Basic Information

Insect: Endotricha flammealis
Gene Symbol: -
Assembly: GCA_905163395.1
Location: LR990878.1:4270071-4276148[+]

Transcription Factor Domain

TF Family: MYB
Domain: Myb_DNA-binding domain
PFAM: PF00249
TF Group: Helix-turn-helix
Description: This family contains the DNA binding domains from Myb proteins, as well as the SANT domain family [1].
Hmmscan Out: # of c-Evalue i-Evalue score bias hmm coord from hmm coord to ali coord from ali coord to env coord from env coord to acc

1 9 2.5 4.9e+03 -1.4 0.0 1 10 124 133 120 137 0.64

2 9 2.3 4.7e+03 -1.3 0.0 12 45 146 180 143 181 0.74

3 9 6.8 1.4e+04 -2.8 0.1 23 31 283 291 275 292 0.78

4 9 0.18 3.7e+02 2.2 0.0 22 44 397 420 367 422 0.74

5 9 0.016 32 5.6 0.3 22 42 497 516 487 519 0.93

6 9 4.4e-05 0.088 13.8 0.4 11 46 618 663 617 663 0.93

7 9 6.6e-06 0.013 16.5 0.3 3 44 712 762 710 764 0.89

8 9 5.9e-05 0.12 13.4 0.0 23 42 894 913 871 917 0.80

9 9 0.46 9.2e+02 1.0 0.1 3 13 1069 1079 1067 1128 0.69

#	of	c-Evalue	i-Evalue	score	bias	hmm coord from	hmm coord to	ali coord from	ali coord to	env coord from	env coord to	acc
1	9	2.5	4.9e+03	-1.4	0.0	1	10	124	133	120	137	0.64
2	9	2.3	4.7e+03	-1.3	0.0	12	45	146	180	143	181	0.74
3	9	6.8	1.4e+04	-2.8	0.1	23	31	283	291	275	292	0.78
4	9	0.18	3.7e+02	2.2	0.0	22	44	397	420	367	422	0.74
5	9	0.016	32	5.6	0.3	22	42	497	516	487	519	0.93
6	9	4.4e-05	0.088	13.8	0.4	11	46	618	663	617	663	0.93
7	9	6.6e-06	0.013	16.5	0.3	3	44	712	762	710	764	0.89
8	9	5.9e-05	0.12	13.4	0.0	23	42	894	913	871	917	0.80
9	9	0.46	9.2e+02	1.0	0.1	3	13	1069	1079	1067	1128	0.69

Sequence Information

Coding Sequence: ATGGAGCAGATTGTAGTTAAAACGGAGATGGATGGGGGGGAGATACTTCTTTTTTATGTTGATGAATCTGAAGATAATCATGTTGAAGGTACAGTAACATCAATTGAAAACATTCGAAATATTCAGGACATTCAAAATTTGCCTTCAATACAAAACATACAAACTATACATAATATAGAAGACATAACCCAAATACAGCAATTGCAAGATAATACAACATATATTATGGAAGACGCCATNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNCATATATGGCTCAGGGCAATCAGGTCAAAGACAAATGGACATATGATGAAACAGGCAAATTACTTCTATTCTACCTTGATAATAAGGAGGTATTCCTCAGCGGGGTTTCTAAAGTAAAGAACCTCTGGGCAGTGGCATGTAAAACCGTACTTCCCGGAAAAAATCCGTTATCATGCGAGAAAAAAATACGCAACTTGAGAAGAAAGTACCGTCAAATGCGTATTGATCGTCAGAAAGGTTTAACTATAAAATATCCTTTATTTGATCTATGTCATAAAGCTTTTTTTTCTGATAAATATGTCAACCAAATGTGGAAAGAGAATTTTGATCAACCTACCACTGCTAAAATACCAATTACAACACAAAATAATACAGACGGGATTGTTGTTGTAAAGAATTTACCATCAAATACACGTGCCAGTGACAACAAAGTTGATAATATGCTCAATTTGTACTTAAAATATAAAAAAGAGTTTCAAAAAGAATATTGGCGAAAAGATTTGTGGGACAGAATTGCAATGGAAATGGGAGAAGAGGATGGTGATTATTGGCACAAAAGGTTTTTGAATTTCAAGCAACACTACCTCAGGATGGTGGTTAAACGTAAAGAGAATGGGCCACAGAGCATCAATTGGCCATACATGGCAATGTTCGATCAAATATTTCAAGATGATGTAGGATTTCAACGTAAAGTGGATATAAAGCCTGACAAACCCTTTACTATTGTAACAAATAGTGTGCTACCAACAGACACTGAAAATGATTGGAATGACACAGAAAAGATTGTGCTGGTAAAATATGTTTTTGATTGTTTTGACGAGTTCCAAGATCCAACAATACCAGATAACTTCTTATGGAATGAAGTTGGTAGATTGTTGGACAAAAAGCCTGATTCATGCAAACAAAAATTTGAAGAATTAAAAGTTGATCATTTAGAAAAATATATTGAAGGTCAATATGAGTTGCATAGTCGTATACCACTTGACATAGTTTTGGATAATGTGATCGCGAAAGAGACAGAAGTAGAATTTGTTAAGGAGAAACGGAAACAGAATGATACATGGAAGACATATGATTTGGATAATTTAGTAAAGCATTTCTATGATAATACAGAAATGTTTAAAGATTCTGTATGTTATTTTGTATGTTGGGCAAGTGTTGCTAAGAGACTGCATAAAAGTATACATGTTTGCAGATCACAATGGGATGAACTTACATTACTTTATAAGACACTTTTAGACGATAAAAAAGAGAATCCCGATAGCCAAATAGATTGGAGATATATAGAGTTATTTGACAGGATTTTTAACTATGGTATGGATACTGATTTGTTAGAAAATTTAGCTGAAACTAAGCCTAAAATTAAGGAAGATGATAAAATTGGTGTGAAAAAGGTGAACATTAATTATGAAAATGATAATATGGACAATCCGACCGATGACGAAGAATATGATGAAAGGGGTTTCACAAAACGCACCAAAAGGGGCATTGGTGACTCGAAAGCGTTTAAAATTTTGGAATATTTTCAAAAACACAAAGACAAATTCTCAACTAGTCAAAGAAAGAAACATGCGTTATGGCAGGTGCTCGCTAAACAGATTGGAATTACAGCTGAACAGTGCGCCCATAGATATAGGAATTTAAAGCAAGTGTACACAGTATACGTTCAAAGAGAAATAGATAAACCTGAGATGCCAATTCTGTGGCCTTACTATACCCTATGCAAAAAGGTATTTGGATACCGTGCTATAAAATCTAAGTTGAAGAATAGCAAAACTTCAGAGGATGAAGATTGGTCTGCAAAAGAGATAAAACAGATTATAAATTATTTTAAAAATAATTACAATCAAATGTCTGATTGTGTTGAGGACAGCGCTAAGTGGGAGGACATTGCCAAAGAGATTGGCAAATCAGAACATTCTTGTATGGAGAAGTTTGTAGAACTTAGAAAGTCCTATAGGAAACTTAAAACTATGAAGGAAAACAATGCTAATGTAAAAGTATCGTGGAAATATTTTAATTTGTTTGATGAGATATACAATTTTAAAGATGGCTATATTGTAGAAGAAATGGAAGTGGATGAAATCGAACATGTTATAGAAAGCGAACAAAATGATTCACAAGAAGAAGAAGATTATCAGTGTATCATCGTTCTACCTGAAGGACAGGATATATCAGATATTGAAAGCTCTCAAATCATTATGAATGACACTCCATCAGTCGTAGATACCCCTACTGTATCTAAATGGACTAAGCTCACTAAAAAAATACTTTTAATCAACTATTTAAACTATTTAAGATCTAAAAAGGGAAAAGAGATAGACGCAGTTGAAATGTGGAAAGAGATAGCAACAAAAATTCCAAACAAAACGCCTCTGTCTTGCAGAAAAATGTTTGCAAAACTCAAAAGCAATCATAAGGATTTGGAAAATGATGGTGTAAATAAAAAGAAGTCGCCATACTTTAAATTAATTGAGAAAGTATTGGCTTTTAAACCAAAGTTTATTAAAACTACACAAAATTTACAAGAAGGGCGTACATACAAAGATGTTCCATTACCGACTAACAAAATCGAGCAAGCACTGCAATATTACTTAGTACACATAGAAGAGTTTATAAGTCCTAGATTCGAGAAAAAACATATGTGGACAGAATTAGCTAACTTCGTTACAGAACCTGTAACTAGAGTGTTTAATAAAGTTAATTATTTGAAAAAGTATTATAATATTAATACAGATGAAGTGGCTGGGGAGAAGTCATTATTTAGTGAGTTATTAAAAGAAATTGTCACTAAAGAGACTGCAATAAAAGCTTTGATGGAAAATGAGCCGAAAGTGACTATTGAAGATCAAGGAGAGCTTACATGGTCGGACGAAGAGGTGGAGCAACTTTTGATATGGTACTTAGCCAATTTGGAACAATTCAAAGATCCCAAATATAGCAGAAAATATCTATGGTTGGATGTTGCGAACATTTTGCAGAAAACTCCGTTGGCTTGCTCCAAAAAAATGGCAGAAATTAGAACACAGTATAGGAATATGGTGAAGGAGAATTCGGATGATTGCAGTATTTGGAAATTCTATAATTTATGTCAAAAAATTTATGGTACGGGAAAGAAAAATGAAATGAATAGTGTATGA
Protein Sequence: MEQIVVKTEMDGGEILLFYVDESEDNHVEGTVTSIENIRNIQDIQNLPSIQNIQTIHNIEDITQIQQLQDNTTYIMEDAXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXYMAQGNQVKDKWTYDETGKLLLFYLDNKEVFLSGVSKVKNLWAVACKTVLPGKNPLSCEKKIRNLRRKYRQMRIDRQKGLTIKYPLFDLCHKAFFSDKYVNQMWKENFDQPTTAKIPITTQNNTDGIVVVKNLPSNTRASDNKVDNMLNLYLKYKKEFQKEYWRKDLWDRIAMEMGEEDGDYWHKRFLNFKQHYLRMVVKRKENGPQSINWPYMAMFDQIFQDDVGFQRKVDIKPDKPFTIVTNSVLPTDTENDWNDTEKIVLVKYVFDCFDEFQDPTIPDNFLWNEVGRLLDKKPDSCKQKFEELKVDHLEKYIEGQYELHSRIPLDIVLDNVIAKETEVEFVKEKRKQNDTWKTYDLDNLVKHFYDNTEMFKDSVCYFVCWASVAKRLHKSIHVCRSQWDELTLLYKTLLDDKKENPDSQIDWRYIELFDRIFNYGMDTDLLENLAETKPKIKEDDKIGVKKVNINYENDNMDNPTDDEEYDERGFTKRTKRGIGDSKAFKILEYFQKHKDKFSTSQRKKHALWQVLAKQIGITAEQCAHRYRNLKQVYTVYVQREIDKPEMPILWPYYTLCKKVFGYRAIKSKLKNSKTSEDEDWSAKEIKQIINYFKNNYNQMSDCVEDSAKWEDIAKEIGKSEHSCMEKFVELRKSYRKLKTMKENNANVKVSWKYFNLFDEIYNFKDGYIVEEMEVDEIEHVIESEQNDSQEEEDYQCIIVLPEGQDISDIESSQIIMNDTPSVVDTPTVSKWTKLTKKILLINYLNYLRSKKGKEIDAVEMWKEIATKIPNKTPLSCRKMFAKLKSNHKDLENDGVNKKKSPYFKLIEKVLAFKPKFIKTTQNLQEGRTYKDVPLPTNKIEQALQYYLVHIEEFISPRFEKKHMWTELANFVTEPVTRVFNKVNYLKKYYNINTDEVAGEKSLFSELLKEIVTKETAIKALMENEPKVTIEDQGELTWSDEEVEQLLIWYLANLEQFKDPKYSRKYLWLDVANILQKTPLACSKKMAEIRTQYRNMVKENSDDCSIWKFYNLCQKIYGTGKKNEMNSV

Similar Transcription Factors

Sequence clustering based on sequence similarity using MMseqs2

100% Identity: -
90% Identity: -
80% Identity: -