Basic Information

Insect: Boloria selene
Gene Symbol: -
Assembly: GCA_905231865.2
Location: HG993156.1:3405904-3411763[+]

Transcription Factor Domain

TF Family: MYB
Domain: Myb_DNA-binding domain
PFAM: PF00249
TF Group: Helix-turn-helix
Description: This family contains the DNA binding domains from Myb proteins, as well as the SANT domain family [1].
Hmmscan Out: # of c-Evalue i-Evalue score bias hmm coord from hmm coord to ali coord from ali coord to env coord from env coord to acc

1 7 6.8 1e+04 -2.6 0.3 4 13 79 88 77 90 0.66

2 7 2.7 4e+03 -1.4 0.1 12 31 223 242 220 249 0.67

3 7 0.16 2.4e+02 2.6 0.0 22 44 341 364 335 366 0.85

4 7 0.0025 3.7 8.4 0.2 22 44 441 462 419 464 0.77

5 7 0.075 1.1e+02 3.6 0.1 23 45 588 609 565 610 0.85

6 7 3.6e-06 0.0054 17.5 0.3 3 44 661 711 659 713 0.81

7 7 0.0014 2.1 9.2 0.1 17 45 836 871 825 872 0.72

#	of	c-Evalue	i-Evalue	score	bias	hmm coord from	hmm coord to	ali coord from	ali coord to	env coord from	env coord to	acc
1	7	6.8	1e+04	-2.6	0.3	4	13	79	88	77	90	0.66
2	7	2.7	4e+03	-1.4	0.1	12	31	223	242	220	249	0.67
3	7	0.16	2.4e+02	2.6	0.0	22	44	341	364	335	366	0.85
4	7	0.0025	3.7	8.4	0.2	22	44	441	462	419	464	0.77
5	7	0.075	1.1e+02	3.6	0.1	23	45	588	609	565	610	0.85
6	7	3.6e-06	0.0054	17.5	0.3	3	44	661	711	659	713	0.81
7	7	0.0014	2.1	9.2	0.1	17	45	836	871	825	872	0.72

Sequence Information

Coding Sequence: ATGAATTTGGAAAAACAAATTGTGGTTAAAACAGAAGTTCAGCCAAACGGAGATATACTGTTATTTTATGTTGATGAAAATGAAGAATTCAGTGCTGGTGTATTAGATAACACTGATGATAATAGTATACAAGATTTGTCTGATAAGTATATTATTGAAGAAGATTTTGGAGAAGGAGATTCTGCTGAAGAACTTGATATTGCTCAAGCTTCCGAGGAAGTTGCCAATGAAGTGTGGGAAGATGAAGAAATCAAACGCCTTGTTATATTTTATCTTGATAATAAAGAAACATTTCTCAGTGGAACAACAAAAAAAGTACATTTGTGGGCAGTTGCGTGTAAGACTATGTTGGCTGGAAAAAAACCTTTGTCATGTGAGGTGAAACTAAGGAATTTAAAGAGAAAGTACGCCCAATTGAGGGTTGACAACCAGACCGGTACTTTTATTAACTGGCCATTGTATGATTTGTGTCACCAAGCATTTCACGATGACACATTCGTTCAAATGTGTCTAAATGAGCCCGCTCAGGAATCTGTTACAATGAGTTTGCCTGTACAGAATGTTATCAATAAGGATGGAGTAATAGTTGTAAAGAATGTTAATACAAATCAAAACATAGATGAAAAGGTTGAAACTATGTTAAATTTGTATATAAAACATAAAAATTTCTTTCAAAAACACAATACACAAAAAGGTCTTTGGGAAGCTATTGCTATGGATTTGGGAGAAGAAGATGTTGACTACTGGCATAAGCGTTTCTTAAATTTCAAACAGCACTATATTAGAATGGTCTATAAAAGAAAAGAAAGTGGGGCTGACAATGTCAATTGGCCATACATGAAATACTTTGATAAAATTTATGGTGAAGATGAAGAATTTCAACGTAAATTTATTCAAAATAATCCAGATTCAGCACCATCTGAAAATAACGAAAATTTCTGGAACAATACAGAAAAAACCTTTTTGGCTAAATACTGTTTTGACTGTTTACACGAATTTCAAGATCCAACCATACCAAATGATTTTCTTTGGCAAGAAGTTGGTAGATTACTAGACAAAAAACCAGAAAGTTGTAAAAAAAAGTATGAAGAACTTAAAGAAGCCCATTTTGAGCAACTTATGCAAGGTGGTTACAATTTAGCTGACCGAGTGCCGTTAGCAATCATATTTGACAATATAATAGCCAAAGAGGTTGAAAATGAAGTTGAGAATCCCTCTAGACGTGACTCAGACATATGGAAAACTGAACAAATAGATGAGTTAGTACAATTTTTGTATGAAAATATAGACATGCTAAAAGACTCGGTATGTTATTATGTTTGTTGGGCGATATTAGCTAAGAAATTAAACAGAAATATAGACTCATGTAAGAAACAATGGAATGACTTAACTGCCCTATACAAAACTATTCTAGAGGATAAAAAAGAAGATCCTGAAATGCAAATAGATTGGAGATACATTGATCTCTTTGATAGAATATTTGATTATGGGATGGACACTAATTTGTTGGATGGTTATGAAAAGCTAAAAGGTCTAAGTCAAGTTAATAAGTCTAGTAAAATTGGAGTCAAAAAAATAACCATAAAAGATAGCGACGATAAATTGCTTGATGGTACAGATGATGAAGAGTCTTACGACGAAAGAGGATTTGCAAAGCGTTCTAAAAAACGTAATGGCGATACTAAAGCATTTAAAATATTGGAATACTATTTAAAGAATAAAGATAAGTTTGCTTCGTCACAGTATAAGAAGTTAGCACTTTGGGAAATATTGGCGAGGCAAATAGGAATATCAGCGGCTGAATGTGCCCACAGGTTCCGAAACTTCAAACAAGTTTACACTGGATATGTTCAAAGGGAAATAAATAAGCCAGAGATGCCAATACTTTCGCCATATTACAATTTGTGCAAAAAAGTCTTTGGTTATAGAGCAATCAAATCTAAGCTCAAGAATGGTAAGATTGATTCAGACGACTCAGAAGATTGGTCTGCAAAGGAAATTAAGCAATTAATTAATTATTTTGCCAAAAATTATCACAATTTAATGGATAATGTAGAGAAAAAAAGTAAATGGACGAAAATTGCAAGCGATTTGGGGAGATCGGAGACCAGCTGTTGTGATAAGTTCTTAGAATTAAGAAAGTCGTATAGGAAATTAAGAACTATGAAGACTCGCAATCCTGATGTGAAGGTGTCTTGGAAATATTTTAATATGATCGATGATATTTATAAGAACAAAGAACAAAATGAGAAAATTGAAATGTTAGAGAATATGGAAGTTGATGAACATAGTGACTATAATAGTATTGTTAAGACGGAAATTCAAGAAGATGACGATTTTCAGTGTATCATAGTAATACCCGAAGGAGAGGATATAAACAATGCTCAAATAATAATGCAAAGACCAGACGAAAAGGTAGAAATAGTAACAGAAAAACAGCCAATAATAACTAAATGGAACCGAAGAAGTAAGAAACAACTTTTAATACAATACCTAAAATATCTTAAAGCTCATAAAGATAAAGAAATTAATTTAAGAGACATGTGGACAGAAATAGCGTCTAAATTAGATGAAAAAACTCCTTTGTCATGCAAGAAAATGTATGTGAAACTAAAAAATCAGCATAAGCAGTTGACTAACGAAAATAATGAATATAGAACACCATATTCAAATTTAATTGAAAAAATACTTAAATTCAAGCCTAAAATCGTTAAAACAATTAAAAGTAATACGAATTTGGATGATGTCTATGAAGATGTGGCAATGTCTGATGATAAAGTGGATAAAGCATTGAAGTATTATTTGCAAAACTTAGAAGATTTTGTTAGTCCCAAATTCGAGCAGAAATATCTTTGGAGTGAATTAGCAAAATTCATTTCTGAACCAGTCAACAAAATATACAGCAAAGTTAATTACTTAAAGCAAACATTTAACTCAGATCAAGACAGTCCATACAAGGACATATTATCAGAAATTATAATAAAAGAGAAAACATTAAAAGATTCTATGGAAAATGATCACAAACCTTTACTGGAAGATGAAAATGAGCAAAATTGGTCGGATATTGAAATAGAAACGCTATTAACATGGTATTTAGCTCATTTGGATAAGTTTAAAAACCCAAAATTTGTCAGAAGTTACTTATGGATCGAGGCCTCAGATATTTTGAAGAAGAGTGCTTTGGTGTGTTCTAAGAAAATGTTAGAAATACGATCGCAATATAGGACTATGGTGAAGGAGAATCCTGAAGAATTAAATAATTGGAAGTTTTATAATCTGTGTCAAAGAATCTATGGTACCGGCAAGAAAAGTAGTTTGAATAACTAA
Protein Sequence: MNLEKQIVVKTEVQPNGDILLFYVDENEEFSAGVLDNTDDNSIQDLSDKYIIEEDFGEGDSAEELDIAQASEEVANEVWEDEEIKRLVIFYLDNKETFLSGTTKKVHLWAVACKTMLAGKKPLSCEVKLRNLKRKYAQLRVDNQTGTFINWPLYDLCHQAFHDDTFVQMCLNEPAQESVTMSLPVQNVINKDGVIVVKNVNTNQNIDEKVETMLNLYIKHKNFFQKHNTQKGLWEAIAMDLGEEDVDYWHKRFLNFKQHYIRMVYKRKESGADNVNWPYMKYFDKIYGEDEEFQRKFIQNNPDSAPSENNENFWNNTEKTFLAKYCFDCLHEFQDPTIPNDFLWQEVGRLLDKKPESCKKKYEELKEAHFEQLMQGGYNLADRVPLAIIFDNIIAKEVENEVENPSRRDSDIWKTEQIDELVQFLYENIDMLKDSVCYYVCWAILAKKLNRNIDSCKKQWNDLTALYKTILEDKKEDPEMQIDWRYIDLFDRIFDYGMDTNLLDGYEKLKGLSQVNKSSKIGVKKITIKDSDDKLLDGTDDEESYDERGFAKRSKKRNGDTKAFKILEYYLKNKDKFASSQYKKLALWEILARQIGISAAECAHRFRNFKQVYTGYVQREINKPEMPILSPYYNLCKKVFGYRAIKSKLKNGKIDSDDSEDWSAKEIKQLINYFAKNYHNLMDNVEKKSKWTKIASDLGRSETSCCDKFLELRKSYRKLRTMKTRNPDVKVSWKYFNMIDDIYKNKEQNEKIEMLENMEVDEHSDYNSIVKTEIQEDDDFQCIIVIPEGEDINNAQIIMQRPDEKVEIVTEKQPIITKWNRRSKKQLLIQYLKYLKAHKDKEINLRDMWTEIASKLDEKTPLSCKKMYVKLKNQHKQLTNENNEYRTPYSNLIEKILKFKPKIVKTIKSNTNLDDVYEDVAMSDDKVDKALKYYLQNLEDFVSPKFEQKYLWSELAKFISEPVNKIYSKVNYLKQTFNSDQDSPYKDILSEIIIKEKTLKDSMENDHKPLLEDENEQNWSDIEIETLLTWYLAHLDKFKNPKFVRSYLWIEASDILKKSALVCSKKMLEIRSQYRTMVKENPEELNNWKFYNLCQRIYGTGKKSSLNN

Similar Transcription Factors

Sequence clustering based on sequence similarity using MMseqs2

100% Identity: iTF_01181847;
90% Identity: iTF_00248035;
80% Identity: -