Basic Information

Insect: Nymphalis polychloros
Gene Symbol: -
Assembly: GCA_905220585.1
Location: HG992266.1:5681362-5685785[-]

Transcription Factor Domain

TF Family: MYB
Domain: Myb_DNA-binding domain
PFAM: PF00249
TF Group: Helix-turn-helix
Description: This family contains the DNA binding domains from Myb proteins, as well as the SANT domain family [1].
Hmmscan Out: # of c-Evalue i-Evalue score bias hmm coord from hmm coord to ali coord from ali coord to env coord from env coord to acc

1 6 0.13 2e+02 2.7 0.0 23 43 348 367 338 370 0.86

2 6 0.00057 0.87 10.3 0.2 23 44 446 466 415 468 0.75

3 6 0.091 1.4e+02 3.2 0.0 23 45 593 614 580 615 0.77

4 6 5e-05 0.076 13.6 0.4 3 44 666 716 664 718 0.82

5 6 0.00077 1.2 9.8 0.0 14 45 839 877 834 878 0.82

6 6 7.7 1.2e+04 -3.0 0.0 26 44 1060 1081 1058 1082 0.75

#	of	c-Evalue	i-Evalue	score	bias	hmm coord from	hmm coord to	ali coord from	ali coord to	env coord from	env coord to	acc
1	6	0.13	2e+02	2.7	0.0	23	43	348	367	338	370	0.86
2	6	0.00057	0.87	10.3	0.2	23	44	446	466	415	468	0.75
3	6	0.091	1.4e+02	3.2	0.0	23	45	593	614	580	615	0.77
4	6	5e-05	0.076	13.6	0.4	3	44	666	716	664	718	0.82
5	6	0.00077	1.2	9.8	0.0	14	45	839	877	834	878	0.82
6	6	7.7	1.2e+04	-3.0	0.0	26	44	1060	1081	1058	1082	0.75

Sequence Information

Coding Sequence: ATGGAAAAAATAGTGGTTAAAACTGAGGTCCAACCGAATGGCGATATACTACTCTATTACGTTGATGAAAATGAAGAAACAGATCTACAAGGTTTGGAGAATGAAGTGCAAAATAATGTTCAAATTTTGCCAGAAACTAAGTATATCATCGAAGAAGATCTCGGTGGAGGGGAGTCAGCTGAGGAACTAGATATAGCTCAGGCATCAGAACAAGTTTCCAATGAAATCTGGCTAGAGGATGAAATAAAGCGTCTCATAGTTTTCTATCTTGATAATAAAGATACATTTCTTGGTGGAGCTACAAAGAAAACACATTTATGGGCTGTTGCATGTAAGACAATGCTGGCTGGTAAAACTCCTATATCCTGTGAAGTTAAATTAAGAGATTTAAAAAGGAAATATGTTCAAGTATGCCTTGAAAATCAGAATGGTGCGACCATTAACTGGCATTATTACGATTTGTGTAACCGGGCATTTCACGATGATAGTTTTGTTAAAATGTGCCTCAACGAAACTAGTTCCGATAATCAAGTTACTGTGAATATGCCTGTTAAAAATGTTGTCAACCAAGATGGTATATTAGTTGTAAAAAAAGTGAACAGTGGTCAAAACAAGGATGAGCAAGTTGAGGCAATGCTCAATTCATACATCAAACATAAGTCTTTCTTTCAGAAGCAGTATAATTCACAGAGAGGGTTATGGGAGGCTATTGCTACGGATTTGGGAGAAGAAGACGTAAATTATTGGCACAAACGCTTCTTAAACTTTAAACAACACTATATAAGGATGATCTGTAAACGCAAGGAAAGTGGGGCTGGAAGCATTAATTGGCCATATATGACGTATTTTGATCAAATATTTGGTGATGATGAAGATTTCTTACGTAAATATGTATATAATGAAGAAAATGACTCAATGGTCTCTATATTAATCGAAAATTATGAAAATTCCTGGAATGATGTAGAAATAACCTTTTTGGTTAAGTATTATTTTGATTGCTTCAATGAATTCCATGACCCGAGCATACCAAATCAATTCTCATGGCAAGAAGTTGGCAGATTATTAGATAAAACACCAGAAAATTGTGAGAAAAAGTTTGAAGAACTTAAGAATAAGCATTTTGATAAACTTGTAGAGGGTAACTATGATTTGGCAAATAGAATACCATTAGCTATTATATTTGATAACATTATAGCTAAGGAAGTAGAAATGGAAGTTAATAATCCCGAAAAAGTTGGTCTGGATCGATGGGAGACGGAACAAATTGATGAATTAGTTCAGTATCTGTATGAAAATATAGATATGTTAAAAGATCCTGTCTGTTATTATGTTAGTTGGGCATCTCTTGCAAGGAAATTGAAACGAAGTGTAACATCTTGTCGGAAACAATGGAACGATCTGACTACGCTTTACAAGAGTATTTTAGATGATAAAAAAGAAAATCCTGACATGCAAATAGATTGGAGATACATTGATTTATTCGATAGGATATTCGATTATGGTATGGATAGTAATCTATTGGACGGATATGAGAAATTGAAAGAACTCAGTCAGGTTAATAAACCGAATAAAGTAGGAGTTAAGAAGATCACCATCAAAGATAATGATGACAAATTCCTTGAAAATGGAACAGACGATGAGGAATTCTATGACGAAAGAGGTTTTATAAAACGTTCCAAAAAACGGAATGGTGATGCCAAAGCGTTCAAAATACTAGAATTCTATTTAAAAAATAAAGATAAATTTGGATCATCACAGCAAAAGAAATTAGCGCTATGGGAAATATTGGCACGCCAAATAGGTGTTACAGCAACGGAATGCGCTCACAGGTTTCGTAATTTCAAACAAGTGTACACAGGATATGTCCAAAGAGAAATAAATAAGCCTGAAATGCCAATACTCTGGCCATATTACAACCTTTGCAAGAAAGTATTTGGATATAGAGCCATAAAATCTAAATTGAAAAACGGAAAGATGGATTCGGATGACGCAGAAGATTGGTCCGCAAAAGAAATCAAGCAATTGATCAATTATTTTTCTAGAAACTTCAGTAATTTTCAAGAAAATATTGAAGAGAGAAGCAAATGGACAGAAATAGCTCAAGAAATTAGTAGAACCGAAACAAGTTGTTGTGATAAGTTCCTAGAGTTGAGGAAGTCTTATAGAAAGTTGAAGACAATGAAAGCCCGTAATCCAGATGTCAAAGTGTCCTGGAAATATTTTAATATGCTTGATGATATTTATAAATATGGTGAACAAAATTGTGAAGTTCTGGAAACTATGGAAGTTGATGAGTGCAACGATGAGGATAATGGATTAAAGCTGGAAATGCAGGAAGATGACGATTATCAATGTATCATCGTTTTACCTGAAGACGAAGATATTAATAATGCTCAAATCATTATTCAAGGACAAGATCAGGAGACCACAGAAACAGAACAAATGACAAATTCGAAGCAAATCATAACTAAGTGGAATAAAAGAAGCAAAAAGCGACTTTTAATACTTTATTTAAATTATCTAAGGATGCACAAAGGACAGGAGATTAATCAAAGAGATATGTGGACGGAGATTGCATCGAAGTTAGAAGAAAAAACACCCATTTCTTGCAAGAAAATGTTCTTAAAATTAAAAAATCAACACAAACAACTTAACGAAACTGACTTCAAACTTCCATATAGTGTCCTCATAGAAAAAATTCTGACTTTTAAGCCTAAATTTGCCAAATCAAACAAAAATAAGGATTTAGGAGACATTAATACTTACGAAGACATACCAATGTCCGATGAGAAAGTTTACAATGCTCTAAATTATTACTTGCAAAATCTTGAAGACTTTGTCAGCCCGAAATTTGAGCAGAAATATCTATGGACGGAACTAGCGAAATTTATTTCAGAGCCAGTCAACAAAATATTCAGCAAAATTAACTACTTGAAACAAACATTTGATAGTGAAATTGACACTCCCTTTAAGGATATTTTACATGAAGTATTGACAAAGGAAAATACACTCAAAGAGGAAATAAATAAGGATCCTGATCCAATAACAGAGGAGGATAGTGAACAAACATGGTCTGATATTGAAACCGAACGTCTTCTAACATGGTACTTGGCCCATTTGGATAAGTTTAAGAACCCGAAGTTTGTTCGTAGCTATTTATGGATGGAGGCGTCCGATATATTGAAGAAGAGTCCATTAGTTTGTTCAAAGAAAATGTCCGAAATACGATCCCAGTACAGGACGATGGTCAGAGAAAATCCAGAGGAATTAGATAGTTGGAAATTTTACAATCTGTGCCAGAGAATCTATGGAACTGGAAAGAAAAGCTCGAATAGTAATAGAGGTCTAGAAGATATATAA
Protein Sequence: MEKIVVKTEVQPNGDILLYYVDENEETDLQGLENEVQNNVQILPETKYIIEEDLGGGESAEELDIAQASEQVSNEIWLEDEIKRLIVFYLDNKDTFLGGATKKTHLWAVACKTMLAGKTPISCEVKLRDLKRKYVQVCLENQNGATINWHYYDLCNRAFHDDSFVKMCLNETSSDNQVTVNMPVKNVVNQDGILVVKKVNSGQNKDEQVEAMLNSYIKHKSFFQKQYNSQRGLWEAIATDLGEEDVNYWHKRFLNFKQHYIRMICKRKESGAGSINWPYMTYFDQIFGDDEDFLRKYVYNEENDSMVSILIENYENSWNDVEITFLVKYYFDCFNEFHDPSIPNQFSWQEVGRLLDKTPENCEKKFEELKNKHFDKLVEGNYDLANRIPLAIIFDNIIAKEVEMEVNNPEKVGLDRWETEQIDELVQYLYENIDMLKDPVCYYVSWASLARKLKRSVTSCRKQWNDLTTLYKSILDDKKENPDMQIDWRYIDLFDRIFDYGMDSNLLDGYEKLKELSQVNKPNKVGVKKITIKDNDDKFLENGTDDEEFYDERGFIKRSKKRNGDAKAFKILEFYLKNKDKFGSSQQKKLALWEILARQIGVTATECAHRFRNFKQVYTGYVQREINKPEMPILWPYYNLCKKVFGYRAIKSKLKNGKMDSDDAEDWSAKEIKQLINYFSRNFSNFQENIEERSKWTEIAQEISRTETSCCDKFLELRKSYRKLKTMKARNPDVKVSWKYFNMLDDIYKYGEQNCEVLETMEVDECNDEDNGLKLEMQEDDDYQCIIVLPEDEDINNAQIIIQGQDQETTETEQMTNSKQIITKWNKRSKKRLLILYLNYLRMHKGQEINQRDMWTEIASKLEEKTPISCKKMFLKLKNQHKQLNETDFKLPYSVLIEKILTFKPKFAKSNKNKDLGDINTYEDIPMSDEKVYNALNYYLQNLEDFVSPKFEQKYLWTELAKFISEPVNKIFSKINYLKQTFDSEIDTPFKDILHEVLTKENTLKEEINKDPDPITEEDSEQTWSDIETERLLTWYLAHLDKFKNPKFVRSYLWMEASDILKKSPLVCSKKMSEIRSQYRTMVRENPEELDSWKFYNLCQRIYGTGKKSSNSNRGLEDI

Similar Transcription Factors

Sequence clustering based on sequence similarity using MMseqs2

100% Identity: iTF_00985050;
90% Identity: iTF_01080672;
80% Identity: -