Basic Information

Insect: Vanessa atalanta
Gene Symbol: -
Assembly: GCA_905147765.1
Location: LR990574.1:3411510-3417190[+]

Transcription Factor Domain

TF Family: MYB
Domain: Myb_DNA-binding domain
PFAM: PF00249
TF Group: Helix-turn-helix
Description: This family contains the DNA binding domains from Myb proteins, as well as the SANT domain family [1].
Hmmscan Out: # of c-Evalue i-Evalue score bias hmm coord from hmm coord to ali coord from ali coord to env coord from env coord to acc

1 6 0.27 3.2e+02 1.8 0.0 22 43 345 367 341 370 0.83

2 6 0.00085 1 9.9 0.2 23 44 446 466 417 468 0.84

3 6 0.032 38 4.8 0.0 23 45 593 614 580 615 0.88

4 6 7.3e-05 0.086 13.3 0.3 3 44 666 716 664 718 0.80

5 6 0.0056 6.7 7.2 0.0 22 45 852 878 839 879 0.79

6 6 8.6 1e+04 -3.0 0.0 26 44 1061 1082 1059 1083 0.75

#	of	c-Evalue	i-Evalue	score	bias	hmm coord from	hmm coord to	ali coord from	ali coord to	env coord from	env coord to	acc
1	6	0.27	3.2e+02	1.8	0.0	22	43	345	367	341	370	0.83
2	6	0.00085	1	9.9	0.2	23	44	446	466	417	468	0.84
3	6	0.032	38	4.8	0.0	23	45	593	614	580	615	0.88
4	6	7.3e-05	0.086	13.3	0.3	3	44	666	716	664	718	0.80
5	6	0.0056	6.7	7.2	0.0	22	45	852	878	839	879	0.79
6	6	8.6	1e+04	-3.0	0.0	26	44	1061	1082	1059	1083	0.75

Sequence Information

Coding Sequence: ATGGAAAAAATAGTAGTTAAAACGGAGGTACAACCAAATGGAGATATACTGCTCTTTTACGTCGATGAAAATGAAGAATCTGATCTCCGAGGTTTGGAAAATGAAGTTCAAAATAATGTACAATTATTGCCAGATACTAAGTACATAATTGAAGAAGACCTAGGTGAAGGGGAGTCAGCTGAGGAACTGGATATAGCCCAGGCATCAGAACAGGTTTCCAATGATATTTGGTTAGAAGATGAAATAAAACGACTCATAGTTTTCTATCTTGATAATAAAGAAACATTTCTTAGTGGAGCTACAAAGAAAACACATTTATGGGCTGTTGCGTGTAAAACAATGCTGGCTGGTAAGACTCCAATATCATGTGAAGTAAAATTAAGAGAATTAAAAAAAAAATATGTTCAAGTGTGCCTCGAAAATCAGAACGGAGGTACCATAATTTGGAATTATTACAATTTGTGTAATCAGGCATTTCACGATGACAACTTTGTTAAAATGTGCCTTAGTGAAAATAATAGCGATAATCAAATTACTGTGAATATGCCAGTTAAAAATGTTGTCAACCAAGATGGTATATTAGTTGTTAAAAAAGTCAATAGTTGTCAAAACAAAGATGAGCAAGTTGAAGCAATGCTCAATTCATACATCAAACACAAGACTTTCTTTCAGAAACAGTATAATACACAGAGAGGCTTATGGGAGGCTATTGCTATGGATTTGGGAGAACAGGATGTTGATTATTGGCACAAACGTTTCTTAAACTTCAAACAACACTATATAAGGATGATCTACAAACGTAAGGAAAGTGGAGCTGATAGTATTAATTGGCCATACATGAAATACTTTGATAAAATATTTGGTGATGACGAAGATTTCTCACGTAAATATTTATACAGTGAAGAAAATGACACTAAAGTCTCTATAATGATTGAAAATGATCCAAATTCCTGGAATGATATTGAAATAACATTTTTGGTTAAGTATTATTTCGATTGTTTCAATGAATTCCACGATCCGAGCATACCAAATAATTTTTTATGGCAAGAAGTTGGTAGATTAATAGACAAGACACCGGAAAATTGTGAGAAAAAATTTGAAGATCTTAAGAATGAACATTTCGATAAACTCGTAGAAGGTGACTATGATTTAGCAAATCGGATACCGTTGGCTATTTTGTTTGATAACATAATAGCCAAAGAAGTAGAAATGGAGGTTAATAGCCCCGAAAAAGATGGTCCTGATCTATGGAAGACGGAGCAAATTGATGAATTGGTGCAGTATTTGTATGAAAATATAGATATGTTAAAAGATCCTGTGTGTTATTATGTCAGTTGGGCATCCCTTGCGAGGAAATTGAAAAGAAGTGTAACATCTTGTCGTAAACAATGGAACGATCTGACTACACTTTATAAGAACATTTTAGATGATAAAAAAGAAAATCCTGATATGCAAATAGACTGGAGGTACATTGACTTATTTGATAGAATATTTGATTACGGTATGGATAGCAATCTACTGGACGGATACGAGAAGTTGAAAGAACTCGGTCAAGTAAATAAATCTAATAAAGTGGGAGTTAAAAAGATCACCATCAAAGATAACGATGATAAATTCCTTGAAAATGGAACAGATGACGAGGAACTCTACGACGAAAGAGGTTTTACAAAGCGTTCCAAAAAACGCAACGGAGACGTAAAAGCTTTCAAAATACTAGAATTCTATTTAAAAAATAAAGATAAATTTGCATCATCGCAGCAGAAGAAATTGGCACTATGGGAAATCTTGGCACGACAAATAGGCATTACAGCAACGGAATGCGCTCACAGATTCCGCAATTTCAAACAAGTTTACACGGGATACGTTCAAAGGGAAATAAATAAGCCCGAAATGCCCATACTTTGGCCATACTACAACCTTTGCAAGAAAGTATTCGGCTATAGAGCCATAAAATCGAAATTGAAAAACGGGAAGATGGATTCTGACGACGCAGAAGACTGGTCCGCAAAGGAAATCAAGCAGTTGATCAATTATTTTTCTAGAAACTTCAGCAATTTCCAAGAAAATATCGAAGCAAGAAGCAAATGGACAGAAATAGCCCAAGAAATCAGTCGGACCGAAACAAGTTGTTGTGATAAATTTCTTGAGTTAAGGAAGTCTTATAGAAAATTGAAGACGATGAAAGCCCGTAATCCAGATGTTAAAGTCTCCTGGAAATATTTTAATATGCTCGATGACATTTATAAATATGGTGAACAAAACTGTGAAGTTCTGGAAAATATGGAAGTTGATGAGTGCAATGATGATGATAATGAATTAAAGCTGGAAATGCAGGAAGATGATGATTATCAATGTATCATCGTTATACCCGAAGGCGAAGACATTAATAATACTCAAATTATTATTCAAGAACAAGAACAAGATCAAGATCAAGAGGCCACAGAAATAACAAATTCAAAGCAAATCATAACGAAATGGAATAAGCGAAGTAAAAAACGACTTCTAACCCTTTATCTAAATTACCTAAGGGTGCACAAAGGACAGGAGATTAATCAAAGAGAAATGTGGACCGAAATTGCGTCGAAATTAGATGAAAAAACGCCCATTTCATGCAAGAAAATGTTCTTAAAACTAAAAAATCAACACAAGCAACTTAACGAAGCTGACTTCAAACTTCCGTATAGTAACCTCTTAGAGAAAATCCTCACTTTTAAACCTAAATTTGCCAAATCAAACAAAAACAAGGATTTAGAAGAAATCAATACTTACGAAGACATACCAATGTCCGATGAGAAAGTTTACAATGCTTTAAATTATTACTTGCAGAATCTTGAAGATTTTGTCAGCCCAAAATTTGAGCAGAAATATCTTTGGACGGAACTAGCGAAATTCATTTCTGAGCCAGTCAACAAAATATTCAGTAAAATTAACTACTTGAAGCAAACATTTGATAGTGAAATAGAAACTCCTTTTAAGGAGATCTTGCATGAAATATTGACAAAGGAAAATGCACTCAGAGAGGAAATAAATAAGGATCCTGATCCAATAACAGAGGAGGATAGTGAGCAAACATGGTCGGATATTGAAACTGAGCGTCTTCTAACATGGTACTTAGCCCATTTGGATAAGTTTAAGAATCCGAAGTTCGTTCGAAGTTATCTATGGATGGAAGCCTCCGATATATTGAAGAAGAGTCCACTGGTTTGTTCGAAGAAAATGTCCGAGATACGATCCCAGTACAGAACAATGGTTAGAGAAAATCCAGAGGAATTAGACAACTGGAAGTTTTACAATCTGTGTCAGAGAATTTATGGAACTGGGAAGAAGAGCTCGACTAGTAACAAGGGTCTTGAAGATATATAA
Protein Sequence: MEKIVVKTEVQPNGDILLFYVDENEESDLRGLENEVQNNVQLLPDTKYIIEEDLGEGESAEELDIAQASEQVSNDIWLEDEIKRLIVFYLDNKETFLSGATKKTHLWAVACKTMLAGKTPISCEVKLRELKKKYVQVCLENQNGGTIIWNYYNLCNQAFHDDNFVKMCLSENNSDNQITVNMPVKNVVNQDGILVVKKVNSCQNKDEQVEAMLNSYIKHKTFFQKQYNTQRGLWEAIAMDLGEQDVDYWHKRFLNFKQHYIRMIYKRKESGADSINWPYMKYFDKIFGDDEDFSRKYLYSEENDTKVSIMIENDPNSWNDIEITFLVKYYFDCFNEFHDPSIPNNFLWQEVGRLIDKTPENCEKKFEDLKNEHFDKLVEGDYDLANRIPLAILFDNIIAKEVEMEVNSPEKDGPDLWKTEQIDELVQYLYENIDMLKDPVCYYVSWASLARKLKRSVTSCRKQWNDLTTLYKNILDDKKENPDMQIDWRYIDLFDRIFDYGMDSNLLDGYEKLKELGQVNKSNKVGVKKITIKDNDDKFLENGTDDEELYDERGFTKRSKKRNGDVKAFKILEFYLKNKDKFASSQQKKLALWEILARQIGITATECAHRFRNFKQVYTGYVQREINKPEMPILWPYYNLCKKVFGYRAIKSKLKNGKMDSDDAEDWSAKEIKQLINYFSRNFSNFQENIEARSKWTEIAQEISRTETSCCDKFLELRKSYRKLKTMKARNPDVKVSWKYFNMLDDIYKYGEQNCEVLENMEVDECNDDDNELKLEMQEDDDYQCIIVIPEGEDINNTQIIIQEQEQDQDQEATEITNSKQIITKWNKRSKKRLLTLYLNYLRVHKGQEINQREMWTEIASKLDEKTPISCKKMFLKLKNQHKQLNEADFKLPYSNLLEKILTFKPKFAKSNKNKDLEEINTYEDIPMSDEKVYNALNYYLQNLEDFVSPKFEQKYLWTELAKFISEPVNKIFSKINYLKQTFDSEIETPFKEILHEILTKENALREEINKDPDPITEEDSEQTWSDIETERLLTWYLAHLDKFKNPKFVRSYLWMEASDILKKSPLVCSKKMSEIRSQYRTMVRENPEELDNWKFYNLCQRIYGTGKKSSTSNKGLEDI

Similar Transcription Factors

Sequence clustering based on sequence similarity using MMseqs2

100% Identity: iTF_00985050;
90% Identity: iTF_01080672;
80% Identity: -