Basic Information

Insect: Vanessa tameamea
Gene Symbol: -
Assembly: GCA_037043105.1
Location: CM073301.1:5379419-5384468[-]

Transcription Factor Domain

TF Family: MYB
Domain: Myb_DNA-binding domain
PFAM: PF00249
TF Group: Helix-turn-helix
Description: This family contains the DNA binding domains from Myb proteins, as well as the SANT domain family [1].
Hmmscan Out: # of c-Evalue i-Evalue score bias hmm coord from hmm coord to ali coord from ali coord to env coord from env coord to acc

1 5 0.39 3.5e+02 1.8 0.0 22 43 345 367 341 370 0.83

2 5 0.0012 1.1 9.9 0.2 23 44 446 466 417 468 0.84

3 5 0.046 42 4.8 0.0 23 45 593 614 581 615 0.88

4 5 0.0001 0.094 13.3 0.3 3 44 666 716 664 718 0.80

5 5 0.008 7.3 7.2 0.0 22 45 852 878 839 879 0.79

#	of	c-Evalue	i-Evalue	score	bias	hmm coord from	hmm coord to	ali coord from	ali coord to	env coord from	env coord to	acc
1	5	0.39	3.5e+02	1.8	0.0	22	43	345	367	341	370	0.83
2	5	0.0012	1.1	9.9	0.2	23	44	446	466	417	468	0.84
3	5	0.046	42	4.8	0.0	23	45	593	614	581	615	0.88
4	5	0.0001	0.094	13.3	0.3	3	44	666	716	664	718	0.80
5	5	0.008	7.3	7.2	0.0	22	45	852	878	839	879	0.79

Sequence Information

Coding Sequence: ATGGAAAAAATAGTAGTTAAAACGGAGGTACAACCAAATGGAGATATACTGCTCTTTTACGTCGAtgAAAATGAAGAAACTGATCTCCGAGGTTTGGAAAATGaagttcaaaataatgtacaattattGCCAGATACTAAGTACATCATTGAAGAAGACCTAGGTGAAGGGGAGTCAGCTGAGGAACTGGATATAGCTCAGGCAACAGAACATGTTTCCAATGATATTTGGTTAGAAGATGAAATAAAACGACTCATAGTTTTCTATCTTGataataaagaaacatttcTTAGTGGAGCTACAAAGAAAACACATTTATGGGCTGTTGCGTGTAAAACAATGCTGGCTGGTAAGACTCCGATATTATGTGAAGTAAAAttaagagaattaaaaaaaaattatgttcaagTGTGCCTCGAAAATCAGAACGGAGGTACCATAATTTGGAATTATTACAATTTGTGTAATCAGGCATTTCACGATGACAACTTTGTTAAAATGTGCCTTAGTGAAAATAGTAGCGATAATCAAATTACTGTGAATATGCCAGTTAAAAATGTTGTCAACCAAGATGGTATATTAGTTGTTAAAAAAGTCAACAGTTGTCAAAACAAAGATGAGCAAGTTGAAGCAATGCTCAATTCATACATCAAACACAAGACTTTCTTTCAGAAACAGTATAATACACAGAGGGGCTTATGGGAGGCTATTGCTATGGATTTTGGAGAAGAGGATGTTGATTATTGGCACAAACGTTTCTTAAACTTCAAGCAACACTATATAAGGATGATCTACAAACGTAAGGAAAGTGGAGCTGAAAGTATTAATTGGCCATATATGAAATACTTTGATCAAATATTTGGTGATGACGAAGATTTCtcacgtaaatatttatacagtgaAGAAAATGACACTAAAGTCTCTATAATGATTGAAAATGATCCAAATTCCTGGAATGatattgaaataacatttttggtTAAGTATTATTTCGATTGTTTCAATGAATTCCACGATCCGAGCATACCAAATAATTTTTTATGGCAAGAAGTTGGTAGATTAATAGATAAGACACCGGAAAATTGTGAGAAAAAATTTGAAGATCTTAAGAATGAACATTTCGGTAAACTCATAGAAGGTGACTATGATTTAGCAAATCGGATACCGTTAGCAATTTTGTTTGATAACATAATAGCTAAAGAAGTAGAAATGGAAGTTAATAACCCCGAAAAAGATGGTCCTGATCTATGGAAGACCGAACAAATTGATGAATTAGTGcagtatttgtatgaaaatatagaTATGTTAAAAGATCCTGTGTGTTATTATGTTAGTTGGGCATCCCTTGCGAGGAAATTGAAAAGAAGCGTAACGTCTTGTCGGAAACAATGGAACGATCTGACTACACTTTATAAGAACAttttagatgataaaaaagaaaatcctGATATGCAAATAGACTGGAGGTATATTGACTTAtttgatagaatatttgattatGGTATGGATAGCAATCTACTGGACGGTTATGAGAAATTGAAAGAACTCGGGCaagtaaataaatctaataaagtGGGAGttaAAAAGGTCACCATCAAAGATAATGATGATAAATTCCTTGAAAATGGAACAGATGACGAGGAACTTTACGACGAAAGAGGTTTTACAAAGCGTTCCAAAAAACGCAACGGAGACGCAAAAGCTTTCAAAATACTagaattctatttaaaaaataaagataaatttgcaTCATCACAGCAGAAGAAATTGGCACTATGGGAAATCTTGGCACGACAAATAGGCATTACAGCAACGGAATGCGCTCACAGATTCCGCAATTTCAAACAAGTATACACGGGATACGTTCAAAGGGAAATAAATAAGCCCGAAATGCCCATACTTTGGCCATACTACAACCTTTGCAAGAAAGTATTCGGCTATAGAGCCATAAAATCGAAATTGAAAAACGGGAAGATGGATTCCGACGACGCAGAAGACTGGTCCGCAAAGGAAATCAAGCAGTTGATCAATTATTTCTCTAGAAACTTCAGCAATTTCCAAGAAAATATCGAAGCAAGAAGCAAATGGACAGAAATAGCCCAAGAAATCAGTAGGACCGAAACAAGTTGTTGTGATAAGTTTCTTGAGTTAAGGAAGTCTTATAGAAAATTGAAGACGATGAAAGCCCGTAATCCAGATGTCAAAGTCTCctggaaatattttaatatgctcgatgacatttataaatatggtGAACAAAACTGTGAAGTTCTGGAAAATATGGAAGTTGATGAGTgcaatgatgatgataatgaaataAAGCTGGAAATGCAGGAAGATGATGATTATCAATGTATCATTGTTATACCCGAAGGCgaagatattaataatactcaaattattattcaagaaCAAGAACAAGATAAAGATCAAGAGGCCACAGAAATAACAAATTCAAAGCAGATCATAACGAAATGGAATAAGCGAAGTAAAAAAAGACTTCTAACCCTTTATCTAAATTACCTAAGGGTGCACAAAGGACAGGAGATTAATCAAAGAGAAATGTGGACGGAAATTGCGTCGAAATTAGACGAAAAAACGCCCATTTCATGCAAGAAAATgttcttaaaactaaaaaatcaaCACAAGCAACTTAACGAAGCTGACTTCAAACTTCCGTATAGTGTCCTCTTAGAGAAAATCCTCACTTTCAAACCTAAATTTGCcaaatcaaacaaaaacaagGATTTAGAAGAAATCAATACTTACGAAGATATACCAATGTCCGATGAGAAAGTTTACAAtgctttaaattattacttgcAGAATCTTGAAGACTTTGTCAGCCCAAAATTTGAGCAGAAATATCTTTGGACGGAACTAGCGAAATTCATTTCTGAGCCAGTCAACAAAATATTCAGTAAAATTAACTACTTGAAGCAAACATTTGACAGTGAAATAGATACTCCTTTTAAGGAGATCTTGCATGAAATATTGACAAAGGAAAATGCACTCAGAGAGGAAATAAATAAGGATCCTGATCCAATAACAGAGGAGGATAGTGAGCAAACATGGTCTGATATTGAAACTGAGCGACTTCTAACATGGTACTTAGCCCATTTGGATAAGTTTAAGAATCCGAAGTTCGTTCGAAGTTATCTATGGATGGAGGCGTCCGATATATTGAAGAAGAGTCCACTGGTTTGTTCGAAGAAAATGTCCGAAATACGATCCCAGTATAGAACAATGGTTAGAGAAAATCCAGAGGAATTAGACAATTGGAAGTTTTACAATCTGTGTCAGAGAATTTATGGAACTGGGAAGAAGAGCTCGACTAGTAACAAGGGTCttgaagatatataa
Protein Sequence: MEKIVVKTEVQPNGDILLFYVDENEETDLRGLENEVQNNVQLLPDTKYIIEEDLGEGESAEELDIAQATEHVSNDIWLEDEIKRLIVFYLDNKETFLSGATKKTHLWAVACKTMLAGKTPILCEVKLRELKKNYVQVCLENQNGGTIIWNYYNLCNQAFHDDNFVKMCLSENSSDNQITVNMPVKNVVNQDGILVVKKVNSCQNKDEQVEAMLNSYIKHKTFFQKQYNTQRGLWEAIAMDFGEEDVDYWHKRFLNFKQHYIRMIYKRKESGAESINWPYMKYFDQIFGDDEDFSRKYLYSEENDTKVSIMIENDPNSWNDIEITFLVKYYFDCFNEFHDPSIPNNFLWQEVGRLIDKTPENCEKKFEDLKNEHFGKLIEGDYDLANRIPLAILFDNIIAKEVEMEVNNPEKDGPDLWKTEQIDELVQYLYENIDMLKDPVCYYVSWASLARKLKRSVTSCRKQWNDLTTLYKNILDDKKENPDMQIDWRYIDLFDRIFDYGMDSNLLDGYEKLKELGQVNKSNKVGVKKVTIKDNDDKFLENGTDDEELYDERGFTKRSKKRNGDAKAFKILEFYLKNKDKFASSQQKKLALWEILARQIGITATECAHRFRNFKQVYTGYVQREINKPEMPILWPYYNLCKKVFGYRAIKSKLKNGKMDSDDAEDWSAKEIKQLINYFSRNFSNFQENIEARSKWTEIAQEISRTETSCCDKFLELRKSYRKLKTMKARNPDVKVSWKYFNMLDDIYKYGEQNCEVLENMEVDECNDDDNEIKLEMQEDDDYQCIIVIPEGEDINNTQIIIQEQEQDKDQEATEITNSKQIITKWNKRSKKRLLTLYLNYLRVHKGQEINQREMWTEIASKLDEKTPISCKKMFLKLKNQHKQLNEADFKLPYSVLLEKILTFKPKFAKSNKNKDLEEINTYEDIPMSDEKVYNALNYYLQNLEDFVSPKFEQKYLWTELAKFISEPVNKIFSKINYLKQTFDSEIDTPFKEILHEILTKENALREEINKDPDPITEEDSEQTWSDIETERLLTWYLAHLDKFKNPKFVRSYLWMEASDILKKSPLVCSKKMSEIRSQYRTMVRENPEELDNWKFYNLCQRIYGTGKKSSTSNKGLEDI

Similar Transcription Factors

Sequence clustering based on sequence similarity using MMseqs2

100% Identity: iTF_00985050;
90% Identity: iTF_01080672;
80% Identity: -