Basic Information

Insect: Philaethria dido
Gene Symbol: -
Assembly: GCA_033558755.1
Location: JAKGSA010000648.1:735785-740232[+]

Transcription Factor Domain

TF Family: MYB
Domain: Myb_DNA-binding domain
PFAM: PF00249
TF Group: Helix-turn-helix
Description: This family contains the DNA binding domains from Myb proteins, as well as the SANT domain family [1].
Hmmscan Out: # of c-Evalue i-Evalue score bias hmm coord from hmm coord to ali coord from ali coord to env coord from env coord to acc

1 7 7.5 8e+03 -2.6 0.0 15 31 221 241 219 242 0.69

2 7 0.6 6.4e+02 1.0 0.0 22 43 340 362 310 365 0.76

3 7 0.00049 0.52 10.8 0.2 23 44 441 461 412 463 0.82

4 7 0.079 84 3.8 0.1 23 45 587 608 564 609 0.85

5 7 3.1e-05 0.033 14.7 0.4 3 44 660 710 658 712 0.83

6 7 0.0011 1.2 9.7 0.2 14 45 834 872 826 873 0.78

7 7 2.9 3.1e+03 -1.2 0.3 2 14 1013 1025 1012 1031 0.85

#	of	c-Evalue	i-Evalue	score	bias	hmm coord from	hmm coord to	ali coord from	ali coord to	env coord from	env coord to	acc
1	7	7.5	8e+03	-2.6	0.0	15	31	221	241	219	242	0.69
2	7	0.6	6.4e+02	1.0	0.0	22	43	340	362	310	365	0.76
3	7	0.00049	0.52	10.8	0.2	23	44	441	461	412	463	0.82
4	7	0.079	84	3.8	0.1	23	45	587	608	564	609	0.85
5	7	3.1e-05	0.033	14.7	0.4	3	44	660	710	658	712	0.83
6	7	0.0011	1.2	9.7	0.2	14	45	834	872	826	873	0.78
7	7	2.9	3.1e+03	-1.2	0.3	2	14	1013	1025	1012	1031	0.85

Sequence Information

Coding Sequence: ATGGAAAAACAAATAGTTGTTAAAACAGAAGTGCAACCTAATGGAgacatacttttattttatgttgatgAACATGAAGGACTAGATGCTAGTGTCTTGGAAACTACAGATGTAAATAATATAGAGGTTCTacctgaaaaatatattgtggaGGAAGATATTGGAGATGCTGACTCTACTGAAGAGCTGGACATCAGTCAAGCCTCTGAAGATATTATCAATGAAATATGGGAGGATGAGGAAATAAGacaacttataattttttaccttGATAACAAAGACACATTTCTAAGTGGTACTACTAAAAAAGTGCATTTATGGGCTGTTGCATGCAAAACCATGTTGACGGGGAAACAGCCTTTATCTTGTGAGGTGAAGCTTAGGACTTTAAAGAGAAAATATGCTCAGTTGCGTGTAGACAATCAAAATGGAACTTTTATTAACTGGCCAATGTATGATTTATGTCACCAAGCATTTCATGATGACACATTTGTTCAAATGTGTTTAAACGAACCAGCTCAGGAATCAGTTACATTAAGTATGCCTTCACAGAATGTTGTAAGTAAAGATGGTATTTTACTTGTAAAAAAGGTTAACTCAAGCCAAAATAAAGATGAAAAAGTTGAAACTATGttgaatttatacataaaacataaaaatttcttTCAAAAACATAGTAATTCACAAAAAGGTTTGTGGGAGGCTATTGCTATGGATTTAGGGGAGGCAGATGTTGATTATTGGCATAAGCGCTTCCTAAACTTCAAACAACATTACATAAGAATGGtgtataaaagaaaagaaactggTCCAGAAAGTGTAAATTGGCCTTACATGAAAtactttgataaaatatttggtGAAGATGAGGAATTTCAACATAGATTCATAGAAAACATTGAATTCACAACACCAACAATACATGACGAGAATGCCTGGAATGAAACTGAGAAAAcctttttagttaaatattattttgattgtttACATGAATTTCTAGATCCTTCTGTTCCAAATAAATTTCTATGGCAAGAAGTTGGTAGACTACTGGATAAAAAACCAGAGGCTTGCAGGAAAAAGTTTGAAGAGCTTAAAAGGGCTCATTTTGATCAGCTCATAGAGGGTAGTTATAATTTAGTAGAAAGAGTGCCTTTAGCAATTTTATTCGACAATATAATAGCTAAAGAGGTTGAGAGTGAGGTGGAAAATCCTATAAAACGTGACTCAGATATATGGAAAACTGAACAGATTGATGAATtagttcaatatttatatgaaaacatagATATGTTGAAAGACGCTGTATGTTATTATGTGACTTGGGCAGCATTAGCAAAGAAATTGCATAGAACTGTGGACTCTTGTAAAAAACAGTGGAATGAACTAACTtccttatataaaactattttggaTGATAAAAAAGAGGATCCGGACATGCAAATAGACTGGCGTTACATAGATTTATTTGATAGAATATTTGATTATGGCATGGATACTAATTTGTTGGATGGTTATGAAAGGTTGAAAGGACTCAGTCAAGTTAATAAGTCTAGTAAAATTGGagttaaaaaaataacaatacgaGACAACGACGAAAAACTGATCGACGGAACTGACGACGAGGAATCCTACGACGAAAGAGGTTTCGCCAAACGTTCAAAAAAACGTAGCGGAGATACCAAAGCGTTTAAAATACTAGAGTActatctaaaaaataaagataaatttgCTTCGTCACAACAAAAGAAATTGGCTCTCTGGGAAATACTGGCCAGACAAATTGGCATATCGGCTACCGAATGCGCCCATCGGTTTAGAAACTTCAAGCAGGTTTACACCGGCTATGTCCAAAGAGAGATAAATAAACCAGAAATGCCAATATTATggccatattataatatatgcaaaAAAGTTTTCGGCTACAGAGCTATAAAGTCGAAATTGAAAAACGGCAAAATGGACTCCGATGACCCAGAAGATTGGGCGGCGaaggaaataaaacaattaattaattatttcgcCAGAAACTATCACCAATTGtctgaaaatatagaaaataaggGGAAATGGACGAAAGTAGCCCATGATTTGGGTAGAACAGAAAACAGTTGTTGCGAGAAGTTTCTAGAACTTAGAAAGTCTTATCGTAAGTTAAAAACTATGAAGGCTAGAAACCCAGATGTGAAAGTGTcgtggaaatattttaatatgatagatgATATTTATAAGAACAACGAAATGAACGATAGTACTGAAGTGCTTGAAACTATGGAGGTAGATGAAAATAGCGATTATGATGTTATTGTGAAGAATGAGGCACAAGAAGATGACGACTTCCAATGTATCATAGTAATACCAGAAGGAGAAGATATAAATAACGCACAAATTATCATACAAGGACAAGAAGAAAGTCCCACACAACAAAACACAATACAAAAACAATCAGTCGTAACTAAATGGAATAGACGAAGCAAAAGACAACTATTAATACAATACCTTAAATATCTTAAagcacataaaaataaagaaattaaccTGAGAGAAATGTGGACAGAAATAGCATCTAAATTAGATGAAAAAACTCCCCTatcttgcaaaaaaatatatttgaaactaaaaaatcaaCATAAACTTAGTAAAGATCATAAAACCccatattcaaatttaatagaaaaaatttTACAAGTTAAGCCTAAAATCATTAAAACAGTCAAAAGTGATAGCAACTTGGAAGACATATATGAAGATGTTCCAATGTCAGACGATAAAGTGGAAAAAGCGttgaaatattacttacaaaacTTAGAGGACTTTGTTAGTCCTAAATTTGAGCAGAAATACTTATGGACTGAATTAGCTAAGTTCATATGTGAACcagtcaataaaatatatagcaaaattaattatttgaagcAGACATTTAGTAATGACTCGGAAAGTCCTTATAAAGAATTGTTATCAGAAATACTAACAAAAGAGAATATGTTAAAAGATTCAATAGAAAAAGATCATCCAGTACTAGAAGATGAGAATGAAGAAGCTTGGTCTAATGTAGAAATAGAAAGGCTTTTAACATGGTACTTAGCACATTtagacaaatttaaaaatccaaAATTTGTAAGAAGTTACTTGTGGATGGAGGCGTCGGATATATTGAAGAAAAGTGCGTTAGTCTGTTCCAAGAAAATGCTAGAAATAAGATCTCAATACAGAACGATGGTGAAAGAGAATCaagaagaattaaataattggaAGTTTTATAATCTGTGCCAGAGGATTTATGGGACGGGAAAGAAGAATAGTGTTGCTTAA
Protein Sequence: MEKQIVVKTEVQPNGDILLFYVDEHEGLDASVLETTDVNNIEVLPEKYIVEEDIGDADSTEELDISQASEDIINEIWEDEEIRQLIIFYLDNKDTFLSGTTKKVHLWAVACKTMLTGKQPLSCEVKLRTLKRKYAQLRVDNQNGTFINWPMYDLCHQAFHDDTFVQMCLNEPAQESVTLSMPSQNVVSKDGILLVKKVNSSQNKDEKVETMLNLYIKHKNFFQKHSNSQKGLWEAIAMDLGEADVDYWHKRFLNFKQHYIRMVYKRKETGPESVNWPYMKYFDKIFGEDEEFQHRFIENIEFTTPTIHDENAWNETEKTFLVKYYFDCLHEFLDPSVPNKFLWQEVGRLLDKKPEACRKKFEELKRAHFDQLIEGSYNLVERVPLAILFDNIIAKEVESEVENPIKRDSDIWKTEQIDELVQYLYENIDMLKDAVCYYVTWAALAKKLHRTVDSCKKQWNELTSLYKTILDDKKEDPDMQIDWRYIDLFDRIFDYGMDTNLLDGYERLKGLSQVNKSSKIGVKKITIRDNDEKLIDGTDDEESYDERGFAKRSKKRSGDTKAFKILEYYLKNKDKFASSQQKKLALWEILARQIGISATECAHRFRNFKQVYTGYVQREINKPEMPILWPYYNICKKVFGYRAIKSKLKNGKMDSDDPEDWAAKEIKQLINYFARNYHQLSENIENKGKWTKVAHDLGRTENSCCEKFLELRKSYRKLKTMKARNPDVKVSWKYFNMIDDIYKNNEMNDSTEVLETMEVDENSDYDVIVKNEAQEDDDFQCIIVIPEGEDINNAQIIIQGQEESPTQQNTIQKQSVVTKWNRRSKRQLLIQYLKYLKAHKNKEINLREMWTEIASKLDEKTPLSCKKIYLKLKNQHKLSKDHKTPYSNLIEKILQVKPKIIKTVKSDSNLEDIYEDVPMSDDKVEKALKYYLQNLEDFVSPKFEQKYLWTELAKFICEPVNKIYSKINYLKQTFSNDSESPYKELLSEILTKENMLKDSIEKDHPVLEDENEEAWSNVEIERLLTWYLAHLDKFKNPKFVRSYLWMEASDILKKSALVCSKKMLEIRSQYRTMVKENQEELNNWKFYNLCQRIYGTGKKNSVA

Similar Transcription Factors

Sequence clustering based on sequence similarity using MMseqs2

100% Identity: iTF_00248035; iTF_00247151; iTF_00723023; iTF_00159797; iTF_00213406; iTF_00212416;
90% Identity: -
80% Identity: -