Basic Information

Insect: Aphis gossypii
Gene Symbol: MYB_2
Assembly: GCA_004010815.1
Location: NW:30388-33408[+]

Transcription Factor Domain

TF Family: MYB
Domain: Myb_DNA-binding domain
PFAM: PF00249
TF Group: Helix-turn-helix
Description: This family contains the DNA binding domains from Myb proteins, as well as the SANT domain family [1].
Hmmscan Out: # of c-Evalue i-Evalue score bias hmm coord from hmm coord to ali coord from ali coord to env coord from env coord to acc

1 6 0.0061 4 7.1 0.0 22 44 289 310 276 312 0.92

2 6 5.8e-12 3.8e-09 36.0 1.1 4 46 321 365 318 365 0.97

3 6 3.9e-09 2.6e-06 26.9 0.2 1 44 371 420 371 422 0.94

4 6 0.057 37 4.0 0.0 25 45 451 471 440 472 0.83

5 6 2.5e-12 1.6e-09 37.2 0.1 1 43 480 525 480 527 0.93

6 6 5.6 3.7e+03 -2.4 0.1 4 14 773 783 772 789 0.75

#	of	c-Evalue	i-Evalue	score	bias	hmm coord from	hmm coord to	ali coord from	ali coord to	env coord from	env coord to	acc
1	6	0.0061	4	7.1	0.0	22	44	289	310	276	312	0.92
2	6	5.8e-12	3.8e-09	36.0	1.1	4	46	321	365	318	365	0.97
3	6	3.9e-09	2.6e-06	26.9	0.2	1	44	371	420	371	422	0.94
4	6	0.057	37	4.0	0.0	25	45	451	471	440	472	0.83
5	6	2.5e-12	1.6e-09	37.2	0.1	1	43	480	525	480	527	0.93
6	6	5.6	3.7e+03	-2.4	0.1	4	14	773	783	772	789	0.75

Sequence Information

Coding Sequence: atggACGCATATGGTAACCCAATTCCTGGACCATCaagagaatttttaaatatagaaactACTGAATCAACAGCTGCTTATGACCTTATATGGTTAGAAAATGAGTTCAACAATGATGATACTAATGAAGATTCAaaagttcaaataaatatatttaaaagtttgaataaaaatgacagttataaatttgaaccaattaaaacaaatcctagtattcaagatttttttgaaaaaattgattgcATAGATTTTAATCAAGATGATatcgaacaaaataaatattatcttacagAGTTATTAgaacaatgtaataatttcataGATATTTTAGGccgtaatatagtttatttagaagaaataatgattgaaattcatagaaatattgaaatttcaaaaagaAATGAAATTAAAGCTTTAACTTGtataaagtttgaaaaaaaatatatgcctaaagttaaaatgaaaaatttgaaaattaaagcaCACTtggaaaacttttttaaaattggtttaGTAAACTGCCCACAGAATCCTCATCTTAAGGAGTTATACGaaactgaaaaattaatgttatcgtACAATGGACGTTTTATATTTGAAGAATGTATTGAAAGAAATCAATGGAAACaagagtttaaaaataaattagaaaaagcaATACATACTGaagtgttaaataaattaaaaattcctaTGCTTGAACAGCACTTGCGTCTTAGTATAGAAGGAAATAAACAAACTAAtccaattattaaacaaaaaattgaaattgaaatgttaGACCTAGAAAAagaattagatattatagCGAAAACACCATTTAAGCAGTTAGTCTTTCAGTTTATGGATTCAGACGCAAAGTATGATTGGCTACACATTGCAAAAGAAGTTGATAAACCTGATATACAATGTCAAAGGTtttggaatttaattttaaaacctcCCATATCTAGAGCTATATGGACTAAAAGTGAAGATGACCgtttaattcaaattgttgCAAAAAATGAGGAAAAAAATTGGCAAAAAATAGCTGATGAATTAGATAATAACCGTAATGAGTTACAATGTTTTGttcattatcaaaaatataaaaaaatgattcacaCAAGAGGTAAATGGACAAAAGAAGAAGATCAGAAACTTGTAGagataattaagaaaaactcAATAGATAATATCATCAATTGGCAAAGAGTATATTTTGCTATGCaagataataatagaaatgttTATCAAATCTACTCCAGatatatgcaAAGTTTAAAACCAGGCATCAAGAAAGGGTTTTTGActgataatgaaaaatttattattaaacaagctaaaatccaaaatatacCCCCATCGATAGTATCAATGAATCTAACTAATCGAACTCCTACACAAGTTCGTAATGCTTATcgtagaattttattaaacaatgaaGATATTTATAGAGGTGGTTGGTCAGCTGaagaagataaaatattaatgcgtGCTGTAAATTCTTTTGTGCCTAATGAATTTAGTTGGACACAAATATCTCAACAGGTGCCTAACCGTAATGAAGAACAATGCCGtcatagatttaaattaattgaaaaaaaattaaaaattaatccaaATTTAGATGTTGATGATCTTTCACGCCGATTCCGATCTTACAAGTATAAAGAATTAGCTTTTTTTCCAGaagatgaattaaattttgatttacaaaaacaatttaaactcaATCGCCAATTTCTTAAAACATCTAATATGCCAATGGAAACAATTGCCGATCTCAAGTTGAAGAGAGCATActtggaaaataattttgttattaacaaTTGCAATATGTCTAGTAAATGTGATCTCTACAAACACATACTTGATTATTTGGGAGCTAATTTGGTTGCACCTAATACGTTTACCCACACAGATGATTTGATTGATGCTGGACTTATGAGCATGATGTCATATATACAAGAGTATTCCATTGATGTAATGACTTTAGATTCTAGTAAGGTGGAGCATAATTTGTGTAACCCACTATTAACCCACGAAGGAGTTCACAATGTCTTGAGAACAAGTGATATAATCAATTCTGATCTAAGTGAAATAGAAGGTTTATTAgacattagaataaaaaatattcataaggaACAACCAAaagaagatttaaatttaaataattctactaaaaaaataaaagatccaCTACTACCTCTACAGTTCATTGGTTCTGTACCACCAAATTATGAGACTTTTAAAATCTTGTATGCATATAAGAATTCTTTAACTTCATTCATGAAAATCGATCACTGTAAAGATTCCAATATGGATTTTGATTGGGATGACGAAGAATCTATGAAATTAGAGAAACGCCTTGTCGCCATGTTAAGGTTACcaacattattttctaatttgatACCTTACAATGCAGCAAACATAAATATGCTTGTAAATGCTGACAAAGTTAATAAGGAAGAGATAAAAATAGTATCGTCTTCAAATTATTCTAAAGTTAATTATGCAcaccctaaaaataaaaaatac
Protein Sequence: MDAYGNPIPGPSREFLNIETTESTAAYDLIWLENEFNNDDTNEDSKVQINIFKSLNKNDSYKFEPIKTNPSIQDFFEKIDCIDFNQDDIEQNKYYLTELLEQCNNFIDILGRNIVYLEEIMIEIHRNIEISKRNEIKALTCIKFEKKYMPKVKMKNLKIKAHLENFFKIGLVNCPQNPHLKELYETEKLMLSYNGRFIFEECIERNQWKQEFKNKLEKAIHTEVLNKLKIPMLEQHLRLSIEGNKQTNPIIKQKIEIEMLDLEKELDIIAKTPFKQLVFQFMDSDAKYDWLHIAKEVDKPDIQCQRFWNLILKPPISRAIWTKSEDDRLIQIVAKNEEKNWQKIADELDNNRNELQCFVHYQKYKKMIHTRGKWTKEEDQKLVEIIKKNSIDNIINWQRVYFAMQDNNRNVYQIYSRYMQSLKPGIKKGFLTDNEKFIIKQAKIQNIPPSIVSMNLTNRTPTQVRNAYRRILLNNEDIYRGGWSAEEDKILMRAVNSFVPNEFSWTQISQQVPNRNEEQCRHRFKLIEKKLKINPNLDVDDLSRRFRSYKYKELAFFPEDELNFDLQKQFKLNRQFLKTSNMPMETIADLKLKRAYLENNFVINNCNMSSKCDLYKHILDYLGANLVAPNTFTHTDDLIDAGLMSMMSYIQEYSIDVMTLDSSKVEHNLCNPLLTHEGVHNVLRTSDIINSDLSEIEGLLDIRIKNIHKEQPKEDLNLNNSTKKIKDPLLPLQFIGSVPPNYETFKILYAYKNSLTSFMKIDHCKDSNMDFDWDDEESMKLEKRLVAMLRLPTLFSNLIPYNAANINMLVNADKVNKEEIKIVSSSNYSKVNYAHPKNKKY

Similar Transcription Factors

Sequence clustering based on sequence similarity using MMseqs2

100% Identity: iTF_00972975;
90% Identity: iTF_00135248;
80% Identity: -