Basic Information

Insect: Anoplophora glabripennis
Gene Symbol: -
Assembly: GCA_000390285.2
Location: NW:395413-403401[-]

Transcription Factor Domain

TF Family: MYB
Domain: Myb_DNA-binding domain
PFAM: PF00249
TF Group: Helix-turn-helix
Description: This family contains the DNA binding domains from Myb proteins, as well as the SANT domain family [1].
Hmmscan Out: # of c-Evalue i-Evalue score bias hmm coord from hmm coord to ali coord from ali coord to env coord from env coord to acc

1 4 0.0092 7.4 6.5 0.0 2 14 1334 1346 1333 1361 0.77

2 4 1.8e-06 0.0014 18.4 0.0 2 43 1411 1453 1410 1455 0.89

3 4 6.3 5e+03 -2.6 0.1 22 30 1492 1506 1464 1512 0.50

4 4 0.23 1.8e+02 2.0 0.1 22 32 1556 1566 1552 1573 0.85

#	of	c-Evalue	i-Evalue	score	bias	hmm coord from	hmm coord to	ali coord from	ali coord to	env coord from	env coord to	acc
1	4	0.0092	7.4	6.5	0.0	2	14	1334	1346	1333	1361	0.77
2	4	1.8e-06	0.0014	18.4	0.0	2	43	1411	1453	1410	1455	0.89
3	4	6.3	5e+03	-2.6	0.1	22	30	1492	1506	1464	1512	0.50
4	4	0.23	1.8e+02	2.0	0.1	22	32	1556	1566	1552	1573	0.85

Sequence Information

Coding Sequence: ATGGAACAACAAAATATTGGCAATAATTCATTCACATTTACAATcaacaattttagaaaaaaacaaaaggaaGTTTTTCATGGATCAAAATTGTTATTGAGAGACTattctaaatataatattaataagccTGGAAGAAACCAGTGGCTTATAGGAGATAGTTCCTTAAAAAGCAACcaaaagaagaaacaaaataatttggttAGAATTAGCGATCTTACTGATCAACAGAAAAAATGTGAGGATAGTCTCAATACCGTAAAACGTAAGAAGcgcaaaaagagaaaaaaaaataacgttgaagacatgcaacaaaagttttttgaaaGCAATGCagtaaatggtaaaaaatatacaacaaaCCCTAAAAGTGAATTAAATACATCTTTTAGAGACactaattacaaaaaatcaatcgCATGTCCGTTAGGCACGTCGAATGTTTCGATGACTTCCCACGTTGTAAATCATTCAAATAGAAATTCAAATGATATTAGAAGCACAGTTTCAAGTAACTACAATGTTAGTTACAAGcaaaagaagaaaagaaaaaaattagaaaagcaGAAGTATGATACTATTAACAAATTTAGAGGCAATAGTAACACAAGTGAATCAAATTACAGTGGTCAATTTGCATTAAATGGCTCTGAATCTAAAGTAGTTAATAAACAGGATTTAGATTTGctttattttgatatatatgGGAATGGGAGAACTAGTAAAGAAcaagaagcaaataaaaatgtagtatGTAATGGTTCtcacataaatatatttaactgtGATACTTCTAATAACTGTAATGATAAAAAAACTATGTTACAGCAAAGTGAAAAtcgaagaaagaaaaaaaaagataatgttAACGAatctaataatttcaattttctgttttataatataaataaagattCAGATCAGATATGTGATAAAAATGATGTTCTGATAGAGACtggtttagaaaataatttagaatcTGAAGAGGTAGCTGTGATGAGTAGTGAGGATAAAGAGAGATTCAATGTACTTGGTAAAGAGTCAAGAAAACgtaaaaagagaaataaaaatgcAGGAACCTCTATAAACATTTTGGATTCTGAGgatgaagtaaaattaaataaacatattttactaGAAGATAATGGGAcaaaaagaacagaaaatagttttaaaatgcaGGATAAATTGAAAAAGAAGAAGAGTCGAAAAAAGTCTGTTGATTTGATAGTAAATGTTTCAGACAGTGACTGTGAGTTTATTGATTTTGATAATTCAATTTCAAAGACAAAAGGCAAgcataatacatataaaatcgACGAAAAAGATTCTAAACCGAAACACAAGACAAGaataatggaaaataatatgCAGGAAAATATTCTTGGATTCAGTAATGCTAACACTAAAAATGCTTTACTAAAAATGTCAGAAAAAAGTAGTGAAGATAATAAAGAATCTGATGAACTAAATGTAGTAGATGATTGTAAGTTTCTTaaagttaaaaagaaaaaaactaaatctcAAGCTGACAAtaatataggttatacaaaaaacatGAGCAAGTTTAAAAAAGATGTTGAGGATGTACATGATACTAATATTTCAAGAGAAGATGTATTTGATTGTAATATAAATTCActggaaaataaaaacaattcatTACCTGTAACACCAGATACTAAAGCCTGTGAAATTGTAAAAGCTGCAGAATTGAAAACCCATGTAAATGAGAATGATGGAGAATGTGAGATTATTGATTTTGTTAGTTCAAATAGGAAAAAGAAGAAGCAACAATTTATTAATGTTGAATTGGATGCTATTTATTCACCCAAAAGGAAACAAAAGGTACAAGCAAAGGAAACTGATGTTCAAGAAAATACACATGAAACTACTAACACATcgaaattattgagaaatatcAATAAAGATGATAGCGAATACAGTGAAATGAATATAACTGATGATTTTAAGCGTGTCAAatccaaaaagaaaaaacataaaaattactctaacagtaatattttaaatattcttaagAAAGAAGAAATAGATGAGGAAGATGATGTACATTACCAAAATTTCAGGGAACTCAATGACTCTGAATCTACAGAAGAGGAACAAGATTCAAatgataaattcaaatattccaAACAATATGGATTCACCTCTAAAAATTATATGGCAAGTGGAggcaaattattttatgaatcgCCAGGAAATAAGAGTTATACAATGTCTCAAGATGTACAAACAAATACAAACAGAAGGAATGAGCAAAGTCAAATTGGAGATAATGATACATTGACGATTATTTCTGAGGATGAATGTGAAATTATCGACTATGTTAGTTCAAATTCAAAGAAAAGGAGGAAACGTGTTACTAGTACAAAATCAGATGTCTACAATACACCCAAAAAGAAATATAacacaacaataaaaattgttgataATAATGAGAATTCTGCAACAGTgtcaagaaaaaataattacgatGCAAGTATATCCAAAGGACAAACTGGAAATAGTGCTTCAGATgttgaaaaacagaaaatatttaaggaaGTCAATAATAAACAACAAGAGCATTACAACAAACTAGATACGGTTAAATCCCTAAAAGAGGAATGGTGTTGGGACGACGAATTAGGGAACCATTATAGTATTTCACATAAAAACAATGAGATGGCGTGTGTAACTAAAGACGATAAATCTGTAGAAACTAAAACCGAGATACAGGAAACCAGTACAAACAGTTTAACCAGTAACGTAAAGCTTGAATGTTACAGTGATAAACCAAATATTGGAGTATTTACACTTAGAACTGATTTAAATTCACCAACTAAAACAGTTCAAAAATCAGACGAAATGGAAATTAAAGatgATAATCAAGATGACCCGAGCAATTCAAAAAGTGAATCAACATTTTTAGAAGAAGAAACGAACAAAGTGGATgagaaagttaaaaatattaaaacaccaAATAGTTCTGAAAGTGAACATGAGATAATCGACTACGTTGGTTCAAGTACTAAGAAAAAGAGAAAACATATCACTGGTGAGGAGTTAGAGGCCCGtaatacaaacaaaaagaaatgcAAAACAGCAAAGGTGAAAAACGAAGAAAACGTTGAAATTCGTAatgcattaaataatttacaatacaATGAAAATGAGTTGAGTGGAAAAAATCCAGCCGATGATTATAATTTAGTCAAAGTTGAAAAGAAGAAACATAAATTCTTGGAAATTCGAACTGATGTAGATTACGTCGAGAAACAGGAAACTATTAAAGAAGAAGTCGATAATGAACGGCAAGAGAATCCTTTTGAACTAGTTTTAGTTAATTCTCTAAAAGAGGAACATTATCAGGACGAATTAGAAGATTGTAACAGTATTTCATTGAAAGAGAACGACTTGAGCAGTGTCTATGAAACTGAGGACGACAGTACACATGAATctcagaaaatttttaacgactGTCAGTCTTCAGACAGTTCTGAAAATGAGGACAGTACACATGGATCTCAGGAAATTTTTAGTGACGATCGGTCTTCAGACGGTTCGGAAATAATCGGTTCTAAATGGGGATATGCGCAATATAATACTGAGGTGGACGAAGATGGTACAAATAATTCGACTAATGATGCATTAAACTCTTATGAATATCATATCGATAAAGTAAATATTGATGCAATTACAAAGGATTCATATGTATCAGATCACATAGAAAGTGAagAGGATGAGGACAGAAAAAAGGAAAGTCCAGATAAAATCAAGAGGAATGAGGAGAGTATTCGTAAAAGACAAAGGAAGTCGATTATACCGGTAATATGCACCGATCCAGAAGAACTTGAGGATGACATTGAGAAGCTGAGGAATTTAATAGTCCTGTTCCCTTTCAGTATACCTCCTTTGCATGCTTTAACAACCAGAACGACTACACCGACAAAGGAATTGCTAGAAAAAATTCGACAACAGAATTTGTCGATAAAAAGTGGACCTTTCAGCAAAGAAGAAGACGAGAAGATCATAGAAAATTGGAAACAGTTATGCAGAgaaCATGGTTTGGGGATGAACCCTTccctatttttcaaatttcctacGAAAATGAAGATGGAAACGAAAGTAGACATCCTACGTTACCTAGCACACGACATGGACGATCGCCTCGTGCACCGAGTATATATTAGATTTCGGCACCTACTTCAACAAGACCATATAAAAACCGGACGgtTCACCCCCGAGGAAGATGAAATGTTATTAGAGTTTCTGAGGAACACGCACTCGGGGCGTCCTTTTAGTGATTTATCTAAACTACTCCGTCGCACCAAAACATCTGTTGAAAGACGCTATAATCTACTGACgaataatgataataaagtAACTCATTGGACTGTAGAAATGGTCGATAGGTTCGTTAAGGCGCTAATGAAAATTACGAAATGTGAAAAGGTAAAGAAACTGAAGCATAGAGAGTTTACGAATAAAGAATGGCAAAAGTTGTCCAAAAAATTGGATaatatacctattaaaaaattacaacgtGCATGGAAAGTTACAATATATCCCCGATTGTTTTCTAAGGAAGTTGATATGAGAGAAGTGAAGGaggatataataaatattttatgtgATCGAAACGAAACAGATTGGAGAACGGTGAACTGGAAGGAAATAGCAAAGCACTTTAAAGGTGTCACTGCGGATAAAATATACATGATGTTTAAACAACTGATACACTTCCACGTGCCTAGACATAAACGTAGTGATCTTAAAGAGTGCCTGGATTTCTTGAACAGTATGCTCTCGAGATATGGTAGGTTACATTCtacacataaatttaaaaaatttatcgtTAAAAACGGCCACATAACTTATAATATTGAAAACTCCAATTAA
Protein Sequence: MEQQNIGNNSFTFTINNFRKKQKEVFHGSKLLLRDYSKYNINKPGRNQWLIGDSSLKSNQKKKQNNLVRISDLTDQQKKCEDSLNTVKRKKRKKRKKNNVEDMQQKFFESNAVNGKKYTTNPKSELNTSFRDTNYKKSIACPLGTSNVSMTSHVVNHSNRNSNDIRSTVSSNYNVSYKQKKKRKKLEKQKYDTINKFRGNSNTSESNYSGQFALNGSESKVVNKQDLDLLYFDIYGNGRTSKEQEANKNVVCNGSHINIFNCDTSNNCNDKKTMLQQSENRRKKKKDNVNESNNFNFLFYNINKDSDQICDKNDVLIETGLENNLESEEVAVMSSEDKERFNVLGKESRKRKKRNKNAGTSINILDSEDEVKLNKHILLEDNGTKRTENSFKMQDKLKKKKSRKKSVDLIVNVSDSDCEFIDFDNSISKTKGKHNTYKIDEKDSKPKHKTRIMENNMQENILGFSNANTKNALLKMSEKSSEDNKESDELNVVDDCKFLKVKKKKTKSQADNNIGYTKNMSKFKKDVEDVHDTNISREDVFDCNINSLENKNNSLPVTPDTKACEIVKAAELKTHVNENDGECEIIDFVSSNRKKKKQQFINVELDAIYSPKRKQKVQAKETDVQENTHETTNTSKLLRNINKDDSEYSEMNITDDFKRVKSKKKKHKNYSNSNILNILKKEEIDEEDDVHYQNFRELNDSESTEEEQDSNDKFKYSKQYGFTSKNYMASGGKLFYESPGNKSYTMSQDVQTNTNRRNEQSQIGDNDTLTIISEDECEIIDYVSSNSKKRRKRVTSTKSDVYNTPKKKYNTTIKIVDNNENSATVSRKNNYDASISKGQTGNSASDVEKQKIFKEVNNKQQEHYNKLDTVKSLKEEWCWDDELGNHYSISHKNNEMACVTKDDKSVETKTEIQETSTNSLTSNVKLECYSDKPNIGVFTLRTDLNSPTKTVQKSDEMEIKDDNQDDPSNSKSESTFLEEETNKVDEKVKNIKTPNSSESEHEIIDYVGSSTKKKRKHITGEELEARNTNKKKCKTAKVKNEENVEIRNALNNLQYNENELSGKNPADDYNLVKVEKKKHKFLEIRTDVDYVEKQETIKEEVDNERQENPFELVLVNSLKEEHYQDELEDCNSISLKENDLSSVYETEDDSTHESQKIFNDCQSSDSSENEDSTHGSQEIFSDDRSSDGSEIIGSKWGYAQYNTEVDEDGTNNSTNDALNSYEYHIDKVNIDAITKDSYVSDHIESEEDEDRKKESPDKIKRNEESIRKRQRKSIIPVICTDPEELEDDIEKLRNLIVLFPFSIPPLHALTTRTTTPTKELLEKIRQQNLSIKSGPFSKEEDEKIIENWKQLCREHGLGMNPSLFFKFPTKMKMETKVDILRYLAHDMDDRLVHRVYIRFRHLLQQDHIKTGRFTPEEDEMLLEFLRNTHSGRPFSDLSKLLRRTKTSVERRYNLLTNNDNKVTHWTVEMVDRFVKALMKITKCEKVKKLKHREFTNKEWQKLSKKLDNIPIKKLQRAWKVTIYPRLFSKEVDMREVKEDIINILCDRNETDWRTVNWKEIAKHFKGVTADKIYMMFKQLIHFHVPRHKRSDLKECLDFLNSMLSRYGRLHSTHKFKKFIVKNGHITYNIENSN

Similar Transcription Factors

Sequence clustering based on sequence similarity using MMseqs2

100% Identity: -
90% Identity: -
80% Identity: -