Basic Information

Insect: Zeuzera pyrina
Gene Symbol: -
Assembly: GCA_907165235.1
Location: OU015642.1:7104707-7111392[+]

Transcription Factor Domain

TF Family: MYB
Domain: Myb_DNA-binding domain
PFAM: PF00249
TF Group: Helix-turn-helix
Description: This family contains the DNA binding domains from Myb proteins, as well as the SANT domain family [1].
Hmmscan Out: # of c-Evalue i-Evalue score bias hmm coord from hmm coord to ali coord from ali coord to env coord from env coord to acc

1 7 0.052 1.1e+02 4.3 2.8 1 14 73 86 73 130 0.77

2 7 0.16 3.6e+02 2.7 0.0 23 44 350 370 343 372 0.86

3 7 0.00034 0.74 11.3 0.1 9 43 430 469 427 471 0.81

4 7 0.0024 5.4 8.5 0.2 22 46 593 619 574 619 0.78

5 7 0.0032 6.9 8.2 0.1 3 41 669 716 667 721 0.83

6 7 0.00012 0.26 12.8 0.0 21 42 862 889 849 893 0.77

7 7 0.94 2.1e+03 0.3 0.4 2 13 1046 1057 1045 1066 0.90

#	of	c-Evalue	i-Evalue	score	bias	hmm coord from	hmm coord to	ali coord from	ali coord to	env coord from	env coord to	acc
1	7	0.052	1.1e+02	4.3	2.8	1	14	73	86	73	130	0.77
2	7	0.16	3.6e+02	2.7	0.0	23	44	350	370	343	372	0.86
3	7	0.00034	0.74	11.3	0.1	9	43	430	469	427	471	0.81
4	7	0.0024	5.4	8.5	0.2	22	46	593	619	574	619	0.78
5	7	0.0032	6.9	8.2	0.1	3	41	669	716	667	721	0.83
6	7	0.00012	0.26	12.8	0.0	21	42	862	889	849	893	0.77
7	7	0.94	2.1e+03	0.3	0.4	2	13	1046	1057	1045	1066	0.90

Sequence Information

Coding Sequence: ATGGAACAAATCGTGGTGAAGACTGAAATGCAACCTAATGAGGAGATCCTGTTGTTCTATGTTGATGAAGATGGAGGAAACGAACAAGGAATTTTAACTACTATGGAAAACATTGAACAAGTTCATGAAGAACAAGTACATCATGACACTTATGTAATGGAGGAAACTGCAGAATCAGCTGAAGAAGAATTTAGTCCATCAGATCAATCTTATGGTAAAGAACGGTGGACAGAAGAAGAGACTAAAAAACTTCTTGTGTTTTATATCGACAATAAGAACACTTTCGTCACGGGTGCTACAAGAAAGAAGCATTTATGGACTATTGCATGTAAGACGATGCTTAATGGGAAAAACCCTAATGCATGTGAAATGAAACTGCGCAACATGAAGAAGAAATATGCACAAGCACTCATAGACCAGAAACAAAATCCCAACTACCAGTGGCCCTATTTCGAGTTATGTCATCAAGCTTTTCATGATGACAATCAAGTTAGTGCAATGTTAAATGAAAATCAATCAGAACAACCAAATATTCCTGTGAAATATAAACCAGATGATGAAGGCATAGTggtagtaaaaaaaattcataacagTAGACCGAATACAGatgaaaaagtagaaattatgTTGAATATGTACCTTAAACATAAGAAGAAAGGTAAGGAAAGTACTCAAAGAAATTTATGGGAGACAATTGCTCTAGAAATTGGTGAGGAAGATGCTCAGTATTGGCATAAACGTTTCTTGAACTTCAAACAACATTACATAAGATTGTTGGACAAGCGTGCCGTGACTGGCCAAGACAACACCAGCTGGccatatatgaaaatatttgatgaaataTATGACGATGACAAAGAATTCCAACGAAAATATCTGAATACTGAAAATGTATCAAGTTATAAAGTGATTCATATTTCTACAGAAGAAATGGTAACTCAAGGATCTTTGGCTGATTGGAATCAAACAGAAGTTACAGTTCTTGCGAAGTATTACTTTGATTGTTTCGATGAGTTTCAGGATCCTACTATACCAAAGAACTTTTTATGGAACGAAGTAGGTAGACTGATAGACAAAAATCCTGAAGCTTGCAAACTGAAATATGAGGAACTAAAAGGTGAACATTTGGACAAATACATCGAAGGTGGATATGATATCCGGGCTCGTATTCCATTGGCAATATTGTTTGACTATATTATATCTAAAGAAATGCAAATAGCATTACTAAAAGTTCCAAAAAGTTCAGACCAATGTGATGTGTGGAAAATGACTGTAATCGATGAATTAGTTcagtttttatatgaaaatatagaaatgttTAAAGATCCTGATTGCTATTTTGTTTGCTGGGCGGCCATTGCCAAGAAATTAAAGTTAAGCGTACACAGCTGCAAGAAGCAATGGGAGGAATTGACAActttatataaaactattttggaggataaaaaagaaaatccaGATATGCAAATAGATTGGAGATATATTGAGTTATTTGATAGAATATTTGATTATGGCATGGATACCAAGCTGTTGGAGGGATATGAGAGACAAATTCAGTTGAATGACAGTCAGAAAAAAGTTTCTGATAAAATTGGCGttaaaaaagtaaagatCAAAATCGATGATGATGGGATTGATAACGGCACAGAAGATGACGAATCATATGACGAGAGGGGGTTCACAAAACGATCGAAAAGAAGCGGCGATTCTAAGGCCTTCAAGATATTAGAGTACTAccataaaaataaggaaaagtTCTCAACTactcaaagaaaaaaacaagcTTTGTGGGAAATATTAGCAAAGCAAATAGGTACGTCAGCTGAGCAGTGCGCTCATAgatttagaaacttaaaacaAGTGTACACTGCTTACATACAAAGAGAAATCAGTAAACCAGAAATGCCTATATTATGGCCATATTACGCACTTTGCAAGAAAGTTTTCGGATACAGAGCCCTCAAAAACAAACTGAAAAATGGTAAAGTCGAAATAGACAGTGAGGAATGGTCtgcaaaagaaattaaacaattaataagCTATTTCGGTAATAACTATAACGATTTGAACCAGAATCCAGAGATTAGTTCCAAATGGACAACCATAGCAACTCAAATAGGCAAAAGTGAAGGTTCTTGCAGTGAGAAATTGGCAGAATTACGGAAATCTTACAGCAGATTGAAGGCAATAAAGAAACGAGATCCTGAAGCAAAAGTGTGttggaaatattataatatgtttgatGAAATCTTCATGTCCAATAAGGATAGTTTAGATAACACTGAGATTGTACTTGAAGAGATGGAAGTAGACGAATCAAATGATGAAGTGACTTATGAAGTCATACCACTGAACAATGAAAACAACTCTGAAACGCAGGAAGGagATGATGATTTTCAGTGTATCATTTTTATACCTGAAGGCAAAGACATTAGTGAAGCTCAGATAATAACACAAGAGAATGCTGAAAAATTACTCGCAACAGCTACGTCCGAGACAAAACCAACCGTAACAAAGTGGAATAAGCGAACAAAAAAGAGGTTGCTGATCctgtatttgaattttataagaaaaaataaagggAAAGACATTAATTCTCTAGAAATGTGGAAAGAAATAGCTTCGAAATTACCAGATAAGACATCTCTGTCTTGCAGAAAAATGTTtgcaaaactaaaaaacaatcaTTTCCAAAATTCTAGCAGTGATGATGTTAATAAAAAGAAGACACCCTATTATTCCATTTTGTCTAAAATACTGGCCTTGAAGCCAAAATTTGCTAAAACTGGCCTTAACAAGAGTTTAGAAGAAGGAAAAAGTTATAAAGATATTCCATTACCTTTGCAGAAAGTGGAACAGGCTTTGCAATATTATCTGCAGCATGTAGAAGAATTTATAAGTCCAATGTATGAAAAGAAATATGTTTGGACGGAGTTAGCTAACCATGTTTCAGAACCTGTTTTGAAGATCTTTAACAAAATTAACTATTTgaaaactaattataatattgagACGGACGAAGTGGCTGATGAGAAAACGTCATTTGGAGCAATCTTAAAAGATATTTTGGCAAAGGAAGCAATTCTAAAAGAACAAATAACAATACCTCAATCTATAGAAGAAACACAGTGCTCAGAAAATTGGTCAGAGGATGAAGTTGAACAACTTCTTATTTGGTATTTAGCAAATTTggagaaatttaaaaatccgAAATACATCCGTTCGTATCTATGGATTGAAGCCTCGAACATTCTGAAGAAAATTCCATTAGTTTGCTcaaagaaaatgattgaaatacGTACATTATATAGAAATATGGTGAAAGAGAGTCCagaagaattaaataattggAGATTTTATGACTTGTGTCAGAAGATATATGGTACTGGGAAGAAAAGCAGCACTGGCAACGACTcttaa
Protein Sequence: MEQIVVKTEMQPNEEILLFYVDEDGGNEQGILTTMENIEQVHEEQVHHDTYVMEETAESAEEEFSPSDQSYGKERWTEEETKKLLVFYIDNKNTFVTGATRKKHLWTIACKTMLNGKNPNACEMKLRNMKKKYAQALIDQKQNPNYQWPYFELCHQAFHDDNQVSAMLNENQSEQPNIPVKYKPDDEGIVVVKKIHNSRPNTDEKVEIMLNMYLKHKKKGKESTQRNLWETIALEIGEEDAQYWHKRFLNFKQHYIRLLDKRAVTGQDNTSWPYMKIFDEIYDDDKEFQRKYLNTENVSSYKVIHISTEEMVTQGSLADWNQTEVTVLAKYYFDCFDEFQDPTIPKNFLWNEVGRLIDKNPEACKLKYEELKGEHLDKYIEGGYDIRARIPLAILFDYIISKEMQIALLKVPKSSDQCDVWKMTVIDELVQFLYENIEMFKDPDCYFVCWAAIAKKLKLSVHSCKKQWEELTTLYKTILEDKKENPDMQIDWRYIELFDRIFDYGMDTKLLEGYERQIQLNDSQKKVSDKIGVKKVKIKIDDDGIDNGTEDDESYDERGFTKRSKRSGDSKAFKILEYYHKNKEKFSTTQRKKQALWEILAKQIGTSAEQCAHRFRNLKQVYTAYIQREISKPEMPILWPYYALCKKVFGYRALKNKLKNGKVEIDSEEWSAKEIKQLISYFGNNYNDLNQNPEISSKWTTIATQIGKSEGSCSEKLAELRKSYSRLKAIKKRDPEAKVCWKYYNMFDEIFMSNKDSLDNTEIVLEEMEVDESNDEVTYEVIPLNNENNSETQEGDDDFQCIIFIPEGKDISEAQIITQENAEKLLATATSETKPTVTKWNKRTKKRLLILYLNFIRKNKGKDINSLEMWKEIASKLPDKTSLSCRKMFAKLKNNHFQNSSSDDVNKKKTPYYSILSKILALKPKFAKTGLNKSLEEGKSYKDIPLPLQKVEQALQYYLQHVEEFISPMYEKKYVWTELANHVSEPVLKIFNKINYLKTNYNIETDEVADEKTSFGAILKDILAKEAILKEQITIPQSIEETQCSENWSEDEVEQLLIWYLANLEKFKNPKYIRSYLWIEASNILKKIPLVCSKKMIEIRTLYRNMVKESPEELNNWRFYDLCQKIYGTGKKSSTGNDS*

Similar Transcription Factors

Sequence clustering based on sequence similarity using MMseqs2

100% Identity: -
90% Identity: -
80% Identity: -