Basic Information

Insect: Amorpha juglandis
Gene Symbol: E(z)_1
Assembly: GCA_949126905.1
Location: OX421376.1:820206-858571[-]

Transcription Factor Domain

TF Family: MYB
Domain: Myb_DNA-binding domain
PFAM: PF00249
TF Group: Helix-turn-helix
Description: This family contains the DNA binding domains from Myb proteins, as well as the SANT domain family [1].
Hmmscan Out: # of c-Evalue i-Evalue score bias hmm coord from hmm coord to ali coord from ali coord to env coord from env coord to acc

1 9 0.15 1.2e+02 3.3 0.0 3 34 430 461 428 464 0.91

2 9 0.15 1.2e+02 3.3 0.0 3 34 498 529 496 532 0.91

3 9 0.15 1.2e+02 3.3 0.0 3 34 566 597 564 600 0.91

4 9 0.15 1.2e+02 3.3 0.0 3 34 634 665 632 668 0.91

5 9 0.15 1.2e+02 3.3 0.0 3 34 702 733 700 736 0.91

6 9 0.15 1.2e+02 3.3 0.0 3 34 770 801 768 804 0.91

7 9 0.15 1.2e+02 3.3 0.0 3 34 838 869 836 872 0.91

8 9 0.15 1.2e+02 3.3 0.0 3 34 906 937 904 940 0.91

9 9 0.0007 0.57 10.8 0.0 3 44 974 1015 972 1016 0.96

#	of	c-Evalue	i-Evalue	score	hmm coord from	hmm coord to	ali coord from	ali coord to	env coord from	env coord to	acc
1	9	0.15	1.2e+02	3.3	3	34	430	461	428	464	0.91
2	9	0.15	1.2e+02	3.3	3	34	498	529	496	532	0.91
3	9	0.15	1.2e+02	3.3	3	34	566	597	564	600	0.91
4	9	0.15	1.2e+02	3.3	3	34	634	665	632	668	0.91
5	9	0.15	1.2e+02	3.3	3	34	702	733	700	736	0.91
6	9	0.15	1.2e+02	3.3	3	34	770	801	768	804	0.91
7	9	0.15	1.2e+02	3.3	3	34	838	869	836	872	0.91
8	9	0.15	1.2e+02	3.3	3	34	906	937	904	940	0.91
9	9	0.0007	0.57	10.8	3	44	974	1015	972	1016	0.96

Sequence Information

Coding Sequence: ATGAGCAAGTCGAAAGTTTCGGCGGAATGGAAGAAGCGTGTGAAATCCGAGTACATGAGACTCCGCCAAGTGAAGCGGTTCAAACGTGCAGATGAAGTGAAAGTTGCTTGGGCGCGCAATTTAAGAATAATGTCGGAGGCTATAGAGACAAGGGACACAGAACCTTCGGATCGTAGTAGAAAACCTTTTTGGCCTCCTCCCGCACAAACCTCCAGTCATGAGAGCCTAATGAAACGCGCAGAAGTCACTTACACTGACGCTTCCGGTGTAGTTACAACACAACAAGTGCCAATACGAATAATCAACTCTGTCAACCCTATTCCGACGATGTACACATGGGCGCCGACACAAAAGAACTTTATGGTGGAAGACGAGACGGTGCTGCACAACATCCCGTACATGGGCGATGAGGTGCTGGACCAGGACGGTACATTCATCGAGGAGCTAATAAAGAACTACGACGGGAAAGTGCATGGTGACAAGGAGGGTGGTTTCATCGACGATCAGCTGTTCGTGGACCTGGTGCATGCGCTGATGACGTATCAAACCAAGGAGGAAGTCGCCGAGGAGCGACGGGATAGGGAAGCTCGCAACTCCAAGGATGATAAAGAGAAGGACAATGGAATGGAACAGAAGGAGAAAGACAAAGAAGAGAACAAAGATGGCGAGAAGTTAATCAATGACAAACAGTTCCCCATATTTATCATATTTCAAGCCATCAGTTCACAGTTCCCGGACAAGGGAACGGCGCAGGAGTTGAGAGagaaATACATCGAGTTGACATCCCGTAGTGACCCGAACGCCCTACCACCAGAATGCACGCCGAACATCGACGGCCCACTCGCCGAGTCCGTCTCCAGAGATCAGACGATGCATTCGTTCCACACGCTGTTCTGTCGGCGATGCTTCAAGTACGACTGCTTCCTGCACCGTTTGCAAGCGTGCCACCCGCGACCCAACCTGTGCAAACGGAAGGGGCCCGATCTCAAGTCCTTCTCGGAACCCTGCGGATCCAGTTGCTACATGATGTTGGAGGGTATGCGCGAGAAACTGGCTAGGGAGAAGGCGGCGGGTGAAGAGGACAAGGGGAAGAGTCATGCTATCGACTCGCCCAACGACGCCTCGTCGGAAGATAGCAATGatagtaataaatatcaaaaagGTAGTAACAGTAACTCGAGCAACAGTAACTGGAGTACGAACGGCGTGAACCCCAAACCTGCGGGGGAAGAGTCCGCCGAGCCCGCCTACAACGCGCTAGGTCTGTCCGTGGGCGACATCGAGTCGGAGTGGACGGGCTCGGACCAGTCGCTGTTTAGAGCGCTGCACAAGGTGTTTCCCTCCAACTACTGCGCCATCGCACAGCTGATGCTCTCCAAGACTTGTCAACAGAGCGCTGCACAAGGTGTTTCCCTCCAACTACTGCGCCATCGCACAGCTGATGCTCTCCAAGACTTGTCAACAGGTCTGTCTGTGGGCGACATCGAGTCGGAGTGGACGGGCTCGGACCAGTCGCTGTTTAGAGCGCTGCACAAGGTGTTTCCCTCCAACTACTGCGCCATCGCACAGCTGATGCTCTCCAAGACTTGTCAACAGAGCGCTGCACAAGGTGTTTCCCTCCAACTACTGCGCCATCGCACAGCTGATGCTCTCCAAGACTTGTCAACAGGTCTGTCTGTGGGCGACATCGAGTCGGAGTGGACGGGCTCGGACCAGTCGCTGTTTAGAGCGCTGCACAAGGTGTTTCCCTCCAACTACTGCGCCATCGCACAGCTGATGCTCTCCAAGACTTGTCAACAGAGCGCTGCACAAGGTGTTTCCCTCCAACTACTGCGCCATCGCACAGCTGATGCTCTCCAAGACTTGTCAACAGGTCTGTCTGTGGGCGACATCGAGTCGGAGTGGACGGGCTCGGACCAGTCGCTGTTTAGAGCGCTGCACAAGGTGTTTCCCTCCAACTACTGCGCCATCGCACAGCTGATGCTCTCCAAGACTTGTCAACAGAGCGCTGCACAAGGTGTTTCCCTCCAACTACTGCGCCATCGCACAGCTGATGCTCTCCAAGACTTGTCAACAGGTCTGTCTGTGGGCGACATCGAGTCGGAGTGGACGGGCTCGGACCAGTCGCTGTTTAGAGCGCTGCACAAGGTGTTTCCCTCCAACTACTGCGCCATCGCACAGCTGATGCTCTCCAAGACTTGTCAACAGAGCGCTGCACAAGGTGTTTCCCTCCAACTACTGCGCCATCGCACAGCTGATGCTCTCCAAGACTTGTCAACAGGTCTGTCTGTGGGCGACATCGAGTCGGAGTGGACGGGCTCGGACCAGTCGCTGTTTAGAGCGCTGCACAAGGTGTTTCCCTCCAACTACTGCGCCATCGCACAGCTGATGCTCTCCAAGACTTGTCAACAGAGCGCTGCACAAGGTGTTTCCCTCCAACTACTGCGCCATCGCACAGCTGATGCTCTCCAAGACTTGTCAACAGGTCTGTCTGTGGGCGACATCGAGTCGGAGTGGACGGGCTCGGACCAGTCGCTGTTTAGAGCGCTGCACAAGGTGTTTCCCTCCAACTACTGCGCCATCGCACAGCTGATGCTCTCCAAGACTTGTCAACAGAGCGCTGCACAAGGTGTTTCCCTCCAACTACTGCGCCATCGCACAGCTGATGCTCTCCAAGACTTGCCAACAGGTCTGTCTGTGGGCGACATCGAGTCGGAGTGGACGGGCTCGGACCAGTCGCTGTTTAGAGCGCTGCACAAGGTGTTTCCCTCCAACTACTGCGCCATCGCACAGCTGATGCTCTCCAAGACTTGTCAACAGAGCGCTGCACAAGGTGTTTCCCTCCAACTACTGCGCCATCGCACAGCTGATGCTCTCCAAGACTTGTCAACAGGTCTGTCTGTGGGCGACATCGAGTCGGAGTGGACGGGCTCGGACCAGTCGCTGTTTAGAGCGCTGCACAAGGTGTTTCCCTCCAACTACTGCGCCATCGCACAGCTGATGCTCTCCAAGACTTGTCAACAGGTGTACACTTATTGGATCAACACCGGCCAAGAGGAGTGTCGCGTCGAAGCAGAGTTAACACCACCtcggaagaagaagaagaagcatCGGCTGTGGTCTGTCCACTGTCGCAAGATACAACTCAAGAAGGATTCCGCGTCACATCATGTGTACAATTACACGCCGTGTGACCATCCGAACCAGCCGTGCGACAGCATGTGTCCGTGCCTTCAGTCGCAGAACTTCTGCGAGAAGTTCTGTCAGTGCAGTAGCGATTGCCAGAATCGTTTCCCGGGCTGCCGCTGCAAGGCGCAGTGCAACACGAAGCAGTGCCCGTGCTACCTGGGCGTGCGCGAGTGCGACCCCGACCTGTGCAGCGCGTGCGGGGCGGACGCGGCGCCGCCCCCCACGCACGCCGTCTACTGCAAGAACGTCTCCGTGCAGAGGGGTCTCCACAAGCACCTGCTGCTCGCGCCATCGGACGTGGCGGGGTGGGGCATATTCCTGAAGGACGCGGCGCACAAGAACGAGTTCATATCCGAGTACTGCGGAGAGATCATATCGCAGGACGAGGCCGACCGCCGCGGGAAGGTTTACGACAAATACATGTGCTCCTTCCTGTTCAACCTTAACAATGATTTCGTGGTAGACGCGACGCGTAAAGGCAACAAGATTCGTTTCGCGAACCATTCGATCAATCCGAATTGTTACGCGAAGGTGATGATGGTGAACGGTGACCATCGCATCGGCATCTTCGCCAAACGCGCCATACAACCAGGCGAGGAGCTGTTCTTTGATTACAGATATGGACCAACTGAACAATTGAAGTTTGTCGGCATTGAGAGGGAAATGGAATTCTTATGA
Protein Sequence: MSKSKVSAEWKKRVKSEYMRLRQVKRFKRADEVKVAWARNLRIMSEAIETRDTEPSDRSRKPFWPPPAQTSSHESLMKRAEVTYTDASGVVTTQQVPIRIINSVNPIPTMYTWAPTQKNFMVEDETVLHNIPYMGDEVLDQDGTFIEELIKNYDGKVHGDKEGGFIDDQLFVDLVHALMTYQTKEEVAEERRDREARNSKDDKEKDNGMEQKEKDKEENKDGEKLINDKQFPIFIIFQAISSQFPDKGTAQELREKYIELTSRSDPNALPPECTPNIDGPLAESVSRDQTMHSFHTLFCRRCFKYDCFLHRLQACHPRPNLCKRKGPDLKSFSEPCGSSCYMMLEGMREKLAREKAAGEEDKGKSHAIDSPNDASSEDSNDSNKYQKGSNSNSSNSNWSTNGVNPKPAGEESAEPAYNALGLSVGDIESEWTGSDQSLFRALHKVFPSNYCAIAQLMLSKTCQQSAAQGVSLQLLRHRTADALQDLSTGLSVGDIESEWTGSDQSLFRALHKVFPSNYCAIAQLMLSKTCQQSAAQGVSLQLLRHRTADALQDLSTGLSVGDIESEWTGSDQSLFRALHKVFPSNYCAIAQLMLSKTCQQSAAQGVSLQLLRHRTADALQDLSTGLSVGDIESEWTGSDQSLFRALHKVFPSNYCAIAQLMLSKTCQQSAAQGVSLQLLRHRTADALQDLSTGLSVGDIESEWTGSDQSLFRALHKVFPSNYCAIAQLMLSKTCQQSAAQGVSLQLLRHRTADALQDLSTGLSVGDIESEWTGSDQSLFRALHKVFPSNYCAIAQLMLSKTCQQSAAQGVSLQLLRHRTADALQDLSTGLSVGDIESEWTGSDQSLFRALHKVFPSNYCAIAQLMLSKTCQQSAAQGVSLQLLRHRTADALQDLPTGLSVGDIESEWTGSDQSLFRALHKVFPSNYCAIAQLMLSKTCQQSAAQGVSLQLLRHRTADALQDLSTGLSVGDIESEWTGSDQSLFRALHKVFPSNYCAIAQLMLSKTCQQVYTYWINTGQEECRVEAELTPPRKKKKKHRLWSVHCRKIQLKKDSASHHVYNYTPCDHPNQPCDSMCPCLQSQNFCEKFCQCSSDCQNRFPGCRCKAQCNTKQCPCYLGVRECDPDLCSACGADAAPPPTHAVYCKNVSVQRGLHKHLLLAPSDVAGWGIFLKDAAHKNEFISEYCGEIISQDEADRRGKVYDKYMCSFLFNLNNDFVVDATRKGNKIRFANHSINPNCYAKVMMVNGDHRIGIFAKRAIQPGEELFFDYRYGPTEQLKFVGIEREMEFL

Similar Transcription Factors

Sequence clustering based on sequence similarity using MMseqs2

100% Identity: -
90% Identity: -
80% Identity: -