Basic Information

Insect: Eupithecia dodoneata
Gene Symbol: ZEB2_1
Assembly: GCA_947044255.1
Location: CAMRHC010000035.1:1930707-1937631[+]

Transcription Factor Domain

TF Family: zf-C2H2
Domain: zf-C2H2 domain
PFAM: PF00096
TF Group: Zinc-Coordinating Group
Description: The C2H2 zinc finger is the classical zinc finger domain. The two conserved cysteines and histidines co-ordinate a zinc ion. The following pattern describes the zinc finger. #-X-C-X(1-5)-C-X3-#-X5-#-X2-H-X(3-6)-[H/C] Where X can be any amino acid, and numbers in brackets indicate the number of residues. The positions marked # are those that are important for the stable fold of the zinc finger. The final position can be either his or cys. The C2H2 zinc finger is composed of two short beta strands followed by an alpha helix. The amino terminal part of the helix binds the major groove in DNA binding zinc fingers. The accepted consensus binding sequence for Sp1 is usually defined by the asymmetric hexanucleotide core GGGCGG but this sequence does not include, among others, the GAG (=CTC) repeat that constitutes a high-affinity site for Sp1 binding to the wt1 promoter [1].
Hmmscan Out: # of c-Evalue i-Evalue score bias hmm coord from hmm coord to ali coord from ali coord to env coord from env coord to acc

1 37 0.0016 0.095 13.5 0.8 2 21 159 178 158 179 0.95

2 37 8.6 5.3e+02 1.7 0.4 3 23 187 207 186 207 0.89

3 37 0.31 19 6.3 0.1 1 23 212 235 212 235 0.93

4 37 1.4 87 4.2 0.3 2 23 241 262 240 262 0.94

5 37 0.094 5.8 7.9 3.7 3 21 267 285 266 286 0.93

6 37 0.0038 0.23 12.3 0.8 2 23 324 346 323 346 0.95

7 37 0.18 11 7.1 0.6 3 23 354 373 353 373 0.95

8 37 0.0098 0.6 11.0 1.5 1 23 378 400 378 400 0.98

9 37 0.0039 0.24 12.3 3.7 1 23 406 429 406 429 0.97

10 37 0.0027 0.17 12.8 0.4 2 23 439 461 439 461 0.95

11 37 1.3 81 4.3 0.6 1 16 471 486 471 488 0.90

12 37 0.0027 0.17 12.8 0.0 1 20 598 617 598 619 0.94

13 37 0.16 10 7.2 2.9 1 23 649 671 649 671 0.97

14 37 0.0013 0.083 13.7 1.4 2 23 676 698 675 698 0.95

15 37 0.16 10 7.2 4.9 3 21 703 721 702 722 0.92

16 37 0.003 0.19 12.6 3.1 1 23 731 754 731 754 0.97

17 37 0.0092 0.57 11.1 5.6 1 23 760 782 760 782 0.98

18 37 0.0013 0.081 13.7 1.7 1 23 789 812 789 812 0.97

19 37 0.013 0.79 10.6 0.1 2 21 926 945 925 946 0.93

20 37 0.046 2.8 8.9 1.6 1 23 976 999 976 999 0.93

21 37 0.00062 0.038 14.8 0.9 3 23 1006 1026 1004 1026 0.98

22 37 0.27 17 6.5 4.2 1 21 1029 1049 1029 1050 0.91

23 37 0.00041 0.025 15.3 0.4 1 23 1062 1085 1062 1085 0.94

24 37 0.00022 0.014 16.2 1.7 1 23 1091 1113 1091 1113 0.98

25 37 0.18 11 7.0 1.0 5 23 1123 1141 1121 1141 0.97

26 37 0.0025 0.16 12.8 0.9 1 23 1147 1170 1147 1170 0.98

27 37 0.022 1.4 9.9 0.2 3 23 1180 1201 1179 1201 0.96

28 37 0.00074 0.045 14.5 0.1 2 21 1312 1331 1311 1332 0.94

29 37 3.3 2e+02 3.1 0.0 3 23 1339 1360 1337 1360 0.94

30 37 0.15 9.4 7.2 0.0 3 23 1367 1388 1366 1388 0.92

31 37 0.0014 0.085 13.7 1.0 2 23 1394 1415 1393 1415 0.95

32 37 0.038 2.3 9.1 3.2 2 20 1419 1437 1418 1438 0.94

33 37 2.3e-05 0.0014 19.3 0.3 1 23 1463 1486 1463 1486 0.95

34 37 0.0011 0.064 14.1 2.2 1 23 1492 1514 1492 1514 0.96

35 37 0.065 4 8.4 0.2 1 23 1520 1542 1520 1542 0.98

36 37 0.037 2.3 9.2 0.1 1 23 1548 1571 1548 1571 0.94

37 37 0.00011 0.0067 17.1 2.0 1 23 1577 1599 1577 1600 0.96

#	of	c-Evalue	i-Evalue	score	bias	hmm coord from	hmm coord to	ali coord from	ali coord to	env coord from	env coord to	acc
1	37	0.0016	0.095	13.5	0.8	2	21	159	178	158	179	0.95
2	37	8.6	5.3e+02	1.7	0.4	3	23	187	207	186	207	0.89
3	37	0.31	19	6.3	0.1	1	23	212	235	212	235	0.93
4	37	1.4	87	4.2	0.3	2	23	241	262	240	262	0.94
5	37	0.094	5.8	7.9	3.7	3	21	267	285	266	286	0.93
6	37	0.0038	0.23	12.3	0.8	2	23	324	346	323	346	0.95
7	37	0.18	11	7.1	0.6	3	23	354	373	353	373	0.95
8	37	0.0098	0.6	11.0	1.5	1	23	378	400	378	400	0.98
9	37	0.0039	0.24	12.3	3.7	1	23	406	429	406	429	0.97
10	37	0.0027	0.17	12.8	0.4	2	23	439	461	439	461	0.95
11	37	1.3	81	4.3	0.6	1	16	471	486	471	488	0.90
12	37	0.0027	0.17	12.8	0.0	1	20	598	617	598	619	0.94
13	37	0.16	10	7.2	2.9	1	23	649	671	649	671	0.97
14	37	0.0013	0.083	13.7	1.4	2	23	676	698	675	698	0.95
15	37	0.16	10	7.2	4.9	3	21	703	721	702	722	0.92
16	37	0.003	0.19	12.6	3.1	1	23	731	754	731	754	0.97
17	37	0.0092	0.57	11.1	5.6	1	23	760	782	760	782	0.98
18	37	0.0013	0.081	13.7	1.7	1	23	789	812	789	812	0.97
19	37	0.013	0.79	10.6	0.1	2	21	926	945	925	946	0.93
20	37	0.046	2.8	8.9	1.6	1	23	976	999	976	999	0.93
21	37	0.00062	0.038	14.8	0.9	3	23	1006	1026	1004	1026	0.98
22	37	0.27	17	6.5	4.2	1	21	1029	1049	1029	1050	0.91
23	37	0.00041	0.025	15.3	0.4	1	23	1062	1085	1062	1085	0.94
24	37	0.00022	0.014	16.2	1.7	1	23	1091	1113	1091	1113	0.98
25	37	0.18	11	7.0	1.0	5	23	1123	1141	1121	1141	0.97
26	37	0.0025	0.16	12.8	0.9	1	23	1147	1170	1147	1170	0.98
27	37	0.022	1.4	9.9	0.2	3	23	1180	1201	1179	1201	0.96
28	37	0.00074	0.045	14.5	0.1	2	21	1312	1331	1311	1332	0.94
29	37	3.3	2e+02	3.1	0.0	3	23	1339	1360	1337	1360	0.94
30	37	0.15	9.4	7.2	0.0	3	23	1367	1388	1366	1388	0.92
31	37	0.0014	0.085	13.7	1.0	2	23	1394	1415	1393	1415	0.95
32	37	0.038	2.3	9.1	3.2	2	20	1419	1437	1418	1438	0.94
33	37	2.3e-05	0.0014	19.3	0.3	1	23	1463	1486	1463	1486	0.95
34	37	0.0011	0.064	14.1	2.2	1	23	1492	1514	1492	1514	0.96
35	37	0.065	4	8.4	0.2	1	23	1520	1542	1520	1542	0.98
36	37	0.037	2.3	9.2	0.1	1	23	1548	1571	1548	1571	0.94
37	37	0.00011	0.0067	17.1	2.0	1	23	1577	1599	1577	1600	0.96

Sequence Information

Coding Sequence: ATGAGTCGCCAAGTGGACGTAAAGGCTCTTATATCACATATCGTGAAAGGCGACGGCTTAGACAAATGCAGAGTTTGCATGGGAGATACATCACAAGGACAAGTCCACCTCACTGACACAGTAATGATGGACGGAGACAAAGCTGTTACGCTCTCAGAGCTTCTTGAAGTTATCACAGGTGTTGAGGTGGAGTTGGAAAATGCGCTACCATCCTCCTTATGCCTAACCTGCTCCGTAGCTGCCTTCGAGGCAGCCGAGTTCAAGACCCTGGTCCTAAGGGCGCAACGACAGTGGAACAGCACTGTCAACATGTTAAACCATATTCCTGATCATAAATACGCCCCAACTAGTCATAAGATCCTCGCAGTCCTATCCAATaactatattaaaatttgtgaCGAAGGAATAAAACCACCTGTTGAGAAGCCGAGAGACAATCCAATTCTGAAAAGACCGGGAAAGTTACAAGAATGTCAATGTCCAACTTGTGGGAACACGTTTCAGTATGCTGTGCAGCTTAATAAGCATTTGAGGGACTCCGTAGACTTGCTCCGGGCTTGTCACATCTGTGCTGAAGTCATGAGTAGAAGCAAACTGATAAAACATGTCAAAGAGGagcataatataaaaacatacgcATGTAAGAAATGCCCAGCCATACTAACTAATGCCAAACTGTTATCTGATCATAATTTGAAAGCACATGCAAAAGGGAGTATTAAGTGTGTCGATTGTAGCTATACATTCCTAACACCACAAGCAATATACGCTCATCAACACATACATACTCAAAGATGCTGTCCAAACTGCGACAGAGTCTTTCGAAACCGACCATGTTATTCCTACCACATCAAAAAATGCTGCAAACTAGACCTTAAACACAAGAGCAAACATGTACCAGTAACCTTAcagaacaaagaaaacaaaaaggtTACAATGGGAAAGCGAGGCAGCATCAACCATAAATGCATCTGCGATTATTGCAATAAAACTTATGCTGCCAAAAAGTTCTTATCAGCTCATATCCAGATAGTCCACTTGAAGAATACACACAGACCTTGTGTTTACTGCGGCAAGCAGTTTGCGGCTGCTCACATGTCCACACATTTAAAGAGTCATAAGAAATCAAGCTTTAAGTGTGACCATTGTGGGGTAGAGCTTAAGTCTAAATTAGGTTTCATGCAGCACTTAAGACTTCACACAGGAGAGCGACCTTACAAATGCAGTCTCTGCGGAGAACACTTCTCATCTTCATCGAGGATGTCAGAGCACAAACGGAACAAACACTTTAAATCTCAAATAGTCTTAAAAAACGTCTGCACAATTTGCTCGGCTAAGTTCAGACTGCCATCTAAACTTAAAATGCATATGGATAAGGTCCATAAATGCAATAGAATGGAAGAAGTCTGTTATAAATGCGAGTTATGCCGTGAGAtgtttgacagctgtcaaagtCTGATGGAAGATGGCAACACTCCGCGACAGCTGTGCCAACAATGCATTTCCGATATCACCGCCTTTCTACCATTCCTGAGACTCTGCAAACAATCCGCCGCATATTGGAGCTTTCTATCCGAAAATTTGATCAACCTTTCTTCCCAGAAGACTTTTAACACAGCTTTCATCTTTGTCAACgataaaatagataaagttACCAACGTGTTCGAGAAAAGGGATAGAAACAAGAATAGGTTGTGGCATGTCGTGACAAAGCGGATTAACCAGCTGGAGTCGGCGAGACGGACACGAGAATCCGACGACAATGAACCAACGAAGCCGGGAAAGTTTCTCTACACTTGCGTAGAGTGCGGTGCGAAGTTTACCCGGTTGGAGAACATTAACAACCATTTAGCGAGCCAAAACAAGCGTTTCTGTGCTCATTGCGAGCAGATTATCGAGCTTAAAGCTTTTGGAGCGCATCTGGAGTCGCATTCAATTCCTTTCTATACCTGTAAGATGTGCTCTGTACCCTTTGAGTGTAAATACCAGTTGATAAAACACAAAAGTGTGCATCAAGGTAGAATCATGTGTGGGGAATGCAAGATCACCTTTCCCTCAGCGCATCACCTAAATATTCACGTTAACAGGAAGCATGAGCGCGCTTCATGCGtcaaatgtaataaaaagttttctaatcgCATATGTTTTAACAAGCATCGAAGTAAATGCAAGTCTAGGATCTCTGAGAAGTATATTTGTGATCACTGCTCAAAGGAGTTCAGTGAGAAGGGGCATATTAAGTTGCACATTTATACGATGCATTCAAAGATCTCGTCCCATCAATGCGAACTGTGCGGGAGAAAGTTTAACAGTGCGTGTCACTTGGACGAACATAAAGAAACCCATAATGTGATACCCGATAGATATGTCTGCCCGTTTTGTGGCGGGCGTTATAGCTCCTCGGGAGGCTATCGAAAGCATTTGAGACATAAGCATTATAGAACTAATCCCGAACTGAAGATGGATATGATATGCACGTGCGATGTGGATGACGGGCCAGCGCTCCCGCCGGGGCTCTGCGGCGTCTGCGCAGGCGACGCTATATCTGCCGCTAAATTCAGAAAACTCACCGAAAAGTCTGCGAAATGCTGGAGCGAAGCCGCCCAAAACCTCTCACGAATAGACAGCGAGAGCAACGACACGAAAACACTGCTCTACGTCCACGAAGAACACACTTTGATATTCTACGAGAAACGGGCCAAGAGTGCTAAATCTGCGGTCACGGCTCTCGGAAACTACGAGAAGGCACCAACGTTCAATAGAAAGAACCCGATTTCATGCCCATTCTGCGGTAAGCGGGTGATTTCTGTGCAGAATCTTAACCAACATCTTCAAAACAGCTCGAAAACAGTGTGTATTTGCGGTTCCCTTATGGAGAAATCAGAAATCTGTGAACACTTGCGAGAGATACACCATATCGAGGTTTTCGAATGCAGCATCTGTCATGAGCAGTTTCAGAGTAATGAGGTTTTAAAGTGGCATAGCACTAAATCCCACGGCTCTAAGTCGTTCGGTTGCGAGCATTGCGGACGTGGTTACAGAAACGAGAGGGCCTTGCGGGCCCATTACTACACCCACACTTTGTTCGACTGCTCCGCTTGCGGGAGAACTTTCGAGAACAGCCGATGTTACCGCCACCACAAGACTACATGCAAAACTAAACATAAGAATGATTTCAGTATCTTTGAGTGTAATGACTGCGGACAGAAATACGACAAGAAAGGATCTCTTAGGATACATGTGATACAAAAACATTTGAATGTCTTGCCTTACGTTTGTCAGGTCTGCGGAAAGCAAACTTCTACCATAAGCCATTTGAAATCACACTCTAAAGTTCACGACGTACATAGGAAGACTCTAGAATGCCACTGCGGGGCTAAGTTCCGGACTGATATAGGGTACCGTTTACATATGAGAATCCACAGCGGTTTGAGGCCTTTTAAATGTGAGGAGTGCGAGGAGAGTTTCATATCGGCGTCTCGACGCTCCGATCATATGAAGAGACGTCATAAGAGTGTGAAAGATATGGCGCATGGTTGCGAGCAATGCTTGGCTCGGTTCATCAGGCCTTGGGAGCTGAAGAAGCATTACAAGCTGTCGCATAGTTCGATAATAAAAGAAGAAACCTTCTGTCCGGGCGGTGTTTGCGTGGCTTGCGCAAGCGCAGCGCTGGCCGCGGAAGAGTTCCGTCTATTCGTCCGCAACGCCGCCTCGCTCTGGCGCCGCGCCATCATCAACCTCTCCCAGCTGCCCTACGAGGCTTCCGACAACGCAAAATCAGTTTGCGCGGTCGTTTCCCCCAACATAACTGTCGATACACACAGCGATCTAGACGCCGGCGATGCGACTGAAGTCATCGATAAATTGCAGTCGAAGTTGATTAAGAAGAAAAACGAGAGAAAACCCCGCGTTCTCCGCACCGGGCTGAACGTTACCTGCCCTGACTGTAACAAGCAGTTCGCAGGTCCTCATTTACTGCAAACGCATCTTCAGAACAGCGATAGGAAAGATGCTTGTGGAATTTGCGGCGCCGTCGTTGTTAAAGGTGTTGGGTTGAAATATCACCTCGCAACGGTGCATAGAGAACCCGCGATCCTGTGCAAAGAATGCCCGACCGTTGTCATCACAGAGGCTGAGCTCAAAGCACATGAGAGCTTAGCTCACAAACCTGGGGCACTAAACTGCACCGCTTGCGGTAGAACCTTTACCCGCAAAGGGTCGTACGACAGCCATACCCAGATGCACGTCGTCTTGACCTGCAGACTCTGCGGTACGCAATTCTCTAACAGAAGCTGCTTCCGCCAACATAGATCCTGTTGCGAGCCCAACGCAAAACCTACATCTATCCCCCGCATACGTCGTTCGAACAACCGCGACCCGGGCCAATACGTCTGCGACTACTGTCAAAAGATGTACAGCTCTCGGCCGCAATTGAAGAACCATATCCTCTGGATCCACTTGGACCACAGGCCGCACCAGTGCTCCTTCTGCGGGAAGCGATTCTACACATCAGCGAGGTTAAACGAGCACACCGTTGTCCATACGAGAGTTAGGAACTTCGAGTGTGACCTATGTGACGCGAAGCTAGTATCGAAAAGTGCTGCGATTTACCACAGACGAAGGCATACGGGGGAGAAGCCCTACATTTGCGACGACTGTGGAGCAGCCTTCATCTCCTCGTCGAGGAGGCTAGAACACGCTAAACGGAAACACAATAGAGGGATTCGGTTCAAGTGTACGGAGTGCACCGCTAGCTTCGTAAGGAGACGGGAGCTTGAGAAACACGTGGCAAAACATCATACAGCCACGGGAAAATCTGAGGCATTAGTAAGGCTCTTCAAGCTTGATGTTATTTCTTAG
Protein Sequence: MSRQVDVKALISHIVKGDGLDKCRVCMGDTSQGQVHLTDTVMMDGDKAVTLSELLEVITGVEVELENALPSSLCLTCSVAAFEAAEFKTLVLRAQRQWNSTVNMLNHIPDHKYAPTSHKILAVLSNNYIKICDEGIKPPVEKPRDNPILKRPGKLQECQCPTCGNTFQYAVQLNKHLRDSVDLLRACHICAEVMSRSKLIKHVKEEHNIKTYACKKCPAILTNAKLLSDHNLKAHAKGSIKCVDCSYTFLTPQAIYAHQHIHTQRCCPNCDRVFRNRPCYSYHIKKCCKLDLKHKSKHVPVTLQNKENKKVTMGKRGSINHKCICDYCNKTYAAKKFLSAHIQIVHLKNTHRPCVYCGKQFAAAHMSTHLKSHKKSSFKCDHCGVELKSKLGFMQHLRLHTGERPYKCSLCGEHFSSSSRMSEHKRNKHFKSQIVLKNVCTICSAKFRLPSKLKMHMDKVHKCNRMEEVCYKCELCREMFDSCQSLMEDGNTPRQLCQQCISDITAFLPFLRLCKQSAAYWSFLSENLINLSSQKTFNTAFIFVNDKIDKVTNVFEKRDRNKNRLWHVVTKRINQLESARRTRESDDNEPTKPGKFLYTCVECGAKFTRLENINNHLASQNKRFCAHCEQIIELKAFGAHLESHSIPFYTCKMCSVPFECKYQLIKHKSVHQGRIMCGECKITFPSAHHLNIHVNRKHERASCVKCNKKFSNRICFNKHRSKCKSRISEKYICDHCSKEFSEKGHIKLHIYTMHSKISSHQCELCGRKFNSACHLDEHKETHNVIPDRYVCPFCGGRYSSSGGYRKHLRHKHYRTNPELKMDMICTCDVDDGPALPPGLCGVCAGDAISAAKFRKLTEKSAKCWSEAAQNLSRIDSESNDTKTLLYVHEEHTLIFYEKRAKSAKSAVTALGNYEKAPTFNRKNPISCPFCGKRVISVQNLNQHLQNSSKTVCICGSLMEKSEICEHLREIHHIEVFECSICHEQFQSNEVLKWHSTKSHGSKSFGCEHCGRGYRNERALRAHYYTHTLFDCSACGRTFENSRCYRHHKTTCKTKHKNDFSIFECNDCGQKYDKKGSLRIHVIQKHLNVLPYVCQVCGKQTSTISHLKSHSKVHDVHRKTLECHCGAKFRTDIGYRLHMRIHSGLRPFKCEECEESFISASRRSDHMKRRHKSVKDMAHGCEQCLARFIRPWELKKHYKLSHSSIIKEETFCPGGVCVACASAALAAEEFRLFVRNAASLWRRAIINLSQLPYEASDNAKSVCAVVSPNITVDTHSDLDAGDATEVIDKLQSKLIKKKNERKPRVLRTGLNVTCPDCNKQFAGPHLLQTHLQNSDRKDACGICGAVVVKGVGLKYHLATVHREPAILCKECPTVVITEAELKAHESLAHKPGALNCTACGRTFTRKGSYDSHTQMHVVLTCRLCGTQFSNRSCFRQHRSCCEPNAKPTSIPRIRRSNNRDPGQYVCDYCQKMYSSRPQLKNHILWIHLDHRPHQCSFCGKRFYTSARLNEHTVVHTRVRNFECDLCDAKLVSKSAAIYHRRRHTGEKPYICDDCGAAFISSSRRLEHAKRKHNRGIRFKCTECTASFVRRRELEKHVAKHHTATGKSEALVRLFKLDVIS

Similar Transcription Factors

Sequence clustering based on sequence similarity using MMseqs2

100% Identity: iTF_00700316;
90% Identity: iTF_00696644;
80% Identity: -