Basic Information

Insect: Exocentrus adspersus
Gene Symbol: -
Assembly: GCA_029955175.1
Location: JANEYG010000007.1:3123691-3130002[+]

Transcription Factor Domain

TF Family: zf-C2H2
Domain: zf-C2H2 domain
PFAM: PF00096
TF Group: Zinc-Coordinating Group
Description: The C2H2 zinc finger is the classical zinc finger domain. The two conserved cysteines and histidines co-ordinate a zinc ion. The following pattern describes the zinc finger. #-X-C-X(1-5)-C-X3-#-X5-#-X2-H-X(3-6)-[H/C] Where X can be any amino acid, and numbers in brackets indicate the number of residues. The positions marked # are those that are important for the stable fold of the zinc finger. The final position can be either his or cys. The C2H2 zinc finger is composed of two short beta strands followed by an alpha helix. The amino terminal part of the helix binds the major groove in DNA binding zinc fingers. The accepted consensus binding sequence for Sp1 is usually defined by the asymmetric hexanucleotide core GGGCGG but this sequence does not include, among others, the GAG (=CTC) repeat that constitutes a high-affinity site for Sp1 binding to the wt1 promoter [1].
Hmmscan Out: # of c-Evalue i-Evalue score bias hmm coord from hmm coord to ali coord from ali coord to env coord from env coord to acc

1 46 0.00012 0.0081 17.3 0.2 2 23 4 25 4 25 0.95

2 46 1.1e-05 0.00077 20.5 4.6 1 23 31 53 31 53 0.98

3 46 0.0038 0.26 12.5 1.3 1 23 59 81 59 81 0.98

4 46 0.081 5.5 8.4 0.4 2 23 88 110 88 110 0.90

5 46 1.2e-05 0.0008 20.4 1.6 1 23 115 137 115 137 0.98

6 46 0.051 3.5 9.0 2.4 1 23 146 169 146 169 0.94

7 46 0.00014 0.0096 17.0 0.7 1 23 176 198 176 198 0.98

8 46 1.2e-05 0.00085 20.4 0.8 2 23 205 226 204 226 0.98

9 46 4.7e-07 3.2e-05 24.8 0.5 1 23 232 254 232 254 0.98

10 46 9.4 6.4e+02 1.9 2.4 1 14 260 273 260 276 0.88

11 46 2.1e-05 0.0014 19.7 0.8 2 23 291 312 291 312 0.97

12 46 1.6e-06 0.00011 23.2 0.6 1 23 318 340 318 340 0.98

13 46 0.0046 0.31 12.3 1.6 1 23 346 368 346 368 0.98

14 46 0.002 0.14 13.4 0.3 2 23 375 397 375 397 0.95

15 46 0.0015 0.1 13.8 1.6 1 23 402 424 402 424 0.96

16 46 0.0023 0.16 13.2 0.4 2 23 435 457 434 457 0.95

17 46 0.00023 0.015 16.4 0.6 1 23 464 486 464 486 0.97

18 46 5.1e-06 0.00034 21.6 0.9 2 23 493 514 492 514 0.97

19 46 3.4e-05 0.0023 19.0 1.9 1 23 520 542 520 542 0.97

20 46 0.013 0.87 10.9 3.8 1 23 548 570 548 571 0.95

21 46 0.00083 0.056 14.6 2.7 1 23 590 612 590 612 0.94

22 46 0.00039 0.026 15.7 0.7 1 23 618 640 618 640 0.97

23 46 0.022 1.5 10.1 1.5 1 23 646 668 646 668 0.99

24 46 0.0018 0.12 13.6 0.3 2 23 675 697 675 697 0.94

25 46 0.00073 0.05 14.8 4.5 1 23 702 724 702 724 0.97

26 46 0.11 7.3 8.0 2.3 2 23 735 757 734 757 0.93

27 46 9.7e-05 0.0066 17.5 1.6 1 23 764 786 764 786 0.98

28 46 6.1e-06 0.00041 21.3 1.8 2 23 793 814 792 814 0.97

29 46 1.3e-05 0.00089 20.3 6.2 1 21 820 840 820 842 0.96

30 46 2.4 1.7e+02 3.7 0.4 1 17 848 864 848 865 0.91

31 46 1.1 73 4.8 4.4 1 20 938 957 938 960 0.95

32 46 0.094 6.4 8.1 0.3 1 23 967 989 967 989 0.95

33 46 0.00062 0.042 15.0 2.3 1 23 995 1018 995 1018 0.97

34 46 0.0027 0.18 13.0 0.4 1 23 1028 1051 1028 1051 0.96

35 46 0.0068 0.46 11.7 0.7 3 23 1061 1081 1060 1081 0.98

36 46 0.0021 0.14 13.4 1.0 1 23 1087 1109 1087 1109 0.97

37 46 1.9e-06 0.00013 22.9 0.9 1 23 1115 1137 1115 1137 0.98

38 46 0.2 14 7.1 0.6 2 23 1252 1273 1251 1273 0.91

39 46 0.14 9.5 7.6 3.3 1 23 1279 1301 1279 1301 0.98

40 46 0.0019 0.13 13.5 1.3 1 23 1307 1329 1307 1329 0.91

41 46 0.00025 0.017 16.2 3.6 1 23 1335 1358 1335 1358 0.98

42 46 0.0011 0.077 14.2 3.3 1 23 1370 1393 1370 1393 0.93

43 46 0.011 0.76 11.1 1.3 3 23 1404 1424 1403 1424 0.98

44 46 1.9e-06 0.00013 22.9 1.2 1 23 1430 1452 1430 1452 0.98

45 46 1.6e-06 0.00011 23.2 0.8 1 23 1458 1480 1458 1480 0.98

46 46 0.006 0.41 11.9 0.0 1 22 1486 1507 1486 1507 0.96

#	of	c-Evalue	i-Evalue	score	bias	hmm coord from	hmm coord to	ali coord from	ali coord to	env coord from	env coord to	acc
1	46	0.00012	0.0081	17.3	0.2	2	23	4	25	4	25	0.95
2	46	1.1e-05	0.00077	20.5	4.6	1	23	31	53	31	53	0.98
3	46	0.0038	0.26	12.5	1.3	1	23	59	81	59	81	0.98
4	46	0.081	5.5	8.4	0.4	2	23	88	110	88	110	0.90
5	46	1.2e-05	0.0008	20.4	1.6	1	23	115	137	115	137	0.98
6	46	0.051	3.5	9.0	2.4	1	23	146	169	146	169	0.94
7	46	0.00014	0.0096	17.0	0.7	1	23	176	198	176	198	0.98
8	46	1.2e-05	0.00085	20.4	0.8	2	23	205	226	204	226	0.98
9	46	4.7e-07	3.2e-05	24.8	0.5	1	23	232	254	232	254	0.98
10	46	9.4	6.4e+02	1.9	2.4	1	14	260	273	260	276	0.88
11	46	2.1e-05	0.0014	19.7	0.8	2	23	291	312	291	312	0.97
12	46	1.6e-06	0.00011	23.2	0.6	1	23	318	340	318	340	0.98
13	46	0.0046	0.31	12.3	1.6	1	23	346	368	346	368	0.98
14	46	0.002	0.14	13.4	0.3	2	23	375	397	375	397	0.95
15	46	0.0015	0.1	13.8	1.6	1	23	402	424	402	424	0.96
16	46	0.0023	0.16	13.2	0.4	2	23	435	457	434	457	0.95
17	46	0.00023	0.015	16.4	0.6	1	23	464	486	464	486	0.97
18	46	5.1e-06	0.00034	21.6	0.9	2	23	493	514	492	514	0.97
19	46	3.4e-05	0.0023	19.0	1.9	1	23	520	542	520	542	0.97
20	46	0.013	0.87	10.9	3.8	1	23	548	570	548	571	0.95
21	46	0.00083	0.056	14.6	2.7	1	23	590	612	590	612	0.94
22	46	0.00039	0.026	15.7	0.7	1	23	618	640	618	640	0.97
23	46	0.022	1.5	10.1	1.5	1	23	646	668	646	668	0.99
24	46	0.0018	0.12	13.6	0.3	2	23	675	697	675	697	0.94
25	46	0.00073	0.05	14.8	4.5	1	23	702	724	702	724	0.97
26	46	0.11	7.3	8.0	2.3	2	23	735	757	734	757	0.93
27	46	9.7e-05	0.0066	17.5	1.6	1	23	764	786	764	786	0.98
28	46	6.1e-06	0.00041	21.3	1.8	2	23	793	814	792	814	0.97
29	46	1.3e-05	0.00089	20.3	6.2	1	21	820	840	820	842	0.96
30	46	2.4	1.7e+02	3.7	0.4	1	17	848	864	848	865	0.91
31	46	1.1	73	4.8	4.4	1	20	938	957	938	960	0.95
32	46	0.094	6.4	8.1	0.3	1	23	967	989	967	989	0.95
33	46	0.00062	0.042	15.0	2.3	1	23	995	1018	995	1018	0.97
34	46	0.0027	0.18	13.0	0.4	1	23	1028	1051	1028	1051	0.96
35	46	0.0068	0.46	11.7	0.7	3	23	1061	1081	1060	1081	0.98
36	46	0.0021	0.14	13.4	1.0	1	23	1087	1109	1087	1109	0.97
37	46	1.9e-06	0.00013	22.9	0.9	1	23	1115	1137	1115	1137	0.98
38	46	0.2	14	7.1	0.6	2	23	1252	1273	1251	1273	0.91
39	46	0.14	9.5	7.6	3.3	1	23	1279	1301	1279	1301	0.98
40	46	0.0019	0.13	13.5	1.3	1	23	1307	1329	1307	1329	0.91
41	46	0.00025	0.017	16.2	3.6	1	23	1335	1358	1335	1358	0.98
42	46	0.0011	0.077	14.2	3.3	1	23	1370	1393	1370	1393	0.93
43	46	0.011	0.76	11.1	1.3	3	23	1404	1424	1403	1424	0.98
44	46	1.9e-06	0.00013	22.9	1.2	1	23	1430	1452	1430	1452	0.98
45	46	1.6e-06	0.00011	23.2	0.8	1	23	1458	1480	1458	1480	0.98
46	46	0.006	0.41	11.9	0.0	1	22	1486	1507	1486	1507	0.96

Sequence Information

Coding Sequence: ATGCACAACGTTTGTGCGACTTGTGGGAAAGTTTTTGCTTACGCCAAAAGTCTTAAGAAGCATCTCGTCTCTCACGGCGAAGAGAGGCCCTTTCCTTGCCACCtctgcaataaaaaattcaagaggCGGTACCAACTCTCTACCCACATTAAGGTACACGACGGTTCCTTGTCCTTCGAGTGCGATTTGTGTTTGAAAAAACTGCGTTCTAGAAGCTCCTTGATAACTCACAGAAAGCTACACCTCAAAGATTACGTTGCCAGGTGTGAGTTGTGTAACCAAGGCTTCTACACGATTCAACAGTACACTAACCACATGGGCGCCAAGCATACAAGCAGCAGCTTCGTCTGCAATATTTGCGGTAGATCGTGCTACGACAAAGCCTCTTTGCAAGGTCACATGAAGCGTCACTCCAAAGATTACGGCAGTGTTAAATTCCAATGTGAATTATGCGATAAGGAATTCCTACAGGAGCGGTATTTGAAGCAACACCACGTGCGAATGCACAAAAACGGAGGTCAGAGGTACGTTTGTGACCACTGCGGGAAGAAAGTAGGATCAAAGACAAGTTTGCGAGACCACCTACTCATCCATAAGGGCTTGAAACCCATAAAATGCAAAGAGTGCGGTCGAGGCTTCGCCCTGAGAACAACACTGAAGTTGCACATGCGGACCCATACAGGAGAGAGGCCCTACAGCTGCGACGTATGCGGTAAGGCGTTCACCCAGAAAGGTCCCTTGAAGACTCACATGCGGTACCACACCGGCGAAAGACCTTACAAATGTGAGATTTGCCCTACCGGGTGCAAGAGTCGGAAAAAAAGACGGAGTCGTGTTAAGAAGGAAACTGAACATTCAAGAAAAGCAGAAACTTGCGATGTGTGTGGCAAGTCATTCACAGACACGAGGAAGCTGACGAGACACGTCATCTCACATAGTGAAGAAAGACCCTATTCCTGCAACCTGTGCGGCAAGCAATTCAAGAGGAAATATCAAGTAGCGGCGCACATTCGCGTGCATGACGGTAACATGTCCTTCGAATGCGATTTCTGCTCTAAGAAATTACGGTCCAAGGGCTCCTGGATGATCCACAGGAGGAGGCATTTGAAGGATTACGTTGCCAAGTGTGAGGTTTGCGGCCAGGGTTTCGTAACGAATCAAGAGTACAGCAACCACATGGGTTCCAAGCACAACACTAGCAACCACATTTGCAACATCTGCGGAAGAGGTTGTTACGACAAAGGTGTCTTAAAAAGTCACATGGCTCGTCACGCAGATAACTACGAGACTAATCAGAGTATCAAGTGCGATATTTGCGACAAAACCTTCCTTCAAGAAAAGTACCTTCGGCAACACGTCATAAGGATTCACAGGGATGGAGGGCAGAAGTACATGTGTGACTTTTGCGGGAAGAATCTGAACTCCAAAGGGAGTTTGAAGAACCATATATACATACACAAGGGAGTTAGGCCGGTAGAGTGCAAGGAATGCGGTAAGAATTTTGTTCTGAAGACCACCTTGAAGTTGCATATGAGAACTCATACCGGGGAGCGACCCTATAGTTGTAAAGTGTGCGGGAAATCGTTCACGCAAAGAGGCCCTTTGCATACTCACTTGCTGTATCATACCGGAGAGAGGCCACACAAGTGTGAAATCTGTTCCATGGGTTTCGTAACTAAAACGTTATTAGTGAGCCATAATAAGAAACACCACGACGTCATGTGTACGAAGAAACAAGGATCTAAGTCTAGGAGATCGAAATCAGTTCATTTTTGTACAGTTTGTGGAAAAGTCTTCACAGATGTCAGATGCCTGAGTCGTCATCTCGTCGTACACAGCGAGGAGAGGCCGTTTGCTTGTAACATCTGCCCTATGAAATTCAAGTTGAATCACCAACTATCAGCCCACGCTCGCGTGCACAACGAAAGCCTGTCTTACGAGTGTGATTTCTGTTTGAAAAAACTACGGTCGAAGGGTTCCTGGGTCACCCACCGACGCAGACATACGAAAGACTTCATTGCTAGGTGTGAAATTTGCGACCAAGGTTTCGTCACCAGTCAGGAATATACCAGGCATGTGGACTCCAAGCATGGAATGAGCAGTCACACATGCACCATCTGCAGACGAGGTTTCTACAACAAACACGGTCTCCAAAGTCACATGGCTCGCCACGCTACCGGTTACAGCACCAACGAACACATTCGCTGCGAACTGTGCAACAAGACCTTCCTCCaagcgaagtacctgaaagatCATTTCCATAGAGTACATAAAGACGGCGGACAGAGATTCGTATGCCATCATTGCGGTAAGGAGGTGAACTCCAGAGGCAGTTTACGCGACCATCTGCTGATCCACGAAGGGCGTAAGCCGCTCCAGTGTATGGAATGCGGCAGGTGTTTTGTACAGAAGGGTACGTTGGACCAGCATATGAGGACGCATACGGGAGAGCGGCCCTACGAGTGTAAAGAATGCGGGAAGTGCTTTACCCAGAAGACTGCACTCACTAGACACTTACGGTGTCACACCGGGGAAAGGCCTTACGAGTGCCCCGTGTGCTGCAAAGGATTCATCAGCAAGGCAGCGTTgtcCAAAAACTATCGTCAAAAACGGGCCTTAACAGATCCTGAATGTGTTAttccaaaaccaaaaaaagaacCCAAAGAGGAATTAACCGATTCCGAAGAAGAGTACCCTGAAGATACTTTAGAGAACAATTTGCTCAAATTTGCTTGTGAACTCTGCGAAGAACAGATTCAAACAAGTATTGATTTCGCCATACACTCCATCAAGCATTCCCCAGATAACAAGTACTACTGCCACCATTGCCAATATAAAACGACTACGGCCAAGCGTATACGGAACCACATGTGGTTGCACGGCAAcaacagaaaatttttcaaatgtgAAACGTGCACTACCGTTTTCCCCGAATGGGCCCAAGCTATGGATCACAAAAACTTCCACTCGGGTGAGATGCCGTACGAATGTGAAACTTGTGGCAAGCATTTCATGTATTCCTGGTTGTTATTCACCCATCGCCGTTTACTTCACTGGGAAAGTACTGGAGGTACCGGCCCTTTCATGTGCGCAGTCTGCAGTGGGTCGTTTGGCACACGGTCCGGTTTACGGAAACACATCAGCAGGAAACACAGCAACAACCCTAAAGAGGTTACACTCTGCGATATTTGCGGAAAGAGTTTGGCTAACAACGAAACGTTGAAATTCCACAAGAGGACGCATACCGGGTACAAACCCCACGTGTGTAGTACTTGCGGTAAGAGCTTTTTGAAGAAAGGGTTGCTTATGGAACACGAGAGGGTCCACACCGGCGAGAGGCCCTTCATCTGTAAATACTGCCAGAAGGGGTTTTCACAGAGGGCACCCCTGAAAATTCACATGAGGACTCATACAGGAGAAAGGCCgtttTTCAACTCCTCCATCCTAAACAATCTCATATATGGCCCAGGAATATCTATAACACCCATCAAACAGGAAAGTAGCAACTGCCCTGCCACCGAATCCAATAAACCAGCTCCTTTTAACGGGTACAACGGTTATAACCCGTTCATTAACCAGTTTCTGGAACTTGACGCCAAGTTTCAACTTCCAAACGCAGAGATGGAAATAAAACCTGAAGCAGATTCTGGCAATATTCTAGACTGTTTAGATAAAGCTAATAAAGTGAAAAAGAAACCAAAGAACAGTTCGGATAGGAGTGCTCCTCAACCCCCTACTATTGACGAACCGATACATTGCGAAACTTGTAACGAAACTTATAAGAACAATGTAGCTTTCGCTTTGCATTCGATTCAACACGCACAAGATGAGAAATACGAGTGCCACTTATGCGATTATAGGAACTCGTCCAAATACCACATCGAAATGCATATCAGAGCCCACGAAGGCACCACCAAATACAAATGCGAGATCTGCGGTAAAGCCTTCACTGTAAGCACCCACGCCATAgaacataaatatttccatacGGGAGAAAAACCTTTCCAATGTGAAATTTGCGGGAAACACTTCATGTTTTCCTGGTTCTTAACCTCGCATCGCAGAACGCAGCACTGGGAAATAATGACTGGAAGCCCACTAGTGAAATACGACTGTACTATCTGTAACAAGCACTACACTTCTTCTACCGGCCTAAAAAGGCACAACCTCAGCAAACACAACTCTTCGGGAATAGACCCCTCCGTACTATGTGACATATGCGGAAAAAGACTTTCCAGTAAAGAGAAACTAAAGTTCCACAGAAGGATACATACAGGTTACAAACCCTTCTCCTGCGAGGTGTGCACTAAAAGTTTCTCTAGGAAAGAACAATTGAAGGAGCACGAAAGAGTGCACACGGGAGAGAAGCCGTTCATATGCAAATACTGCGGGAAAGGGTTCACTCAGAGGTCTCCTCTTAGGATACACGAGAGGACTCACACCGGGGAAAGACCGTACGTGTGCATGATTTGCGGCAAAGGGTTTATTTCCAAGGGGGTGATGGATACGCACATGAAGACTTGTTCAGCGGCGCAGATACCTTATATTTAA
Protein Sequence: MHNVCATCGKVFAYAKSLKKHLVSHGEERPFPCHLCNKKFKRRYQLSTHIKVHDGSLSFECDLCLKKLRSRSSLITHRKLHLKDYVARCELCNQGFYTIQQYTNHMGAKHTSSSFVCNICGRSCYDKASLQGHMKRHSKDYGSVKFQCELCDKEFLQERYLKQHHVRMHKNGGQRYVCDHCGKKVGSKTSLRDHLLIHKGLKPIKCKECGRGFALRTTLKLHMRTHTGERPYSCDVCGKAFTQKGPLKTHMRYHTGERPYKCEICPTGCKSRKKRRSRVKKETEHSRKAETCDVCGKSFTDTRKLTRHVISHSEERPYSCNLCGKQFKRKYQVAAHIRVHDGNMSFECDFCSKKLRSKGSWMIHRRRHLKDYVAKCEVCGQGFVTNQEYSNHMGSKHNTSNHICNICGRGCYDKGVLKSHMARHADNYETNQSIKCDICDKTFLQEKYLRQHVIRIHRDGGQKYMCDFCGKNLNSKGSLKNHIYIHKGVRPVECKECGKNFVLKTTLKLHMRTHTGERPYSCKVCGKSFTQRGPLHTHLLYHTGERPHKCEICSMGFVTKTLLVSHNKKHHDVMCTKKQGSKSRRSKSVHFCTVCGKVFTDVRCLSRHLVVHSEERPFACNICPMKFKLNHQLSAHARVHNESLSYECDFCLKKLRSKGSWVTHRRRHTKDFIARCEICDQGFVTSQEYTRHVDSKHGMSSHTCTICRRGFYNKHGLQSHMARHATGYSTNEHIRCELCNKTFLQAKYLKDHFHRVHKDGGQRFVCHHCGKEVNSRGSLRDHLLIHEGRKPLQCMECGRCFVQKGTLDQHMRTHTGERPYECKECGKCFTQKTALTRHLRCHTGERPYECPVCCKGFISKAALSKNYRQKRALTDPECVIPKPKKEPKEELTDSEEEYPEDTLENNLLKFACELCEEQIQTSIDFAIHSIKHSPDNKYYCHHCQYKTTTAKRIRNHMWLHGNNRKFFKCETCTTVFPEWAQAMDHKNFHSGEMPYECETCGKHFMYSWLLFTHRRLLHWESTGGTGPFMCAVCSGSFGTRSGLRKHISRKHSNNPKEVTLCDICGKSLANNETLKFHKRTHTGYKPHVCSTCGKSFLKKGLLMEHERVHTGERPFICKYCQKGFSQRAPLKIHMRTHTGERPFFNSSILNNLIYGPGISITPIKQESSNCPATESNKPAPFNGYNGYNPFINQFLELDAKFQLPNAEMEIKPEADSGNILDCLDKANKVKKKPKNSSDRSAPQPPTIDEPIHCETCNETYKNNVAFALHSIQHAQDEKYECHLCDYRNSSKYHIEMHIRAHEGTTKYKCEICGKAFTVSTHAIEHKYFHTGEKPFQCEICGKHFMFSWFLTSHRRTQHWEIMTGSPLVKYDCTICNKHYTSSTGLKRHNLSKHNSSGIDPSVLCDICGKRLSSKEKLKFHRRIHTGYKPFSCEVCTKSFSRKEQLKEHERVHTGEKPFICKYCGKGFTQRSPLRIHERTHTGERPYVCMICGKGFISKGVMDTHMKTCSAAQIPYI

Similar Transcription Factors

Sequence clustering based on sequence similarity using MMseqs2

100% Identity: -
90% Identity: -
80% Identity: -