Basic Information

Insect: Archips xylosteana
Gene Symbol: -
Assembly: GCA_947563465.1
Location: OX387370.1:12347158-12366444[-]

Transcription Factor Domain

TF Family: zf-C2H2
Domain: zf-C2H2 domain
PFAM: PF00096
TF Group: Zinc-Coordinating Group
Description: The C2H2 zinc finger is the classical zinc finger domain. The two conserved cysteines and histidines co-ordinate a zinc ion. The following pattern describes the zinc finger. #-X-C-X(1-5)-C-X3-#-X5-#-X2-H-X(3-6)-[H/C] Where X can be any amino acid, and numbers in brackets indicate the number of residues. The positions marked # are those that are important for the stable fold of the zinc finger. The final position can be either his or cys. The C2H2 zinc finger is composed of two short beta strands followed by an alpha helix. The amino terminal part of the helix binds the major groove in DNA binding zinc fingers. The accepted consensus binding sequence for Sp1 is usually defined by the asymmetric hexanucleotide core GGGCGG but this sequence does not include, among others, the GAG (=CTC) repeat that constitutes a high-affinity site for Sp1 binding to the wt1 promoter [1].
Hmmscan Out: # of c-Evalue i-Evalue score bias hmm coord from hmm coord to ali coord from ali coord to env coord from env coord to acc

1 43 0.0065 0.47 11.8 0.4 2 22 149 169 148 169 0.95

2 43 0.00027 0.019 16.1 0.9 1 23 232 254 232 254 0.97

3 43 5.9e-06 0.00043 21.3 3.4 1 23 263 285 263 285 0.98

4 43 9.8e-05 0.0071 17.5 0.5 1 23 291 313 291 313 0.97

5 43 8.3e-05 0.006 17.7 2.0 1 23 322 344 322 344 0.97

6 43 0.0015 0.11 13.8 0.2 1 23 350 372 350 372 0.95

7 43 1.1e-06 8.4e-05 23.6 3.4 1 23 381 403 381 403 0.97

8 43 0.00027 0.019 16.1 0.9 1 23 409 431 409 431 0.97

9 43 5.2e-05 0.0038 18.4 2.3 1 23 440 462 440 462 0.97

10 43 0.0002 0.014 16.5 0.3 1 23 468 490 468 490 0.95

11 43 1.8e-07 1.3e-05 26.1 1.9 1 23 499 521 499 521 0.97

12 43 0.00038 0.027 15.7 0.6 1 23 527 549 527 549 0.97

13 43 5.9e-06 0.00043 21.3 3.4 1 23 558 580 558 580 0.98

14 43 9.8e-05 0.0071 17.5 0.5 1 23 586 608 586 608 0.97

15 43 9.1e-06 0.00066 20.8 3.1 1 23 617 639 617 639 0.98

16 43 0.0002 0.014 16.5 0.3 1 23 645 667 645 667 0.95

17 43 3.5e-05 0.0025 18.9 1.6 1 23 676 698 676 698 0.96

18 43 0.0002 0.014 16.5 0.3 1 23 704 726 704 726 0.95

19 43 1.8e-07 1.3e-05 26.1 1.9 1 23 735 757 735 757 0.97

20 43 0.00038 0.027 15.7 0.6 1 23 763 785 763 785 0.97

21 43 5.9e-06 0.00043 21.3 3.4 1 23 794 816 794 816 0.98

22 43 9.8e-05 0.0071 17.5 0.5 1 23 822 844 822 844 0.97

23 43 8.3e-05 0.006 17.7 2.0 1 23 853 875 853 875 0.97

24 43 0.0015 0.11 13.8 0.2 1 23 881 903 881 903 0.95

25 43 3.5e-05 0.0025 18.9 1.6 1 23 912 934 912 934 0.96

26 43 0.0002 0.014 16.5 0.3 1 23 940 962 940 962 0.95

27 43 1.8e-07 1.3e-05 26.1 1.9 1 23 971 993 971 993 0.97

28 43 0.00038 0.027 15.7 0.6 1 23 999 1021 999 1021 0.97

29 43 5.9e-06 0.00043 21.3 3.4 1 23 1030 1052 1030 1052 0.98

30 43 9.8e-05 0.0071 17.5 0.5 1 23 1058 1080 1058 1080 0.97

31 43 9.1e-06 0.00066 20.8 3.1 1 23 1089 1111 1089 1111 0.98

32 43 0.0002 0.014 16.5 0.3 1 23 1117 1139 1117 1139 0.95

33 43 3.5e-05 0.0025 18.9 1.6 1 23 1148 1170 1148 1170 0.96

34 43 0.0002 0.014 16.5 0.3 1 23 1176 1198 1176 1198 0.95

35 43 1.8e-07 1.3e-05 26.1 1.9 1 23 1207 1229 1207 1229 0.97

36 43 0.00038 0.027 15.7 0.6 1 23 1235 1257 1235 1257 0.97

37 43 5.9e-06 0.00043 21.3 3.4 1 23 1266 1288 1266 1288 0.98

38 43 9.8e-05 0.0071 17.5 0.5 1 23 1294 1316 1294 1316 0.97

39 43 1.1e-06 8.4e-05 23.6 3.4 1 23 1325 1347 1325 1347 0.97

40 43 9.8e-05 0.0071 17.5 0.5 1 23 1353 1375 1353 1375 0.97

41 43 0.00011 0.0082 17.3 1.6 1 23 1384 1406 1384 1406 0.97

42 43 0.0002 0.014 16.5 0.3 1 23 1412 1434 1412 1434 0.95

43 43 1.5e-06 0.00011 23.2 2.3 1 23 1443 1465 1443 1465 0.97

#	of	c-Evalue	i-Evalue	score	bias	hmm coord from	hmm coord to	ali coord from	ali coord to	env coord from	env coord to	acc
1	43	0.0065	0.47	11.8	0.4	2	22	149	169	148	169	0.95
2	43	0.00027	0.019	16.1	0.9	1	23	232	254	232	254	0.97
3	43	5.9e-06	0.00043	21.3	3.4	1	23	263	285	263	285	0.98
4	43	9.8e-05	0.0071	17.5	0.5	1	23	291	313	291	313	0.97
5	43	8.3e-05	0.006	17.7	2.0	1	23	322	344	322	344	0.97
6	43	0.0015	0.11	13.8	0.2	1	23	350	372	350	372	0.95
7	43	1.1e-06	8.4e-05	23.6	3.4	1	23	381	403	381	403	0.97
8	43	0.00027	0.019	16.1	0.9	1	23	409	431	409	431	0.97
9	43	5.2e-05	0.0038	18.4	2.3	1	23	440	462	440	462	0.97
10	43	0.0002	0.014	16.5	0.3	1	23	468	490	468	490	0.95
11	43	1.8e-07	1.3e-05	26.1	1.9	1	23	499	521	499	521	0.97
12	43	0.00038	0.027	15.7	0.6	1	23	527	549	527	549	0.97
13	43	5.9e-06	0.00043	21.3	3.4	1	23	558	580	558	580	0.98
14	43	9.8e-05	0.0071	17.5	0.5	1	23	586	608	586	608	0.97
15	43	9.1e-06	0.00066	20.8	3.1	1	23	617	639	617	639	0.98
16	43	0.0002	0.014	16.5	0.3	1	23	645	667	645	667	0.95
17	43	3.5e-05	0.0025	18.9	1.6	1	23	676	698	676	698	0.96
18	43	0.0002	0.014	16.5	0.3	1	23	704	726	704	726	0.95
19	43	1.8e-07	1.3e-05	26.1	1.9	1	23	735	757	735	757	0.97
20	43	0.00038	0.027	15.7	0.6	1	23	763	785	763	785	0.97
21	43	5.9e-06	0.00043	21.3	3.4	1	23	794	816	794	816	0.98
22	43	9.8e-05	0.0071	17.5	0.5	1	23	822	844	822	844	0.97
23	43	8.3e-05	0.006	17.7	2.0	1	23	853	875	853	875	0.97
24	43	0.0015	0.11	13.8	0.2	1	23	881	903	881	903	0.95
25	43	3.5e-05	0.0025	18.9	1.6	1	23	912	934	912	934	0.96
26	43	0.0002	0.014	16.5	0.3	1	23	940	962	940	962	0.95
27	43	1.8e-07	1.3e-05	26.1	1.9	1	23	971	993	971	993	0.97
28	43	0.00038	0.027	15.7	0.6	1	23	999	1021	999	1021	0.97
29	43	5.9e-06	0.00043	21.3	3.4	1	23	1030	1052	1030	1052	0.98
30	43	9.8e-05	0.0071	17.5	0.5	1	23	1058	1080	1058	1080	0.97
31	43	9.1e-06	0.00066	20.8	3.1	1	23	1089	1111	1089	1111	0.98
32	43	0.0002	0.014	16.5	0.3	1	23	1117	1139	1117	1139	0.95
33	43	3.5e-05	0.0025	18.9	1.6	1	23	1148	1170	1148	1170	0.96
34	43	0.0002	0.014	16.5	0.3	1	23	1176	1198	1176	1198	0.95
35	43	1.8e-07	1.3e-05	26.1	1.9	1	23	1207	1229	1207	1229	0.97
36	43	0.00038	0.027	15.7	0.6	1	23	1235	1257	1235	1257	0.97
37	43	5.9e-06	0.00043	21.3	3.4	1	23	1266	1288	1266	1288	0.98
38	43	9.8e-05	0.0071	17.5	0.5	1	23	1294	1316	1294	1316	0.97
39	43	1.1e-06	8.4e-05	23.6	3.4	1	23	1325	1347	1325	1347	0.97
40	43	9.8e-05	0.0071	17.5	0.5	1	23	1353	1375	1353	1375	0.97
41	43	0.00011	0.0082	17.3	1.6	1	23	1384	1406	1384	1406	0.97
42	43	0.0002	0.014	16.5	0.3	1	23	1412	1434	1412	1434	0.95
43	43	1.5e-06	0.00011	23.2	2.3	1	23	1443	1465	1443	1465	0.97

Sequence Information

Coding Sequence: ATGGAGCACGAGGTCAAGCAGGAGCCGCCGCAGCCGCCCGACGCCGCCGCGGCGCCGCCAGTTGACAGAGCAGAGCCGTGTCCGGTGAAGCAGGAGCGCAGCGACGACGCCAACGACGATGCCGCAGCGCTGCCAGTTGACGGAGCCGAGCCGAGCACGGTGAAGCAGGAGAGCAGTGCCGCGGCAACGGACGGCTTGGAGGACTCCTGCGCCAGTAGCGAGTGTTCGGGAGAGCACCTCAAGGAGGAGCCTGCAGCTGCTGCCGGCTGCAATGCAGAGCTTCTTATGTTTATGCTCAGGCCTTGCACTGTCCGCCTCGAGCGCGCCCGAGTGGATGAGTACTGCGCGCCACGCCCCAGACCACACAATGACGCCCACGAGCCTGACTGTACTAGTGCAATGCGTCAAGTACCCGCGAGAACTCACGCGCAGACGGAAACGTTGTCGTGTGACAGTTGCAGCGCACAGTTCACACAAAAAGATAAATTAGTTAGACATTTAAGAACATGCGCAAGTCAGATTTGGCCAGGATCTAAAAAGCCCACACCCAGTAGGAGTATCACAAAAGAAAAACCATTCTCTTACAATCACTGTCCGGAACAGTTTCTGTCCAAAGCCCGCTTGGCTGTACACAGACGGGCGTGCCCCCGAGAGGCGGGACAGCCGCCTAACAGTCACACGGGGGAGAAGCCTTACAGCTGCGATGTTTGTCAGGAGCGGTTCACGTACAAACGTAATTTAATTGAACATAATGAAACCCACCTGCCTGACGCAATGAAAACAACTTTTTCCTGCGATGTTTGTAACAAAAACTTTACACAAAAGTGTAACTTAGTTGACCATATGCGCAGTCACACGGGGGAGAAGCCTTACAGCTGCGATGTTTGTCAGGAGCGGTTCACAGACAAACGTAATTTAATTGAACATAATGAAACCCACCTGCCTGACGCAATGAAAACAACTTTTTCCTGCGGTGTTTGTAACAAAAACTTTACACAAAAGTGTAACTTAGTTGACCATATGGGCAGTCACACGGAGGGGAAGCCTTACAGCTGCGATGTTTGTCTGGAGCGGTTCACAGACAAACGTAATTTAATTGAACATAATGAAATCCACCTGCCTGTTGCAATGAAACCAACTTTTGCTTGCGATATTTGTAACAAAAACTTTACACAAAAGTGTAACTTAGTTCGCCACATGCGCAGTCACACGGGGGGAAAGCCTTACAGCTGCGATGTTTGTCAGGAGCGGTTCACGTACAAACGTAATTTAATTGAACATAATGAAACCCACCTGCCTGACGCAATGAAAACAACTTTTTCCTGCGATGTTTGTAACAAAAACTTTACACAAAAGTGTAACTTAGTTGACCATATGGGCAGTCACACGGGGGAGAAGCCTTACAGCTGCGATGTCTGTCAGGAGCGGTTCACAGACAAACGTAATTTAATTGAACATAATGAAATCCACCTGCCTGTTGCAATGAAACCAACTTTTGCTTGCGATATTTGTAACAAAAACTTTACACAAAAGTCTAACTTATATACCCATATGCGCAGTCACACGGGGGAGAAGCCTTACAGCTGCGATGTTTGTCAGGAGCAGTTCACAGACAAACGTAATTTACTTGAACATAATGAAACCCACCTGCCTGACGCAATGAAAACAACTTTTTCCTGCGATGTTTGTAACAAAAACTTTACACAAAAGTGTAACTTAGTTGACCATATGCGCAGTCACACGGGGGAGAAGCCTTACAGCTGCGATGTTTGTCAGGAGCGGTTCACAGACAAACGTAATTTAATTGAACATAATGAAACCCACCTGCCTGACGCAATGAAAACAACTTTTTCCTGCGGTGTTTGTAACAAAAACTTTACACAAAAGTGTAACTTAGTTGACCATATGCGCAGTCACACGGAGGGGAAGCCTTACAGCTGCGATGTTTGTCAGGAGCGGTTCACAGACAAACGTAATTTAATTGAACATAATGAAATCCACCTGCCTGTTGCAATGAAACCAACTTTTGCTTGCGATATTTGTAACAAAAACTTTACACAAAAGTGTAACTTAGTTGACCATATGGGCAGTCACACGGGGGAGAAGCCTTACAGCTGCGATGTCTGTCAGGAGCGGTTCACAGACAAACGTAATTTAATTGAACATAATGAAATCCACCTGCCTGTTGCAATGAAACCAACTTTTGCTTGCGATATTTGTAACAAAAACTTTACACAAAAGTCTAACTTATATACCCATATGCGCAGTCACACGGGGGAGAAGCCTTACAGCTGCGATGTTTGTCAGGAGCAGTTCACAGACAAACGTAATTTACTTGAACATAATGAAACCCACCTGCCTGACGCAATGAAAACAACTTTTTCCTGCGATGTTTGTAACAAAAACTTTACACAAAAGTGTAACTTAGTTGACCATATGCGCAGTCACACGGGGGAGAAGCCTTACAGCTGCGATGTTTGTCAGGAGCGGTTCACAGACAAACGTAATTTAATTGAACATAATGAAACCCACCTGCCTGACGCAATGAAAACAACTTTTTCCTGCGGTGTTTGTAACAAAAACTTTACACAAAAGTGTAACTTAGTTGACCATATGGGCAGTCACACGGAGGGGAAGCCTTACAGCTGCGATGTTTGTCTGGAGCGGTTCACAGACAAACGTAATTTAATTGAACATAATGAAATCCACCTGCCTGTTGCAATGAAACCAACTTTTGCTTGCGATATTTGTAACAAAAACTTTACACAAAAGTGTAACTTAGTTGACCATATGGGCAGTCACACGGGGGAGAAGCCTTACAGCTGCGATGTCTGTCAGGAGCGGTTCACAGACAAACGTAATTTAATTGAACATAATGAAATCCACCTGCCTGTTGCAATGAAACCAACTTTTGCTTGCGATATTTGTAACAAAAACTTTACACAAAAGTCTAACTTATATACCCATATGCGCAGTCACACGGGGGAGAAGCCTTACAGCTGCGATGTTTGTCAGGAGCAGTTCACAGACAAACGTAATTTACTTGAACATAATGAAACCCACCTGCCTGACGCAATGAAAACAACTTTTTCCTGCGATGTTTGTAACAAAAACTTTACACAAAAGTGTAACTTAGTTGACCATATGCGCAGTCACACGGGGGAGAAGCCTTACAGCTGCGATGTTTGTCAGGAGCGGTTCACAGACAAACGTAATTTAATTGAACATAATGAAACCCACCTGCCTGACGCAATGAAAACAACTTTTTCCTGCGGTGTTTGTAACAAAAACTTTACACAAAAGTGTAACTTAGTTGACCATATGCGCAGTCACACGGAGGGGAAGCCTTACAGCTGCGATGTTTGTCAGGAGCGGTTCACAGACAAACGTAATTTAATTGAACATAATGAAATCCACCTGCCTGTTGCAATGAAACCAACTTTTGCTTGCGATATTTGTAACAAAAACTTTACACAAAAGTGTAACTTAGTTGACCATATGGGCAGTCACACGGGGGAGAAGCCTTACAGCTGCGATGTCTGTCAGGAGCGGTTCACAGACAAACGTAATTTAATTGAACATAATGAAATCCACCTGCCTGTTGCAATGAAACCAACTTTTGCTTGCGATATTTGTAACAAAAACTTTACACAAAAGTCTAACTTATATACCCATATGCGCAGTCACACGGGGGAGAAGCCTTACAGCTGCGATGTTTGTCAGGAGCAGTTCACAGACAAACGTAATTTACTTGAACATAATGAAACCCACCTGCCTGACGCAATGAAAACAACTTTTTCCTGCGATGTTTGTAACAAAAACTTTACACAAAAGTGTAACTTAGTTGACCATATGCGCAGTCACACGGGGGAGAAGCCTTACAGCTGCGATGTTTGTCAGGAGCGGTTCACAGACAAACGTAATTTAATTGAACATAATGAAACCCACCTGCCTGACGCAATGAAAACAACTTTTGCTTGCGATATTTGTAACAAAAACTTTACACAAAAGTGTAACTTAGTTCGCCATATGCGCAGTCACACGGGGGAGAAGCCTTACAGCTGCGATGTTTGTCAGGAGCGGTTCACAGACAAACGTAATTTAATTGAACATAATGAAACCCACTTGCCTGACGCAATGAAAACAACTTTTTCCTGCGATGTTTGTAACAAAAACTTTATACAAAAGTGTAACTTAGTTGACCATATGGGCAGTCACACGGGGGAGAAGCCTTACAGCTGCGATGTCTGTCAGGAGCGGTTCACAGACAAACGTAATTTAATTGAACATAATGAAATCCACCTGCCTGTTGCAATGAAACCAACTTTTGCTTGCGATATTTGTAACAAAAACTTTACACAAAAGTTTAACTTATACACCCATATGCGCAGTCACACGGGGGAGAAGCCTTACAGCTGCGATATATGTTGCCTCCAGCCGCTCGGCCTCACGGAGCAGGAGCCTGCTGAGGAGCGCCGCCCCGCCCCCCGGCCCCCGCCGCTCTCACGGAGCAGGAGCCCGCTGAGGAGCGCCGCCCCGCCCCCCGGCCCCCGCCGCTCAGCGCGGACAGGCCCGCGCGCAACTTATATGCGATTTGAATCGCCGATACCTGATAGCCCTGATGGATCACAAATTGTTATATTTATTTTGTTTGATTGA
Protein Sequence: MEHEVKQEPPQPPDAAAAPPVDRAEPCPVKQERSDDANDDAAALPVDGAEPSTVKQESSAAATDGLEDSCASSECSGEHLKEEPAAAAGCNAELLMFMLRPCTVRLERARVDEYCAPRPRPHNDAHEPDCTSAMRQVPARTHAQTETLSCDSCSAQFTQKDKLVRHLRTCASQIWPGSKKPTPSRSITKEKPFSYNHCPEQFLSKARLAVHRRACPREAGQPPNSHTGEKPYSCDVCQERFTYKRNLIEHNETHLPDAMKTTFSCDVCNKNFTQKCNLVDHMRSHTGEKPYSCDVCQERFTDKRNLIEHNETHLPDAMKTTFSCGVCNKNFTQKCNLVDHMGSHTEGKPYSCDVCLERFTDKRNLIEHNEIHLPVAMKPTFACDICNKNFTQKCNLVRHMRSHTGGKPYSCDVCQERFTYKRNLIEHNETHLPDAMKTTFSCDVCNKNFTQKCNLVDHMGSHTGEKPYSCDVCQERFTDKRNLIEHNEIHLPVAMKPTFACDICNKNFTQKSNLYTHMRSHTGEKPYSCDVCQEQFTDKRNLLEHNETHLPDAMKTTFSCDVCNKNFTQKCNLVDHMRSHTGEKPYSCDVCQERFTDKRNLIEHNETHLPDAMKTTFSCGVCNKNFTQKCNLVDHMRSHTEGKPYSCDVCQERFTDKRNLIEHNEIHLPVAMKPTFACDICNKNFTQKCNLVDHMGSHTGEKPYSCDVCQERFTDKRNLIEHNEIHLPVAMKPTFACDICNKNFTQKSNLYTHMRSHTGEKPYSCDVCQEQFTDKRNLLEHNETHLPDAMKTTFSCDVCNKNFTQKCNLVDHMRSHTGEKPYSCDVCQERFTDKRNLIEHNETHLPDAMKTTFSCGVCNKNFTQKCNLVDHMGSHTEGKPYSCDVCLERFTDKRNLIEHNEIHLPVAMKPTFACDICNKNFTQKCNLVDHMGSHTGEKPYSCDVCQERFTDKRNLIEHNEIHLPVAMKPTFACDICNKNFTQKSNLYTHMRSHTGEKPYSCDVCQEQFTDKRNLLEHNETHLPDAMKTTFSCDVCNKNFTQKCNLVDHMRSHTGEKPYSCDVCQERFTDKRNLIEHNETHLPDAMKTTFSCGVCNKNFTQKCNLVDHMRSHTEGKPYSCDVCQERFTDKRNLIEHNEIHLPVAMKPTFACDICNKNFTQKCNLVDHMGSHTGEKPYSCDVCQERFTDKRNLIEHNEIHLPVAMKPTFACDICNKNFTQKSNLYTHMRSHTGEKPYSCDVCQEQFTDKRNLLEHNETHLPDAMKTTFSCDVCNKNFTQKCNLVDHMRSHTGEKPYSCDVCQERFTDKRNLIEHNETHLPDAMKTTFACDICNKNFTQKCNLVRHMRSHTGEKPYSCDVCQERFTDKRNLIEHNETHLPDAMKTTFSCDVCNKNFIQKCNLVDHMGSHTGEKPYSCDVCQERFTDKRNLIEHNEIHLPVAMKPTFACDICNKNFTQKFNLYTHMRSHTGEKPYSCDICCLQPLGLTEQEPAEERRPAPRPPPLSRSRSPLRSAAPPPGPRRSARTGPRATYMRFESPIPDSPDGSQIVIFILFD

Similar Transcription Factors

Sequence clustering based on sequence similarity using MMseqs2

100% Identity: -
90% Identity: -
80% Identity: -