Basic Information

Insect: Apamea epomidion
Gene Symbol: -
Assembly: GCA_947507525.1
Location: OX382254.1:6390799-6413956[+]

Transcription Factor Domain

TF Family: zf-C2H2
Domain: zf-C2H2 domain
PFAM: PF00096
TF Group: Zinc-Coordinating Group
Description: The C2H2 zinc finger is the classical zinc finger domain. The two conserved cysteines and histidines co-ordinate a zinc ion. The following pattern describes the zinc finger. #-X-C-X(1-5)-C-X3-#-X5-#-X2-H-X(3-6)-[H/C] Where X can be any amino acid, and numbers in brackets indicate the number of residues. The positions marked # are those that are important for the stable fold of the zinc finger. The final position can be either his or cys. The C2H2 zinc finger is composed of two short beta strands followed by an alpha helix. The amino terminal part of the helix binds the major groove in DNA binding zinc fingers. The accepted consensus binding sequence for Sp1 is usually defined by the asymmetric hexanucleotide core GGGCGG but this sequence does not include, among others, the GAG (=CTC) repeat that constitutes a high-affinity site for Sp1 binding to the wt1 promoter [1].
Hmmscan Out: # of c-Evalue i-Evalue score bias hmm coord from hmm coord to ali coord from ali coord to env coord from env coord to acc

1 31 0.005 0.35 11.8 2.5 1 23 242 265 242 265 0.93

2 31 0.49 35 5.5 0.7 1 23 335 357 335 357 0.94

3 31 0.0059 0.42 11.6 0.4 2 23 429 451 428 451 0.94

4 31 0.0084 0.59 11.1 1.7 2 23 457 479 456 479 0.94

5 31 0.016 1.1 10.2 0.8 1 23 484 507 484 507 0.96

6 31 0.67 48 5.1 0.1 2 23 510 532 509 532 0.92

7 31 0.11 7.6 7.6 2.2 2 21 539 558 538 559 0.93

8 31 0.016 1.1 10.2 0.3 1 23 618 641 618 641 0.91

9 31 0.16 11 7.0 0.7 1 23 690 712 690 712 0.95

10 31 0.4 28 5.8 0.1 2 23 740 762 739 762 0.89

11 31 0.00021 0.015 16.1 0.2 2 23 783 805 782 805 0.96

12 31 0.00013 0.0096 16.7 2.8 1 23 810 832 810 833 0.96

13 31 6.4e-05 0.0045 17.7 0.5 1 23 837 860 837 860 0.95

14 31 0.21 15 6.7 0.3 2 23 863 885 862 885 0.95

15 31 0.084 6 7.9 1.3 2 20 891 909 890 914 0.91

16 31 0.0031 0.22 12.4 1.9 2 23 960 982 959 982 0.94

17 31 1.6 1.2e+02 3.9 0.1 2 23 1011 1033 1010 1033 0.94

18 31 0.0047 0.34 11.9 0.0 1 23 1055 1078 1055 1078 0.92

19 31 0.013 0.92 10.5 3.3 1 23 1120 1143 1120 1143 0.94

20 31 1.2 87 4.3 0.0 2 23 1216 1239 1215 1239 0.94

21 31 2.5e-05 0.0018 19.0 0.1 3 23 1246 1267 1245 1267 0.94

22 31 0.02 1.4 9.9 0.4 1 23 1314 1337 1314 1337 0.92

23 31 0.08 5.7 8.0 0.1 3 23 1369 1390 1367 1390 0.94

24 31 0.017 1.2 10.1 2.3 2 23 1413 1434 1413 1435 0.95

25 31 0.0013 0.096 13.6 1.7 1 23 1440 1463 1440 1463 0.97

26 31 0.082 5.8 8.0 0.2 1 23 1468 1491 1468 1491 0.93

27 31 0.0027 0.19 12.6 0.7 2 23 1497 1519 1496 1519 0.92

28 31 0.0018 0.13 13.2 0.2 2 23 1527 1549 1526 1549 0.97

29 31 0.28 20 6.3 0.0 2 23 1556 1577 1555 1577 0.95

30 31 5.8e-06 0.00041 21.0 0.6 1 23 1583 1605 1583 1605 0.92

31 31 6.5e-06 0.00046 20.9 1.2 1 23 1611 1634 1611 1634 0.97

#	of	c-Evalue	i-Evalue	score	bias	hmm coord from	hmm coord to	ali coord from	ali coord to	env coord from	env coord to	acc
1	31	0.005	0.35	11.8	2.5	1	23	242	265	242	265	0.93
2	31	0.49	35	5.5	0.7	1	23	335	357	335	357	0.94
3	31	0.0059	0.42	11.6	0.4	2	23	429	451	428	451	0.94
4	31	0.0084	0.59	11.1	1.7	2	23	457	479	456	479	0.94
5	31	0.016	1.1	10.2	0.8	1	23	484	507	484	507	0.96
6	31	0.67	48	5.1	0.1	2	23	510	532	509	532	0.92
7	31	0.11	7.6	7.6	2.2	2	21	539	558	538	559	0.93
8	31	0.016	1.1	10.2	0.3	1	23	618	641	618	641	0.91
9	31	0.16	11	7.0	0.7	1	23	690	712	690	712	0.95
10	31	0.4	28	5.8	0.1	2	23	740	762	739	762	0.89
11	31	0.00021	0.015	16.1	0.2	2	23	783	805	782	805	0.96
12	31	0.00013	0.0096	16.7	2.8	1	23	810	832	810	833	0.96
13	31	6.4e-05	0.0045	17.7	0.5	1	23	837	860	837	860	0.95
14	31	0.21	15	6.7	0.3	2	23	863	885	862	885	0.95
15	31	0.084	6	7.9	1.3	2	20	891	909	890	914	0.91
16	31	0.0031	0.22	12.4	1.9	2	23	960	982	959	982	0.94
17	31	1.6	1.2e+02	3.9	0.1	2	23	1011	1033	1010	1033	0.94
18	31	0.0047	0.34	11.9	0.0	1	23	1055	1078	1055	1078	0.92
19	31	0.013	0.92	10.5	3.3	1	23	1120	1143	1120	1143	0.94
20	31	1.2	87	4.3	0.0	2	23	1216	1239	1215	1239	0.94
21	31	2.5e-05	0.0018	19.0	0.1	3	23	1246	1267	1245	1267	0.94
22	31	0.02	1.4	9.9	0.4	1	23	1314	1337	1314	1337	0.92
23	31	0.08	5.7	8.0	0.1	3	23	1369	1390	1367	1390	0.94
24	31	0.017	1.2	10.1	2.3	2	23	1413	1434	1413	1435	0.95
25	31	0.0013	0.096	13.6	1.7	1	23	1440	1463	1440	1463	0.97
26	31	0.082	5.8	8.0	0.2	1	23	1468	1491	1468	1491	0.93
27	31	0.0027	0.19	12.6	0.7	2	23	1497	1519	1496	1519	0.92
28	31	0.0018	0.13	13.2	0.2	2	23	1527	1549	1526	1549	0.97
29	31	0.28	20	6.3	0.0	2	23	1556	1577	1555	1577	0.95
30	31	5.8e-06	0.00041	21.0	0.6	1	23	1583	1605	1583	1605	0.92
31	31	6.5e-06	0.00046	20.9	1.2	1	23	1611	1634	1611	1634	0.97

Sequence Information

Coding Sequence: ATGGAGTTCGACGAGATTGTGGTGAAGGAGAGCCCCGGGCTTTGCCGGTGCTGTCTCTCCGAAGGATGCTACAAGGATTTGGGCACCGAATATACCTGGATGAATGAAACAGAGGTTTATGCTGATATACTGCTCGAATGCTTCGATATTAGCATAACCCAACACAATGAAGGTCCAAATGGTCCAAACCGGCTCATCTGTGAGGTCTGCATCACTCGGTTGCGGGACGCATGCAACTTCAAGAAACAAGTCATGGACTCGGAGAAGAAATTCATTGATATGATGGGCAGGGGGGAATTTAGACCTAAAATGCTTATCTACCAGGCGCAGCTGAAGTGTGAAGGTCCAGCTCCAGTGGAGGATCCTGACGATGAAGATATAGAATATCTTGAGGACGATTTAGATTTTGCTGAGGTCAACCTTAAAGACGAGTTAACACAGCCTTCAGTATCAGACGCCACAGTGACCATGCCGGTCAAAGGCAAGCGTGGTCGTCCTCGCAAGAACACACCAGTGAAGCCGGACAAGAGGGCCAAAGTGGCTAAAGTTGACGAAAAGGCCAAGACGTCGAAAGCTGTTGCCAAAGGTGAGAAACGGTGCACCACAGAGGCGTCGAGTAAGTCCTCAATGACGTCAACAAGACGCAACAAATTAATGAAGACTAACGCTATTATAGTTCTAGAAACTTCCACCGTCATCCCCTTCAAATGGCATAGACAAAATTACCTCTGTTTCTTCTGCCATCTGACTTTCAAAGACACAGATTTGCTCAAAGAGCATATTCGAGACCAGCATAAGAAATCTAATATCAAAGCTGCCGTTTCATACCTGAGAAGAGACGAGAAAGTTAAAATTGACGTCTCAGTACTACAATGTCGGTCTTGCAATGGTAAAAAACCGAGGAAATACAAGGGCACAGAGTCTTCCTCGATGAGAAGGCGACGGAACCTACAAATATTATTCAACAACACATCTATTATTCCTTTTAAATGGCGTGGGAAGTACCTGTGTTTCTATTGCAGTAAAGACATTGCGGAGTATACAGAGTTGAGAAAACATACGAAAGCACATGGCAGCTGTTCTATAAAAGACCATTCTCTCAAAGTCTTAAAAGGAGGACAGAACATGGAAATTAAAGTAGACATATCATTGATCACTTGCGAAGTGTGTGCGGAGACGTTACCGTCTTTCGATGAAATCGTCACTCATTTGTTTGATAAACATGAACTTGAATATGATAAAGAAGTAGAAATGGCTATAGAAGAGTATAAACTTGCTGATCTCAGTTGTACGGGATGCGATGAAAAGTTCACATATTTCGGATACCTTGTCTCTCACGTCAATAATACCCACCCGAAAAACTGCCTGATTTGCGATAACTGCAACCAAAAGTTCAATAAAAGGAGAGATCTGTTTTCTCACGTGAAAAATTATCATCGAGAAGGAGGGTACCAATGCGAAATGTGCCCTCAAATCTTCAATTCCTTGAATATTTTGAGAAAACACCGAAATAACAGGCATTTGACTCGATGCAACATTTGCAATTTAAAACTGCCGTCAGCTGCTTTGAGACAAAAACATATCGATTTAGAACATCCAGACGATGGATCTTTGCAATGCGATACCTGTTTCAAAGAGTTCCATACGAAGCAGGGCCTCAAAATGCATTCAAGGAAATGCAAAGGAGAGGAGATTTTCGGAATCGCCATTAAAGAAGAAAACGTTGCCATGGACTTAGACCTAAACTACGAGGATCAATCCAAAAAACCCTGCGTTAAACAAATCAGAGAAAATATAGTTATAGTCATAAACATGTCTACGGCAATACCTTTTAATTTTTATAAGAATAAGTTCAACTGTTTCTACTGCTCAAAAGATTTCGCCGATTCCGATTTGATGAGGGAACACGCGGTTATGGAACATCCTGTGTGCGATGTAAAAGAGAAATGTATTAGGAAATATTTGAAAACAGAGATGACAAAGCACAGTGCTAGTTATCTAAGGAGGAGAAATCTGCAAATATTGCTCAACAATACAACGTTGATACCTTTTAAATGGCGCGGCAAATACCTCTGCTTTTATTGCGGGGACGATACGACGACGCCCGATCGTCTCCGGAAACACACGAAAGGCCACGGACCTTGCAGTGATAGCGACAGAGCTATACGACTAGTTAAATCAGCTGATATAGAAATCAAAATAGATGTATCCGATGTTTCGTGCGAGATTTGTTCCGAAACTTTCCCCTTTTTAGACGAAATTATTGACCACTTGATTTTTAAACACCAACTCCCTTATGCGAAAGATGTGGAGATGCTGTTATCAGCATACAGACTGTTAGATCTTCAGTGTCTCCTTTGCGATGAAACCTTCAATTACTTAAGTAAATTAATCAGCCATATGAACGTCGCTCATCCAAAAAACAGCTTTGAGTGTGCCGAATGTAAAAAGAACTTTAATAAAAAGAGAGATTTGGATTCGCACATAAGAATGCATCATAAGAAATGCTATTCTTGTACGAAATGCGATGTAACGTTCCCAACAAACTCCGCGTTACAGATTCATAGGTCTAACTCTCATTCTTCGACTTGTAACATCTGCTTCCAAGTATTTGCGTCAGACGGCAAGCGGTTAGCTCATCAGAAATCTGACCATGATTCTAATCAGAGCCAATGTGGATTCTGCAATAAAGTTCTAACAACAAAACAGGCCTTTATAAGACATGCTGCAAATTGCGAACATAAACCTAAGGACGAAACTGTCATAATAGATGACGATGAAGACAAAAAAGTATCCGTCAAAGAAATAAGAAAAAGTTTAGCATGCATCTTTAACATGACAACCGCCCTTCCTTTCAAATTCTTTATGAATAGGCTACGATGTTTCTATTGCACGAAAGACTTCACCTCATGTGAAGATTTAAAAGAACATACTGCTATAGAACACCCTCACTGTGATATATCCTTTAAGTCTATGAGATTAAGGAACAGATATGACGGTGTCCAAATCAAAGTTGATACTTCTTCTTTGTCTTGTAGACTATGCCAAGTCACCTTGGAGGATTTGAACGATTTAATTGACCATTTGAGTAAAGAGCATAAGGTGAAATGCGACTTTTCTGTCGAGAGTAATCTGCAGCCGTTTAAACTGATTAAAGACAACTACCCTTGCCCAATTTGCGGGGAAGTCTACAGATATTTTGGCGTCCTACTCAAGCACGTCGAACTCCCCCACACTTCGTTCCTAAACGATAGTAACATAGAACCTAAGAAAAAACAAAATATACTACAAATACGACAGAACATACAGTGCGTACTCAATATGTCGACTGCTGTGCCTTTCAAATTCTTCTCTAAATACTCCTGCTTTTATTGTTCAAAGAAATTCGTTGAATTTGACGAGTTACGTCACCATACCAGCCTTGAACATCCTGTATGCGATTTGAAATCGAAATGCATGAAGAAATGCAAAGGGGAAAGGATAGCTGTCAAAATTGACATATCTGCATTAGCTTGTAAAATATGTTGCCTCCCTATGCCTAATTTAGAAGATTTAGTCAACCATTTAATAAACGAACATAAGGCGAACTATGATACCTCAATTCCTGGGTGTTTAGAGCCTTTCCGGGTTATAAAAGACAATATGCCATGTCCTATATGCCCGGATACCGTCTTCCGATACTTCGGCATATTGCTCCGACATATGAACTCCGAACACAGCAACAACAACAGGATCTGTGACTTCTGCGGTCGAAGCTTCAGGAACGCGGCGAATCTAAACGTGCATATAACGTATGCACACACAGGTTCAAAATTCAATACTGTGGAGGACAAATATAAGAAAATGGAAGTCGCCCGTAAGCTACTGATAAAACGGCGAAATGTCGAATATGTTTTACAGTATAGCAACGTCACACCTTTCATGTGGCACAAAGGGAAATATAAATGCTTTTACTGCAACGAAACTACTAAAGACCCCGTCGTACTTCGAGAGCATACGACCGAAGCGCACCAATTCGCGAATCTAGAACTCGTTGTGTTTGACAGAACCAAAAACAATAGAAATAAAGATGCTGCTGTCAAAATTGATGTTACTAACATATGTTGCAAGCTTTGTCCTCAAGCAGTGCCGAATTTAGAAGAGCTGATACATCATTTGATCATCGCACATGACGCTGAATATGATGTAAGCGTTCCAAATTGTCTTCTACCCTTCAAATTAGACAAGGACCAGCCAACATGCCCGACTTGCAACATGAAATTCGTGTTCTTCGAATATTTGCTCCGCCACGCGAACAAACACCATCTTTCCCACCATTACATCTGCGATGTTTGCGGCACCAGTTTCCAAGGAGAGAACCATTTGAAAATGCATTATAGGTACTATCACAGAGAGGGTGGCTACACTTGCGAATACTGTGGCATTAGTCTTGCAACTCTATCCAAAAAGATTTTACACGAAAAGAACGTCCATTTAGTGAACTTATCGACTTGCCCGCATTGTCCGGAAACTTTCAAAAGTCCGTACTTAAAGAAACTTCATTTGGCGAACGTTCATGAGGTTGAAGAGCTCAAAATTAAATGTCCATTTTGTCCAAAAGTGTATCCACAGGAATCTATAATGTCTCGTCATATGAGGAGAGTGCATCTAAGAGAGAAGAATGTAGAATGTGAAGTATGTGGGGACAAGTTCTTCGGACCTTACGATGTTAAACTCCACATGGTCAAACACAATGGAGAAAAGAAATTCGTCTGCTCTGTCTGCGGGAAAAAATTCTCCAAGCGAAGTAACTTGAACTCCCATGCAGTTTTACATACGAAAGAGAAGGACTATGTATGTGTAGTTTGCAATAAAGCATTTGCTCATCAGACGAATTTGCGAATGCATATCCGTAATAGACATAGTCGATTTGATCTAGCTCCAATAGTTGACGAAATTGATGAAAGCGATATGGTCCAAATGGAAATCATTCAGGAGGAATTAGAAGGAGAAGTGGCAGGACAATACATTCAATGA
Protein Sequence: MEFDEIVVKESPGLCRCCLSEGCYKDLGTEYTWMNETEVYADILLECFDISITQHNEGPNGPNRLICEVCITRLRDACNFKKQVMDSEKKFIDMMGRGEFRPKMLIYQAQLKCEGPAPVEDPDDEDIEYLEDDLDFAEVNLKDELTQPSVSDATVTMPVKGKRGRPRKNTPVKPDKRAKVAKVDEKAKTSKAVAKGEKRCTTEASSKSSMTSTRRNKLMKTNAIIVLETSTVIPFKWHRQNYLCFFCHLTFKDTDLLKEHIRDQHKKSNIKAAVSYLRRDEKVKIDVSVLQCRSCNGKKPRKYKGTESSSMRRRRNLQILFNNTSIIPFKWRGKYLCFYCSKDIAEYTELRKHTKAHGSCSIKDHSLKVLKGGQNMEIKVDISLITCEVCAETLPSFDEIVTHLFDKHELEYDKEVEMAIEEYKLADLSCTGCDEKFTYFGYLVSHVNNTHPKNCLICDNCNQKFNKRRDLFSHVKNYHREGGYQCEMCPQIFNSLNILRKHRNNRHLTRCNICNLKLPSAALRQKHIDLEHPDDGSLQCDTCFKEFHTKQGLKMHSRKCKGEEIFGIAIKEENVAMDLDLNYEDQSKKPCVKQIRENIVIVINMSTAIPFNFYKNKFNCFYCSKDFADSDLMREHAVMEHPVCDVKEKCIRKYLKTEMTKHSASYLRRRNLQILLNNTTLIPFKWRGKYLCFYCGDDTTTPDRLRKHTKGHGPCSDSDRAIRLVKSADIEIKIDVSDVSCEICSETFPFLDEIIDHLIFKHQLPYAKDVEMLLSAYRLLDLQCLLCDETFNYLSKLISHMNVAHPKNSFECAECKKNFNKKRDLDSHIRMHHKKCYSCTKCDVTFPTNSALQIHRSNSHSSTCNICFQVFASDGKRLAHQKSDHDSNQSQCGFCNKVLTTKQAFIRHAANCEHKPKDETVIIDDDEDKKVSVKEIRKSLACIFNMTTALPFKFFMNRLRCFYCTKDFTSCEDLKEHTAIEHPHCDISFKSMRLRNRYDGVQIKVDTSSLSCRLCQVTLEDLNDLIDHLSKEHKVKCDFSVESNLQPFKLIKDNYPCPICGEVYRYFGVLLKHVELPHTSFLNDSNIEPKKKQNILQIRQNIQCVLNMSTAVPFKFFSKYSCFYCSKKFVEFDELRHHTSLEHPVCDLKSKCMKKCKGERIAVKIDISALACKICCLPMPNLEDLVNHLINEHKANYDTSIPGCLEPFRVIKDNMPCPICPDTVFRYFGILLRHMNSEHSNNNRICDFCGRSFRNAANLNVHITYAHTGSKFNTVEDKYKKMEVARKLLIKRRNVEYVLQYSNVTPFMWHKGKYKCFYCNETTKDPVVLREHTTEAHQFANLELVVFDRTKNNRNKDAAVKIDVTNICCKLCPQAVPNLEELIHHLIIAHDAEYDVSVPNCLLPFKLDKDQPTCPTCNMKFVFFEYLLRHANKHHLSHHYICDVCGTSFQGENHLKMHYRYYHREGGYTCEYCGISLATLSKKILHEKNVHLVNLSTCPHCPETFKSPYLKKLHLANVHEVEELKIKCPFCPKVYPQESIMSRHMRRVHLREKNVECEVCGDKFFGPYDVKLHMVKHNGEKKFVCSVCGKKFSKRSNLNSHAVLHTKEKDYVCVVCNKAFAHQTNLRMHIRNRHSRFDLAPIVDEIDESDMVQMEIIQEELEGEVAGQYIQ

Similar Transcription Factors

Sequence clustering based on sequence similarity using MMseqs2

100% Identity: iTF_00038040;
90% Identity: -
80% Identity: -