Basic Information

Insect: Apamea anceps
Gene Symbol: -
Assembly: GCA_951799955.1
Location: OX637530.1:4420481-4438888[-]

Transcription Factor Domain

TF Family: zf-C2H2
Domain: zf-C2H2 domain
PFAM: PF00096
TF Group: Zinc-Coordinating Group
Description: The C2H2 zinc finger is the classical zinc finger domain. The two conserved cysteines and histidines co-ordinate a zinc ion. The following pattern describes the zinc finger. #-X-C-X(1-5)-C-X3-#-X5-#-X2-H-X(3-6)-[H/C] Where X can be any amino acid, and numbers in brackets indicate the number of residues. The positions marked # are those that are important for the stable fold of the zinc finger. The final position can be either his or cys. The C2H2 zinc finger is composed of two short beta strands followed by an alpha helix. The amino terminal part of the helix binds the major groove in DNA binding zinc fingers. The accepted consensus binding sequence for Sp1 is usually defined by the asymmetric hexanucleotide core GGGCGG but this sequence does not include, among others, the GAG (=CTC) repeat that constitutes a high-affinity site for Sp1 binding to the wt1 promoter [1].
Hmmscan Out: # of c-Evalue i-Evalue score bias hmm coord from hmm coord to ali coord from ali coord to env coord from env coord to acc

1 32 0.51 43 5.7 0.7 1 23 234 256 234 256 0.94

2 32 0.0061 0.52 11.7 0.4 2 23 328 350 327 350 0.94

3 32 0.0087 0.73 11.2 1.7 2 23 356 378 355 378 0.94

4 32 0.016 1.4 10.4 0.8 1 23 383 406 383 406 0.96

5 32 0.7 59 5.2 0.1 2 23 409 431 408 431 0.92

6 32 0.11 9.3 7.8 2.2 2 21 438 457 437 458 0.93

7 32 0.016 1.4 10.4 0.3 1 23 517 540 517 540 0.91

8 32 0.025 2.1 9.8 0.2 3 23 569 590 567 590 0.94

9 32 0.027 2.2 9.7 0.4 2 23 613 636 612 636 0.95

10 32 0.0012 0.1 13.9 0.6 3 20 643 660 641 664 0.90

11 32 0.84 71 5.0 0.3 1 23 669 692 669 692 0.96

12 32 0.00025 0.021 16.1 0.2 2 23 698 720 698 720 0.96

13 32 0.00015 0.013 16.8 4.8 1 23 724 747 724 747 0.97

14 32 0.0057 0.48 11.8 0.9 2 23 754 775 753 775 0.96

15 32 0.11 9.4 7.7 1.2 1 23 781 804 781 804 0.93

16 32 0.17 14 7.2 0.7 1 23 841 863 841 863 0.95

17 32 0.42 35 5.9 0.1 2 23 891 913 890 913 0.89

18 32 4.6e-05 0.0039 18.4 0.3 2 23 934 956 933 956 0.96

19 32 0.0002 0.017 16.4 3.0 1 23 961 983 961 984 0.96

20 32 2.2e-05 0.0019 19.4 0.6 1 23 988 1011 988 1011 0.95

21 32 0.22 19 6.8 0.3 2 23 1014 1036 1013 1036 0.95

22 32 0.087 7.3 8.1 1.3 2 20 1042 1060 1041 1065 0.91

23 32 0.0032 0.27 12.6 1.9 2 23 1111 1133 1110 1133 0.94

24 32 1.7 1.4e+02 4.0 0.1 2 23 1162 1184 1161 1184 0.94

25 32 0.085 7.2 8.1 0.8 1 20 1206 1225 1206 1240 0.94

26 32 1.3 1.1e+02 4.4 0.0 2 23 1313 1336 1312 1336 0.94

27 32 2.6e-05 0.0022 19.2 0.1 3 23 1343 1364 1342 1364 0.94

28 32 0.0046 0.39 12.1 2.8 2 23 1369 1391 1368 1391 0.94

29 32 0.015 1.2 10.5 5.1 1 23 1396 1419 1396 1419 0.96

30 32 3.2e-05 0.0027 18.9 5.0 1 23 1423 1446 1423 1446 0.97

31 32 0.00037 0.031 15.5 0.3 2 23 1453 1474 1452 1474 0.96

32 32 1.3e-05 0.0011 20.1 0.6 1 23 1480 1502 1480 1502 0.98

#	of	c-Evalue	i-Evalue	score	bias	hmm coord from	hmm coord to	ali coord from	ali coord to	env coord from	env coord to	acc
1	32	0.51	43	5.7	0.7	1	23	234	256	234	256	0.94
2	32	0.0061	0.52	11.7	0.4	2	23	328	350	327	350	0.94
3	32	0.0087	0.73	11.2	1.7	2	23	356	378	355	378	0.94
4	32	0.016	1.4	10.4	0.8	1	23	383	406	383	406	0.96
5	32	0.7	59	5.2	0.1	2	23	409	431	408	431	0.92
6	32	0.11	9.3	7.8	2.2	2	21	438	457	437	458	0.93
7	32	0.016	1.4	10.4	0.3	1	23	517	540	517	540	0.91
8	32	0.025	2.1	9.8	0.2	3	23	569	590	567	590	0.94
9	32	0.027	2.2	9.7	0.4	2	23	613	636	612	636	0.95
10	32	0.0012	0.1	13.9	0.6	3	20	643	660	641	664	0.90
11	32	0.84	71	5.0	0.3	1	23	669	692	669	692	0.96
12	32	0.00025	0.021	16.1	0.2	2	23	698	720	698	720	0.96
13	32	0.00015	0.013	16.8	4.8	1	23	724	747	724	747	0.97
14	32	0.0057	0.48	11.8	0.9	2	23	754	775	753	775	0.96
15	32	0.11	9.4	7.7	1.2	1	23	781	804	781	804	0.93
16	32	0.17	14	7.2	0.7	1	23	841	863	841	863	0.95
17	32	0.42	35	5.9	0.1	2	23	891	913	890	913	0.89
18	32	4.6e-05	0.0039	18.4	0.3	2	23	934	956	933	956	0.96
19	32	0.0002	0.017	16.4	3.0	1	23	961	983	961	984	0.96
20	32	2.2e-05	0.0019	19.4	0.6	1	23	988	1011	988	1011	0.95
21	32	0.22	19	6.8	0.3	2	23	1014	1036	1013	1036	0.95
22	32	0.087	7.3	8.1	1.3	2	20	1042	1060	1041	1065	0.91
23	32	0.0032	0.27	12.6	1.9	2	23	1111	1133	1110	1133	0.94
24	32	1.7	1.4e+02	4.0	0.1	2	23	1162	1184	1161	1184	0.94
25	32	0.085	7.2	8.1	0.8	1	20	1206	1225	1206	1240	0.94
26	32	1.3	1.1e+02	4.4	0.0	2	23	1313	1336	1312	1336	0.94
27	32	2.6e-05	0.0022	19.2	0.1	3	23	1343	1364	1342	1364	0.94
28	32	0.0046	0.39	12.1	2.8	2	23	1369	1391	1368	1391	0.94
29	32	0.015	1.2	10.5	5.1	1	23	1396	1419	1396	1419	0.96
30	32	3.2e-05	0.0027	18.9	5.0	1	23	1423	1446	1423	1446	0.97
31	32	0.00037	0.031	15.5	0.3	2	23	1453	1474	1452	1474	0.96
32	32	1.3e-05	0.0011	20.1	0.6	1	23	1480	1502	1480	1502	0.98

Sequence Information

Coding Sequence: ATGGAGTTCGACGAGATTGTGGTGAAGGAGAGCCCCGGGCTTTGCCGGTGCTGTCTCTCCGAAGGATGCTACAAGGATTTGGGCACCGAATATACTTGGATGAATGAAACAGAGGTTTATGCTGATATGCTGCTCGAATGCTTCGATATTAGCATAACCCAACACAATGAAGGTCCAAATGGTCCAAACCGGCTcatctgtgaagtctgcatCACTCGGTTGCGGGATGCATGCAACTTTAAGAAACAAGTCATGGACTCGGAGAAGAAATTCATTGATATGATGGGCAGGGGGGAATTTAGACCCAAGATGCTTATCTACCAGGCGCAGCTGAAATGTGAAGGTCCAGCTCCAGTGGAGGATCCTGACGATGAAGATGTAGAATATCTTGAGGACGATATAGATTTTGCTGAGGTCAACCTCAAAGACGAGTTAACACAGCCTTCAGTATCAGACGCCACCGTAGCCATGCCGGTCAAAGGCAAGCGTGGTCGTCCTCGCAAGAACACACCAGTGAAGCCGGACAAGAGGGCCAAAGTGGCTAAAGTTGACGAAAAGGCCAAGACGTCGAAAGCTGTTGCTAAAGGTAAAAAACCGAGGAAATACAAGGGCACAGAGTCTTCCTCGATGAGAAGGCGACGGAACCTACAAATATTATTCAACAACACATCTATTATTCCTTTTAAATGGCGTGGGAAGTACCTGTGTTTCTATTGCAGTAAAGACATTGCGGAGTATACAGAGTTGAGAAAACATACGAAAGCACATGGCAGCTGTTCCATAAAAGACCATTCTCTCAAAGTTTTAAAAGGAGGCCAGAACATGGAAATTAAAGTAGACATATCATTGATCACTTGCGAATTGTGTGCGGAGACGTTACCGTCTTTCGATGAAATCGTCACTCATTTGTTTGATAAACATGAACTTGAATATGATAAAGAAGTAGAAATGGCTATAGAAGAGTATAAACTTGCTGATCTCAGTTGTACGGGATGCGATGAAAAGTTCACGTATTTCGGATACCTTGTCTCTCATGTCAATAATACCCACCCGAAAAACTGCCTTATTTGCGATAACTGCaaccaaaaattcaataaaaggAGAGATCTGTTTTCTCACGTGAAAAATTATCATCGGGAAGGAGGGTATCAATGCGAAATGTGCCCTCAAATCTTCAattccttgaatattttgagaaAACACCGAAATAACAGGCATTTGACTCGATGCAACATTTGCAATTTGAAACTGCCGTCAGCTGCTTTGAGACAAAAACATATCGATTTAGAACATCCAGACGACGGGTCTTTGCAATGTGATACCTGTTTTAAAGAGTTCCATACGAAACAGGGCCTCAAAATGCATTCAAGGAAATGCAAAGGAGAGGAGATTTTCGGAATCGCCATCAAAGAAGAAAACGTTGCCATGGACTTGGACCTAAACTACGAGGATCAATCCAAAAAACCTTGCGTCAAACAAATCAGAGAAAATATAGTTATAGTCATAAACATGTCTACGGCAAtaccttttaatttttataagaaTAAGTTCAACTGTTTCTACTGCTCAAAAGATTTCGCCGATTCCGATTTGATGAGGGAACACGCGGTTATGGAACATCCTGTGTGCGATATAAAACAGAAATGTATTAGGAAGTGTAGGGAGTCCGTCGCTTGCGTGAAAATCGATATTTCTTCACTCGCTTGCAAAGTCTGCTTCGAGTCATTAACTGACTTGGATCATTTGATTGATCATTTAATCGTAAAACACGATGCGAAGTACGACAAATCGATAACAACATGTCTGcaaccttataggctgattaaagaCAACATGGTCTGTCCACACTGTCCCGGCGAAGTATTCCGCTTCTTCGGAACACTGCTTAAACATATGAAcatcaaacatacaaacaacaaTATCATTTGCGTTTACTGCGGCCAAACATTCCGTAGGGATCAAAACTTACGTGTTCACATTTGGCGTCATCACAGAGCAGGGCGTTTCAAATGTACAATTTGTGCTGCTGAGTGCAATATACCATCTCGTCTGTACATGCACATGGCTCGAGCACACGGCGTTAAAGCTGCAAAATGTCCTAAATGCCCCGAATCTTTCGCTACGCAATACGAAAGGCAGAAACATCTGATCATCGCCCACAACACTGGCCACAAATGCTCTTATTGTGGAAAACTCTTTACACGAAACTCCTTTATGAGTAACCATATACGAAGAACGCATATGAAAGAGAAGAGTATAGAATGTTCTGTTTGCTATACAAAGTTCTTTAACACTGTCCTGTTGAAGAGGCATATGGTGAAACATAGCGGGCAGAAGAAATACAGCTGTGATGTGTGTGGGGAACGGTTCTACTGGCGCAAGACCATGAAGACTCATAGAGATAGGCTGCATAatttgGAAACAGAGATGACAAGGCACAGTGCTAGTTATCTAAGGAGGAGAAATCTGCAAATATTGCTCAACAATACAACGTTGATACCTTTTAAATGGCGCGGCAAATACCTCTGCTTTTATTGCGGGGACGATACGACGACTCCCGATCGTCTCCGGAAACACACGAAAGGCCACGGACCTTGCAGTGATAGCGACAGAGCTATACGACTAGTTAAATCAGCTGATATAGAAATCAAAATAGACGTATCCGATGTTTCGTGCGAGATTTGTTCAGAAACATTCCCCTTTTTAGACGAAATTATTGACCACTTGATTTTTAAACACCAACTCCCTTATGCAAAAGATGTGGAGATGCTGTTATCAGCATACAGACTGTTAGATCTTCAGTGTCTCCTTTGCGATAAAACCTTCAATTACTTAAGTAAATTAATCAGCCATATGAACGTCGCTCATCCAAAAAACAGCTTTGAGTGTGTCGAATGTAAAAAGAACTTTAATAAAAAGAGGGATTTGGATTCGCACATAAGAATGCATCATAAGAAATGCTATTCTTGTACGAAATGCGATGAAACGTTCCCAACAAACTCCGCGTTACAGATTCATAGGTCTAACTCTCATTCTTCGACTTGTAACATCTGCTTCCAAGTATTTGCGTCAGACGGCAAGCGGTTAGCTCATCAGAAATCTGACCATGATTCTAATCAGAGCCAATGTGGATTCTGCAATAAAGTTCTAACAACAAAACAGGCCTTTATAAGACACGCTGCAAATTGCGAACATAAACCTAACGAAGAAACTGTCATAATAGATGACGATGAAGACAAAAAAATACCCGTCaaagaaataagaaaaagtTTAGCATGCATCTTTAACATGACAACCGCACTTCCTTTCAAATTCTTTATGAATAGGCTACGATGTTTCTATTGCACGAAAGACTTCACCTCATGTGAAGATTTAAAAGAACATACTGCTATAGAACACCCTCACTGCGATATATCCTTTAAGTCTATGAGATTAAGGAACAGATATGACGGTGTCCAAATCAAAGTTGATACTTCTTCTTTGTCTTGTAGATTATGCCAAGTCACCTTGGAGGATTTGAACGATTTGATTGACCATTTGAGTAAAGAGCATAAGGTGAAATGCGACTTTTCTGTCGAGAGTAATCTGCAGCCGTTCAAACTGATTAAAGACAACTACCCTTGCCCAATTTGCGGGGAAATCTACAGATATTTTGGCGTCCTACTCAAGCACAAATTCGTTGAATTTGACGAGTTACGTCACCATACCAGCCTTGAACATCCTGTATGCGATTTGAAGTCGAAATGCATGAAGAAGTGCAAAGGGGAAAGGATAGCTGTCAAGATTGACATATCTGCATTAGCTTGTAAAATATGTTGCCTCCCTATGCCTAATTTAGAAGATTTAGTCAACCATTTAATAAACGAACATAAGGCGAACTATGATACCTCAATTCCTGGGTGTTTAGAGCCTTTCCGGGTTATAAAAGACAATATGCCATGTCCCATATGCCCGGATACCGTCTTCCGATACTTCGGCATATTGCTCCGACATATGAACTCCGAACACAGCAACAACAACAGGATCTGTGACTTCTGCGGTCGAAGCTTCAGGAATGCGGCGAATCTAAACGTGCATATAACGTATGCACACACAGGTTCCTGTGAATGTGACATTTGTGGGGTTAAATACAAGAACCAGTGGTGTCTAGCGCGACATAGAGCGAGGACACACGATGCGAAGGACCACAAATGTCCAAAATGTCCCGAGCAATTCCAATCTCAGTACCATAAACAAAAACACTTAATAAAAATGCATAATGTGGGGCACAAATGTAGTTACTGCGGGAAAATGTTTACAAGAAACTCTTTCATGAAAGACCATGTCAGGCGCACACATTTGAAGGAAAAAAACATTCCTTGTTCCATTTGCAATGAGAAGTTTTTCGATAATTATCTTTTGAGAATGCATATGGTGAAACATGAGGGGGATAGGAAATTCAGTTGCACTGTTTGTGGGAAAGCCTTTTTGAGACGAAGTAATTTGAGCTCGCATATGGAGATGCACAAAAAGTATGGGCATGTGCAGTAG
Protein Sequence: MEFDEIVVKESPGLCRCCLSEGCYKDLGTEYTWMNETEVYADMLLECFDISITQHNEGPNGPNRLICEVCITRLRDACNFKKQVMDSEKKFIDMMGRGEFRPKMLIYQAQLKCEGPAPVEDPDDEDVEYLEDDIDFAEVNLKDELTQPSVSDATVAMPVKGKRGRPRKNTPVKPDKRAKVAKVDEKAKTSKAVAKGKKPRKYKGTESSSMRRRRNLQILFNNTSIIPFKWRGKYLCFYCSKDIAEYTELRKHTKAHGSCSIKDHSLKVLKGGQNMEIKVDISLITCELCAETLPSFDEIVTHLFDKHELEYDKEVEMAIEEYKLADLSCTGCDEKFTYFGYLVSHVNNTHPKNCLICDNCNQKFNKRRDLFSHVKNYHREGGYQCEMCPQIFNSLNILRKHRNNRHLTRCNICNLKLPSAALRQKHIDLEHPDDGSLQCDTCFKEFHTKQGLKMHSRKCKGEEIFGIAIKEENVAMDLDLNYEDQSKKPCVKQIRENIVIVINMSTAIPFNFYKNKFNCFYCSKDFADSDLMREHAVMEHPVCDIKQKCIRKCRESVACVKIDISSLACKVCFESLTDLDHLIDHLIVKHDAKYDKSITTCLQPYRLIKDNMVCPHCPGEVFRFFGTLLKHMNIKHTNNNIICVYCGQTFRRDQNLRVHIWRHHRAGRFKCTICAAECNIPSRLYMHMARAHGVKAAKCPKCPESFATQYERQKHLIIAHNTGHKCSYCGKLFTRNSFMSNHIRRTHMKEKSIECSVCYTKFFNTVLLKRHMVKHSGQKKYSCDVCGERFYWRKTMKTHRDRLHNLETEMTRHSASYLRRRNLQILLNNTTLIPFKWRGKYLCFYCGDDTTTPDRLRKHTKGHGPCSDSDRAIRLVKSADIEIKIDVSDVSCEICSETFPFLDEIIDHLIFKHQLPYAKDVEMLLSAYRLLDLQCLLCDKTFNYLSKLISHMNVAHPKNSFECVECKKNFNKKRDLDSHIRMHHKKCYSCTKCDETFPTNSALQIHRSNSHSSTCNICFQVFASDGKRLAHQKSDHDSNQSQCGFCNKVLTTKQAFIRHAANCEHKPNEETVIIDDDEDKKIPVKEIRKSLACIFNMTTALPFKFFMNRLRCFYCTKDFTSCEDLKEHTAIEHPHCDISFKSMRLRNRYDGVQIKVDTSSLSCRLCQVTLEDLNDLIDHLSKEHKVKCDFSVESNLQPFKLIKDNYPCPICGEIYRYFGVLLKHKFVEFDELRHHTSLEHPVCDLKSKCMKKCKGERIAVKIDISALACKICCLPMPNLEDLVNHLINEHKANYDTSIPGCLEPFRVIKDNMPCPICPDTVFRYFGILLRHMNSEHSNNNRICDFCGRSFRNAANLNVHITYAHTGSCECDICGVKYKNQWCLARHRARTHDAKDHKCPKCPEQFQSQYHKQKHLIKMHNVGHKCSYCGKMFTRNSFMKDHVRRTHLKEKNIPCSICNEKFFDNYLLRMHMVKHEGDRKFSCTVCGKAFLRRSNLSSHMEMHKKYGHVQ

Similar Transcription Factors

Sequence clustering based on sequence similarity using MMseqs2

100% Identity: -
90% Identity: -
80% Identity: -