Basic Information

Insect: Amphimallon solstitiale
Gene Symbol: -
Assembly: GCA_963170755.1
Location: OY720675.1:3323965-3334031[-]

Transcription Factor Domain

TF Family: zf-C2H2
Domain: zf-C2H2 domain
PFAM: PF00096
TF Group: Zinc-Coordinating Group
Description: The C2H2 zinc finger is the classical zinc finger domain. The two conserved cysteines and histidines co-ordinate a zinc ion. The following pattern describes the zinc finger. #-X-C-X(1-5)-C-X3-#-X5-#-X2-H-X(3-6)-[H/C] Where X can be any amino acid, and numbers in brackets indicate the number of residues. The positions marked # are those that are important for the stable fold of the zinc finger. The final position can be either his or cys. The C2H2 zinc finger is composed of two short beta strands followed by an alpha helix. The amino terminal part of the helix binds the major groove in DNA binding zinc fingers. The accepted consensus binding sequence for Sp1 is usually defined by the asymmetric hexanucleotide core GGGCGG but this sequence does not include, among others, the GAG (=CTC) repeat that constitutes a high-affinity site for Sp1 binding to the wt1 promoter [1].
Hmmscan Out: # of c-Evalue i-Evalue score bias hmm coord from hmm coord to ali coord from ali coord to env coord from env coord to acc

1 43 2.4 7.8e+02 4.0 1.3 1 23 289 312 289 312 0.97

2 43 0.51 1.7e+02 6.1 0.4 2 23 319 340 318 340 0.96

3 43 0.29 96 6.9 8.5 1 23 346 368 346 368 0.98

4 43 0.01 3.3 11.5 3.9 2 23 375 396 374 396 0.97

5 43 1.2 4e+02 4.9 7.4 1 23 402 424 402 424 0.98

6 43 0.039 13 9.6 4.7 1 23 430 452 430 452 0.98

7 43 9.9 3.2e+03 2.1 1.2 1 23 458 480 458 480 0.86

8 43 0.00045 0.15 15.7 0.8 2 23 486 507 485 507 0.97

9 43 0.051 17 9.3 0.5 1 23 513 535 513 535 0.97

10 43 0.0074 2.4 11.9 1.2 1 23 541 563 541 563 0.97

11 43 0.00076 0.25 15.0 1.1 1 23 569 591 569 591 0.97

12 43 0.00012 0.04 17.5 0.7 1 23 597 619 597 619 0.98

13 43 0.36 1.2e+02 6.6 3.3 1 23 625 648 625 648 0.96

14 43 1.4 4.4e+02 4.8 2.0 1 23 654 676 654 676 0.96

15 43 0.017 5.5 10.8 0.7 1 23 726 749 726 749 0.97

16 43 0.25 82 7.1 0.3 2 23 756 777 755 777 0.97

17 43 0.17 56 7.6 8.7 1 23 783 805 783 805 0.99

18 43 0.014 4.7 11.0 4.0 2 23 812 833 811 833 0.97

19 43 0.3 98 6.8 3.2 1 23 839 861 839 861 0.98

20 43 0.096 32 8.4 5.0 1 23 867 889 867 889 0.98

21 43 4.9 1.6e+03 3.0 1.0 1 23 895 917 895 917 0.87

22 43 0.0048 1.6 12.5 0.9 2 23 923 944 922 944 0.95

23 43 0.0014 0.45 14.2 1.3 1 23 950 972 950 972 0.97

24 43 0.035 12 9.8 3.9 1 23 978 1000 978 1000 0.97

25 43 0.0023 0.74 13.5 1.5 1 23 1006 1028 1006 1028 0.96

26 43 0.00026 0.084 16.5 0.2 1 23 1034 1056 1034 1056 0.98

27 43 0.033 11 9.8 2.7 1 23 1062 1085 1062 1085 0.96

28 43 1.4 4.4e+02 4.8 2.0 1 23 1091 1113 1091 1113 0.96

29 43 0.0026 0.86 13.3 0.9 1 23 1158 1181 1158 1181 0.97

30 43 0.12 38 8.1 0.4 2 23 1188 1209 1187 1209 0.97

31 43 0.025 8.3 10.2 2.8 1 23 1215 1237 1215 1237 0.99

32 43 0.02 6.4 10.6 3.2 2 23 1244 1265 1243 1265 0.97

33 43 0.041 14 9.5 5.6 1 23 1271 1293 1271 1294 0.96

34 43 0.047 16 9.4 5.6 1 23 1299 1321 1299 1321 0.98

35 43 2.9 9.5e+02 3.7 0.7 1 23 1327 1349 1327 1349 0.88

36 43 0.11 36 8.2 3.3 2 23 1355 1376 1354 1376 0.95

37 43 0.0011 0.36 14.5 1.9 1 23 1382 1404 1382 1404 0.97

38 43 0.29 94 6.9 6.4 1 23 1410 1432 1410 1432 0.91

39 43 0.34 1.1e+02 6.6 0.6 1 23 1447 1469 1447 1469 0.95

40 43 0.017 5.6 10.8 1.5 1 23 1475 1497 1475 1497 0.94

41 43 0.13 43 8.0 2.6 1 23 1503 1526 1503 1526 0.96

42 43 4.1 1.3e+03 3.3 2.8 1 23 1532 1554 1532 1554 0.97

43 43 0.03 9.7 10.0 3.0 1 22 1560 1581 1560 1581 0.97

#	of	c-Evalue	i-Evalue	score	bias	hmm coord from	hmm coord to	ali coord from	ali coord to	env coord from	env coord to	acc
1	43	2.4	7.8e+02	4.0	1.3	1	23	289	312	289	312	0.97
2	43	0.51	1.7e+02	6.1	0.4	2	23	319	340	318	340	0.96
3	43	0.29	96	6.9	8.5	1	23	346	368	346	368	0.98
4	43	0.01	3.3	11.5	3.9	2	23	375	396	374	396	0.97
5	43	1.2	4e+02	4.9	7.4	1	23	402	424	402	424	0.98
6	43	0.039	13	9.6	4.7	1	23	430	452	430	452	0.98
7	43	9.9	3.2e+03	2.1	1.2	1	23	458	480	458	480	0.86
8	43	0.00045	0.15	15.7	0.8	2	23	486	507	485	507	0.97
9	43	0.051	17	9.3	0.5	1	23	513	535	513	535	0.97
10	43	0.0074	2.4	11.9	1.2	1	23	541	563	541	563	0.97
11	43	0.00076	0.25	15.0	1.1	1	23	569	591	569	591	0.97
12	43	0.00012	0.04	17.5	0.7	1	23	597	619	597	619	0.98
13	43	0.36	1.2e+02	6.6	3.3	1	23	625	648	625	648	0.96
14	43	1.4	4.4e+02	4.8	2.0	1	23	654	676	654	676	0.96
15	43	0.017	5.5	10.8	0.7	1	23	726	749	726	749	0.97
16	43	0.25	82	7.1	0.3	2	23	756	777	755	777	0.97
17	43	0.17	56	7.6	8.7	1	23	783	805	783	805	0.99
18	43	0.014	4.7	11.0	4.0	2	23	812	833	811	833	0.97
19	43	0.3	98	6.8	3.2	1	23	839	861	839	861	0.98
20	43	0.096	32	8.4	5.0	1	23	867	889	867	889	0.98
21	43	4.9	1.6e+03	3.0	1.0	1	23	895	917	895	917	0.87
22	43	0.0048	1.6	12.5	0.9	2	23	923	944	922	944	0.95
23	43	0.0014	0.45	14.2	1.3	1	23	950	972	950	972	0.97
24	43	0.035	12	9.8	3.9	1	23	978	1000	978	1000	0.97
25	43	0.0023	0.74	13.5	1.5	1	23	1006	1028	1006	1028	0.96
26	43	0.00026	0.084	16.5	0.2	1	23	1034	1056	1034	1056	0.98
27	43	0.033	11	9.8	2.7	1	23	1062	1085	1062	1085	0.96
28	43	1.4	4.4e+02	4.8	2.0	1	23	1091	1113	1091	1113	0.96
29	43	0.0026	0.86	13.3	0.9	1	23	1158	1181	1158	1181	0.97
30	43	0.12	38	8.1	0.4	2	23	1188	1209	1187	1209	0.97
31	43	0.025	8.3	10.2	2.8	1	23	1215	1237	1215	1237	0.99
32	43	0.02	6.4	10.6	3.2	2	23	1244	1265	1243	1265	0.97
33	43	0.041	14	9.5	5.6	1	23	1271	1293	1271	1294	0.96
34	43	0.047	16	9.4	5.6	1	23	1299	1321	1299	1321	0.98
35	43	2.9	9.5e+02	3.7	0.7	1	23	1327	1349	1327	1349	0.88
36	43	0.11	36	8.2	3.3	2	23	1355	1376	1354	1376	0.95
37	43	0.0011	0.36	14.5	1.9	1	23	1382	1404	1382	1404	0.97
38	43	0.29	94	6.9	6.4	1	23	1410	1432	1410	1432	0.91
39	43	0.34	1.1e+02	6.6	0.6	1	23	1447	1469	1447	1469	0.95
40	43	0.017	5.6	10.8	1.5	1	23	1475	1497	1475	1497	0.94
41	43	0.13	43	8.0	2.6	1	23	1503	1526	1503	1526	0.96
42	43	4.1	1.3e+03	3.3	2.8	1	23	1532	1554	1532	1554	0.97
43	43	0.03	9.7	10.0	3.0	1	22	1560	1581	1560	1581	0.97

Sequence Information

Coding Sequence: ATGGTGCGCAATTATGAACGCAAAAGACCGCCAAATAAGAACTATGACATGGACAGTTTACAACATGCGATGCGACAAGTCCGTACCAAAAGAACGACGATGTATAGAGCTTCAAAAACATTCAAAGTACCTTTCAGTACCCTATACAGCCGTGTAAAAGGTTTACGTGTGGTAAAAAGCACCACCAAAGTTCGAACAACTGCGTTTTCGCAGTTAGAAGAACGTAAGCTAGTATTAGGGCTCACAACACTAGAAAAATGGGGTTTTGGGTTGAGCCGCAAAGACACCTTAATATCAAAACTCCATTCAAAGATAATGCTTAGCTTAAAGGTTCCACAAGCTGTCGAATTTGCGAGGAAAAAAGCAACAGCTCCTGCCAACAAAAAAGAAGGCGATGCTTCTACTACTGCATCTATTTCTACCAATGATGTGGTATCATTTGAGTCTCTTCTACTTTCCACGGTTAAACAAAAGAAACCTTGTGAGAAGTATCCAAAGAAGAGAGTAGCAGCAGGTGCTGAGATTATAAGTCGAGAAATTCTTTGCATGAAGACCGATATTGTTGCATCCTCAAAGAAAAGAAGACAACAAGCAGATAGTTCTTCTGAAGATGATGGGTCAGTAGTTTTGTCATTTCGCGATTCTGACAGTGACAAAGAGTTTCTAGAAAACTTAAGAAATCCGTCTCCAGAAATTAGTGATGTTCAACAGGTTTCAGAATTCGGCAAATGgcAGTGCATATTATTAGCTCCGGAAGAAGAAACACTACTCTCAACTAAATTAAATAGGCAGCCATATGTACAAAAAGAAACTCCCATATTGAGAGCGACTCCTGTGCATAATCAAGATGAAGAAGACAAAAGATTTGAATGTTTTTTGTGCGAACACGTCACGAACGGGAAAACTCGTTTGGACGCTCACTACCGAAGTGATCATTTTATAGATGGAAAACTTAAGTGCCCGCAGTGCGAATATGAGTCTGATCGCAGAACCATTCTGAAACTGCACATGATTAAACATCTAGGCGTTAAACGGTTCAAGTGTTTGCAATGTGATTTCTCAACGCGTTTCAAGCACTGCCTCAGGAGACATTTAAACAACCACGAAACGGTGAAGAGTCTTAAGTGTTCGCAATGTGAGTACACGACAAAAAGCAAGGATTGCCTTCGGAATCATCTTGATACTCATGTGACGGTGAAACGATTTAAATGTACGCAATGTGACTACACAACACATCGCGGATTCCATTTTAAGAACCATTTAGCTAAGCACGACGCGGTAAAGCCATACTCATGTTCAAAATGCGACTTTGTGACGCATTCACAGCGGTATCTTCGAAATCATTTATATACGCACGAGACGGTGCGAAGATTCGAATGCCCCCAATGTGATTACTTGGCGAAATGTAGGAGATCTCTCGCAAAACACGTCTCCTTGCACAAGACGAAAGATTTAAAATGTCCGGTATGCGACTATGTGacaaacaataaatattatttgaaaatgcATTCCAACACTCACGATACTGTGAAACGGTTTAAGTGTTCGGAATGTGACTTCGCTACCACCAGTAAAGAGATTCTCAAATCTCATGTTGCTAGACACACTACCGAGAAATCGTTCAAATGTCCGTTATGCGACTACGTGACGTACGAGAAACGTTATTTGGAACGACATTCTAGTAGCCACGAAGCTGTGAGACGCTTTAAATGTTCAGAATGTGACTACGCGGCAACTAGCAGTCGTAATCTTAGAAAGCATTCCATCAAGCACAACACTGATAAATCGTTTAAATGTGCCGAATGTGATTACGTGACGAATCGTAAAGATTATCTTACACAGCACGTCAAAATACACGCAAGTGTGATGGAATTTAAGTGCACCGAATGCGAGTACGCCACGCACATCAAATCTCGTTTTAAAAGGCATATGCTTGAAACGCACGAGACTGTAAAACGATTTAAATGTTCCCAATGTGCTTATGCGACGAATATTAAGGGTAAACTTACAAGACATTCTCATGTTCATGACGCCGCTAAACCgcAGTGCATATTATTAGCTCCGGAAGAAGAAACACTACTTTCAACTAAATTAAATAGGCAGTCATTTGATCAAAAAAAAACTACGATTTTGAGAGCGGCGACTGTGCATAATCAAGATGAAGGAGACAAGAGATTTGAATGTTTTTTGTGCGAATACGTCACAAACCGCAAAACTCTTTTGGACGCTCACTACCGAAGTGATCATTTTATAGACGGAAAACTTAAGTGCCCGCAATGCGAATATGAGTCTGATCGCAGAGACATTCTTAAACTGCACATGATTAAACATCTAGGCGTTAAACGGTTCAAGTGTTTGCAATGTGATTTCTCAACTCGTTTCAAGCACTGCCTCAGGAGACATTTAAGCACACATGAGACGGTGAAGAGTCTTAAATGTACGCAATGTGAGTATAGAACAAAACGCAAGGATTGCCTTAAGAGTCATCTTTTAGTCCATGAGACGGCGAAGCGATTTAAATGTTCGCAATGTGACTACACAACACATCGCGGAATCGATTTTAAGAACCACTTAGCCAAGCACGACGCAGTGAAGCCATACTCATGTTCAAAATGCGACTTTGTGACGCATTCACAAAGGTATCTTCGAAATCATTTATATAAACACGAGACGGTGCGACGATTCGAATGCCCCCAATGTGATTACATGGCGATATGTAGGCGATCTCTCGCGAAACACGTCTTCTTGCACAAGCCGAAAGATTTAAAGTGTCCGTTATGCGACTACGTGacaaacaataaatattatttgaaaatgcATTCCACCAGTCACGATATTGTGAAACGGTTTAAGTGTTCTGAATGTGACTTCGCTACGAACAGTAAAGAGAATCTCAGATCTCATTTTGCTAGACACACTACCGATAAATCGTTCAAATGTCCGTTATGCGACTACGTGACGTACAAGAAATGTTATTTGGAACGGCATTCTAGTAGTCACGAAGCTGTGAGATGCTTTAAATGTTCAGAATGCGACTACGCGGCAACCACCAGTCGTAATCTTAAAAGTCATTCCACCAAGCACAACACTGATAAATCGTTTAAATGTGCCGAATGTGACTACGTGACGAATCGCAAAGACTATCTTATAATACACGTCAAGATACACGCAAGTGCGATGGAATTCAAGTGTGCCGAATGCGAATACGCCACACACAACAAATCTCGTTTTAAAAGGCATATGCTTGAAATGCACGAGACTGTAAAACGATTTAAATGTTCCCAATGTGCTTATGCGACGAATATTAAGGGCAAACTTACAAGACATTCTCATGTTCATGACGCCATTAAACCgCAGTGCATACTATTAGCTCCGAAAGAAGAAACACTACTTTCAActaaattaaatcaaaaagaaaCTCCGATTTTGAGAGCGGCTACTGTGCATAATCAAGATGAAGAAGACAAGAGATTTGAATGTTTTTTGTGCGAATACGTCACAAACCGCAAAACTCTTTTGAACGCTCACTACCGAAGTGATCATTATATAGACGGAAAACTTAAGTGCCCGCAGTGCGAATATGAGTCTGATCGCAGAGACATTCTTAAACAGCACATGATTAAACATCTAGGCGTTAAACGGTTCAAGTGTTTGCAATGTGATTTCACAACTAATTTCACGCGCGGACTCAGGAGACATTTAAACACACACGAGACGGTGAAGAGTCTTAAATGTACGCAATGTGAGTACACAACAAAGCAAAAGGATTGCCTTAACTATCATCTTTTAGTCCATGAGACGGCGAAGCGATTTAAATGTTCGCAGTGTGACTACACAACACATCGCAAAGACGTTCTTAAGAACCATTTAGCTAAGCACCACGCGGTAAAGCCATACTCATGTTCAAAATGCGACTTTGTGACGCATTCAGAAAGGAATCTTCGAAATCATTTACATACGCACGAGACGGTGCGACGATTCGAATGCCCCCAATGTGATTACGTGGCGATATGTAGGCGATCTCTCGCAAAACACGTCTTCTTGCACAAGCCGAAAGATTTAAAGTGTCCGTTATGCGACTATGTGACGAACAAGAAGTATTGTTTGAAATTACATTTCACCAGTCACGATGCTGTGAAACGGTTTAAGTGTTCCGAATGTGACTTTGCTACGACCAACAAACAGAATCTCAGATCTCATTTTGCTAGGCACACTACCGATAAATCGTTCAAATGTCCGTTATGCGACTACGTGACGTACAGGAAATGTTATTTGGAACGGCATTGTAGTAGTCACGAAGCTGTGAGATGTTCTAGTAGTCATGAAGCTGTGAGGCGCTTTAAATGTTCAGAATGCGACTACGCGGCAACCACCAGTCGTATTCTTAAAAGTCATTCTATCAAGCACAACACTGATAAATCGTTTAAATGTGCCGAATGTGACTACGTGACGAATCGCAAAGACTATCTTGCAATACACTGCAAAATACACGCAAGTGCGATGGAATTTAAGTGTGCCGAATGCGTATACGCCACACACAACAAATCTCGTTTTAAAAGGCATATGCTTGAAATGCACGAGACTGTAAAACGATTTAAATGTTCCCAATGTGCTTATGCGACGAATATTAAGTGCAAACTTACAAGACATTCTCTTGTTCATGACGCCATTAAACCGTTTAAATGTTCGCGATGTGAATTTGAAACCAAATATAAAAGTAGTCTGAAAACACATCAAAAGACATGTATCTAA
Protein Sequence: MVRNYERKRPPNKNYDMDSLQHAMRQVRTKRTTMYRASKTFKVPFSTLYSRVKGLRVVKSTTKVRTTAFSQLEERKLVLGLTTLEKWGFGLSRKDTLISKLHSKIMLSLKVPQAVEFARKKATAPANKKEGDASTTASISTNDVVSFESLLLSTVKQKKPCEKYPKKRVAAGAEIISREILCMKTDIVASSKKRRQQADSSSEDDGSVVLSFRDSDSDKEFLENLRNPSPEISDVQQVSEFGKWQCILLAPEEETLLSTKLNRQPYVQKETPILRATPVHNQDEEDKRFECFLCEHVTNGKTRLDAHYRSDHFIDGKLKCPQCEYESDRRTILKLHMIKHLGVKRFKCLQCDFSTRFKHCLRRHLNNHETVKSLKCSQCEYTTKSKDCLRNHLDTHVTVKRFKCTQCDYTTHRGFHFKNHLAKHDAVKPYSCSKCDFVTHSQRYLRNHLYTHETVRRFECPQCDYLAKCRRSLAKHVSLHKTKDLKCPVCDYVTNNKYYLKMHSNTHDTVKRFKCSECDFATTSKEILKSHVARHTTEKSFKCPLCDYVTYEKRYLERHSSSHEAVRRFKCSECDYAATSSRNLRKHSIKHNTDKSFKCAECDYVTNRKDYLTQHVKIHASVMEFKCTECEYATHIKSRFKRHMLETHETVKRFKCSQCAYATNIKGKLTRHSHVHDAAKPQCILLAPEEETLLSTKLNRQSFDQKKTTILRAATVHNQDEGDKRFECFLCEYVTNRKTLLDAHYRSDHFIDGKLKCPQCEYESDRRDILKLHMIKHLGVKRFKCLQCDFSTRFKHCLRRHLSTHETVKSLKCTQCEYRTKRKDCLKSHLLVHETAKRFKCSQCDYTTHRGIDFKNHLAKHDAVKPYSCSKCDFVTHSQRYLRNHLYKHETVRRFECPQCDYMAICRRSLAKHVFLHKPKDLKCPLCDYVTNNKYYLKMHSTSHDIVKRFKCSECDFATNSKENLRSHFARHTTDKSFKCPLCDYVTYKKCYLERHSSSHEAVRCFKCSECDYAATTSRNLKSHSTKHNTDKSFKCAECDYVTNRKDYLIIHVKIHASAMEFKCAECEYATHNKSRFKRHMLEMHETVKRFKCSQCAYATNIKGKLTRHSHVHDAIKPQCILLAPKEETLLSTKLNQKETPILRAATVHNQDEEDKRFECFLCEYVTNRKTLLNAHYRSDHYIDGKLKCPQCEYESDRRDILKQHMIKHLGVKRFKCLQCDFTTNFTRGLRRHLNTHETVKSLKCTQCEYTTKQKDCLNYHLLVHETAKRFKCSQCDYTTHRKDVLKNHLAKHHAVKPYSCSKCDFVTHSERNLRNHLHTHETVRRFECPQCDYVAICRRSLAKHVFLHKPKDLKCPLCDYVTNKKYCLKLHFTSHDAVKRFKCSECDFATTNKQNLRSHFARHTTDKSFKCPLCDYVTYRKCYLERHCSSHEAVRCSSSHEAVRRFKCSECDYAATTSRILKSHSIKHNTDKSFKCAECDYVTNRKDYLAIHCKIHASAMEFKCAECVYATHNKSRFKRHMLEMHETVKRFKCSQCAYATNIKCKLTRHSLVHDAIKPFKCSRCEFETKYKSSLKTHQKTCI

Similar Transcription Factors

Sequence clustering based on sequence similarity using MMseqs2

100% Identity: -
90% Identity: -
80% Identity: -