Basic Information

Insect: Topomyia yanbarensis
Gene Symbol: -
Assembly: GCA_030247195.1
Location: CM058068.1:201458252-201480698[-]

Transcription Factor Domain

TF Family: zf-C2H2
Domain: zf-C2H2 domain
PFAM: PF00096
TF Group: Zinc-Coordinating Group
Description: The C2H2 zinc finger is the classical zinc finger domain. The two conserved cysteines and histidines co-ordinate a zinc ion. The following pattern describes the zinc finger. #-X-C-X(1-5)-C-X3-#-X5-#-X2-H-X(3-6)-[H/C] Where X can be any amino acid, and numbers in brackets indicate the number of residues. The positions marked # are those that are important for the stable fold of the zinc finger. The final position can be either his or cys. The C2H2 zinc finger is composed of two short beta strands followed by an alpha helix. The amino terminal part of the helix binds the major groove in DNA binding zinc fingers. The accepted consensus binding sequence for Sp1 is usually defined by the asymmetric hexanucleotide core GGGCGG but this sequence does not include, among others, the GAG (=CTC) repeat that constitutes a high-affinity site for Sp1 binding to the wt1 promoter [1].
Hmmscan Out: # of c-Evalue i-Evalue score bias hmm coord from hmm coord to ali coord from ali coord to env coord from env coord to acc

1 49 0.0043 0.43 13.1 0.6 2 23 47 70 47 70 0.92

2 49 1.2e-05 0.0013 21.1 0.5 1 23 76 98 76 98 0.97

3 49 0.00014 0.014 17.8 1.9 1 23 104 126 104 126 0.98

4 49 2.7e-06 0.00028 23.2 0.8 1 23 132 154 132 154 0.99

5 49 0.00012 0.013 18.0 1.4 1 23 160 182 160 182 0.98

6 49 0.043 4.4 10.0 0.1 1 23 188 210 188 210 0.98

7 49 0.022 2.2 10.9 2.5 1 21 216 236 216 238 0.95

8 49 0.0049 0.5 12.9 6.5 1 21 244 264 244 266 0.95

9 49 6.6 6.7e+02 3.1 5.9 1 21 272 292 272 294 0.96

10 49 0.005 0.51 12.9 0.1 1 23 302 324 302 324 0.94

11 49 0.00063 0.065 15.7 1.3 2 23 343 364 342 364 0.98

12 49 0.0018 0.18 14.3 1.6 1 23 370 392 370 392 0.98

13 49 0.073 7.4 9.2 1.0 1 21 398 418 398 419 0.91

14 49 0.00035 0.036 16.5 2.1 1 23 426 448 426 448 0.99

15 49 0.0012 0.12 14.9 1.8 1 23 454 476 454 476 0.98

16 49 6.7e-05 0.0068 18.8 0.1 1 23 482 504 482 504 0.97

17 49 0.00055 0.056 15.9 0.6 3 23 512 532 510 532 0.94

18 49 3e-06 0.00031 23.0 0.6 1 23 538 560 538 560 0.98

19 49 2.3e-05 0.0023 20.3 4.0 1 23 566 588 566 588 0.98

20 49 2e-05 0.002 20.5 0.4 1 23 594 616 594 616 0.99

21 49 0.00033 0.034 16.6 0.3 1 23 624 646 624 646 0.97

22 49 0.05 5 9.8 1.1 1 23 652 675 652 675 0.95

23 49 9.9e-05 0.01 18.3 0.9 1 23 680 702 680 702 0.99

24 49 4.4e-06 0.00045 22.5 1.9 1 23 708 731 708 731 0.97

25 49 9e-05 0.0092 18.4 1.9 1 23 765 787 765 787 0.98

26 49 0.00027 0.027 16.9 6.0 1 23 793 815 793 815 0.98

27 49 1e-06 0.00011 24.5 2.1 1 23 821 843 821 843 0.99

28 49 4.7e-06 0.00048 22.4 1.0 1 23 849 871 849 871 0.98

29 49 0.018 1.9 11.1 0.1 3 23 879 899 877 899 0.96

30 49 0.0017 0.18 14.4 2.8 1 21 906 926 906 928 0.95

31 49 0.0047 0.47 13.0 6.6 1 21 934 954 934 956 0.96

32 49 1.6e-05 0.0017 20.7 0.2 1 23 962 984 962 984 0.99

33 49 0.0022 0.23 14.0 0.0 1 23 992 1014 992 1014 0.95

34 49 0.071 7.3 9.3 0.9 2 23 1021 1043 1021 1043 0.95

35 49 8e-07 8.2e-05 24.8 0.5 1 23 1048 1070 1048 1070 0.99

36 49 6.1e-06 0.00062 22.1 1.2 2 23 1077 1099 1076 1099 0.96

37 49 2.6e-05 0.0027 20.1 0.8 2 23 1134 1156 1133 1156 0.97

38 49 2.7e-06 0.00027 23.2 1.3 1 23 1156 1178 1156 1178 0.98

39 49 0.5 51 6.6 3.6 1 23 1184 1206 1184 1206 0.90

40 49 4.8e-05 0.0049 19.3 1.3 1 23 1212 1234 1212 1234 0.99

41 49 0.00019 0.019 17.4 3.5 1 23 1240 1262 1240 1262 0.97

42 49 0.035 3.5 10.3 0.8 1 23 1268 1290 1268 1290 0.95

43 49 0.0011 0.11 15.0 1.7 1 21 1297 1317 1297 1319 0.95

44 49 0.0087 0.89 12.1 7.5 1 23 1325 1347 1325 1347 0.97

45 49 0.016 1.6 11.3 0.6 1 21 1353 1373 1353 1375 0.95

46 49 0.00094 0.096 15.2 0.1 1 23 1383 1405 1383 1405 0.94

47 49 0.0018 0.18 14.3 1.2 1 23 1411 1434 1411 1434 0.96

48 49 0.00059 0.06 15.8 2.4 1 23 1439 1461 1439 1461 0.98

49 49 2.4e-06 0.00024 23.4 0.2 2 23 1468 1490 1467 1490 0.95

#	of	c-Evalue	i-Evalue	score	bias	hmm coord from	hmm coord to	ali coord from	ali coord to	env coord from	env coord to	acc
1	49	0.0043	0.43	13.1	0.6	2	23	47	70	47	70	0.92
2	49	1.2e-05	0.0013	21.1	0.5	1	23	76	98	76	98	0.97
3	49	0.00014	0.014	17.8	1.9	1	23	104	126	104	126	0.98
4	49	2.7e-06	0.00028	23.2	0.8	1	23	132	154	132	154	0.99
5	49	0.00012	0.013	18.0	1.4	1	23	160	182	160	182	0.98
6	49	0.043	4.4	10.0	0.1	1	23	188	210	188	210	0.98
7	49	0.022	2.2	10.9	2.5	1	21	216	236	216	238	0.95
8	49	0.0049	0.5	12.9	6.5	1	21	244	264	244	266	0.95
9	49	6.6	6.7e+02	3.1	5.9	1	21	272	292	272	294	0.96
10	49	0.005	0.51	12.9	0.1	1	23	302	324	302	324	0.94
11	49	0.00063	0.065	15.7	1.3	2	23	343	364	342	364	0.98
12	49	0.0018	0.18	14.3	1.6	1	23	370	392	370	392	0.98
13	49	0.073	7.4	9.2	1.0	1	21	398	418	398	419	0.91
14	49	0.00035	0.036	16.5	2.1	1	23	426	448	426	448	0.99
15	49	0.0012	0.12	14.9	1.8	1	23	454	476	454	476	0.98
16	49	6.7e-05	0.0068	18.8	0.1	1	23	482	504	482	504	0.97
17	49	0.00055	0.056	15.9	0.6	3	23	512	532	510	532	0.94
18	49	3e-06	0.00031	23.0	0.6	1	23	538	560	538	560	0.98
19	49	2.3e-05	0.0023	20.3	4.0	1	23	566	588	566	588	0.98
20	49	2e-05	0.002	20.5	0.4	1	23	594	616	594	616	0.99
21	49	0.00033	0.034	16.6	0.3	1	23	624	646	624	646	0.97
22	49	0.05	5	9.8	1.1	1	23	652	675	652	675	0.95
23	49	9.9e-05	0.01	18.3	0.9	1	23	680	702	680	702	0.99
24	49	4.4e-06	0.00045	22.5	1.9	1	23	708	731	708	731	0.97
25	49	9e-05	0.0092	18.4	1.9	1	23	765	787	765	787	0.98
26	49	0.00027	0.027	16.9	6.0	1	23	793	815	793	815	0.98
27	49	1e-06	0.00011	24.5	2.1	1	23	821	843	821	843	0.99
28	49	4.7e-06	0.00048	22.4	1.0	1	23	849	871	849	871	0.98
29	49	0.018	1.9	11.1	0.1	3	23	879	899	877	899	0.96
30	49	0.0017	0.18	14.4	2.8	1	21	906	926	906	928	0.95
31	49	0.0047	0.47	13.0	6.6	1	21	934	954	934	956	0.96
32	49	1.6e-05	0.0017	20.7	0.2	1	23	962	984	962	984	0.99
33	49	0.0022	0.23	14.0	0.0	1	23	992	1014	992	1014	0.95
34	49	0.071	7.3	9.3	0.9	2	23	1021	1043	1021	1043	0.95
35	49	8e-07	8.2e-05	24.8	0.5	1	23	1048	1070	1048	1070	0.99
36	49	6.1e-06	0.00062	22.1	1.2	2	23	1077	1099	1076	1099	0.96
37	49	2.6e-05	0.0027	20.1	0.8	2	23	1134	1156	1133	1156	0.97
38	49	2.7e-06	0.00027	23.2	1.3	1	23	1156	1178	1156	1178	0.98
39	49	0.5	51	6.6	3.6	1	23	1184	1206	1184	1206	0.90
40	49	4.8e-05	0.0049	19.3	1.3	1	23	1212	1234	1212	1234	0.99
41	49	0.00019	0.019	17.4	3.5	1	23	1240	1262	1240	1262	0.97
42	49	0.035	3.5	10.3	0.8	1	23	1268	1290	1268	1290	0.95
43	49	0.0011	0.11	15.0	1.7	1	21	1297	1317	1297	1319	0.95
44	49	0.0087	0.89	12.1	7.5	1	23	1325	1347	1325	1347	0.97
45	49	0.016	1.6	11.3	0.6	1	21	1353	1373	1353	1375	0.95
46	49	0.00094	0.096	15.2	0.1	1	23	1383	1405	1383	1405	0.94
47	49	0.0018	0.18	14.3	1.2	1	23	1411	1434	1411	1434	0.96
48	49	0.00059	0.06	15.8	2.4	1	23	1439	1461	1439	1461	0.98
49	49	2.4e-06	0.00024	23.4	0.2	2	23	1468	1490	1467	1490	0.95

Sequence Information

Coding Sequence: atgcgtcctCCCCACGCACACCTAATGCCCCGTGGATTAATTCCCTGGTTGGTCAAACAAGCACCAAATAAGCATAGAAATTACTCTGCTCTGTCCAAAGCAATCTATTCCTATGATAATACCGGTCTCAAAAAGCCCAAATGCTACATTTGCGATCGACAATTTGCTGAACTGCGCTACCTAAAACTGCACATGCGATCAACAGCCCACGCCGAAAAAGTTTCCCATCCGTGCGACATTTGCGGGAAAATCATTGCGCGGAAGGACTCACTCGAAAGACACCGAAGAACGCATACCGGCGAACGACCCTTTTCTTGCGAAATATGTGGCAAAAGTTTCCCATGCAAACGCTCGCTGGTCAACCATATGCGATTGCATACTGGAAATCACAACTACAGGTGCGATGTTTGTGACAAAGGATACAGTTCAAGGAGTAAGCTCATGATCCACTTGAGGACCCATACAGGCGAGCGTCCGTACAAATGTGAGCTATGTGAAAAAAGTTTCGCTAGTCAGTTGTACCTGAGAAATCATACGCTAAGACATGAGGAAAATCACGAGTTCAGCTGTGGCGTTTGTGGCAAAGGATGTGGTACGGGAGCTCTACTTGCGATTCACGAGAAAACCCACAGCACCGAACGTCCATACAAATGTGACATTTGCGGCAAGGAATTTTTCGCTATTGGACAGTTCAATCGGCATCTGAAGTGTCATAATGACGAACGTCTGCATCGGTGTACTGTTTGCACTAAAGAATTCAAAAACAATCAGCACCTCGTCGTACACATGCGCTGTCACACTGGTGAACGGCCATACAAATGTGAAGTTTGCTGTTCTTCGTTCAGGTTTTCTAACAACCTGGTAGAGCACATGAAATGTCACTTAGACGTagcgtcaagaccattccaatgTGGCGTATGCGGAGCAAAATTTAGTCTGCAAAGAACGCTTACCGCACACAGTGTGGTTCATGGCCATTCCGACGACCAGCCGGATCGCGATGGTACCGGTCTCGAAAAGCCCACCAAATGCGACATTTGCGATCGACTAATCACTAAACTAGGAAACTTCAAAAGACACATGCGAACTCACACCGAGAATACAGCCCACCGGTGCGACATTTGCGGAAAAACCCTTAAGTGGAGGGACTCACTCGAAAGTCATAGAAGAATGCATACCGGCGAACGGCCGTTTCGTTGCGAAATATGTGGCAAAGGTTTCGCCTGTAAACGCACTCTGAACGGACATACGAAATTGAATGCTGGAAATCACGACTACAAGTGCGATGTTTGTGGCAAAGCATACAGTCCAAAGTGTAAGTTTGTGGACCACATGAAATCCCATGCAGGAGAGCGTCCGTACGAATGTGacatatgtggaaaaaaatttgcTAGCCAGTGCATCCTGAGAAATCATACGCTAAGACATACAGAAAATTATGAATTCAGCTGCGATGTTTGTGGCAAAGGATTTGCTACAAGAGGCAGCCTTGTGAATCACGGGAAATCGCATAGCACCGGGCGCCCACTCGCATGTGACATATGTGGCAAAACCTTCTACAATAACCAGACgctgcggtatcacagtgacaGGCATATGACGGAACATCCTTTCAAATGTAACATTTGTGGCAAGGGATTCTCTTTCCTTGGTCAGCTCAATAAGCATTGGAAGATTCATAATGCCCCACGTCTCCATCGGTGTAATGTTTGCAACAAAGAGTTCAGAACTAAGTTTCTGCTTGTCACACACATGCGGTCTCACACTGATGAACGGCCATACAAATGTGAAATTTGCGGTTCTTCGTTTAGGACTTCTACTACACTGGTTGGGCACATGAAAATTCACGCAAATCTAGCATCAAACCCGTTCGAATGTGACGTATGCGGAGCAAAGTTTAGCCAACAAAGAACTCTTAGCATTCACAGTAAAGTTCATCGGAAGACACCGTGCCATGAATGTCCTAATTGTAACAAACAATTTCTCGCCTCTAGAGACCTGAACAGGCACAGAGTTACCGTTCACAATGATCGACCGTACAAATGTACGATCTGTGACATAACGACCACTACCATGCAGAACTTGCGGTCACATTTGAAAGTTCACTATGGCGCGATTCGGCACAAATGTCACATTTGTGGGAAGAGTTACGCAAGGAAATCCGGTCTTAATGATCACGTCAAAGTAGTGCACGCTCAAGATAAACGCCTCCACTCCGACCACGAGCTGGATGGTGATGGTAGCGAACTAGAAAAACGGCACATGGGAACCACTAACCACGAAAAAGCTTCTCACCGGTGCGACATTTGTGGGAAAAGCTTTGAGAAACCATACGTCTACGTAAGACATAGAAGAATGCATACCGGCGAACGACCGTTTTCATGCGTAATATGTGGCAAATGTTTCACATGCCAATCCTATCTGCGCAATCATATGAGATTGCATACCGAAAATCACATCTACAAGTGCGATGTTTGCGGCAAAGGTTACAGTTCAAAGTCTAAGTTCACGACCCACATGAGATCCCATACAGGCGAGCGTCCGTACAAATGTGACATATGTGGAAAAAGTTTTGCTAGTCAGTTGTATCTGAGAAATCATACGCTAAGACATGAGGAAAATTACGAGTTCGGCTGTGATTTTTGTGGCAAAGGATTTGGTACAAGAGCTAAGCTTGCGGTTCACGAGGAAATCCACAGCACCACCGAGCGCCCATTCAAATGTAACATTTGCGACAAGGGATTTTCCTTTATTGGACAGCTCAATCAGCATCTGAAATGTCATAACGACGAACGTCTGTATCGGTGTAATGTTTGCAACAAAGAGTTCAGAATTAATCACCATCTCATCTCACACATGCGTTGTCACACTGCCGAGCGACCATACAAATGTGAAGTTTGCGGTTCTTCGTTCAGGTTCGCCAGTAACCTGGTAGGGCACATGAAAGTTCACTTGAACCTAGCATCAAAACCGTTCGAATGTGACATATGCGGGGCAAAATTCAGTGCGCAAGGAACCCTCACCGCTCACAGTGATGTTCATCGGCAGGGACAGGCGGCTGAATGCTTTACATGTGATAAACAGTTTCTCACCTCCAGAGAGCTGGAGAAGCATAGGGTTACCATTCACAACTATCGACCGTACAAGTGTACGATTTGTGGCAAAACCTTTGCCACCATGCCGAACTTGCGGTCACATCTGAAAGTTCACACCGATGTGATTCGACTGAAATGTCACATTTGCGAGCGGAGCTATTCAAGGAAATCAAGCCTACAGGCACACGTAAAAGTAGCACACGCTCGAGATGAATTCATGCAATGTAGTGGTATTCAACCGGGTGTCCACTCCAACGAGGAGCCGGATGGTGGTGATGGTACTGATGGTCTCGAAAGGCCCACCAAATGCGACATTTGCGATCGACAATTCGCTAAACTGAGCACTTTCGAACGGCACATACGAACATCCCACCGGTGCGAAATTTGCGGGAAAACCATTGCGCGGAAGGACTCACTCGAAAGACACCGAAGGACGCATACCGGCGAACGACCATTTCCTTGCGACGTATGTGGCAAAAGTTTCGTATGTAAACGCACTCTGATCTGCCATATGACACTGCATACTGGAAATCACAACTACAAGTGCGATTTTTGTGGCAAAGGATACAGTTCAAAGGCTAAGTTTACGATCCACGTGAGATCCCATACGGGCGAGCGTCCACACAAATGTACCATCTGTGGTAAAAGTTTTGCTAGTCAGTTGTACCTGAGAAGTCATACGTTTAGACATGAGGAAAATTACGAATTCAGCTGTGATGTTTGTGGTAAAAGATATGGTACAAGAGCTAAGCTTGAGTTTCACAAGGAAACACACAGCACAACCGAGCGCCCATACAAATGTGACATTTGCGGTAAGGGATTTTCCTTTATTGGACTGCTCAATCAGCATCTGAAATGTCATAATGAAGAACGTCTGCATTCGTGTAATATTTGCAACCAAAAGTTCAGAATTATTCATCATCTCAACTCACACATGCGCCGTCACAAGGATGAACGACCGTACAAATGTGAAGTTTGCGGTGCTTCGTTTAAGGCTTCCAATGGCCTGGTAGGGCACATGAAATGTCACTCAAACCTAGCCGCAAAACCGTTCGAATGTGACATATGCGGAGCAAAATTTAGTCTGCAAAGAAACCTCACCGTTCACAGTGTGGTTCATCGGCCGGGACAGTCCCATGAATGCTTTATATGTGGCCAACAATTTCGCACCCTCAGAGTGCTGGAAAGGCATAGAATCACCATTCACGACTATCGACCGCACAAATGTACGATCTGTGACAAAGCCTGCGGCACCGTGTCGAGCTTGCGGGATCATCTGAAAGTTCACACTGACGTGATGCGACTCAAATGTCCTATTTGCGGGCAAAGCTATGCAAGGAAATCAAGCCTTCAAACACACATAAAAGAAATACACGGTCGAGATAAATCAGTGTAG
Protein Sequence: MRPPHAHLMPRGLIPWLVKQAPNKHRNYSALSKAIYSYDNTGLKKPKCYICDRQFAELRYLKLHMRSTAHAEKVSHPCDICGKIIARKDSLERHRRTHTGERPFSCEICGKSFPCKRSLVNHMRLHTGNHNYRCDVCDKGYSSRSKLMIHLRTHTGERPYKCELCEKSFASQLYLRNHTLRHEENHEFSCGVCGKGCGTGALLAIHEKTHSTERPYKCDICGKEFFAIGQFNRHLKCHNDERLHRCTVCTKEFKNNQHLVVHMRCHTGERPYKCEVCCSSFRFSNNLVEHMKCHLDVASRPFQCGVCGAKFSLQRTLTAHSVVHGHSDDQPDRDGTGLEKPTKCDICDRLITKLGNFKRHMRTHTENTAHRCDICGKTLKWRDSLESHRRMHTGERPFRCEICGKGFACKRTLNGHTKLNAGNHDYKCDVCGKAYSPKCKFVDHMKSHAGERPYECDICGKKFASQCILRNHTLRHTENYEFSCDVCGKGFATRGSLVNHGKSHSTGRPLACDICGKTFYNNQTLRYHSDRHMTEHPFKCNICGKGFSFLGQLNKHWKIHNAPRLHRCNVCNKEFRTKFLLVTHMRSHTDERPYKCEICGSSFRTSTTLVGHMKIHANLASNPFECDVCGAKFSQQRTLSIHSKVHRKTPCHECPNCNKQFLASRDLNRHRVTVHNDRPYKCTICDITTTTMQNLRSHLKVHYGAIRHKCHICGKSYARKSGLNDHVKVVHAQDKRLHSDHELDGDGSELEKRHMGTTNHEKASHRCDICGKSFEKPYVYVRHRRMHTGERPFSCVICGKCFTCQSYLRNHMRLHTENHIYKCDVCGKGYSSKSKFTTHMRSHTGERPYKCDICGKSFASQLYLRNHTLRHEENYEFGCDFCGKGFGTRAKLAVHEEIHSTTERPFKCNICDKGFSFIGQLNQHLKCHNDERLYRCNVCNKEFRINHHLISHMRCHTAERPYKCEVCGSSFRFASNLVGHMKVHLNLASKPFECDICGAKFSAQGTLTAHSDVHRQGQAAECFTCDKQFLTSRELEKHRVTIHNYRPYKCTICGKTFATMPNLRSHLKVHTDVIRLKCHICERSYSRKSSLQAHVKVAHARDEFMQCSGIQPGVHSNEEPDGGDGTDGLERPTKCDICDRQFAKLSTFERHIRTSHRCEICGKTIARKDSLERHRRTHTGERPFPCDVCGKSFVCKRTLICHMTLHTGNHNYKCDFCGKGYSSKAKFTIHVRSHTGERPHKCTICGKSFASQLYLRSHTFRHEENYEFSCDVCGKRYGTRAKLEFHKETHSTTERPYKCDICGKGFSFIGLLNQHLKCHNEERLHSCNICNQKFRIIHHLNSHMRRHKDERPYKCEVCGASFKASNGLVGHMKCHSNLAAKPFECDICGAKFSLQRNLTVHSVVHRPGQSHECFICGQQFRTLRVLERHRITIHDYRPHKCTICDKACGTVSSLRDHLKVHTDVMRLKCPICGQSYARKSSLQTHIKEIHGRDKSV

Similar Transcription Factors

Sequence clustering based on sequence similarity using MMseqs2

100% Identity: -
90% Identity: -
80% Identity: -