Basic Information

Insect: Lucilia cuprina
Gene Symbol: zfh1_2
Assembly: GCA_001187945.1
Location: JRES01000955.1:247301-259615[+]

Transcription Factor Domain

TF Family: zf-C2H2
Domain: zf-C2H2 domain
PFAM: PF00096
TF Group: Zinc-Coordinating Group
Description: The C2H2 zinc finger is the classical zinc finger domain. The two conserved cysteines and histidines co-ordinate a zinc ion. The following pattern describes the zinc finger. #-X-C-X(1-5)-C-X3-#-X5-#-X2-H-X(3-6)-[H/C] Where X can be any amino acid, and numbers in brackets indicate the number of residues. The positions marked # are those that are important for the stable fold of the zinc finger. The final position can be either his or cys. The C2H2 zinc finger is composed of two short beta strands followed by an alpha helix. The amino terminal part of the helix binds the major groove in DNA binding zinc fingers. The accepted consensus binding sequence for Sp1 is usually defined by the asymmetric hexanucleotide core GGGCGG but this sequence does not include, among others, the GAG (=CTC) repeat that constitutes a high-affinity site for Sp1 binding to the wt1 promoter [1].
Hmmscan Out: # of c-Evalue i-Evalue score bias hmm coord from hmm coord to ali coord from ali coord to env coord from env coord to acc

1 37 8.1 5.4e+02 1.1 0.1 10 23 11 24 10 24 0.94

2 37 0.092 6.1 7.2 1.7 3 23 31 52 30 52 0.88

3 37 8e-07 5.3e-05 23.1 0.3 1 23 58 80 58 80 0.98

4 37 0.0004 0.027 14.6 0.4 1 23 521 544 521 544 0.97

5 37 0.0044 0.29 11.3 1.1 1 22 550 571 550 573 0.90

6 37 4.9e-08 3.2e-06 26.9 2.5 1 23 576 598 576 598 0.98

7 37 9.1e-06 0.00061 19.8 0.4 1 23 604 628 604 628 0.95

8 37 0.0011 0.07 13.3 3.9 1 23 633 655 633 655 0.97

9 37 0.00028 0.019 15.1 0.3 3 23 663 683 661 683 0.98

10 37 0.0006 0.04 14.1 4.8 1 23 689 711 689 711 0.94

11 37 5.5e-06 0.00037 20.5 0.0 1 23 717 739 717 739 0.98

12 37 1.1e-05 0.00076 19.5 0.8 3 23 785 805 783 805 0.98

13 37 0.0079 0.52 10.6 8.1 1 23 811 833 811 833 0.95

14 37 0.00013 0.0086 16.2 1.5 1 23 997 1019 997 1019 0.98

15 37 0.008 0.53 10.5 3.1 1 23 1024 1046 1024 1046 0.97

16 37 2.2e-05 0.0015 18.6 0.9 1 23 1049 1071 1049 1071 0.97

17 37 5.5e-05 0.0036 17.3 0.9 1 23 1077 1102 1077 1102 0.97

18 37 0.013 0.84 9.9 0.1 1 23 1108 1130 1108 1130 0.98

19 37 1 68 3.9 0.2 1 19 1136 1154 1136 1156 0.91

20 37 0.0022 0.15 12.3 4.9 1 23 1164 1186 1164 1186 0.95

21 37 9.5e-05 0.0063 16.6 0.2 1 23 1192 1214 1192 1214 0.98

22 37 8e-06 0.00053 20.0 2.8 1 23 1382 1404 1382 1404 0.98

23 37 0.00013 0.0087 16.2 2.2 1 23 1409 1431 1409 1431 0.98

24 37 0.0014 0.093 12.9 1.6 1 23 1434 1456 1434 1456 0.97

25 37 0.00061 0.041 14.0 1.1 1 23 1462 1486 1462 1486 0.96

26 37 0.0009 0.06 13.5 0.2 2 23 1493 1514 1492 1514 0.97

27 37 0.00069 0.046 13.9 1.5 1 20 1520 1539 1520 1542 0.94

28 37 0.00091 0.061 13.5 3.9 1 23 1548 1570 1548 1570 0.95

29 37 3.2e-05 0.0021 18.1 0.2 1 23 1576 1598 1576 1598 0.98

30 37 0.00021 0.014 15.5 2.7 1 23 1699 1722 1699 1722 0.97

31 37 2e-05 0.0013 18.7 3.1 1 23 1727 1749 1727 1749 0.99

32 37 0.00048 0.032 14.4 0.9 1 23 1752 1774 1752 1774 0.96

33 37 0.028 1.8 8.8 2.1 1 21 1780 1802 1780 1804 0.92

34 37 0.0064 0.43 10.8 0.2 1 23 1810 1832 1810 1832 0.98

35 37 0.00015 0.0098 16.0 1.5 1 23 1838 1860 1838 1860 0.97

36 37 0.00016 0.011 15.9 2.4 1 23 1866 1888 1866 1888 0.95

37 37 2.4e-05 0.0016 18.5 0.2 1 23 1894 1916 1894 1916 0.99

#	of	c-Evalue	i-Evalue	score	bias	hmm coord from	hmm coord to	ali coord from	ali coord to	env coord from	env coord to	acc
1	37	8.1	5.4e+02	1.1	0.1	10	23	11	24	10	24	0.94
2	37	0.092	6.1	7.2	1.7	3	23	31	52	30	52	0.88
3	37	8e-07	5.3e-05	23.1	0.3	1	23	58	80	58	80	0.98
4	37	0.0004	0.027	14.6	0.4	1	23	521	544	521	544	0.97
5	37	0.0044	0.29	11.3	1.1	1	22	550	571	550	573	0.90
6	37	4.9e-08	3.2e-06	26.9	2.5	1	23	576	598	576	598	0.98
7	37	9.1e-06	0.00061	19.8	0.4	1	23	604	628	604	628	0.95
8	37	0.0011	0.07	13.3	3.9	1	23	633	655	633	655	0.97
9	37	0.00028	0.019	15.1	0.3	3	23	663	683	661	683	0.98
10	37	0.0006	0.04	14.1	4.8	1	23	689	711	689	711	0.94
11	37	5.5e-06	0.00037	20.5	0.0	1	23	717	739	717	739	0.98
12	37	1.1e-05	0.00076	19.5	0.8	3	23	785	805	783	805	0.98
13	37	0.0079	0.52	10.6	8.1	1	23	811	833	811	833	0.95
14	37	0.00013	0.0086	16.2	1.5	1	23	997	1019	997	1019	0.98
15	37	0.008	0.53	10.5	3.1	1	23	1024	1046	1024	1046	0.97
16	37	2.2e-05	0.0015	18.6	0.9	1	23	1049	1071	1049	1071	0.97
17	37	5.5e-05	0.0036	17.3	0.9	1	23	1077	1102	1077	1102	0.97
18	37	0.013	0.84	9.9	0.1	1	23	1108	1130	1108	1130	0.98
19	37	1	68	3.9	0.2	1	19	1136	1154	1136	1156	0.91
20	37	0.0022	0.15	12.3	4.9	1	23	1164	1186	1164	1186	0.95
21	37	9.5e-05	0.0063	16.6	0.2	1	23	1192	1214	1192	1214	0.98
22	37	8e-06	0.00053	20.0	2.8	1	23	1382	1404	1382	1404	0.98
23	37	0.00013	0.0087	16.2	2.2	1	23	1409	1431	1409	1431	0.98
24	37	0.0014	0.093	12.9	1.6	1	23	1434	1456	1434	1456	0.97
25	37	0.00061	0.041	14.0	1.1	1	23	1462	1486	1462	1486	0.96
26	37	0.0009	0.06	13.5	0.2	2	23	1493	1514	1492	1514	0.97
27	37	0.00069	0.046	13.9	1.5	1	20	1520	1539	1520	1542	0.94
28	37	0.00091	0.061	13.5	3.9	1	23	1548	1570	1548	1570	0.95
29	37	3.2e-05	0.0021	18.1	0.2	1	23	1576	1598	1576	1598	0.98
30	37	0.00021	0.014	15.5	2.7	1	23	1699	1722	1699	1722	0.97
31	37	2e-05	0.0013	18.7	3.1	1	23	1727	1749	1727	1749	0.99
32	37	0.00048	0.032	14.4	0.9	1	23	1752	1774	1752	1774	0.96
33	37	0.028	1.8	8.8	2.1	1	21	1780	1802	1780	1804	0.92
34	37	0.0064	0.43	10.8	0.2	1	23	1810	1832	1810	1832	0.98
35	37	0.00015	0.0098	16.0	1.5	1	23	1838	1860	1838	1860	0.97
36	37	0.00016	0.011	15.9	2.4	1	23	1866	1888	1866	1888	0.95
37	37	2.4e-05	0.0016	18.5	0.2	1	23	1894	1916	1894	1916	0.99

Sequence Information

Coding Sequence: ATGTCAGAAAGGACAACATATGCAGATATTTTTGCCTCATCCTATCAATTGGCGATACATCGTGAAATGCACACAACAGAGCGtaaatattgttgtattatttgtGCCGAAAGTTTTAACGATTCAAAGGCTTTGTATCATCATCAGGCATTACATGCgaaggaaaataaatatgtttgtaatttatGTGGGAAATCTTATAGGCAATCGGCTGGTTTGTCACAACACATGAGATGGCATAGAAAGCAGCAGGAGCGTTctttaataattgatattgaaaaatatttacgcATTTTAAATATGGAAAAACGTAAATCTGTTAatgaaagattaaaaaatgtaaaattacagAGTAATGTTAATAAAACTGCGCCTGGGGTAAAAGCCAAGGCAAACGAAGAAACTAATTTAGAAGAGTATCCCAAATTAAGAAAACCCAAACCGGCTACTTTACTAAAAATACAAGCGAGACAGAAAAAAACTAACGATTTAGCTATAAAGGCGACAGTAAAAGATTTGGAAACTGCAGACGAAAAACATGTGCAAGTGCCTTTGCGCCAGGAATTTCTCGATAAGAAACAACAACTGGAAAAGGCTACTacgaatttattgaaaaaatatgaaatacgtAAGATGCAAGGTCGTCTTCTAGATGATGATATGTGTAGTTTAGATTCCGAAGAGGCACAGCCTTTAACACTACACCAGGAACTCGATTTACAATTTAATGATCTAAAATTAAAGGATAATGAGAACCAAATAACTAAtgtcaaaaacaacaaagaattaAACTTTCTCGAACAACATTTggttaacattttatatacaaaagtacAAGCTCATCCAAATGGTTTCTTTGCGGAAAATCTTCCTTTATGGTATAAGAAAACCTTCGATAAGGATATAGCTAAAGATTGGCTAGAACTGATGGAAAGATCacgtaaattttatatagaaaaagtacaaaacaagACTGTGCTATATAGCAAGGAAGTGGAATTTACGGATATAAAAGCTTCTGGAGACATGGCGGAAGCACCCGAGACAGAAAAGGAGTCTACGcatttaattgaaaaattattcgaaaagatgttaaaaaattgttttttacccgtaaattataataaaccacAAACGCAAACCTGTGGAGAGATAATTTGTGAAAATCTAcaagaatttataattaattgtaaattgtgtaaaatcaaaatatttgagTTTGAAGAATTTGTGCAGCATTTTAAGAATGTCCACTTGGATAAGGCGTTAATAAATGATAGCACAACAGAAcggaaaatagaaaataaattacatgaAGATCAGGAGGAAAATTATGAGCGTGTGATTAAGTTAGAAATATCTGAGGCACATGAACCATTGAAAAATGATGAAAAGTTTACAGCAAACATCGATAATGAAGAATTCTTATGGGAGGCGGACAATAGTAACTATACGGATGATGACAAGGATGAGGATTATAATACAGAAGATGACGGAGACCCGGAGGAGGATGAGGAACAAAGCAAAAGTATAATGAGAAAGCCGCGTAAACCTAAAGAATTTTCCTgtgaaatttgcaataaaaagtaTGCCGACTCTAGACGCTTACAGCTGCATGTGAAAATTGTACATTTACGCGAAAAACCTTACAAATGCTCTATGTGTGATCAGGCTTTTGCCGAAGAACGTACGCTTAAGAATCATGTGGGTCATAAACATACGGGTTATGAGTGCCCCGAATGCCACAAGAATTTCTCAACAAATCGCAATTTGAAACGACACATGCTAATACATGTAGATAAAAAAGAATTCATTTGCCAAGAGGATAATTGTGGTAAGGCGTTTGCCACCAAGGGTCAGCTAAAAGATCATCAACGCTATCATACTAGTGAAATGTTTATTTGCGAGGAATGTGGCTATAAGTGCCGGCAACGCGAATCACTAATTGTTCATAAACGCCATCATACGGGAGAGAAGCCATTTGGATGTAAGCTTTGTGATCGTCGTTTTGGTTCGAAACCTTTACTCAATGAACACATGGCCACGCATGAAACGGAACGTAAACATATTTGTGATGTTTGTGGTAAAAGTTTTAATCGGCCCAAGGCTTTATATCAtcataaacatttacatttagGCGTTAAGAAGTTTGTTTGTAAAATCTGTGGTCAGGCCTATGCTCAAGCGGCCGGTCTATCGGCTCACATGCGAAAGCATAGAGAAGAGGGTGGCTCTGCCTCTTTTACCACCGAACCTGCGCTACCAcctaataatacaaatattttaaatTGTAAAAGACATGAATCCTTAAGGGAACATAAACGTCAGCATACGGGAGAGATACCGTTTGGCTGTGAAGTATGTGGAcgtagttttagtttaaaaaaattactgacCAGACATATGAGTAGTCATGAAACGGTGCGTAAACATGTTTGTAATGTTTGCGGGAAAAGTTTTAATCGACACAATGCTCTCTATCATCACAAACATTTGCATTCGGATGTTAagaagttttttgtaaaatatgtggTCAGGCCTATGCTCAGACAGCGGGACTATCCGCTCATATGCGAAAACATAGAGAAAATCataatatgtaatttttgtcaaataaaaatatttgaatttaatgaaTTCGTGGAACATTTTCGCACTATACACTGGCCAGAAATTAATGGAACacataataaatacaatacTCTTTTACACAATGTACATCCAGTTAAGCAAGCTAAAATTGAAGATGTTAAACAACTAAAACTAGAGGTAAATGAACAGGCAAAAGATTTTCATATTGAGGACGAGTCGATGCAAGGTAGTGAAAATGACTGGAGGCCGGAGTTGGAAATGCAGCAAAATATAAGTAATAGTGGGTTTTCTAATCAAGAGGAAGACAATTGCAGTGATAGAGAAGAATCCATAGGAATATTAAAGAAGGAATATTTGCAGAATGAAAAACCCAacctgaaaagaaaaaaacatgactTTAAATGTTCTATATGTGCACGTACCTTTATTAAAAAGTCAACATATGAAACACATATAAAAGAGCATAAGATTATGCCATACAAATGCACTAAATGCTCGCGATCCTTTGACGAAGAGTTGCAACTTATGCAGCATCAACATTTACATGATGGTTATGCTTGTGATATTTGTCAGAAAGTTTTTAAGAAGAGGAATAACTTAGTTTCACATAAAGAAACTcatgtgaaaacaaaaaatttcaaatgtacTTATGAAAATTGTGAGAAAGCATACTCTGGTCAAAGGCAACTGCAACGTCATATGCGTTTAGTACACATACGAGGTGCATGTTTTGTTTGTGATATATGTGGCTCTAGGCAGCGAGATAAAATAGCTTTGGCCGATCATATGCGTTCGCATACTGGTGAAAGACCCTTTGCTTGCAGTTTATGTGCGCGACGCTTTATGACGAAATCGAGACTGGGCGAACATAAAGCCTGTCATGAAACGGAACGTAAACATGTGTGCGAGGTTtgtggtaaaaattttaatcgtgCCAAGGCTTTGTATCATCATAAACACTTGCATTTGGATGTAAAGAAATTTGTGTGTAAACTTTGCGGTGCTGCTTATGCCCAGTGTGCTGGATTATCGGCTCATATGCGTAAACATAAAGATCAACAAGTATTCAAACAGctgtttaaacttaaacttggaaaaatgttaaaaaattgttttttacctatacaatataataatttaactaGCAAAACTTGTGGCGAAATTATTTGTCAAAGTGAAACTGTCTTCAGCATAGTGTGTAAATTTTGTGACTTAAGAATTTTCGAATATGAAGAATTTCTACAACATTTTCGCAATAACCACTGGACAGAGCAGTTAAATGTAAAGAATGATGGAGGCAATAAAGAATGTAATGAAAAATCTTTAGATCCAAAcgaaatagaaaatgaaaaactcgTAAAGAGAGATGTATGTTTggaatcgaaaattttatatgatgTAGAAGAAACTGAAGAGGATTTGGAGACAAATGATGACGATGAATGGCAGCCGGAAATGGAAGAGGAACAAAATGAGGATTCTAATGATATGACGGAAACAAAGGCAATATTAAAAAAGCCTGTGAAggacaacaaaaaaagagaacgTCCCTTTAAATGTGAGATGTGTACGCGAACATTTAGCAACAAGTCCAACTATGAAGCACATAAACTTAAGCATAAAACTGTACAATACAATTGCGAGAAATGCAGTAAAACTTTTGTAACAGAACATGAACTTGGCCTTCATCAGCGTTCTCATAATGGTTACAGTTGTTCAATTTGTAATATGTCTTTTATGAAATACGAATCATTGCGTACACACAAAGAGTCTCATATAGAaaccaaaaatttcatttgcacTTATAAAGATTGCAATAAAGCGTTTGCCACCAAACGTCGTCTAGGCTCCCACATGCGCTTACACATACGAGAACCTACACTGGTGTGTGAATTGTGTGGCGGACGTTATCGCTCGACAAAAGAACTAAACGATCATATACGCAGACATACGGGTGAAAAGCCATTTGCTTGCAATTTATGTGATCGACGTTTCACATCGAAATCTTTATTGGGCGAACATATGGCGTGTCATGAAACGGAACGTAAACATGTATGTGAAGTATGTGGTAAGGGCTTCAATCGTCCCAAGGCATTATACCAtcataaacatttacatttggaagtaaaaaaatttgtgtGTAAAATATGTGGTGCTGCATATGCTCAGTGTGCAGGATTATCGGCTCATATGCGTAAACATAAGGAAAAGGCAAATATGCCAACAGATTTCCCTAGAAATGATATTATTTTGTATgaatggaaaaataatattaaaagtgaaaatgaaACAGATGAAGAATTTCTAAGTAATGACTGCGATAAGAGGTATCTAGCAAATGAGCTCGTTGTTAAACAAACGTCTGAAGGCGGCCAAGACATTGATAGtgaaaaagaagaagagaaTGGGAATTCAAGTGAGAGTTCAGaggatttttcaaaatctttggTAATTTTGAAAAAGGCCACAGACAAATCTTCCAAGACCcgtaaaaagaaacttttcgaATGTACACAATGCAAACGCaagtttaatacaaatttctatTTACGTATTCACGTACGACAAGAGCATGAACCAGTAAGCTTTCAATGTGATAAATGCAGCAAATCCTTTGTGGAAAaacgttatttaaaattacaccAGCGTTCCCATATAGGTTACACTTGCCAGATTTGCAATAAAGTCTTTGATAAATATGAAGCCCTACGCTATCATAGTGAAAGCCATATAGAATCGAGAAATTTCATTTGTGACTATGAAAAGTGTGGTAAGGCATTTCCCAACAATCGTCGACTAAGTGCTCATAAACGTTGCCATTTTGCTGTGGCACCGTTTGTTTGTGAGATTTGTGGTTCACGCCAGCGTAGTAAAGAGTTTTTAATCGTTCATATACGCACGCATACAGGGGAAAAGCCCTATGCTTGCAGTCAATGCGATCGTCGTTTTGCCTCCAAACATTTTCTACAAGATCATCAAGCTGTACATGCTACCGAACGTACTCATGTGTGTACGGTTTGTGGTAAGGCTTTTGCCAGCAGTAAATCTCTCTATCATCATCGTGATCTGCATTTGGGCATAAAGAAATATGTGTGTAAAATATGCAATAGTGCATACACACAGTCGGCTGGACTGTCGGCCCATATGCGTAAACATAAACAGGATAGCGGTCTATTAGATGTTGAGCAAACAACATCTAACAATTGA
Protein Sequence: MSERTTYADIFASSYQLAIHREMHTTERKYCCIICAESFNDSKALYHHQALHAKENKYVCNLCGKSYRQSAGLSQHMRWHRKQQERSLIIDIEKYLRILNMEKRKSVNERLKNVKLQSNVNKTAPGVKAKANEETNLEEYPKLRKPKPATLLKIQARQKKTNDLAIKATVKDLETADEKHVQVPLRQEFLDKKQQLEKATTNLLKKYEIRKMQGRLLDDDMCSLDSEEAQPLTLHQELDLQFNDLKLKDNENQITNVKNNKELNFLEQHLVNILYTKVQAHPNGFFAENLPLWYKKTFDKDIAKDWLELMERSRKFYIEKVQNKTVLYSKEVEFTDIKASGDMAEAPETEKESTHLIEKLFEKMLKNCFLPVNYNKPQTQTCGEIICENLQEFIINCKLCKIKIFEFEEFVQHFKNVHLDKALINDSTTERKIENKLHEDQEENYERVIKLEISEAHEPLKNDEKFTANIDNEEFLWEADNSNYTDDDKDEDYNTEDDGDPEEDEEQSKSIMRKPRKPKEFSCEICNKKYADSRRLQLHVKIVHLREKPYKCSMCDQAFAEERTLKNHVGHKHTGYECPECHKNFSTNRNLKRHMLIHVDKKEFICQEDNCGKAFATKGQLKDHQRYHTSEMFICEECGYKCRQRESLIVHKRHHTGEKPFGCKLCDRRFGSKPLLNEHMATHETERKHICDVCGKSFNRPKALYHHKHLHLGVKKFVCKICGQAYAQAAGLSAHMRKHREEGGSASFTTEPALPPNNTNILNCKRHESLREHKRQHTGEIPFGCEVCGRSFSLKKLLTRHMSSHETVRKHVCNVCGKSFNRHNALYHHKHLHSDVKKFFVKYVVRPMLRQRDYPLICENIEKIIICNFCQIKIFEFNEFVEHFRTIHWPEINGTHNKYNTLLHNVHPVKQAKIEDVKQLKLEVNEQAKDFHIEDESMQGSENDWRPELEMQQNISNSGFSNQEEDNCSDREESIGILKKEYLQNEKPNLKRKKHDFKCSICARTFIKKSTYETHIKEHKIMPYKCTKCSRSFDEELQLMQHQHLHDGYACDICQKVFKKRNNLVSHKETHVKTKNFKCTYENCEKAYSGQRQLQRHMRLVHIRGACFVCDICGSRQRDKIALADHMRSHTGERPFACSLCARRFMTKSRLGEHKACHETERKHVCEVCGKNFNRAKALYHHKHLHLDVKKFVCKLCGAAYAQCAGLSAHMRKHKDQQVFKQLFKLKLGKMLKNCFLPIQYNNLTSKTCGEIICQSETVFSIVCKFCDLRIFEYEEFLQHFRNNHWTEQLNVKNDGGNKECNEKSLDPNEIENEKLVKRDVCLESKILYDVEETEEDLETNDDDEWQPEMEEEQNEDSNDMTETKAILKKPVKDNKKRERPFKCEMCTRTFSNKSNYEAHKLKHKTVQYNCEKCSKTFVTEHELGLHQRSHNGYSCSICNMSFMKYESLRTHKESHIETKNFICTYKDCNKAFATKRRLGSHMRLHIREPTLVCELCGGRYRSTKELNDHIRRHTGEKPFACNLCDRRFTSKSLLGEHMACHETERKHVCEVCGKGFNRPKALYHHKHLHLEVKKFVCKICGAAYAQCAGLSAHMRKHKEKANMPTDFPRNDIILYEWKNNIKSENETDEEFLSNDCDKRYLANELVVKQTSEGGQDIDSEKEEENGNSSESSEDFSKSLVILKKATDKSSKTRKKKLFECTQCKRKFNTNFYLRIHVRQEHEPVSFQCDKCSKSFVEKRYLKLHQRSHIGYTCQICNKVFDKYEALRYHSESHIESRNFICDYEKCGKAFPNNRRLSAHKRCHFAVAPFVCEICGSRQRSKEFLIVHIRTHTGEKPYACSQCDRRFASKHFLQDHQAVHATERTHVCTVCGKAFASSKSLYHHRDLHLGIKKYVCKICNSAYTQSAGLSAHMRKHKQDSGLLDVEQTTSNN

Similar Transcription Factors

Sequence clustering based on sequence similarity using MMseqs2

100% Identity: -
90% Identity: -
80% Identity: -