Basic Information

Insect: Lagria hirta
Gene Symbol: -
Assembly: GCA_947359425.1
Location: OX375797.1:27057139-27064240[+]

Transcription Factor Domain

TF Family: zf-C2H2
Domain: zf-C2H2 domain
PFAM: PF00096
TF Group: Zinc-Coordinating Group
Description: The C2H2 zinc finger is the classical zinc finger domain. The two conserved cysteines and histidines co-ordinate a zinc ion. The following pattern describes the zinc finger. #-X-C-X(1-5)-C-X3-#-X5-#-X2-H-X(3-6)-[H/C] Where X can be any amino acid, and numbers in brackets indicate the number of residues. The positions marked # are those that are important for the stable fold of the zinc finger. The final position can be either his or cys. The C2H2 zinc finger is composed of two short beta strands followed by an alpha helix. The amino terminal part of the helix binds the major groove in DNA binding zinc fingers. The accepted consensus binding sequence for Sp1 is usually defined by the asymmetric hexanucleotide core GGGCGG but this sequence does not include, among others, the GAG (=CTC) repeat that constitutes a high-affinity site for Sp1 binding to the wt1 promoter [1].
Hmmscan Out: # of c-Evalue i-Evalue score bias hmm coord from hmm coord to ali coord from ali coord to env coord from env coord to acc

1 30 0.27 14 7.1 0.2 1 23 98 121 98 121 0.97

2 30 2.2 1.1e+02 4.3 4.1 2 23 131 153 130 153 0.96

3 30 0.044 2.2 9.6 2.2 1 23 163 186 163 186 0.98

4 30 0.021 1.1 10.6 1.5 1 23 195 218 195 218 0.92

5 30 0.0081 0.41 11.9 3.1 1 23 259 282 259 282 0.97

6 30 4.5 2.3e+02 3.3 0.3 2 23 292 314 291 314 0.94

7 30 0.62 31 6.0 2.2 2 23 324 346 323 346 0.96

8 30 0.012 0.59 11.4 1.8 1 23 356 379 356 379 0.95

9 30 0.0066 0.33 12.2 1.0 1 23 388 411 388 411 0.93

10 30 0.44 22 6.5 3.7 1 23 420 443 420 443 0.96

11 30 2.6 1.3e+02 4.0 0.9 1 23 484 507 484 507 0.95

12 30 1.2 60 5.1 5.4 1 23 516 539 516 539 0.97

13 30 0.0056 0.28 12.4 1.5 1 23 549 572 549 572 0.97

14 30 0.043 2.2 9.6 2.5 1 23 581 604 581 604 0.93

15 30 0.013 0.63 11.3 1.9 1 23 613 636 613 636 0.97

16 30 0.14 6.8 8.1 1.1 1 23 677 700 677 700 0.96

17 30 2.1 1.1e+02 4.3 3.5 1 23 709 732 709 732 0.97

18 30 0.27 14 7.1 0.2 1 23 801 824 801 824 0.97

19 30 2.2 1.1e+02 4.3 4.1 2 23 834 856 833 856 0.96

20 30 0.033 1.7 10.0 4.2 1 23 866 889 866 889 0.97

21 30 0.001 0.051 14.8 1.5 1 23 898 921 898 921 0.93

22 30 1.8 91 4.5 1.5 1 23 930 953 930 953 0.93

23 30 0.14 6.9 8.1 3.5 1 23 962 985 962 985 0.97

24 30 8.2 4.1e+02 2.5 0.2 2 23 995 1017 994 1017 0.94

25 30 3.3 1.6e+02 3.7 3.1 2 23 1027 1049 1026 1049 0.94

26 30 0.0011 0.058 14.6 2.0 1 23 1059 1082 1059 1082 0.97

27 30 0.56 28 6.1 4.3 1 23 1091 1114 1091 1114 0.92

28 30 0.074 3.7 8.9 2.0 1 23 1123 1146 1123 1146 0.97

29 30 0.0021 0.11 13.8 5.1 1 23 1185 1208 1185 1208 0.98

30 30 0.0036 0.18 13.0 3.1 1 23 1217 1240 1217 1240 0.95

#	of	c-Evalue	i-Evalue	score	bias	hmm coord from	hmm coord to	ali coord from	ali coord to	env coord from	env coord to	acc
1	30	0.27	14	7.1	0.2	1	23	98	121	98	121	0.97
2	30	2.2	1.1e+02	4.3	4.1	2	23	131	153	130	153	0.96
3	30	0.044	2.2	9.6	2.2	1	23	163	186	163	186	0.98
4	30	0.021	1.1	10.6	1.5	1	23	195	218	195	218	0.92
5	30	0.0081	0.41	11.9	3.1	1	23	259	282	259	282	0.97
6	30	4.5	2.3e+02	3.3	0.3	2	23	292	314	291	314	0.94
7	30	0.62	31	6.0	2.2	2	23	324	346	323	346	0.96
8	30	0.012	0.59	11.4	1.8	1	23	356	379	356	379	0.95
9	30	0.0066	0.33	12.2	1.0	1	23	388	411	388	411	0.93
10	30	0.44	22	6.5	3.7	1	23	420	443	420	443	0.96
11	30	2.6	1.3e+02	4.0	0.9	1	23	484	507	484	507	0.95
12	30	1.2	60	5.1	5.4	1	23	516	539	516	539	0.97
13	30	0.0056	0.28	12.4	1.5	1	23	549	572	549	572	0.97
14	30	0.043	2.2	9.6	2.5	1	23	581	604	581	604	0.93
15	30	0.013	0.63	11.3	1.9	1	23	613	636	613	636	0.97
16	30	0.14	6.8	8.1	1.1	1	23	677	700	677	700	0.96
17	30	2.1	1.1e+02	4.3	3.5	1	23	709	732	709	732	0.97
18	30	0.27	14	7.1	0.2	1	23	801	824	801	824	0.97
19	30	2.2	1.1e+02	4.3	4.1	2	23	834	856	833	856	0.96
20	30	0.033	1.7	10.0	4.2	1	23	866	889	866	889	0.97
21	30	0.001	0.051	14.8	1.5	1	23	898	921	898	921	0.93
22	30	1.8	91	4.5	1.5	1	23	930	953	930	953	0.93
23	30	0.14	6.9	8.1	3.5	1	23	962	985	962	985	0.97
24	30	8.2	4.1e+02	2.5	0.2	2	23	995	1017	994	1017	0.94
25	30	3.3	1.6e+02	3.7	3.1	2	23	1027	1049	1026	1049	0.94
26	30	0.0011	0.058	14.6	2.0	1	23	1059	1082	1059	1082	0.97
27	30	0.56	28	6.1	4.3	1	23	1091	1114	1091	1114	0.92
28	30	0.074	3.7	8.9	2.0	1	23	1123	1146	1123	1146	0.97
29	30	0.0021	0.11	13.8	5.1	1	23	1185	1208	1185	1208	0.98
30	30	0.0036	0.18	13.0	3.1	1	23	1217	1240	1217	1240	0.95

Sequence Information

Coding Sequence: ATGTCAGACTTTGTAAAACCTCGTTTATCACGGGCCCTTTTTGCCTGTCATAGGCCTCTGTCGTTTTATTTGTGTTGTTTTTGTGAATATAGAACACATCAAAAAATACATAACCTCAAACACAATTGTAGGCTGGATCGCCTTAGTAATGAGGCTACTTTGAACCGCACCGAAAGATGTAATGTTAATAAAAAGTCTTTAAAAGATTCAAGAAAAACCTACGAGGAATGTCAAAACTCTATTTTTTTGAAAAATATCAAAACAGATACAGATCAGCAACACCAACTATGCTACGAATGTGATCAGTGTGAGTTCAAAGCTGAAGAAAAGCGCCTATTGAATATACATATAAACAGCACCCATCCTCCAATTGAATTAGAAAAATCGTTAAAATGTGATCAGTGTCATTATAAAACAATTTATGAGGAATTCTTAAAAGATCATAAAAAGAGGAAGCATTTTTCAAAATCAAAAAGTATTCAAATGTATCAATGCGACTTGTGTGAGTATTTGACTGTATATAGAAGTAGTTTTACAAAACATAAAAGAGTAAAACATAGTCTAGGCGCCGTACAAAAAAGGTTTCATTGTGACCAGTGCGACTTTATTTACACCAACAAACAGGCCTTAAAAGTACATAACATCGTCAAACACACTTCATCCGAATTAAAGAAAAAGATTGAATGTAATATGTGTGACTATAAAACAGTGTATGGACGTTATTTACCAGTGCATAAAAAGAACAAGCATAATTTAATAGAAATACGGGAATGGTTTCAATGCGATCAGTGCAATTATAAAACGCCTAACAAAAATGAATTAAAAATGCATAAAAAAAGAAAGCATATTCCAATTGAATTACAAAATTGGTTACAGTGCAATCAGTGTGAGTTCAAAGCTGAAGAAAAGCGCGTTTTGAATATACATATAAACAGCACACATGCTCCAATTGAACTAGAAAAATCGCTAAAGTGTGATCAGTGTAATTATAAAACTATATATGAGGAGTTTTTGAAAGATCATAAAAAGAGGAAGCATTTTTTACATTCGAAACCATTAGAAATGTTTCAATGCGATCTGTGTGAGTTTACAACTGCCAATAAGAGTGGCTTTACAAGACATAAAAATCTAAAACACACTTTAGTTAAATTACAAAAAAGATTTCAATGCGACAAGTGCGATTTTATTACTATACACAAAAGTGCTCTAAAAGCACATAATATCGTTAAGCACACCTCTGTCGAATGTGCAAAACAATTCCAATGCGATAAATGCGAATATAAAACTATCTATGAACGTTACTTAACAGCCCATAAACATAAAATGCACAATTCAGAAGAAGTGCGAGAATGGTTTCAATGCGCCCATTGCAAATATAAAACTCTTCACAGAAAGGGTATAAATATGCATATAAAAAAAAAGCATCTTCAAATTGAATTACGACAGTCGTTCCAATGCGATCAATGTGAGTTCAAAGCTACTGAAAAACGTATTTTAAACAAACATATAAACAACACACATGCTCCAATTGAATTAGAAAAATCGTTCAAGTGTGATCAGTGTCATTATAAAACCATTTATGAGGAGTTTTTAAAAGATCATAAAAAGAGGAAGCATTTTTTAAATTCGAAACCCTTAGAAATGTTTCAATGCGATCTGTGTGAGTTTACAACTGCCAATAAAAGTGGTTTTACAAGACATAAAAATATAAAGCACACTTCAGTTAAACTACAAAAAAGATTTCAATGCGATAAGTGCGATTTTATTACTATACACAAGCATGCTCTAAAAGCGCATAATATCGTTAAGCACATTTCTGTCGAATGTGCAAAACAATTCCAATGCGATAAATGCGATTATAAAACTGTCTATGAACGTTACTTAACAGCCCATAAAAATAAAATGCACAATTCAGAAGAAGTGCGAGAATGGTTTCAATGCGCTCATTGCAAGTATAAAACTCTTCACAGAAAGGGTATAAATTTGCATATTGAAAAAAAACATCGTCCAATTGAAGTAAAACAGTGGTTCCAGTGCGATCAGTGTGAGTTTAAAGTTACAGACAAACGTATTTTAAACAAACATATAAACAACACACATGCTCCAATTGAATTAGAAAAATCGTTCAAGTGTGATCAATGCCAATATAAAACTATGTATGAAGAATTTTTGACAGATCATAAGAAAAGGAAGCATTTTTTAAATTCGAAAACAATTCAAAGATTTCAATGTGATCTGTGTGAGCTTGATAGCCTTGGGAATAAGGCTTTGAAGCACACCGAAGGTTGTAATGTTAATAAAAAGCCGTTAAAAGATCCAAAAAAAATCTACGAGGAGTGTCAAGAATCTACTTTTTTGAAAAATATCAAAACAGATACAGATCAGCAACACCAAATATGCTACGAATGTGATCAGTGTGAGTTCAAAGCTGAAGAGAAGCGCCTTTTGAACATACATATAAACAGCACACATCCTCCAATTGAATTAGAAAAATCGTTAAAATGTGATCAGTGTCATTATAAAACAATTTATGAGGAATTTTTAAAAGATCATAAAAAGAGGAAGCATTTTTCAAATTCAAAAAATATTCAAATACATCAATGCGATTTGTGTGAGTATTCGACTGTATTTAGAAGTAGTTTTACGAAACATAAAAGAGTAAAACATAGTCTAGGTGCAGTACAGAAAAGGTTTCAATGTGATCAGTGCGACTATATTTACACCAACAAACATGCCTTAAAAGTGCATAACATCGTTAAACACACTTCGGCCGAACTAAAGAAAAAATTTGAATGCAATATGTGTGACTATAAAACAGTGTATGAACGTTACCTACCTGTACATAAAAAGAAGAAGCATAATTTAAAAGAAATACGGGAATGGTTTCAATGCGATCAGTGCAAGTATAGAACGCCTAATAAAAAAGAAGTAAAAATGCATAAAAAAAGAAAGCATATTTCAATTGAATTACAAAATTGGTTACAGTGCGATCAGTGTGAGTTCAAAGCTATAGACAAACGTATTTTGAACATACATATAAACAGCACACATGCTCCACTTGAATTAGAAAAATCGCTAAAATGTGATCAGTGTCATTATAAAACTATATATGAGGAATTTTTGAAAGATCATAAAGAGAGGAAGCATTTTTTAAATGCGAAAACAATTCAAATGTTTCAATGCGAGTTGTGTGAGTATACAACGGCTAATAAAAGTAGTTTTACAAGACATAAAAATATAAAACACACTTTGGTTAACTTACAAAAAAAATTTCATTGCGACAAGTGCGATTTTATTACTATACACAAACATGCTCTAAAAGCACATAATATTGTTAAGCACACCCCAGCCGAATTTGCAAAACAATTCCAATGCGATAAATGCGAATATAAAACAGTCTATGAACGTTACTTAACAGTCCATAAAAATAAAATGCACAATTCAGAAGAAGTGCGAGATTGGTTTCAATGCGCTCATTGCAAGTATAAAACCCTTCACAGAAGCGGTATAAATATGCATATAAAAAGAAAGCATCTTCCAATTCAAGAGTGGTTCCAGTGCGATCAGTGCGATTTTAAAGCAAAAAACAAATCACATCTTAAAACTCATACAAATACAAAGCATCTATCGGTGGAAATGCAGATACTGTTTCAATGTGATGGTTGCAGCTATAAAACATTCTACAAATCTGATCTAAAAAGGCACCAAGATAGAAAGCATCTTAATTAA
Protein Sequence: MSDFVKPRLSRALFACHRPLSFYLCCFCEYRTHQKIHNLKHNCRLDRLSNEATLNRTERCNVNKKSLKDSRKTYEECQNSIFLKNIKTDTDQQHQLCYECDQCEFKAEEKRLLNIHINSTHPPIELEKSLKCDQCHYKTIYEEFLKDHKKRKHFSKSKSIQMYQCDLCEYLTVYRSSFTKHKRVKHSLGAVQKRFHCDQCDFIYTNKQALKVHNIVKHTSSELKKKIECNMCDYKTVYGRYLPVHKKNKHNLIEIREWFQCDQCNYKTPNKNELKMHKKRKHIPIELQNWLQCNQCEFKAEEKRVLNIHINSTHAPIELEKSLKCDQCNYKTIYEEFLKDHKKRKHFLHSKPLEMFQCDLCEFTTANKSGFTRHKNLKHTLVKLQKRFQCDKCDFITIHKSALKAHNIVKHTSVECAKQFQCDKCEYKTIYERYLTAHKHKMHNSEEVREWFQCAHCKYKTLHRKGINMHIKKKHLQIELRQSFQCDQCEFKATEKRILNKHINNTHAPIELEKSFKCDQCHYKTIYEEFLKDHKKRKHFLNSKPLEMFQCDLCEFTTANKSGFTRHKNIKHTSVKLQKRFQCDKCDFITIHKHALKAHNIVKHISVECAKQFQCDKCDYKTVYERYLTAHKNKMHNSEEVREWFQCAHCKYKTLHRKGINLHIEKKHRPIEVKQWFQCDQCEFKVTDKRILNKHINNTHAPIELEKSFKCDQCQYKTMYEEFLTDHKKRKHFLNSKTIQRFQCDLCELDSLGNKALKHTEGCNVNKKPLKDPKKIYEECQESTFLKNIKTDTDQQHQICYECDQCEFKAEEKRLLNIHINSTHPPIELEKSLKCDQCHYKTIYEEFLKDHKKRKHFSNSKNIQIHQCDLCEYSTVFRSSFTKHKRVKHSLGAVQKRFQCDQCDYIYTNKHALKVHNIVKHTSAELKKKFECNMCDYKTVYERYLPVHKKKKHNLKEIREWFQCDQCKYRTPNKKEVKMHKKRKHISIELQNWLQCDQCEFKAIDKRILNIHINSTHAPLELEKSLKCDQCHYKTIYEEFLKDHKERKHFLNAKTIQMFQCELCEYTTANKSSFTRHKNIKHTLVNLQKKFHCDKCDFITIHKHALKAHNIVKHTPAEFAKQFQCDKCEYKTVYERYLTVHKNKMHNSEEVRDWFQCAHCKYKTLHRSGINMHIKRKHLPIQEWFQCDQCDFKAKNKSHLKTHTNTKHLSVEMQILFQCDGCSYKTFYKSDLKRHQDRKHLN

Similar Transcription Factors

Sequence clustering based on sequence similarity using MMseqs2

100% Identity: -
90% Identity: -
80% Identity: -