Basic Information

Insect: Criorhina ranunculi
Gene Symbol: -
Assembly: GCA_951813785.1
Location: OX638381.1:78569086-78583500[-]

Transcription Factor Domain

TF Family: zf-C2H2
Domain: zf-C2H2 domain
PFAM: PF00096
TF Group: Zinc-Coordinating Group
Description: The C2H2 zinc finger is the classical zinc finger domain. The two conserved cysteines and histidines co-ordinate a zinc ion. The following pattern describes the zinc finger. #-X-C-X(1-5)-C-X3-#-X5-#-X2-H-X(3-6)-[H/C] Where X can be any amino acid, and numbers in brackets indicate the number of residues. The positions marked # are those that are important for the stable fold of the zinc finger. The final position can be either his or cys. The C2H2 zinc finger is composed of two short beta strands followed by an alpha helix. The amino terminal part of the helix binds the major groove in DNA binding zinc fingers. The accepted consensus binding sequence for Sp1 is usually defined by the asymmetric hexanucleotide core GGGCGG but this sequence does not include, among others, the GAG (=CTC) repeat that constitutes a high-affinity site for Sp1 binding to the wt1 promoter [1].
Hmmscan Out: # of c-Evalue i-Evalue score bias hmm coord from hmm coord to ali coord from ali coord to env coord from env coord to acc

1 28 2e-05 0.002 18.8 1.9 2 23 147 168 146 168 0.98

2 28 0.01 0.99 10.3 0.7 2 23 186 208 185 208 0.95

3 28 0.04 3.9 8.4 2.1 1 20 791 810 791 813 0.91

4 28 1e-05 0.001 19.7 1.3 1 23 820 842 820 842 0.97

5 28 0.02 2 9.3 0.9 1 23 962 985 962 985 0.94

6 28 0.056 5.6 7.9 0.9 1 21 1022 1042 1022 1043 0.94

7 28 0.00013 0.013 16.3 0.5 3 23 1055 1075 1053 1075 0.96

8 28 6.7e-06 0.00067 20.3 0.5 1 23 1082 1104 1082 1104 0.98

9 28 0.0038 0.38 11.6 0.5 2 23 1118 1139 1117 1139 0.97

10 28 0.063 6.3 7.8 0.2 1 23 1214 1237 1214 1237 0.94

11 28 0.00089 0.089 13.6 2.3 2 23 1303 1324 1302 1324 0.98

12 28 6.1e-07 6e-05 23.6 2.1 1 23 1331 1353 1331 1353 0.98

13 28 5.3 5.3e+02 1.7 0.7 2 23 1384 1405 1383 1405 0.87

14 28 0.00042 0.042 14.6 2.6 1 23 1490 1513 1490 1513 0.96

15 28 0.029 2.9 8.8 2.2 1 23 1550 1573 1550 1573 0.95

16 28 0.061 6.1 7.8 4.0 1 23 1583 1605 1583 1605 0.98

17 28 1.3e-05 0.0013 19.4 1.0 1 23 1611 1633 1611 1633 0.98

18 28 0.00055 0.055 14.3 0.3 3 23 1658 1679 1657 1679 0.97

19 28 0.00027 0.027 15.2 1.9 1 23 1720 1743 1720 1743 0.95

20 28 0.056 5.5 8.0 3.1 1 22 1750 1771 1750 1771 0.97

21 28 1.2 1.2e+02 3.7 1.1 1 23 1780 1803 1780 1803 0.91

22 28 0.0054 0.54 11.1 2.1 1 19 1809 1827 1809 1828 0.97

23 28 6.9e-05 0.0069 17.1 1.9 1 23 1839 1861 1839 1861 0.98

24 28 1.7e-05 0.0017 19.0 0.2 1 23 1880 1902 1880 1902 0.96

25 28 0.00068 0.068 14.0 4.3 1 23 1908 1930 1908 1930 0.99

26 28 9.3e-07 9.2e-05 23.0 3.4 1 23 1936 1958 1936 1958 0.98

27 28 2.3e-07 2.3e-05 24.9 2.4 1 23 1964 1986 1964 1986 0.99

28 28 0.00028 0.028 15.2 0.4 1 23 1992 2016 1992 2016 0.93

#	of	c-Evalue	i-Evalue	score	bias	hmm coord from	hmm coord to	ali coord from	ali coord to	env coord from	env coord to	acc
1	28	2e-05	0.002	18.8	1.9	2	23	147	168	146	168	0.98
2	28	0.01	0.99	10.3	0.7	2	23	186	208	185	208	0.95
3	28	0.04	3.9	8.4	2.1	1	20	791	810	791	813	0.91
4	28	1e-05	0.001	19.7	1.3	1	23	820	842	820	842	0.97
5	28	0.02	2	9.3	0.9	1	23	962	985	962	985	0.94
6	28	0.056	5.6	7.9	0.9	1	21	1022	1042	1022	1043	0.94
7	28	0.00013	0.013	16.3	0.5	3	23	1055	1075	1053	1075	0.96
8	28	6.7e-06	0.00067	20.3	0.5	1	23	1082	1104	1082	1104	0.98
9	28	0.0038	0.38	11.6	0.5	2	23	1118	1139	1117	1139	0.97
10	28	0.063	6.3	7.8	0.2	1	23	1214	1237	1214	1237	0.94
11	28	0.00089	0.089	13.6	2.3	2	23	1303	1324	1302	1324	0.98
12	28	6.1e-07	6e-05	23.6	2.1	1	23	1331	1353	1331	1353	0.98
13	28	5.3	5.3e+02	1.7	0.7	2	23	1384	1405	1383	1405	0.87
14	28	0.00042	0.042	14.6	2.6	1	23	1490	1513	1490	1513	0.96
15	28	0.029	2.9	8.8	2.2	1	23	1550	1573	1550	1573	0.95
16	28	0.061	6.1	7.8	4.0	1	23	1583	1605	1583	1605	0.98
17	28	1.3e-05	0.0013	19.4	1.0	1	23	1611	1633	1611	1633	0.98
18	28	0.00055	0.055	14.3	0.3	3	23	1658	1679	1657	1679	0.97
19	28	0.00027	0.027	15.2	1.9	1	23	1720	1743	1720	1743	0.95
20	28	0.056	5.5	8.0	3.1	1	22	1750	1771	1750	1771	0.97
21	28	1.2	1.2e+02	3.7	1.1	1	23	1780	1803	1780	1803	0.91
22	28	0.0054	0.54	11.1	2.1	1	19	1809	1827	1809	1828	0.97
23	28	6.9e-05	0.0069	17.1	1.9	1	23	1839	1861	1839	1861	0.98
24	28	1.7e-05	0.0017	19.0	0.2	1	23	1880	1902	1880	1902	0.96
25	28	0.00068	0.068	14.0	4.3	1	23	1908	1930	1908	1930	0.99
26	28	9.3e-07	9.2e-05	23.0	3.4	1	23	1936	1958	1936	1958	0.98
27	28	2.3e-07	2.3e-05	24.9	2.4	1	23	1964	1986	1964	1986	0.99
28	28	0.00028	0.028	15.2	0.4	1	23	1992	2016	1992	2016	0.93

Sequence Information

Coding Sequence: ATGCTGTATGAAAGTGCTGAGACTACTGATCATCGCACATTGGGTGATATCTTCTTCGATGTCGTGAAAATCGAAACAAAAACCGACATAGAATCCTCACCTAGTCGCATTTGCATTCCTTGTTCACAAGATCTAGTAAGCGCATACAATTTCATTAAGACATCACAGCAGAACGAAGATCGACTGCGTGATTACTTTAAAAGTTCTAGCATAATACAACCCGATTGCTTGTCCGAATTTCCCATAGACATTCCAAATCAACCAAATGTCGCTGACGCCCTGCAAATAAAGGTtgaaaatgaattaataaatGAGTATGTTGAACCTCCACCTGAGGACAATAATCCTCCACCAAGTAGTTCCGAATCAGCCGAATCAGAAGGAAATGACTACGAAGATGAAGCACCATTGCACAAGGAaagtaaaattaataaaatgcaGTGTACTTACTGCGGTCGTATATTTAAGAGACTGGACTTTTTGGAGaatcacaaaaggaaacacGAAGAAGAACTCAATAAGAAAGaAGAATCAGGTGAAGATACCTCCACGCTTATATGTGATGAATGTGGAATTAATTGCGATAGCAAACTTGAACTAAAGACCCATCGTTTGACCGAACACCCTCCTAACAGAACAATATCTTCTGAGCGTGAAAATAGTGAGAGTTCtgcaattcaaaacaaaacaattaacaaatgTGACCATGGGTGCTCTCGTCCACCAACTGTAGAACGATGGTACAAGAAGAAGATGTCTGTACACCGTGGTTCAGAGCAAACCGTTTCAAAAGATACCACAGATATTTTAATGTTAAAATTAGAAATGAGTAATTTAAGAGAAACATGTTTAAAAGAATTCAGTGAGATAAAAGCACTAATCAGGCAGCAAAGTAATACAATAACTAAGGAGAGAGATCATAAGGATGTGATAGAGAAAAGTGATGAAGTTGTAACACAAATGCCCGTGTGGAAGTTTGACAAAATATTCCCAATAAACTCAGAGGAAGAACTCAATGCACTGAATAGTATCGATGAGAATCAAAAATTGATTGCTACCAAGCGAATGGCTTCAAGTGAGTTGGATGATATACATAATAAGTCTGTGATAGTGACTGCACCAAAAGGAACTTCCAGTGAACTCTTCCCTTcatcgacaaaagaaaaagaatgtgCAGATATGACGGCTTCAATCGAATCCACTGCCGGTTCAACTAAAAAGTTTAGCCACTTAAAGGAATCTGAAGAGTCAGACGCAGAGGTAGAGGATCCTAATTTAAGTACAACAACCTCCAAACGTATAACGtataaaaaaattctattcgaACAAAAGGAATTGCTTGTGAAGCTTTACGAAGAGGGTAAAACCATCAAAGAAGCTGCGTTTATGTCCAACATAAACATTAATACTGCCAAAGGTATCCTGCGGAATTATAAGGAAAGTAGTGACGCCCTAATAGACAAACGTCGTGGCGGCAATAGAACACGCAAACTGACTTGTGATGTACTTTCCACTATCGAAACATGTGTGGAGAAAAATCATGCTGTTCATTTGGAGCACATAAGAAACATTTTAGCCGAACAGAAGATTCATATAACCAAGAGTACCATTAACAATGGTCTGCGGGAACTGAAAATTACACTTAAACAGCCCTCTTATGAGTCACAACAAGTAAACCAACCGCAAGCAATTGAACACCGAAGGATTTTTGCTCTTGAATTCGCCAACTGGGCGCTTGATGATCGacataaaatgatttttatagacGAATGTGGAGTTAACTTGCATGTGGGAAGGCGTCAGATGCAGTCAACTACTCCAATTGTTCTTGGTCGCAGTGCAGTCATGATAGCTGCGCTCAACAGTAACGGCATCATCCATACTAACATTTTTGGCAGTAACTCGTGCAATACTACAAAATTCGCCACGTTTCTACGTGAACTTGTTGATAAGCTGTCATTGAAAGATGACATGGGAGATGCCATTCTTATTATGGACAATGCAGGCATTCATGAAAGCCGGGAGGTGGGTGAAATTCTGGCAACCTCAAAGATCTGCGTTAGAACCTTGCCACCATTTTCTCCAATGCTCAATCCACTTGGAAAGTCATTTATAAAGATGAAAGCTTATGCGCGAAGCGTTTTGGGGGATGCTTCGATAGAGGAGACCAATTTAGTAGAAGTCTTGGAGAAAAGTGTGTCAAGCATTACAGCGACTGATTGTAGTAATTATGTCATGGATGTGATTTTGCTGCTGCATGATGCCATGGCTGGTAGACCtaaAAAACGGAAACGGCAACCGCGATGTCATCgtccaaaggaaaaaaaaagggaaactagaaaacaaaataaaaataaagcagcCGGCCGTTTTGAATGCGACACTTGTGGCAAAACGTTTGCTTGGAAAAAAGATTTGGGTCGCCACGAGAAATGCCATGAGCCCAACAACAAGAAGTATGCATGTCCACACTGTGAACGTCGATTTATTCGAAAAGACAAGCTCACATCGCATTTACTCGTTCACTTGGCGGGCGTTGCTAAATCACGTCCTTTACGGTCCATTCAGTATTACGCGCATAACTTGTTTTCTGGGAAAAAATTCCTAGAAATAAAGTGTATGCTCTGTAACTTTGATAAGGCATCAAACGTGCGGGAACTTCGTCGGCACATTAGCTTGCACAACAACTTGGAGGTTCTTGAAGAACTCGGTAATAGTAATGTCGTTAAGAGGTTCTATCCCGATAGGAGTTTGCAAGAAGTTATTCCATTGATTGCTGCTCAAATCGAAAATAATCGGTTCGAGAAACTACACTCGATAGTGAATGCGAATACCTATGAAATGGGTATAAGCGATTCGAACGAAAGTGATACTGACACTGAGTACATGTGTGAGGCATGCGTTGAGCCCTTTAATCGTAAACACAAACTAATGACCCATCAGGCCTACGAGCACACTTTCGACGAGTGCCCATACAAATGTGACAATTGTCAACTAAAATTCACTTGCAAACAAGTGTTCGAGAGCCATCTGAAACATCACTGCGAAAACCCCGACAAAGAATTCAAATGCAAGGAATGTCCGGGTCGGTTTACATGGCCAGAGAATCTTGAGAATCACAAATGTAGCAAGAAAGTACGAATTGATAAGGAGAAGACCATTTGTGAGGTTTGCGATAAGAGTTTTCCTACGCCCAAAGAAATGCGAATGCATAAAAAGTCCCATATACCGGACAATAAATCTTTCAATTGCTCCGTATGTGGCGAGAAATACATTCGTCTTGCGAATCTACGTCGCCATTTGAAGATGCACACTGAAAAGCATCTCAAATCCATGCAGCCGAAGAGATTACAGTGTTTGCTTTGCGATGCAGAGTTCCAAAGTCTGCGCAATTTAAAAACTCATATATTCACGCATTCAGACGGCCAGACAAACGTTAACTTTAAATGCTGTGAacaatttgtaaacaatttctATCCAGAAGCGGATGAAAACGACATTTCGGAGCACATTCAGCGTTGTTTCAGTGAGCAAAAACTTTGGCGCCTGTATATAGcggtaaataaatttaacctaGAGATGGTCTTGAGTGATTCCgacagtgatgatgatgaatttaaTCAATCACCAAAAGAAAGCTACATTTGCGAGTTGTGTGACTTAAAATTTGATCGTATGCAAGCCATATTACGACATCAGTACATTGAGCATGATTCGAAGAAGACGAGTTTTCCACACAAGTGCGATAGATGTAGCGATCAGTTCATTTGCCAAGCTCTCTTAAGTCGTCACCAGAAAAGTGAGTGCATAAACGTGGACAGAATTCACGCATGCGTAAAATGCGGCGTCAAATACACTTGGAAGCAAAATTTGGTCGGCCATAGCTGTCAAAAGGAAGACAGTAAGAAATGCGAGGTCTGCGGCAGGAAGTTTAATTGGCAAAAAGACCTATACCGGCATAAGCGTACCCACATACCAGATGATAAAAAATTCGAGTGTCTGGTGTGCGAAAAGAAGTTCAGTCGAAAGGATAACATGCGATCTCACATGAGAACACACGATACTGACAATAAGATGGGCTTGAAAGCGACGCTTACGTGGGAGCAACAGGACGAGAACTTGTGTAGGCCACATGGGGACAAATGCATTGAatgtaaaatttgtttggcgAAGCATGATACAATTCGGGAGCTAGCAAGTCATTTAAGGACACACAAAGACAGCCGAACTCTTAGGAATCAAGAAGCTCAGGCCAAGGACATCTCGATGTTGTTGTACGGTAAGGAAATGGAACTGGATGATCTTAGTGAGGCAATAAAACAAGATCTCCTGGATGACAAAAACGCACATTTCTATTCGATCACAAACGAAATGGGCTACGAGTTGACTCTGATCGATTCTGAAACAGGTTCTGAATTAGAAGTAGACGACAAtacagatgatgatgacgatgaactGCGAAAAGGTTACAACTGCAGCCTATGCAATAAGACTTTTAATCGGAAGTTTAAAATGTTCGAACATCAAAGGGCGGGACATTCGTGGGACGAGCTGCCATTCGAATGTGAACATTGTTCGGCGAAGTTTGTCTGTGAGAGTATCTATGATATGCATCTGCAGCACCAATGCGAAAACAAagggaaaaaatttaaatgcaagAGATGTCCATTAAAATTCACTTGGAGGGATAACCTTAAATATCACGAGAAATATATACATGATAAGCAGCCAATATTGCCGAAGAAATACCATTGCCGTGTTTGTGAAAAGAGTTTCCAAGCGCGCAAGGATTATCTAAGACATAAAAAGATTCATGAACCCGATGAGGAATTCGAATGTACGTGGTGTTTCAGAATATTCATGCGAAGGGATAATCTTAAGGTTCATATGAAAGTTCATCAGAATGCCACTCATCTCTTGCTACCCGACATCTACTACCTAGCCCGCCCAAATGGAGccaaaattgcggattgtaagcTTTGTGATCAGAAGTTTACCAAAGTCTCCGCATTGCTCGAACACATTCGAAGTGCGCATTCAAAACATCAGAAGCAAGCTACCACTCCCAATCCAACAAGTTACTCGATTACAAACGCTTTAGGCTATGAGATGGATATTGAGGACTCTGAAACTGAGAAAGAGGACACAATAGAGAAATATTCTTGTGATGTTTGCAATACACGATTCAATCGTCGCTTTAAACTGCTAAAGCATCAACAAGCACTTCACTATTCCGACAACATTCCACACAAGTGCAACTATTGCAACTTCAAATGTGTATCGGAAGCAGTGCTAAATTATCACATGCGAACACAATGTATGAATGAGACGAAACAATACCACTGCAGTAGATGTACAATGCGATTCATGTGGCAGGAGAATTTAGAAAACCATGAAAGCTTAATACACGACAGCCCGCGAACACACACATGCGACGTGTGCAAAAGGGATTTCGCCACACAGCACGACCTGAAGAGTCACAGTGATTGCAAACCGCCGACCGAGGTTAAATTTTACGAATGCAAACTGTGTGATCGAAAGTACAATCGAAAGGATCGCTTGATGAAACACGTTAAGGTTCACGATGTCGAGTCCAAAAAATCGCTTGCCAAAACGAAACAATCCTCAGATAAAAAGTATTTGTGCGCATTTTGTGGTAAGGAAGTGTCGAGCTCTTCGAATCTAGTGATACACATGCGGCGACATACAGGTGAGAAGCCCTTCAAATGTGAATTTTGTAACAAAGGCTTTCCACGATCATCAGATTTAAGTTGTCACCGGCGGACTCATACTGGAGAACGGCCACACAAGTGTACAGTTTGTGAGAAGGCATTTTCGCGTTCGTACAAACTGCAAACTCACATGCGGATTCATTCGGGAGAAAAGCCGTACAAGTGTACATACTGTGACAAGAGTTTCACTCAGTCCAATGATTTGACGCTTCATGTCCGCAGGCACACCGGTGAAAGACCATATACATGTGAGACATGTGGTGAGAGGTTTATACAGGGAACAGCACTTAGAAATCACAGAAGGATGCGCGGCCACTATCAGATATAA
Protein Sequence: MLYESAETTDHRTLGDIFFDVVKIETKTDIESSPSRICIPCSQDLVSAYNFIKTSQQNEDRLRDYFKSSSIIQPDCLSEFPIDIPNQPNVADALQIKVENELINEYVEPPPEDNNPPPSSSESAESEGNDYEDEAPLHKESKINKMQCTYCGRIFKRLDFLENHKRKHEEELNKKEESGEDTSTLICDECGINCDSKLELKTHRLTEHPPNRTISSERENSESSAIQNKTINKCDHGCSRPPTVERWYKKKMSVHRGSEQTVSKDTTDILMLKLEMSNLRETCLKEFSEIKALIRQQSNTITKERDHKDVIEKSDEVVTQMPVWKFDKIFPINSEEELNALNSIDENQKLIATKRMASSELDDIHNKSVIVTAPKGTSSELFPSSTKEKECADMTASIESTAGSTKKFSHLKESEESDAEVEDPNLSTTTSKRITYKKILFEQKELLVKLYEEGKTIKEAAFMSNININTAKGILRNYKESSDALIDKRRGGNRTRKLTCDVLSTIETCVEKNHAVHLEHIRNILAEQKIHITKSTINNGLRELKITLKQPSYESQQVNQPQAIEHRRIFALEFANWALDDRHKMIFIDECGVNLHVGRRQMQSTTPIVLGRSAVMIAALNSNGIIHTNIFGSNSCNTTKFATFLRELVDKLSLKDDMGDAILIMDNAGIHESREVGEILATSKICVRTLPPFSPMLNPLGKSFIKMKAYARSVLGDASIEETNLVEVLEKSVSSITATDCSNYVMDVILLLHDAMAGRPKKRKRQPRCHRPKEKKRETRKQNKNKAAGRFECDTCGKTFAWKKDLGRHEKCHEPNNKKYACPHCERRFIRKDKLTSHLLVHLAGVAKSRPLRSIQYYAHNLFSGKKFLEIKCMLCNFDKASNVRELRRHISLHNNLEVLEELGNSNVVKRFYPDRSLQEVIPLIAAQIENNRFEKLHSIVNANTYEMGISDSNESDTDTEYMCEACVEPFNRKHKLMTHQAYEHTFDECPYKCDNCQLKFTCKQVFESHLKHHCENPDKEFKCKECPGRFTWPENLENHKCSKKVRIDKEKTICEVCDKSFPTPKEMRMHKKSHIPDNKSFNCSVCGEKYIRLANLRRHLKMHTEKHLKSMQPKRLQCLLCDAEFQSLRNLKTHIFTHSDGQTNVNFKCCEQFVNNFYPEADENDISEHIQRCFSEQKLWRLYIAVNKFNLEMVLSDSDSDDDEFNQSPKESYICELCDLKFDRMQAILRHQYIEHDSKKTSFPHKCDRCSDQFICQALLSRHQKSECINVDRIHACVKCGVKYTWKQNLVGHSCQKEDSKKCEVCGRKFNWQKDLYRHKRTHIPDDKKFECLVCEKKFSRKDNMRSHMRTHDTDNKMGLKATLTWEQQDENLCRPHGDKCIECKICLAKHDTIRELASHLRTHKDSRTLRNQEAQAKDISMLLYGKEMELDDLSEAIKQDLLDDKNAHFYSITNEMGYELTLIDSETGSELEVDDNTDDDDDELRKGYNCSLCNKTFNRKFKMFEHQRAGHSWDELPFECEHCSAKFVCESIYDMHLQHQCENKGKKFKCKRCPLKFTWRDNLKYHEKYIHDKQPILPKKYHCRVCEKSFQARKDYLRHKKIHEPDEEFECTWCFRIFMRRDNLKVHMKVHQNATHLLLPDIYYLARPNGAKIADCKLCDQKFTKVSALLEHIRSAHSKHQKQATTPNPTSYSITNALGYEMDIEDSETEKEDTIEKYSCDVCNTRFNRRFKLLKHQQALHYSDNIPHKCNYCNFKCVSEAVLNYHMRTQCMNETKQYHCSRCTMRFMWQENLENHESLIHDSPRTHTCDVCKRDFATQHDLKSHSDCKPPTEVKFYECKLCDRKYNRKDRLMKHVKVHDVESKKSLAKTKQSSDKKYLCAFCGKEVSSSSNLVIHMRRHTGEKPFKCEFCNKGFPRSSDLSCHRRTHTGERPHKCTVCEKAFSRSYKLQTHMRIHSGEKPYKCTYCDKSFTQSNDLTLHVRRHTGERPYTCETCGERFIQGTALRNHRRMRGHYQI

Similar Transcription Factors

Sequence clustering based on sequence similarity using MMseqs2

100% Identity: -
90% Identity: -
80% Identity: -