Basic Information

Insect: Philophylla caesio
Gene Symbol: -
Assembly: GCA_963971545.1
Location: OZ020604.1:5980199-5985792[+]

Transcription Factor Domain

TF Family: zf-C2H2
Domain: zf-C2H2 domain
PFAM: PF00096
TF Group: Zinc-Coordinating Group
Description: The C2H2 zinc finger is the classical zinc finger domain. The two conserved cysteines and histidines co-ordinate a zinc ion. The following pattern describes the zinc finger. #-X-C-X(1-5)-C-X3-#-X5-#-X2-H-X(3-6)-[H/C] Where X can be any amino acid, and numbers in brackets indicate the number of residues. The positions marked # are those that are important for the stable fold of the zinc finger. The final position can be either his or cys. The C2H2 zinc finger is composed of two short beta strands followed by an alpha helix. The amino terminal part of the helix binds the major groove in DNA binding zinc fingers. The accepted consensus binding sequence for Sp1 is usually defined by the asymmetric hexanucleotide core GGGCGG but this sequence does not include, among others, the GAG (=CTC) repeat that constitutes a high-affinity site for Sp1 binding to the wt1 promoter [1].
Hmmscan Out: # of c-Evalue i-Evalue score bias hmm coord from hmm coord to ali coord from ali coord to env coord from env coord to acc

1 28 0.0094 3.3 10.7 2.5 1 23 248 270 248 270 0.98

2 28 0.0012 0.43 13.5 6.0 1 23 276 298 276 298 0.98

3 28 0.023 8.1 9.5 2.4 1 23 367 389 367 389 0.98

4 28 0.0041 1.4 11.9 4.7 1 23 395 417 395 417 0.98

5 28 0.048 17 8.5 0.1 2 23 451 472 450 472 0.96

6 28 0.24 83 6.3 6.8 1 23 544 567 544 567 0.97

7 28 0.048 17 8.5 0.2 1 22 574 595 574 595 0.95

8 28 2.1e-06 0.00074 22.2 1.8 2 23 645 666 644 666 0.97

9 28 0.015 5.2 10.1 0.3 1 23 673 696 673 696 0.96

10 28 0.36 1.3e+02 5.7 1.5 2 23 704 725 703 725 0.95

11 28 0.83 2.9e+02 4.6 2.4 1 23 808 831 808 831 0.92

12 28 5.6 2e+03 2.0 2.0 1 21 840 860 840 861 0.90

13 28 0.082 29 7.8 1.5 1 23 870 893 870 893 0.96

14 28 0.00023 0.081 15.8 0.4 2 23 909 930 908 930 0.97

15 28 3.7e-05 0.013 18.3 4.2 1 23 937 959 937 959 0.98

16 28 0.00039 0.13 15.1 1.0 1 23 1116 1139 1116 1139 0.96

17 28 0.0023 0.8 12.6 1.1 1 23 1176 1199 1176 1199 0.98

18 28 1.4e-05 0.0048 19.6 1.3 1 23 1214 1236 1214 1236 0.97

19 28 2.4e-05 0.0085 18.9 1.3 1 23 1243 1265 1243 1265 0.98

20 28 0.042 15 8.7 0.1 2 21 1292 1311 1291 1312 0.95

21 28 0.0068 2.4 11.1 1.8 1 23 1360 1383 1360 1383 0.97

22 28 0.062 22 8.1 0.8 1 23 1420 1443 1420 1443 0.95

23 28 0.00018 0.063 16.1 2.4 1 23 1474 1497 1474 1497 0.98

24 28 1.5e-05 0.0052 19.5 0.2 2 23 1528 1549 1527 1549 0.95

25 28 6.7e-05 0.023 17.5 2.3 1 23 1555 1577 1555 1577 0.99

26 28 8.3e-06 0.0029 20.3 7.0 1 23 1583 1605 1583 1605 0.98

27 28 1.1e-06 0.0004 23.0 1.5 1 23 1611 1633 1611 1633 0.99

28 28 0.00094 0.33 13.9 0.1 1 20 1639 1658 1639 1663 0.92

#	of	c-Evalue	i-Evalue	score	bias	hmm coord from	hmm coord to	ali coord from	ali coord to	env coord from	env coord to	acc
1	28	0.0094	3.3	10.7	2.5	1	23	248	270	248	270	0.98
2	28	0.0012	0.43	13.5	6.0	1	23	276	298	276	298	0.98
3	28	0.023	8.1	9.5	2.4	1	23	367	389	367	389	0.98
4	28	0.0041	1.4	11.9	4.7	1	23	395	417	395	417	0.98
5	28	0.048	17	8.5	0.1	2	23	451	472	450	472	0.96
6	28	0.24	83	6.3	6.8	1	23	544	567	544	567	0.97
7	28	0.048	17	8.5	0.2	1	22	574	595	574	595	0.95
8	28	2.1e-06	0.00074	22.2	1.8	2	23	645	666	644	666	0.97
9	28	0.015	5.2	10.1	0.3	1	23	673	696	673	696	0.96
10	28	0.36	1.3e+02	5.7	1.5	2	23	704	725	703	725	0.95
11	28	0.83	2.9e+02	4.6	2.4	1	23	808	831	808	831	0.92
12	28	5.6	2e+03	2.0	2.0	1	21	840	860	840	861	0.90
13	28	0.082	29	7.8	1.5	1	23	870	893	870	893	0.96
14	28	0.00023	0.081	15.8	0.4	2	23	909	930	908	930	0.97
15	28	3.7e-05	0.013	18.3	4.2	1	23	937	959	937	959	0.98
16	28	0.00039	0.13	15.1	1.0	1	23	1116	1139	1116	1139	0.96
17	28	0.0023	0.8	12.6	1.1	1	23	1176	1199	1176	1199	0.98
18	28	1.4e-05	0.0048	19.6	1.3	1	23	1214	1236	1214	1236	0.97
19	28	2.4e-05	0.0085	18.9	1.3	1	23	1243	1265	1243	1265	0.98
20	28	0.042	15	8.7	0.1	2	21	1292	1311	1291	1312	0.95
21	28	0.0068	2.4	11.1	1.8	1	23	1360	1383	1360	1383	0.97
22	28	0.062	22	8.1	0.8	1	23	1420	1443	1420	1443	0.95
23	28	0.00018	0.063	16.1	2.4	1	23	1474	1497	1474	1497	0.98
24	28	1.5e-05	0.0052	19.5	0.2	2	23	1528	1549	1527	1549	0.95
25	28	6.7e-05	0.023	17.5	2.3	1	23	1555	1577	1555	1577	0.99
26	28	8.3e-06	0.0029	20.3	7.0	1	23	1583	1605	1583	1605	0.98
27	28	1.1e-06	0.0004	23.0	1.5	1	23	1611	1633	1611	1633	0.99
28	28	0.00094	0.33	13.9	0.1	1	20	1639	1658	1639	1663	0.92

Sequence Information

Coding Sequence: ATGGCCTCATATCAATGTCGCACATGTCGTGAACCAAGTGTGGGAAACTTCTACTCCCTTTCGGATCTTTTGGATGAGGAACACTACCCTAAAAAGACACTTGCAGACTTCCTTTGGGACATCGCAAAAATTAACAATAAAACTGATGATGCTAAACGTTTGCCGCAACATATTTGCGGAAGCTGTTGTCGCAAGCTGAAAAATACGTATTCGTTTGTTTTGCAAGcacaaattgcaaataaaaaactttttgccAGTTTATATATCGAAGATGTTGGTTCTGACGCTGGCAAAGAAATGGCTGGAAAACATAACGATTGTCTATTGGAGGCTCCTATTGATATACCACTACggcaaattgaaattaaaaaagaatctGATTACGGTGAAGAGGTAGAGAATAGCACAGAAGATCTAActaatattaatacaaatgaaTTTCAAATGGCGGGTAAAAGAAGAGAGGAGTTTATTCAATTGGTAAAGGAAGAAATGCCTTTAGAAGAAGAAGTGGAGAGTATTAGCACAGAAGATAGCGAAGGAATCGATCCTATAACCACAGTAGAAACCAGCTGGAAAATCGAGACCAGCTGGAAAATCGAGAAGATTGGGagtgacaattttgaaaatttgattgaTTTAGATAGTAGCAAGAGtGGATCTCTTCTGGTTAAAAGGCGGCGTGGAAGACCTCAAACTGCGATTTTATTTGACTATACATATTGTACAGACGATGGTAGAtattattgcaaaaaatgtgagaagAACTTCGCTTGGAAAAAAGATGCCCAACGCCACATGAAATACCATTTGAGCACTTTTCCATATCATTGTGACCAATGCCAAAAACGCTTTCAGCGAAAGGATAAATTTGATAAACATATGAAAATACATTCCAAAAAAGGTAGCGACATGGCCACAGAATATCACGCCGAAGTCTTAGAGGGAGAAATAGGTGAAGTTGAAACGAGCGATGATCAGAGTGATGAAGAAAGCGCTGAacacACGTCAACATCCTCAATACCAACAAAACGTCGCCGCGGTAGACCAGtttctacaaaaaaactggAATTCACTTTTTGTAATGATGACGGTCGTTACCACTGTAACAGGTGCAACAAAGACTTTGCATGGAAGAAAGATGTTGAACGACATATAAAGAGTCATTTTGGTATTTTTCCATACGAATGTAACCAGTGTAGCCATCGTTTCCAGCGAAAAGACAAGTTTACCGAACACTTGAAGATACACGCCAAAGGCGAACCGGAAGTTAAACGACTACGGCCGACAGTACGGGCAGAGTGGAATTTCGCGGAACGTATTTATACAGAGCAGCGGTTTCGTTCAATCGAATGTAAACTCTGCAATGaagttatatttaatataagtgCCTTAAGACAGCACTTGCTAAGCCATTTGCAACCCGATACTTTGCGTTTAGATGTTGATTGTGACGTTGTTAAAGAACTGTTCCCGAGTTCGAAAGATGATATGTCCAAAATTAAATCACAAATATGCAAAGACATTAAGGATAAACGATACTCCAAATATTATGCCATTGTTAACGCTTATGGTTATGAAATGTCACTGAGCGATTCTGAATCAGAGCCTGAAAGGAATGATGCTAAATACGAGTGTGAACTATGTCATGCAAAGTGTGGTCGCAAACATCAACTATTCCAGCATTCCAAAACGGAACATGCTCAAGAGAAATTGCCATATAAGTGCAACGTTTGCAAGTTAGAGTTTGTGAATACAGCTATGTTTGCGTTACATTCACGCACCCAATGCAGAAACCGcgataaaaaatatcaatgtcTCAAGTGTCCGGGAAAGTTTGTGTGGTTACAGAACTTGCAAGGACATAATTGCTCTAATCGACTCAATGTTTATGTTCCCAAATGGCCGGATAAACGCAAACTACATTTATTACAGTGTAATTTTTGTGACAAAACATTTCGTTATGCGACTGATTTGAAGCGTCATCAAGAGACTCATAACCTGAACAGTCGCTCTCATGTGTGTGCTATATGCAGCCAACCTTTTTTGAAAGCCGAAAACTTGCGTCAACATTTGCGACAAGCACACGAGCAAATAAAACGACGTATTGAATGCTGTTTATGCACTGAAAAACTCAATACACTTGCTCAGCTTCGAACACATTTGACCAATCATTCGGATGGTTGGACCGGTTTAAGTTACGCGgagggaaaatattttaaggtgCATTGGCCTCAAGGCTGTCGAGGAAAAGAAGGCGAAGTTGAACAGAGTATTCTTATCGACTTTGCAggacaaaatttaacaaattattattcaGCTATGGATGAAAGTGGCAACGAACTAGATTTATACGATTCGGAGACCGATTTGGAATTGGAATCACTCACTACCGCCAATAAAGAACCTTCATCTAGTTCCTACACGTGTGATTTGTGCAAGCAGGTATTTTTCCGAAGATTACGTATTCTGCAACATCAACATAGCGCACATGCTGAGGAGAAAGAACCATTTCCACATGCTTGCACTCGTTGCGAGAAGCAATTCGTTTGCTTGGGTTTATTAGAGCAGCACTATAAACGTGATTGTGGCAACATCTTCAAGCGTTTCGATTGTCAACGCTGCTCAGCGCGCTTTGTGTGGGAGGAAAACCTGCAACACCACATGCAACGTCAGCATATAGATCCAGAGCAACAAATAAGTCGGCAACTTGCCAATAAACTGCAATGTGAGCAATGTAATAAAGTGTTCGTTTGGCCAAAGGATCTAACACGCCACAAACGTATCCATATGCCCGACGATGAAAAGTTCGAATGCCTATATTGTGAGCGTAAATTCTATAGAAAGGATCATTTACAAACACACTTAAAAGTCCACGGCGCTGGTGGTACCATGGCCGCTGCTACAACAACTGCAGTAGCCAGCAAACGCGAGCTTAATCGCAAAGTAAATGcTGTCGATCCGCATCTCTGTAAACCGAATGGCTTGAAATGTGTCCAATGCAAAATCTGTCTATCAAAGCACACAAAAATAGCCGATCTGCGTGCACATCTCTTAGAGCATCGCACTGATGTTTCTTTGTCGCAACATGTTACAACCAACTCGGAAATATCGCAACTTTTCTATCCTGATGAGGCGCCGTTGACTATCGATTTGCTAATGGCAAGAATGAAAGCAGATATAAATGCCGGCCAGTTAGATCGGTTTTACTCAATCACCAATGAATTGGGCCATGAGCTAAGTATCAGCGGATCTGATACAGATGACACAGATTCAGATTCAGAGCCTGATGAAATTTTAGACAATGCGACAGGATACAGCATTCGACACCCAAGACGTTCAATTTACAATTGCGATTTGTGCAGCATTACTTTTACACgaaaatttaaactatttgcTCATCAAGCAAGTGAGCATATTTGGAATGAGGCGCCACATGTTTGCCAGCATTGTCAAGCGCACTTTTTGTGCGATAAACTCTTGCAGTCGCATTACCGCCACCAATGTAAGAATTTGCTGAAGCGTTATGTTTGCCGGAAATGTCCTCAGCGATTTATGTGgaaagaaaatcttaaaatgcACTTACGCACAATGCATCCTGACAGCGAGGAAGTAAAAAAGGTTTTCGCACCAAGTTCATTTGATTGTGAGGAATGCTCCAGGAGCTTTCAGATGCAGAAGGATTTAACTCGTCACATGATGACACATCGAGCTGATGCTACCGTCTTCCCATGCCTTTGGTGTCCTCGCAAGTTTTACCGCAAAAGCAATTTGTACTTGCACATCAAACGTCATGGCGTATCTTCACATCAGCTGAGTGCAGCGGCGTCTCACATTACTGCAAGCAAAGGGCCAAATGGAAAGAAACAAATACAATGTCGCGTATGTAACGTACAATTCCACAGTGTGTCGGCTTTACGCGCCCATCTGCGCGAAGAGACTTCATCAATGTTGACTTCTCATCACAATTACAATTCTCAGCGGAACTATTCGATTATGAATGAGTTGGGCTATGAATTGGATATCGATGACTCGGAAACGGGAGAAGAAGATAATGAAAGCGTTCCAAATAAGTCGTACAAGTGCCAAATGTGTGGTTTGATTTGCAAAAGGCGGTATGAGATGGGTCAGCATCAGTTATCAGTACACAAACACGAGCATATAACATTGAAGTGTGACAATTGTGTTTTTAAAACGGTATCGACTGATGTAATGGAACACCACTTGCGCACACAATGcaacaataaagaaaaagagCATCAATGCACACAGTGTTCATACAAATTCATGTGGGCCGAGAATTTGAATGCTCACGTAAAATTGGTACATCAACCTTCGCCAGATGAAACGCAAGTAACTGTCGGTGCTGCCGATGATGGAGTTTCCTCATCTCGTATCGAACCCGTTCCATCTCAGGAATTTCAATGTGATAAGTGCGAACGTCGATATAATCGCAAAGATCGGCTGTTCGCACATATCAAAAAGATGCATGGAGCGGAAAGCGATGCTCCTAGTTCTAGCATCAATTCTGCTAAAGAACTTTCAAATGTTAAGAAAACGgggccaaaagaaaaaaaatttctttgtgcTTTTTGCGGTCGCGCAGTGAGCTCATCATCAAATTTGATAGTTCACATGCGACGTCACACTGGCGAAAAGCCATTCCAATGTGAATTCTGCGACAAAGCTTTTCCACGATCCTCCGACTTGGCTTGTCATCGGCGTACTCATACAGGCGAAAAGCCACATCGCTGCACCGTTTGTAACAAATCATTTTCACGTTCATACAAATTGCATACTCACATGCGCATCCATTCTGGCGAAAGGCCGTATAAATGCACATACTGTGAGAAGAGTTTTACACAATCCAATGACCTTGCACTTCACGTACGCCGACATACTGGCGAACGACCGTATGTGTGTAATGTTTGCGGTGAAAGCTTCATTCAGGGTACGGCGTTGAAGAATCACCGCACGGCTCAATCACATTTCCCAACGGATGAAACGCAGGATATGTCGCTGGGGGAAGAACAAACGAGCAACATTTTGCAACTGGACGAGCAAGGTAATAGTTTGATACAAttgtaa
Protein Sequence: MASYQCRTCREPSVGNFYSLSDLLDEEHYPKKTLADFLWDIAKINNKTDDAKRLPQHICGSCCRKLKNTYSFVLQAQIANKKLFASLYIEDVGSDAGKEMAGKHNDCLLEAPIDIPLRQIEIKKESDYGEEVENSTEDLTNINTNEFQMAGKRREEFIQLVKEEMPLEEEVESISTEDSEGIDPITTVETSWKIETSWKIEKIGSDNFENLIDLDSSKSGSLLVKRRRGRPQTAILFDYTYCTDDGRYYCKKCEKNFAWKKDAQRHMKYHLSTFPYHCDQCQKRFQRKDKFDKHMKIHSKKGSDMATEYHAEVLEGEIGEVETSDDQSDEESAEHTSTSSIPTKRRRGRPVSTKKLEFTFCNDDGRYHCNRCNKDFAWKKDVERHIKSHFGIFPYECNQCSHRFQRKDKFTEHLKIHAKGEPEVKRLRPTVRAEWNFAERIYTEQRFRSIECKLCNEVIFNISALRQHLLSHLQPDTLRLDVDCDVVKELFPSSKDDMSKIKSQICKDIKDKRYSKYYAIVNAYGYEMSLSDSESEPERNDAKYECELCHAKCGRKHQLFQHSKTEHAQEKLPYKCNVCKLEFVNTAMFALHSRTQCRNRDKKYQCLKCPGKFVWLQNLQGHNCSNRLNVYVPKWPDKRKLHLLQCNFCDKTFRYATDLKRHQETHNLNSRSHVCAICSQPFLKAENLRQHLRQAHEQIKRRIECCLCTEKLNTLAQLRTHLTNHSDGWTGLSYAEGKYFKVHWPQGCRGKEGEVEQSILIDFAGQNLTNYYSAMDESGNELDLYDSETDLELESLTTANKEPSSSSYTCDLCKQVFFRRLRILQHQHSAHAEEKEPFPHACTRCEKQFVCLGLLEQHYKRDCGNIFKRFDCQRCSARFVWEENLQHHMQRQHIDPEQQISRQLANKLQCEQCNKVFVWPKDLTRHKRIHMPDDEKFECLYCERKFYRKDHLQTHLKVHGAGGTMAAATTTAVASKRELNRKVNAVDPHLCKPNGLKCVQCKICLSKHTKIADLRAHLLEHRTDVSLSQHVTTNSEISQLFYPDEAPLTIDLLMARMKADINAGQLDRFYSITNELGHELSISGSDTDDTDSDSEPDEILDNATGYSIRHPRRSIYNCDLCSITFTRKFKLFAHQASEHIWNEAPHVCQHCQAHFLCDKLLQSHYRHQCKNLLKRYVCRKCPQRFMWKENLKMHLRTMHPDSEEVKKVFAPSSFDCEECSRSFQMQKDLTRHMMTHRADATVFPCLWCPRKFYRKSNLYLHIKRHGVSSHQLSAAASHITASKGPNGKKQIQCRVCNVQFHSVSALRAHLREETSSMLTSHHNYNSQRNYSIMNELGYELDIDDSETGEEDNESVPNKSYKCQMCGLICKRRYEMGQHQLSVHKHEHITLKCDNCVFKTVSTDVMEHHLRTQCNNKEKEHQCTQCSYKFMWAENLNAHVKLVHQPSPDETQVTVGAADDGVSSSRIEPVPSQEFQCDKCERRYNRKDRLFAHIKKMHGAESDAPSSSINSAKELSNVKKTGPKEKKFLCAFCGRAVSSSSNLIVHMRRHTGEKPFQCEFCDKAFPRSSDLACHRRTHTGEKPHRCTVCNKSFSRSYKLHTHMRIHSGERPYKCTYCEKSFTQSNDLALHVRRHTGERPYVCNVCGESFIQGTALKNHRTAQSHFPTDETQDMSLGEEQTSNILQLDEQGNSLIQL

Similar Transcription Factors

Sequence clustering based on sequence similarity using MMseqs2

100% Identity: iTF_00091566;
90% Identity: -
80% Identity: -