Basic Information

Insect: Platyscapa corneri
Gene Symbol: -
Assembly: GCA_018907185.1
Location: JACCHW010000028.1:158826-173746[+]

Transcription Factor Domain

TF Family: zf-C2H2
Domain: zf-C2H2 domain
PFAM: PF00096
TF Group: Zinc-Coordinating Group
Description: The C2H2 zinc finger is the classical zinc finger domain. The two conserved cysteines and histidines co-ordinate a zinc ion. The following pattern describes the zinc finger. #-X-C-X(1-5)-C-X3-#-X5-#-X2-H-X(3-6)-[H/C] Where X can be any amino acid, and numbers in brackets indicate the number of residues. The positions marked # are those that are important for the stable fold of the zinc finger. The final position can be either his or cys. The C2H2 zinc finger is composed of two short beta strands followed by an alpha helix. The amino terminal part of the helix binds the major groove in DNA binding zinc fingers. The accepted consensus binding sequence for Sp1 is usually defined by the asymmetric hexanucleotide core GGGCGG but this sequence does not include, among others, the GAG (=CTC) repeat that constitutes a high-affinity site for Sp1 binding to the wt1 promoter [1].
Hmmscan Out: # of c-Evalue i-Evalue score bias hmm coord from hmm coord to ali coord from ali coord to env coord from env coord to acc

1 30 5.2e-06 0.0018 20.4 1.0 1 23 223 245 223 245 0.98

2 30 0.0023 0.76 12.1 1.9 1 23 268 291 268 291 0.96

3 30 0.00011 0.038 16.2 0.5 2 23 298 320 297 320 0.96

4 30 0.00061 0.2 13.9 0.9 1 21 340 360 340 361 0.94

5 30 0.00038 0.13 14.5 0.1 2 23 456 477 455 477 0.96

6 30 0.012 4.1 9.8 0.3 1 23 483 506 483 506 0.91

7 30 9.8e-05 0.033 16.4 0.1 1 23 575 598 575 598 0.96

8 30 0.0067 2.2 10.6 0.4 1 23 604 627 604 627 0.96

9 30 0.1 34 6.9 1.5 1 23 640 662 640 662 0.97

10 30 3e-05 0.01 18.0 0.9 3 23 706 727 705 727 0.96

11 30 0.83 2.8e+02 4.0 0.9 2 23 790 813 789 813 0.93

12 30 2.6 8.7e+02 2.4 0.0 2 23 822 844 822 844 0.84

13 30 0.17 56 6.2 0.1 2 23 851 873 850 873 0.93

14 30 1.1e-05 0.0036 19.4 1.2 1 23 881 903 881 903 0.98

15 30 0.00017 0.059 15.6 3.3 1 23 980 1003 980 1003 0.97

16 30 0.014 4.7 9.6 0.5 2 23 1010 1032 1009 1032 0.95

17 30 0.00059 0.2 13.9 4.8 1 21 1071 1091 1071 1092 0.94

18 30 0.0022 0.75 12.1 1.8 2 23 1106 1127 1105 1128 0.93

19 30 0.66 2.2e+02 4.3 2.6 1 23 1131 1153 1131 1154 0.95

20 30 0.0066 2.2 10.6 0.9 2 23 1161 1184 1160 1184 0.93

21 30 0.8 2.7e+02 4.0 0.2 2 23 1192 1214 1192 1214 0.95

22 30 3 1e+03 2.2 0.0 2 23 1221 1243 1220 1243 0.87

23 30 0.19 63 6.0 2.7 2 23 1252 1274 1252 1274 0.96

24 30 0.22 74 5.8 0.8 2 23 1280 1302 1280 1302 0.93

25 30 0.035 12 8.3 0.3 1 23 1369 1392 1369 1392 0.96

26 30 0.0092 3.1 10.2 2.6 1 20 1421 1440 1421 1442 0.94

27 30 0.27 90 5.6 1.9 2 23 1530 1552 1529 1552 0.94

28 30 3.4 1.1e+03 2.1 0.9 2 21 1559 1578 1558 1581 0.94

29 30 0.14 47 6.4 1.8 1 23 1592 1614 1592 1614 0.97

30 30 0.04 14 8.1 0.2 2 20 1622 1640 1621 1641 0.94

#	of	c-Evalue	i-Evalue	score	bias	hmm coord from	hmm coord to	ali coord from	ali coord to	env coord from	env coord to	acc
1	30	5.2e-06	0.0018	20.4	1.0	1	23	223	245	223	245	0.98
2	30	0.0023	0.76	12.1	1.9	1	23	268	291	268	291	0.96
3	30	0.00011	0.038	16.2	0.5	2	23	298	320	297	320	0.96
4	30	0.00061	0.2	13.9	0.9	1	21	340	360	340	361	0.94
5	30	0.00038	0.13	14.5	0.1	2	23	456	477	455	477	0.96
6	30	0.012	4.1	9.8	0.3	1	23	483	506	483	506	0.91
7	30	9.8e-05	0.033	16.4	0.1	1	23	575	598	575	598	0.96
8	30	0.0067	2.2	10.6	0.4	1	23	604	627	604	627	0.96
9	30	0.1	34	6.9	1.5	1	23	640	662	640	662	0.97
10	30	3e-05	0.01	18.0	0.9	3	23	706	727	705	727	0.96
11	30	0.83	2.8e+02	4.0	0.9	2	23	790	813	789	813	0.93
12	30	2.6	8.7e+02	2.4	0.0	2	23	822	844	822	844	0.84
13	30	0.17	56	6.2	0.1	2	23	851	873	850	873	0.93
14	30	1.1e-05	0.0036	19.4	1.2	1	23	881	903	881	903	0.98
15	30	0.00017	0.059	15.6	3.3	1	23	980	1003	980	1003	0.97
16	30	0.014	4.7	9.6	0.5	2	23	1010	1032	1009	1032	0.95
17	30	0.00059	0.2	13.9	4.8	1	21	1071	1091	1071	1092	0.94
18	30	0.0022	0.75	12.1	1.8	2	23	1106	1127	1105	1128	0.93
19	30	0.66	2.2e+02	4.3	2.6	1	23	1131	1153	1131	1154	0.95
20	30	0.0066	2.2	10.6	0.9	2	23	1161	1184	1160	1184	0.93
21	30	0.8	2.7e+02	4.0	0.2	2	23	1192	1214	1192	1214	0.95
22	30	3	1e+03	2.2	0.0	2	23	1221	1243	1220	1243	0.87
23	30	0.19	63	6.0	2.7	2	23	1252	1274	1252	1274	0.96
24	30	0.22	74	5.8	0.8	2	23	1280	1302	1280	1302	0.93
25	30	0.035	12	8.3	0.3	1	23	1369	1392	1369	1392	0.96
26	30	0.0092	3.1	10.2	2.6	1	20	1421	1440	1421	1442	0.94
27	30	0.27	90	5.6	1.9	2	23	1530	1552	1529	1552	0.94
28	30	3.4	1.1e+03	2.1	0.9	2	21	1559	1578	1558	1581	0.94
29	30	0.14	47	6.4	1.8	1	23	1592	1614	1592	1614	0.97
30	30	0.04	14	8.1	0.2	2	20	1622	1640	1621	1641	0.94

Sequence Information

Coding Sequence: ATGCTTGTTAGGATTAACGGTAGGAAGGGAATACGAAAAATCATAACACGAACAGGACCGAACGCGACATCTGCAACGGGTAAAGCTCCCAGAATCTCCTGGACAAAGAAAGTCCTCGTCTCGCCATTGATAGCAGAAGATGACAGATTGCCGAAATGCCTTTGCTATAGATGCATGTACAATTTGGAGAACTTCTACGACTTTAGAACGGCTTGCGTCAATGCGGTCGCTCTACTGGAAAGATGTTTACCACCGGAAGAGACGAAGACGGAGATCAAGCAGGAGGGTGAGGAAACTGAGCCGTATTCGGAGCTACGTATGGAGCTACTAAAGGAAAAGGAGAATATGCCAATGCTCATCCCCGAGGCACCCGTCGTCAATCCGAATGCAGCCCTTGGCACCCCGCCGAGACTCATGTCCGACGGGGAGCAGGAGCACGAGATGGAGGACCTCACCCACGATCATGACATGGGTGATGAACATTTGGACGATCAGGATGATCACAAGTCAGATGAATACGAGATGGACATGGAAACAAATCCAAGTGATTTTTTAGAAATGAGCGCAATGGTACCGGAAGAGGAGAACGTGTTGCCTCAAAGTCAAATGCTCGGTCACCATCAGGACACAGGTGTCTTCCAACACCGCAATGAGCAGCACGAAGTGTACGTGTGCTCACTTTGCAACAAAGCTTTCAGTTCCAAGGGACATTTATCGCTTCACGCGCGGATACACGTAGGCGCGGGCGACGTCATCGGTGAGAAGGTTATCACGGACGACCACACCTCGTATAAGAGGCCGTACCAGTGCGACCTATGTAATAAGTCCTACTCGACAGCTAAGCATCGCTGGGGACACGTATCCACGACGCATCGGGGCCATCCCGCTGTGACGTGCGGTTATTGCTCGCGTATCTATTCTACGCGTACGAATCTTGAGGAGCACATAAAGTCACGACATGCGGGCTTACCGCCACCTCCAGAAATGCCGGTTCCCTACGTCCAGCCTGACTCTCGACACCAGTGCAAAACTTGTCCAAAGATGTATACCAACATCACGGATCTTAACAAACATAGTAGAGTCTGTCTGGGCGAGCATCAGCGAAAAGAGATGGCTAACAACAGCCTGAACTCTCAGAGCTTCGATCATACATCAGATTTATCTAGCATTGATTCAGATTATGAGAATAAAGATTATAAAAGTGCTGAGGCAAAACTTGCTAAAAATCCTCAATTAACTATTCTTAAACAAGCTCTTATCAAAGGCGAGAGTGTAAAAAAGGAATACGAGGAAAGGCAGAAAATGTTAAGCAAAGTGAAAAAGCAGTCTAATAGAGATGGGAGTAATTCAGATGCAAAGCGATGGTACTGTGAGGTATGTCCTTTAAACTTTGCTACTGCTGACGATCTTAGGCAGCACGAGAAGAGTCACGATGCCGATAAGCCTTATATATGCATTTTGTGTGAAAAAGATTTTGTTTTAAAATCATCTTTGAGTAGGCATATACTTTCATCTCATGGTGTTGATCCAACACCATTGATCGAAAGTGATAAATGCTTAAAGAAGTCAATGCAAGATAGAAATGCACAACCACTCGTGATAAAAGAGGAACAAAACATTACCAAAGAAAATTCCACATCACCATTTTCTCCTGATAATATGGAAAATGATGATGACGAACAAGAAAACGGAAACGATAATATGCTCGAAATAGAAACTGTTTTTGTCTGTGAAATTTGTACACGAGACTTCAATGATCGAGCGTCACTTTGGTTACACATTCGAGCTACTCATAAAGAATATGCTGCATTTGCCTGTGGAGTTTGCCTGAAAATTTGTTCAGATAATGCACAATTGTTAAATCATGTCAATATGTATCATGGAGGTTCAAAGCTTTTAATGTCTGAACAAAGAAGGTATAGTTGCACGATATGTGGAAGACAGCATGATTCTCGTAAAAAACTTATAACGCATGTATCGATTCACAATGTCGATCCAGGCTATGATCCCGCTAGCTTTGTACAATTAAATACTAATTATTATAATGAGAACGTCAACAGTAATGAAGGAAATGACCTGATCATGGACTGTGATGATGAAAGTGAAAAAGTGGATTGTTACATTTGCTACAAATCATTCCCAAATGAGGATCACCTCATACGTCATCAAAGAAATGCGCATAAAACTGAGCAGATGGTTCAAATGAATGAATTCGGTGGTAATGGCGCAGCTGCCGGACAAAATGGAACTGGAAATCGGGCTCAGTACCACCTCTTCTTCGTATGCGAGCTTTGCGGAAGTTCTCATCCTAGTAAATGGGAACGTTGGCTTCATGTTAGTAGTATGCATAACAATGAACCTTCCATAAAGTGCGAGCGCGATGACTGCGCCAAAATCTTCGCTACAAAGACCTTGCGTAACGAGCACGCGCAGCATCACCAACTCCAGGGCAGCTCACCTAATACCTGTGAGATCTGCGGCAAGCTCTGGGGAAGTCGAGTCGACTATTGGAAACATGTTATGGGTGTGCACTCTGACACGGTACCTCTTATTTGCGGTGTTTGCCTCAAGGTCTTCCCGGATGTATTGCAGCTCAGTCAGCACGTCAAATTAAAACACTGGCCGCTCACTAACGGCGATTTCAGTTGTGATATATGCGGCAGGCCATATTCGAACAAAAGTAAGATGTCACGACACAGGAAAATTCATGGTCTTGATGGAGAGGCTTATAATCCCTCGGCCACCAATAGCAGTTTAATCATCAATGACGCCTCGATGAATGATATGCCTGGTCTTCCAGTTCCTTTGCAACTAGATAATGGTCTACCGCAACCTGTAGAGCCAGCTTCTATCGACTTGAGTTGTGAGATGTGTGGCGACCTTAAGTTCCCTTGCCTAGAGGATTTGTGTAACCACCGGCGTATGGCTCATAGTCTGTTTCCTTGCGATCTTTGTAATAAGTGTTATGGGCGCACTTCGCATCTCTGGAAACATGTTAACCGCGTTCATAAAGGACACGAGGACGTCACTTGTAGATTTTGTCTCAAGACAAGTGCTTCCAAGGATCATCTTGCAGCTCACATTGCCAAGATACATCGATATGAACCTGAACTTAAAAGCGAGATGAGGGATGCAATGNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNACGATGTTCTCCACTTTTGTGAAAAATGTAATAAATCCTTCCACAAGAGGTATCTATTGCGTCGCCACATGAAAGGTTGTCAAAATTATCGAAAGGACCCTGGTGCTCTGTTGACGCGCTGTCGAGCCTGTGAGCGCATTTTCAAGGATCGGGCCAGCTTGCAAAAGCATATTGAAAACCACCACAGCTCTTATGAGTGTCATCTGTGCAAGGAGACGATAACATCGAAACTAGGTATAATGACGCACAATCGCGTGCATCACATGCTTCATCCTGACCTCACTTGCGAGCTCGAGAACTGCCGCAAACTCTTTAGGACGAAGGAGGACTTAGAGTCTCATCGTAAAGATCACAAACACCACGGCAGTCCTAACGTCTGTGATTTTTGTGGAGATACGGTGGAGAATAAATTGAAGCTTAAAATGCATATATTGAGTTTGCACAGAAATGAAATTGGTGTTTCTTGTGGGGTTTGCTTGATCCCCATGAAGGATCCTAAGGACCTTAAGAAACACGTAGAAGATGTTCACGAAAGTGTACTACTTAAACCAAATACTTGTCAGGTGTGCGGTAAGCAATATGCGTCTAAGTGGAAGGCATTTGATCACACTAAGAAATGCCACGGTAAGGTATTCCGCACTTGTAAGCAGTGTCTGGCCGTGTTCACCTCTGACGAAGACTTGCGTTATCACTACGAGCATATACACAACATTCCGAAAGATCAACTGGACGCGTTTCAGTATCGGCTGGAGGTGGCCGGCAACAAGATGGATGACTACGATCTTGGACCGCTTGAGGTCGTTGTAAAGGAAGAGCCCGAAGAGCTTGACTTTGACATGGAGCCCTTCGACGAGGACAATTGTAACTCAAACGATTCGAAGAGGCGTCGTTCTATTGGCGATACCTATGACTGTGAAATATGCCCTGAGATATTTCTCAATCATGAGCTTTTGTCATCCCATTACCGCAATGTCCATAACACCGATCCCACGAGGATGTATAAAAAAATGCGATTGGAGTCTGCAGCCAAAACTAAGAAGAAAACACGTGAGCGTGAAAACTACGAATGCAAGAACTGTCAGAAGCAGTTTTGTACCAAGACACTCTACCTTAGTCACGTGAGCGTGTGTACGCGTAGGTCAACCTCGATTCTCGAGGCTCATCTTAAGAATAACAACCAGGTGAAACGCGAAGAACCCGAGCCTGTTCTATGTGAGACGAACCTTAATATTCCAGACTTCAATCTGTTCGAGGATATCAATATGCAGTTATCAGGACAGAAGCCAGTACCGAGTCTGATGCCTCTTGGTCACTCCTCCTCCAAGACTTCCAAATATTCGCGGAAGGACTCGCGCAAAGTTTATGATGAGTCGACAAATACTGAGTGCACTTGCGAGGTTTGCGGCAAACAGTGGCCTGCCAAAAAGCATCTCTGGCAACACCTTATCCGCTTTCACAGGGCCGAAGCTGCTGTTACTTGCGGCGTCTGCCTAAAGCTGTGTGCCACATATGAAGACCTTGCAGAACACCTTAGATGCGCTCATCCCGCCATACTCTCCACTGCAGGAAATAACTTTACGTGTAAGATATGTGGTCGCTACCATAATGCCCGAAGCAAGCTCTTGCTACATATGAGTATACACATCAATTGTGCTGCTAACTCAATGTGCCAACGCTGCAACAGAAGTTTCGAGAACGACGAAAAGTTGAAGGAGCATATCGGTGCTTGTCTCGGAGCCCAAGGTGAAGAACATAGCCCTGATAAGCCGATGAAAGATGATGGTGAAGAAAAAGGTAGTCTTATAGGTGACGAAGATGAACACGAAGAGAATGATCTCGGAGATGATGAAGAGGAGGAAGTCGAGAGTGTTGAAGAAAAAACAAGATATGAAGCTATGTCCGAGTCAGAGGATGATGTTTACGAAAAGAAAAAGCAAGAATCTGTACTTGTTAATTACTCTGATGATGAGGGACCTCCGGCTCTCAGTGCGATGATGCCGCTTGCTCTGAAGGATGGTAGCAGTGACCGCCAAGAGGATGATAGTCAAGATGAGATGAGTGCCCGTCGCCGTACCCTTAGTAATTCATTAAGCTCGAAAAAGGATAAGAGCGAGGAAAGTGAAAACGACAGTAGCGAAGTTGAAGAAGTAGAAGAAGTTGAAGAGGAGGAGGTTGAGGAAGCTGAGGAAGTCGAAGAAGTCGAAGAAGTCGAAGAAGTCGAAGAAGTCGAAGAAGTCGAAGAAGTAGAGGCTTCCGAGGAAGAGGAAGAGGAAGAAGTGCACCAGGCCGAGATCGTCGATCCCAATAGCGCTTTTCACGTGGATAACAACTCAAGGAGCAGTAATGAAGTTGATGAAAATGATATGCACAATCTAAATGGTACCGTTCTCATGCTAGCCAACGATGCAGACGGGAATCAAATTCTCATTGAGCGTAACATGGCTGATCTTGAAAACGATGATTCAGTTCATGATATGGCACAATATGTGTTCCAAGATGGCACAGGTTTCGCCTTGGAAGATTATGAGGCAATCGTAGAAAGTCAAGGAGATGAAGACGAGGCTGATCAACAGCATCACGATTTTGAGGTAGAGATCAGCAATGTTAACGAGGACCTCGACGAGCAAGAGGTAGAAGAAGAAGAGGAGGAACATGATGATCAGGAAAATGCGCAAGAAGAGGATGAAGATGAGCTCAGCTCTAGTGCCAAAAGCTAA
Protein Sequence: MLVRINGRKGIRKIITRTGPNATSATGKAPRISWTKKVLVSPLIAEDDRLPKCLCYRCMYNLENFYDFRTACVNAVALLERCLPPEETKTEIKQEGEETEPYSELRMELLKEKENMPMLIPEAPVVNPNAALGTPPRLMSDGEQEHEMEDLTHDHDMGDEHLDDQDDHKSDEYEMDMETNPSDFLEMSAMVPEEENVLPQSQMLGHHQDTGVFQHRNEQHEVYVCSLCNKAFSSKGHLSLHARIHVGAGDVIGEKVITDDHTSYKRPYQCDLCNKSYSTAKHRWGHVSTTHRGHPAVTCGYCSRIYSTRTNLEEHIKSRHAGLPPPPEMPVPYVQPDSRHQCKTCPKMYTNITDLNKHSRVCLGEHQRKEMANNSLNSQSFDHTSDLSSIDSDYENKDYKSAEAKLAKNPQLTILKQALIKGESVKKEYEERQKMLSKVKKQSNRDGSNSDAKRWYCEVCPLNFATADDLRQHEKSHDADKPYICILCEKDFVLKSSLSRHILSSHGVDPTPLIESDKCLKKSMQDRNAQPLVIKEEQNITKENSTSPFSPDNMENDDDEQENGNDNMLEIETVFVCEICTRDFNDRASLWLHIRATHKEYAAFACGVCLKICSDNAQLLNHVNMYHGGSKLLMSEQRRYSCTICGRQHDSRKKLITHVSIHNVDPGYDPASFVQLNTNYYNENVNSNEGNDLIMDCDDESEKVDCYICYKSFPNEDHLIRHQRNAHKTEQMVQMNEFGGNGAAAGQNGTGNRAQYHLFFVCELCGSSHPSKWERWLHVSSMHNNEPSIKCERDDCAKIFATKTLRNEHAQHHQLQGSSPNTCEICGKLWGSRVDYWKHVMGVHSDTVPLICGVCLKVFPDVLQLSQHVKLKHWPLTNGDFSCDICGRPYSNKSKMSRHRKIHGLDGEAYNPSATNSSLIINDASMNDMPGLPVPLQLDNGLPQPVEPASIDLSCEMCGDLKFPCLEDLCNHRRMAHSLFPCDLCNKCYGRTSHLWKHVNRVHKGHEDVTCRFCLKTSASKDHLAAHIAKIHRYEPELKSEMRDAMXXXXXXXXXXXXXXXXXXXXXDVLHFCEKCNKSFHKRYLLRRHMKGCQNYRKDPGALLTRCRACERIFKDRASLQKHIENHHSSYECHLCKETITSKLGIMTHNRVHHMLHPDLTCELENCRKLFRTKEDLESHRKDHKHHGSPNVCDFCGDTVENKLKLKMHILSLHRNEIGVSCGVCLIPMKDPKDLKKHVEDVHESVLLKPNTCQVCGKQYASKWKAFDHTKKCHGKVFRTCKQCLAVFTSDEDLRYHYEHIHNIPKDQLDAFQYRLEVAGNKMDDYDLGPLEVVVKEEPEELDFDMEPFDEDNCNSNDSKRRRSIGDTYDCEICPEIFLNHELLSSHYRNVHNTDPTRMYKKMRLESAAKTKKKTRERENYECKNCQKQFCTKTLYLSHVSVCTRRSTSILEAHLKNNNQVKREEPEPVLCETNLNIPDFNLFEDINMQLSGQKPVPSLMPLGHSSSKTSKYSRKDSRKVYDESTNTECTCEVCGKQWPAKKHLWQHLIRFHRAEAAVTCGVCLKLCATYEDLAEHLRCAHPAILSTAGNNFTCKICGRYHNARSKLLLHMSIHINCAANSMCQRCNRSFENDEKLKEHIGACLGAQGEEHSPDKPMKDDGEEKGSLIGDEDEHEENDLGDDEEEEVESVEEKTRYEAMSESEDDVYEKKKQESVLVNYSDDEGPPALSAMMPLALKDGSSDRQEDDSQDEMSARRRTLSNSLSSKKDKSEESENDSSEVEEVEEVEEEEVEEAEEVEEVEEVEEVEEVEEVEEVEASEEEEEEEVHQAEIVDPNSAFHVDNNSRSSNEVDENDMHNLNGTVLMLANDADGNQILIERNMADLENDDSVHDMAQYVFQDGTGFALEDYEAIVESQGDEDEADQQHHDFEVEISNVNEDLDEQEVEEEEEEHDDQENAQEEDEDELSSSAKS

Similar Transcription Factors

Sequence clustering based on sequence similarity using MMseqs2

100% Identity: iTF_00708091;
90% Identity: iTF_01524173;
80% Identity: -