Basic Information

Insect: Pollenia griseotomentosa
Gene Symbol: -
Assembly: GCA_963931875.1
Location: OZ007563.1:9738488-9745602[-]

Transcription Factor Domain

TF Family: zf-C2H2
Domain: zf-C2H2 domain
PFAM: PF00096
TF Group: Zinc-Coordinating Group
Description: The C2H2 zinc finger is the classical zinc finger domain. The two conserved cysteines and histidines co-ordinate a zinc ion. The following pattern describes the zinc finger. #-X-C-X(1-5)-C-X3-#-X5-#-X2-H-X(3-6)-[H/C] Where X can be any amino acid, and numbers in brackets indicate the number of residues. The positions marked # are those that are important for the stable fold of the zinc finger. The final position can be either his or cys. The C2H2 zinc finger is composed of two short beta strands followed by an alpha helix. The amino terminal part of the helix binds the major groove in DNA binding zinc fingers. The accepted consensus binding sequence for Sp1 is usually defined by the asymmetric hexanucleotide core GGGCGG but this sequence does not include, among others, the GAG (=CTC) repeat that constitutes a high-affinity site for Sp1 binding to the wt1 promoter [1].
Hmmscan Out: # of c-Evalue i-Evalue score bias hmm coord from hmm coord to ali coord from ali coord to env coord from env coord to acc

1 27 0.13 21 7.6 1.3 1 23 252 275 252 275 0.91

2 27 2.1e-05 0.0034 19.5 2.0 1 23 281 304 281 304 0.97

3 27 0.00012 0.02 17.1 1.8 2 23 334 355 333 355 0.97

4 27 0.002 0.34 13.2 0.6 1 23 432 455 432 455 0.96

5 27 0.12 20 7.6 1.1 2 23 463 484 462 484 0.97

6 27 6.1 1e+03 2.3 0.5 2 19 493 510 492 512 0.92

7 27 0.00033 0.055 15.7 1.3 2 23 529 550 528 550 0.97

8 27 0.083 14 8.2 0.7 2 20 563 581 562 584 0.94

9 27 0.014 2.3 10.6 2.9 1 23 663 686 663 686 0.95

10 27 0.0034 0.56 12.5 0.2 1 20 693 712 693 714 0.95

11 27 0.091 15 8.0 0.2 2 23 726 748 725 748 0.94

12 27 0.00039 0.065 15.5 0.4 2 23 763 784 762 784 0.97

13 27 2.8e-07 4.7e-05 25.4 1.9 1 23 790 812 790 812 0.98

14 27 0.014 2.2 10.6 1.9 1 23 957 981 957 981 0.96

15 27 2 3.4e+02 3.8 1.2 2 21 989 1008 988 1009 0.89

16 27 1.3 2.2e+02 4.4 0.7 3 23 1020 1041 1019 1041 0.95

17 27 0.0099 1.6 11.1 4.2 1 23 1051 1073 1051 1074 0.95

18 27 0.014 2.3 10.6 6.7 1 23 1081 1103 1081 1104 0.94

19 27 0.00074 0.12 14.6 0.1 2 19 1130 1147 1129 1150 0.94

20 27 0.004 0.67 12.3 4.5 1 23 1203 1226 1203 1226 0.97

21 27 0.052 8.6 8.8 0.7 1 23 1263 1286 1263 1286 0.97

22 27 0.072 12 8.3 6.2 1 23 1318 1341 1318 1341 0.97

23 27 5.2e-07 8.5e-05 24.5 0.7 1 23 1368 1390 1368 1390 0.96

24 27 3.2e-06 0.00053 22.0 0.4 1 23 1396 1418 1396 1418 0.99

25 27 3.8e-06 0.00064 21.8 2.9 1 23 1424 1446 1424 1446 0.98

26 27 6.2e-06 0.001 21.1 2.1 1 23 1452 1474 1452 1474 0.99

27 27 0.049 8.1 8.9 0.7 1 22 1480 1501 1480 1504 0.90

#	of	c-Evalue	i-Evalue	score	bias	hmm coord from	hmm coord to	ali coord from	ali coord to	env coord from	env coord to	acc
1	27	0.13	21	7.6	1.3	1	23	252	275	252	275	0.91
2	27	2.1e-05	0.0034	19.5	2.0	1	23	281	304	281	304	0.97
3	27	0.00012	0.02	17.1	1.8	2	23	334	355	333	355	0.97
4	27	0.002	0.34	13.2	0.6	1	23	432	455	432	455	0.96
5	27	0.12	20	7.6	1.1	2	23	463	484	462	484	0.97
6	27	6.1	1e+03	2.3	0.5	2	19	493	510	492	512	0.92
7	27	0.00033	0.055	15.7	1.3	2	23	529	550	528	550	0.97
8	27	0.083	14	8.2	0.7	2	20	563	581	562	584	0.94
9	27	0.014	2.3	10.6	2.9	1	23	663	686	663	686	0.95
10	27	0.0034	0.56	12.5	0.2	1	20	693	712	693	714	0.95
11	27	0.091	15	8.0	0.2	2	23	726	748	725	748	0.94
12	27	0.00039	0.065	15.5	0.4	2	23	763	784	762	784	0.97
13	27	2.8e-07	4.7e-05	25.4	1.9	1	23	790	812	790	812	0.98
14	27	0.014	2.2	10.6	1.9	1	23	957	981	957	981	0.96
15	27	2	3.4e+02	3.8	1.2	2	21	989	1008	988	1009	0.89
16	27	1.3	2.2e+02	4.4	0.7	3	23	1020	1041	1019	1041	0.95
17	27	0.0099	1.6	11.1	4.2	1	23	1051	1073	1051	1074	0.95
18	27	0.014	2.3	10.6	6.7	1	23	1081	1103	1081	1104	0.94
19	27	0.00074	0.12	14.6	0.1	2	19	1130	1147	1129	1150	0.94
20	27	0.004	0.67	12.3	4.5	1	23	1203	1226	1203	1226	0.97
21	27	0.052	8.6	8.8	0.7	1	23	1263	1286	1263	1286	0.97
22	27	0.072	12	8.3	6.2	1	23	1318	1341	1318	1341	0.97
23	27	5.2e-07	8.5e-05	24.5	0.7	1	23	1368	1390	1368	1390	0.96
24	27	3.2e-06	0.00053	22.0	0.4	1	23	1396	1418	1396	1418	0.99
25	27	3.8e-06	0.00064	21.8	2.9	1	23	1424	1446	1424	1446	0.98
26	27	6.2e-06	0.001	21.1	2.1	1	23	1452	1474	1452	1474	0.99
27	27	0.049	8.1	8.9	0.7	1	22	1480	1501	1480	1504	0.90

Sequence Information

Coding Sequence: atgtCTAGCTATATTAAAATTGAATGTTTAATAAATGGAGTTCGTTATAAATGCCGCACTTGTTTTGATCCAGGAAGAACATTTTACTCCCTTAGAGATGAGTACAGCAAGTCCAAAACTTTGTGTGATTTATTGAAGGATATTACTCAAATACAGACAAACGACGATGATTTACTCCCAAAAACAATGTGTTGCAAATgcttagaaaaactaaaaagttcCTACGATTTTATACTTCAGATTCATGATGTCAATAAAAAATACTCACAATTGTTAGACAATTGCGATGATCCATTGCAGGAAGTTGATAATTTTACCGATTGTTTGGCCGAATCAACAATTGACTTACCATTGAATCAGTATATTCCAGAAATTAAGATAGAGGAAGATTTCCCTGATACTTTTAACATTGTTTTAGATAACAATCAATGCGCAGGGGACAGTGAAGCAAAATTAGAAAACGAAGGTGTACCGGAAGCTGAAGATTCTTTAGGTAACATTAATACAGATGACTTTAAAACAAGTGCCCAATTAGGAGAACGTAAAAAGTATTATTTGAAAACCAGAAGGAATCGAAACGTAGATGAAGATTGTAATGATAATagcTCGTCTTCATCTGATGAAAGTGATTATGTGCCActcaaaaagttaaagaaagaaaaatgtaaCAATACCAGCAGTCCGCTTGTTAAACGCAAAAAAGGTCGCCAAGCTCCACAATATTAtgataaaattgaaaaagttaACGATCGTTTTGTGTGCCTCATATgccaaaaaacattttcattacgAAAGGATTGTGGTCGACATATAGCGTCGATTCATTTGCGCCAAACCATGTTTCCTTGCGAAATTTGCGGACAACGTTTTAGTCGTAAAGACAAAATACAACATCATATTAAACGTATGCATTCCGGCGGAATAGCGTATCCGCCTAAACATAAGGAATGGTTGTTTGGAGATCGTTTATATTATAAGCCTTCTACTTGGCTTCTTGTGCAATGTAAATTGTGTGATGAAACATTTAAAACGACAAAAGAACTTCGTCAACATCTTACTAAACACAGTAAGTTTGACACTCTTCATAATTTAGAAATAAGCAGTAACGTTATCCAACATTTGTTTGGAAATATGATCGATTTGAACATCGTGAAGGAAAGCATATGCAAAGATATCCGcgaagaaaatttgtttaaatactaCACAGTGTTGAATAAATATGGCTATGAAATGTCCATTAGTGATACGGAAGTTGAAGACATGAATGAAGAAGATCCAGAGTGTCCCAAGAAATACAAGTGCGATTTATGTGCAAAAgagttttcttttcaatatcAAGTTTTCGCTCATTTAAAGGAGGTTCATGGCGAAaatgaaatttctttaaaatgtaaTCTATGCAAATTAGAATTTATTTCAATCAAAATGTATGAACAACATTCAAAAACGCACTGCCGTAatagaaataaagttttagTTTGTGCGCATTGTCCAGCAAAATTTGTTTGGCCTGATAATATGAAAAACCACAATTGTGCCACTAAAATGCTGCTTATCTCAaaagaattatataaaaaaccaCTAAAATGTAATATTTGCGATCGAAAATTTGAGGTAAAGactaaatatgaaaaacatttagAAACGCATAAAGACGGAAGAACGGTATCTGCAAAGACTATAATCCGTTGTGGCCTTTGCGCGCACTCCTTCGACAAGCTTAGAAATTTACGCCAACATATGCCTTTACATGCGGATGGAAAGACTGGTATTGACTTTAAAGGCTGTATTTATGTGAAACGTTTCGAACGTGCAAAATCAATTGATTTTGCTTTACTACAGCAGGAAATACAAAACGCTTATAGTAAATCTCAAATAAGTCGTTTTTATCGAGCTATTAATAGGGATGGTAATGAGCTGGACATTTTGGATTCGGATAGTGATACGGAGGAAGCCAAGGATAATGATCAAGCTTTAGAAAATGAATATAAATGTGAACTTTGTAATTCAGCATTcagaaaaagaaaacttttattaaatcatCAACACGAGAGTCACAATGGTGTGCCTTTGCCTTTCACGTGTAACGACTGTACCCAGCAATATGTAAGTAATGATTTATTGCAGCAACATTTGGTAAGGGATTGTTGGAATGAACATCGGCGAATAGCTCAACAATGTGACTATTGTAATGCTCGATTTATATGGCCAAATAATCtattaaaacataaagaaattcagCATAAAAATCAGAAACAACCAAAGCCTCAAAGAGCAAGTACACTAAAATGTGAGTATTGCGAAAAAGTATTCATATGGCCCAAGGATTTGGTGCGTCATAGAAAAACGCATACAGAAGGGAAAAAATTTACTTGTCCGCATTGTGATCGTAAATTTCAACGCAAAGACAATTTGTTAGCGCACATCAGAATACATTGTCCTGATGGCATTCCCACTGTTTCCAATCCCGGTAAAAGCATCGACTACATACTACCACATTTAATAAAGCCACATGGCTGCAAACGCATTAAATGCATGATATGTTATTCTGAACACAATCGCATACGCGATTTGAGATCTCATTTACGAACACATCGGTATGCAGTACACTttgaaaaaagaagagaaatCGAAAGTTTGGAAGTCATATCTTCTCAACTATATCCAGATGAGCCAGTTGCTTTAACAGAAGATGTATTAGTAAAACGTATCAGCTCCGATATTGTTGCGGAAAATAATTTAGAACGTTTTTACTCTATAACAAATGAAAATGGATATGAAGTTTCTTTAGACAGTTCTGAAACGGAAAGCGATTCTGATGACAATGACAACGATAACGATAAAGAAGTCCATAAATCAAAACGTATTTATAAATGCGATTTATGtccaaatttaagttttaatcgTAAATACAAACTTTTCGCCCACCAAAACAATAAGCATACTTGGGAAGAAGCTCGTCATATTTGTATACACTGTAACGGGCGATTTATTTCATCATATATGCTGCAACTACACTATAAGAATCAAtgtaaaaatactaaaaaacgaAACTTTTGCCGTCGTTGTCCCTTGCGATTTATGTGGAAGAGTAATATGAAAGCTCATATCACAATGGAACATGGTCACGAGatcgATTTAACTCGAGGCCATGAATGTTTTCTATGTcaagaaaagttttttcctcAAAAAGAGCTTCAACGTCACTTGATCACACATCATTCTGCGGATGCTGAACTTCATTACTGCCTCCTCTGTCCAAAAACGTTCTTTAGCGTAGAACATCTTAATAAACATTTGAGTCGACATCATTTGACTACAGACGATGTCGAAAGCGTTGAAAGTATAATACATTCCACATGCTGGCCTAACGgtgaaaaagttattaaatgcaaaatatgtggcCAAACATTTGATACAATGGGCAACTTAAGAGAACACTTTTCCCTCAAAAACCCTCAAAACATGTGTTATAATCATCATTCGTTTGCAAATTACTCGGCGATCAATCAAAAGGGGTTCGAATTGGATTTGGAACTGGACTCTGAAACAGAAGTGGAAGCCGAGGTGCAATATAAAAGgggtcaaaaaaatattaaatatccCTATAATTGTTGTATGTGTAGTATGTCATTCAAAAGAAAGTATCAAATAGCTCAACATCAGCGTTCTATGCATAACTATGAAATGTTGGCTCTAAAATGTGATCACTGTATTTTTAGAACAGTCTCACAgAAAGTTTTAGATTACCACAAGGCAACGCAGTGTTTAAATACAGAAAAGCAATTCGAATGTGAACAgtgtaaattcaaatttatgtggCAAGAGAATCTAGAAAATCATGTTATTACGTTTCATACTCTAAAAGATTCCAAAGCAACAAATGCTGCAGCACCAATACCGACTTCTAATGAACCTGTACCAACCAATAGCAAAAATGATactaatatttttgagtgtATGGACTGTCACCGCCGTTATAACCGCAAAGACCGTTATAAAGCTCACTTCAAAAAGTTCCACGGCGAGGAATTACAAATAACCCCAGAAAGGAAAAGCTCAAAAGTTCGCAAACAGGCCATACCAAAAAcggaaaaattgtatttatgtgCCTTTTGTGGCCTTTCCTTTTCAAACAATTCAAATCTTACTGTGCACATGAGAAGACACACAGGAGAGAAGCCATTTAAGTGTGATCTTTGCGAAATGGGCTTTCCACGTTCATCCGACTTACAAGCCCACCGTCGCACACATACTGGAGAACGTCCCTTTAAATGTATGTACTGCGATAAATCATTTTCGCGACAATACAAATTGAATGTTCACAACCGCATACATACCGGCGAGCGTCCTTACCAGTGCTCGTTTTGTCAGAAATCATTTATTCAATCAAACGATTTGACTCTACACTTGCGTCGTCATACGGGTGAAAGACCCTATATGTGTGAAGTTTGTGGTGAAGGTTTTATATGCGCCACATCTCTCAAACAACATCGTAATTCTAAAGGACACCAAGaagaaaaaattgatttaaaaatgtgtgtTCAACAGTTGACACAATTTGACATGAAATTCTAA
Protein Sequence: MSSYIKIECLINGVRYKCRTCFDPGRTFYSLRDEYSKSKTLCDLLKDITQIQTNDDDLLPKTMCCKCLEKLKSSYDFILQIHDVNKKYSQLLDNCDDPLQEVDNFTDCLAESTIDLPLNQYIPEIKIEEDFPDTFNIVLDNNQCAGDSEAKLENEGVPEAEDSLGNINTDDFKTSAQLGERKKYYLKTRRNRNVDEDCNDNSSSSSDESDYVPLKKLKKEKCNNTSSPLVKRKKGRQAPQYYDKIEKVNDRFVCLICQKTFSLRKDCGRHIASIHLRQTMFPCEICGQRFSRKDKIQHHIKRMHSGGIAYPPKHKEWLFGDRLYYKPSTWLLVQCKLCDETFKTTKELRQHLTKHSKFDTLHNLEISSNVIQHLFGNMIDLNIVKESICKDIREENLFKYYTVLNKYGYEMSISDTEVEDMNEEDPECPKKYKCDLCAKEFSFQYQVFAHLKEVHGENEISLKCNLCKLEFISIKMYEQHSKTHCRNRNKVLVCAHCPAKFVWPDNMKNHNCATKMLLISKELYKKPLKCNICDRKFEVKTKYEKHLETHKDGRTVSAKTIIRCGLCAHSFDKLRNLRQHMPLHADGKTGIDFKGCIYVKRFERAKSIDFALLQQEIQNAYSKSQISRFYRAINRDGNELDILDSDSDTEEAKDNDQALENEYKCELCNSAFRKRKLLLNHQHESHNGVPLPFTCNDCTQQYVSNDLLQQHLVRDCWNEHRRIAQQCDYCNARFIWPNNLLKHKEIQHKNQKQPKPQRASTLKCEYCEKVFIWPKDLVRHRKTHTEGKKFTCPHCDRKFQRKDNLLAHIRIHCPDGIPTVSNPGKSIDYILPHLIKPHGCKRIKCMICYSEHNRIRDLRSHLRTHRYAVHFEKRREIESLEVISSQLYPDEPVALTEDVLVKRISSDIVAENNLERFYSITNENGYEVSLDSSETESDSDDNDNDNDKEVHKSKRIYKCDLCPNLSFNRKYKLFAHQNNKHTWEEARHICIHCNGRFISSYMLQLHYKNQCKNTKKRNFCRRCPLRFMWKSNMKAHITMEHGHEIDLTRGHECFLCQEKFFPQKELQRHLITHHSADAELHYCLLCPKTFFSVEHLNKHLSRHHLTTDDVESVESIIHSTCWPNGEKVIKCKICGQTFDTMGNLREHFSLKNPQNMCYNHHSFANYSAINQKGFELDLELDSETEVEAEVQYKRGQKNIKYPYNCCMCSMSFKRKYQIAQHQRSMHNYEMLALKCDHCIFRTVSQKVLDYHKATQCLNTEKQFECEQCKFKFMWQENLENHVITFHTLKDSKATNAAAPIPTSNEPVPTNSKNDTNIFECMDCHRRYNRKDRYKAHFKKFHGEELQITPERKSSKVRKQAIPKTEKLYLCAFCGLSFSNNSNLTVHMRRHTGEKPFKCDLCEMGFPRSSDLQAHRRTHTGERPFKCMYCDKSFSRQYKLNVHNRIHTGERPYQCSFCQKSFIQSNDLTLHLRRHTGERPYMCEVCGEGFICATSLKQHRNSKGHQEEKIDLKMCVQQLTQFDMKF

Similar Transcription Factors

Sequence clustering based on sequence similarity using MMseqs2

100% Identity: iTF_01237890; iTF_01235959;
90% Identity: iTF_01235959; iTF_01237890;
80% Identity: -