Basic Information

Insect: Drosophila ochracea
Gene Symbol: -
Assembly: GCA_035044125.1
Location: JAWNML010000003.1:9366626-9371144[-]

Transcription Factor Domain

TF Family: zf-C2H2
Domain: zf-C2H2 domain
PFAM: PF00096
TF Group: Zinc-Coordinating Group
Description: The C2H2 zinc finger is the classical zinc finger domain. The two conserved cysteines and histidines co-ordinate a zinc ion. The following pattern describes the zinc finger. #-X-C-X(1-5)-C-X3-#-X5-#-X2-H-X(3-6)-[H/C] Where X can be any amino acid, and numbers in brackets indicate the number of residues. The positions marked # are those that are important for the stable fold of the zinc finger. The final position can be either his or cys. The C2H2 zinc finger is composed of two short beta strands followed by an alpha helix. The amino terminal part of the helix binds the major groove in DNA binding zinc fingers. The accepted consensus binding sequence for Sp1 is usually defined by the asymmetric hexanucleotide core GGGCGG but this sequence does not include, among others, the GAG (=CTC) repeat that constitutes a high-affinity site for Sp1 binding to the wt1 promoter [1].
Hmmscan Out: # of c-Evalue i-Evalue score bias hmm coord from hmm coord to ali coord from ali coord to env coord from env coord to acc

1 25 0.00052 0.033 14.6 0.9 1 23 213 235 213 235 0.97

2 25 2.1e-05 0.0013 19.0 4.3 1 23 241 263 241 263 0.98

3 25 0.02 1.2 9.6 0.7 2 23 296 317 295 317 0.96

4 25 0.0015 0.092 13.1 1.9 1 23 392 415 392 415 0.94

5 25 0.82 52 4.5 0.8 2 22 425 445 425 445 0.95

6 25 4.2 2.6e+02 2.3 0.4 1 19 454 472 454 474 0.91

7 25 0.43 27 5.4 2.0 1 23 592 615 592 615 0.96

8 25 0.0006 0.038 14.4 0.2 1 22 624 645 624 645 0.95

9 25 0.0048 0.3 11.5 4.3 1 23 654 676 654 677 0.96

10 25 6.4e-05 0.004 17.4 0.4 2 23 691 712 690 712 0.97

11 25 1.4e-05 0.00089 19.5 5.2 1 23 718 740 718 740 0.98

12 25 0.12 7.3 7.2 1.0 1 23 879 902 879 902 0.95

13 25 0.0048 0.3 11.5 2.2 1 22 909 930 909 930 0.96

14 25 0.4 25 5.5 0.4 1 20 939 958 939 962 0.86

15 25 5.8e-05 0.0037 17.6 1.6 1 23 986 1008 986 1008 0.97

16 25 0.00044 0.028 14.8 0.7 1 23 1015 1037 1015 1037 0.98

17 25 0.13 8.2 7.0 0.0 2 21 1064 1083 1063 1084 0.94

18 25 0.039 2.4 8.7 4.0 1 23 1129 1152 1129 1152 0.96

19 25 0.0066 0.42 11.1 1.5 1 23 1189 1212 1189 1212 0.96

20 25 0.014 0.88 10.1 3.1 1 23 1239 1262 1239 1262 0.97

21 25 1.3e-05 0.00084 19.6 0.1 2 23 1283 1304 1282 1304 0.95

22 25 4.5e-05 0.0029 17.9 2.9 1 23 1310 1332 1310 1332 0.99

23 25 4.1e-06 0.00026 21.2 2.3 1 23 1338 1360 1338 1360 0.97

24 25 2.8e-07 1.8e-05 24.8 2.6 1 23 1366 1388 1366 1388 0.99

25 25 0.00051 0.032 14.6 0.4 1 22 1394 1415 1394 1418 0.91

#	of	c-Evalue	i-Evalue	score	bias	hmm coord from	hmm coord to	ali coord from	ali coord to	env coord from	env coord to	acc
1	25	0.00052	0.033	14.6	0.9	1	23	213	235	213	235	0.97
2	25	2.1e-05	0.0013	19.0	4.3	1	23	241	263	241	263	0.98
3	25	0.02	1.2	9.6	0.7	2	23	296	317	295	317	0.96
4	25	0.0015	0.092	13.1	1.9	1	23	392	415	392	415	0.94
5	25	0.82	52	4.5	0.8	2	22	425	445	425	445	0.95
6	25	4.2	2.6e+02	2.3	0.4	1	19	454	472	454	474	0.91
7	25	0.43	27	5.4	2.0	1	23	592	615	592	615	0.96
8	25	0.0006	0.038	14.4	0.2	1	22	624	645	624	645	0.95
9	25	0.0048	0.3	11.5	4.3	1	23	654	676	654	677	0.96
10	25	6.4e-05	0.004	17.4	0.4	2	23	691	712	690	712	0.97
11	25	1.4e-05	0.00089	19.5	5.2	1	23	718	740	718	740	0.98
12	25	0.12	7.3	7.2	1.0	1	23	879	902	879	902	0.95
13	25	0.0048	0.3	11.5	2.2	1	22	909	930	909	930	0.96
14	25	0.4	25	5.5	0.4	1	20	939	958	939	962	0.86
15	25	5.8e-05	0.0037	17.6	1.6	1	23	986	1008	986	1008	0.97
16	25	0.00044	0.028	14.8	0.7	1	23	1015	1037	1015	1037	0.98
17	25	0.13	8.2	7.0	0.0	2	21	1064	1083	1063	1084	0.94
18	25	0.039	2.4	8.7	4.0	1	23	1129	1152	1129	1152	0.96
19	25	0.0066	0.42	11.1	1.5	1	23	1189	1212	1189	1212	0.96
20	25	0.014	0.88	10.1	3.1	1	23	1239	1262	1239	1262	0.97
21	25	1.3e-05	0.00084	19.6	0.1	2	23	1283	1304	1282	1304	0.95
22	25	4.5e-05	0.0029	17.9	2.9	1	23	1310	1332	1310	1332	0.99
23	25	4.1e-06	0.00026	21.2	2.3	1	23	1338	1360	1338	1360	0.97
24	25	2.8e-07	1.8e-05	24.8	2.6	1	23	1366	1388	1366	1388	0.99
25	25	0.00051	0.032	14.6	0.4	1	22	1394	1415	1394	1418	0.91

Sequence Information

Coding Sequence: atgttgcCGACGAATATTTGTCGCACGTGTGCGTTGCAAGGTGACAACTTGTTGGCATTGGCTACGCGGAGTGAGAAATACGAAAAGAAAAGTATTTGCGACATGCTGCACGAATTAACACAAAACGatCCACTGCTGGAGCATACAGATGATAATCTACCACAGCATTTGTGCGGCCAGTGCTTGAGCCAGCTGGAAGCTGCCTATGCATTTGTGGTGCAGGTACGCCAGACGCAGGAGCAACTCTTGCTGCAGCTACGTAATGGGTTGCAGACACAGTGCCTGGATGAATCACCCATCGATATAAGCACAGAGCACATCAAAATCGAAGCAGACATTGACCTAGATGCGGACATGGCTGACTTAGTCGATGCTGAgttggaggaggagcaggagaagCAGGTGGCCTTAAAATGTCAGCCGGCAACTGATAGCGATAGTAGTCAAGATAATGTGAAGGACCATCACATTAGGGTCAAAACCCCTCAGCTGCGGCGCAGTGCACGGCGAGCCAAACTGAGCACAGACAGCGAAAATGAGTCTTCCGAGCAGGTGAAGCCGTTGCCTGTTAAGCGTGGACGCGGTCGTCCCGCACGTCTGGCCAAGAGGGAGACGACCACCAACGAGGACGGGCGGCATGTGTGCGAGGTGTGCGGCAAGACATTCTCCTGGTATCGTGACATGCAACGCCATGCGCGCATCCACTTTGAGCAAGCGGGTTTTGTGTGCGAGCACTGCGGCAAGAAGTTCATGCGCAAGGACAAGTACATGACACATCTGCGATCGCACAAGAAGCACGTgtcaacagacagacagacactgCCACGGAGCAACGCGTGGCGCTACGCGGAGCGTCTTTACAGCCCCGGCAGATTCATGCGTGTAGAGTGCAAACTGTGCGGCTTGAGTTGCCAGCGCATTCGGGAGTTGCGCGAGCACCTGGCGAGTCATGTTCACATTGAGACATTGTCGAATCTCAGCCTGGACAACGATGTCATCCGAGAGCAGTTTGGCAGCCAATTGGATTTGCATCAAATAAAGGAAAAGGTGTGCGCGCAAATTGCCAAAGGTCGCGAGCAACTGGAGAATTACGGCGCCGTTGTGAATGCTTACGGCTATGAGCTGTGCCTCAGCGATtcggatgaggaggaggaaggGGAGCTGGCTGGCAAATATCAATGTCTGCGCTGCAATGTCAGCTTTACACGCAAGCACCAACTCATGGGTCACACGCTCGAGGAGCACACGGACAGAAGTGAGACTCTTTTGGAACGCTGCAATATCTGTCAAATTGGCTTTGTTTGCGCCAAGCTGCTGGAACAGCATAAGCGCACGCAGTGCCTCAATCCGCTGAAGCGTTACAGCTGCGAGAATTGTCCTGGCAAGTTTATTTGGCTGCAGAATCTGCAGCAACATGCATGCTGCAGGCCCCAACCGGATATGCAGCATCGGCGgtcggagcagcagcaggtccCTCATCACCAGATCCAATGTTGTCTGTGCAAAGTCCAACCCAGCAGCATGACTGCCCTCCGCTCTCATTTGCTCACGCATCGTGATGGATATACCGGCATTgatccgcagcagcagtctgTCTTCTTTCGCACCTATTACGATGATGCTGGCGCCGGCTGCCTGTCGGAGCTCAGGGCACGTATCACAGGCGATTTTGAGGCACAGCTTTATGGAAGATATTTCAATGCGTGCACGGACAGCGGACAGGAACTGGACTTCAACGACTCCGACAAGGAGTGGAGCGATGCGCCCATTCTGCACAGCTGTGGCGTGTGTGGCGAGAGCAGCGTCTGCCTCGATCAGCTGTTCCAGCATCAGCAGAGCCAGCACATAGAGCTAACGGGCAGCCTGCCTCATGTTTGCTCCGATTGTGGATTGGGCTATGTGTCCGAatcgctgctgcagcagcatcgtcGTCGCATCTGCGCCAAGCTGCATGCCAAGTACAAGTGTCCACTTTGCAGTCAGCGCTTCTATTGGCATTCCAACTACGAGCGGCACATTCAGGTGCATCATCCTACGGATAcgaagcaggagcaggagaagAGCAAGCTGCAGTGCAGCGAGTGCGATAAGGTGTTTATCTGGCCCAAGGATTTGACGCGCCACAAGCGCATGCATCAGTCGCAGGTGCAGTTCGAATGCGCCCACTGCGATCGCAAGTTTCATCGCAAGGATGGCCTTAAGTCACACATGCGGATGCACGGCGAGCAGCCGACGTCGTCTCTCGgtgagcagctgcagcgcatGCCGATGGTATTGAACCAGCTATGTCGCCCCAATGGCTGCAAGCAGATCAAGTGCATGATTTGCCTGTCGCAGCACACGAAGATCTCCGATTTGCGAACTCATTTGACGAGCCATCAGTTGACGCTGTGCTTGGCCGAGGAGCGAGGCATCACAAATATTTGTCGAGCTCTTTATCCGGAGCTGAGTACGCCACTGGATCACCAGGCATTGATCAAGCGCATCCAGCGTGATCTAACCAAAGGCTTGGAGCTGGAAAGATTCGTTTCGATAACCAACGAGGCGGGCATCGAACTAAGCCTGGACAGCAGCGAAACGGATACGGATTCGGATTGTGCAGCGGAAACTGAACGGAGTAGCACGGAACGCCGTTACAGCTGTGAATTGTGCCAGGTGCAGGTGATGCGGAAGCATCAGCTATATGCCCACCAACTGGAACAGCACACGTGGCACCAGACGACGCACGTGTGCAGTCACTGCCAGGCGAGATTCGTGAAtgagcagctgctggagcATCACTATCGCACCCTCTGCCGCAATGCCCAGCGACGTTTCCTGTGTCGCAAGTGTCCATTGCGCTTTCGCTGGCGCGATAATCTGAAGCTGCACAATGGTGTGGCGCATCAGGAGCGAGGGACTGTGGAACAGCACTCCAATGTGGACATTCAGTTGCGTATGCTGCCTGTAGTTAGCTACGACTGTGTCGAGTGCAAGCGTAgcttcaaaatgcaaaaagatcTCACACGGCACACCCTGATGCATGCCCAGGAGTCGAGCATCTATCGGTGTCGCTGGTGCGCACGACGTTTCTATCGCGAGGCGAATCTGCTGCAGCACATCGAGCGACATGGCATCAGCGCCGACCAGCTGCCCTATGCGGAGGCCCTGCTCAACGCCAGCAGGCATCCGCATGGACCGAAGTGCATCCAGTGTCGCGTGTGTGAATTATCCTTTGGCAGCATTGCGGCACTGCGTTCGCATTTGCAATCGTCGCCAGTTGGCACTCATCATCCAATTGAGTCTATGGCCAACTATTCGATCACCAATCAGCTTGGCTACGAACTGCACCTGGACGACTCCGAAACGGATGAAGAAGCCAAGCCGGCCGGCACTCCGGCGCATTACACGTGCGGCATGTGCCAGCTGCGCTGTGTGCGCAAGTTTGAACtgcaccagcatcagcaggcCATGCATCGTCTGGAGCGTATCGGCGACGGCTGCAATCTGTGCATCTTCAAGAGCGTCTCGCCCGATCTAATTGCCTATCATCGGCGTGTGCTGTGCGAGAACACGGAGAAGCAGTTTAAGTGCTCTAAGTGCAGCTACAAGTTTATGTGGCAGTCGAATCTGGTGCAGCACATCCAACTGCAGCATCCCAGCAGCGAAGAGTcgccaacaaaaacagcaatgtCCAAGACCGTGCCCGACATTGATAACGTCGAATGCCACATCTTCCAGTGTGGCCAGTGTCCCAGTAAATACAATCGTAAGGATCGCCTCACCGCCCATGTGAAAAAGTGTCACACGGCTGGCGCAACTACATTAACAAAATCGACAGCGGCTACCAAGCAGCAGAAGAGTTTCCTGTGCGCCTTCTGCGGCAAGGCGGTGAGCTCATCCTCCAATTTAATCATACACATACGTCGGCACACCGGCGAGAAGCCGTTCAAGTGTGATTACTGCGACATGGCCTTTCCGCGTTCCTCCGATCTCCAGTGCCATCGACGCACCCACACCGGCGAACGGCCCCACATCTGCACCGTCTGTAAGAAGGGATTCGCTCGCTCATacaagctgcagcagcacatgCGCATCCACAACGGCGAACGGCCCTACAAGTGCACCTTCTGCGACAAGAGCTTCACCCAGTCCAATGACCTCACCCTCCACATCCGACGCCACACGGGTGAACGACCTTATCAGTGCAATACTTGCGGCGAGCGATTCATTCAGGGCACAGCGCTCAAGAACCATCGACAGCAGAATGGCCACCACGAGACGGAAGTGGATCAATCGAAGGATGACTAA
Protein Sequence: MLPTNICRTCALQGDNLLALATRSEKYEKKSICDMLHELTQNDPLLEHTDDNLPQHLCGQCLSQLEAAYAFVVQVRQTQEQLLLQLRNGLQTQCLDESPIDISTEHIKIEADIDLDADMADLVDAELEEEQEKQVALKCQPATDSDSSQDNVKDHHIRVKTPQLRRSARRAKLSTDSENESSEQVKPLPVKRGRGRPARLAKRETTTNEDGRHVCEVCGKTFSWYRDMQRHARIHFEQAGFVCEHCGKKFMRKDKYMTHLRSHKKHVSTDRQTLPRSNAWRYAERLYSPGRFMRVECKLCGLSCQRIRELREHLASHVHIETLSNLSLDNDVIREQFGSQLDLHQIKEKVCAQIAKGREQLENYGAVVNAYGYELCLSDSDEEEEGELAGKYQCLRCNVSFTRKHQLMGHTLEEHTDRSETLLERCNICQIGFVCAKLLEQHKRTQCLNPLKRYSCENCPGKFIWLQNLQQHACCRPQPDMQHRRSEQQQVPHHQIQCCLCKVQPSSMTALRSHLLTHRDGYTGIDPQQQSVFFRTYYDDAGAGCLSELRARITGDFEAQLYGRYFNACTDSGQELDFNDSDKEWSDAPILHSCGVCGESSVCLDQLFQHQQSQHIELTGSLPHVCSDCGLGYVSESLLQQHRRRICAKLHAKYKCPLCSQRFYWHSNYERHIQVHHPTDTKQEQEKSKLQCSECDKVFIWPKDLTRHKRMHQSQVQFECAHCDRKFHRKDGLKSHMRMHGEQPTSSLGEQLQRMPMVLNQLCRPNGCKQIKCMICLSQHTKISDLRTHLTSHQLTLCLAEERGITNICRALYPELSTPLDHQALIKRIQRDLTKGLELERFVSITNEAGIELSLDSSETDTDSDCAAETERSSTERRYSCELCQVQVMRKHQLYAHQLEQHTWHQTTHVCSHCQARFVNEQLLEHHYRTLCRNAQRRFLCRKCPLRFRWRDNLKLHNGVAHQERGTVEQHSNVDIQLRMLPVVSYDCVECKRSFKMQKDLTRHTLMHAQESSIYRCRWCARRFYREANLLQHIERHGISADQLPYAEALLNASRHPHGPKCIQCRVCELSFGSIAALRSHLQSSPVGTHHPIESMANYSITNQLGYELHLDDSETDEEAKPAGTPAHYTCGMCQLRCVRKFELHQHQQAMHRLERIGDGCNLCIFKSVSPDLIAYHRRVLCENTEKQFKCSKCSYKFMWQSNLVQHIQLQHPSSEESPTKTAMSKTVPDIDNVECHIFQCGQCPSKYNRKDRLTAHVKKCHTAGATTLTKSTAATKQQKSFLCAFCGKAVSSSSNLIIHIRRHTGEKPFKCDYCDMAFPRSSDLQCHRRTHTGERPHICTVCKKGFARSYKLQQHMRIHNGERPYKCTFCDKSFTQSNDLTLHIRRHTGERPYQCNTCGERFIQGTALKNHRQQNGHHETEVDQSKDD

Similar Transcription Factors

Sequence clustering based on sequence similarity using MMseqs2

100% Identity: iTF_00577186;
90% Identity: iTF_00610043;
80% Identity: -