Basic Information

Insect: Drosophila busckii
Gene Symbol: -
Assembly: GCA_011750605.1
Location: NC:15469519-15477280[+]

Transcription Factor Domain

TF Family: zf-C2H2
Domain: zf-C2H2 domain
PFAM: PF00096
TF Group: Zinc-Coordinating Group
Description: The C2H2 zinc finger is the classical zinc finger domain. The two conserved cysteines and histidines co-ordinate a zinc ion. The following pattern describes the zinc finger. #-X-C-X(1-5)-C-X3-#-X5-#-X2-H-X(3-6)-[H/C] Where X can be any amino acid, and numbers in brackets indicate the number of residues. The positions marked # are those that are important for the stable fold of the zinc finger. The final position can be either his or cys. The C2H2 zinc finger is composed of two short beta strands followed by an alpha helix. The amino terminal part of the helix binds the major groove in DNA binding zinc fingers. The accepted consensus binding sequence for Sp1 is usually defined by the asymmetric hexanucleotide core GGGCGG but this sequence does not include, among others, the GAG (=CTC) repeat that constitutes a high-affinity site for Sp1 binding to the wt1 promoter [1].
Hmmscan Out: # of c-Evalue i-Evalue score bias hmm coord from hmm coord to ali coord from ali coord to env coord from env coord to acc

1 18 2e-05 0.0012 18.7 2.1 1 23 289 311 289 311 0.97

2 18 6.5e-06 0.00039 20.2 0.4 1 23 317 339 317 339 0.97

3 18 0.00095 0.057 13.4 0.9 1 23 345 367 345 367 0.95

4 18 1.4e-05 0.00082 19.2 3.1 1 23 373 395 373 395 0.97

5 18 3.1e-05 0.0019 18.1 4.7 1 23 401 423 401 423 0.99

6 18 5.7e-05 0.0034 17.2 5.7 1 23 429 451 429 451 0.97

7 18 2.8e-07 1.7e-05 24.5 4.3 1 23 457 479 457 479 0.98

8 18 1e-07 6e-06 25.9 2.4 1 23 485 507 485 507 0.97

9 18 5.8e-05 0.0035 17.2 6.7 1 23 514 536 514 536 0.97

10 18 0.0001 0.0061 16.5 6.5 1 23 542 564 542 564 0.98

11 18 9e-06 0.00054 19.8 4.5 1 23 570 592 570 592 0.98

12 18 6.5e-06 0.00039 20.2 8.1 1 23 598 620 598 620 0.98

13 18 5.1e-06 0.0003 20.5 7.8 1 23 626 648 626 648 0.97

14 18 6e-07 3.6e-05 23.5 7.7 1 23 654 676 654 676 0.98

15 18 0.00019 0.011 15.6 9.5 1 23 682 705 682 705 0.95

16 18 6.6e-05 0.004 17.0 0.9 1 23 711 733 711 733 0.98

17 18 0.0007 0.042 13.8 4.4 1 23 743 765 743 765 0.98

18 18 8.2e-06 0.00049 19.9 1.6 1 23 771 794 771 794 0.96

#	of	c-Evalue	i-Evalue	score	bias	hmm coord from	hmm coord to	ali coord from	ali coord to	env coord from	env coord to	acc
1	18	2e-05	0.0012	18.7	2.1	1	23	289	311	289	311	0.97
2	18	6.5e-06	0.00039	20.2	0.4	1	23	317	339	317	339	0.97
3	18	0.00095	0.057	13.4	0.9	1	23	345	367	345	367	0.95
4	18	1.4e-05	0.00082	19.2	3.1	1	23	373	395	373	395	0.97
5	18	3.1e-05	0.0019	18.1	4.7	1	23	401	423	401	423	0.99
6	18	5.7e-05	0.0034	17.2	5.7	1	23	429	451	429	451	0.97
7	18	2.8e-07	1.7e-05	24.5	4.3	1	23	457	479	457	479	0.98
8	18	1e-07	6e-06	25.9	2.4	1	23	485	507	485	507	0.97
9	18	5.8e-05	0.0035	17.2	6.7	1	23	514	536	514	536	0.97
10	18	0.0001	0.0061	16.5	6.5	1	23	542	564	542	564	0.98
11	18	9e-06	0.00054	19.8	4.5	1	23	570	592	570	592	0.98
12	18	6.5e-06	0.00039	20.2	8.1	1	23	598	620	598	620	0.98
13	18	5.1e-06	0.0003	20.5	7.8	1	23	626	648	626	648	0.97
14	18	6e-07	3.6e-05	23.5	7.7	1	23	654	676	654	676	0.98
15	18	0.00019	0.011	15.6	9.5	1	23	682	705	682	705	0.95
16	18	6.6e-05	0.004	17.0	0.9	1	23	711	733	711	733	0.98
17	18	0.0007	0.042	13.8	4.4	1	23	743	765	743	765	0.98
18	18	8.2e-06	0.00049	19.9	1.6	1	23	771	794	771	794	0.96

Sequence Information

Coding Sequence: ATGCAGCACGTGAGCGCTGCCACTTCGGCGCCTTCGGTGGTCTCAGCACCAGCAGTGGTAACCACTGGCGGTGGCACGACCATAACACTTGGCGGACCGCCACCACTAGCATTGCACGGTGGTAAACACTTGGTggagcatcatcatcatcatcagcagcagcagcaacaacaacagcagcagcagcagcagcataaacagGAACCCGGTTTAGTGGGTGTTAAGGCGCCAGCAGCGGCGCACGGCTTGGAAATGTATAAAGTGAACATTGAGGATATATCGCAGCTATTTACCTATCACGAGGTCTTTGGCAAAATCCATGGCGATGTGGTGAATCATGTGGCGGCGGTGCACGGCAGTCAgctgccaccaccaccgcagctgccgccgccgccgccactgccgcccacacaagcaacaacgcAAACAACGCATGCGGCTAGCGCAGCTGTTgccgcagcggcggcgtccaCAAATAATGCAGCCGTTGCCGCTGTAATGGCCTCGGCCaatgcggcggcagcggctgcagccgcatcagcagcggcaaatgcacagcaacagcagcagcagcaacaacagcagcagcaacaacaacaacagcagcagcagcaacagcagcagcagcagcaacaacagcagcagcagccagctgtGGCTGCAAGCACTGGCAGTGgtgccaccgccaccaccaaTACTAGCAGCAGTGCTGCCGGTGGTGCTGGCGGTGCCACCACAGTGACAAGCACGGGTGAGTTGCTAATGCCCAAAATGGAGGGCGGCCTGCATGGCGTCGATGGTCAAGCGGGCGGCACTGGGAGTGTTGCTTTAGCCCCAGACGGCACCCCCATAGCCACGGGTACGCATGTGTGCGACATTTGTGGGAAAATGTTTCAGTTTCGCTATCAGCTGATTGTGCACCGTCGCTACCACAGCGAGCGCAAGCCGTTCATGTGTCAAGTATGCGGTCAGGGCTTTACCACATCGCAGGATTTAACACGCCATGGTAAAATACATATTGGCGGTCCCATGTTCACCTGCATTGTGTGCTTCAATGTGTTTGCAAATAACACTAGCCTGGAGCGGCATATGAAACGCCATTCGACGGACAAGCCATTCGCCTGCACCATTTGCCAAAAGACCTTTGCACGCAAAGAGCATCTGGACAATCATTTTCGCTCCCATACCGGCGAAACGCCGTTTCGTTGCCAGTATTGCGCCAAGACGTTTACGCGCAAGGAGCATATGGTTAACCATGTGCGCAAACACACGGGTGAGACGCCACATCGTTGCGATATTTGTAAGAAGTCATTTACGCGCAAGGAACACTATGTTAACCACTACATGTGGCACACTGgtCAAACCCCACATCAGTGCGATGTCTGTGGCAAGAAATATACACGCAAGGAGCATCTAGCCAATCACATGCGCTCCCATACTAACGAGACGCCCTTCCGTTGTGAAATCTGCGGCAAGAGCTTCAGTCGCAAGGAGCACTTCACCAATCACATACTCTGGCATACAGCAGGCGAGACGCCGCATCGGTGTGACTTCTGCTCCAAGACGTTTACACGGAAGGAGCATCTGTTGAATCACGTGCGTCAGCATACGGGAGAGTCGCCGCACCGCTGCTCTTACTGCATGAAGACGTTCACGCGCAAGGAGCATCTGGTGAATCACATACGACAGCACACGGGTGAGACTCCGTTCAAGTGCACGTACTGCACGAAAGCGTTCACGCGCAAAGATCACATGGTTAATCATGTACGGCAACATACAGGCGAATCGCCGCACAAGTGCACCTACTGCACCAAGACGTTCACACGCAAGGAGCACTTGACGAACCATGTGCGCCAGCATACGGGCGATTCGCCGCACCGTTGCACCTACTGCAAGAAGACCTTCACCCGCAAGGAGCACCTGACGAACCATGTGCGGCTCCACACCGGCGACTCGCCGCACAAGTGCGAGTACTGCCAGAAGACGTTCACCCGCAAGGAGCATCTCAATAATCATATGCGCCAGCACTCGAGCGACAATCCCCATTGCTGCAATGTCTGCAATAAGCCCTTCACCCGCAAGGAGCATCTCATCAATCACATGTCCCGCTGCCACACCGGCGATCGCCCCTTCACCTGCGAAACCTGCGGCAAGTCCTTCCCCTTGAAGGGCAATCTCCTCTTCCATCAGCGCAGCCACACCAAGGGCCAAGAGTGCGAACGTCCATTCTCCTGCGAAAAGTGCCCCAAAAACTTTATATGCAAAGGTCATTTAGTCTCGCATATGCGCTCCCATTCGGGCGAGAAGCCACACGCGTGCACATTGTGCAGCAAGGCGTTTGTGGAGCGCGGCAATTTGAAGCGCCACATGAAGATGAACCATCCGGATGCCATGATGCCGCCACCACCAGTGCATCCGCATCCACAGATACCGGCTGGTGTGCTGACCCAGGTCAAGCAGGAAGTCAAACCGATCATAAtacCGCATCACTCGACGACGACCACAATGCACACCATACAGCAGATAAccgctggcgctgccgctgcgggCGCCGGAGCCGTCCAGCTGACACCCGGCCTAGTGCCGCTTGTGACCAGCACGCTCATCTCCTCGCACAATGCGCAGCAGacgcagaagcagcagcaagcagccgccgctgtggctgcgcagcaacaagcggccgcagcagccgccgcacagcaacaggcagcggcagcagctgcagcgcagcaacaggctgtggcagcagctgcgcatcatcaacaacaggttgctgcacagcagcagcagcagcaacaacagcaacaggctgCAGTGGCagcgcatcagcagcaacagcagcagctgcagcagcaacaattgctgcaattgtccatacatcatcatcagcaacatcagcagcagcagcagcaacaacagcaacaacatcatcaacaacagcagcaacatcctGGCCaagcgccgcagcagcaacaacaacagcagcagcagcaacaacaacagccaccgCCGCAGGTGCCCATTGCCTTGATAAGTGATCCCAGCGCATTGGCGCGCGCTGccatgcagctgcaacatctGCCCAGCAATGTTGAACAGCATCCAGTTTACTAA
Protein Sequence: MQHVSAATSAPSVVSAPAVVTTGGGTTITLGGPPPLALHGGKHLVEHHHHHQQQQQQQQQQQQQHKQEPGLVGVKAPAAAHGLEMYKVNIEDISQLFTYHEVFGKIHGDVVNHVAAVHGSQLPPPPQLPPPPPLPPTQATTQTTHAASAAVAAAAASTNNAAVAAVMASANAAAAAAAASAAANAQQQQQQQQQQQQQQQQQQQQQQQQQQQQQQQPAVAASTGSGATATTNTSSSAAGGAGGATTVTSTGELLMPKMEGGLHGVDGQAGGTGSVALAPDGTPIATGTHVCDICGKMFQFRYQLIVHRRYHSERKPFMCQVCGQGFTTSQDLTRHGKIHIGGPMFTCIVCFNVFANNTSLERHMKRHSTDKPFACTICQKTFARKEHLDNHFRSHTGETPFRCQYCAKTFTRKEHMVNHVRKHTGETPHRCDICKKSFTRKEHYVNHYMWHTGQTPHQCDVCGKKYTRKEHLANHMRSHTNETPFRCEICGKSFSRKEHFTNHILWHTAGETPHRCDFCSKTFTRKEHLLNHVRQHTGESPHRCSYCMKTFTRKEHLVNHIRQHTGETPFKCTYCTKAFTRKDHMVNHVRQHTGESPHKCTYCTKTFTRKEHLTNHVRQHTGDSPHRCTYCKKTFTRKEHLTNHVRLHTGDSPHKCEYCQKTFTRKEHLNNHMRQHSSDNPHCCNVCNKPFTRKEHLINHMSRCHTGDRPFTCETCGKSFPLKGNLLFHQRSHTKGQECERPFSCEKCPKNFICKGHLVSHMRSHSGEKPHACTLCSKAFVERGNLKRHMKMNHPDAMMPPPPVHPHPQIPAGVLTQVKQEVKPIIIPHHSTTTTMHTIQQITAGAAAAGAGAVQLTPGLVPLVTSTLISSHNAQQTQKQQQAAAAVAAQQQAAAAAAAQQQAAAAAAAQQQAVAAAAHHQQQVAAQQQQQQQQQQAAVAAHQQQQQQLQQQQLLQLSIHHHQQHQQQQQQQQQQHHQQQQQHPGQAPQQQQQQQQQQQQQPPPQVPIALISDPSALARAAMQLQHLPSNVEQHPVY

Similar Transcription Factors

Sequence clustering based on sequence similarity using MMseqs2

100% Identity: iTF_00560429;
90% Identity: -
80% Identity: -