Basic Information

Insect: Deroplatys truncata
Gene Symbol: ZNF212_1
Assembly: GCA_030765065.1
Location: CM060983.1:47539166-47542846[+]

Transcription Factor Domain

TF Family: zf-C2H2
Domain: zf-C2H2 domain
PFAM: PF00096
TF Group: Zinc-Coordinating Group
Description: The C2H2 zinc finger is the classical zinc finger domain. The two conserved cysteines and histidines co-ordinate a zinc ion. The following pattern describes the zinc finger. #-X-C-X(1-5)-C-X3-#-X5-#-X2-H-X(3-6)-[H/C] Where X can be any amino acid, and numbers in brackets indicate the number of residues. The positions marked # are those that are important for the stable fold of the zinc finger. The final position can be either his or cys. The C2H2 zinc finger is composed of two short beta strands followed by an alpha helix. The amino terminal part of the helix binds the major groove in DNA binding zinc fingers. The accepted consensus binding sequence for Sp1 is usually defined by the asymmetric hexanucleotide core GGGCGG but this sequence does not include, among others, the GAG (=CTC) repeat that constitutes a high-affinity site for Sp1 binding to the wt1 promoter [1].
Hmmscan Out: # of c-Evalue i-Evalue score bias hmm coord from hmm coord to ali coord from ali coord to env coord from env coord to acc

1 23 0.00029 0.19 15.0 3.5 1 23 141 163 141 163 0.97

2 23 0.0074 4.9 10.6 5.2 1 23 168 190 168 190 0.97

3 23 0.067 44 7.6 0.1 1 21 201 221 201 222 0.92

4 23 0.00048 0.32 14.3 3.4 1 23 266 288 266 288 0.98

5 23 0.00047 0.31 14.4 0.3 1 23 291 313 291 313 0.98

6 23 6.4e-06 0.0043 20.2 0.9 1 23 321 343 321 343 0.99

7 23 0.0072 4.8 10.6 2.0 1 23 414 436 414 436 0.97

8 23 0.0013 0.84 13.0 1.2 1 23 442 465 442 465 0.97

9 23 1.7e-05 0.011 18.9 3.1 1 23 529 552 529 552 0.97

10 23 0.00044 0.29 14.5 4.4 1 23 558 580 558 580 0.99

11 23 0.01 6.8 10.2 1.7 1 23 603 625 603 625 0.95

12 23 0.00086 0.58 13.5 1.3 1 23 631 653 631 653 0.98

13 23 9e-06 0.006 19.8 5.3 2 23 663 684 662 684 0.97

14 23 0.003 2 11.8 4.4 1 23 690 713 690 713 0.96

15 23 6.3e-05 0.042 17.1 0.0 1 23 745 767 745 767 0.98

16 23 0.0018 1.2 12.5 2.1 1 23 790 812 790 812 0.92

17 23 2e-05 0.013 18.7 3.7 1 22 830 851 830 851 0.96

18 23 0.00032 0.22 14.9 1.1 1 23 914 936 914 936 0.93

19 23 0.00011 0.073 16.4 1.6 1 23 1055 1077 1055 1077 0.97

20 23 0.00011 0.076 16.3 2.1 1 23 1116 1138 1116 1138 0.97

21 23 0.00088 0.59 13.5 2.2 1 23 1144 1166 1144 1166 0.98

22 23 0.0029 1.9 11.9 2.1 1 23 1172 1195 1172 1195 0.97

23 23 0.0002 0.13 15.6 0.1 1 23 1201 1224 1201 1224 0.97

#	of	c-Evalue	i-Evalue	score	bias	hmm coord from	hmm coord to	ali coord from	ali coord to	env coord from	env coord to	acc
1	23	0.00029	0.19	15.0	3.5	1	23	141	163	141	163	0.97
2	23	0.0074	4.9	10.6	5.2	1	23	168	190	168	190	0.97
3	23	0.067	44	7.6	0.1	1	21	201	221	201	222	0.92
4	23	0.00048	0.32	14.3	3.4	1	23	266	288	266	288	0.98
5	23	0.00047	0.31	14.4	0.3	1	23	291	313	291	313	0.98
6	23	6.4e-06	0.0043	20.2	0.9	1	23	321	343	321	343	0.99
7	23	0.0072	4.8	10.6	2.0	1	23	414	436	414	436	0.97
8	23	0.0013	0.84	13.0	1.2	1	23	442	465	442	465	0.97
9	23	1.7e-05	0.011	18.9	3.1	1	23	529	552	529	552	0.97
10	23	0.00044	0.29	14.5	4.4	1	23	558	580	558	580	0.99
11	23	0.01	6.8	10.2	1.7	1	23	603	625	603	625	0.95
12	23	0.00086	0.58	13.5	1.3	1	23	631	653	631	653	0.98
13	23	9e-06	0.006	19.8	5.3	2	23	663	684	662	684	0.97
14	23	0.003	2	11.8	4.4	1	23	690	713	690	713	0.96
15	23	6.3e-05	0.042	17.1	0.0	1	23	745	767	745	767	0.98
16	23	0.0018	1.2	12.5	2.1	1	23	790	812	790	812	0.92
17	23	2e-05	0.013	18.7	3.7	1	22	830	851	830	851	0.96
18	23	0.00032	0.22	14.9	1.1	1	23	914	936	914	936	0.93
19	23	0.00011	0.073	16.4	1.6	1	23	1055	1077	1055	1077	0.97
20	23	0.00011	0.076	16.3	2.1	1	23	1116	1138	1116	1138	0.97
21	23	0.00088	0.59	13.5	2.2	1	23	1144	1166	1144	1166	0.98
22	23	0.0029	1.9	11.9	2.1	1	23	1172	1195	1172	1195	0.97
23	23	0.0002	0.13	15.6	0.1	1	23	1201	1224	1201	1224	0.97

Sequence Information

Coding Sequence: atgCTGCTGGATATCAAGCAGGAGCAGATAGAAGAATGTGAGCCAGAGCAACGAGAAAATACACATGTGATCATTGATGACCCATTGAGTTTCACAACAGAAAGTCACAGATTGCAGCATGCCTCTGAGTCTAACAGAATCTACCCAATAAGACAGATCAAGAATGAACCATTTGATTGTGAGGACAATGATATATCTATTACTGATGAATTGGATAGAAATGACAGTGCTGAGATTGTGTCACCAGATAacatggaggatctcttggaagaggaattagaagatgagagagaagaaatggagaaagatgaaaaagaagaaaatggagtTGAAAGGAGATCAACAAGAAATAGAACGCTCTCAATAAGGAACACTCCAAACTTTTATACAGATGACGATGTGTATTCCGATAAAGAGGCATACTTCTGTGTTCATTGCAACAAGGCATTTCCATTTAGGTCGTACTATTTGCGTCATCTCAAAGTACACAATAGGGATGACTTTATGTGTACGCAGTGCAATAAGCAGTTTTCCTGCAAGCGCAATTTGGATAGACATGTCAGACTTCACCGAAGGATTCCTGCTGGTGGCAAGAAACTTTACCCTTGTATATACTGCCCAGAGGTGTTTGACAACAGTGTGAAATATGCAAGGCATCGTAAGAACTGCAAGGGCCCAAATGCAGCACCAAAAGTTCTACCAAAAGCACGGCCTCAGGAGTCACAGGTAAAAGAGTCAATGGAAATTTTTAAGCCATTCTCAGAGGATAGTACAAACAGCGATGGAAGAACTACATTTCCATGTTACATATGTGAAAGAAATTTTAATAGCATACATAAATTACAAACACATCGAAGGACACACAGCGATTTCAATTGTAATCGTTGTGGCAAATCATTTGATGGAGGTATTGCATTGAGCAATCATTTACGACGGCATAATTTTGATGGTTTTAAGCGTTATACTTGCAAGATATGCCAGAAGAACTTCACTAATATCAGTGCATTGGTCAGTCATAAAAGAATACATACCTTGAGAGGTGAGACTCGGCAACTTGCTTCCTTGCCCATGATTCCCAAGGCAAAAACCTTACCACCTGCTAAAAACATACCACCTGTTAGAAGCTTACCACATGCCAAAAGCTTTGCAACAGCCAAAAGCCTAGCTTCGGCCAAAACCTTATCAGCCACCAGTAAACTGATGAGCATGCACCCTGAAATTCCTGCACGTGGTGGCGGCTACAATTGTGCCATCTGCCACAAATGGGTGAAAACTCGCTCAGTTCTGAAACGGCATATGACAAGTCATACAAAGTTGAAACTCTTCAAATGCAGCATTTGTGATGTTTCCATGGGTTATGCATCATCATTGCATAAGCACATGAGACTTACTCACAATATTGAGATTACATATGGAGATATTCGTGAGATGTTTGATGTACCCGCTATTGAAGAACAAGAGGCAATTGCAGTAGAGAAAGACCCACCAGTCAAGAAACAAGTACAGAAACAGAATCCTGTACCAGATACAACTCCGAAACAAAAGGTTGGTGAAATGAATTCATTAATTTCAACAGTTGGCAACTATCATTGTAACATATGCGAGAAAATTTTCACTAATAAACATCTGCTAAACAATCATGTGAAGATAATACACATGGGAGGTAAGGCTTATAAATGCAACACCTGCTCAAAACTCTTTGCCTATAAGCATCTGTTGGCAAAGCACTCAAGAACACATGCAGGTGGAGTCACCAGCAAGCTGCAGCAAAAGCAGACACCTGCCTATGAAGAGGCAGCACAAGAATTTACCTGCAATGTCTGCTGTCGCTCTTTCCCTGATGCTAAGACCCTAAATAATCACAAAGGTGTTCATACACGCTTCAAATGCTACTCATGTTCCATATGCTTCAAGACTTTCAATGGAATGCGAAACTGGGAGCAGCACCAGAAGCTTCATTCACTTCATTCTTCCATTATCAACTGCAGATGCAAGCTTTGTGGGAAGAAGTTCACATCTCGCAGTGAATTGAATGAACACAAAAAGACTCACATCACATTAAAAATCTATACTTGTGGCGTATGCAAGAATTCTTACAACAGTAGTTCATCATTAAACAAACACAAGCATCGCAAACATGGCGGCTTTGGGGACACCGAAGTACGGCAGATTGATAGTGGTGGCTCCATTATCGATGAAGTGCTGAGTGATGTAGAAGAAGTAGACCGTTGCTATGTGTGTGATATATGCAATAAAGTTTACGGGGATGAAGAAGAACTGGAAAATCACAAAATGATCCATGTGCAGAGAGTTGCAGTTCCCAACAAAACTGCAGCCTCCAACAAAAGTGCAGTTTCAAAAGGAGCGTTTCATTGCGACCTGTGCAGACGAAATTTTCCTGACCAGTCTTCACTCAGCAAGCATAAAGGTTGGCACTCGAGACGAAGCTTCACACATCCAATAGTGGTAACTGGGAAGAAGCGGGTATATAGTTGTAATTACTGCCATAGAACTTTCACAAACAGTGGGTCTCTCTCAAAGCATAAGCGTAAAAATTGCCCTCCCAAAAGATTCTACAAAGGAGACTTCATGAATCCTTCAGTGCAGGCAGTTCAGCGgcaagaagaggaagaaatgGTAGATGAAGTGTCAGCACCGGATTCACCTTCTGATGCACTTTCTTCGCAACCAGCAGCAAGGATGCCACAAATAACTCTTGGATCACAAAAggtgaaaaaatttccatgtccCTCATGTGACAGACATTTTAATAACAAGCGTGCACTTGTTCGCCACAAGGGTTGGCACACACGTCAAGTTAAACGGCAGTCATTGGCAGCGGCAGAAGCAGAAAAAGCTGAAGAAACACCATCTTCTTCTCCAGTGCCACCAGAACCGTCATCGCCATCACCACCAGATTCATCATCACCGCCACCCCTAGAATCATCATCGCCACCACGTTTAGagtcatcatcaccaccacccctAGAATCATCACCACTACCATCATCAGTTGAATTAACTGAATCCAAGGAAACAAAGGATGAAAAAATGGAGGAAATTGACCTAAATGAGCTAAATGAATCGCCAGAAGTGAAGCCAGAGGAGGAGGAGCAGCAGCCGCCACCACCAAAACAGACTGATGGAGAAGCTAACAGCAGACATCCATGCAACATCTGCTTCAAGGTTTACAGCTCTGCTTCAATGCTTGATAAGCACAAACGTCTACACAGACGTAAGGCGCTTCCAAACAAGGTGATAAAGTATTCAGACTCTCCAGAACCGGAAAAGCCACCTGTTTTATCACCTGAGCTGCCTCCTGTAGAAGGAAACGATGAAGGGCTGCATCCATGCAGATATTGCAGTAAAGCTTTCACCTTCCGTCGCAACCTCATCGATCATGAACGTGTGCATACAGGAGAGCGGCCATTTTCCTGCAACGTATGTCATCTCACATTTTCTCGCCGTGCCATACTCTGGCGCCACAAGAAAGTGCATCTTGGTGTGCGTCCATTTTCATGTTCCATTTGTTCCAAATCTTTCCTTCTGAACTTCCAGCTGACCCTCCACATGAGACAAAAGCACTCGGAGAAGGCTGCATATGAATGCGTGAAGTGTGACAAGACACTGGACACGAGTGAAGCTCTTGAAAAGCATGAACTTACAGAACATAGTGAATAA
Protein Sequence: MLLDIKQEQIEECEPEQRENTHVIIDDPLSFTTESHRLQHASESNRIYPIRQIKNEPFDCEDNDISITDELDRNDSAEIVSPDNMEDLLEEELEDEREEMEKDEKEENGVERRSTRNRTLSIRNTPNFYTDDDVYSDKEAYFCVHCNKAFPFRSYYLRHLKVHNRDDFMCTQCNKQFSCKRNLDRHVRLHRRIPAGGKKLYPCIYCPEVFDNSVKYARHRKNCKGPNAAPKVLPKARPQESQVKESMEIFKPFSEDSTNSDGRTTFPCYICERNFNSIHKLQTHRRTHSDFNCNRCGKSFDGGIALSNHLRRHNFDGFKRYTCKICQKNFTNISALVSHKRIHTLRGETRQLASLPMIPKAKTLPPAKNIPPVRSLPHAKSFATAKSLASAKTLSATSKLMSMHPEIPARGGGYNCAICHKWVKTRSVLKRHMTSHTKLKLFKCSICDVSMGYASSLHKHMRLTHNIEITYGDIREMFDVPAIEEQEAIAVEKDPPVKKQVQKQNPVPDTTPKQKVGEMNSLISTVGNYHCNICEKIFTNKHLLNNHVKIIHMGGKAYKCNTCSKLFAYKHLLAKHSRTHAGGVTSKLQQKQTPAYEEAAQEFTCNVCCRSFPDAKTLNNHKGVHTRFKCYSCSICFKTFNGMRNWEQHQKLHSLHSSIINCRCKLCGKKFTSRSELNEHKKTHITLKIYTCGVCKNSYNSSSSLNKHKHRKHGGFGDTEVRQIDSGGSIIDEVLSDVEEVDRCYVCDICNKVYGDEEELENHKMIHVQRVAVPNKTAASNKSAVSKGAFHCDLCRRNFPDQSSLSKHKGWHSRRSFTHPIVVTGKKRVYSCNYCHRTFTNSGSLSKHKRKNCPPKRFYKGDFMNPSVQAVQRQEEEEMVDEVSAPDSPSDALSSQPAARMPQITLGSQKVKKFPCPSCDRHFNNKRALVRHKGWHTRQVKRQSLAAAEAEKAEETPSSSPVPPEPSSPSPPDSSSPPPLESSSPPRLESSSPPPLESSPLPSSVELTESKETKDEKMEEIDLNELNESPEVKPEEEEQQPPPPKQTDGEANSRHPCNICFKVYSSASMLDKHKRLHRRKALPNKVIKYSDSPEPEKPPVLSPELPPVEGNDEGLHPCRYCSKAFTFRRNLIDHERVHTGERPFSCNVCHLTFSRRAILWRHKKVHLGVRPFSCSICSKSFLLNFQLTLHMRQKHSEKAAYECVKCDKTLDTSEALEKHELTEHSE

Similar Transcription Factors

Sequence clustering based on sequence similarity using MMseqs2

100% Identity: iTF_01410918;
90% Identity: -
80% Identity: -