Basic Information

Insect: Bradysia odoriphaga
Gene Symbol: ZNF711_1
Assembly: GCA_016920775.1
Location: JAFDOW010001217.1:702536-711485[-]

Transcription Factor Domain

TF Family: zf-C2H2
Domain: zf-C2H2 domain
PFAM: PF00096
TF Group: Zinc-Coordinating Group
Description: The C2H2 zinc finger is the classical zinc finger domain. The two conserved cysteines and histidines co-ordinate a zinc ion. The following pattern describes the zinc finger. #-X-C-X(1-5)-C-X3-#-X5-#-X2-H-X(3-6)-[H/C] Where X can be any amino acid, and numbers in brackets indicate the number of residues. The positions marked # are those that are important for the stable fold of the zinc finger. The final position can be either his or cys. The C2H2 zinc finger is composed of two short beta strands followed by an alpha helix. The amino terminal part of the helix binds the major groove in DNA binding zinc fingers. The accepted consensus binding sequence for Sp1 is usually defined by the asymmetric hexanucleotide core GGGCGG but this sequence does not include, among others, the GAG (=CTC) repeat that constitutes a high-affinity site for Sp1 binding to the wt1 promoter [1].
Hmmscan Out: # of c-Evalue i-Evalue score bias hmm coord from hmm coord to ali coord from ali coord to env coord from env coord to acc

1 23 0.31 16 6.1 0.2 6 23 108 125 102 125 0.87

2 23 0.065 3.3 8.2 0.6 1 23 131 153 131 153 0.95

3 23 1.4e-06 6.9e-05 22.9 0.2 2 23 158 179 158 179 0.98

4 23 0.0013 0.066 13.6 0.2 1 23 185 209 185 209 0.97

5 23 6.5e-05 0.0033 17.6 2.7 2 23 236 257 235 257 0.96

6 23 6.1e-06 0.00031 20.9 0.9 1 23 263 285 263 285 0.98

7 23 1.6e-05 0.00082 19.5 3.2 1 23 291 314 291 314 0.97

8 23 0.0038 0.19 12.1 2.5 1 23 323 346 323 346 0.96

9 23 9.9e-08 5e-06 26.5 0.2 1 23 453 475 453 475 0.98

10 23 1.7e-06 8.8e-05 22.6 0.5 1 23 481 505 481 505 0.98

11 23 0.14 7.1 7.1 5.3 1 21 541 561 541 563 0.95

12 23 7.6e-06 0.00039 20.6 1.8 1 23 616 638 616 638 0.98

13 23 0.0098 0.5 10.8 2.0 1 23 644 666 644 666 0.97

14 23 0.0017 0.087 13.2 0.9 1 23 672 694 672 694 0.96

15 23 0.0028 0.14 12.5 3.1 2 23 701 722 700 722 0.96

16 23 2.7e-05 0.0013 18.9 1.1 2 23 944 965 943 965 0.98

17 23 0.00032 0.016 15.5 2.6 1 23 971 994 971 994 0.94

18 23 0.0025 0.13 12.6 1.0 1 23 1001 1023 1001 1023 0.95

19 23 6.5e-06 0.00033 20.8 4.1 1 23 1029 1051 1029 1051 0.98

20 23 0.00032 0.016 15.5 0.3 1 23 1133 1155 1133 1155 0.97

21 23 8.9e-08 4.5e-06 26.7 0.3 2 23 1160 1181 1159 1181 0.97

22 23 2.5e-06 0.00012 22.1 0.8 1 23 1187 1209 1187 1209 0.96

23 23 0.00058 0.029 14.7 3.7 1 21 1215 1235 1215 1236 0.95

#	of	c-Evalue	i-Evalue	score	bias	hmm coord from	hmm coord to	ali coord from	ali coord to	env coord from	env coord to	acc
1	23	0.31	16	6.1	0.2	6	23	108	125	102	125	0.87
2	23	0.065	3.3	8.2	0.6	1	23	131	153	131	153	0.95
3	23	1.4e-06	6.9e-05	22.9	0.2	2	23	158	179	158	179	0.98
4	23	0.0013	0.066	13.6	0.2	1	23	185	209	185	209	0.97
5	23	6.5e-05	0.0033	17.6	2.7	2	23	236	257	235	257	0.96
6	23	6.1e-06	0.00031	20.9	0.9	1	23	263	285	263	285	0.98
7	23	1.6e-05	0.00082	19.5	3.2	1	23	291	314	291	314	0.97
8	23	0.0038	0.19	12.1	2.5	1	23	323	346	323	346	0.96
9	23	9.9e-08	5e-06	26.5	0.2	1	23	453	475	453	475	0.98
10	23	1.7e-06	8.8e-05	22.6	0.5	1	23	481	505	481	505	0.98
11	23	0.14	7.1	7.1	5.3	1	21	541	561	541	563	0.95
12	23	7.6e-06	0.00039	20.6	1.8	1	23	616	638	616	638	0.98
13	23	0.0098	0.5	10.8	2.0	1	23	644	666	644	666	0.97
14	23	0.0017	0.087	13.2	0.9	1	23	672	694	672	694	0.96
15	23	0.0028	0.14	12.5	3.1	2	23	701	722	700	722	0.96
16	23	2.7e-05	0.0013	18.9	1.1	2	23	944	965	943	965	0.98
17	23	0.00032	0.016	15.5	2.6	1	23	971	994	971	994	0.94
18	23	0.0025	0.13	12.6	1.0	1	23	1001	1023	1001	1023	0.95
19	23	6.5e-06	0.00033	20.8	4.1	1	23	1029	1051	1029	1051	0.98
20	23	0.00032	0.016	15.5	0.3	1	23	1133	1155	1133	1155	0.97
21	23	8.9e-08	4.5e-06	26.7	0.3	2	23	1160	1181	1159	1181	0.97
22	23	2.5e-06	0.00012	22.1	0.8	1	23	1187	1209	1187	1209	0.96
23	23	0.00058	0.029	14.7	3.7	1	21	1215	1235	1215	1236	0.95

Sequence Information

Coding Sequence: ATGGAATTCGTTACCGAGTTTGATTTAACCAATCAACAGATTGTTCTATTGAATGGCATTGATATTGTGTCGGGACGCGACAGTCCCACCGATTTCATCAATTGTCCCGTTGGTGACTTAGGACTCGAGCAAATACAGTATCCTGAGTGCATCTTAGATGAAACAAACAATAATCCATCGAATGGTGACGGGCACCAGCAACATCAATTCCAAATCATAAAACAGCGGAACGGCAATCGCTATATGAAATtcaagaaatcgaagaaaaatgtgaaaacaaaaCTTGTTGATCAACAACCACAACAGTGTCCTGTCGCACCGTGCCGGGCAGTATTTaccagtaaattgaaattgagaaaACATGTCCAGGAGCATGCATTCAAGAAGCAACATCGCTGCGACACTTGTTTTGAAGAGTTTAATGTGCTGGAAAACCTTATGCTGCACGCATCGTTACATTCGAATGATGGTCGTTGTCCGCAATGTGGGAAAGTGTTTCGACGATTGGCCAGCTTGGAAGGGCACATCAAAACTCATTTCAAAAATGAATACTACACATGTACGCAGGGCTGCGGCGAAATGTTCCCTCTGGAATGGATGTTAAAGCAACACATGAACCAATTCCATCCGACTGAAATTTCAAAAGACCAACAAGAAAAGGAAGAGCTAGCCAAACAGCGAAAACTTAAACGAAGGAATTTGCTTAGCTGTCAATACTGTGGCAAGCAATTCACCAAAAATTGCCTGCTGATACGGCACGAACGGATTCACAACGGTCAGAAACCCTTTGAATGTGATAGATGTGACCGAAGCTTTGCTCAGAAGAACACTTTGGTCATCCATCAACGGCGACATTCCGACCATCGAATGTATCAGTGCACACACTGTCCGCAAACATTCGTTCAGAAAGGGAATCTGCTGTCGCACATAGCCAAATGTCATACATACAAGGAGGGCGAGCCGAGTTTTCCGTGCAACCAGTGCTCGTGTACGTTCAAGAAAATCGGCACTTTGAACGCTCACATCAGCAAGTTCCATGCAGCGCAGAGCGTACTGGTCGACGATGATCTTGGATTTAAATTGGACGATGTGATGAAGGAACTGAACGATCTGCATCGATCAAATTCTTTGGAGAATGAACTGATATCGAAGGATCTGTTTTTCAATCTTCCCGTTATTATGCCGCCGGCAACATCCGAAGAGATTCAAAATGCGGTAGTCGGTGGCGATAAACAATCGGAATATGCAAACACAACGAATGCTACACAAAGCTCACTAAAACTGGCTGTTCATACGAGCAACGGAATGGTTACCCATCGCAGTGTAATGCAAAGAATTTATGGGAATATGCGCTGCTATGTGTGCCTGTACTGCCCGAAAGAATTTCGTCGTCCCTCTGACCTTGTTCGTCACATACGCATTCATACAAAGGAGAAGCCATTTTCCTGCCCGATTGCGAATTGTGGCAAGAAATTTTCGGTCAAAAGTTCGCTGAGCAAACACCTCAACACCCATTCGAAATCGTCACAGCAACACGCCTGCGGTGTATGTATGCAGACATTTCCGAGCGCCGAAACCTTCGACGAACATTGTGCGCTGAAACACCAGGACAATCCAATATTTCAATGCTTCATTTGTTCGCGACTGTGCGTCACAAATGGGGAGCTGAAGCGCCACTTAAAATGTCATCGATCGCCGGTCAAAGCTAAAAAACCCGTACGGCAACAGGAATGTGACGACGATGGTATCCAACTGGAGATTGTTATGAAAGAACCGATAATGTTGACCGACGATGGACAAATTGAAGTGACGGCGGAGAAACCTGTACCCGATCAGGAGCGAAAGTTTGAGTGCTCTGTGTGTCCTAGTACATTTAAGCGGAACAGTCATTTAAAAGAACACATTTTGTCGCACCTGGGCGTTAAAGCTCATAAATGCGAGATATGCTTAAAGTCCTTTGGTAAAATGAGCATCTTAAATCGACACATGCTGTATCACTCCAACGAGAAGAAGTTCAATTGTGGAACGTGTAACGCCAGCTTCATCTCAAACAATCAACTGAGTCGACACAGCTTGAAACATACAAGCCAAAGAAATGTCATGTGTCCCTATTGCCAGAAGCGCTTCAAAAGCAAAGCAACATGCCGCACCCATTTGCAAATCCACAAAACCCAGTGGATGAAGCAGTTCAAAGAGCAATTAAAATCGGGAACAATTCAGTTCGAAGAGGACGTGACGCTCGGTCAACCGAACGACCAGCCTGCACTCGATGTCGTGACATCGGCCACAAATGAACACCTGTTGCAATCGTTACACAATGACAACACCGATTCGTTTCACGAAACGGTCCAACGCAACGACGAGAGTAACCAGGTTTTGTTCACCAATTTGGTGCAAGACGCTCAGATGGACGACTCACGAAATCAGTTCGAATATTTCCTGTTGTTGCCTTCAAATGGCGATCCGAATGGCATTACAACCGGTGCCGACGGTAGATCGGATGGTGAACAGCAGTTCGTTGTGGACGATGATCAGCTCAATTTTGCCAATTTACAATTCATTCGGCTGGATCAGTCGGCCTTGTTAGAATTGGAAAATTCTGCAACGGAAACCGTTATTTCTATGGCAAAACATCGACTGAATGACAATGAGTTGAACCGACCGGAAATGGTTTTGAATACTGATTGTAATGAGTCACAAGTGCCTGTACCTGAATCTACACGACCTACAAATGTCGACGTGTCAACGGAATCGTCGAAAGAAATTCAATTGGCGAACAAACCGTTGGCTAATGTCCAGAGGACTAGAAAGTCCACAAAGTCTATCAACAAATGCGAGAcctgtttgaaaattttcaaaaaaccaaTTGATCTTCGGCGACACATTCGGACCCATACTTTAGAAAAGCCTTTCAGCTGTTCCAATTGCCCGAGATCGTTCAGCCTCAAAAGCACCTTACAGAATCACAACAAGAACAAACACTCCGACATGAAAGAGATGCATCCCTGTACGGTCTGTTGGAAGGCATTCTCGTCAAAACATGCGGTCATCACCCATTCGCTAATCCATTCCAATTCGCGTCCATTCAAATGCGAGTACTGCACGACGACATTTCGAACGCGTGGCCATTTGAAAATCCATCAACAAATCCATCTGAGGGAAGGACGCAAGTTGGGTGTGAATCCGTCGGagattaaaacgaaaaaagagAAAGCGAAACTATTGCCGCTGATGAATGTGGTGCAAGAGTTCGGTGACCCGACTGTTTACGAAGAGTTTGTCGATCACAATGGATTCGTTGAGGAAATGCCAGATTCAACGGTATTTAGAGTGGAACGATCGGACTCTGACACGGGAAATCACATAGTCAATACCGAATCTCTAACACATACAATTTACCAGTGCTCCTTTTGTCCGGAGCAATTCAACGACAAGGACAATTACAGTGCCCATGCAGCTAGCCACAAAGAAAACCTTCGTTGTCCTGATTGTCAAAAAGTGTTTACCAAGCCAAGCCTTCTGAAGCGACACATGATTGTGCATTACGGTCGAAAGGAATTTACGTGCAAAATTTGCCAAAAATCTTATACTCAGAAAGCGACACTGCAAGCACATATGGGTCTGCACACGGACGGCGCTTCGTTCGAGTGTTCACAGTGTCacaaaaagttcaatttcaaaacgaatcTTACGACCCACGAACGACAATGCATTTTGTTGAACAACCAGACACCTTCGGAATATAACATCGGAATCTCGtaa
Protein Sequence: MEFVTEFDLTNQQIVLLNGIDIVSGRDSPTDFINCPVGDLGLEQIQYPECILDETNNNPSNGDGHQQHQFQIIKQRNGNRYMKFKKSKKNVKTKLVDQQPQQCPVAPCRAVFTSKLKLRKHVQEHAFKKQHRCDTCFEEFNVLENLMLHASLHSNDGRCPQCGKVFRRLASLEGHIKTHFKNEYYTCTQGCGEMFPLEWMLKQHMNQFHPTEISKDQQEKEELAKQRKLKRRNLLSCQYCGKQFTKNCLLIRHERIHNGQKPFECDRCDRSFAQKNTLVIHQRRHSDHRMYQCTHCPQTFVQKGNLLSHIAKCHTYKEGEPSFPCNQCSCTFKKIGTLNAHISKFHAAQSVLVDDDLGFKLDDVMKELNDLHRSNSLENELISKDLFFNLPVIMPPATSEEIQNAVVGGDKQSEYANTTNATQSSLKLAVHTSNGMVTHRSVMQRIYGNMRCYVCLYCPKEFRRPSDLVRHIRIHTKEKPFSCPIANCGKKFSVKSSLSKHLNTHSKSSQQHACGVCMQTFPSAETFDEHCALKHQDNPIFQCFICSRLCVTNGELKRHLKCHRSPVKAKKPVRQQECDDDGIQLEIVMKEPIMLTDDGQIEVTAEKPVPDQERKFECSVCPSTFKRNSHLKEHILSHLGVKAHKCEICLKSFGKMSILNRHMLYHSNEKKFNCGTCNASFISNNQLSRHSLKHTSQRNVMCPYCQKRFKSKATCRTHLQIHKTQWMKQFKEQLKSGTIQFEEDVTLGQPNDQPALDVVTSATNEHLLQSLHNDNTDSFHETVQRNDESNQVLFTNLVQDAQMDDSRNQFEYFLLLPSNGDPNGITTGADGRSDGEQQFVVDDDQLNFANLQFIRLDQSALLELENSATETVISMAKHRLNDNELNRPEMVLNTDCNESQVPVPESTRPTNVDVSTESSKEIQLANKPLANVQRTRKSTKSINKCETCLKIFKKPIDLRRHIRTHTLEKPFSCSNCPRSFSLKSTLQNHNKNKHSDMKEMHPCTVCWKAFSSKHAVITHSLIHSNSRPFKCEYCTTTFRTRGHLKIHQQIHLREGRKLGVNPSEIKTKKEKAKLLPLMNVVQEFGDPTVYEEFVDHNGFVEEMPDSTVFRVERSDSDTGNHIVNTESLTHTIYQCSFCPEQFNDKDNYSAHAASHKENLRCPDCQKVFTKPSLLKRHMIVHYGRKEFTCKICQKSYTQKATLQAHMGLHTDGASFECSQCHKKFNFKTNLTTHERQCILLNNQTPSEYNIGIS

Similar Transcription Factors

Sequence clustering based on sequence similarity using MMseqs2

100% Identity: iTF_00245620;
90% Identity: iTF_00245620;
80% Identity: -