Basic Information

Insect: Trichogramma evanescens
Gene Symbol: -
Assembly: GCA_902732785.1
Location: CACVKI010141663.1:27298-30245[+]

Transcription Factor Domain

TF Family: zf-C2H2
Domain: zf-C2H2 domain
PFAM: PF00096
TF Group: Zinc-Coordinating Group
Description: The C2H2 zinc finger is the classical zinc finger domain. The two conserved cysteines and histidines co-ordinate a zinc ion. The following pattern describes the zinc finger. #-X-C-X(1-5)-C-X3-#-X5-#-X2-H-X(3-6)-[H/C] Where X can be any amino acid, and numbers in brackets indicate the number of residues. The positions marked # are those that are important for the stable fold of the zinc finger. The final position can be either his or cys. The C2H2 zinc finger is composed of two short beta strands followed by an alpha helix. The amino terminal part of the helix binds the major groove in DNA binding zinc fingers. The accepted consensus binding sequence for Sp1 is usually defined by the asymmetric hexanucleotide core GGGCGG but this sequence does not include, among others, the GAG (=CTC) repeat that constitutes a high-affinity site for Sp1 binding to the wt1 promoter [1].
Hmmscan Out: # of c-Evalue i-Evalue score bias hmm coord from hmm coord to ali coord from ali coord to env coord from env coord to acc

1 17 0.016 1.4 9.7 0.1 1 20 73 92 73 94 0.94

2 17 0.00023 0.02 15.5 0.1 1 20 110 129 110 131 0.94

3 17 0.0039 0.33 11.6 0.4 2 23 147 169 146 169 0.90

4 17 0.0041 0.35 11.5 0.2 3 23 175 196 174 196 0.96

5 17 0.00027 0.023 15.2 1.3 1 23 202 224 202 224 0.96

6 17 3.2e-05 0.0027 18.2 2.9 2 23 232 254 231 254 0.94

7 17 0.0046 0.39 11.4 1.8 1 23 278 300 278 300 0.98

8 17 0.0011 0.091 13.4 0.7 2 23 307 327 306 327 0.97

9 17 0.00051 0.043 14.4 0.2 1 23 331 353 331 353 0.98

10 17 0.00096 0.081 13.5 1.7 1 23 459 481 459 481 0.97

11 17 2.8 2.4e+02 2.6 0.1 1 23 486 509 486 509 0.73

12 17 0.013 1.1 10.0 3.1 2 21 515 534 514 536 0.92

13 17 9.8e-05 0.0082 16.6 3.5 1 23 544 566 544 566 0.96

14 17 3.2e-05 0.0027 18.2 0.3 1 23 579 601 579 601 0.98

15 17 6.6 5.5e+02 1.5 0.1 2 8 608 614 607 621 0.88

16 17 3.2e-05 0.0027 18.2 0.9 3 23 636 656 634 656 0.96

17 17 7.7e-06 0.00065 20.1 1.2 1 23 662 684 662 684 0.98

#	of	c-Evalue	i-Evalue	score	bias	hmm coord from	hmm coord to	ali coord from	ali coord to	env coord from	env coord to	acc
1	17	0.016	1.4	9.7	0.1	1	20	73	92	73	94	0.94
2	17	0.00023	0.02	15.5	0.1	1	20	110	129	110	131	0.94
3	17	0.0039	0.33	11.6	0.4	2	23	147	169	146	169	0.90
4	17	0.0041	0.35	11.5	0.2	3	23	175	196	174	196	0.96
5	17	0.00027	0.023	15.2	1.3	1	23	202	224	202	224	0.96
6	17	3.2e-05	0.0027	18.2	2.9	2	23	232	254	231	254	0.94
7	17	0.0046	0.39	11.4	1.8	1	23	278	300	278	300	0.98
8	17	0.0011	0.091	13.4	0.7	2	23	307	327	306	327	0.97
9	17	0.00051	0.043	14.4	0.2	1	23	331	353	331	353	0.98
10	17	0.00096	0.081	13.5	1.7	1	23	459	481	459	481	0.97
11	17	2.8	2.4e+02	2.6	0.1	1	23	486	509	486	509	0.73
12	17	0.013	1.1	10.0	3.1	2	21	515	534	514	536	0.92
13	17	9.8e-05	0.0082	16.6	3.5	1	23	544	566	544	566	0.96
14	17	3.2e-05	0.0027	18.2	0.3	1	23	579	601	579	601	0.98
15	17	6.6	5.5e+02	1.5	0.1	2	8	608	614	607	621	0.88
16	17	3.2e-05	0.0027	18.2	0.9	3	23	636	656	634	656	0.96
17	17	7.7e-06	0.00065	20.1	1.2	1	23	662	684	662	684	0.98

Sequence Information

Coding Sequence: atgataataaatatacatggTCAAAAAGTCGAAGAGAAGAAGCTAATCCCGCGAAATCGAGTCAATAAATCTTTGGATAAAAGCGGTGGTCAATCAATCGTACGTCGCACCGTTAAGACTGACGTTAAAAAATCCAAACCAGCGAAAAACGACTCGACTCCTCGATTTGTAGAGAACGTTCcggaaatgataaaaaattacgttAACGGCCCCCCATACGAGTGCGATTCGTGCGACGACACGTACGAAGACCAAAAGAACTTGACCATTCACAAGATGGAGAGATCgatcgtgcgcgcgagagagcaatTCAAAACGAGAAACTCGCACGTCTGCAGCGTCTGCGGCTCCGCGTTCAAGACCAGCTCGGAGCTGGTCGCGCATTACGAGTACTGTCGATCGGGCCACCAGACAAGAGCTCAGCAGCTGTGGTCGGTCGTCTGCGAGATATGCAATCGCAAGTTCAAAGACTTGAAGTCCCAAAAGGCGCACAAGGCCTGGTCGCATTCGATCAACATCCTCTGCCCGCTGTGCGACAAGCAATTGAGCTCTACGAAGGAGCTGTTGGCGCATCAAACGAGCGTACACGCGAAAGAGTCGAGGCACTCATGCAGGTATTGCGGCAAGAGCTTCGACGAACTTCTGTCGCTCCAGGCTCACGTGTCCCGTCACGAGGGTAAAAATGGCCCGGTGTCCTGCTCGTATTGCGATAAGATTTTCAGGCACGAGCATTATCTCAAGAGGCACGTGGAATCCGTACACCAAGATCCAGGAAGGATGGTTGTCCTCAAAACGAGTaatctaagaaaaaagaacaaagaaattaaaatgtacAAGTGCGAGATTTGCGAGTACGAGACGAAAAGGAGGAGTTTTTTCCTGATGCATGCCAACAAGCATAATACACCTGAAAGAAAAGAGTGCGAActttgtggaaaaaaattgcgacccaaatatttcaatatacaTATGAGAATTCACATGGACGATTTTAAGTGCGATAAATGCGGAAAAATCGTTAACGGAAAGAGCAAAATTGTCCAGCATATGGCTATGCACGGCGTTGACCAGAAAGATGTGTTGAGCGCAGTCGGCTCAGAAAAACTCTCGATACGTAGTCGGACTGATGTTGCCGAACCACCTCGAAAGATCCAAAGGGTTGTAAAAGACGAAAACTCCTTGATAATTCCCGAAGAGCATAATTACTCTCATCGAGTTGGTTCAGAAAGTCTCTCGGTTTCTGGAGAGATCCAATGCGCTACCATAGGTGGTCAAGTGacaCCGAAGGCCAAGTCGAGGCGAGCGCCTCGGCGAACCGTGGCCGAGCGACAAGATCAGCGCAAGTACACGCCCTCGGCGCCTCGGCGACGCCGCCACGAGTGTCGCTTCTGCTCGAAGCTGTACGCCACGCAGTCCCAGCTGGCCCTGCACGTGCGCAGCCACACCAATCAGAGCTTCGTGTGCAACTTTTGCGGCGAGCCCCAGCTGTCCGCGGACACCCTCAACGTCCACCTCGGCCGCTATCACCGCGAGGCCAGCGTCAGCTGTCAGATCTGCAAGCGCTTCTTCGCCAGCCAACGCAGTCTCACGCTGCACTCGCGCTGCCACACCAACGAGGACAAGCGCAAGCACGTCTGTCTGGTCTGCGACAAGAGCTTCAGCAGCCACGCCTATCTGAAGACCCACGCGAAGCAGCACGCCCTCGCGCCCAAAGTGCTGGCGCCCAAGAAGACCTACAACTGCGCCGACTGCGACTTCTCCACGGTGTACAGCAGCAATCTGCAGAAGCACGTGGCCACCCACACGGGCGAGAACAAGTCCATGTGCCACGTGTGCGGCAAGTGGGTGGTGCGCTCCTACATGCCCGTCCACGTGCGCATCCACTCGAGCGAGAAGCCCCACCTCTGCGACATCTGCGGCAAGCGCTTCAGCGTGCTCAAGTATCTGCTGGCGCACGAGCGCATGCACACCGGCGACAAGCCCTACCGCTGCCAGATCTGCAACAAGCGCTTCTCCCAGGAGACACCCCTCAAGATGCACATCAAGCTGCATCAGCGCAAGTTAAGAATTAACAATGACGAgagcgacgatgacgacgccGACGCCGACGATTTCGATGATGATGACTGTTAA
Protein Sequence: MIINIHGQKVEEKKLIPRNRVNKSLDKSGGQSIVRRTVKTDVKKSKPAKNDSTPRFVENVPEMIKNYVNGPPYECDSCDDTYEDQKNLTIHKMERSIVRAREQFKTRNSHVCSVCGSAFKTSSELVAHYEYCRSGHQTRAQQLWSVVCEICNRKFKDLKSQKAHKAWSHSINILCPLCDKQLSSTKELLAHQTSVHAKESRHSCRYCGKSFDELLSLQAHVSRHEGKNGPVSCSYCDKIFRHEHYLKRHVESVHQDPGRMVVLKTSNLRKKNKEIKMYKCEICEYETKRRSFFLMHANKHNTPERKECELCGKKLRPKYFNIHMRIHMDDFKCDKCGKIVNGKSKIVQHMAMHGVDQKDVLSAVGSEKLSIRSRTDVAEPPRKIQRVVKDENSLIIPEEHNYSHRVGSESLSVSGEIQCATIGGQVTPKAKSRRAPRRTVAERQDQRKYTPSAPRRRRHECRFCSKLYATQSQLALHVRSHTNQSFVCNFCGEPQLSADTLNVHLGRYHREASVSCQICKRFFASQRSLTLHSRCHTNEDKRKHVCLVCDKSFSSHAYLKTHAKQHALAPKVLAPKKTYNCADCDFSTVYSSNLQKHVATHTGENKSMCHVCGKWVVRSYMPVHVRIHSSEKPHLCDICGKRFSVLKYLLAHERMHTGDKPYRCQICNKRFSQETPLKMHIKLHQRKLRINNDESDDDDADADDFDDDDC

Similar Transcription Factors

Sequence clustering based on sequence similarity using MMseqs2

100% Identity: iTF_01482938;
90% Identity: iTF_01482938;
80% Identity: -