Basic Information

Insect: Timema genevievae
Gene Symbol: -
Assembly: GCA_902155825.1
Location: CABFWO010007637.1:5515-13693[+]

Transcription Factor Domain

TF Family: zf-C2H2
Domain: zf-C2H2 domain
PFAM: PF00096
TF Group: Zinc-Coordinating Group
Description: The C2H2 zinc finger is the classical zinc finger domain. The two conserved cysteines and histidines co-ordinate a zinc ion. The following pattern describes the zinc finger. #-X-C-X(1-5)-C-X3-#-X5-#-X2-H-X(3-6)-[H/C] Where X can be any amino acid, and numbers in brackets indicate the number of residues. The positions marked # are those that are important for the stable fold of the zinc finger. The final position can be either his or cys. The C2H2 zinc finger is composed of two short beta strands followed by an alpha helix. The amino terminal part of the helix binds the major groove in DNA binding zinc fingers. The accepted consensus binding sequence for Sp1 is usually defined by the asymmetric hexanucleotide core GGGCGG but this sequence does not include, among others, the GAG (=CTC) repeat that constitutes a high-affinity site for Sp1 binding to the wt1 promoter [1].
Hmmscan Out: # of c-Evalue i-Evalue score bias hmm coord from hmm coord to ali coord from ali coord to env coord from env coord to acc

1 14 0.1 19 7.9 2.5 3 20 226 243 224 245 0.93

2 14 0.00017 0.032 16.7 0.3 1 20 254 273 254 274 0.96

3 14 0.01 1.9 11.0 4.6 1 20 282 301 282 304 0.95

4 14 4.1e-06 0.00076 21.7 0.6 2 23 311 332 310 332 0.97

5 14 0.00015 0.029 16.8 1.9 1 23 510 532 510 532 0.96

6 14 0.015 2.8 10.5 0.2 2 21 541 560 540 561 0.93

7 14 0.0017 0.32 13.5 4.3 1 20 610 629 610 632 0.92

8 14 0.059 11 8.6 0.5 1 23 637 660 637 660 0.92

9 14 0.00015 0.028 16.8 0.6 1 23 666 688 666 688 0.96

10 14 0.019 3.6 10.2 4.9 1 23 696 718 696 718 0.98

11 14 0.0006 0.11 14.9 0.7 3 23 726 746 724 746 0.97

12 14 0.00078 0.15 14.6 0.8 1 23 752 775 752 775 0.94

13 14 0.0049 0.92 12.0 0.3 1 23 788 810 788 810 0.95

14 14 0.0012 0.22 14.0 0.0 1 23 901 923 901 923 0.98

#	of	c-Evalue	i-Evalue	score	bias	hmm coord from	hmm coord to	ali coord from	ali coord to	env coord from	env coord to	acc
1	14	0.1	19	7.9	2.5	3	20	226	243	224	245	0.93
2	14	0.00017	0.032	16.7	0.3	1	20	254	273	254	274	0.96
3	14	0.01	1.9	11.0	4.6	1	20	282	301	282	304	0.95
4	14	4.1e-06	0.00076	21.7	0.6	2	23	311	332	310	332	0.97
5	14	0.00015	0.029	16.8	1.9	1	23	510	532	510	532	0.96
6	14	0.015	2.8	10.5	0.2	2	21	541	560	540	561	0.93
7	14	0.0017	0.32	13.5	4.3	1	20	610	629	610	632	0.92
8	14	0.059	11	8.6	0.5	1	23	637	660	637	660	0.92
9	14	0.00015	0.028	16.8	0.6	1	23	666	688	666	688	0.96
10	14	0.019	3.6	10.2	4.9	1	23	696	718	696	718	0.98
11	14	0.0006	0.11	14.9	0.7	3	23	726	746	724	746	0.97
12	14	0.00078	0.15	14.6	0.8	1	23	752	775	752	775	0.94
13	14	0.0049	0.92	12.0	0.3	1	23	788	810	788	810	0.95
14	14	0.0012	0.22	14.0	0.0	1	23	901	923	901	923	0.98

Sequence Information

Coding Sequence: ATGGATGCTGAAGTGACATTGTGTGAAGAGGAACAGATTAATCCTATCGTTGGCCCGTCTTTTAGTGGGCATTGTTCAAATTCGGTACAAAACGATGCCTTGCTTAATTATGAAGGCAGTGCAATGGTTGTGTATCAAGCAGATGTTGAAATGAGTGAAGACATTTCTACTCCACAAGTGAGATGCTTAGAATTTTACCATGACAGTGAAGAACTGAATCAGGTGGACCTATCATCATTAAGTAGTTCTGCTACTTATTTAGAGAACGTTAGTGCTGAGCTTGGGACTGAAAATACTGGGACTACTTCACATGTTAACAGCATAGGAATGTATGTGGAAACTGAACCGAAGGACACCAACTCGCATTCTCATGACAAGAATAATTTCCCAAAAGCTTACCAAGATAATATTCTGAAAGTAGATATAAATGTTACTTCCAAACCTGAAGGTTCCATCACATATCGGAACAACAATGTCAAGGAGTGTGTTTTAGAGAAATGCGATCAAGAACAAACATTTTGTCACCATCGGTCTATTGTCACTGACAACGTTATGGTGAAATCTGAAAACATTGAGCCTTCGACAACTACAGATGATGAGAGTATGGCCGTGGAAGCTCTTCAGCAGCTCGGAGGTGGGGACCTACTATATTCAAACCTCAACTCGCTCCAGCATTGCTACATCTGCGGCTCAAAGTTCCACTCCAGAGACAGCTTTCAGAAGCACCTTTCCTTGTGCGCCGAGACGGGGATGGCCGCTCACACTTGCAGCGTCTGCAGGGAGACCTTTATACGCAAGTCAGACCTGGAGAACCACCTAGTGTGTCACCAGGTGGACAGGCCCTATGCCTGCAAGATATGCAGTACCTTGTTCTGCAGGAAGGCAGAGCTCCAGAATCACATGACGTGCCACAACGTCACCAGGCCTCTCAAATGCCCGCAGTGTGGGACCGATTTCCAACGGTTGTCGAGTCTCACCAATCACATGAAGATACATAACTACCCCCCGGGTAAAGCCGTTGGTTTGTTTGATCTCCGGTCAGATGGCAAACCTGTATCAATGCCGTCAACACAGGAGGGGAAATTAAAGTATGAAGAATCGTCAGCAAGTGTCAAACCTTTGCAAGGAACTTCTGTAAGTCACGTGAATACTACAGATACCAGTTTGACAAGTCGCGAGACGGAAGAAACGTCCTTTTCACAAGCTCCAAAAGTTGCAGTCCTAccaattaacaattttaacttttctatGAACCAAAGTGTGGATGAAAATTCTTTACACAACATTTGTGACTCACCCAATCAAACCTCAGGACAGCTTGTAGATTGTAGTAAAATTGAGCGTTTGAATACACAATTTGATACGCCTGACGGTGGTGATAACTTAATTTCAAAATCAGACTCAAATTTCTGTTCTGTGAAAGTCGAATCTATGCCCTATATCATGTCGCAGGGATGCCATCCTAAAGAAATGTTCTCGGCTCAAAGCCCCGAGCAAGACTTGCCAAAAGCCGAGGATAAACGCCCCCACATCTGCCGGCATTGCGGTACGGCCTTCGCCCGTCTCAAGGCCCTCCAGTCGCACGTCCGCCTGCATGAGGACAATTGGGGGGCCCCTTTGTACTGCAAGAGATGTGAGGAGAATTTCCCCGATGAAATTTCTCTTAACCGACATCAGTTGAGATGCACCGGGCCGATGACTCTGCCTCATCGGAATGTGAACGGGAGCTTGCAGCCGACTCATAACCCGACGCCGCCGACTGGACCCTATACAAAATCGTTTGAAAATGGTGTCCGTACTGCggaaacaaaaactaaattgGGGAAACATTGCTGTGAAGAATGTGAGAAGAGGTTTGCcactaaacaaaaactattcaGACACATGTGGGTGCACAGAAGAAAGCAGTACGTATGCGAGGTGTGCGGGTGCGCGGTGACGAGTCAGCAAGGTCTAGACGAGCACCGCCATGCCATGCACCCAGGCGAGAATCGACACATATGTTTCCAGTGTGGCAAGAGCTTTGTGAGCCGTCAGGGCCTCTGGGAGCACGGCAGGGTCCACGGTCGTGGACCCCCGGGGGTGTTCCATTGTCAGCAGTGCTCCAAACAGTTCACAAGCAGACaaGGGTTTCTCATTCATAACCGAACACACACGGGTGAACGCCCTTACGGGTGCAAGTTTTGCACCAAGGCCTTCCGGGACGGCGGTACACTCCGAAAGCACGAGCGGATACACACCGGAGAGCGGCCCCACGCTTGTCCCCTCTGTCACCGCGCGTTCAACCAGAAGGTGGTGCTGCGGGAACATGTGAGATGGGTGCACGCGGCCAACAAGTCCAATAACGACGTACCCCACATCTTCTCGTGTCAGCTGTGTGGCCAAACCCTCGGAGACAGAGAGGAACTGTGCGCCCATATCGTCCAACACAGTGACCAGATGGCGGCCGCCGCCAAAGCTTTGACCGCAAGTAGCGTTGAAAATCCGAATATTATCAAAAAAGAACTTGGTGCAAAAATGGTAACTTCAGAGACCACGCCGCCTTCATCAACGGAAATGTGCGCCGATATGACCGCACAAGCATCGTCGGCGACTGATTCTTACATTACATCAAAGTATTTAGTTCCTAACGGGGTGATCACGATTAATAAACCAGAAGGTGGCGTAATCTCATCGCGTATAAAGATGGAGGCCAGGGATTATGTTTGTGACATGTGTGGGGAAGGTTTTGCATTGAAGGAAGGTCTTTTGAACCATGTTTTAATTCACATTTGA
Protein Sequence: MDAEVTLCEEEQINPIVGPSFSGHCSNSVQNDALLNYEGSAMVVYQADVEMSEDISTPQVRCLEFYHDSEELNQVDLSSLSSSATYLENVSAELGTENTGTTSHVNSIGMYVETEPKDTNSHSHDKNNFPKAYQDNILKVDINVTSKPEGSITYRNNNVKECVLEKCDQEQTFCHHRSIVTDNVMVKSENIEPSTTTDDESMAVEALQQLGGGDLLYSNLNSLQHCYICGSKFHSRDSFQKHLSLCAETGMAAHTCSVCRETFIRKSDLENHLVCHQVDRPYACKICSTLFCRKAELQNHMTCHNVTRPLKCPQCGTDFQRLSSLTNHMKIHNYPPGKAVGLFDLRSDGKPVSMPSTQEGKLKYEESSASVKPLQGTSVSHVNTTDTSLTSRETEETSFSQAPKVAVLPINNFNFSMNQSVDENSLHNICDSPNQTSGQLVDCSKIERLNTQFDTPDGGDNLISKSDSNFCSVKVESMPYIMSQGCHPKEMFSAQSPEQDLPKAEDKRPHICRHCGTAFARLKALQSHVRLHEDNWGAPLYCKRCEENFPDEISLNRHQLRCTGPMTLPHRNVNGSLQPTHNPTPPTGPYTKSFENGVRTAETKTKLGKHCCEECEKRFATKQKLFRHMWVHRRKQYVCEVCGCAVTSQQGLDEHRHAMHPGENRHICFQCGKSFVSRQGLWEHGRVHGRGPPGVFHCQQCSKQFTSRQGFLIHNRTHTGERPYGCKFCTKAFRDGGTLRKHERIHTGERPHACPLCHRAFNQKVVLREHVRWVHAANKSNNDVPHIFSCQLCGQTLGDREELCAHIVQHSDQMAAAAKALTASSVENPNIIKKELGAKMVTSETTPPSSTEMCADMTAQASSATDSYITSKYLVPNGVITINKPEGGVISSRIKMEARDYVCDMCGEGFALKEGLLNHVLIHI*

Similar Transcription Factors

Sequence clustering based on sequence similarity using MMseqs2

100% Identity: iTF_01450856; iTF_01448848; iTF_01445054;
90% Identity: -
80% Identity: -