Basic Information

Insect: Sitophilus oryzae
Gene Symbol: -
Assembly: GCA_002938485.2
Location: NW:360460-382557[+]

Transcription Factor Domain

TF Family: zf-C2H2
Domain: zf-C2H2 domain
PFAM: PF00096
TF Group: Zinc-Coordinating Group
Description: The C2H2 zinc finger is the classical zinc finger domain. The two conserved cysteines and histidines co-ordinate a zinc ion. The following pattern describes the zinc finger. #-X-C-X(1-5)-C-X3-#-X5-#-X2-H-X(3-6)-[H/C] Where X can be any amino acid, and numbers in brackets indicate the number of residues. The positions marked # are those that are important for the stable fold of the zinc finger. The final position can be either his or cys. The C2H2 zinc finger is composed of two short beta strands followed by an alpha helix. The amino terminal part of the helix binds the major groove in DNA binding zinc fingers. The accepted consensus binding sequence for Sp1 is usually defined by the asymmetric hexanucleotide core GGGCGG but this sequence does not include, among others, the GAG (=CTC) repeat that constitutes a high-affinity site for Sp1 binding to the wt1 promoter [1].
Hmmscan Out: # of c-Evalue i-Evalue score bias hmm coord from hmm coord to ali coord from ali coord to env coord from env coord to acc

1 12 0.0011 0.057 13.6 0.1 1 23 291 313 291 313 0.94

2 12 1.6e-05 0.00083 19.4 1.6 1 23 321 343 321 343 0.99

3 12 0.0013 0.07 13.3 0.5 2 23 351 372 350 372 0.96

4 12 6.8e-07 3.5e-05 23.7 0.8 1 23 378 400 378 400 0.99

5 12 1e-05 0.00053 20.0 1.7 1 23 407 429 407 429 0.99

6 12 0.00012 0.0062 16.6 0.5 1 23 435 457 435 457 0.96

7 12 9.3e-06 0.00048 20.1 0.2 1 23 463 485 463 485 0.98

8 12 7.4e-07 3.8e-05 23.6 1.2 1 23 491 514 491 514 0.96

9 12 3.8e-06 0.0002 21.3 2.3 1 23 520 543 520 543 0.96

10 12 1.9e-05 0.00098 19.1 2.6 1 23 549 571 549 571 0.99

11 12 1.3e-05 0.00065 19.7 0.5 1 23 577 599 577 599 0.97

12 12 0.0025 0.13 12.5 0.1 1 22 605 626 605 629 0.92

#	of	c-Evalue	i-Evalue	score	bias	hmm coord from	hmm coord to	ali coord from	ali coord to	env coord from	env coord to	acc
1	12	0.0011	0.057	13.6	0.1	1	23	291	313	291	313	0.94
2	12	1.6e-05	0.00083	19.4	1.6	1	23	321	343	321	343	0.99
3	12	0.0013	0.07	13.3	0.5	2	23	351	372	350	372	0.96
4	12	6.8e-07	3.5e-05	23.7	0.8	1	23	378	400	378	400	0.99
5	12	1e-05	0.00053	20.0	1.7	1	23	407	429	407	429	0.99
6	12	0.00012	0.0062	16.6	0.5	1	23	435	457	435	457	0.96
7	12	9.3e-06	0.00048	20.1	0.2	1	23	463	485	463	485	0.98
8	12	7.4e-07	3.8e-05	23.6	1.2	1	23	491	514	491	514	0.96
9	12	3.8e-06	0.0002	21.3	2.3	1	23	520	543	520	543	0.96
10	12	1.9e-05	0.00098	19.1	2.6	1	23	549	571	549	571	0.99
11	12	1.3e-05	0.00065	19.7	0.5	1	23	577	599	577	599	0.97
12	12	0.0025	0.13	12.5	0.1	1	22	605	626	605	629	0.92

Sequence Information

Coding Sequence: ATGACTTCGAACACGAATGTTTGTCTGATCTGCAATGCCAGTTGTTTGTCAAGCAGAAATACTATCAAAATCTTCGATAAAGATtcTGCTGTAATTAGTGAAATAAGCATCCCAGTAACTATAGGACGTATCCTGAAAAGAGATGTAAGGAAAGACAATGTTCATTCTGAGATATTATGCAAGAAGTGCTTCAAATTAGTCGATGAGTATGAAGAAATACAAAATCGGATGGGTGAAATATCGAAAGAAATTTCAGATAACTACAAAGCCAATATCGAGTCTAGACAAATAGAGACAGACCATATGCAAGAAAGCAGCAATAGGGAAAACAATGAATTACCAAAGAAAATTCTAGATATCCCTTCAAGTGATGATGAATCTTCCCAGGTAATAGAAAAGCCCCTAGAATCTCTAGAAGATATTAACATGGTTTTGGTTAAAATGCATGATACTCCGATGGAGGATGATGACGATATAGAAAATGGAAGTCAAAACTACCAACCAATCCACGTTAATTCAGATGGTGAAGAACAGGAACCTTCATCAGAAACAGGAGaaaaaattacatTCATTAAAGTAGAACCCAATGTTAGCGATACTAGCTCAAACGATCAAACTCAGGTGTCTCACACTCCTGATACAAGCAAACCTAACATTTTAAAGCGACGTGCTTCGTCCAATGGCATTACTTATGGTGGTGACAGCATAGGAATGCAGTCTGTTAAACTTAAACCAACTGAAGAATTAGAGGCTCCAATTGTAAGCAGGGATGGCAAAGCATACACATGTCTTTTGTGTGTTGGTGATGAGGTAACCGGTGAAGACAAAGAAATAATAGCGCACATGAAGGAAGCCCACGAGTGTCGTTTGTACATTTGCGACGTGTGTGGCATGGACTTTAGAAAAAGAAATTTGCTGTCTGCGCATGTCGACGAACACGTGGCCAACGAAGAGGGCGACTTCCAGTGCGAAGTTTGCAACAGGATATTTACCAATCTCCGTCTCTTTAGAATTCACAGAAGaATGCATTTGCCCCCAGCCAAGGCTTGGAGTTGTAGTACGTGCGCAAAAAGATTCAGCAGCAAGAATTTGTTGGACGAACATGTTAACATGCACCTGGGCGTGAGGCCTTACGTTTGCAACGTTTGCGGCAAAGACTTTGCTAGCAAATACACTTTTAAGGCCCACGAAAGAACGCACGAAAATAGACCAAGACCTTACAGgtGCGAACAATGCGGTAAGTCGTTCCTGAGTCAGCAGAACTTGACTCAGCACGAGAAAACTCATTTGGGTATAAAAGAGTTCGAGTGTCACCTGTGCAACAAGCAGTTTGGATCAGCCAATAACTTAGAGGTACATTCGATCGTGCACACTGGCTACAGGCCGTTCATATGCGGCCTTTGCGGCAAAACGTTTGCCAGAAAGGCTGAAATTAAGGATCACGAGAGAACTCATACCGGGGAACGACCGTATCAGTGCGAATTCTGTGGAGCTACATTTAGTCAAAGGTCCAACCTTCAGTCTCATAAAAGAGCCACTCATTATGATGATAAAAGATATAGATGCGAGGATTGTGGTAAGTGCTTCAAACGCAGACGACTGCTGGACTATCACATTAAGGCTGCCCATACTGGAGAGCGTCCATTCAAATGCGAAGTATGTCAAGCTACTTTCGTCTATCCAGAACACTTCAAGAAACATCGGCGCATTCATACTGGCGAGAAGCCCTTCTCTTGCGAGatttgtGGGAAGGCTTTCAATTCGAGAGACAATCGTAACGCTCATCGCTATGTCCATTCGGATAAGAAGCCATATGAGTGTCTTGTATGCGGAGCCGGGTTTATGCGAAAACCTCTTTTGTACCAGCACATGCAGTTGCAAGGTCATCTGAACGATACCATTGTGGTGAACCAACCCAGACTAACATTAGACGATAAACTAGTAATGGACTCGGAAAGCCACCTGGTCCGGGTCGAAGAAGAATCCAGCGCCAACGAATCGAAGCTTTTTATAGCCGCGGAAGACGGCAACGAGCACATTATCATCGACGGCCAGCACATCACCTTCGCCGAAACCACCTCCGACAACGAGGACGATAACGGCGAAGTCATAGACGAGATCGAGCAAGTGGTCGGGACCGAAGAGGCCGAATACGAGGAGATCCTCACTTCGGAGGCTCTGACAAGCAGCGAGACGCAGATAATCGATACTCCCGACGGGCCGATTCAGCTGGTTAAGGTGAAGATCCCGAACGAGCACGGCGAGGAGGAAGAAGCCTGGATCAAGATAGTGCCAGAGTGA
Protein Sequence: MTSNTNVCLICNASCLSSRNTIKIFDKDSAVISEISIPVTIGRILKRDVRKDNVHSEILCKKCFKLVDEYEEIQNRMGEISKEISDNYKANIESRQIETDHMQESSNRENNELPKKILDIPSSDDESSQVIEKPLESLEDINMVLVKMHDTPMEDDDDIENGSQNYQPIHVNSDGEEQEPSSETGEKITFIKVEPNVSDTSSNDQTQVSHTPDTSKPNILKRRASSNGITYGGDSIGMQSVKLKPTEELEAPIVSRDGKAYTCLLCVGDEVTGEDKEIIAHMKEAHECRLYICDVCGMDFRKRNLLSAHVDEHVANEEGDFQCEVCNRIFTNLRLFRIHRRMHLPPAKAWSCSTCAKRFSSKNLLDEHVNMHLGVRPYVCNVCGKDFASKYTFKAHERTHENRPRPYRCEQCGKSFLSQQNLTQHEKTHLGIKEFECHLCNKQFGSANNLEVHSIVHTGYRPFICGLCGKTFARKAEIKDHERTHTGERPYQCEFCGATFSQRSNLQSHKRATHYDDKRYRCEDCGKCFKRRRLLDYHIKAAHTGERPFKCEVCQATFVYPEHFKKHRRIHTGEKPFSCEICGKAFNSRDNRNAHRYVHSDKKPYECLVCGAGFMRKPLLYQHMQLQGHLNDTIVVNQPRLTLDDKLVMDSESHLVRVEEESSANESKLFIAAEDGNEHIIIDGQHITFAETTSDNEDDNGEVIDEIEQVVGTEEAEYEEILTSEALTSSETQIIDTPDGPIQLVKVKIPNEHGEEEEAWIKIVPE

Similar Transcription Factors

Sequence clustering based on sequence similarity using MMseqs2

100% Identity: -
90% Identity: -
80% Identity: -