Basic Information

Insect: Nicrophorus vespilloides
Gene Symbol: -
Assembly: GCA_001412225.1
Location: NW:130183-134708[+]

Transcription Factor Domain

TF Family: zf-C2H2
Domain: zf-C2H2 domain
PFAM: PF00096
TF Group: Zinc-Coordinating Group
Description: The C2H2 zinc finger is the classical zinc finger domain. The two conserved cysteines and histidines co-ordinate a zinc ion. The following pattern describes the zinc finger. #-X-C-X(1-5)-C-X3-#-X5-#-X2-H-X(3-6)-[H/C] Where X can be any amino acid, and numbers in brackets indicate the number of residues. The positions marked # are those that are important for the stable fold of the zinc finger. The final position can be either his or cys. The C2H2 zinc finger is composed of two short beta strands followed by an alpha helix. The amino terminal part of the helix binds the major groove in DNA binding zinc fingers. The accepted consensus binding sequence for Sp1 is usually defined by the asymmetric hexanucleotide core GGGCGG but this sequence does not include, among others, the GAG (=CTC) repeat that constitutes a high-affinity site for Sp1 binding to the wt1 promoter [1].
Hmmscan Out: # of c-Evalue i-Evalue score bias hmm coord from hmm coord to ali coord from ali coord to env coord from env coord to acc

1 21 0.00031 0.021 14.7 6.0 1 23 168 190 168 190 0.98

2 21 0.0015 0.1 12.5 0.3 1 23 210 232 210 232 0.98

3 21 7e-06 0.00048 19.8 2.5 1 23 239 262 239 262 0.97

4 21 6.7e-07 4.5e-05 23.1 0.3 1 23 268 290 268 290 0.98

5 21 2.8e-05 0.0019 17.9 1.9 1 23 296 318 296 318 0.93

6 21 4.5e-05 0.0031 17.3 0.7 3 23 326 346 324 346 0.96

7 21 1.4e-05 0.00096 18.9 0.8 1 23 352 374 352 374 0.98

8 21 0.0001 0.0068 16.2 0.8 1 23 380 402 380 402 0.99

9 21 2.4e-05 0.0016 18.2 2.1 1 23 408 430 408 430 0.98

10 21 1.6e-06 0.00011 21.9 0.8 1 23 436 458 436 458 0.98

11 21 0.00033 0.022 14.6 2.5 1 23 649 671 649 671 0.98

12 21 0.098 6.7 6.8 0.2 1 23 699 721 699 721 0.93

13 21 3e-06 0.0002 21.0 5.1 1 23 728 750 728 750 0.98

14 21 8.6e-06 0.00059 19.6 3.4 1 23 756 778 756 778 0.98

15 21 5.5e-07 3.7e-05 23.3 1.8 1 23 784 806 784 806 0.98

16 21 3.2e-05 0.0022 17.8 0.7 1 23 812 834 812 834 0.94

17 21 2e-05 0.0014 18.4 0.3 3 23 842 862 840 862 0.96

18 21 1.9e-06 0.00013 21.6 2.9 1 23 868 890 868 890 0.98

19 21 9.7e-05 0.0066 16.2 0.8 1 23 896 918 896 918 0.99

20 21 2.3e-06 0.00015 21.4 1.0 1 23 924 946 924 946 0.98

21 21 6.6e-07 4.5e-05 23.1 1.2 1 23 952 974 952 974 0.98

#	of	c-Evalue	i-Evalue	score	bias	hmm coord from	hmm coord to	ali coord from	ali coord to	env coord from	env coord to	acc
1	21	0.00031	0.021	14.7	6.0	1	23	168	190	168	190	0.98
2	21	0.0015	0.1	12.5	0.3	1	23	210	232	210	232	0.98
3	21	7e-06	0.00048	19.8	2.5	1	23	239	262	239	262	0.97
4	21	6.7e-07	4.5e-05	23.1	0.3	1	23	268	290	268	290	0.98
5	21	2.8e-05	0.0019	17.9	1.9	1	23	296	318	296	318	0.93
6	21	4.5e-05	0.0031	17.3	0.7	3	23	326	346	324	346	0.96
7	21	1.4e-05	0.00096	18.9	0.8	1	23	352	374	352	374	0.98
8	21	0.0001	0.0068	16.2	0.8	1	23	380	402	380	402	0.99
9	21	2.4e-05	0.0016	18.2	2.1	1	23	408	430	408	430	0.98
10	21	1.6e-06	0.00011	21.9	0.8	1	23	436	458	436	458	0.98
11	21	0.00033	0.022	14.6	2.5	1	23	649	671	649	671	0.98
12	21	0.098	6.7	6.8	0.2	1	23	699	721	699	721	0.93
13	21	3e-06	0.0002	21.0	5.1	1	23	728	750	728	750	0.98
14	21	8.6e-06	0.00059	19.6	3.4	1	23	756	778	756	778	0.98
15	21	5.5e-07	3.7e-05	23.3	1.8	1	23	784	806	784	806	0.98
16	21	3.2e-05	0.0022	17.8	0.7	1	23	812	834	812	834	0.94
17	21	2e-05	0.0014	18.4	0.3	3	23	842	862	840	862	0.96
18	21	1.9e-06	0.00013	21.6	2.9	1	23	868	890	868	890	0.98
19	21	9.7e-05	0.0066	16.2	0.8	1	23	896	918	896	918	0.99
20	21	2.3e-06	0.00015	21.4	1.0	1	23	924	946	924	946	0.98
21	21	6.6e-07	4.5e-05	23.1	1.2	1	23	952	974	952	974	0.98

Sequence Information

Coding Sequence: ATGGAAGAAGAAAGTATTCCCATGGATATGGATATTTGTCGTTTGTGTATGACAGAAGTGGGTTCCTTTAAATCTGCATTTGATGCTGAAGAAAACACAGGATTAGAAGTTCTTCTTGCAGATATGATTATGGCTTTCACTTCTGTCcaaatGACAATAGGAGATGGTCTACCTGACAAAATATGTGATGTTTGCTATCAAAAAGTACCAgacatgtatatatttaaaaagcaaTGTGAGGAAGCTGATAGAAAACTTAGGATGACTTTAAAGAAATTTCCTTTCAATTTGAATGAGGATGATATGACCCCCATAGAATTAGACAATtcagaaaatgttattattaaacctGACATTTccaatgttaaaattgaagttgTTGATCAACAATCAGATGAAGATGTTGTATGTAATGTAAAAGTGGAGAATGTGGATGAGCATGTCAACTATAATATACAAGATCAAACAATGCAAATCTGCAATGCAGaaaaatccaaattatttgaatgtgATCAGTGCAGCAAATGTTTCAAAAGGGAAGACTTTTTTGTGCGACATAAAAAAACCcatgaaataacatttatccaaataaaagaagaaatcaaAGATATATCACAGGAGCAAGAGTTCAAATGTGCAACATGTAATATGGAATTTGATAGTAATGAGACTTATAATGAACATTTAGAAATTCATAGAGAAAGAGGAGAGCTGTTCCGCTGTCAAATTTGCAGTaaacaatttgcaaaaaattTCCAACTTACAAGGCATATGAAACAAATACATTCTAGTTTAAAACCAtacatatgtaatatttgCTCAAAAGCTTTTAATCAGATTTCAACATTAACTGATCACATGCGTATACACAATGGGGAGAAACCATTTTTGTGTTCAACTTGTGGTAAAAGTTTTAATCATTTAGGCAATTTGAAGCAGCATGCTGTTAGGCATAGTGGAGTAAAGGCGCATTTGTGTAACCTTTGTGGCAATGGTTTTGCTAGTAAAGGAGAATTAAGTGTGCATATGCGAAAACATAcaggTGTACGTCCGTTCGTATGCACGGTTTGTAACAGCGGTTTCACGACTTCCAGCTATCTGGCCAAGCATAAGAGGATACACTCGGGCGAAAAGCCGTACGAATGCGACGTATGTAAGATGAAGTTTTCTCGATCAGGAATTCTTGCGCGTCACAAAAGGACGCATACTGGTGAAAAGCCGTATGTTTGTAAATTCTGTTCAAAAGCTTTTGCTCAGTCGAACGATCTAAGCTCACACCACAGAATACATACAGGCGAAAAACCCTATATCTGCGATCTCTGTGGTCAAGCCTTCCGACAGAGCTCAACACTTAAAACCCATAAAAAGGTTCATATGGACAAAAATAGCCGACAAGATGCAGATGTAAATGTCGCGATATCGAATATACAgcatgttattaataaaatcaagaacgaaaataatatggaaGAGAATAGTTTGCGGAATATTTGTCGTGTTTGCATGACGGAGAAGGGTATTTTTCAATCAGTTTTTGTTTCAGAGGAGAGAACAGGCTTGAAAATTCATCTTGCTGAAATGGTTATGGCTTATACTTCTGTCCAGATAACGTTAGGAGATGGGTTACCAGAAGAGATTTGCTCAGAATGTGCAGAGAGAATACCAGACTTGTACTTATTCAAGATGAAATGCGAAGAGACAGACAGAAATCTGAGATTACGATTGGGGAAGAACCCTTTTAAACTTATAGAACATGAGGAAGaagatttacataattttgatttagaaGATAATGACTCTGAGGATGTCATTATTAAACCAGATATTTGTGatgttaaaatagaaaatttggaAGATATACCAATTGAAAAGTTCGTAGAGTACACAGAACCTAATGATATTTCAACTGATTTGGATAATAGTGGTGATATGCAAGGAAAGTTATTTGAGTGTGGTGAatgcaataaatgttttacCAAAGAGGATATACTTGTTAGGCATAAAAGGTCTCATGAAGCAACagtaatacaaattgaagaagaagatgCTGATGACATTGATGATTTGACGGATCCACtaacaacaaaacaagaatATAAATGTTCAACATGTAATATGGAATTCGATAATGGTATAACTTATGATGAACATTTGGAAATACATAAGGAAAGTGGAGATATTTTCTCATGtggaatttgtaataaaaagtttacGAAAAATTTTCATCTCAACAGACATATGAAGTTGCATGCTGTTGTTAAACCCCATACATGTAAAGTATGCAATAAGGGATACACAAGAGCTGAGCAGCTGAGTCATCATATGAATATTCATACAGGTATCAAACCACATGTTTGTAATGTGTGTTCTAAAgGTTTCAACcagatttcaaatttaaaagatCATATGAGAACCCACAATGGAGAAAAACCATTTTTGTGTTCCACTTGTGGCAAAGGTTTCAATCAATTGGGCAACTTGCGACAACATACTGTCAGGCATAGTGGTATCAAGGCTCATCTATGTAATATATGTGGTAACGGCTTTGCTAGCAAAGGTGAATTATCCGCGCATATTAGAAAACATACAGGTGCACGTCCGTTTGTGTGCTCTATCTGTAATCACGGTTTCACAACATCAAGTTCTCTCACGAAACATAAGCGAATTCACTCGGGCGAAAAACCGTATGAGTGCGAGGTGTGCAAGATGAAGTTTTCGCGTTCGGGAATTCTCGCGCGTCATAAAAGGACGCACACCGGCGAAAAACCCTACGTGTGCAAATTCTGTTCAAAAGCGTTCTCACAGTCAAACGACCTTAGTTCCCATCTCAGAATTCATACAGGCGAGAAGCCCTACATATGTGATCAGTGCGGACAGGCATTTCGTCAGAGTTCCACCCTCAAaaagcacaaaaaaatacacagcGATAAGAACAATATGATCGATTCAGGCGTTGTTATCGGAATGGTGGTACCCTTCCTGAATAACATTTAG
Protein Sequence: MEEESIPMDMDICRLCMTEVGSFKSAFDAEENTGLEVLLADMIMAFTSVQMTIGDGLPDKICDVCYQKVPDMYIFKKQCEEADRKLRMTLKKFPFNLNEDDMTPIELDNSENVIIKPDISNVKIEVVDQQSDEDVVCNVKVENVDEHVNYNIQDQTMQICNAEKSKLFECDQCSKCFKREDFFVRHKKTHEITFIQIKEEIKDISQEQEFKCATCNMEFDSNETYNEHLEIHRERGELFRCQICSKQFAKNFQLTRHMKQIHSSLKPYICNICSKAFNQISTLTDHMRIHNGEKPFLCSTCGKSFNHLGNLKQHAVRHSGVKAHLCNLCGNGFASKGELSVHMRKHTGVRPFVCTVCNSGFTTSSYLAKHKRIHSGEKPYECDVCKMKFSRSGILARHKRTHTGEKPYVCKFCSKAFAQSNDLSSHHRIHTGEKPYICDLCGQAFRQSSTLKTHKKVHMDKNSRQDADVNVAISNIQHVINKIKNENNMEENSLRNICRVCMTEKGIFQSVFVSEERTGLKIHLAEMVMAYTSVQITLGDGLPEEICSECAERIPDLYLFKMKCEETDRNLRLRLGKNPFKLIEHEEEDLHNFDLEDNDSEDVIIKPDICDVKIENLEDIPIEKFVEYTEPNDISTDLDNSGDMQGKLFECGECNKCFTKEDILVRHKRSHEATVIQIEEEDADDIDDLTDPLTTKQEYKCSTCNMEFDNGITYDEHLEIHKESGDIFSCGICNKKFTKNFHLNRHMKLHAVVKPHTCKVCNKGYTRAEQLSHHMNIHTGIKPHVCNVCSKGFNQISNLKDHMRTHNGEKPFLCSTCGKGFNQLGNLRQHTVRHSGIKAHLCNICGNGFASKGELSAHIRKHTGARPFVCSICNHGFTTSSSLTKHKRIHSGEKPYECEVCKMKFSRSGILARHKRTHTGEKPYVCKFCSKAFSQSNDLSSHLRIHTGEKPYICDQCGQAFRQSSTLKKHKKIHSDKNNMIDSGVVIGMVVPFLNNI

Similar Transcription Factors

Sequence clustering based on sequence similarity using MMseqs2

100% Identity: -
90% Identity: -
80% Identity: -