Basic Information

Insect: Sphenella marginata
Gene Symbol: -
Assembly: GCA_951509765.1
Location: OX608079.1:14798958-14805229[+]

Transcription Factor Domain

TF Family: zf-C2H2
Domain: zf-C2H2 domain
PFAM: PF00096
TF Group: Zinc-Coordinating Group
Description: The C2H2 zinc finger is the classical zinc finger domain. The two conserved cysteines and histidines co-ordinate a zinc ion. The following pattern describes the zinc finger. #-X-C-X(1-5)-C-X3-#-X5-#-X2-H-X(3-6)-[H/C] Where X can be any amino acid, and numbers in brackets indicate the number of residues. The positions marked # are those that are important for the stable fold of the zinc finger. The final position can be either his or cys. The C2H2 zinc finger is composed of two short beta strands followed by an alpha helix. The amino terminal part of the helix binds the major groove in DNA binding zinc fingers. The accepted consensus binding sequence for Sp1 is usually defined by the asymmetric hexanucleotide core GGGCGG but this sequence does not include, among others, the GAG (=CTC) repeat that constitutes a high-affinity site for Sp1 binding to the wt1 promoter [1].
Hmmscan Out: # of c-Evalue i-Evalue score bias hmm coord from hmm coord to ali coord from ali coord to env coord from env coord to acc

1 27 0.012 1.9 10.6 2.9 1 23 245 267 245 267 0.97

2 27 0.069 11 8.2 2.5 1 23 273 295 273 295 0.97

3 27 0.056 8.6 8.5 2.8 1 23 365 387 365 387 0.98

4 27 0.0005 0.077 15.0 4.7 1 23 393 415 393 415 0.98

5 27 0.043 6.6 8.9 0.2 2 23 450 471 449 471 0.97

6 27 0.16 24 7.1 0.7 1 23 545 568 545 568 0.97

7 27 3.2 4.9e+02 3.0 0.4 1 16 575 590 575 596 0.80

8 27 2.6e-06 0.0004 22.2 1.8 2 23 646 667 645 667 0.97

9 27 0.0032 0.5 12.4 0.7 1 23 674 697 674 697 0.95

10 27 4.5 6.9e+02 2.5 1.2 3 23 706 726 705 726 0.96

11 27 0.062 9.6 8.4 1.6 1 23 810 833 810 833 0.96

12 27 0.039 6 9.0 0.6 1 23 872 895 872 895 0.96

13 27 0.00015 0.023 16.6 0.3 2 23 911 932 910 932 0.97

14 27 6.6e-07 0.0001 24.0 4.5 1 23 939 961 939 961 0.98

15 27 0.00027 0.041 15.8 0.5 1 23 1118 1141 1118 1141 0.96

16 27 0.0028 0.43 12.6 1.1 1 23 1178 1201 1178 1201 0.98

17 27 0.00011 0.017 17.1 1.1 1 23 1216 1238 1216 1238 0.97

18 27 0.00031 0.047 15.6 3.2 1 23 1245 1267 1245 1267 0.98

19 27 0.014 2.1 10.4 0.4 3 21 1295 1313 1294 1314 0.96

20 27 0.0022 0.33 13.0 1.4 1 23 1362 1385 1362 1385 0.97

21 27 0.081 12 8.0 0.6 1 23 1422 1445 1422 1445 0.95

22 27 0.00013 0.02 16.8 1.6 1 23 1481 1504 1481 1504 0.98

23 27 1.8e-05 0.0028 19.5 0.2 2 23 1538 1559 1537 1559 0.95

24 27 8.1e-05 0.012 17.5 2.3 1 23 1565 1587 1565 1587 0.99

25 27 1e-06 0.00016 23.4 5.6 1 23 1593 1615 1593 1615 0.97

26 27 1e-06 0.00016 23.5 2.3 1 23 1621 1643 1621 1643 0.99

27 27 0.0015 0.23 13.5 0.2 1 23 1649 1671 1649 1671 0.95

#	of	c-Evalue	i-Evalue	score	bias	hmm coord from	hmm coord to	ali coord from	ali coord to	env coord from	env coord to	acc
1	27	0.012	1.9	10.6	2.9	1	23	245	267	245	267	0.97
2	27	0.069	11	8.2	2.5	1	23	273	295	273	295	0.97
3	27	0.056	8.6	8.5	2.8	1	23	365	387	365	387	0.98
4	27	0.0005	0.077	15.0	4.7	1	23	393	415	393	415	0.98
5	27	0.043	6.6	8.9	0.2	2	23	450	471	449	471	0.97
6	27	0.16	24	7.1	0.7	1	23	545	568	545	568	0.97
7	27	3.2	4.9e+02	3.0	0.4	1	16	575	590	575	596	0.80
8	27	2.6e-06	0.0004	22.2	1.8	2	23	646	667	645	667	0.97
9	27	0.0032	0.5	12.4	0.7	1	23	674	697	674	697	0.95
10	27	4.5	6.9e+02	2.5	1.2	3	23	706	726	705	726	0.96
11	27	0.062	9.6	8.4	1.6	1	23	810	833	810	833	0.96
12	27	0.039	6	9.0	0.6	1	23	872	895	872	895	0.96
13	27	0.00015	0.023	16.6	0.3	2	23	911	932	910	932	0.97
14	27	6.6e-07	0.0001	24.0	4.5	1	23	939	961	939	961	0.98
15	27	0.00027	0.041	15.8	0.5	1	23	1118	1141	1118	1141	0.96
16	27	0.0028	0.43	12.6	1.1	1	23	1178	1201	1178	1201	0.98
17	27	0.00011	0.017	17.1	1.1	1	23	1216	1238	1216	1238	0.97
18	27	0.00031	0.047	15.6	3.2	1	23	1245	1267	1245	1267	0.98
19	27	0.014	2.1	10.4	0.4	3	21	1295	1313	1294	1314	0.96
20	27	0.0022	0.33	13.0	1.4	1	23	1362	1385	1362	1385	0.97
21	27	0.081	12	8.0	0.6	1	23	1422	1445	1422	1445	0.95
22	27	0.00013	0.02	16.8	1.6	1	23	1481	1504	1481	1504	0.98
23	27	1.8e-05	0.0028	19.5	0.2	2	23	1538	1559	1537	1559	0.95
24	27	8.1e-05	0.012	17.5	2.3	1	23	1565	1587	1565	1587	0.99
25	27	1e-06	0.00016	23.4	5.6	1	23	1593	1615	1593	1615	0.97
26	27	1e-06	0.00016	23.5	2.3	1	23	1621	1643	1621	1643	0.99
27	27	0.0015	0.23	13.5	0.2	1	23	1649	1671	1649	1671	0.95

Sequence Information

Coding Sequence: ATGACTTCATATCAGTGCCGTACGTGCCGTGAGACAAAAAAATGCCAATATTATGCTCTGACAGACTTTTTGGACGAGGAGCGCTGCCCTAAGAAGACACTTGCCGATTTCCTTTGGGATATTGCAAAAATCAATaataaaACAGAGGACGCCAAACGTTTACCCCAACAAATTTGTGCAGGTTGCTCACGCAAGCTAAATAACACATATTCTTTCATACTCCAAGCGCAAGTGGCTAATAGAAAACTATTTGCAAGCTTATATATCGGAAAAGCAGGGTGTAGCTCTGCGAAAGATTTACCAAACAAAAGTAATGATTGCCTATTAGAGACTCCCATAGATATACCGATACGGCAAACAGTTATTAAAGAAGAAAACGATAATGCCGAGGAAGAACCTACTGAAGAACGCAGAGAAGGGTTATCTGCTGATAAAGAAATCGAAAACGTAGAAGAAAGTTTAAATACTGAAGCAGAATCGGTTAAGGAGGAGCATATAGATTTGGAGCTCAAAATCAGAGACACTGATTGTATAAGCGAAGaTGAAAGTGTCGGCGTCGATCCTATTACCACCGTTGACAAGGACAAAGAAAACCCGGTCACGCTAGACAATGCCAGCGATCGCGATACTGACAAGAGTGAAGATGCTGCTCCACCAGTAAAGCGCAGACGCGGTAGATCACAAAGAATTGCACACACTTTAGAGTTTGCTTACTGTGATGATAATGGTCGATACCATTGTAAAAAGTGTGATAAAAGTTTTGCTTGGAAAAAAGATGCAGAACGTCATTACGAGACACATAGTGGCATTTTTCCGTATGAGTGCGAGCAATGTGGCCATCTCTTTCAAAAAAAGGATAAATATGATAATCATATGAGTCTTCACGCTAGGCGAGATAATGTGGAAGATAAATCCCTTCCAGaaGACGAAATCTTTGACATAGAATCCAAACTGGAAGTAGAGTTGGATGCGAATGATACCAGTGACGAACAAAGTGAAGAGGAATATGAAGAAATCAAACCTAAACGACGTCGGGGTAAACAATCTTCTTCAAAGAAGCCAGAATTCACCTTTAACAATGACGACGAACGTTATCATTGCAATAGATGTAATAAGGACTTTGCCTGGAAGAAAGATGTAGAGCGCCATTTGAAAAGTCATTATGGTATTTATCCATACGAATGTAATAAGTGTGGACATCGTTTTCAGCGAAAGGACAAGTTTTCTAATCACTTGAAAGTGCATGAGAGACAAGAGGCTGGTGGTACACGTCGACCAAAATCCGACAAACGCGCAGAATTAAGTTTCGCAGAACATTTATATACGGAACTGCGCTTCCGTTCGCTGGAATGTAAGTTGTGcactgaaaatataccaaattTAGCAACACTCCGCACGCACTTGCAAACACACATTGAACCAAATACAATAGATATAGAGGCGGATAGTGATATCGTTAAAGAACTATTCCCCAATGCGAATGGTGGTTTGAATCACATtaaattacaaatatgtaaagaCATCAAAGAGCAACGTTTTGGGAAGTATTATGCAATTATTAATGCATATGGTTATGAAATGGCTCTAAGTGATTCTGACACAGAACCTATTACTGTGGAGGGAGAAAAGAAATATGAATGTGAATTATGTCTCGTTAAGATGACGCGCAAGTATCAATTAATACAGCATTCAAAAACTGAGCATTCTCAAGAAAAATTTCCACATAAATGTAATGTTTGCAAATTGCAATTTGTAAGCGCTCCAATGTACGAGTTTCACTCACGCACACAATGCCGTAATCGTGATAGAAAATATCAATGTCTAAAATGTCCAGGAAAATTTGTATGGTTACAGAACCTTCAAGGACACAAATGTTCCAATCGTCTTAACTTGTACGCCCCAAAAAAGACAGAACAGCGAAAACGAAATTTGTTACAATGCAACTTCTGTGATAAAACTTTCCGTTACGCCACTGACTTGAAACGGCATCAAGAAACTCACAACTTGAGTAGTCGTTCTCATATTTGCAGTATTTGTAGTCAACCATTTTTGAAAGCCGAAAATCTGCGTCAACATATGCGGCAAGCTCATGATCAATTCAAACGACGCATTTTGTGTTGCCTCTGTGGTGAAAAACCTAAAACACTGGCAAAGCTACGTATACATTTGCAAAATCATGCGGATGGTTGGACTGGTATTAGATACACAGAGGGACTTTATTTTAAAGCACACTGGCCCCAAGGTTGCAAAGGTAGAGAAGCAGAAATAGAACAAAGCATTGTAATTGATTTTGCTGGACAGAATCTAACACCCTACTATTGCGCCGTGGACGAGAGTGGTAATGAAATGGATTTGTATGACTCTGAAACAGATTTGGAAACGGAAACTGATGCTCCCTCGTCGAGTGGGAACCCTACATCAAACGTGTATAGTTGCGATTTGTGTAACGAAGTATACTACAGAAGATCGCGTATATTACAACATCAACATAGTGCACATGCCGATAGTTCAGAAACACTACCACATGCCTGTGGACGTTGTGAGAAACAATACGTTTGTTTGGGTTTACTAGAACGTCATTATAAGCGTGATTGTGGCAATATATATAAACGTTTTGATTGTAAGCGATGTTCAGCGCGCTTTGTGTGGGAAGAAAATTTGCAGCAGCATATGCAACGCCAGCACATCGATCCAGAACAACAAATAAGTCGCCAACTTGCTAATAAGTTGCAATGTGATGAATGTAATAAAGTATTCGTTTGGCCAAAAGATTTAACGCGTCACAAACGTATTCATATGCCTGATGATGAAAAGTTCGAATGCCCATATTGTGATCGAAAATTCTACCGGAAAGATCATTTGCAAACACACTTGAAAACTCATGGCGCCTCTGGTAATACGGCTGCGGCGACTACAACTGCGGCAGCTACCAAACGCGAGCTTAATCGCAAAGTGAGTGCTGTTGACCCGCATCTTTGTAAACCCAATGGTCTCAAGTGTGTGCAATGTAAAATTTGTCTTTCCACACATACGAAAATTGCCGATCTTCGTGAACATTTAATGGAACATCGCAGTGAAGTTTCACTTTCCCAATATGTTGCCACAAACTCAAAAACATCTCTGCACTTCTATCCGGATGAAGCCCCTATGCCAAGGGAGTTATTGATAGCAAGAATGTTGGCTGATATAACTGCTGGCCAGCTAGATCGTTTTTATTCCATAACAAATGAGCTCGGTCATGAGTTAAGCATTAGTGGTTCTGATACTGATGATACGGACTCAGAATCAGAGCCTGATGAAACCTTAGATCATGCCATTGGTTATAGCATTCAACACCCAAGACGTTCTACATACAATTGTGATTTGTGTAGCATTGCTTTTACACGCAAGTACAAACTGTTTGCTCATCAAGCAAGCGATCATAAATGGGACGAAGCTCCTTATGTATGTCAAAGTTGTCAAGCACATTTCCTATGCGATAAATTATTGCAGTCGCATTATCGTCATCAAtgtaaaaatttgttgaaacgTTATGTATGTCGCAAATGTCCACAACGTTTTATGTGGAAGGAAAATCTTAAAATGCATTTACGAACTATGCATCCGGATAGTGAAGATGTACAAAAGatATTCTCGCTCAGTTCCTTTGATTGTGATGAATGTTCACGAACTTTCCAAATGCAGAAAGACTTAACTCGTCACCAGATGATCCATCGCACCGATGCTACTGTGTTCCCATGTCTCTTTTGCCAACGGAAGTTTTATCGCCGTAGCAACTTATATTTGCATATTAAACGTCATGGTATAACATCACATGAGCTGAGTGCAGCCGCAGCTCATATCACTGCTCACAAAGGGCCGAATGGCAAAAAGGAAATTCTTTGCCGTGTATGTAGtatgcaatttaaaaccttatCTGCCTTACGCACCCATCTCCGTCAAGAGACTGCAGCGATATTACCATCTCACCACGACTACAGCTCACAGCAAAACTATTCCATTATGAATGAATTAGGATTTGAATTAGATATGAATGATTCAGAGACAGAGGAAGAAGATAATGACGATGCGAAAGTCAAGTCCTACAAATGCCAAGTATGTGGACTGGTTTGCAAGAGACGATATGAAATGGGTCAACATCAGTTATCTATACATAAGCACGAATTTATAACACTTAAGTGTGATAAATGCGTATTTAGAACGGTTTCAAATGATATTATGGAGCATCACTTGCGTACACAATGTAACAATGTCGAAAAACAGCATCAATGCACTCAATGTTCTTACAAATTTATGTGGCCCGAGAACTTGGAGGTCCACGTTAAATTGGTGCATCCACCAATACCTGAAGAGATGCAGCCGCTTAAAGGAGCAACAGAGGCAATAACAGCTACATCAAATGATTCCCCAGGAAATAGTATACCCGTGCCACCTCAAGTATTCCAATGCGATCAGTGTGAGCGTCGTTATAATCGTAAAGATCGATTGGTGGCCCATATGAAAAAATCCCATGCTCAGAACGATGACAACAATGATCCTAGTTGTAGCACAAATGCTACTGAAACTAAAACATCAATTACCGGCAAGAAGCCGCCGAAGGAGAAGTCGTTTTTATGTGCATTCTGTGGCCGTGCTGTGAGCTCATCGTCAAATTTGATTGTTCATATGCGCCGACACACAGGCGAGAAACCGTTTCAATGTGAATTTTGTGATAAGGCATTTCCCCGGTCTTCGGATTTGGCGTGTCATCGACGTACACACACAGGCGAGAAACCCCATCATTGTACAGTGTGTGGTAAGTCCTTTTCACGTTCATACAAATTGCAACAACACATGCGTATACATTCTGGTCAAAGGCCATACAAGTGCACATATTGTGAGAAGAGCTTTACGCAATCAAATGACCTTAACTTGCATGTTCGTCGGCATACTGGTGAACGTCCTTATGTATGCAATGTATGCGGTGAAGGATTCATTCAAGGGACAGCTTTAAAGCATCACCGAACAGCTCATGGTCATTTCGAAGGAGATACACGAGAGGAACGAACCAGTAATGTTTTACAATTAGATGAAGGTAACAGCTTAATGCAATTATAA
Protein Sequence: MTSYQCRTCRETKKCQYYALTDFLDEERCPKKTLADFLWDIAKINNKTEDAKRLPQQICAGCSRKLNNTYSFILQAQVANRKLFASLYIGKAGCSSAKDLPNKSNDCLLETPIDIPIRQTVIKEENDNAEEEPTEERREGLSADKEIENVEESLNTEAESVKEEHIDLELKIRDTDCISEDESVGVDPITTVDKDKENPVTLDNASDRDTDKSEDAAPPVKRRRGRSQRIAHTLEFAYCDDNGRYHCKKCDKSFAWKKDAERHYETHSGIFPYECEQCGHLFQKKDKYDNHMSLHARRDNVEDKSLPEDEIFDIESKLEVELDANDTSDEQSEEEYEEIKPKRRRGKQSSSKKPEFTFNNDDERYHCNRCNKDFAWKKDVERHLKSHYGIYPYECNKCGHRFQRKDKFSNHLKVHERQEAGGTRRPKSDKRAELSFAEHLYTELRFRSLECKLCTENIPNLATLRTHLQTHIEPNTIDIEADSDIVKELFPNANGGLNHIKLQICKDIKEQRFGKYYAIINAYGYEMALSDSDTEPITVEGEKKYECELCLVKMTRKYQLIQHSKTEHSQEKFPHKCNVCKLQFVSAPMYEFHSRTQCRNRDRKYQCLKCPGKFVWLQNLQGHKCSNRLNLYAPKKTEQRKRNLLQCNFCDKTFRYATDLKRHQETHNLSSRSHICSICSQPFLKAENLRQHMRQAHDQFKRRILCCLCGEKPKTLAKLRIHLQNHADGWTGIRYTEGLYFKAHWPQGCKGREAEIEQSIVIDFAGQNLTPYYCAVDESGNEMDLYDSETDLETETDAPSSSGNPTSNVYSCDLCNEVYYRRSRILQHQHSAHADSSETLPHACGRCEKQYVCLGLLERHYKRDCGNIYKRFDCKRCSARFVWEENLQQHMQRQHIDPEQQISRQLANKLQCDECNKVFVWPKDLTRHKRIHMPDDEKFECPYCDRKFYRKDHLQTHLKTHGASGNTAAATTTAAATKRELNRKVSAVDPHLCKPNGLKCVQCKICLSTHTKIADLREHLMEHRSEVSLSQYVATNSKTSLHFYPDEAPMPRELLIARMLADITAGQLDRFYSITNELGHELSISGSDTDDTDSESEPDETLDHAIGYSIQHPRRSTYNCDLCSIAFTRKYKLFAHQASDHKWDEAPYVCQSCQAHFLCDKLLQSHYRHQCKNLLKRYVCRKCPQRFMWKENLKMHLRTMHPDSEDVQKIFSLSSFDCDECSRTFQMQKDLTRHQMIHRTDATVFPCLFCQRKFYRRSNLYLHIKRHGITSHELSAAAAHITAHKGPNGKKEILCRVCSMQFKTLSALRTHLRQETAAILPSHHDYSSQQNYSIMNELGFELDMNDSETEEEDNDDAKVKSYKCQVCGLVCKRRYEMGQHQLSIHKHEFITLKCDKCVFRTVSNDIMEHHLRTQCNNVEKQHQCTQCSYKFMWPENLEVHVKLVHPPIPEEMQPLKGATEAITATSNDSPGNSIPVPPQVFQCDQCERRYNRKDRLVAHMKKSHAQNDDNNDPSCSTNATETKTSITGKKPPKEKSFLCAFCGRAVSSSSNLIVHMRRHTGEKPFQCEFCDKAFPRSSDLACHRRTHTGEKPHHCTVCGKSFSRSYKLQQHMRIHSGQRPYKCTYCEKSFTQSNDLNLHVRRHTGERPYVCNVCGEGFIQGTALKHHRTAHGHFEGDTREERTSNVLQLDEGNSLMQL

Similar Transcription Factors

Sequence clustering based on sequence similarity using MMseqs2

100% Identity: iTF_00992841;
90% Identity: iTF_00992841;
80% Identity: -