Basic Information

Insect: Epistrophe eligans
Gene Symbol: -
Assembly: GCA_951394125.1
Location: OX596030.1:82558467-82569846[+]

Transcription Factor Domain

TF Family: zf-C2H2
Domain: zf-C2H2 domain
PFAM: PF00096
TF Group: Zinc-Coordinating Group
Description: The C2H2 zinc finger is the classical zinc finger domain. The two conserved cysteines and histidines co-ordinate a zinc ion. The following pattern describes the zinc finger. #-X-C-X(1-5)-C-X3-#-X5-#-X2-H-X(3-6)-[H/C] Where X can be any amino acid, and numbers in brackets indicate the number of residues. The positions marked # are those that are important for the stable fold of the zinc finger. The final position can be either his or cys. The C2H2 zinc finger is composed of two short beta strands followed by an alpha helix. The amino terminal part of the helix binds the major groove in DNA binding zinc fingers. The accepted consensus binding sequence for Sp1 is usually defined by the asymmetric hexanucleotide core GGGCGG but this sequence does not include, among others, the GAG (=CTC) repeat that constitutes a high-affinity site for Sp1 binding to the wt1 promoter [1].
Hmmscan Out: # of c-Evalue i-Evalue score bias hmm coord from hmm coord to ali coord from ali coord to env coord from env coord to acc

1 29 0.027 2.5 9.3 0.4 1 23 314 336 314 336 0.98

2 29 3e-05 0.0028 18.5 4.0 1 23 342 364 342 364 0.98

3 29 0.0025 0.23 12.5 1.3 1 23 370 393 370 393 0.91

4 29 0.00037 0.035 15.1 0.4 3 23 399 419 398 419 0.97

5 29 0.11 11 7.3 1.2 1 23 427 450 427 450 0.91

6 29 0.0011 0.11 13.6 0.4 3 23 459 480 457 480 0.94

7 29 0.016 1.5 10.0 0.3 1 16 486 501 486 502 0.87

8 29 0.0025 0.23 12.5 0.4 1 23 777 799 777 799 0.99

9 29 0.048 4.4 8.5 2.8 1 23 805 827 805 827 0.93

10 29 0.018 1.7 9.8 4.4 1 23 833 856 833 857 0.94

11 29 0.001 0.097 13.7 0.3 3 23 862 882 861 882 0.97

12 29 0.13 12 7.1 0.7 1 23 890 913 890 913 0.91

13 29 0.0034 0.31 12.1 0.3 3 23 922 943 920 943 0.94

14 29 0.056 5.2 8.2 0.4 1 12 949 960 949 961 0.92

15 29 0.28 26 6.0 0.2 6 23 1225 1242 1225 1242 0.98

16 29 0.00016 0.015 16.2 0.4 1 23 1248 1270 1248 1270 0.98

17 29 2.4e-06 0.00023 22.0 3.0 1 23 1276 1298 1276 1298 0.99

18 29 0.0019 0.18 12.8 1.2 1 22 1304 1325 1304 1327 0.90

19 29 0.0014 0.13 13.3 0.4 3 23 1335 1355 1334 1355 0.97

20 29 0.00023 0.021 15.8 0.2 2 23 1364 1386 1363 1386 0.96

21 29 0.02 1.8 9.7 0.5 1 23 1393 1416 1393 1416 0.92

22 29 0.025 2.3 9.4 0.2 1 16 1422 1437 1422 1438 0.87

23 29 0.093 8.7 7.5 1.5 1 23 1605 1627 1605 1627 0.97

24 29 0.00013 0.012 16.6 1.1 1 23 1633 1656 1633 1656 0.93

25 29 0.00032 0.03 15.3 1.6 1 23 1662 1685 1662 1685 0.93

26 29 0.0009 0.083 13.9 2.0 3 23 1693 1713 1692 1713 0.97

27 29 0.0026 0.24 12.4 4.0 1 23 1721 1744 1721 1744 0.97

28 29 0.025 2.3 9.3 0.3 1 23 1751 1774 1751 1774 0.92

29 29 0.044 4.1 8.6 0.3 1 17 1780 1796 1780 1797 0.89

#	of	c-Evalue	i-Evalue	score	bias	hmm coord from	hmm coord to	ali coord from	ali coord to	env coord from	env coord to	acc
1	29	0.027	2.5	9.3	0.4	1	23	314	336	314	336	0.98
2	29	3e-05	0.0028	18.5	4.0	1	23	342	364	342	364	0.98
3	29	0.0025	0.23	12.5	1.3	1	23	370	393	370	393	0.91
4	29	0.00037	0.035	15.1	0.4	3	23	399	419	398	419	0.97
5	29	0.11	11	7.3	1.2	1	23	427	450	427	450	0.91
6	29	0.0011	0.11	13.6	0.4	3	23	459	480	457	480	0.94
7	29	0.016	1.5	10.0	0.3	1	16	486	501	486	502	0.87
8	29	0.0025	0.23	12.5	0.4	1	23	777	799	777	799	0.99
9	29	0.048	4.4	8.5	2.8	1	23	805	827	805	827	0.93
10	29	0.018	1.7	9.8	4.4	1	23	833	856	833	857	0.94
11	29	0.001	0.097	13.7	0.3	3	23	862	882	861	882	0.97
12	29	0.13	12	7.1	0.7	1	23	890	913	890	913	0.91
13	29	0.0034	0.31	12.1	0.3	3	23	922	943	920	943	0.94
14	29	0.056	5.2	8.2	0.4	1	12	949	960	949	961	0.92
15	29	0.28	26	6.0	0.2	6	23	1225	1242	1225	1242	0.98
16	29	0.00016	0.015	16.2	0.4	1	23	1248	1270	1248	1270	0.98
17	29	2.4e-06	0.00023	22.0	3.0	1	23	1276	1298	1276	1298	0.99
18	29	0.0019	0.18	12.8	1.2	1	22	1304	1325	1304	1327	0.90
19	29	0.0014	0.13	13.3	0.4	3	23	1335	1355	1334	1355	0.97
20	29	0.00023	0.021	15.8	0.2	2	23	1364	1386	1363	1386	0.96
21	29	0.02	1.8	9.7	0.5	1	23	1393	1416	1393	1416	0.92
22	29	0.025	2.3	9.4	0.2	1	16	1422	1437	1422	1438	0.87
23	29	0.093	8.7	7.5	1.5	1	23	1605	1627	1605	1627	0.97
24	29	0.00013	0.012	16.6	1.1	1	23	1633	1656	1633	1656	0.93
25	29	0.00032	0.03	15.3	1.6	1	23	1662	1685	1662	1685	0.93
26	29	0.0009	0.083	13.9	2.0	3	23	1693	1713	1692	1713	0.97
27	29	0.0026	0.24	12.4	4.0	1	23	1721	1744	1721	1744	0.97
28	29	0.025	2.3	9.3	0.3	1	23	1751	1774	1751	1774	0.92
29	29	0.044	4.1	8.6	0.3	1	17	1780	1796	1780	1797	0.89

Sequence Information

Coding Sequence: ATGAAGTGCattctttgtttaaaaacacCGGACAAACCAATTGATATATTCGGAGAGCAAGGTCGTAGTCTCGATATGAAATGTAtaatttctaaacatttttggcTCGAGCCAAATCAAGAGGATATTAACTCCAAATTAATATGTTCATCATGTTGGATATCAGTTGATGCATTTCACAAATTTTACGAAGAAATAAAAGAAGCCCATTGTTCGTTTCAAGAAATAAAACCTGCAGTTGCAGAAGATGATTTTCAAGAAGGAGGAACCATGTCAAACGACAATCATTTCAGTGACAATAATATGTATTTGGATGAAGATATTAAAGTTGAAGATTAcgaatcaacaaattttcaaatggaATTACAATGTCATATAAATCCTTTAGAAATATCAATCAAAAGTGATGAAAGGGATTTTGACATTAAATCCGACTCAGAGTCTGAAATGCCTTTATCCGAATTATCCAGACAGCTTCATAAAAAGGTTAAAACTGTGAAGAAGGTCAATATTGCCGGAGTCGAACAGttcaaaaaaagagataaaactTCTAAGACAAACATCGGAGCGCCCAAAAAGAAACTACTTAAGGATAGAACTCCaaagaaaacaaacgaaaaatcaaaaatgagtTCCCCTATTAAAGACACCATTGAAGAAAAACTTCATATCCACGAAGGCAAATGGCTAGCCAATTGCTATGCAGAAGAAACTTATTCCAGGCCAATAAGCTCTGAAGAGCTGGACAAATACTTAAAACAGAACATAGAACTTTTGTGTGGTGTTTGCCAGAAGCCAATGGATGAATTCGCATCCCTCCATCCGCATTTCGTTAAGTATCATGATAAAGCTAAACCTTTTGTATCTTGTTGTGGGAGGAAACTTAAGTACCGTGCGCATATAATCGATCATAGTTTAGTGCATAAAATCCCGGACTATTTTAAGTGTATGGAATGCTCAAAAGTTTGGCCATCTCGTCGCAGTCTGAAGGAGCACTTGTCAATACATAATAAGAATTTCATTTACCACTGTGACAAATGCAACAAGAGCTTTTGCAGTAAGCCTGCTCTTGAACGTCACCAGGAGGTTCACTTTGTGGAACGTCCATTTAAATGTGACGAGTGTGATAAGTTCTACGCAACAGAATACCGACTTAAGCAACACGCCTACAACATgcatcaatataaaaaaatttgtgaacaaTGCGGGCAAGTATTTCGAGAGAAGGAAACATTTGTTCGACATTTATTGAAACACACAAATCAACCAAAGCCATTTTTTGAATGTAAAATATGTGGAGCTAGGCTTTCGAGTAAAAAAATTCTACAGAAACATAACAAGTTTCAGCATTTGGAAGATTCAATCGAACAAAATTGTAACCTATGTGGAATTACAGTTAAAAACTTGCAAGCTCTCAAACGACATATGAATTTCGTTCATAAATATCAGCGGGAGCACAAGTGTACAATGTGCGACAAAGCCTTCAAGAGGGCTCTTACACTTaagCCAAATCAAGACGATGGCAACTCCACATTGATATGTTCTTCATGTTGGACATCAGTTGATGCatttcacaaattttaccaaaaaataaaagaagcccATTGTTCGTTTCAAGAAATAAAACCTGCAGTTGTAgatgattttcaaaaagaagtAACTATGTCCAAAGATAATCGTTTGAATCACAATAACTTGTATATGGATGAAGatataaaaGTTGAAGCCTACGAATCAACAAATTTCCCTATAGAATTACAATGTCATATAAATCCTTTGGAAATGTCAGTCAGAATCGATGAAAAGGACGTTGAGATTAAGTCGGACTCGGAGTCCGAAATGTCTTTATCTGAATTATCCAGACAACttcaaaaaaaggataaaatctTAAACAAGAGCAATATTACAGAAGTCAAACAATTccaaaaaagaagtagatctaaGAGTAACATTGGAGAGCccaaaaagaaattacttaagGAAAAAACTCCAAAGAAAACACATACAGAATCCAAATTGAGTTCCGAGAGTATAGATAACAATGATGAAAAACTTCATATACACGAAGGCAAATGGCTAGCCAAGTCATATGCAGAAGAAACTTATTCCAGGCCAATAAGCTCTGAGGAGCTGGACAAATACATAAAACAGAACATAGAACTTTCGTGTGGAGTTTGTCAGAAGCCAATAGATGAATTCGCATCCCTTCATCCGCATTTCGTTAACTGCCATGAAAAAACTAAACCATATGTCTCTTGTTGTGGGAAGAAACTAAAGTTTCGTGCTCATATAATCGATCATAATTTAGTGCACAAAATACCTGAATATTTTAAGTGTGTGGAATGCTCAAAAGTTTGGCCATCTCGTCGGAATTTGAAGGTACACTTGTCAACACacaataagaattttatttaccaCTGTGAAAAATGCAACAAGAGCTTTGGTAGTAAGCCTGCTCTTGAATTTCACCATGAAGTACACTTTGTAGATCGACCATTTAAATGTGAAGAATGCGATAAGTTCTATGCAACAGACTACCGACTTAAGCAACATATCTACCATGTGCAtcattataagaaaatttgtgAACAATGCGGTCAAGTATTTCGGGAGAAGGAAACATTTGTTCAACATTTATTGAAACACACAAATCAACCAAAGCCAATTTTTGAATGCGAAATATGTGGAGCTAGGCTTTCGAGTAAAAAAATTCTACAGAAACATAACAAGTTTCAGCACCTGGAAGATCCAATAGAACAAAATTGCGACCTTTGTGGAATTAAAGTTAAGAACTTGCAAGCTCTTAAACGACatatgaattttgttcataaatatCAGCGGGAGCACAAGTGTACAATGTGCGACAAAGCCTTCAAAAGGGCTCTTATACTTAAGtgcattttgtgtttgaaaaatcCACATGTGTCAATAAATATATTCGGAGAGACTGGTCGTTACCTCGATATCAAAGAAATCATAACTAAACACTTTTGGCTTCAGccAAATGAAGACAATAGGAGTTCGAATTCGATATGTTCTATTTGTTGGACAACATTGGAATCATTTCACAAATTCTATGAAGAAATCAAAAAAGCCCACTGTTCGCAAATGGAAATTAAACCTGCAAATGATGAAAATGAGGACTTGGAAGTAGAAGTCAATGCAAGTGATTATCATGTAGATAATTATGACGGTATCCTGTGTCAAGccATTAAAGTTGAATTGAAAGAGGAAACTAATAATGAAAGAACGGAACACGATAACTCTAAcgaaaatgtaaaatgttcAATAGAAGTGGAAGTAAAATATGACCAAGATGAACCTGATAGAGACGAATATTTGGAGGAGTCCGACTCGGAAATCCCCCTCTCTAAATTGGCCAAACAAGGTCAGGAAGAAAAGGAAAGCCCTAAAAGTAATTCTAGCTTCAAATCAGACGTCCAAAGTAAAAATACCGATGACCAAAAGGTTCACATCCAAGACGGAAAATGGCTTGCAACTTGCTTTGGTGAGGAAACCACCGATAAGTCCATTAGTCACAAAGAGTTGGATAAgtttatcaaaattaacattGAACTTACCTGCGAAATATGTCGAATACCAATGAAAGACTTCTTAGCACTCCAAAAACACTTCAAAGATACCCACACTGGAAAAACCTTTGTGACTTGTTGCGATAAAAAGTTCTCACTGCGAAGTCGTTTAGTTGATCATATTTTGCTACATAAGCTACCTGGCTATTTTACATGTGTGATCTGCTCTAAGCTCTTGTCTTCTCGAGAAAACCTAAGAAAACATATGATTGTGCATGACAAGAAATATGACTTCCAATGTAATAAGTGTGATAAGACTTTTTATCGGAAACAACTTCTTGACCGTCACATGGATACCCACGTACTAGatcgaaaatttaaatgtgACAAATGTGACAAACTcTTTACATCGAAATTTTCTCTAGGACAACACGTCTACGGTGTCCATAAAGGTGGCTATAAGAAAATTTGCGAGCAATGTGGCAAAGTTTCTCGTGACCATGAAGCTTTCGTTCGTCATCAATTGGTACACACAAATCAACCAAAACCATTTGTCGAATGCCCAAAATGTGGTATCAAACTCGTTGACAAAAATGGGTTACGTAAACATATGCAATCTCAGCATCCCGATGAAACACGTGAACACGTTTGCACCGAATGCGGAATCATAACTAACACAATATTTGCATTGAGGCGACACATAACGTTTATGCACAAGAGAAAACGTGACCATAAGTGTCCGGTGTGTGAAAAAGCTTTTAAGAGAGCTCTTACTTTGAAGCCATTGGATGTTGATTCCGTCGACGAAAATATTAAATGCCCTTtagaatttaaagtaaaatgcgatcaaaataaatttgacatgGACGAAGAGGAACAAGAGGAATCTGATTCGGAAATTCCCCTATCAAAGTTGAGCGAACAACTGCAACATAAGGAGGAAAGTTTAGAAAGCAATTGTAGTACTAAGTCGAATGACAAAGGTAAAAACACTAAGGATGAAAAGATACACATCCACGAAGGTAAATGGCTGGCCACTTGTTTTGGCGAAGAAACTGTTATAAAGCCTATAAGTCACCATGAGTTggacaaatttattaaattaaatacggaACTAACTTGTGAGATATGCCGCATTCCAATGAAAGATTTCTTAACCCTTCAGACGCACTTCAAAGATACCCATACTGTTAAACCCTTTGTAACTTGTTGTGACAAAAAATTCGAACTTCGTTGTCGTTTAGTTGACCACATTTTATTGCACAAGTTGCCCAATTATTTTACATGTGTTGTATGTTCCAAAGTCTTGTCGTGCCGccttaatttaagaaaacacaTGGTTGTTCACGATAAAAAACAAGCTTTCCAATGTGACCAATGCGATAAGACCTTCTACCGAAAAGAGGTCTTTAATCGTCACGTGTTGGATATACATACTTTAGatcgaaaatttaaatgtgAAGAATGTGATAAACTatTTGCTTCAAAATGTTCACTAAACACGCATATCTACGGTGTTCATAAAGGTCGATATAAGAAAATTTGCGAGCAATGCGGTAAGGTCTCTTGTGATCAAGAAACTTTTCTTCGTCACCAAATGAAACATTCAAACAAACCACAAACATATTTTGAATGTCCAAAATGTAGTGTCAAACTTTCAACCAAACACGGATTACGACATCATATTAGATATCAGCATTCAGAAGATACCCGAGAACACGTTTGCAATGTTTGTGGAAACATATCAACAAGTGAAGCGGCATTGAAACGGCATGTAACATATATGCACAAGTACAAACGAGATTTTAAATGCTCGTTGTGTGAAAAGGCTTTTAAGAGGGCTCTTACTTTGAAGGTAAGAAGAtag
Protein Sequence: MKCILCLKTPDKPIDIFGEQGRSLDMKCIISKHFWLEPNQEDINSKLICSSCWISVDAFHKFYEEIKEAHCSFQEIKPAVAEDDFQEGGTMSNDNHFSDNNMYLDEDIKVEDYESTNFQMELQCHINPLEISIKSDERDFDIKSDSESEMPLSELSRQLHKKVKTVKKVNIAGVEQFKKRDKTSKTNIGAPKKKLLKDRTPKKTNEKSKMSSPIKDTIEEKLHIHEGKWLANCYAEETYSRPISSEELDKYLKQNIELLCGVCQKPMDEFASLHPHFVKYHDKAKPFVSCCGRKLKYRAHIIDHSLVHKIPDYFKCMECSKVWPSRRSLKEHLSIHNKNFIYHCDKCNKSFCSKPALERHQEVHFVERPFKCDECDKFYATEYRLKQHAYNMHQYKKICEQCGQVFREKETFVRHLLKHTNQPKPFFECKICGARLSSKKILQKHNKFQHLEDSIEQNCNLCGITVKNLQALKRHMNFVHKYQREHKCTMCDKAFKRALTLKPNQDDGNSTLICSSCWTSVDAFHKFYQKIKEAHCSFQEIKPAVVDDFQKEVTMSKDNRLNHNNLYMDEDIKVEAYESTNFPIELQCHINPLEMSVRIDEKDVEIKSDSESEMSLSELSRQLQKKDKILNKSNITEVKQFQKRSRSKSNIGEPKKKLLKEKTPKKTHTESKLSSESIDNNDEKLHIHEGKWLAKSYAEETYSRPISSEELDKYIKQNIELSCGVCQKPIDEFASLHPHFVNCHEKTKPYVSCCGKKLKFRAHIIDHNLVHKIPEYFKCVECSKVWPSRRNLKVHLSTHNKNFIYHCEKCNKSFGSKPALEFHHEVHFVDRPFKCEECDKFYATDYRLKQHIYHVHHYKKICEQCGQVFREKETFVQHLLKHTNQPKPIFECEICGARLSSKKILQKHNKFQHLEDPIEQNCDLCGIKVKNLQALKRHMNFVHKYQREHKCTMCDKAFKRALILKCILCLKNPHVSINIFGETGRYLDIKEIITKHFWLQPNEDNRSSNSICSICWTTLESFHKFYEEIKKAHCSQMEIKPANDENEDLEVEVNASDYHVDNYDGILCQAIKVELKEETNNERTEHDNSNENVKCSIEVEVKYDQDEPDRDEYLEESDSEIPLSKLAKQGQEEKESPKSNSSFKSDVQSKNTDDQKVHIQDGKWLATCFGEETTDKSISHKELDKFIKINIELTCEICRIPMKDFLALQKHFKDTHTGKTFVTCCDKKFSLRSRLVDHILLHKLPGYFTCVICSKLLSSRENLRKHMIVHDKKYDFQCNKCDKTFYRKQLLDRHMDTHVLDRKFKCDKCDKLFTSKFSLGQHVYGVHKGGYKKICEQCGKVSRDHEAFVRHQLVHTNQPKPFVECPKCGIKLVDKNGLRKHMQSQHPDETREHVCTECGIITNTIFALRRHITFMHKRKRDHKCPVCEKAFKRALTLKPLDVDSVDENIKCPLEFKVKCDQNKFDMDEEEQEESDSEIPLSKLSEQLQHKEESLESNCSTKSNDKGKNTKDEKIHIHEGKWLATCFGEETVIKPISHHELDKFIKLNTELTCEICRIPMKDFLTLQTHFKDTHTVKPFVTCCDKKFELRCRLVDHILLHKLPNYFTCVVCSKVLSCRLNLRKHMVVHDKKQAFQCDQCDKTFYRKEVFNRHVLDIHTLDRKFKCEECDKLFASKCSLNTHIYGVHKGRYKKICEQCGKVSCDQETFLRHQMKHSNKPQTYFECPKCSVKLSTKHGLRHHIRYQHSEDTREHVCNVCGNISTSEAALKRHVTYMHKYKRDFKCSLCEKAFKRALTLKVRR

Similar Transcription Factors

Sequence clustering based on sequence similarity using MMseqs2

100% Identity: -
90% Identity: -
80% Identity: -