Basic Information

Insect: Eupithecia subumbrata
Gene Symbol: -
Assembly: GCA_949316285.1
Location: OX438646.1:12501313-12511347[+]

Transcription Factor Domain

TF Family: zf-C2H2
Domain: zf-C2H2 domain
PFAM: PF00096
TF Group: Zinc-Coordinating Group
Description: The C2H2 zinc finger is the classical zinc finger domain. The two conserved cysteines and histidines co-ordinate a zinc ion. The following pattern describes the zinc finger. #-X-C-X(1-5)-C-X3-#-X5-#-X2-H-X(3-6)-[H/C] Where X can be any amino acid, and numbers in brackets indicate the number of residues. The positions marked # are those that are important for the stable fold of the zinc finger. The final position can be either his or cys. The C2H2 zinc finger is composed of two short beta strands followed by an alpha helix. The amino terminal part of the helix binds the major groove in DNA binding zinc fingers. The accepted consensus binding sequence for Sp1 is usually defined by the asymmetric hexanucleotide core GGGCGG but this sequence does not include, among others, the GAG (=CTC) repeat that constitutes a high-affinity site for Sp1 binding to the wt1 promoter [1].
Hmmscan Out: # of c-Evalue i-Evalue score bias hmm coord from hmm coord to ali coord from ali coord to env coord from env coord to acc

1 24 0.017 1.4 10.4 1.5 3 23 654 675 653 675 0.92

2 24 6.5 5.6e+02 2.3 1.1 4 21 1045 1062 1043 1063 0.87

3 24 0.15 12 7.4 1.4 1 21 1071 1091 1071 1092 0.96

4 24 8.8 7.5e+02 1.9 0.4 1 23 1132 1155 1132 1155 0.90

5 24 0.00031 0.026 15.9 0.9 3 21 1166 1184 1166 1185 0.96

6 24 0.39 33 6.1 0.5 2 23 1193 1215 1192 1215 0.93

7 24 0.023 1.9 10.0 0.8 3 23 1234 1255 1232 1255 0.92

8 24 0.00053 0.045 15.1 0.5 1 23 1260 1283 1260 1283 0.93

9 24 0.1 8.5 8.0 0.0 1 23 1309 1332 1309 1332 0.91

10 24 0.023 2 9.9 3.4 1 23 1337 1359 1337 1359 0.97

11 24 0.018 1.6 10.3 0.2 1 23 1365 1388 1365 1388 0.95

12 24 0.014 1.2 10.7 1.0 1 23 1401 1423 1401 1423 0.97

13 24 0.00022 0.019 16.3 1.8 1 23 1479 1502 1479 1502 0.97

14 24 0.00019 0.016 16.5 1.4 1 23 1554 1577 1554 1577 0.95

15 24 0.0022 0.18 13.2 1.4 2 23 1602 1624 1601 1624 0.95

16 24 0.025 2.1 9.9 0.1 2 23 1630 1652 1629 1652 0.94

17 24 0.11 9.8 7.8 0.9 1 23 1695 1718 1695 1718 0.95

18 24 0.0015 0.13 13.7 0.6 1 23 1726 1748 1726 1748 0.93

19 24 0.00013 0.012 17.0 0.4 2 23 1835 1857 1834 1857 0.93

20 24 4.1e-07 3.5e-05 24.9 1.4 3 23 1864 1884 1863 1884 0.98

21 24 0.0042 0.36 12.3 0.2 1 23 1903 1925 1903 1926 0.95

22 24 0.43 37 6.0 0.0 1 23 1949 1971 1949 1971 0.97

23 24 0.034 2.9 9.4 0.6 1 23 1977 2000 1977 2000 0.95

24 24 0.00048 0.041 15.3 0.5 1 23 2008 2031 2008 2031 0.96

#	of	c-Evalue	i-Evalue	score	bias	hmm coord from	hmm coord to	ali coord from	ali coord to	env coord from	env coord to	acc
1	24	0.017	1.4	10.4	1.5	3	23	654	675	653	675	0.92
2	24	6.5	5.6e+02	2.3	1.1	4	21	1045	1062	1043	1063	0.87
3	24	0.15	12	7.4	1.4	1	21	1071	1091	1071	1092	0.96
4	24	8.8	7.5e+02	1.9	0.4	1	23	1132	1155	1132	1155	0.90
5	24	0.00031	0.026	15.9	0.9	3	21	1166	1184	1166	1185	0.96
6	24	0.39	33	6.1	0.5	2	23	1193	1215	1192	1215	0.93
7	24	0.023	1.9	10.0	0.8	3	23	1234	1255	1232	1255	0.92
8	24	0.00053	0.045	15.1	0.5	1	23	1260	1283	1260	1283	0.93
9	24	0.1	8.5	8.0	0.0	1	23	1309	1332	1309	1332	0.91
10	24	0.023	2	9.9	3.4	1	23	1337	1359	1337	1359	0.97
11	24	0.018	1.6	10.3	0.2	1	23	1365	1388	1365	1388	0.95
12	24	0.014	1.2	10.7	1.0	1	23	1401	1423	1401	1423	0.97
13	24	0.00022	0.019	16.3	1.8	1	23	1479	1502	1479	1502	0.97
14	24	0.00019	0.016	16.5	1.4	1	23	1554	1577	1554	1577	0.95
15	24	0.0022	0.18	13.2	1.4	2	23	1602	1624	1601	1624	0.95
16	24	0.025	2.1	9.9	0.1	2	23	1630	1652	1629	1652	0.94
17	24	0.11	9.8	7.8	0.9	1	23	1695	1718	1695	1718	0.95
18	24	0.0015	0.13	13.7	0.6	1	23	1726	1748	1726	1748	0.93
19	24	0.00013	0.012	17.0	0.4	2	23	1835	1857	1834	1857	0.93
20	24	4.1e-07	3.5e-05	24.9	1.4	3	23	1864	1884	1863	1884	0.98
21	24	0.0042	0.36	12.3	0.2	1	23	1903	1925	1903	1926	0.95
22	24	0.43	37	6.0	0.0	1	23	1949	1971	1949	1971	0.97
23	24	0.034	2.9	9.4	0.6	1	23	1977	2000	1977	2000	0.95
24	24	0.00048	0.041	15.3	0.5	1	23	2008	2031	2008	2031	0.96

Sequence Information

Coding Sequence: ATGACTGTGAACTATGATCGTGTTTGTAGACTGTGCATGTCATCTCGAGGCGAATTACTGCCGATTTTTCCTACCACCAGTTCGGATGAGTTGGAACCTCCCATCCTCGCATCAAAAATTAAGGATTGTGTGTCTGTAGAGATAAACGAAAATGACGAGCTGCCGACGAACATCTGCAGGAAATGCGTGGATAATGTCAACAACTGGCATATATTCAAGACTGTATGTGCAAAGACACAAAACAAACTACTGTCTCTCACAAGAAAGGATGGAAGCCTACTAGAAGAGGTGCAAGTAAAAAATGAGCCTTTTTCTGATGAGGCTTATGATGATGGAGTGGTCATTGATGGATTATACCCTGAGAATGAGcAAGCGGCCGCTTCAAAGCTGCAGCCAGAAGGTCCCCCGATCCTGGCCTCGTTGGGACTTACTCCACGGAGTGATAAGAATTATGTTGACCCACGAATGGATTGGCAACGAGTTCATGCCATATTGGGTATGATTCAAGAGAATGATGTTATCGACTCGCTCCAATCCTTCGAAGAGAGTGATGAGTTGCACCATTCCGATCATGAGTCAGACTCGGAGGCAGAGCTCCAACCGAACATAGATGATATCTACACCGACTGTAAAATGGGCTACATTTGCAGAAACAAGAATATTCTGAACCAAAGGCCGTTCGACATTTCATACCTCAAAGTAAATACTGTAAAAGTGAAAAAGCGCAGACATGATATTCATAAACACGTTGGTACCCCCAAAAGTGCATGGCACCTACTGTTTACAGAAGACCTTCTTGATCTCATTGTGTCCGCAAcaaatgaaaacattctcaggCACAGCAAAGTATTTGATGGCTGCACTAGTGTCGGTGAAGTCAAGAGTCTTATTGGAATTTTGTACCTGAACGGTATAATGCGGCCAACTCATCAGAAATGCAGTGACCTCTGGGACAAAGACGTTGGCGTCCCGGCCGTTATAAACGCAATGACAAACGAACGCTTCAACTTTCTCTTACAAAACCTCTGTTTCCATAGCCAAGATGATGATAACAGCATTATGCAGTACGATACAATGAAGCGAATACGCAAATTGTTTGAGATATTCGTGATGAACTGCAGAAGTACATTCGACGTGCAGAGTACAGCGGTCGTTGATGAGATCATTGTGCCAGTTTTCGGACCTTGCCCGTTTCGATACGACATCGATAAGAAACCATTGAAACGTGGAATCAAAATAGTGCTGCTGGTCGATCCAAGTAATTTCTACGTGAGCAATCTGGATGTGATCACAGATCCGTATTTCGCAGGCGACGAGATCGTGAAAAAGATCACTCAACATTTGTACGGTAGTGGAAAAACTATAATTATGGACAGCTGGTATTTTTCCACTGGCTTGATGGAAAGCCTTAAAAATTCTAAACTGTATACCATGGCGGCCCTGCATCCGAAAAGCGAAGGAATACCTCCACTGTTTATATCGCAGCACAGAAAAACTTGCACGTACACTTCTGGATTTGGCGACGAGTTCTCGCTGACTTCTTACATAAACGCGCAGTCGAAAGCGATCAACGTCATTACAAACCTGCCCCAGTTCAATAAGAAAGGTCACACGAACCGCACGACATCAGTATCAGCTTACAAAAAAGACCAATCGGCTGTGGAGGTCCTGGATGTGTTAATGCATTACTATACAACATTGCAAAATACAAACGATTGGACGTTATCGCTGTTCTTTACATTGTTGAATATTGCATCAGTAAATGCTCAAGTTGTATGGAGTACCCAGGCTTCCACGGGAACGGAGAGTGATAAAGACGAAGATGAAGATTATGAAGATTTAAAAATCCCGCAGCCTGTGAAGGTGCCCCACATGCCTGAGGTGTCCATCACCGTGATGCGCCCCACGGGAGAAACCCTACAGTCGCGACAAGGTATCCAACAAATTGCCTCTAAAGACTGTCTAATCTGCGGCCGCAGCTACCGGTACTCACACAACGCGAGACGACATGAACTCAACACACACAAATTCGACCGCTACACAAACAGAATAAACAAACCGAAATCGCAGACTCGTATGCAACCAAAACTCCGACCAAACCCTTTTAACCCGAAAGCACGTCTCATGCCTAATCCTATTAGCCACAAAATGCAATTAGTACCAAAAATGTCTCCGAAATTCATGCCGCAGCAGCATAGTCTTCAGTTCCATAGGAAAATAATAACTCCACCGAAACCAATACCTATAAAATCTGCAAAATCACAACAAAACAATTTACCCTATCCGTTGCGTATCAAAGCTCTCAAAGATTTGCAGATAAAGAAAAAAGAACCacagattttaaaaactttgcTCACCGCTAAGCCTGAGGTTTTGGTCTCGGAACCAGAAATAATGAATTCTGGCCCCGAGAGCCCGGAGACTTTGATTTCTGAACCTGAAATAGCGTCGTTCCAAGTTGAAACTATTCTCTCAGAGCCCAATGATTATGATGAAAATCAAGACGAAGATGAGGGTGATGCTGAAATGCACAACCATCAGAGTCAAAATTATGACACTGTCGATATGGATTCTGAAAATGAAATAGAAATTGCTCGACAGCAAGAAAGTGCGGAAGATAACGAAGAAAATGCGAATGAAGATGAAAATATCCAGCAAGAAGACgataataattttgatgacGCTGACAAAGAGGATGAAAATGATAGTGATAAAGCGAGCCCCCAAGATGTAACTCAAGCTGGAACTGAAGATGACAGTCAAAATATGGTTATCGATGAAAATAGTGAAACTAAAGAAGACGAACCAAACAATGAAGAAGAAGATGAAGAAGGCAACGATGAagctgataatgatgaattaGACGCCAGTCAGGCTGAACGAAACGAGGATGATGAGGAAATTCTCGGACTTACGCCTCAAATTGAGTTGAACGAAGAAATGCAAAACAACTCTACCATCAACAGTGAGATGAATGACGAAGAAGAACCGGACGAAACCGCTGAGTTCAACGATACAGTCGACGGCGAAGCTGACGAGCCAAACGCTCCGCAAGGCTTCGTCACCAGCACTCAGAGAGACTTTATCAAAAGATATCGTGATATCATCCTGCAGATCAACACCCAGAGATGCCTGTGTTGCGACAAAGAATATCCGCGCAGAAAATCCGTGATTCAACATCTGCAGAAAAATGGATATAAAGTCCCAAAGCACACTTGCTATAATTGCGTCGTTACGTTCACGCACATTGGAGCACTGTTAAGTCATATGAGGCATAACAATTGCACTGATCTCTGGAAGATTATTTATGATGATAACGGAATCACCAGCGAAATGATAATCGAAGAGCCTAAGAGCAAAATACAAACCAAAGATATTTTCAATGCGAAATCGTATGCGTGTAGATTGTGCCCCGCCAAATTTCAACTAAAACAATCTATCATGAAACATGTTTCTGAGTTCCATGAGGACGGTCAGTCGTCGGTTCCTATGGGCTGCGTCCACTGCGGAGCATCTTTCAAAGATAAAACTTTACTCAAGAAACACATTCGCAATGGCGAATGTACTGTGTACATCCATTGTGATTTATGTTCAGAACAATTTACCAATATGCAAGAATTTAACGATCATGCTTTGTCTGCTCATGCTGAGCACTTTGTGAAGTCTGAAAACCAGAGTGTCGATGGACGACTCACAGATTGCTATCTATGTGGAACCAAGACTAGCAGCTATTCGAACTTGCTCAAACATTTTAAAGCGGAACATGATCAGATATCGCATCCTTGCCAATTTTGTGGAGTTAAATTTGAACAACCAGTCGATCTAAACAAACACATGTATCTGGAGCATCCTGGGCAAACTCCTGATTTGAACGCCACCCATCCTGACATGTCTCTTGTCAAGGAAGAAGCTGAAGAATACCACTACTCTTGCACCGAGTGTAATGCAATATTCGAAACTGTAGACGAATGGACTGATCACCAAGTGGCTGAGCATAACCAAGTGGCGCATCATTGCGACCAATGCGAAAAGAAATTCCTGCGACCTTCAGAGCTTGCAGAGCACAAGAATACCCACTTGAGAGTTAAATTCTATCCTTGCAGTGTTTGTTCAAACTCTTACAGCACCCCACAAAAGTTGGCTGATCACGTCCAGAACTCGCATCCTGGTGCCGGAACCAGTGCCAGCCCTGATCATGAATTTTTCTGCGAAATGTGTATTCGACCATTTAAAAGTCGCCAGGCCTATTCGAATCATATGCGTATTCATGCTAAAGTACCAACCACTAACAGAAAACCACAAACACCACAGGCACTCAAAGAGTTCGACCCACGTATAATTGGGAAACCCATCAAGCAGATTACTTTGTCAAATGTAGTTCAACCTTCAACTGTCTTCAACTTTAGGCCAAACGCAAATGTGCCTAATGCTCCTTATTCTTGTGACATTTGCGGCAAAGGTTTCATgcacaagaaaaatatttgGAAACACAAAAAAGTTTTGCATGCCGATATTATTAATGATAGAAACGATAGCGAAGAGAATACCATGCACGCCTCCACCGAAGAAGACGATTACAACGTCGATGAGAACGGCTCTATACTTTCAACGCCGCAATTTAATAGTTTCGCTTTTCCGGTGGAACCTTCGCCGAGCGTTCACGAATGTGAATTATGTGGAAAACAATTCCCTCTGAAGTCTAGTTTGATTAAGCACAAACGTGCCAAGCACGGAATTGTTAATACGAACCACGCTATTAAAACTGAATCACAAGCTTCACCTAGTGAAGGTAGTGGTCGGTCCAGTTGCACtatttgtaaaatttcattTGCGGACAAAAAATCTTATTACCGCCACAGAAAGAACGTCCACAAATCAGCTACGCAAATGTGCAAGATATGTGGTAAGCCGCTTAACTCGACGCAGGAGCTTTATGAACATCTGAAAGCGGCCCACGCTAGCTTGTTGCTCGGTTACGACGCCAACCAGAGTACGAGTAAGTCTCAGGATATTTCACAAGACATGGATCCTGAGTATGACGAACAAGAAATTGCTAATACAAATATTGAATACCAAGCGAGGTACCCATGTGATACATGTGGTAAACAATTTTTAGGATTACTGTCTTTGCAAAATCATCAGTGTGTAAGTCACCCTCCATCGCAACCTCAGACTTTCGACTGTGAAATTTGCCACAAAAGTTACACGTCGATCGCTGCGTTGAAGAGCCATCGTGGTTGGCATCTCCGATCCCCCGATGGCAAAGCGGCTGCTAACAATAGCGGTCTTTGGATGCCGCAGCATAAAGTTACCACTAAGGTTAGCAAGCACGAAGTTTTAGAAGCAACCCCGCCTCCAACAGGACGGTCGCAATCGACAGCTTCCGTAGCGAAAAGGAGACTCCCTCCCGAAGTGGAAGTGACCGTTGTGAACCCCAACAAAAAGATGCGCTCTGACGATTCTGTTGAGATGGAACAGCACGGTGACGCTGTAGAAGGCAAGTATTGTACGATATGTGACAAAGAGTTTACGAAACGCGCCGCATATCAACGGCACATGGACGAAGTGCACCAGCCGAACTCCGTGTTTTGTCCAGTCTGCGATAAAAGCTTCACGCGTAAATCGACTCTGCTCGTTCACATGAAGAAGCATTACGAAGATGGCGGAGAAGGTAGCTCCACAGCTCAAGTCGATGAAGATGAAGGTTTTCCGTGCGAAATCTGCGGTGCGCAGTATGATACCGAGAACGCTTTACGGGCGCACAAGATAAGGCATCACGCTGATGAGGAATCGGGTGATTCAGAGGATGACGGGGAGGTGCCGATGCCGGCGCAGCCTGGCGAGTTTACTTGCGGCCAGTGCGGCGACGGCGTGGCCACGGCGCGCGATCTGATCACGCATCGCGCGATACACTCAACGCATACTAAATTCTTCTGTAATATCTGCAAAGTGTACTTCGCCAGGGCATTGGATCTGTCATCGCACACGCGAGCGCGGCATGCAGACAATGAGAAAGTATTCTTCCCGTGTGCCATGTGTGATCGCTTCTACATGAACAAGAAAAGTTTACAGCGACACATCGATATGGTTCATTGA
Protein Sequence: MTVNYDRVCRLCMSSRGELLPIFPTTSSDELEPPILASKIKDCVSVEINENDELPTNICRKCVDNVNNWHIFKTVCAKTQNKLLSLTRKDGSLLEEVQVKNEPFSDEAYDDGVVIDGLYPENEQAAASKLQPEGPPILASLGLTPRSDKNYVDPRMDWQRVHAILGMIQENDVIDSLQSFEESDELHHSDHESDSEAELQPNIDDIYTDCKMGYICRNKNILNQRPFDISYLKVNTVKVKKRRHDIHKHVGTPKSAWHLLFTEDLLDLIVSATNENILRHSKVFDGCTSVGEVKSLIGILYLNGIMRPTHQKCSDLWDKDVGVPAVINAMTNERFNFLLQNLCFHSQDDDNSIMQYDTMKRIRKLFEIFVMNCRSTFDVQSTAVVDEIIVPVFGPCPFRYDIDKKPLKRGIKIVLLVDPSNFYVSNLDVITDPYFAGDEIVKKITQHLYGSGKTIIMDSWYFSTGLMESLKNSKLYTMAALHPKSEGIPPLFISQHRKTCTYTSGFGDEFSLTSYINAQSKAINVITNLPQFNKKGHTNRTTSVSAYKKDQSAVEVLDVLMHYYTTLQNTNDWTLSLFFTLLNIASVNAQVVWSTQASTGTESDKDEDEDYEDLKIPQPVKVPHMPEVSITVMRPTGETLQSRQGIQQIASKDCLICGRSYRYSHNARRHELNTHKFDRYTNRINKPKSQTRMQPKLRPNPFNPKARLMPNPISHKMQLVPKMSPKFMPQQHSLQFHRKIITPPKPIPIKSAKSQQNNLPYPLRIKALKDLQIKKKEPQILKTLLTAKPEVLVSEPEIMNSGPESPETLISEPEIASFQVETILSEPNDYDENQDEDEGDAEMHNHQSQNYDTVDMDSENEIEIARQQESAEDNEENANEDENIQQEDDNNFDDADKEDENDSDKASPQDVTQAGTEDDSQNMVIDENSETKEDEPNNEEEDEEGNDEADNDELDASQAERNEDDEEILGLTPQIELNEEMQNNSTINSEMNDEEEPDETAEFNDTVDGEADEPNAPQGFVTSTQRDFIKRYRDIILQINTQRCLCCDKEYPRRKSVIQHLQKNGYKVPKHTCYNCVVTFTHIGALLSHMRHNNCTDLWKIIYDDNGITSEMIIEEPKSKIQTKDIFNAKSYACRLCPAKFQLKQSIMKHVSEFHEDGQSSVPMGCVHCGASFKDKTLLKKHIRNGECTVYIHCDLCSEQFTNMQEFNDHALSAHAEHFVKSENQSVDGRLTDCYLCGTKTSSYSNLLKHFKAEHDQISHPCQFCGVKFEQPVDLNKHMYLEHPGQTPDLNATHPDMSLVKEEAEEYHYSCTECNAIFETVDEWTDHQVAEHNQVAHHCDQCEKKFLRPSELAEHKNTHLRVKFYPCSVCSNSYSTPQKLADHVQNSHPGAGTSASPDHEFFCEMCIRPFKSRQAYSNHMRIHAKVPTTNRKPQTPQALKEFDPRIIGKPIKQITLSNVVQPSTVFNFRPNANVPNAPYSCDICGKGFMHKKNIWKHKKVLHADIINDRNDSEENTMHASTEEDDYNVDENGSILSTPQFNSFAFPVEPSPSVHECELCGKQFPLKSSLIKHKRAKHGIVNTNHAIKTESQASPSEGSGRSSCTICKISFADKKSYYRHRKNVHKSATQMCKICGKPLNSTQELYEHLKAAHASLLLGYDANQSTSKSQDISQDMDPEYDEQEIANTNIEYQARYPCDTCGKQFLGLLSLQNHQCVSHPPSQPQTFDCEICHKSYTSIAALKSHRGWHLRSPDGKAAANNSGLWMPQHKVTTKVSKHEVLEATPPPTGRSQSTASVAKRRLPPEVEVTVVNPNKKMRSDDSVEMEQHGDAVEGKYCTICDKEFTKRAAYQRHMDEVHQPNSVFCPVCDKSFTRKSTLLVHMKKHYEDGGEGSSTAQVDEDEGFPCEICGAQYDTENALRAHKIRHHADEESGDSEDDGEVPMPAQPGEFTCGQCGDGVATARDLITHRAIHSTHTKFFCNICKVYFARALDLSSHTRARHADNEKVFFPCAMCDRFYMNKKSLQRHIDMVH

Similar Transcription Factors

Sequence clustering based on sequence similarity using MMseqs2

100% Identity: iTF_00698511;
90% Identity: iTF_00705293;
80% Identity: -