Basic Information

Insect: Zelleria hepariella
Gene Symbol: -
Assembly: GCA_949319315.1
Location: OX439384.1:11969924-11978453[-]

Transcription Factor Domain

TF Family: zf-C2H2
Domain: zf-C2H2 domain
PFAM: PF00096
TF Group: Zinc-Coordinating Group
Description: The C2H2 zinc finger is the classical zinc finger domain. The two conserved cysteines and histidines co-ordinate a zinc ion. The following pattern describes the zinc finger. #-X-C-X(1-5)-C-X3-#-X5-#-X2-H-X(3-6)-[H/C] Where X can be any amino acid, and numbers in brackets indicate the number of residues. The positions marked # are those that are important for the stable fold of the zinc finger. The final position can be either his or cys. The C2H2 zinc finger is composed of two short beta strands followed by an alpha helix. The amino terminal part of the helix binds the major groove in DNA binding zinc fingers. The accepted consensus binding sequence for Sp1 is usually defined by the asymmetric hexanucleotide core GGGCGG but this sequence does not include, among others, the GAG (=CTC) repeat that constitutes a high-affinity site for Sp1 binding to the wt1 promoter [1].
Hmmscan Out: # of c-Evalue i-Evalue score bias hmm coord from hmm coord to ali coord from ali coord to env coord from env coord to acc

1 24 0.043 2.4 9.2 1.5 3 23 706 727 705 727 0.95

2 24 5.9 3.2e+02 2.5 1.1 4 23 1111 1132 1109 1132 0.84

3 24 0.42 23 6.1 0.2 1 21 1137 1157 1137 1158 0.96

4 24 6.1 3.3e+02 2.4 0.3 1 23 1200 1223 1200 1223 0.84

5 24 0.39 22 6.2 0.8 3 21 1234 1252 1232 1253 0.93

6 24 1.2 67 4.6 0.1 2 23 1261 1283 1260 1283 0.89

7 24 0.0039 0.22 12.5 0.3 3 23 1303 1324 1301 1324 0.95

8 24 0.043 2.4 9.2 1.5 1 23 1330 1353 1330 1353 0.93

9 24 0.18 9.7 7.3 0.0 1 23 1381 1404 1381 1404 0.90

10 24 0.026 1.4 9.9 3.4 1 23 1409 1431 1409 1431 0.97

11 24 0.088 4.8 8.2 0.1 1 23 1437 1460 1437 1460 0.95

12 24 0.0033 0.18 12.7 1.3 1 23 1473 1495 1473 1495 0.97

13 24 0.00025 0.014 16.2 1.8 1 23 1544 1567 1544 1567 0.97

14 24 0.0068 0.37 11.7 1.9 1 23 1640 1663 1640 1663 0.96

15 24 0.0047 0.25 12.2 1.5 2 23 1698 1720 1697 1720 0.95

16 24 0.59 32 5.6 0.0 2 23 1726 1748 1725 1748 0.94

17 24 0.11 6.1 7.9 0.1 1 21 1794 1814 1794 1815 0.94

18 24 0.0017 0.095 13.6 0.6 1 23 1825 1847 1825 1847 0.93

19 24 0.00016 0.0086 16.9 0.3 2 23 1936 1958 1936 1958 0.93

20 24 6.9e-07 3.8e-05 24.3 1.3 3 23 1965 1985 1964 1985 0.98

21 24 0.18 10 7.2 0.3 3 23 2005 2025 2003 2026 0.94

22 24 0.17 9.3 7.3 0.0 1 23 2049 2071 2049 2071 0.97

23 24 0.026 1.4 9.9 0.2 1 23 2077 2100 2077 2100 0.94

24 24 0.00036 0.02 15.7 0.4 1 23 2112 2135 2112 2135 0.96

#	of	c-Evalue	i-Evalue	score	bias	hmm coord from	hmm coord to	ali coord from	ali coord to	env coord from	env coord to	acc
1	24	0.043	2.4	9.2	1.5	3	23	706	727	705	727	0.95
2	24	5.9	3.2e+02	2.5	1.1	4	23	1111	1132	1109	1132	0.84
3	24	0.42	23	6.1	0.2	1	21	1137	1157	1137	1158	0.96
4	24	6.1	3.3e+02	2.4	0.3	1	23	1200	1223	1200	1223	0.84
5	24	0.39	22	6.2	0.8	3	21	1234	1252	1232	1253	0.93
6	24	1.2	67	4.6	0.1	2	23	1261	1283	1260	1283	0.89
7	24	0.0039	0.22	12.5	0.3	3	23	1303	1324	1301	1324	0.95
8	24	0.043	2.4	9.2	1.5	1	23	1330	1353	1330	1353	0.93
9	24	0.18	9.7	7.3	0.0	1	23	1381	1404	1381	1404	0.90
10	24	0.026	1.4	9.9	3.4	1	23	1409	1431	1409	1431	0.97
11	24	0.088	4.8	8.2	0.1	1	23	1437	1460	1437	1460	0.95
12	24	0.0033	0.18	12.7	1.3	1	23	1473	1495	1473	1495	0.97
13	24	0.00025	0.014	16.2	1.8	1	23	1544	1567	1544	1567	0.97
14	24	0.0068	0.37	11.7	1.9	1	23	1640	1663	1640	1663	0.96
15	24	0.0047	0.25	12.2	1.5	2	23	1698	1720	1697	1720	0.95
16	24	0.59	32	5.6	0.0	2	23	1726	1748	1725	1748	0.94
17	24	0.11	6.1	7.9	0.1	1	21	1794	1814	1794	1815	0.94
18	24	0.0017	0.095	13.6	0.6	1	23	1825	1847	1825	1847	0.93
19	24	0.00016	0.0086	16.9	0.3	2	23	1936	1958	1936	1958	0.93
20	24	6.9e-07	3.8e-05	24.3	1.3	3	23	1965	1985	1964	1985	0.98
21	24	0.18	10	7.2	0.3	3	23	2005	2025	2003	2026	0.94
22	24	0.17	9.3	7.3	0.0	1	23	2049	2071	2049	2071	0.97
23	24	0.026	1.4	9.9	0.2	1	23	2077	2100	2077	2100	0.94
24	24	0.00036	0.02	15.7	0.4	1	23	2112	2135	2112	2135	0.96

Sequence Information

Coding Sequence: aTGAGTGGAAATTATGATCGTGTTTGTAGACTGTGCTTGTCATCCCGAGGCGAATTACTGCCGATTTTTCCTACCACCAGTTCTGACGGCACAGAACCCCCCGTCCTTGCATCAAAAATAAAGGATTGTGTCGCTGTTCAGATAAACGAGAATGACGAGCTGCCGACGTGTGTCTGCAGGAAATGCGTGGACAACGTCAACAACTGGCACATATTTAAGAATGTGTGTGAAAGGACCCAAAACAAACTACAATCTTTGGCAAAAAAAGATGGCAACCAACTAGAAGAGGTCAAAATCAAAAGTGAACCCCATACTGATGAACTTTATGATGATGGAGTGGTTATTGACGGCTCATATCCAGATCCAGAGCAGAATGCCACTTCTTCGAGTAAACTTCAGCCGGAGGGGCCTCCAATCTTGGCTTCACTGGGGCTCACACCGAGGAGTGATAAGAATTGTGTGGATCCACGAACGGATTGGCATCGGGTCCATGCTATATTGGACATGGTTCAAGACGATGAGGTCATTGATACACTCCAGACGATTGAGGAATGCGATGTCCTACAGCAATCTGATCATGGGTCTGACACAGAGATGGAACTACTGTCTGATATTGACGACGCATTTGTTGACTGCAAAACTGGCTACAAGGCCAAAGACAGAACTGTCCTGTCCAAAGATCCAAAAGCATCCCGCACAAATATTAATGCAAAAATAAAGGAAGCTACCGAATTACAGATGAAGAAATTCAAAGGTCTTGAACCCAAACACTTTGCACGACCCCACGATGCCTGGCACTATTTGTTCAGCGATGACATCTTAGAGCTTATACTTGAATCCACTAATGCTATTATAGTTAAAAGAGGACATATTTCTTCTAACACAACAATAGAGGAAGTGAGGGCTTTCTTCGGGATCTTATATCTGCATGGTATCATGAGGCCAGTGTATCAGAAAAGATGTGACCTTTGGAATGAAAAATATGGTATAGCAGGCATAAGAAATACCATGAAGTATGATAGATTTAAGTTCCTCCTCAGTAACTTAAGTTTTGATAATGAAACTGATGATGATATAGGTATGTCACAATTCGACACCATGAAGCGAATgcgaaaaatatttgaaatctTTGCAATGAACTGTAGAACACTCCATGACATTGAAAATGTTGCAGTAGTTGACGAGGTCATTGTGCCAGTTTACGGACCATGCCCATTCCGCTACAACATTGATAAGAAACAGTTGAAAAATGGCATCAAATTGGTAATGCTTGTGGATCCAAATAATTTCTACATTAGTAATATGGATGTTATTATTGATCCATACTTTGGCCCGGATGAAATTGTGAAAAAGTTGGTGCAACATCTGGCAGGCAGAGGCAAGACTATAGTTATGGACAGTTGGTATACATCCCTCAGTTTAATAGAGTCACTGAAAAAAGAATATCAGTTATACAGCATCGCTGCATTGAACTCGGACAGTGAGCTAGTTCCTCCAGTATTTCTTTCAAATCTGAGGAAGTCCGGAGAATTTAAGACTGGTTTTCTGGATAGTGACACGTTATTGTCATCTTACATAAACAGAGAGTCGAAGTCCGTTAATGTTTTGACCAACCATCCAAAGCACTACAAGAAAGGATATGTCAACCATGCAACTCCAGTGTCCGCTTACAAAAAGAATCAATCAGCAGTAGAAGTCGTAGATGTTCTGATGCATTATTACACTACGATGCAGTGTAGCAACGATTGGACAATGTCGATACTGTTCACGTTGTTGAATATCGCCTCAGTGAATGCCCAAGTGCTGTGGGGTACGCGTAATACATCCAATCTGATTCAACGGCGTGTGTTTATACGAGAGTTGGCCTTTGGTCTCATGGCGCACCATTACAAACGGGTCGACCATGCATCGCTGGAAGAAGCCGATTTTGTCGACCCCATTATCAAGTTTGGCGTCGAGAGCGAGAAGGAGGAGGAGGAATTCGAGGACGAGGCGAACGAACCCAGTCAGTTTGAGAAAGCGGCCAGCATGCCCGAGGTATCTATAACCGTGATGCGTCCTACCGGCGAGACCCTACAGCCGCGGCAGGGTTTCCAACAACTCGCGTCTAAGAACTGTCTCGTGTGCGACCGCGCTTACCGATACTCGCACAATGCCAGGCGTCACGAGCTCACCTCTCACAGCTTTGACCGCTACACGAACAAGGTGACAAACAAAAAACACCCACTTGCTCACATGCAACCTAAACTACGTCCCAACCCGTTCAATCCTAAAGCGCGACTTATGCCAAACCCGATAAGccacaaaatgcaaaaaatgcaAATGCACCCCAGAGCAATGCCCAGCAAGATGGTGCCACACAAAGTCATCCCTAAACCTGTGCCGATCAAGGCTATGTCCGTGAAAGGTGCACAAAACAACCTGCCATACCCCCTACGTATTAAAGCGCTGAAAGACttgcaaataaaaaagaagGAACCACAAATTCTCAAGACCCTGCTGACCTCGAAACCCGAAGTTTTAGTGAGTCAACCAGAAATAAATCACTCAGGCCCGGGCAGTCCAGAAACATTGATATCAGAACCGGAAATAGCATCGTTCCAAGTGGAAGCTATTCTGTCCGAGCCGGATGGTTTCGACGGACATGTGGCAGAAGAGGAAGGCGAGGGCGACGGCGAAGTGAACGTGAATAACCAAAATGCATACGATACCGTCGACATGGAATCTGACAATGAGATCGAGATTGCAAGGCAGGAGTCCCCTGCTGAAGAAATTACTGATAGACTTCATGTTGACGAGCAAGAAGGCGAAGAAAGGATGAGTGACAACGAGAATAATGCGGAAGATAGTCAAATGTACGATGACGACAACCAAGAAGAAAACCATCAAGAAGAGGAGCCAGATGGCAATGAGGACGCTGAGATGGACGAAACTTCTGAAGCGAAGGCGGACGAGGAAGATAAAGAAGTCGAAAATATGAACGAAGATGGAGGAGAAGAATACCACGAAGTAAATCCGGACGATAACGATGCAGACATGGATGATGAGGAAGAGATGCCGCCACTCGGTCTGGCTCCCGTCGTGGAGATCAATGAGGAACAGAACACCAACGACAGCGAACTCAACGAAGAGGATGTCGAAGACGACGAAGAGTTAGATGAGACGGCTGATACCACCGAAACCGATGGAATGCTGATGCCAGGCGCCGACGGCACCGACGCCGACGCAGCTGAGGAAATTGACCCAGACAAGCTATACGTTACCAAGACTCAGCAGGAATTCATACTCAAGCACCGTGACGTCATACAGCAAATTAACACCAAACGTTGTTTGTGCTGCGACAAAGAGTACCCGCGCAGAAAGGCCGTCATACAACATCTGCAGAAAAATGGACACAAGGTTCCCAAGCACACGTGCTACAATTGCGTCATCACTTTCGGCCACATCGGCGCGCTACTCAGCCACATGCGAGCAAATGTGTGCTCCAATTTATGGAAAATAATTTATAACGAAAACGGTATCACTGACGACATGGTGGTTGAGGATGAACCCAAAGATACTAAGGTCCAGTACAAGGACATTTTCAATGCCAGGTCGTATGCCTGCAAGCTGTGTCCGGCCAAATTCCAGCTGAAACAGTTCATTACGAAGCACGTCCTTGATGTTCACGAGAACGGCCAGTCTCTCGTGACCCTCGCCTGTGTCCACTGCAGGTCAAGATTCAAGGACAAAGTTCTATGGAAGAAGCACGTTCGTAATGGGGAATGCACTATTTATATTTCGTGCGATCTGTGCTCTGAGAAGTTCGGCAATGTGCAAGATTTCAACAACCATGCCTTGGCTGTGCACGCCGGAAGTTTCGACCCTGAGAACCAGTCGAAATGTGTCGACGGCCGTCCCACTGATTGCCCCATTTGCGAGAAGAAATTGGCCACCTACCAGAACTTGGTGAAACATTTGAAGCTATTCCACGACGAAGATAAACCTCATTACTGCCAAAACTGCGATTCTAAGTTTGAAAAGGCCGAGGAATTGAATAATCACATCTACCTGCAGCATTCGGATAAGGCGATGGGTATCAAGGCGGAGGTGGACGATGTCGATATGTCCATCGTTAAAGAAGAAGCCGAGGAGTACCACTATTCGTGCACAGAGTGTAACGCCATCTTCGAGACTGTCGACGCTTGGACCGACCACCAAGTCGCGGAGCACAATCAAGTGGCGCACCACTGCGATCAGTGCGAGAAAAAGTTCCTCCGCCCCTCGGAGCTCGCCGAACACAAGAATACCCACTTGCGAGTGAAGCTGTATCCTTGCAGCATCTGCTCGGACTCCTACAGCACTCCACAGAAGCTTTCAGACCACGTGCAGCAAGTGCACCCTGGCGCTTCCGTGTTCGCAGCCGCTGAAACGGAGTTCTTTTGCGATATATGCATCAGATCATTCAAGAGCCGCCAGGCGTACTCTAATCACATGCGCATTCATGCCAAAGTACCTACGACCAACCGGAGGCCGGGCGATCCCAAAGGATTTGCGCCACAAATAATTGGTAAGCCTGTCAAGCAATTTCCGATTGTGCAAGCAGCAAATGTACTGTACAAAACTAATTGCAATGTCCCTAACGCCCCATACTCGTGTGACATTTGTGGCAAAGGATTTATGCACAAAAAGAATATATGGAAACATAAGAAAGTATTGCACGCTGATCTTGTAAATGACAGGAATGACAGCGAAGAAAATACCATGCAAGCGTCGACAGAAGATGACGAATACAACGTCGATGAGAACGGTGCTATACTATCAACTCCGCAGTTTGACAGTTTTAACTTCTCAAACTACACAAACAACGTGCAAACTACATCGACACCGTCGGCGAAAGCGCCAGTGAAACCGCCGGAGGCGAAGCCAATATTGACCTTTTCGTGTGATCTTTGTTACAAGAAGTTCCCACTTAAGACCAGCTTATGGAAGCACAAACGAGCAAAGCATGGTATCATTAATGCAAGCACACTAAGTGGTAACGCGGACACACCCACTCATGTTATTCCAGTACAACCGCCTCAACCAAGTTCTGGGGACGGCAGTCGGTCGAGTTGCACTATTTGCAAGGTAACCTTTGCTGATAAAAAGTCCTACTATAGGCATAGAAAAAATGTCCACAAGTCCACCTCGCAGGTGTGTAAGATTTGCGGAATACCTCTCGCCTCAACTCTAGAGCTTTACGAGCATCTGAGAGCGGCGCACGCTCGCGAGCTGCTCGGCTTCAACGCGAGCCAAGGGACTGTTAAATCACAATCTCAAGAGATGGGGCAGGAGTTGGACGTCGAGTACGAGCAGGATCAAGAGACTGGTGACCCCGGTGCAGAATATCAAGCGCGTTACCCTTGCGAGGCTTGCGGGAAGCAGTTCGTTGGACTTCTTGCGCTACAGAACCATCAGTGTGTGAACCAGCTGTCGAATCAGCCGCAGACATTCGACTGTGAAATTTGCCACAAGAGCTACACTTCGATCGCAGCGTTGAAGAGCCATCGCGGTTGGCACTTGCGCTCGCCTGATGGCAAGGCGGCCGCTAACAACTCAGGGCTATGGATGCCGCAGCACAAAGTGACTAATAAGGTCAGCAAGCACGAAGTGGTGGACCCGGTGCAACTCGCCCGCGTTACACACAGCGCACCGGCCGCCGCAGTCGTCAAACGAAGACTGCCGCCAGAAGTAGAAGTGACTGTCGTTAACCCAAACAAAAAGCTGCGTTCCGACGATTCCGTCGAGATGGATCACAGCAACCCCGGAGGCTCTGAAGACCGCTATTGCACCATCTGCGACAAGGAGTTCACCAAGCGGGCTGCTTACCAGCGTCATATGGACGAGGTCCACCAACCCAACTCCGTGTTCTGTCCCGTTTGTGAGAAGAGCTTCACACGAAAATCGACTCTCCTTGTTCACATGAGGAAGCACTACGAAAGCGGCGAGGGTAGCTCGTCGGCCATTGCCCACGAAGGGGAGACTTACGGCTGCGATGTCTGCGGGGCTCAGTACCAAAGCGCCAACGCGCTAAGAGCACATAGGACGCAGCATCACGGTGAAGCCGAGTCTGAAGGCGAGTCGGAAGACGACGGCAGCGTAGATGCTGCCCAGCCCGGAGAGTTCACCTGTGGACAATGCGGGGATGGCGTCGCTACTCCTAGAGACCTTATCGCGCACCGAACCATGCACGCTACTCCAACTAAGTTCTTCTGCACAGTTTGCAAGGTATACTTCGCTCGCTCCGTCGACTTGGCAGCGCATAGTCGCGCGCGGCACTCGTCCGCCGCTGCCGATGTCGAGAAGGCGTTGTTCCCTTGCGCCATGTGTGACCGCTTCTACATGAACAAGAAGAGTCTCCAGAGACATATCGAGATGGCTCACTGA
Protein Sequence: MSGNYDRVCRLCLSSRGELLPIFPTTSSDGTEPPVLASKIKDCVAVQINENDELPTCVCRKCVDNVNNWHIFKNVCERTQNKLQSLAKKDGNQLEEVKIKSEPHTDELYDDGVVIDGSYPDPEQNATSSSKLQPEGPPILASLGLTPRSDKNCVDPRTDWHRVHAILDMVQDDEVIDTLQTIEECDVLQQSDHGSDTEMELLSDIDDAFVDCKTGYKAKDRTVLSKDPKASRTNINAKIKEATELQMKKFKGLEPKHFARPHDAWHYLFSDDILELILESTNAIIVKRGHISSNTTIEEVRAFFGILYLHGIMRPVYQKRCDLWNEKYGIAGIRNTMKYDRFKFLLSNLSFDNETDDDIGMSQFDTMKRMRKIFEIFAMNCRTLHDIENVAVVDEVIVPVYGPCPFRYNIDKKQLKNGIKLVMLVDPNNFYISNMDVIIDPYFGPDEIVKKLVQHLAGRGKTIVMDSWYTSLSLIESLKKEYQLYSIAALNSDSELVPPVFLSNLRKSGEFKTGFLDSDTLLSSYINRESKSVNVLTNHPKHYKKGYVNHATPVSAYKKNQSAVEVVDVLMHYYTTMQCSNDWTMSILFTLLNIASVNAQVLWGTRNTSNLIQRRVFIRELAFGLMAHHYKRVDHASLEEADFVDPIIKFGVESEKEEEEFEDEANEPSQFEKAASMPEVSITVMRPTGETLQPRQGFQQLASKNCLVCDRAYRYSHNARRHELTSHSFDRYTNKVTNKKHPLAHMQPKLRPNPFNPKARLMPNPISHKMQKMQMHPRAMPSKMVPHKVIPKPVPIKAMSVKGAQNNLPYPLRIKALKDLQIKKKEPQILKTLLTSKPEVLVSQPEINHSGPGSPETLISEPEIASFQVEAILSEPDGFDGHVAEEEGEGDGEVNVNNQNAYDTVDMESDNEIEIARQESPAEEITDRLHVDEQEGEERMSDNENNAEDSQMYDDDNQEENHQEEEPDGNEDAEMDETSEAKADEEDKEVENMNEDGGEEYHEVNPDDNDADMDDEEEMPPLGLAPVVEINEEQNTNDSELNEEDVEDDEELDETADTTETDGMLMPGADGTDADAAEEIDPDKLYVTKTQQEFILKHRDVIQQINTKRCLCCDKEYPRRKAVIQHLQKNGHKVPKHTCYNCVITFGHIGALLSHMRANVCSNLWKIIYNENGITDDMVVEDEPKDTKVQYKDIFNARSYACKLCPAKFQLKQFITKHVLDVHENGQSLVTLACVHCRSRFKDKVLWKKHVRNGECTIYISCDLCSEKFGNVQDFNNHALAVHAGSFDPENQSKCVDGRPTDCPICEKKLATYQNLVKHLKLFHDEDKPHYCQNCDSKFEKAEELNNHIYLQHSDKAMGIKAEVDDVDMSIVKEEAEEYHYSCTECNAIFETVDAWTDHQVAEHNQVAHHCDQCEKKFLRPSELAEHKNTHLRVKLYPCSICSDSYSTPQKLSDHVQQVHPGASVFAAAETEFFCDICIRSFKSRQAYSNHMRIHAKVPTTNRRPGDPKGFAPQIIGKPVKQFPIVQAANVLYKTNCNVPNAPYSCDICGKGFMHKKNIWKHKKVLHADLVNDRNDSEENTMQASTEDDEYNVDENGAILSTPQFDSFNFSNYTNNVQTTSTPSAKAPVKPPEAKPILTFSCDLCYKKFPLKTSLWKHKRAKHGIINASTLSGNADTPTHVIPVQPPQPSSGDGSRSSCTICKVTFADKKSYYRHRKNVHKSTSQVCKICGIPLASTLELYEHLRAAHARELLGFNASQGTVKSQSQEMGQELDVEYEQDQETGDPGAEYQARYPCEACGKQFVGLLALQNHQCVNQLSNQPQTFDCEICHKSYTSIAALKSHRGWHLRSPDGKAAANNSGLWMPQHKVTNKVSKHEVVDPVQLARVTHSAPAAAVVKRRLPPEVEVTVVNPNKKLRSDDSVEMDHSNPGGSEDRYCTICDKEFTKRAAYQRHMDEVHQPNSVFCPVCEKSFTRKSTLLVHMRKHYESGEGSSSAIAHEGETYGCDVCGAQYQSANALRAHRTQHHGEAESEGESEDDGSVDAAQPGEFTCGQCGDGVATPRDLIAHRTMHATPTKFFCTVCKVYFARSVDLAAHSRARHSSAAADVEKALFPCAMCDRFYMNKKSLQRHIEMAH

Similar Transcription Factors

Sequence clustering based on sequence similarity using MMseqs2

100% Identity: -
90% Identity: -
80% Identity: -