Basic Information

Insect: Xestia xanthographa
Gene Symbol: Zfa_1
Assembly: GCA_905147715.1
Location: LR990647.1:22457794-22466688[+]

Transcription Factor Domain

TF Family: zf-C2H2
Domain: zf-C2H2 domain
PFAM: PF00096
TF Group: Zinc-Coordinating Group
Description: The C2H2 zinc finger is the classical zinc finger domain. The two conserved cysteines and histidines co-ordinate a zinc ion. The following pattern describes the zinc finger. #-X-C-X(1-5)-C-X3-#-X5-#-X2-H-X(3-6)-[H/C] Where X can be any amino acid, and numbers in brackets indicate the number of residues. The positions marked # are those that are important for the stable fold of the zinc finger. The final position can be either his or cys. The C2H2 zinc finger is composed of two short beta strands followed by an alpha helix. The amino terminal part of the helix binds the major groove in DNA binding zinc fingers. The accepted consensus binding sequence for Sp1 is usually defined by the asymmetric hexanucleotide core GGGCGG but this sequence does not include, among others, the GAG (=CTC) repeat that constitutes a high-affinity site for Sp1 binding to the wt1 promoter [1].
Hmmscan Out: # of c-Evalue i-Evalue score bias hmm coord from hmm coord to ali coord from ali coord to env coord from env coord to acc

1 23 0.011 2.3 10.8 1.6 3 23 699 720 698 720 0.96

2 23 0.25 49 6.6 0.3 1 22 1109 1130 1109 1130 0.95

3 23 8.9 1.8e+03 1.7 0.4 1 22 1172 1193 1172 1195 0.82

4 23 0.02 3.9 10.1 4.8 2 22 1205 1225 1204 1225 0.93

5 23 3.1 6.2e+02 3.2 0.1 3 23 1234 1255 1233 1255 0.89

6 23 0.021 4.2 10.0 0.2 3 23 1276 1297 1274 1297 0.96

7 23 0.0022 0.44 13.1 1.7 1 23 1303 1326 1303 1326 0.95

8 23 0.15 30 7.3 0.0 1 23 1352 1375 1352 1375 0.90

9 23 0.022 4.5 9.9 3.4 1 23 1380 1402 1380 1402 0.97

10 23 0.01 2 11.0 0.2 1 23 1408 1431 1408 1431 0.95

11 23 0.0048 0.95 12.0 0.8 1 23 1444 1466 1444 1466 0.97

12 23 0.00021 0.042 16.3 1.8 1 23 1516 1539 1516 1539 0.97

13 23 0.0022 0.43 13.1 1.4 1 23 1599 1622 1599 1622 0.96

14 23 0.0028 0.56 12.7 2.1 2 23 1649 1671 1648 1671 0.95

15 23 0.047 9.4 8.9 0.1 2 23 1677 1699 1676 1699 0.94

16 23 0.012 2.4 10.8 0.2 1 21 1743 1763 1743 1764 0.95

17 23 0.0005 0.1 15.1 1.0 1 23 1774 1796 1774 1796 0.93

18 23 0.00013 0.027 16.9 0.3 2 23 1889 1911 1889 1911 0.93

19 23 4.7e-07 9.4e-05 24.6 1.4 3 23 1918 1938 1917 1938 0.98

20 23 0.026 5.2 9.7 0.3 1 23 1956 1978 1956 1979 0.95

21 23 0.17 34 7.1 0.0 1 23 2002 2024 2002 2024 0.98

22 23 0.033 6.5 9.4 0.6 1 23 2030 2053 2030 2053 0.95

23 23 0.0003 0.06 15.8 0.4 1 23 2061 2084 2061 2084 0.96

#	of	c-Evalue	i-Evalue	score	bias	hmm coord from	hmm coord to	ali coord from	ali coord to	env coord from	env coord to	acc
1	23	0.011	2.3	10.8	1.6	3	23	699	720	698	720	0.96
2	23	0.25	49	6.6	0.3	1	22	1109	1130	1109	1130	0.95
3	23	8.9	1.8e+03	1.7	0.4	1	22	1172	1193	1172	1195	0.82
4	23	0.02	3.9	10.1	4.8	2	22	1205	1225	1204	1225	0.93
5	23	3.1	6.2e+02	3.2	0.1	3	23	1234	1255	1233	1255	0.89
6	23	0.021	4.2	10.0	0.2	3	23	1276	1297	1274	1297	0.96
7	23	0.0022	0.44	13.1	1.7	1	23	1303	1326	1303	1326	0.95
8	23	0.15	30	7.3	0.0	1	23	1352	1375	1352	1375	0.90
9	23	0.022	4.5	9.9	3.4	1	23	1380	1402	1380	1402	0.97
10	23	0.01	2	11.0	0.2	1	23	1408	1431	1408	1431	0.95
11	23	0.0048	0.95	12.0	0.8	1	23	1444	1466	1444	1466	0.97
12	23	0.00021	0.042	16.3	1.8	1	23	1516	1539	1516	1539	0.97
13	23	0.0022	0.43	13.1	1.4	1	23	1599	1622	1599	1622	0.96
14	23	0.0028	0.56	12.7	2.1	2	23	1649	1671	1648	1671	0.95
15	23	0.047	9.4	8.9	0.1	2	23	1677	1699	1676	1699	0.94
16	23	0.012	2.4	10.8	0.2	1	21	1743	1763	1743	1764	0.95
17	23	0.0005	0.1	15.1	1.0	1	23	1774	1796	1774	1796	0.93
18	23	0.00013	0.027	16.9	0.3	2	23	1889	1911	1889	1911	0.93
19	23	4.7e-07	9.4e-05	24.6	1.4	3	23	1918	1938	1917	1938	0.98
20	23	0.026	5.2	9.7	0.3	1	23	1956	1978	1956	1979	0.95
21	23	0.17	34	7.1	0.0	1	23	2002	2024	2002	2024	0.98
22	23	0.033	6.5	9.4	0.6	1	23	2030	2053	2030	2053	0.95
23	23	0.0003	0.06	15.8	0.4	1	23	2061	2084	2061	2084	0.96

Sequence Information

Coding Sequence: ATGAATGTGAACTATGATCGTGTTTGTAGACTGTGCTTGTCATCTCGAGGCGAATTACTGCCGATTTTTCCTACCACCAGTTCGGATGACTCGGAACCTCCCGTCCTCGCTTTGAAAATCAAGGATTGTGTGTCCGTACAGATAAACGAAAATGACGACCTGCCCACCAATGTCTGCAGGAAATGCATGGACAATGTCAATAACTggcatgtttttaaaaatgtatgtGAAAGGACACAAAACAAACTACTGTCTCTAAAAGATGGCAACCAACTAGAAGAGGTGAAAATAAAAAGTGAACCACTGTCTGATGAGGCTTATGATGATGGAGTGGTCATTGATGGGTCATATCCTGTCACTGAGAATGCCGGCTACTCAAACAAAGTGCAACCTGAAGGTCCCCCAATCTTGGCTTCATTGGGGCTCACACCAAGAAGTGATAAGAAATGTGTGGATCCGCGAACGGATTGGCACCGGGTCCATGCAATTTTGGACATGGTTCGAGACAATGAAGTGATTGACTCTCTGCAGACAAGGGAAGAGTGTGATGTCTTGCAGCATTCTGACCATGACTCGGATACTGAAGCAGAACTCCAAACAGAAATTGACGACAGTTATGTTAATAGCAAAAGCGGATATATAtgcaaaaataaacaagttATGTCAAAAGTTCCGAAACTATCAACTTCTGTAAATAATGCCAGAGTAAAAGAAGCTTTCAAACTCAGGAAACGTAAATCAGAAGTTCGTAAACATTGTCCACGACCTAAAAATGCGTGGCAGTTGTTATTCACTGATGACCTACTAGAGTTGATTGTTGCCTCTACTAATGACAATATTGTGACAAATGGGAAAAGTTTCACGGAGTCAACGAGCGTCAGCGAAATTAAAACGCTTATCGGTATTCTGTATCTGCACGGCATAATGCGGCCGACGCATCAGAATTGTAGTGACCTTTGGAACAGCGAATGTGGTGTTCCTTGCATCAGAAAAATCATGAAATACGAAAGGTTCAAATTCCTGCTTCAAAACATGAGCTTCGATAAAGAGGACGACAACAGCATTATACAGTTCGACATAATGAAGCGTATGCGTAAAGTATTCGAGATCTTCGCTATGAATTGCAGAACATGTCATGAGATCGAGAATGTCGCAGTTATTGATGAGATCATCGTTCCAGTTTACGGACCTTGCCCATTTCGATACGATATTGATAAGAAGCCGCTGAAGCGGGGCTTAAAGATGATATTGCTAGTTGATTCATCCACATTCTATATGAGCAACTTAGACGTCATCACTGACCCTTACTTCGGCCCCGAGGAGATAACGAAGAAGTTGGTTCAGCACTTGGCTGGAACTGGCAGATCTATTGTCATGGACAGTTGGTTCACTTCTTCCTCACTGATGGATATCCTTAAAAATGAGTACCAGTTGTATTCTATTGCAGCCTTAAACCCAAACAGTGATATGATTCCACCGCTATTCCTATCTCAGTACAGGAAATGTCGAACATTCATGTCTGGATTTATTGATCACGAAGTATCATGGACATCGTATGTCAATACTGAGGGGAAATCCATAAATGTATTGACTAATGAGCCTAGATATTACAGGAAAGGTCATATAAATCACACTACAGTTGTTTCTGTGTATAAGAAGAATCAGTCAGCAGTAGAAGTTGTGGATGTTGTCATGAATTACTACACTACAATGCAACACACAAATGATTGGACGTTGTCCTTATTCTTCACTTTGCTAAACATTGCGTCCGTTAACGCCCAAGTATTGTGGTGCTCCCAAAACTCTAATGTTACGCAGCGTCGCTTATTCATCAAAGATTTAGCTCTAAGCTTACTGGAACAGGATGAAGAAAGAATGTTAATTTCTCCGATACATGATTTAGAAGAGaggaaaaataaattttctCTTGGTGCGGAGAGTGAAAACAATGAAGAAGACGAGGAAGAAATGAACGAGCCTGCACAAAATTTCCCAAAAATGCCCCACATGCCCGAGGTGTCCATCACGGTCATGAGGCCTACCGGCGAGACCCTACACGCTCGTCAAGGTATTCACCAACTCGCTTCCAAACTGTGCCTCGTCTGCGGCCGCTCCTACAGGTACTCTCACAACGCACGCAGACATGAACTTACTTCTCACAGCTTCGACagatatacaaacaaaattactcCTAAAAAAACCCTCAATCATCTACAACCCAAACTGAGACCGAACCCATTCAATCCCAAAGCACGGATGATGCCGAATCCTATTAGTCATAAGATGCAGTTCATAAACAAGAACATGCCAACAAAAATAATGCCCATAAACAAAGTTATAACGCCACAGAAACCCATTCCAATAAAAATGTCGTCAAAGACACAAAATAATTTGCCTTATCCTCTACGCATTAAAGCactcaaagatttacaaattaaaaagaagGAGCCTCAGATTCTGAAGACTTTGTTAACCTCTAAACCTGAAGTTCTGGTCTCAGAACCAGAAATTCTAAATTCTGGGCCTGAGAGTCCAGAAACATTAATATCTGAGCCTGAAATTGCATCTTTTCAAGTTGAAGCTATTCTTACGGAACCCGATGCCGATGCATACGATGATCCGCAACAAGGCGACGAAGAAATCGATGAAGAAATGCagaacaatcaaaatcaaaactatgACACTGTTGATATGGACTCTGAGAACGAAATAGAGATTGCTCGTCAGCAAAGCATTGAACACGATGGCGAGGAAAATGCTGATGGGGAAGAGAATATGGACCATGATGACGACAATAACATGGAAGGCGGTCCGAGCGATAACGAAAAAGATGCCAATGACGATACAGCTGATAGTCAAGAGAacatggaagaagaagatagtGTTGATATTAAACCTGAAGAGCAAATGAAGGACGATGATGGCCAAGAGGACGGAGAACACGAAGAAGTGGAAATGAATCATAATGAAAACGAGGAAGACCATGATGAAGACGATGATGACCTGCCAATATCTCTAGCGCCTGTCGTGGAAATAAGTGAGGGATTGCAAGGTGACTCGTTCAACAGCGAAGTCATTGAGGAAGAGGAGGAGCTCGACGAAACTGTCGATCCCAATGACACCGTCGAAGAGCAGGAAGAGCAGGTTAAAGAACTTGACCCTGACAAAACATATGTTACGAAAACCCAAAGAGACTTTATCCAAAAATACCGCGATATCATTCAGCAAATCAACACGAAACGTTGTTTATGTTGTGACCGAGAACATCCGCGCAGAAAAGCTGTTATACAACACTTGCAGAAAAACGGACACAAGGTACCAAAACACACATGCTACAATTGTGTCATCACGTTCGGACATATTGGCGCACTACTCAGCCATATGAGGTCGAATTCTTGCACCAATCTGTGGAAGATTATTTACAATGAAAATGGTATTACTGACGACTTGGTTCTCGAAGACGAGCCGAAAGAGGTCAAGGTTGCTTACAAAGATATTTTCAATGCCAGGTCGTACGCTTGCAAACTATGCCCAGCTAAATTCCAACTGAAACAGTTTATAATGAAGCATGTTTTGGATACCCATGAGGATGGACAGTCAAGGGTACCACTCTGTTGTGTCCACTGCCGTTCTAGATTCAAAGATAAGAGTTTACTAAAGAAACATATTCGTAAAGGTGATTGTACAGTTTATGTTGCTTGCGATTTGTGCTCAGAAAAGTTCGGGAACATGCAGGACTTCAATGACCATGCGCTAGCCATCCACGCCGGCAGTTTCGATCAGTCGGATAATCAGAGCAAATGTGTCGATGGTCGACCAACAGACTGTCCTTTGTGTGGAAAGAAAAACAGCAGCTATCCGAATTTAGTGAAACATTTGAAGATTATACATGCTGAAGAAAAACCTCACTACTGCCAGCATTGCGACGCGAAATACGAACAAGCTGCTGATCTGAACAAACACATTTACATGGAGCATTCTGACAGAACACTAGGCATGCCGCCTGCTGAACCGGATATGTCCATAGTGAAGGAGGAAGCAGAGGAGTACCACTACTCTTGTACGGAATGTAATGCTATATTCGAAACTGTTGATGCGTGGACTGATCACCAAGTCGCTGAACATAACCAAGTGGCCCACCACTGTGACCAGTGTGAGAAGAAATTCCTTCGTCCTTCAGAGCTGGCAGAGCACAAGAATACTCACTTGAGGGTTAAGTTTTACCCTTGCAGTGTATGTCCCAACTCTTACAGCACTCCACAGAAACTATCTGAGCATGTGCAACAGTCGCATCCAGGAATTGGCGCGGTCGCGGCAGCCGAGTCGGAATTCTTCTGCGACATCTGTATCAGAGCATTCAAGAGTCGGCAAGCTTACTCAAATCATATGCGTATTCACGCTAAAGTACCTACTACTAACAGGAAACCGACTCCAGTCAAAGAGGGATTCGCGCCTCAAATTATTGGGAAACCCATCAAGCAATATCCTATGGTTCAACCGGGTTTTGTATCATTTAAACCTAATTACAACATCCCTAACGCCCCATATTCTTGTGACATTTGTGGTAAAGGATTcatgcataagaaaaatatatGGAAACACAAGAAAGTGTTGCATGCTGATATTTTAGTCGATAGACATGATAGTGAAGAGAACACCATGCAAGCTTCCACGGAAGAGGAGGAATTCAATCCTGATGAGAACGGTGCCATTCTCTCGACGCCACAATTTAATAGTTTTAACTTTACAAACTTCCCGAACAATGCTCAACAATCAACACCAGAAACAATGCCATATTCGTGTGACTTATGTAGCAAACGGTTCCCGCTGAGGACCAGTTTGTGGAAGCACAAGCGCGCTAAACACGGAATTGTAAACCCTGGCACTAGTGGTAACAACGACACATCCACGCCGTCCGCTAGCGGGGAAAGCAGTAGTCGATCTAGCTGCACTATATGCAGAATCACATTTTCAGATAAGAAATCTTACTATCGCCATCGAAAGAATGTCCACAAATCTACCGTTCAAATGTGCAAAATATGTGGCAAACCGCTAAGTTCAACTTTGGAATTATACGAGCACTTGAAAGCCGCTCATGCAAGGGAATTACTAGGGTATAACGCTAACCAAGGCTCCAGTAAATCACAAGATATGTCACAAGAGATGGAACCCGATTATGAAAATGATCAGGAGTCTATCGACCCGAGCGTTGATTACCAAGCGCGGTACCCATGCGATACTTGTGGCAAACAATTTGTTGGTTTGCTAGCTTTGCAAAACCACCAGTGCATCAATCAGATAGCATCACAGCCACAGACGTTTGACTGCGAGATTTGTCACAAGAGTTACACTTCAATATCTGCACTCAAAAGTCATCGTGGGTGGCATTTACGTTCGCCCGATGGAAAAGCAGCCGCCAACAATTCTGGCCTGTGGATGCCTCAGCACAAAGTTACTAGCAAGATAAGCAAACATGAGGTCGTGGACGCATCTCAACTGGCTAAAGTCACACACACCCCCACTCCCCCACCTGTCTCTGCAACCGTAGCGAAAAGAAGACTACCACCAGAGGTCGAAGTGACAGTCGTAAATCCGAACAAGAAACTGCGCTCAGACGACTCGGTCGACTTAGATATGCAAAGTTCTGGTGCCATCGAGGATAGGTACTGTACGATTTGCGATAAGGAATTCACAAAACGAGCGGCGTACCAGCGCCACATGGACGAGGTACATCAACCGAACTCTGTGTTTTGCCCGGTCTGTGATAAGAGTTTTACAAGGAAGTCCACATTGCTCATTCACATGAAGAAACATTACGAGAGCGGTGAGGGCAGTTCCTCTGCTACAGGTCAAGGAGACGATGATTACTCCTGTGATTTGTGCGGAGCTCAATATGACAATGATCAGGCATTGAGGGCGCACCGAGCGCGGCACCACGGAGAAGATGAAGAGTCTGCTGAAGAGAGTGACGACGGAAATGTTCCTATTGCTCCTCCCGGTGAATTCACATGTGCGCAATGCGGCGATGGCGTCGCTACTCCCAGGGACCTCATCGCCCATCGCTCAATGCACGCTACTCCCACCAAATTCTTCTGTAACATATGCAAAGTGTACTTCGCTCGGGCGCTCGACCTCTCGTCGCACACTCGGGCGCGACACGCTGACAACGAAAAGGTATTCTTCCCGTGTGCCATGTGCGACAGGTTTTACATGAATAAAAAGAGCTTACAGCGGCACATTGAGATGGCTCACTGA
Protein Sequence: MNVNYDRVCRLCLSSRGELLPIFPTTSSDDSEPPVLALKIKDCVSVQINENDDLPTNVCRKCMDNVNNWHVFKNVCERTQNKLLSLKDGNQLEEVKIKSEPLSDEAYDDGVVIDGSYPVTENAGYSNKVQPEGPPILASLGLTPRSDKKCVDPRTDWHRVHAILDMVRDNEVIDSLQTREECDVLQHSDHDSDTEAELQTEIDDSYVNSKSGYICKNKQVMSKVPKLSTSVNNARVKEAFKLRKRKSEVRKHCPRPKNAWQLLFTDDLLELIVASTNDNIVTNGKSFTESTSVSEIKTLIGILYLHGIMRPTHQNCSDLWNSECGVPCIRKIMKYERFKFLLQNMSFDKEDDNSIIQFDIMKRMRKVFEIFAMNCRTCHEIENVAVIDEIIVPVYGPCPFRYDIDKKPLKRGLKMILLVDSSTFYMSNLDVITDPYFGPEEITKKLVQHLAGTGRSIVMDSWFTSSSLMDILKNEYQLYSIAALNPNSDMIPPLFLSQYRKCRTFMSGFIDHEVSWTSYVNTEGKSINVLTNEPRYYRKGHINHTTVVSVYKKNQSAVEVVDVVMNYYTTMQHTNDWTLSLFFTLLNIASVNAQVLWCSQNSNVTQRRLFIKDLALSLLEQDEERMLISPIHDLEERKNKFSLGAESENNEEDEEEMNEPAQNFPKMPHMPEVSITVMRPTGETLHARQGIHQLASKLCLVCGRSYRYSHNARRHELTSHSFDRYTNKITPKKTLNHLQPKLRPNPFNPKARMMPNPISHKMQFINKNMPTKIMPINKVITPQKPIPIKMSSKTQNNLPYPLRIKALKDLQIKKKEPQILKTLLTSKPEVLVSEPEILNSGPESPETLISEPEIASFQVEAILTEPDADAYDDPQQGDEEIDEEMQNNQNQNYDTVDMDSENEIEIARQQSIEHDGEENADGEENMDHDDDNNMEGGPSDNEKDANDDTADSQENMEEEDSVDIKPEEQMKDDDGQEDGEHEEVEMNHNENEEDHDEDDDDLPISLAPVVEISEGLQGDSFNSEVIEEEEELDETVDPNDTVEEQEEQVKELDPDKTYVTKTQRDFIQKYRDIIQQINTKRCLCCDREHPRRKAVIQHLQKNGHKVPKHTCYNCVITFGHIGALLSHMRSNSCTNLWKIIYNENGITDDLVLEDEPKEVKVAYKDIFNARSYACKLCPAKFQLKQFIMKHVLDTHEDGQSRVPLCCVHCRSRFKDKSLLKKHIRKGDCTVYVACDLCSEKFGNMQDFNDHALAIHAGSFDQSDNQSKCVDGRPTDCPLCGKKNSSYPNLVKHLKIIHAEEKPHYCQHCDAKYEQAADLNKHIYMEHSDRTLGMPPAEPDMSIVKEEAEEYHYSCTECNAIFETVDAWTDHQVAEHNQVAHHCDQCEKKFLRPSELAEHKNTHLRVKFYPCSVCPNSYSTPQKLSEHVQQSHPGIGAVAAAESEFFCDICIRAFKSRQAYSNHMRIHAKVPTTNRKPTPVKEGFAPQIIGKPIKQYPMVQPGFVSFKPNYNIPNAPYSCDICGKGFMHKKNIWKHKKVLHADILVDRHDSEENTMQASTEEEEFNPDENGAILSTPQFNSFNFTNFPNNAQQSTPETMPYSCDLCSKRFPLRTSLWKHKRAKHGIVNPGTSGNNDTSTPSASGESSSRSSCTICRITFSDKKSYYRHRKNVHKSTVQMCKICGKPLSSTLELYEHLKAAHARELLGYNANQGSSKSQDMSQEMEPDYENDQESIDPSVDYQARYPCDTCGKQFVGLLALQNHQCINQIASQPQTFDCEICHKSYTSISALKSHRGWHLRSPDGKAAANNSGLWMPQHKVTSKISKHEVVDASQLAKVTHTPTPPPVSATVAKRRLPPEVEVTVVNPNKKLRSDDSVDLDMQSSGAIEDRYCTICDKEFTKRAAYQRHMDEVHQPNSVFCPVCDKSFTRKSTLLIHMKKHYESGEGSSSATGQGDDDYSCDLCGAQYDNDQALRAHRARHHGEDEESAEESDDGNVPIAPPGEFTCAQCGDGVATPRDLIAHRSMHATPTKFFCNICKVYFARALDLSSHTRARHADNEKVFFPCAMCDRFYMNKKSLQRHIEMAH*

Similar Transcription Factors

Sequence clustering based on sequence similarity using MMseqs2

100% Identity: iTF_00017541;
90% Identity: iTF_00447463;
80% Identity: -