Basic Information

Insect: Eremobia ochroleuca
Gene Symbol: Zfa_1
Assembly: GCA_949629135.1
Location: OX451396.1:7085828-7094877[-]

Transcription Factor Domain

TF Family: zf-C2H2
Domain: zf-C2H2 domain
PFAM: PF00096
TF Group: Zinc-Coordinating Group
Description: The C2H2 zinc finger is the classical zinc finger domain. The two conserved cysteines and histidines co-ordinate a zinc ion. The following pattern describes the zinc finger. #-X-C-X(1-5)-C-X3-#-X5-#-X2-H-X(3-6)-[H/C] Where X can be any amino acid, and numbers in brackets indicate the number of residues. The positions marked # are those that are important for the stable fold of the zinc finger. The final position can be either his or cys. The C2H2 zinc finger is composed of two short beta strands followed by an alpha helix. The amino terminal part of the helix binds the major groove in DNA binding zinc fingers. The accepted consensus binding sequence for Sp1 is usually defined by the asymmetric hexanucleotide core GGGCGG but this sequence does not include, among others, the GAG (=CTC) repeat that constitutes a high-affinity site for Sp1 binding to the wt1 promoter [1].
Hmmscan Out: # of c-Evalue i-Evalue score bias hmm coord from hmm coord to ali coord from ali coord to env coord from env coord to acc

1 23 0.011 1.1 10.9 1.6 3 23 646 667 645 667 0.96

2 23 0.24 24 6.7 0.3 1 22 1050 1071 1050 1071 0.95

3 23 8.8 8.6e+02 1.8 0.4 1 22 1113 1134 1113 1136 0.82

4 23 0.019 1.9 10.1 4.8 2 22 1146 1166 1145 1166 0.93

5 23 2.5 2.5e+02 3.5 0.0 3 23 1175 1196 1173 1196 0.89

6 23 0.021 2 10.0 0.2 3 23 1217 1238 1215 1238 0.96

7 23 0.0043 0.42 12.2 2.4 1 23 1244 1267 1244 1267 0.95

8 23 0.15 14 7.4 0.0 1 23 1293 1316 1293 1316 0.90

9 23 0.022 2.2 9.9 3.4 1 23 1321 1343 1321 1343 0.97

10 23 0.01 0.99 11.0 0.2 1 23 1349 1372 1349 1372 0.95

11 23 0.0047 0.46 12.1 0.8 1 23 1385 1407 1385 1407 0.97

12 23 0.00021 0.02 16.3 1.8 1 23 1458 1481 1458 1481 0.97

13 23 0.0031 0.31 12.6 0.9 1 23 1543 1566 1543 1566 0.95

14 23 0.0028 0.27 12.8 2.1 2 23 1593 1615 1592 1615 0.95

15 23 0.046 4.5 8.9 0.1 2 23 1621 1643 1620 1643 0.94

16 23 0.012 1.1 10.8 0.2 1 21 1687 1707 1687 1708 0.95

17 23 0.00049 0.048 15.1 1.0 1 23 1718 1740 1718 1740 0.93

18 23 0.00013 0.013 16.9 0.3 2 23 1833 1855 1833 1855 0.93

19 23 4.6e-07 4.5e-05 24.7 1.4 3 23 1862 1882 1861 1882 0.98

20 23 0.026 2.5 9.7 0.3 1 23 1900 1922 1900 1923 0.95

21 23 0.22 21 6.8 0.0 1 23 1946 1968 1946 1968 0.97

22 23 0.032 3.2 9.4 0.6 1 23 1974 1997 1974 1997 0.95

23 23 0.0003 0.029 15.8 0.4 1 23 2005 2028 2005 2028 0.96

#	of	c-Evalue	i-Evalue	score	bias	hmm coord from	hmm coord to	ali coord from	ali coord to	env coord from	env coord to	acc
1	23	0.011	1.1	10.9	1.6	3	23	646	667	645	667	0.96
2	23	0.24	24	6.7	0.3	1	22	1050	1071	1050	1071	0.95
3	23	8.8	8.6e+02	1.8	0.4	1	22	1113	1134	1113	1136	0.82
4	23	0.019	1.9	10.1	4.8	2	22	1146	1166	1145	1166	0.93
5	23	2.5	2.5e+02	3.5	0.0	3	23	1175	1196	1173	1196	0.89
6	23	0.021	2	10.0	0.2	3	23	1217	1238	1215	1238	0.96
7	23	0.0043	0.42	12.2	2.4	1	23	1244	1267	1244	1267	0.95
8	23	0.15	14	7.4	0.0	1	23	1293	1316	1293	1316	0.90
9	23	0.022	2.2	9.9	3.4	1	23	1321	1343	1321	1343	0.97
10	23	0.01	0.99	11.0	0.2	1	23	1349	1372	1349	1372	0.95
11	23	0.0047	0.46	12.1	0.8	1	23	1385	1407	1385	1407	0.97
12	23	0.00021	0.02	16.3	1.8	1	23	1458	1481	1458	1481	0.97
13	23	0.0031	0.31	12.6	0.9	1	23	1543	1566	1543	1566	0.95
14	23	0.0028	0.27	12.8	2.1	2	23	1593	1615	1592	1615	0.95
15	23	0.046	4.5	8.9	0.1	2	23	1621	1643	1620	1643	0.94
16	23	0.012	1.1	10.8	0.2	1	21	1687	1707	1687	1708	0.95
17	23	0.00049	0.048	15.1	1.0	1	23	1718	1740	1718	1740	0.93
18	23	0.00013	0.013	16.9	0.3	2	23	1833	1855	1833	1855	0.93
19	23	4.6e-07	4.5e-05	24.7	1.4	3	23	1862	1882	1861	1882	0.98
20	23	0.026	2.5	9.7	0.3	1	23	1900	1922	1900	1923	0.95
21	23	0.22	21	6.8	0.0	1	23	1946	1968	1946	1968	0.97
22	23	0.032	3.2	9.4	0.6	1	23	1974	1997	1974	1997	0.95
23	23	0.0003	0.029	15.8	0.4	1	23	2005	2028	2005	2028	0.96

Sequence Information

Coding Sequence: ATGAATGTGAATTATGATCGTGTTTGTAGACTGTGCTTGTCATCTCGAGGCGAATTACTGCCGATTTTTCCTACCACCAGTTCGGATGACTCGGAACCTCCCGTCCTCGCTTTGAAAATCAAGGATTGTGTGTCCGTACAGATAAACGAAAATGATGACCTGCCCACTAATGTCTGCAGGAAATGCATGGACAATGTCAATAACTGgcatgtttttaaaaatgtatgtgaAAGGACACAAAACAAACTACAGTCTCTAAAAGATGGCAGCCAACTAGAAGAGgtgaaaataaaaagtgaacCACTCTCTGATGGAGCTTATGATGATGGAGTGGTCATTGATAGCTCATATCCTGTCATTGAGAATGCTGGCTTCTCAAACAAAGTACAACCCGAAGGTCCCCCAATCTTGGCTTCGTTGGGGCTCACACCAAGAAGTGATAAGACATGTGTGGACCCGCGAATGGATTGGCATCGGGTCCATGCAATTTTGGACATGGTTCAAGACAATGAGGTGATTGACTCTCTGCAGACAAAGGAAGAGTGTGACGTTTTGCATAATTCTGATCATGAATCAGATACAGAAGCCGAACTCCAACCGGAAATTGATGATGATTACGTGGATTGCAAAAGCGGATAcatatgcaaaaataaaaaagttatatcAAAAGTTCCCAAACTATCAACTTCTGTAAATAATGCCAGGGTCAAAGAAGCTTTCAAACTTAGGAAACGCAAACCAGAAGTTCATAAACATTGTTCACGACCTAAAAATGCGTGGCAGTTGTTATTCACCGATGACCTACTAGAATTGATTGTTGCTTCTACTAATGACAATATTGTGACAAATGGGAAAGATTTCACGCAGTCAACCAGTGTCAGTGAAGTTAAAACGCTTATCGGTATTCTGTATCTGCACGGTATAATGCGGCCGACGCATCAGAAATGCAGTGACCTTTGGAACAGTGAATGTGGTGTGCCTTGCGTCAGAAACGTCATGAAATACGAAAGATTCAAATTCCTGCTTCAAAACATGAGCTTCGATAAAGAGGACGACGATAGCATTATACAGTTCGACATAATGAAGCGTATGCGTAAAGTATTCGAAATCTTCGCCATGAATTGCAGAACATCTCACGAGATCGAGAATATGGCGGTTATTGATGAGATCATCGTGCCAGTTTACGGACCTTGCCCATTTCGATACGATATTGATAAGAAACCGGTGAAGCGGGGCATAAAGATGGTATTGCTAGTTGATTCATCCACTTTCTATGTGAGCAATTTAGACGTCATTACTGATCCTTATTTTGGCGCCGAAGAGATAACGAAAAAATTGGTTCAGCATTTAGCTGGAACTGGTAGATCTATTGTTATGGATAGTTGGTTCACATCTTCCTCATTGATGGATAGCCTTAGAAATGAGTACCAGTTGTATTCTATCGCAGCCTTGAACCCAAATAGTGATATGATTCCGCCACTATTCCTATCTCAATACAGGAAATGTCGAACATTTATGTCTGGATTTATTGATCATGAAGTATCACTGACATCTTATGTCAATATGGAGGGGAAATCAGTAAATGTATTGACCAATGAGCCTAGATATTACAGGAAAGGTCATATAAATCACACAACAGTTGTATCAGTGTATAAGAAGAATCAGTCTGCTGTAGAAGTTGTGGATGTTCTCATGAACTACTACACTACAATGCAACACACAAATGATTGGACACTGTCCTTATTCTTTACATTGCTGAATATTGCCTCTGGTGCGGAGAGTGAAAACAATGAAGAAGACGAGGAAGAAATGAACGAGCCTGCACAAAATTTCCCGAAAATGCCCCACATGCCCGAGGTGTCCATCACGGTGATGAGGCCTACTGGTGAAACCCTACATGCTCGCCAAGGTATTCACCAACTCGCCTCCAAACTGTGCCTCGTCTGCGGGCGCTCCTACAGGTACTCCCACAACGCACGCagacatgaacttacctctcaCAGCTTCGACAgatatacaaacaaaattacTCCTAAAAAAACCCTCAATCATCTACAACCCAAACTCAGACCGAACCCATTCAATCCCAAAGCACGGATGATGCCGAATCCTATTAGTCATAAGATGCAGTTATTTAACAAGAACATGCCAACAAAAATAATGCCCATGAACAAAGTTATAACGCCACAGAAACCCATTCCAATAAAGACGTCAAAGACACAAAATAATTTGCCTTATCCTCTACGCATTAAAGCACTCAAAGATttacaaattaagaaaaaggaGCCTCAGATTCTGAAGACTCTGTTAACCTCTAAGCCTGAAGTTCTGGTTTCCGAACCAGAAATTCTTAATTCTGGGCCTGAAAGTCCAGAAACATTAATATCTGAGCCTGAAATTGCGTCTTTTCAAGTGGAAGCTATTCTTACGGAACCCGATGCCGATGCATACGATGATCTACAGCAAGGCGACGAAGAAGTTGATGAAGAAATGCAAAACAATCAAAATCAGAACTATGACACAGTTGATATGGACTCTGAGAATGAAATAGAGATTGCTCGTCAGCACGGCATTGAACACGAAGGTGAAGAAATAGTTGATGGAGAGGAGAATATCGAccatgatgatgataataacaTGGAAGGCGCTCAGAGCGATAACGAGAAAGACGGCAATGACGATACAGCTGAAAGTCAAGAGAATATGGAAGAAGATAGTGTTGATATTAAACCTGAAGACCAAATGAAGGACGACGAAGGCCAAGATGAGGGAGAACACGAAGAATTAGAAATGAATCATAACGAAAACGAAGAAGAAGACGATGATGATCTTCCAATATCATTAGCGCCCGTCGTCGAAATAAGTGAGGGATTGCAAGCTGACTCTTTTAACAGCGAAGTCAATGAAGATGACGAGGAACTCGATGAAACTGTCGATACCAATGAAACCATTGAAGATGAGGAGCAAGTCAAAGAACTTGACCCCGACAAAACATATGTTACGAAAACCCAAAGAGACTTCATCCAAAAATATCGCGACATCATTCAGCAAATCAATACGAAGCGTTGTTTATGTTGCGATCGAGAACATCCGCGCAGAAAAGCTGTTATACAACACTTGCAGAAAAACGGGCATAAGGTACCAAAACACACTTGTTACAATTGTGTCATCACGTTCGGACATATTGGCGCTCTTCTCAGTCATATGAGGTCGAATTCTTGCACTAATTTGTGGAagattatttacaatgaaaatgGGATTACTGACGACTTGGTTCTCGAAGATGAGCCGAAAGAGATCAAGGTTGCATACAAAGATATTTTCAATGCCAGGTCGTACGCTTGCAAGCTCTGCCCAGCTAAATTTCAACTGAAACAGTTTATTATGAAGCATGTTTTGGATACGCATGAGGATGGTCAGTCTAGGGTGCCGCTCTGTTGTGTCCATTGCCGTTCTAGGTTCAAAGATAAGAGCTTACTAAAGAAACACATTCGTAAAGGGGATTGTACAGTTTATATTGCCTGCGATTTGTGCTCAGAAAAGTTCGGGAACATGCAGGACTTCAATGACCATGCGCTAGCAATCCACGCTGGCAGTTTCGATCAGTCGGATAATCAGAGCAAATGTGTTGACGGTCGACCCACAGACTGTCCCTTGTGCGGAAAGAAAAACAGTAGCTATCCGAATTTAGTGAAACACTTGAAAATTATACATGCGGAAGAGAAACCGCATTACTGCCAGCATTGCGACGCTAAATACGAACAAGCTACTGAACTGAACAAACACATTTACATGGAGCATTCTGACAGAACATTAGGCATGGCGCCCGCTGAACCGGATATGTCTATAGTTAAGGAAGAAGCAGAGGAGTACCATTACTCCTGTACGGAATGTAATGCCATATTCGAAACTGTTGATGCGTGGACTGATCACCAAGTCGCCGAACATAACCAAGTGGCCCACCACTGTGACCAGTGTGAAAAGAAATTCCTTCGTCCTTCAGAGCTGGCAGAGCACAAGAACACTCACTTGAGGGTTAAATTCTATCCTTGCAGTGTATGTCCTAACTCATACAGCACTCCACAAAAACTGTCCGAGCATGTGCAGCAGTCACATCCAGGAATCGGAGCAGTCGCAGCAACTGAGTCGGAATTCTTCTGCGACATCTGTATCAGAGCATTCAAAAGTCGCCAAGCTTACTCAAATCATATGCGCATTCACGCTAAAGTACCTACTACTAACAGAAAACCAGCTCCACCTGGTAAAGAAGGATTCGCACCTCAAATTATCGGGAAACCTATCAAACAATATCCTGTGGTTCAACCTGGTTTTGTGTCATTTAAACCTAATTATAACATCCCTAACGCTCCTTATTCATGTGACATTTGTGGTAAAGGATTCATGCACAAGAAGAATATATGGAAACACAAGAAAGTGTTGCATGCCGATATTTTAGTCGATAGACATGACAGTGAAGAGAACACTATGCAAGCTTCcacagaagaagaagaattcaACCCCGATGAGAATGGTGCCGTTCTCTCAACGCCACAATTCAATAGTTTTATTAACTTTACGAACTTCCCGAACAATGCTCAACAAACGCCACCACAAGATACAATGCCTTATGCGTGTGATTTATGCAGCAAACGGTTCCCGCTTAGGACCAGTTTATGGAAACACAAGCGCGCTAAACACGGAATCTTAAACCCTAGCACTAGTAGTAGCAACGATACATCCACGCCGTCCGCTAGTGGGGATGGCAGTAGTAGATCTAGCTGCACTATATGTAGAATCACATTTTCAGATAAGAAATCTTATTATCGTCATCGAAAGAATGTCCACAAATCTACCGTTCAAATGTGCAAAATATGTGGCAAACCGCTAAGTTCAACTTTGGAACTATACGAGCACTTGAAAGCCGCTCATGCAAGGGAACTACTGGGTTATAATGCTAACCAAGGCTCCAGTAAATCACAAGATGTGTCACAAGAGGTGGAACCTGATTATGAAAATGATCAGGAGTCTGTTGACCCCAGCGTCGATTACCAAGCGCGCTACCCGTGCGATACTTGTGGCAAACAATTTGTGGGTTTGCTAGCGTTGCAAAACCACCAGTGCATTAATCAGATACAATCACAACCACAGACGTTTGACTGTGAAATTTGTCACAAGAGCTACACTTCAATATCTGCGCTAAAAAGCCATCGTGGGTGGCATTTACGTTCACCCGATGGGAAAGCAGCTGCCAACAATTCTGGCCTATGGATGCCTCAGCACAAGGTTACTAGTAAGATAAGCAAACATGAGGTCGTCGACCCATCACAACTCGCCAAGGTTACACATACCCCCACCCCCCCTCCTGTAACTGCTACCGCAGCGAAAAGAAGACTACCGCCAGAGGTCGAAGTGACAGTCGTAAATCCAAACAAGAAACTGCGCTCAGACGACTCTGTCGACATGGATATGCAAAGTACTGGTGCAATCGAGGATAGGTACTGTACGATTTGCGACAAGGAATTTACAAAACGCGCGGCGTATCAGCGCCACATGGACGAGGTACATCAACCGAACTCTGTATTTTGCCCGGTCTGTGATAAGAGTTTTACAAGGAAATCCACATTGCTCATACACATGAAGAAACACTACGAGAGCGGTGAGGGCAGTTCCTCTGCCACAGGTCAAGGGGACGATGATTACTCCTGTGATTTGTGTGGCGCTCAGTATGACAATGATCAGGCATTAAGGGCGCACCGAGCGCGGCACCATGGAGAAGATGAAGAGTCGGCAGAAGAGAGTGACGACGGAAATGTTCCTATTGCTCCTCCCGGTGAGTTCACCTGTGCGCAATGCGGCGATGGCGTGGCTACACCGAGAGACCTTATCGCTCATCGCACAATGCACGCTACTCCCACCAAATTCTTCTGTAACATATGCAAAGTGTACTTCGCTCGGGCGCTAGACCTCTCCTCGCACACTCGGGCGCGACACGCTGACAACGAAAAGGTATTCTTCCCGTGTGCCATGTGCGACAGGTTTTACATGAACAAGAAGAGTTTACAGCGGCACATCGAGATGGCGCACTGA
Protein Sequence: MNVNYDRVCRLCLSSRGELLPIFPTTSSDDSEPPVLALKIKDCVSVQINENDDLPTNVCRKCMDNVNNWHVFKNVCERTQNKLQSLKDGSQLEEVKIKSEPLSDGAYDDGVVIDSSYPVIENAGFSNKVQPEGPPILASLGLTPRSDKTCVDPRMDWHRVHAILDMVQDNEVIDSLQTKEECDVLHNSDHESDTEAELQPEIDDDYVDCKSGYICKNKKVISKVPKLSTSVNNARVKEAFKLRKRKPEVHKHCSRPKNAWQLLFTDDLLELIVASTNDNIVTNGKDFTQSTSVSEVKTLIGILYLHGIMRPTHQKCSDLWNSECGVPCVRNVMKYERFKFLLQNMSFDKEDDDSIIQFDIMKRMRKVFEIFAMNCRTSHEIENMAVIDEIIVPVYGPCPFRYDIDKKPVKRGIKMVLLVDSSTFYVSNLDVITDPYFGAEEITKKLVQHLAGTGRSIVMDSWFTSSSLMDSLRNEYQLYSIAALNPNSDMIPPLFLSQYRKCRTFMSGFIDHEVSLTSYVNMEGKSVNVLTNEPRYYRKGHINHTTVVSVYKKNQSAVEVVDVLMNYYTTMQHTNDWTLSLFFTLLNIASGAESENNEEDEEEMNEPAQNFPKMPHMPEVSITVMRPTGETLHARQGIHQLASKLCLVCGRSYRYSHNARRHELTSHSFDRYTNKITPKKTLNHLQPKLRPNPFNPKARMMPNPISHKMQLFNKNMPTKIMPMNKVITPQKPIPIKTSKTQNNLPYPLRIKALKDLQIKKKEPQILKTLLTSKPEVLVSEPEILNSGPESPETLISEPEIASFQVEAILTEPDADAYDDLQQGDEEVDEEMQNNQNQNYDTVDMDSENEIEIARQHGIEHEGEEIVDGEENIDHDDDNNMEGAQSDNEKDGNDDTAESQENMEEDSVDIKPEDQMKDDEGQDEGEHEELEMNHNENEEEDDDDLPISLAPVVEISEGLQADSFNSEVNEDDEELDETVDTNETIEDEEQVKELDPDKTYVTKTQRDFIQKYRDIIQQINTKRCLCCDREHPRRKAVIQHLQKNGHKVPKHTCYNCVITFGHIGALLSHMRSNSCTNLWKIIYNENGITDDLVLEDEPKEIKVAYKDIFNARSYACKLCPAKFQLKQFIMKHVLDTHEDGQSRVPLCCVHCRSRFKDKSLLKKHIRKGDCTVYIACDLCSEKFGNMQDFNDHALAIHAGSFDQSDNQSKCVDGRPTDCPLCGKKNSSYPNLVKHLKIIHAEEKPHYCQHCDAKYEQATELNKHIYMEHSDRTLGMAPAEPDMSIVKEEAEEYHYSCTECNAIFETVDAWTDHQVAEHNQVAHHCDQCEKKFLRPSELAEHKNTHLRVKFYPCSVCPNSYSTPQKLSEHVQQSHPGIGAVAATESEFFCDICIRAFKSRQAYSNHMRIHAKVPTTNRKPAPPGKEGFAPQIIGKPIKQYPVVQPGFVSFKPNYNIPNAPYSCDICGKGFMHKKNIWKHKKVLHADILVDRHDSEENTMQASTEEEEFNPDENGAVLSTPQFNSFINFTNFPNNAQQTPPQDTMPYACDLCSKRFPLRTSLWKHKRAKHGILNPSTSSSNDTSTPSASGDGSSRSSCTICRITFSDKKSYYRHRKNVHKSTVQMCKICGKPLSSTLELYEHLKAAHARELLGYNANQGSSKSQDVSQEVEPDYENDQESVDPSVDYQARYPCDTCGKQFVGLLALQNHQCINQIQSQPQTFDCEICHKSYTSISALKSHRGWHLRSPDGKAAANNSGLWMPQHKVTSKISKHEVVDPSQLAKVTHTPTPPPVTATAAKRRLPPEVEVTVVNPNKKLRSDDSVDMDMQSTGAIEDRYCTICDKEFTKRAAYQRHMDEVHQPNSVFCPVCDKSFTRKSTLLIHMKKHYESGEGSSSATGQGDDDYSCDLCGAQYDNDQALRAHRARHHGEDEESAEESDDGNVPIAPPGEFTCAQCGDGVATPRDLIAHRTMHATPTKFFCNICKVYFARALDLSSHTRARHADNEKVFFPCAMCDRFYMNKKSLQRHIEMAH

Similar Transcription Factors

Sequence clustering based on sequence similarity using MMseqs2

100% Identity: iTF_00017541;
90% Identity: iTF_00758469;
80% Identity: -