Basic Information

Insect: Polymixis flavicincta
Gene Symbol: Zfa_1
Assembly: GCA_949987655.1
Location: OX465179.1:18722417-18732389[+]

Transcription Factor Domain

TF Family: zf-C2H2
Domain: zf-C2H2 domain
PFAM: PF00096
TF Group: Zinc-Coordinating Group
Description: The C2H2 zinc finger is the classical zinc finger domain. The two conserved cysteines and histidines co-ordinate a zinc ion. The following pattern describes the zinc finger. #-X-C-X(1-5)-C-X3-#-X5-#-X2-H-X(3-6)-[H/C] Where X can be any amino acid, and numbers in brackets indicate the number of residues. The positions marked # are those that are important for the stable fold of the zinc finger. The final position can be either his or cys. The C2H2 zinc finger is composed of two short beta strands followed by an alpha helix. The amino terminal part of the helix binds the major groove in DNA binding zinc fingers. The accepted consensus binding sequence for Sp1 is usually defined by the asymmetric hexanucleotide core GGGCGG but this sequence does not include, among others, the GAG (=CTC) repeat that constitutes a high-affinity site for Sp1 binding to the wt1 promoter [1].
Hmmscan Out: # of c-Evalue i-Evalue score bias hmm coord from hmm coord to ali coord from ali coord to env coord from env coord to acc

1 22 0.012 1.5 10.8 1.6 3 23 743 764 742 764 0.96

2 22 0.26 33 6.6 0.3 1 22 1153 1174 1153 1174 0.95

3 22 0.12 15 7.7 4.8 2 22 1249 1269 1248 1269 0.93

4 22 2.7 3.4e+02 3.4 0.0 3 23 1278 1299 1276 1299 0.89

5 22 0.022 2.8 10.0 0.2 3 23 1320 1341 1318 1341 0.96

6 22 0.0046 0.58 12.1 2.4 1 23 1347 1370 1347 1370 0.95

7 22 0.16 20 7.3 0.0 1 23 1396 1419 1396 1419 0.90

8 22 0.024 3 9.9 3.4 1 23 1424 1446 1424 1446 0.97

9 22 0.011 1.4 10.9 0.2 1 23 1452 1475 1452 1475 0.95

10 22 0.0051 0.64 12.0 0.8 1 23 1488 1510 1488 1510 0.97

11 22 0.00022 0.028 16.2 1.8 1 23 1560 1583 1560 1583 0.97

12 22 0.0033 0.42 12.6 0.9 1 23 1643 1666 1643 1666 0.95

13 22 0.003 0.38 12.7 2.1 2 23 1693 1715 1692 1715 0.95

14 22 0.05 6.3 8.9 0.1 2 23 1721 1743 1720 1743 0.94

15 22 0.013 1.6 10.8 0.2 1 21 1787 1807 1787 1808 0.95

16 22 0.00053 0.067 15.1 1.0 1 23 1818 1840 1818 1840 0.93

17 22 0.00014 0.018 16.9 0.3 2 23 1933 1955 1933 1955 0.93

18 22 5e-07 6.3e-05 24.6 1.4 3 23 1962 1982 1961 1982 0.98

19 22 0.028 3.5 9.7 0.3 1 23 2000 2022 2000 2023 0.95

20 22 0.23 29 6.8 0.0 1 23 2046 2068 2046 2068 0.97

21 22 0.035 4.4 9.4 0.6 1 23 2074 2097 2074 2097 0.95

22 22 0.00032 0.04 15.8 0.4 1 23 2105 2128 2105 2128 0.96

#	of	c-Evalue	i-Evalue	score	bias	hmm coord from	hmm coord to	ali coord from	ali coord to	env coord from	env coord to	acc
1	22	0.012	1.5	10.8	1.6	3	23	743	764	742	764	0.96
2	22	0.26	33	6.6	0.3	1	22	1153	1174	1153	1174	0.95
3	22	0.12	15	7.7	4.8	2	22	1249	1269	1248	1269	0.93
4	22	2.7	3.4e+02	3.4	0.0	3	23	1278	1299	1276	1299	0.89
5	22	0.022	2.8	10.0	0.2	3	23	1320	1341	1318	1341	0.96
6	22	0.0046	0.58	12.1	2.4	1	23	1347	1370	1347	1370	0.95
7	22	0.16	20	7.3	0.0	1	23	1396	1419	1396	1419	0.90
8	22	0.024	3	9.9	3.4	1	23	1424	1446	1424	1446	0.97
9	22	0.011	1.4	10.9	0.2	1	23	1452	1475	1452	1475	0.95
10	22	0.0051	0.64	12.0	0.8	1	23	1488	1510	1488	1510	0.97
11	22	0.00022	0.028	16.2	1.8	1	23	1560	1583	1560	1583	0.97
12	22	0.0033	0.42	12.6	0.9	1	23	1643	1666	1643	1666	0.95
13	22	0.003	0.38	12.7	2.1	2	23	1693	1715	1692	1715	0.95
14	22	0.05	6.3	8.9	0.1	2	23	1721	1743	1720	1743	0.94
15	22	0.013	1.6	10.8	0.2	1	21	1787	1807	1787	1808	0.95
16	22	0.00053	0.067	15.1	1.0	1	23	1818	1840	1818	1840	0.93
17	22	0.00014	0.018	16.9	0.3	2	23	1933	1955	1933	1955	0.93
18	22	5e-07	6.3e-05	24.6	1.4	3	23	1962	1982	1961	1982	0.98
19	22	0.028	3.5	9.7	0.3	1	23	2000	2022	2000	2023	0.95
20	22	0.23	29	6.8	0.0	1	23	2046	2068	2046	2068	0.97
21	22	0.035	4.4	9.4	0.6	1	23	2074	2097	2074	2097	0.95
22	22	0.00032	0.04	15.8	0.4	1	23	2105	2128	2105	2128	0.96

Sequence Information

Coding Sequence: ATGAATGTGAACTATGATCGTGTTTGTAGACTGTGCTTGTCATCTCGAGGCGAATTACTGCCGATTTTTCCTACCACCAGTTCGGATGACTCGGAACCTCCCGTCCTCGCTTTGAAAATCAAGGATTGTGTGTCCGTACAGATAAACGAAAATGACGACCTGCCCACTAATGTCTGCAGGAAATGCATGGACAATGTCAATAACTGGCAggtttttaaaaatgtatgtgaaaGGACACAAAACAAACTACAGTCTCTAAAAGATGGCAGCCAACTAGAAGAGgtgaaaataaaaagtgaacCTCTTTCTGATGAGGCTTATGATGATGGAGTGGTCATTGATGGATCCTATCCTGTCATTGAGAATGCTGGCTTTTCAAACAAAGTGCAACCTGAAGGTCCCCCAATCTTGGCTTCATTGGGGCTCACACCAAGAAGTGATAAGAAATGTGTGGACCCACGAATGGATTGGCATCGGGTCCATGCAATTTTGGACATGGTTCAAGACAATGAGGTGATTGACTCTCTGCAGACAAAGGAAGAGTGTGATGTTTTGCAACATTCTGATCATGACTCAGATACAGAAGCCGAACTCCAACCAGAAATTAATGATGATTACGTTGATTGCAAAAGCGGTTACATATGCAAAGATAAAAAGGTTATATCAAAAGTTCCAAAACTATCAACTTCTGTAAATAATGCCAGAGTCAAAGAAGCTGTCAAACTTAGGAAACGGAAATCAGAAGTTCGTAAACATTGTTCACGACCAAAAAATGCGTGGCAGTTGTTATTCACCGATGACCTACTAGAATTAATTGTTGCTTCTACTAATGACAATATTGTGACAAATGGGAGAGGTTTGACGGAGTCAACTAGTGTCAGCGAAATTAAAACGCTTATCGGTATTCTGTATCTGCACGGTATAATGCGGCCGACGCATCAGAAATGTAGTGACCTTTGGAACAGTGAATGTGGTGTTCCTTGCGTCAGAAATGTCATGAAATACGAAAGGTTCAAATTCCTGCTTCAAAACATGAGCTTCGATAAAGAGGACGACGATAGCATAATACAGTTCGACATAATGAAACGTATGCGTAAAGTATTCGAAATCTTCGCCATGAATTGCAGAACATCTCACGAGATCGAGCATGTCGCGGTTATTGATGAGATCATTGTGCCAGTTTACGGACCTTGCCCATTTCGATACGATATTGATAAGAAGCCACTGAAGCGGGGCATAAAGATGATATTACTAGTTGATCCATCCACTTTCTATATGAGTAATTTAGATGTCATAACTGATCCTTATTTTGGCGCCGAAGAGATAACAAAAAAGTTGGTTCAGCATTTAGCTGGAACAGGCAGATCTATTGTTATGGATAGTTGGTTCACGTCTTCCTCATTGATGCATAGCCTTAGAAATGAGTATCAGTTGTATTCTATTGCAGCCTTGAACCCACACAGTGATATGATTCCACCACTATTCCTATCTCAATACAGGAAATGTCGAACATTCATGTCTGGATTTATTGATCATGAAGTATCACTAACATCTTATGTCAATACTGAGGGGAAATCAGTAAATGTATTGACCAATGAGCCTAGATATTACAGGAAAGGTCATATAAATCACACAACAGTTGTATCGGTGTATAAGAAGAATCAGTCTGCTGTAGAAGTTGTGGACGTTCTCATGAATTACTATACTACAATGCAACACACAAATGATTGGACATTATCTTTATTCTTTACATTGCTAAATATTGCCTCTGTAAATGCTCAAGTGTTGTGGTGCTCTCAAAACTCAAATGTTTCTCTCCGACGCTTATTTATTAAAGATTTAGCTTTAAGTTTACTAGAACCAGATGAAGAAAGAATGTTAATTTCTCCGATAAACGATTTAGAAGAGAGGAAAAACAAATTTACTCTAGAATGCAGTAATGTACAACCATATTATAAGAATAGGAGAAGATGCAAAATATGCGTGAAAACAACTAAACGTGATAGGAGAACGAGACAGTTCTGTGTGAAGTGTGGCACTTTTATTTGCAAAGAGCATGCTGGTGCGGAGAGTGAAAACAATGAAGAAGACGAGGAAGAAATGAACGAGCCCGCACAAAATTTCCCGAAAATGCCTCACATGCCCGAGGTATCCATCACAGTGATGAGGCCTACTGGTGAAACCTTGCACGCTCGCCAAGGTATTCATCAACTCGCTTCCAAACTGTGCCTCGTCTGTGGCCGCTCCTACAGGTACTCCCACAACGCACGCAGACATGAACTTACTTCTCACAGCTTCGACAGatatacaaacaaaattacTCCTAACAAAAAAACCCTCAATCATCTACAACCCAAACTCAGACCGAACCCATTCAACCCTAAAGCACGGATGATGCCGAATCCTATTAGTCATAAGATGCAGTTCTTTAACAAGAAcatgccaacaaaaataatgcctATGAACAAATCtgatagaaacaaaattataacgCCACAGAAACCCATTCCAATAAAGACGTCAAAGACACAAAATAATTTGCCTTATCCTCTACGTATTAAAGCACTCAAAGATttacaaattaagaaaaaagAGCCTCAGATTCTAAAGACTTTGCTAACTTCTAAACCTGAAGTTCTGGTTTCCGAACCAGAAATTTTGAATTCTGGGCCTGAAAGTCCAGAAACATTGATATCTGAGCCAGAAATTGCATCTTTTCAAGTCGAAGCTATTCTTACGGAACCCGATGCCGATGCATACGATGATCCACAGCAAGGCGACGAAGAAATTGATGAAGAAATGCAGAACAATCAAATTCAAAACTATGACACAGTCGATATGGATTCTGAGAATGAAATAGAGATTGCTCGTCAGCACGGCATTGAACAAGACGGTGATGAAAATGCTGATGGGGAAGAGAATATCGACCATGATGACGATATTAACATGGATGGCACTCAGAGCGATAACGAGAAAGACGGCAATGACGATACAGTTGAAAGTCAGGAGCATATGGAAGAAGATGATAGTGTTGATATTAAACCTGAAGACCAAATGAAGGACGACGAAGGCCAAGAGGAGAGAGAACCCGAAGAGTTAGAAATGAATCACAACGAAAACGAGGAAGAAGACGATGATGACCTTCCAATATCATTAGCGCCCGTCGTCGAAATAAGTGAGGGATTGCAAGTCGACTCGTTTAACAACGAAACCAATGAAGAAGACGAGGAACTCGATGAAACTGTCGATACCAATGAAACCATTGAAGATGAGGAGGTGAAAGAACTTGACCCTGACAAAACATATGTTACGAAAACCCAAAGAGACTTCATTCAGAAGTATCGCGACATAATTCAGCAAATCAACACGAAGCGTTGTTTATGTTGCGATCGAGAACATCCGCGCAGAAAAGCTGTCATACAACACTTGCAGAAAAATGGACATAAGGTACCAAAACACACTTGTTACAATTGTGTCATCACGTTCGGCCATATTGGCGCTCTACTCAGTCATATGAGGTCGAATTCTTGCACTAATTTGTGGAAGATAATTTACAATGAAAACGGCATTACTGAGGACTTAGTTCTCGAAGATGAGCCTAAAGAGGTCAAGGTTGCATACAAAGATATTTTCAATGCCAGGTCATATGCTTGCAAGCTCTGCCCGGCAAAATTCCAACTGAAACAGTTTATTATGAAGCATGTTTCGGATACTCATGAGGATGGACAGTCTAGGGTACCGCTCTGTTGTGTCCACTGCCGTTCTAGGTTCAAAGAAAAGAGCTTACTTAAGAAACACATTCGTAAAGGTGATTGTACAGTTTATATTGCTTGCGATTTGTGCTCAGAAAAGTTCGGGAACATGCAAGACTTCAATGACCATGCGCTAGCCATCCACGCCGGCAGTTTCGATCAGTCGGATACTCAGAACAAATGTGTTGACGGTCGACCAACGGACTGTCCTTTGTGCGGAAAGAAAAACAGCAGCTATCCGAATTTAGTGAAACATTTGAAAATTATACATGCGGAGGAGAAGCCTCACTACTGCCAACATTGCGACGCTAAATACGAACAAGCTACTGAATTGAACAAACACATTTATATGGAGCATTCTGACAGAACGTTAGGCATGGCGCCGGCTGAACCGGACATGTCCCTAGTTAAGGAAGAAGCAGAGGAGTACCATTACTCCTGTACGGAATGTAATGCCATATTCGAAACTGTTGATGCGTGGACTGATCACCAAGTTGCCGAACACAACCAAGTGGCCCACCACTGTGACCAGTGTGAAAAGAAATTCCTTCGTCCTTCAGAGCTGGCAGAGCACAAGAACACTCACTTGAGGGTTAAATTCTATCCTTGCAGTGTATGTCCAAACTCTTACAGCACTCCACAAAAACTGTCGGAGCATGTGCAGCAGTCACACCCAGGAATTGGCGCAGTCGCAGCAACTGAGTCGGAATTCTTCTGCGACATCTGTATCAGAGCATTCAAAAGTCGCCAAGCTTACTCAAATCATATGCGTATTCACGCTAAAGTTCCCACTACTAACAGGAAACCGACTCCAGGCAAAGAGGGATTCGCACCTCAAATTATCGGGAAACCTATCAAACAATATCCTATGGTTCAACCTGGTTTTGTGTCGTTTAAACCTAATTACAACATCCCCAACGCTCCTTATTCATGTGACATTTGTGGTAAAGGATTCATGCACAAGAAGAATATATGGAAACACAAGAAAGTGTTGCATGCCGATATTTTAGTAGATAGACATGACAGTGAAGAAAATACTATGCAAGCTTCAACAGAAGAGGACGAATTCAACCCTGATGAGAATGGTGCCATTCTCTCGACGCcacaatttaatagttttaacttTTCGAACTTCCCGAACAATGCCCAGCAAGCGACACCAGATACAATGCCTTATGCATGCGATTTATGCAGCAAACGGTTCCCGCTTAGGACCAGTTTATGGAAACACAAGCGCGCTAAACACGGAATCGTAAACCCTGGCGCCAATAGCAACAACGATACATCCACGCCGTCCGCTAGTGGGGAAGGCAGTAGTAGGTCTAGCTGCACGATATGTAGAATCACATTTTCAGATAAGAAATCTTATTATCGTCATCGAAAGAATGTCCACAAATCCACCGTTCAAATGTGCAAAATATGTGGCAAACCCCTAAGTTCAACTTTGGAACTATACGAGCACTTGAAAGCCGCTCATGCAAGGGAATTACTGGGTTATAACGCTAACCAAGGCTCCAGTAAAACACAAGATATGTCACAAGAGATGGAACCCGATTATGAAAATGATCAGGAGTCTGTCGATCCCAGCGTCGATTATCAAGCGCGCTACCCGTGCGATACTTGTGGCAAACAATTTGTGGGTTTGCTAGCGTTGCAAAACCACCAGTGTATCAATCAGATATCATCTCAACCACAGACGTTTGACTGCGAGATTTGTCACAAGAGCTACACTTCAATATCAGCGCTAAAAAGCCATCGTGGGTGGCATTTACGTTCACCCGATGGTAAAGCAGCTGCCAACAATTCTGGCCTATGGATGCCTCAGCATAAAGTTACTAGCAAGATAAGCAAACATGAGGTCATCGACCCGTCACAACTTGCTAAGGTCACTCATGCCCCCACTCCCCCTCCTGTTACTGCTACCGTAGCGAAAAGAAGACTACCACCAGAGGTCGAAGTGACAGTCGTAAATCCGAACAAGAAACTGCGCTCAGATGACTCTGTCGACTTGGATGTGCAAAGTACTGGTGCAATCGAGGATCGGTACTGTACGATCTGCGACAAGGAATTTACAAAACGCGCGGCCTATCAGCGCCACATGGACGAGGTACACCAACCCAACTCTGTATTTTGCCCGGTCTGTGATAAGAGTTTTACAAGGAAATCCACGTTGCTCATTCACATGAAGAAACACTACGAGACCGGTGAGGGCAGTTCCTCTGCTACAGGTCAAGGTGACGATGATTACTCCTGTGACTTGTGTGGCGCTCAGTATGACAATGATCAGGCGTTGAGGGCGCACCGAGCGCGGCATCATGGGGAAGAAGAAGAGTCGGCAGAAGAGAGTGACGACGGAAATGTTCCTATTGCTCCTCCCGGTGAATTCACATGTGCGCAATGTGGCGATGGCGTGGCTACACCAAGAGACCTCATCGCCCATCGCACAATGCACGCTACTCCCACCAaatttttctgtaacatatgCAAAGTGTACTTCGCTCGGGCGCTCGACCTCTCCTCGCACACTCGGGCGCGACACGCTGACAACGAAAAGGTATTCTTCCCTTGTGCCATGTGCGACAGGTTTTACATGAACAAGAAGAGTTTACAGCGGCACATCGAGATGGCTCACTGA
Protein Sequence: MNVNYDRVCRLCLSSRGELLPIFPTTSSDDSEPPVLALKIKDCVSVQINENDDLPTNVCRKCMDNVNNWQVFKNVCERTQNKLQSLKDGSQLEEVKIKSEPLSDEAYDDGVVIDGSYPVIENAGFSNKVQPEGPPILASLGLTPRSDKKCVDPRMDWHRVHAILDMVQDNEVIDSLQTKEECDVLQHSDHDSDTEAELQPEINDDYVDCKSGYICKDKKVISKVPKLSTSVNNARVKEAVKLRKRKSEVRKHCSRPKNAWQLLFTDDLLELIVASTNDNIVTNGRGLTESTSVSEIKTLIGILYLHGIMRPTHQKCSDLWNSECGVPCVRNVMKYERFKFLLQNMSFDKEDDDSIIQFDIMKRMRKVFEIFAMNCRTSHEIEHVAVIDEIIVPVYGPCPFRYDIDKKPLKRGIKMILLVDPSTFYMSNLDVITDPYFGAEEITKKLVQHLAGTGRSIVMDSWFTSSSLMHSLRNEYQLYSIAALNPHSDMIPPLFLSQYRKCRTFMSGFIDHEVSLTSYVNTEGKSVNVLTNEPRYYRKGHINHTTVVSVYKKNQSAVEVVDVLMNYYTTMQHTNDWTLSLFFTLLNIASVNAQVLWCSQNSNVSLRRLFIKDLALSLLEPDEERMLISPINDLEERKNKFTLECSNVQPYYKNRRRCKICVKTTKRDRRTRQFCVKCGTFICKEHAGAESENNEEDEEEMNEPAQNFPKMPHMPEVSITVMRPTGETLHARQGIHQLASKLCLVCGRSYRYSHNARRHELTSHSFDRYTNKITPNKKTLNHLQPKLRPNPFNPKARMMPNPISHKMQFFNKNMPTKIMPMNKSDRNKIITPQKPIPIKTSKTQNNLPYPLRIKALKDLQIKKKEPQILKTLLTSKPEVLVSEPEILNSGPESPETLISEPEIASFQVEAILTEPDADAYDDPQQGDEEIDEEMQNNQIQNYDTVDMDSENEIEIARQHGIEQDGDENADGEENIDHDDDINMDGTQSDNEKDGNDDTVESQEHMEEDDSVDIKPEDQMKDDEGQEEREPEELEMNHNENEEEDDDDLPISLAPVVEISEGLQVDSFNNETNEEDEELDETVDTNETIEDEEVKELDPDKTYVTKTQRDFIQKYRDIIQQINTKRCLCCDREHPRRKAVIQHLQKNGHKVPKHTCYNCVITFGHIGALLSHMRSNSCTNLWKIIYNENGITEDLVLEDEPKEVKVAYKDIFNARSYACKLCPAKFQLKQFIMKHVSDTHEDGQSRVPLCCVHCRSRFKEKSLLKKHIRKGDCTVYIACDLCSEKFGNMQDFNDHALAIHAGSFDQSDTQNKCVDGRPTDCPLCGKKNSSYPNLVKHLKIIHAEEKPHYCQHCDAKYEQATELNKHIYMEHSDRTLGMAPAEPDMSLVKEEAEEYHYSCTECNAIFETVDAWTDHQVAEHNQVAHHCDQCEKKFLRPSELAEHKNTHLRVKFYPCSVCPNSYSTPQKLSEHVQQSHPGIGAVAATESEFFCDICIRAFKSRQAYSNHMRIHAKVPTTNRKPTPGKEGFAPQIIGKPIKQYPMVQPGFVSFKPNYNIPNAPYSCDICGKGFMHKKNIWKHKKVLHADILVDRHDSEENTMQASTEEDEFNPDENGAILSTPQFNSFNFSNFPNNAQQATPDTMPYACDLCSKRFPLRTSLWKHKRAKHGIVNPGANSNNDTSTPSASGEGSSRSSCTICRITFSDKKSYYRHRKNVHKSTVQMCKICGKPLSSTLELYEHLKAAHARELLGYNANQGSSKTQDMSQEMEPDYENDQESVDPSVDYQARYPCDTCGKQFVGLLALQNHQCINQISSQPQTFDCEICHKSYTSISALKSHRGWHLRSPDGKAAANNSGLWMPQHKVTSKISKHEVIDPSQLAKVTHAPTPPPVTATVAKRRLPPEVEVTVVNPNKKLRSDDSVDLDVQSTGAIEDRYCTICDKEFTKRAAYQRHMDEVHQPNSVFCPVCDKSFTRKSTLLIHMKKHYETGEGSSSATGQGDDDYSCDLCGAQYDNDQALRAHRARHHGEEEESAEESDDGNVPIAPPGEFTCAQCGDGVATPRDLIAHRTMHATPTKFFCNICKVYFARALDLSSHTRARHADNEKVFFPCAMCDRFYMNKKSLQRHIEMAH

Similar Transcription Factors

Sequence clustering based on sequence similarity using MMseqs2

100% Identity: iTF_00017541;
90% Identity: iTF_00447463;
80% Identity: -