Basic Information

Insect: Anania crocealis
Gene Symbol: -
Assembly: GCA_949315895.1
Location: OX438883.1:7267171-7276247[-]

Transcription Factor Domain

TF Family: zf-C2H2
Domain: zf-C2H2 domain
PFAM: PF00096
TF Group: Zinc-Coordinating Group
Description: The C2H2 zinc finger is the classical zinc finger domain. The two conserved cysteines and histidines co-ordinate a zinc ion. The following pattern describes the zinc finger. #-X-C-X(1-5)-C-X3-#-X5-#-X2-H-X(3-6)-[H/C] Where X can be any amino acid, and numbers in brackets indicate the number of residues. The positions marked # are those that are important for the stable fold of the zinc finger. The final position can be either his or cys. The C2H2 zinc finger is composed of two short beta strands followed by an alpha helix. The amino terminal part of the helix binds the major groove in DNA binding zinc fingers. The accepted consensus binding sequence for Sp1 is usually defined by the asymmetric hexanucleotide core GGGCGG but this sequence does not include, among others, the GAG (=CTC) repeat that constitutes a high-affinity site for Sp1 binding to the wt1 promoter [1].
Hmmscan Out: # of c-Evalue i-Evalue score bias hmm coord from hmm coord to ali coord from ali coord to env coord from env coord to acc

1 23 0.065 7.2 8.5 1.4 3 23 744 765 743 765 0.96

2 23 0.44 49 5.9 0.3 1 22 1151 1172 1151 1172 0.95

3 23 8.7 9.7e+02 1.9 0.3 1 22 1213 1234 1213 1236 0.82

4 23 0.043 4.8 9.1 2.3 2 21 1246 1265 1245 1266 0.94

5 23 0.58 64 5.6 0.1 2 23 1274 1296 1273 1296 0.91

6 23 0.0078 0.86 11.4 0.1 3 23 1317 1338 1315 1338 0.96

7 23 0.017 1.9 10.4 2.8 1 23 1344 1367 1344 1367 0.95

8 23 0.16 18 7.3 0.0 1 23 1393 1416 1393 1416 0.90

9 23 0.0071 0.79 11.6 3.5 1 23 1421 1443 1421 1443 0.97

10 23 0.021 2.4 10.1 0.2 1 23 1449 1472 1449 1472 0.95

11 23 0.0013 0.15 13.8 1.3 1 23 1485 1507 1485 1507 0.98

12 23 0.0019 0.21 13.4 4.0 1 23 1556 1579 1556 1579 0.96

13 23 0.0088 0.98 11.3 1.8 1 23 1641 1664 1641 1664 0.96

14 23 0.0014 0.16 13.8 2.1 2 23 1682 1704 1681 1704 0.95

15 23 0.11 13 7.8 0.1 2 23 1710 1732 1709 1732 0.93

16 23 0.013 1.4 10.8 0.2 1 21 1777 1797 1777 1798 0.95

17 23 0.0016 0.18 13.6 0.6 1 23 1808 1830 1808 1830 0.93

18 23 0.00046 0.05 15.3 0.2 2 23 1917 1939 1917 1939 0.93

19 23 4.3e-07 4.8e-05 24.8 1.4 3 23 1946 1966 1945 1966 0.98

20 23 0.023 2.5 10.0 1.3 1 23 1987 2009 1987 2010 0.94

21 23 0.16 17 7.3 0.0 1 23 2032 2054 2032 2054 0.97

22 23 0.036 4 9.4 0.6 1 23 2060 2083 2060 2083 0.95

23 23 0.00033 0.037 15.8 0.4 1 23 2091 2114 2091 2114 0.96

#	of	c-Evalue	i-Evalue	score	bias	hmm coord from	hmm coord to	ali coord from	ali coord to	env coord from	env coord to	acc
1	23	0.065	7.2	8.5	1.4	3	23	744	765	743	765	0.96
2	23	0.44	49	5.9	0.3	1	22	1151	1172	1151	1172	0.95
3	23	8.7	9.7e+02	1.9	0.3	1	22	1213	1234	1213	1236	0.82
4	23	0.043	4.8	9.1	2.3	2	21	1246	1265	1245	1266	0.94
5	23	0.58	64	5.6	0.1	2	23	1274	1296	1273	1296	0.91
6	23	0.0078	0.86	11.4	0.1	3	23	1317	1338	1315	1338	0.96
7	23	0.017	1.9	10.4	2.8	1	23	1344	1367	1344	1367	0.95
8	23	0.16	18	7.3	0.0	1	23	1393	1416	1393	1416	0.90
9	23	0.0071	0.79	11.6	3.5	1	23	1421	1443	1421	1443	0.97
10	23	0.021	2.4	10.1	0.2	1	23	1449	1472	1449	1472	0.95
11	23	0.0013	0.15	13.8	1.3	1	23	1485	1507	1485	1507	0.98
12	23	0.0019	0.21	13.4	4.0	1	23	1556	1579	1556	1579	0.96
13	23	0.0088	0.98	11.3	1.8	1	23	1641	1664	1641	1664	0.96
14	23	0.0014	0.16	13.8	2.1	2	23	1682	1704	1681	1704	0.95
15	23	0.11	13	7.8	0.1	2	23	1710	1732	1709	1732	0.93
16	23	0.013	1.4	10.8	0.2	1	21	1777	1797	1777	1798	0.95
17	23	0.0016	0.18	13.6	0.6	1	23	1808	1830	1808	1830	0.93
18	23	0.00046	0.05	15.3	0.2	2	23	1917	1939	1917	1939	0.93
19	23	4.3e-07	4.8e-05	24.8	1.4	3	23	1946	1966	1945	1966	0.98
20	23	0.023	2.5	10.0	1.3	1	23	1987	2009	1987	2010	0.94
21	23	0.16	17	7.3	0.0	1	23	2032	2054	2032	2054	0.97
22	23	0.036	4	9.4	0.6	1	23	2060	2083	2060	2083	0.95
23	23	0.00033	0.037	15.8	0.4	1	23	2091	2114	2091	2114	0.96

Sequence Information

Coding Sequence: atgAGTGTGAATTATGATCGTGTTTGTAGACTGTGCTTGTCATCTCGAGGCGAATTACTGCCGATTTTTCCTACCACCAGTTCGGGTGACACGGATCCTCCCGTCCTTGCTTCGAAAATCAAGGACTGTGTCTCTGTGCAGATAAGCGAGAATGACGACCTGCCAACGAATGTCTGCAGGAAATGTGTGGATAATGTCAATAACTGGCATATTTTCAAGTCAGTGTGTGTAAGGACACAAAACAAACTAGAGTTGCTGATAAAAAAGGATGGCAGCCAACTAGAAGAGataaaaattaaaagtgaaCCTTTGTCTGATGAGGCATATGATGATGGAGTGGCCATTGATGGGTCATACCTTGATAGTGAGaATGTTGCTGGATCCAGTAAGATGCAGCCTGAAGGACCACCTATCTTGGCGTCATTGGGACTCACTCCACGAAGTGATAAGAAAAATGTAGACCCTCGTATGGACTGGCAACGAGTCCATGCAATATTGGACATGGTGCAAGACGATGATGTGATTGATTCACTTCAGTCCATCGAGGAGTGTGATGTTGTGCAGGAGTCCGATCACAACTCTGACTCAGAGGCGGAACTTCAAATTGATATAATTGATGAATATATTGACTGCAAGACTGGATATATGTGTAAAAACAGGACAATCCTTTCTAAAAATCCAAAGCTCTCAACTTcggtgataaataaaaaaatcaaagaagCCTCAAGACTAAGGAAAATCAAACCAGGAACAACCAAACTATGTGTGCAACCTAAAAAGGCATGGCAATCACTATTTACAGATGACTTGTTGGACCTAATTGTAGCATCTACAAACGATAACATTCTGAAAACGGGAAATAATATCTCAACTTCAACAAATGTTGGGGAAATAAAAACACTCATCGGAATATTATATCTACATGGTATAATGAGACCAACGCATCAGAGTAGCTGTGACCTTTGGAATAAGGACTGTGGAATTCCATGTGTCAGAAGCGCAATGAAGTATGATCGGTTTAAATTTCTTATCCAAAACTTGAGTTTTGATAAAGATGATGATGACAGCATAGTACAGTTGGATATTATGAAAAGAATGCGTAAGGTATTCGAAATATTCGCAATGAACTGCAGAACTGCTTATGATGTGGATAACTTAGTAGTCATTGATGAGGTCATTGTCCCAGTTTATGGGCCTTGTCCATTTCGGTACAACATTGATAAGAAGCCTCTAAAACGTGGCTTGAAAATGGTGCTCTTGGTTGATTCGGCGAGTTTTTATATCAGTAATTTAGATGTAATTACTGATCATTATTTCGGTGCTGGAGAAATAGTTAGTAAGATGGTTCAACATTTAGCGGGATCGGGACGAACTATTATGATGGATAGTTGGTACACTTCATTGGATTTGATCGATAAACTCAAGAAGGAATATCAGTTGTTCACCATAGCGGCCGCGCAACCTAGCGACAATATAATACCACCTTTGTTTATTTCTCAATACAGAAAATGTAAGACTTTTCTGACTGGGTTTCTGGACAATGATATTGCAATGACGTCGTACATGAATTCCAAGAAAAAGTCGTTGAATGTCTTAACTAATGTACCTAAGTTTTATAAGAGAGGACATAAAAATCATAACACAGCTGCTGCTTTGTATAGGAAGAATCAATCTGCTGTGGAAGTTATTGATGTTTTGATGCACTACTACACTACTATGCAGCACACCAATGATTGGACACTTTCCTTGTTCTTCACTCTTCTTAATATTGCCACAATTAATGCTCAAGTGATATGGTCAACACAGAATTTGCATCAAGTTACAAAACGTCGCTCATTTATTAATGAACTCGCTATCAGCCTTATAGAATGTGATGAGTCCATTGATGTGTCCATGTCTGATGTTTCACTTTTGCGGGAGAAATTTAAGCCCTTAAAAGATATACCATACAAAAATAGAAGAAGGTGTAGAATTTGCGTGAAGACTACAAAAAGAGACAGGAGAACCAAACAGTTTTGTCTCAAATGTGGTCAGTTCATATGCAAAGAGCATACAGGTATCGAAAGTGAGAAAGACGACGAAGATGAAGAAGACGAAGAAGAGATGACAGAACCAGTGAAAAAATACACTAAAGTGACTAACATGCCCGAAGTGTCCATCACTGTGATGCGCCCCACCGGGGAGACGTTGCATGCTCGACAAGGTATCCAACAACTCGCTTCCAAAGACTGTCTTGTGTGTAGCCGATCCTATAGGTACTCACACAATGCCAGGCGCCATGAGCTCACAGCTCACGGCTTCGATAGGTACACTAATAAAACTGTAAACAAAAAACCACCATCACACATGCAACCAAAATTTAGACCAAATCCATTTAATCCTAAAGCCAGGCTTATGCCGAACCCTGTTAGCCATAAAATGAAACTTCTTTCAAAATCAATGCCTACAAAAATGACACAACACAAACTTATCACTCCACCGAAGCCTATACTTATCAAAACGCCGAAAGGAGCTCAAAATAATTTACCATACCCTCTTCGAATAAAAGCACTGAAAGActtacagataaaaaaaaaggaaccgcaaattttaaaaactcttttaaCATCTAAGCCAGAAGTTCTTGTATCTGAACCTGAAATTATAAATTCGGGTCCCGAGAGTCCCGAAACTTTGATTTCTGAACCAGAAATTGCGTCTTTCCAAGTGGAAACTATATTGTCAGAACCAGATGGCTATGACCAGCAACCTGGTGACGAGGAACTAGAAGGTGATATGACAAACAATCAAAGTCAGAACTACGACACAGTCGACATGGAGTCTGACAACGAAATAGAGATTGCGCGTGAGCAAGAAAATGAAGGCGAAGAAGATCATAGAAACGATGAGGGAGAAGATAATATCCAAATTGATGAAGAGATGAATCATTACGATCCTCAAAGTGATACTGAAAAAGATCAAGTTGAGGGACATGACGTCGAAGATAACGATGAGCATATCGGAATTGATGAAAGTGACCTTAAAGCTGAAGAAGAAAATCGGGATAGAGAAGATGGTGTTGAAGATGGAGACAACGACGAACAAGAAATAATTAATCATGATGAAACTCGCGAGGAAGACGATGAAGAACTACCACCGATGGAAATAGCACCAGTAGTAGAAATAAACGAGGACATGCAAACAAACTCTTACAATAGCGAAATTaatgaagaagaagaagaggatCTTGAAGAAACCACTGAAATTAACGATACGGCGGAAGAGGAGGGAGTCAAAGAACTTGACCCAGACAAATTATATGTTACGAAAACTCAAAGAGATTTCATTCAGAAATATCGTGATGTCATTGAACAAGTAAATACAAAACGGTGTTTATGCTGTGACCGCGAGCATCCTCGAAGAAAAGCAGTTATCCAGCATTTACAAAAGAATGGACATAAAGTTCCTAAACATACCTGCTACAACTGTGTAGTAACATTCGGACATATCGGCGCTCTTCTCAGTCATATGAGATCCAATAGCTGCACAGACTTATGGAAAATAATCTACAACGAAAACGGAATTACTGATGATTTAGTCTTAGCAGAGCCAAAGGATAATAAAGTTCAGTATAAAGACATCTTCAATGCAAGATCATATGCTTGCAAGTTGTGTCCTGCCAAATTCCAGCTGAAACAatttataatgaaacatgttttGGATGTTCATGAAGATGGCCAGTCCCGAGTACCACTCCATTGCGTGCATTGCCGAGCGCGATTTAAAGATAAGAGTCTTATCAAAAAGCATATTCGCAATGGCGAATGCACAGTGATCATTTCATGTGAACTGTGCTCTGAGAAGTTTGTAAACATTCAAGATTTTAACGATCACGCTATGGCTGTTCATGCCGGAAGCTTCGACCAGTCTGATAATCAAAACAAATGTGTCGATGGACGACCTACCGATTGTCCAATTTGTGGAAAGAAAAATAGTAGCTACCCGAATTTGGTAAAACATTTGAAGATTATACACAATGAGGAAAAACCTCATTACTGCCAGCATTGCGACTCCAAATACGAACAAGCTACAGATCTCAACAAACACATTTATGTGGAACATTCTGACCGAAGTTTGGGTATGCAAAGCAATGAACCTGATATGTCCTTGGTCAAGGAAGAAGCCGAAGAGTATCATTATTCCTGCACTGAATGTAATGCCATATTTGAAACCGTCGACGCTTGGACGGATCATCAGGTTGCCGAACATAATCAAGTCGCTCACCACTGTGATCAATGCGACAAGAAGTTCCTTCGTCCATCCGAGCTCGCCGAGCATAAGAACACCCATTTGCGTGTCAAATTTTATCCTTGCAGTGTTTGTACGAATTCGTATAGTACTCCACAAAAACTGTCGGAGCACGTTCAACAAGCACATCCTGGTGCTGGCTCTTTAACCGCAACCGAGTCCGAGTTCTATTGCGATATATGCATAAGATCTTTTAAAAGTCGTCAAGCATATTCTAATCATATGCGTATTCATTCCAAAGTACCCACAACTAACAGGAAACCTACAGAACAAAAAGGTTTTGCCCCGCAAATCATAGGCAAACCTATCAAACAATTTACTGCAGTGCAACCTGGTTTCGTGGCATTCAAACCAAATTGTAACGTTCCTAATGCTCCATACTGTTGTGATATATGTGGAAAAGGTTTCATgcataagaaaaatatttggaaACATAAGAAAGTACTACACGCTGATCTCATCAATGACAGGAATGACAGTGAAGACAACACAATGCAAGCATCTACAGAAGACGATGAATATAACGCTGATGAAAATGGAGCTATTCTGTCTACGCCGCAGttcaatagttttaattttacgaaCTTCGCTAATAATAttcaacagccaacaccgcagCCAGATCCGATGCCATTTTCATGTGAGCTCTGTTTTAAACGTTTTCCTCTTCGAACCAGTTTATGGAAACACAAGCGAGCCAAACATGGAATTTCTGGCTCGGATAACCAGCAGCCAAACGAAGCCGGTAACAGATCTAGTTGCACAATCtgtaaaattacattttcaGACAAAAAGTCTTACTATCGACACAGGAAGAATGTCCACAAGTCGTCGTCCCAGATGTGCAAAATCTGTGGCAAGCCGTTAAATTCGACTTTAGAATTGTATGAACATCTTAAAGCTGCTCACGCTCGTGAACTGTTGGGCTACAATGCGAACCAAGGTAACACTAGCAAGGTGCAAGAAAACGAACAAGAGCTAGAAATAGAATATGAAAATGACCAAGACTTGGCAGATCCGAGTGTGGAATATCAAGCTAGATATCCATGTGATACATGCGGTAAACAGTTCGTTGGTTTGCTTGCATTACAAAACCATCAGTGTATTAATCAAATGTCATCACAACCACAAACCTTTGATTGCGAAATCTGTCATAAGAGTTACACATCAATTGCGGCACTTAAAAGCCACCGCGGCTGGCATCTCCGCTCTCCCGACGGCAAAGCGGCCGCCAATAACACTGGGCTATGGATGCCTCAGCACAAAGTAACTAGCAAGGTCAGTAAACATGAAGTTGTCGACCCCGTCCAACTCGCACGCGTGCAACATTCGACACCCGCCGCGACTGTAGTTAAAAGAAGATTACCACCCGAAGTCGAAGTGACAGTTGTTAACCCGAATAAAAAATTGCGATCGGACGATTCTGTTGAAATGGATCACAGCTCGACTGTAGAGGACAGATACTGTACGATATGTGACAAAGAGTTTACAAAACGAGCCGCCTACCTGCGACACATGGACGAGGTGCACCAGCCAAACTCGGTGTTCTGTCCGGTGTGCGATAAGAGTTTCACACGAAAATCGACCTTGTTAGTTCATATGAAGAAGCATTACGAGGGTGGCGAGGGGAGTTCATCAGGGCAGGCACAAGAGGAGGATGAAGAAGAGGACCACTCTTGCGACCTGTGCGGGGCGCAATACGACAGCGAGAAGGCGCTGAAGGCTCACCGGGCGAGGCACCATGGGGATGATGAGTCTGGGGAATCGGAGGATGACGGTAGCGTGGCGGTGTCGCAGCCGGGCGAGTTCACCTGCGGCCAGTGTGGTGACGGAGTGGCCACGCCGCGCGACCTCATCGCTCACCGCACGATGCACGCGACCCCTACCAAATTCTTCTGCAACATTTGCAAGGTGTACTTCGCCCGCGCCCTCGACCTGTCATCGCACACGCGTGCGAGACATTCCGACAACGAGAAGGTCTTCTTCCCATGTGCCATGTGTGACCGCTTCTATATGAACAAGAAGAGTTTGCAACGACACATTGAAATGGCTCATTGA
Protein Sequence: MSVNYDRVCRLCLSSRGELLPIFPTTSSGDTDPPVLASKIKDCVSVQISENDDLPTNVCRKCVDNVNNWHIFKSVCVRTQNKLELLIKKDGSQLEEIKIKSEPLSDEAYDDGVAIDGSYLDSENVAGSSKMQPEGPPILASLGLTPRSDKKNVDPRMDWQRVHAILDMVQDDDVIDSLQSIEECDVVQESDHNSDSEAELQIDIIDEYIDCKTGYMCKNRTILSKNPKLSTSVINKKIKEASRLRKIKPGTTKLCVQPKKAWQSLFTDDLLDLIVASTNDNILKTGNNISTSTNVGEIKTLIGILYLHGIMRPTHQSSCDLWNKDCGIPCVRSAMKYDRFKFLIQNLSFDKDDDDSIVQLDIMKRMRKVFEIFAMNCRTAYDVDNLVVIDEVIVPVYGPCPFRYNIDKKPLKRGLKMVLLVDSASFYISNLDVITDHYFGAGEIVSKMVQHLAGSGRTIMMDSWYTSLDLIDKLKKEYQLFTIAAAQPSDNIIPPLFISQYRKCKTFLTGFLDNDIAMTSYMNSKKKSLNVLTNVPKFYKRGHKNHNTAAALYRKNQSAVEVIDVLMHYYTTMQHTNDWTLSLFFTLLNIATINAQVIWSTQNLHQVTKRRSFINELAISLIECDESIDVSMSDVSLLREKFKPLKDIPYKNRRRCRICVKTTKRDRRTKQFCLKCGQFICKEHTGIESEKDDEDEEDEEEMTEPVKKYTKVTNMPEVSITVMRPTGETLHARQGIQQLASKDCLVCSRSYRYSHNARRHELTAHGFDRYTNKTVNKKPPSHMQPKFRPNPFNPKARLMPNPVSHKMKLLSKSMPTKMTQHKLITPPKPILIKTPKGAQNNLPYPLRIKALKDLQIKKKEPQILKTLLTSKPEVLVSEPEIINSGPESPETLISEPEIASFQVETILSEPDGYDQQPGDEELEGDMTNNQSQNYDTVDMESDNEIEIAREQENEGEEDHRNDEGEDNIQIDEEMNHYDPQSDTEKDQVEGHDVEDNDEHIGIDESDLKAEEENRDREDGVEDGDNDEQEIINHDETREEDDEELPPMEIAPVVEINEDMQTNSYNSEINEEEEEDLEETTEINDTAEEEGVKELDPDKLYVTKTQRDFIQKYRDVIEQVNTKRCLCCDREHPRRKAVIQHLQKNGHKVPKHTCYNCVVTFGHIGALLSHMRSNSCTDLWKIIYNENGITDDLVLAEPKDNKVQYKDIFNARSYACKLCPAKFQLKQFIMKHVLDVHEDGQSRVPLHCVHCRARFKDKSLIKKHIRNGECTVIISCELCSEKFVNIQDFNDHAMAVHAGSFDQSDNQNKCVDGRPTDCPICGKKNSSYPNLVKHLKIIHNEEKPHYCQHCDSKYEQATDLNKHIYVEHSDRSLGMQSNEPDMSLVKEEAEEYHYSCTECNAIFETVDAWTDHQVAEHNQVAHHCDQCDKKFLRPSELAEHKNTHLRVKFYPCSVCTNSYSTPQKLSEHVQQAHPGAGSLTATESEFYCDICIRSFKSRQAYSNHMRIHSKVPTTNRKPTEQKGFAPQIIGKPIKQFTAVQPGFVAFKPNCNVPNAPYCCDICGKGFMHKKNIWKHKKVLHADLINDRNDSEDNTMQASTEDDEYNADENGAILSTPQFNSFNFTNFANNIQQPTPQPDPMPFSCELCFKRFPLRTSLWKHKRAKHGISGSDNQQPNEAGNRSSCTICKITFSDKKSYYRHRKNVHKSSSQMCKICGKPLNSTLELYEHLKAAHARELLGYNANQGNTSKVQENEQELEIEYENDQDLADPSVEYQARYPCDTCGKQFVGLLALQNHQCINQMSSQPQTFDCEICHKSYTSIAALKSHRGWHLRSPDGKAAANNTGLWMPQHKVTSKVSKHEVVDPVQLARVQHSTPAATVVKRRLPPEVEVTVVNPNKKLRSDDSVEMDHSSTVEDRYCTICDKEFTKRAAYLRHMDEVHQPNSVFCPVCDKSFTRKSTLLVHMKKHYEGGEGSSSGQAQEEDEEEDHSCDLCGAQYDSEKALKAHRARHHGDDESGESEDDGSVAVSQPGEFTCGQCGDGVATPRDLIAHRTMHATPTKFFCNICKVYFARALDLSSHTRARHSDNEKVFFPCAMCDRFYMNKKSLQRHIEMAH

Similar Transcription Factors

Sequence clustering based on sequence similarity using MMseqs2

100% Identity: iTF_00961156;
90% Identity: -
80% Identity: -