Basic Information

Insect: Anania hortulata
Gene Symbol: -
Assembly: GCA_963576865.1
Location: OY756390.1:20229379-20245333[-]

Transcription Factor Domain

TF Family: zf-C2H2
Domain: zf-C2H2 domain
PFAM: PF00096
TF Group: Zinc-Coordinating Group
Description: The C2H2 zinc finger is the classical zinc finger domain. The two conserved cysteines and histidines co-ordinate a zinc ion. The following pattern describes the zinc finger. #-X-C-X(1-5)-C-X3-#-X5-#-X2-H-X(3-6)-[H/C] Where X can be any amino acid, and numbers in brackets indicate the number of residues. The positions marked # are those that are important for the stable fold of the zinc finger. The final position can be either his or cys. The C2H2 zinc finger is composed of two short beta strands followed by an alpha helix. The amino terminal part of the helix binds the major groove in DNA binding zinc fingers. The accepted consensus binding sequence for Sp1 is usually defined by the asymmetric hexanucleotide core GGGCGG but this sequence does not include, among others, the GAG (=CTC) repeat that constitutes a high-affinity site for Sp1 binding to the wt1 promoter [1].
Hmmscan Out: # of c-Evalue i-Evalue score bias hmm coord from hmm coord to ali coord from ali coord to env coord from env coord to acc

1 29 0.00015 0.016 16.7 0.9 1 23 214 236 214 236 0.99

2 29 0.0012 0.13 13.9 0.3 2 20 273 291 272 293 0.93

3 29 5.7e-05 0.0059 18.1 0.2 2 23 322 344 321 344 0.96

4 29 0.03 3.1 9.5 0.3 1 23 395 418 395 418 0.96

5 29 0.006 0.62 11.7 0.3 1 23 434 456 434 456 0.95

6 29 5.5e-06 0.00057 21.3 1.3 2 23 498 520 497 520 0.96

7 29 0.00084 0.088 14.4 2.0 2 23 564 586 564 586 0.97

8 29 0.022 2.3 10.0 1.6 1 23 636 659 636 659 0.96

9 29 0.0011 0.11 14.1 0.1 1 23 715 737 715 737 0.97

10 29 0.031 3.3 9.5 4.6 2 23 749 770 748 770 0.96

11 29 0.073 7.6 8.3 1.5 2 23 782 803 781 803 0.96

12 29 0.0037 0.39 12.4 2.2 1 23 813 835 813 835 0.98

13 29 0.85 88 4.9 5.8 2 23 865 886 865 886 0.96

14 29 0.0027 0.28 12.8 3.3 1 23 897 919 897 919 0.97

15 29 5.6e-05 0.0058 18.1 0.5 1 23 927 949 927 949 0.97

16 29 0.00075 0.078 14.6 0.4 2 23 969 991 968 991 0.97

17 29 0.46 48 5.8 0.5 1 23 1009 1031 1009 1031 0.93

18 29 0.14 14 7.4 2.9 1 23 1038 1060 1038 1060 0.97

19 29 0.014 1.5 10.5 4.3 2 23 1071 1093 1070 1093 0.95

20 29 0.00054 0.056 15.0 0.3 1 23 1115 1137 1115 1137 0.97

21 29 6.5 6.7e+02 2.2 0.3 2 20 1141 1159 1140 1160 0.89

22 29 0.026 2.7 9.7 0.1 2 23 1218 1239 1217 1239 0.92

23 29 8.8 9.2e+02 1.7 4.0 5 23 1249 1267 1246 1267 0.94

24 29 0.016 1.7 10.3 0.8 2 23 1278 1300 1277 1300 0.95

25 29 1.9 1.9e+02 3.9 6.3 2 23 1317 1335 1317 1335 0.91

26 29 0.18 19 7.1 1.6 2 21 1339 1358 1339 1359 0.93

27 29 9.7 1e+03 1.6 1.3 2 19 1379 1396 1379 1400 0.91

28 29 0.21 21 6.9 0.5 2 23 1407 1428 1406 1428 0.93

29 29 0.0034 0.35 12.5 0.6 2 23 1439 1461 1438 1461 0.96

#	of	c-Evalue	i-Evalue	score	bias	hmm coord from	hmm coord to	ali coord from	ali coord to	env coord from	env coord to	acc
1	29	0.00015	0.016	16.7	0.9	1	23	214	236	214	236	0.99
2	29	0.0012	0.13	13.9	0.3	2	20	273	291	272	293	0.93
3	29	5.7e-05	0.0059	18.1	0.2	2	23	322	344	321	344	0.96
4	29	0.03	3.1	9.5	0.3	1	23	395	418	395	418	0.96
5	29	0.006	0.62	11.7	0.3	1	23	434	456	434	456	0.95
6	29	5.5e-06	0.00057	21.3	1.3	2	23	498	520	497	520	0.96
7	29	0.00084	0.088	14.4	2.0	2	23	564	586	564	586	0.97
8	29	0.022	2.3	10.0	1.6	1	23	636	659	636	659	0.96
9	29	0.0011	0.11	14.1	0.1	1	23	715	737	715	737	0.97
10	29	0.031	3.3	9.5	4.6	2	23	749	770	748	770	0.96
11	29	0.073	7.6	8.3	1.5	2	23	782	803	781	803	0.96
12	29	0.0037	0.39	12.4	2.2	1	23	813	835	813	835	0.98
13	29	0.85	88	4.9	5.8	2	23	865	886	865	886	0.96
14	29	0.0027	0.28	12.8	3.3	1	23	897	919	897	919	0.97
15	29	5.6e-05	0.0058	18.1	0.5	1	23	927	949	927	949	0.97
16	29	0.00075	0.078	14.6	0.4	2	23	969	991	968	991	0.97
17	29	0.46	48	5.8	0.5	1	23	1009	1031	1009	1031	0.93
18	29	0.14	14	7.4	2.9	1	23	1038	1060	1038	1060	0.97
19	29	0.014	1.5	10.5	4.3	2	23	1071	1093	1070	1093	0.95
20	29	0.00054	0.056	15.0	0.3	1	23	1115	1137	1115	1137	0.97
21	29	6.5	6.7e+02	2.2	0.3	2	20	1141	1159	1140	1160	0.89
22	29	0.026	2.7	9.7	0.1	2	23	1218	1239	1217	1239	0.92
23	29	8.8	9.2e+02	1.7	4.0	5	23	1249	1267	1246	1267	0.94
24	29	0.016	1.7	10.3	0.8	2	23	1278	1300	1277	1300	0.95
25	29	1.9	1.9e+02	3.9	6.3	2	23	1317	1335	1317	1335	0.91
26	29	0.18	19	7.1	1.6	2	21	1339	1358	1339	1359	0.93
27	29	9.7	1e+03	1.6	1.3	2	19	1379	1396	1379	1400	0.91
28	29	0.21	21	6.9	0.5	2	23	1407	1428	1406	1428	0.93
29	29	0.0034	0.35	12.5	0.6	2	23	1439	1461	1438	1461	0.96

Sequence Information

Coding Sequence: ATGGCCCTCAAGCTTGGGAAATGCAGACTTTGTCTGAAGCTTGGCGACTTTTACTCCATCTTTGCGGTGGACAATGCCGTCCAGCTCGCGGAGATGGTAATGGAATGCGCTCGGGTGAAAATCTACGATGGAGACGGACTGCCCGACAAGATTTGTTCGGAATGCATCCAGAAGTTGAGCAGTGCATACATCTTCAAGCAGCAATGTGAGAGGTCCGACCAGGAGCTCAGACGAAATTATGTGCCGCCGCCAGGATTTAGTATCACGCCGCCCCCCGCGCCGCACACTCCGAACCGGCAGAGCAGCGACTCTGCGTTCTCGTCGCAGACGGACGTGTCGTCGCAGAGcaagggggcgggggcgggggcgggggcgggggcagGGGCGGGGGCGGCAGGGGGGGCGGGGGCGCCCCGCGCGCGCAAGCGCAGCCGCGAGAGCGGGGACACTTCCGCGTCGGCCAGCAGCCGCTCGCACGACTACGCGCCCGCCACTAAGAGGGTCTCGGAACTGCGCGACTCGCAGAAGAAACGACGACCAAATAAGTCCTACGAAGACGACTCTGACTACGAAGACAACATGTCCACATCCCAGTTCTCGGCGGGCACGGACTCGGACGAGCCGCTGCTGAAGCAGGCGTTCCAGTGCAAGAAGTGCGACAAGTCGTTCCTGAGTGCCAAAAGCCTCGCCGTACACGGTAGAACGCACTCGAAGAAGGAAAACTTGGGGGAAAATGAGGTAGTGAGCATCCCGAAGGCGTTCCCGTCCCCGTCCCCTTCCCCTTGCGAGGACGCGCGGGACGAGGACGACAAGCTGTCGTGCGAGCGGTGCGGCAAGACGTTCAAGCTGAAGATCATGCTGAAGCGGCACCGCGACGTGTGCGGCGTGGCGCCCGTCGCGCCGCAGAGGGAACTGCTCGTCTCGCTGGAGCCCATCGACGCGgtACACCAACCAAAGAAAATCGAATGCGACATCTGCACCGCAAAGTTCAAAACGATAGACAACCTCAACAAGCATTTACGCGTGGTCCACGCGGCTGCCCCGAAACAGGAACCCTCCCCAGTCAAGGAGAAAGAGAGGAAAGTGTCAGTGCCGTGTATATTCTGCCGGAAGCAGTTCGACGACTACTACGTGTACACCGCACATCATAATAGCTGCAGCAAGCGGCGGGAGTTGGACTGCTTCTCTTGTCCGGTGTGCCAGCGGGTTTCGGGCAAGCGGAGTGCGTTCTTCGTCCACGTGAAGAACTTGCACTTCGAGCGCAGCCTCACGGGGAAGGAGGAGCCCAAGCCGGAGTCCTTTGATTGCCGCATGTGCAGCAAGAGGCTCACCTCGCAGGAGCAGCTAATCACGCACCTCGCCGCGCACATGTCGCACATCGACGAGCCCGCCGCCGCGGTAGACGATGACTCCAGGCCAAGTACAATAGAAGACTCGGCGTCCGTAACATCCGAGTACGGCAGTACAAAGTACGTCTCGAACGGACCCCTGAAATGCAACATTTGCGACAAGCGGTTCACCTACAAGAAGTCCCTGGTCACTCACATGGAGAGAGTGCATACGGGTATAGAAGTTCCTGTGAAGGTGGAACCGCCGGATATAAATCCAGAACAGGGCGATCCAAATTTGCTCAGCGAGACGCGAGCGCCCTCAGAATCCGAGTCTAGTCAAGACGAAGGCGACGACAACACCTGTGATATCTGCGAGAAGCAGTTCTCGTACAGGAGGCTGCTCATCCAGCACAAGAAGACCAAGCACAACCTCAGCTCCGGCACCAAGCGGGCCAAGATCACCCTGAAGGACTGCTCGGTTAGGTGCCTCATCTGCGACCTGGAGATGAAGGTGAGCGCCATCAACGAGCACAACCAGAAGCACATCGCGGTAAACATGAAGCCGCGCAACGAGTACACCTGTGCCGACTGCCGCGACCGCTTCAAGAGCTGTAGCGCCCTCGCCAGCCACATCAAGTTCATACACAGATTAAAACAGCCGCGACCGCCGAAAGCGCCGAGAGCTCTAGAAGGCGGTTCTGAGCTCGCGGATTTTTGCGAGGTCGTTGTGACTAAAGCGGAACCCCTGGACTCGCTCCAGGGTCACAACGACCTGGGAGTAGTTCCGGCGGCCGTGGTCAACGCGGCCGGGTTCACCTGCCCGCTGTGCGGGAAGGTGATGCCAACACTCATATCGCTCAAGAGGCACGTCAACTGGCACACCAACAGGGGGAAGGACCTGGAGAAGAAGATCGAGTGCTTCGTTTGTAAGGAGGAATTCCGATTTCAATGCCACTACAAGCTGCACATGCGCGGACACTACCACGACCCGAACCTGGACCCCAAGCACCTCACGTGCCCCATCTGCCAGCGCAAGAGCAAGCACCTGCGCGCCGCACAGATGCACATGAACTACCACAAGCAGACGCGCTTCAACACCGCCGACTACCAGTGCTCCATCTGCAAGCGAGTCTTCCAACACCGAAAAGTCTACCTCTCCCACATGGCCATCCATTTCAAACGAGGCGAAAGCGGTCAGAACACGATCGTCGGAGATATACTTCCCAACAACGCGGACCGAACCAAATTCGACGGCACCAACACCTGCCACCTCTGCGGAAAGGTCTGCGACTCCGAGAACTCTCTGAAATGCCACGTCCGCTGGCACAATTCGAAATCTTCGTTGTACGGCGCGAGGCACGAGTGCTTCGTCTGCCAGCTCGTCTTCACGAACAAACGACGCCTCGAGACACACACGCGGTCCCACTACGAGGACGACAACGGACCCTTCAAGTGCACCATCTGCGGCAAGGGGTACATCGACGAGGAGTACTTCCGGAGGCACGTGAAAGGACACAACTTCGACCATCAATCCCATAAAGACAGGATCGATAAGCTAAGAAAAGATAAGGTGAAGTGCCCCATCTGTGCGCGCTTCTACCCCGACCTGATACACCTCATCCGCCACCTGCGGCGCACGCACCCCGAGAGCAAGATGATCAAGGCGGACCCCGACGCGCCGCCGCCGGCCTACTTCTCGTGCAAGCTCTGCGCCAAAGTGTTCCTCGACGAGCGCAGGCTCAAGAGGCACGAGGAGGCTCACATGAGGAAGCCCCTGTTCTTCAAATGTAAGTTCTGCGGGAAAAACACCATCTCGCTCAAGAATCACAACGTACACATCAAGGGCCATCTGACGCAGAAATACTTTGACAGTCCGCTAAAATGCATGCATTGCGACGAGAAGTTCGTTAGGGGCTACGATTTACACCACCATTTACGAGATGTCCACCAAATAAACGAGACGTGGATCGCGGAGCGGACGGAACCTACGCTCAACGGGCCACTGAAAGAATTCCAATGCTCGATTTGTTTAAAAGTGCTCGCCAGCAAAGGAAATTTCGAGAGACATATCGACTACCACAACACGCTAAGATGTAACTACTGTTTCGACTTCTTCAGCACCCTCAGATTCTTGGAAGGCCATCTCGCGTTTAGTTgcgaaaagaaaaaactaatcGGTGATACCGAAATTtaccctaaaaaaattaaatgtcactCCTGCTACAAGGCGTTCCATTTACAAGTGAAATTGGACTGTCACCTCCGCACGCAACACGGCATCAAAGTATGCAAGGAGGCGTCGAGCGGCAAAAAGGAGATCGTGTGCGACTACTGCTTCCGAGTGTTCGAAAACGAGGACGCCTTGACGGGCCATAAGGTCTACCACCGGACCGTCGGGTACTACGGGTGCATTTACTGTAAGCGGAAGTTCAACACTCTGACAGTGTACCGGAAGCATAAGAACCACCATTTCTCGCAGCTCAACGTCGACAACCCGACGAAGTGCGAACACTGCGACGAGACGTTCGTCGCGTTCCGCGAGATGATCTACCACATGCGGGACGTGCATGGCGACGACAAAGAGTGGATCATATTGCCGAAGGACTCCATCGAGGAGACGTGCCACATTTGCAACAAGACGTTCTTCAACCTCCACAGACATTTAGAATACCACGAAGAAAATAGATGTAAAAAGTGCGGAGAATACTTCTACTCCAGAGTCGACTACGATAACCATCTGTGCTCGATAGAGAGCGACGACGAGATAGCTATACACGAGAATAGCACCCTACCGGCGTACGAGGAGTGTCGGTTCTGCTTCAAGCCGATCACGAGGAAGTCCTCGAAACGGAAGCACGACATCATCCACAAAGGGTCGGGCTCGATATCCTGCCGCTTCTGCCCACTCAAATTCAAAACAATGGACGCTTTCAACATCCACGCTTTCTCGCACCGAAGCAGAAAGTACAACAAGAGGCCGATAAAGTGTCGCAAGTGCGGGGAAAAGTTCGTGAAATACGGTCCGTTCATAAAGCACATGAAGAACGTCCACAAGTCGACGAAGAAGGTGCACTACCGAGCCAGGGTGAAGGCGGAGCGCTGCGTGGTGTGCGGCGACGAGTTCCCCAACCTGCACAACCACTACCGCGCGCACCTGCTCAACCAGTGCCAGCAGTGCTGCAAGTACTTCACCTCGGCGAAACTCTTCTCCCAGCACGAGTGCGACAAACCAGACTCGGACCCGTCGAAAGTGTTCGTGTGCGACGAGAACCTCGTCGCTCGCATCAACTCGTACGTTCCTAAAGACGAGAAGGACGATGAGAAGTTCTACGGAGGCTCCGCCGACGAAGACGACGACGAGGCGCCGGAGCCGAGCGTCCCCGCCGCGGAGACCAGGGAGCTGAAGCCGGCCCTGTCGGTGCAGGACGACGACAGCCAGGCGGCCGACCTCGACGCCATGACCTTCTCGCAGGACGAAGCCAGTCAGGACGAAAAAGAGCTTCACCAGATGGTGTCTTCCCCCATAATATCGGACGTGCTGTCGCTCTATCAGCAGAGTCAGCATAAAGAGGACAGGAAGCAGATCGTAAACGAGAAAGACATAGTCTCTCTGATCGATGACGACTCTATGGACATGATGGACGTTAATGTTAATATTCCCATCATCACGATTGATTAA
Protein Sequence: MALKLGKCRLCLKLGDFYSIFAVDNAVQLAEMVMECARVKIYDGDGLPDKICSECIQKLSSAYIFKQQCERSDQELRRNYVPPPGFSITPPPAPHTPNRQSSDSAFSSQTDVSSQSKGAGAGAGAGAGAGAAGGAGAPRARKRSRESGDTSASASSRSHDYAPATKRVSELRDSQKKRRPNKSYEDDSDYEDNMSTSQFSAGTDSDEPLLKQAFQCKKCDKSFLSAKSLAVHGRTHSKKENLGENEVVSIPKAFPSPSPSPCEDARDEDDKLSCERCGKTFKLKIMLKRHRDVCGVAPVAPQRELLVSLEPIDAVHQPKKIECDICTAKFKTIDNLNKHLRVVHAAAPKQEPSPVKEKERKVSVPCIFCRKQFDDYYVYTAHHNSCSKRRELDCFSCPVCQRVSGKRSAFFVHVKNLHFERSLTGKEEPKPESFDCRMCSKRLTSQEQLITHLAAHMSHIDEPAAAVDDDSRPSTIEDSASVTSEYGSTKYVSNGPLKCNICDKRFTYKKSLVTHMERVHTGIEVPVKVEPPDINPEQGDPNLLSETRAPSESESSQDEGDDNTCDICEKQFSYRRLLIQHKKTKHNLSSGTKRAKITLKDCSVRCLICDLEMKVSAINEHNQKHIAVNMKPRNEYTCADCRDRFKSCSALASHIKFIHRLKQPRPPKAPRALEGGSELADFCEVVVTKAEPLDSLQGHNDLGVVPAAVVNAAGFTCPLCGKVMPTLISLKRHVNWHTNRGKDLEKKIECFVCKEEFRFQCHYKLHMRGHYHDPNLDPKHLTCPICQRKSKHLRAAQMHMNYHKQTRFNTADYQCSICKRVFQHRKVYLSHMAIHFKRGESGQNTIVGDILPNNADRTKFDGTNTCHLCGKVCDSENSLKCHVRWHNSKSSLYGARHECFVCQLVFTNKRRLETHTRSHYEDDNGPFKCTICGKGYIDEEYFRRHVKGHNFDHQSHKDRIDKLRKDKVKCPICARFYPDLIHLIRHLRRTHPESKMIKADPDAPPPAYFSCKLCAKVFLDERRLKRHEEAHMRKPLFFKCKFCGKNTISLKNHNVHIKGHLTQKYFDSPLKCMHCDEKFVRGYDLHHHLRDVHQINETWIAERTEPTLNGPLKEFQCSICLKVLASKGNFERHIDYHNTLRCNYCFDFFSTLRFLEGHLAFSCEKKKLIGDTEIYPKKIKCHSCYKAFHLQVKLDCHLRTQHGIKVCKEASSGKKEIVCDYCFRVFENEDALTGHKVYHRTVGYYGCIYCKRKFNTLTVYRKHKNHHFSQLNVDNPTKCEHCDETFVAFREMIYHMRDVHGDDKEWIILPKDSIEETCHICNKTFFNLHRHLEYHEENRCKKCGEYFYSRVDYDNHLCSIESDDEIAIHENSTLPAYEECRFCFKPITRKSSKRKHDIIHKGSGSISCRFCPLKFKTMDAFNIHAFSHRSRKYNKRPIKCRKCGEKFVKYGPFIKHMKNVHKSTKKVHYRARVKAERCVVCGDEFPNLHNHYRAHLLNQCQQCCKYFTSAKLFSQHECDKPDSDPSKVFVCDENLVARINSYVPKDEKDDEKFYGGSADEDDDEAPEPSVPAAETRELKPALSVQDDDSQAADLDAMTFSQDEASQDEKELHQMVSSPIISDVLSLYQQSQHKEDRKQIVNEKDIVSLIDDDSMDMMDVNVNIPIITID

Similar Transcription Factors

Sequence clustering based on sequence similarity using MMseqs2

100% Identity: iTF_00075787;
90% Identity: iTF_00075787;
80% Identity: -