Basic Information

Insect: Agonopterix alstromeriana
Gene Symbol: -
Assembly: GCA_963924505.1
Location: OZ004665.1:16127937-16138185[-]

Transcription Factor Domain

TF Family: zf-C2H2
Domain: zf-C2H2 domain
PFAM: PF00096
TF Group: Zinc-Coordinating Group
Description: The C2H2 zinc finger is the classical zinc finger domain. The two conserved cysteines and histidines co-ordinate a zinc ion. The following pattern describes the zinc finger. #-X-C-X(1-5)-C-X3-#-X5-#-X2-H-X(3-6)-[H/C] Where X can be any amino acid, and numbers in brackets indicate the number of residues. The positions marked # are those that are important for the stable fold of the zinc finger. The final position can be either his or cys. The C2H2 zinc finger is composed of two short beta strands followed by an alpha helix. The amino terminal part of the helix binds the major groove in DNA binding zinc fingers. The accepted consensus binding sequence for Sp1 is usually defined by the asymmetric hexanucleotide core GGGCGG but this sequence does not include, among others, the GAG (=CTC) repeat that constitutes a high-affinity site for Sp1 binding to the wt1 promoter [1].
Hmmscan Out: # of c-Evalue i-Evalue score bias hmm coord from hmm coord to ali coord from ali coord to env coord from env coord to acc

1 28 0.00036 0.023 15.6 0.1 2 23 196 217 195 217 0.97

2 28 0.00069 0.045 14.7 1.1 2 21 246 265 245 266 0.94

3 28 1.4e-05 0.00089 20.1 0.4 2 23 300 322 299 322 0.96

4 28 0.12 7.9 7.6 0.4 1 23 374 397 374 397 0.96

5 28 0.022 1.4 10.0 0.4 2 23 415 436 414 436 0.94

6 28 0.0003 0.02 15.8 2.0 2 21 486 505 485 506 0.93

7 28 0.00037 0.024 15.6 1.8 2 23 544 566 543 566 0.97

8 28 5e-05 0.0032 18.3 1.1 1 23 616 639 616 639 0.98

9 28 0.0034 0.22 12.5 2.7 1 23 695 717 695 717 0.97

10 28 0.00059 0.038 14.9 2.8 2 23 729 750 728 750 0.96

11 28 0.021 1.4 10.0 1.1 2 23 762 783 761 783 0.96

12 28 0.011 0.7 10.9 2.2 1 23 793 815 793 815 0.98

13 28 0.25 16 6.6 2.5 2 23 839 860 838 860 0.89

14 28 0.00067 0.043 14.7 4.8 1 23 871 893 871 893 0.98

15 28 0.00017 0.011 16.6 0.8 1 23 901 923 901 923 0.97

16 28 0.0021 0.14 13.2 0.2 2 23 943 965 942 965 0.97

17 28 1 66 4.7 1.1 1 23 983 1005 983 1005 0.91

18 28 0.002 0.13 13.3 1.2 2 23 1046 1068 1045 1068 0.95

19 28 0.0008 0.052 14.5 0.3 1 23 1089 1111 1089 1111 0.97

20 28 5.9 3.8e+02 2.3 0.8 2 23 1115 1136 1114 1136 0.88

21 28 0.08 5.2 8.2 0.2 2 23 1192 1213 1191 1213 0.94

22 28 0.73 47 5.2 4.6 5 23 1223 1241 1221 1241 0.94

23 28 0.016 1 10.4 0.9 2 23 1252 1274 1251 1274 0.95

24 28 0.1 6.5 7.9 2.7 2 23 1291 1309 1291 1309 0.94

25 28 0.64 42 5.4 0.7 2 23 1382 1403 1381 1403 0.93

26 28 0.003 0.19 12.7 0.7 2 23 1414 1436 1413 1436 0.97

27 28 3.1 2e+02 3.2 1.0 2 23 1452 1470 1452 1470 0.86

28 28 1.2 76 4.5 4.5 2 19 1474 1491 1473 1494 0.88

#	of	c-Evalue	i-Evalue	score	bias	hmm coord from	hmm coord to	ali coord from	ali coord to	env coord from	env coord to	acc
1	28	0.00036	0.023	15.6	0.1	2	23	196	217	195	217	0.97
2	28	0.00069	0.045	14.7	1.1	2	21	246	265	245	266	0.94
3	28	1.4e-05	0.00089	20.1	0.4	2	23	300	322	299	322	0.96
4	28	0.12	7.9	7.6	0.4	1	23	374	397	374	397	0.96
5	28	0.022	1.4	10.0	0.4	2	23	415	436	414	436	0.94
6	28	0.0003	0.02	15.8	2.0	2	21	486	505	485	506	0.93
7	28	0.00037	0.024	15.6	1.8	2	23	544	566	543	566	0.97
8	28	5e-05	0.0032	18.3	1.1	1	23	616	639	616	639	0.98
9	28	0.0034	0.22	12.5	2.7	1	23	695	717	695	717	0.97
10	28	0.00059	0.038	14.9	2.8	2	23	729	750	728	750	0.96
11	28	0.021	1.4	10.0	1.1	2	23	762	783	761	783	0.96
12	28	0.011	0.7	10.9	2.2	1	23	793	815	793	815	0.98
13	28	0.25	16	6.6	2.5	2	23	839	860	838	860	0.89
14	28	0.00067	0.043	14.7	4.8	1	23	871	893	871	893	0.98
15	28	0.00017	0.011	16.6	0.8	1	23	901	923	901	923	0.97
16	28	0.0021	0.14	13.2	0.2	2	23	943	965	942	965	0.97
17	28	1	66	4.7	1.1	1	23	983	1005	983	1005	0.91
18	28	0.002	0.13	13.3	1.2	2	23	1046	1068	1045	1068	0.95
19	28	0.0008	0.052	14.5	0.3	1	23	1089	1111	1089	1111	0.97
20	28	5.9	3.8e+02	2.3	0.8	2	23	1115	1136	1114	1136	0.88
21	28	0.08	5.2	8.2	0.2	2	23	1192	1213	1191	1213	0.94
22	28	0.73	47	5.2	4.6	5	23	1223	1241	1221	1241	0.94
23	28	0.016	1	10.4	0.9	2	23	1252	1274	1251	1274	0.95
24	28	0.1	6.5	7.9	2.7	2	23	1291	1309	1291	1309	0.94
25	28	0.64	42	5.4	0.7	2	23	1382	1403	1381	1403	0.93
26	28	0.003	0.19	12.7	0.7	2	23	1414	1436	1413	1436	0.97
27	28	3.1	2e+02	3.2	1.0	2	23	1452	1470	1452	1470	0.86
28	28	1.2	76	4.5	4.5	2	19	1474	1491	1473	1494	0.88

Sequence Information

Coding Sequence: ATGGCCCTCAAGTTGGGAAAATGCAGACTTTGTCTGAAACTCGGCGACTTCTACTCCATCTACACAGTGGACAACACCATGCAGCTTTCGGAAATGGTGATGGAATGCGCTCGAGTGAAGATATATGACGGAGACGGTCTTCCAGACAAAGTGTGTGGGGAGTGTATCCAGAAGCTCAGCAGCGCGTACATCTTCAAGCAGCAGTGTGAGCGGGCCGACCAGGAGCTGCGGCGTAACTATGTACCACCACCTGGCTTCAGCGTCACGCCGCCGCCCCCAAACCGACAGAGCAGCGACTCCGCCTTCTCCTCCGCACACACTGACATCTCCACCCATCAGAAACCTTCCTCCTCGGTCGAGAAGGTCACGCCAGCCCGGAGCAGGAAGCGAAGTCGAGATAGCGCTGACGATGCCTCGGAAACCAGCCAGTACCGTCCCACCACCTCAAAACGCATTGAAGAACTTAAGAAGAAACCAAGGCACCGCTCTCCCAATGCATCAGCAGACTCTGACTTCGAAGATAACAGCTTCACTCAATTCTCAGGAGAAACTGACTCCGATGAACCCCTGATACACAACAAACTGAAGTGCCCAATGTGCCCCAAAGAGTTCATGTCAGGAATCAGCTTAAGTAATCACATGCGGATCCATTCCAAAGACAAGAACATAGGAAAGGCAGTCGTGGACATTCCAAAGAAGAATATTGAGGACGCAAAAGATGTTGAAGATAAACTGAGTTGCGATAAGTGCCAGAAGACTTTCAAGCTCAAGATCATGTTGAAGAGACACCAAAAAGTTTGTGAGAAGATACCTCAGTTATCGCCCCGGAAAGAACTGCTTATTAGTCTGGAACCAATTGACGCAGTGTTACCTAAGCCACAACAACACCAGAAAATCGAATGTGATCTGTGTACCACCAGGTTCAAGACAATGGACAATCTAGAAAAGCATATGAGGGTAGTCCACGCTGCTGTGGTCAAAAAAGACCGTAAAAGTATAGAGCCAAAAGTCGAAGTTAAGATAGCAGTTCCCTGCCTTTATTGCCAGAATATCTTTGACGATTACTACACTCACAGCGCTCATTTCAGCGTGTGTTCAAAGAGAGATGACTCTAAACCGTTTACGTGTCCATTGTGCGAAAGAGTGATGGCGAAGAAGGCATCCTATTTCATTCACTTAAAGAACATGCATTTTTGGGCGCGTGAGAAATACATGGAGTCGTCACCAGCTAAGAATGACCTCGAGTGTCGTATGTGTCATATGAAACTGGCGTCTCAGGATCAGCTGATTAAGCATTTAGCCGCACACATGTCTAATGTAGAGGATGATGACGACGACGGCGTTGAAGATGCCGCTGAATCTAGACCCAGTACAGCAGAAGATGCAATGTCCATAGCATCCGTAGCCTCGATGCAATCTGAGTACAGCAGTGCTACCATCTCAAATGGCCCGCTCAAGTGTGACAACTGCGATAAGTCCTTCAAATACAAGAAATCCTTCGAAACCCACCAATTGAAGTGCACCGAGATAAAGATAAAGAGTGAACCACCGGACAGACCTTCCACAAGCATTCTAGATCAATCGTACCAAGAATTTGAATCAGAGTCAAGCGACGGAGAAGAAGACATGACATGTGAAATCTGTGAAAAACAGTTCTCCTACAAACGATTACTAATACAGCACAAGAAAACGAAACACAACATGAGCTCCGGGACTAAACGAGCAAAGATAACTCTAAAAAACTGCCTGGTACGTTGCCTCATATGCGACTTAGAGATGAAAGTATCCAATATAAACGAGCACAACCAAAAGCACATAACCGCTAACATCAAACCACGAAACCAATACACTTGCGGTGACTGCAGCGAGAAATTCAAAAGCTGTAGCGCCCTAGCGACCCATATAAAGATGGTGCATAGATTGAAGCAGCCTCCGCCACCGAAGTTAGTGGAAGGAGTCGATCCGTCGGATTTTTGTGAAGTCGTTGTGGCGAAATCGGAACCCCTGGACGAGCTCCAGAGTCACAACGGCTTTGGTGAGGTTCCCATCACGCAGAACTCTCCGCTGGTAGACCTGGCAGGGTTTACCTGCCACATCTGCAACAAGAAAATGAAGACGTTGATATCATTGAGGAGGCACGTCAACTGGCACACTAATGTTGGCAATAACTTGGAGAAGCAGATCGAGTGTTTCGTTTGTAATGAGTCTTTCCGCTTCCAACGTCACTACCGGCTGCACATGCGGGAGCACTACCACGACACCACGCTGGACCCCAAGCACCTCACGTGCCCCATCTGCAACCGCCGCAGCAAGCACCTCCGCGCCGCCCAGGCCCACATGAACTTCCACAAACAGACCCGCTTCAAGAACAAGGACTACCAGTGCTCCATCTGCAAGCGAATCTTCCAGCACAGGAAAGTATATCTCTCACATATGGCCATCCACTATAAAAGAGGTGAGGGACAGAACGCTATAGTAGGCGATAACCTCGCTAAAACGGCCGTCGACGGCTTAACCTGCCCGCAGTGTGGTAAGGTCTGCGATTCGGAAAATTCTTTAAAGTGTCATGTTACATGGCACAAGTCAAAATCATCATTGTACGGCTCCAGGCACGAATGTTCCATCTGCCATGTACAGTTCACTAATAAAAGAACACTGGAGTTGCATACTAGAACGCATTATGAGGATGATAACGGTCCATTTAAGTGCACTACTTGCGGCAAAGGTTACATTGATGAGGAATACTTTAGGAGACATGTGAAAggtcataattttgatagtatGAGTCATAAAAAACGTATAGAAAAACTTAGGAAGGACAAAGTCAAGTGCCCGATCTGTACGCGCTACTACCCGGACGTAGTTAAACTGATTCGTCACTTGAGGAGGACCCATCCGGAGAGCAAGATGATTAAAACGGATCCGGACGCGCCTCCACCCAATTACTTCACTTGCAAGCTGTGCGCTAAGGTGTTCCTTGACGAACGAAGACTACAGCACCATGAGGAAGCTCATCTCAGGAAACCAGAGttctttaaatgtaaattttgtttAAAGAACACCAACTCTCTTCAAAAGCATAGGCTGCACGTAAAGCAGAAACATTTGACTCAAAAATACGTCGATAATCCTCTAAAGTGCCCTCAATGTGAGGAGACTTTCATCAGAGGTTACGCTCTCCACCATCACTTGCGCGACGCTCACGGCATCGATGAGACGTGGATAGCGGAACGCACTGAACAGAAACTCGGCCCACTCCGCGAGTTCCAGTGCTCGATCTGCCTCAAAGTACTCGCCAGTAAAGGCAACTACGAACGACATATCGACTACCATAACACTCTGCGATGCAACTACTGTTTCGACTACTTCAGCTCCCTAAAATTCCTCGAAGGTCACTTAGCATTCCATTGCGAAAAGAGAAAACTGCTCGGCGATACCGAAACTTATCCCAAGAGAGTTAAGTGTCATGTTTGCTACAAGGCGTTCCATTTGCAAGTGAAACTTGACTGTCATTTACGTACGCAGCACGGCATTAAAGTTTCAAGAGAAGCATCGGAGTGCAAACAGGAGATCGTGTGCGACTTCTGCTTTAGAGTATTCGAGAATGACTATGCACTCACTATGCACAAAATATACCACCGTACTGTCGGGTATTTAGGCTGTATTTACTGCAACAGAAAGTTTAGTAATCTAACACTTTACAACAAACATAAGAATCATCACTACAGTCAACTCAACGTGGATAATCCGACGAAATGCGAACATTGTGACGAAACGTTCGTAGCTTTCAGAGACATGATATATCACATGAGGGACGACCATGGCGACGACAAAGATTGGTTGGTGAAACCCAAAGAGTCCATCGAAGAGACTTGCCCTATTTGCAACAAAGTATTCTTCAACCTACACAGACATTTGATGTATCATGAGGAAAATAGATGCAAGAAATGCAGAGAGTACTTCTTTTCTAGATTAGACTTTGACAATCATCTCTGCCCCATTGATAGTGACGATGAGGAAGCTGAAAATAACGAGGACGACTCACGGCCTAAGTATGAGGAGTGCGAGTTTTGCTTCAAACCTATCACCAGAAAGTGCACATATAAGAAACACAACGTTCTCCACAAAGTGTCCGGAGCGATATCGTGTCGATTCTGTTCTCTCAAGTTCAAAACAATTGACGCTTTCAACATCCATGCGTTCTCGCATCGCAGCAGAAAGTACAATAAGAAACCGATAAAATGCAGAATATGTAAAGAGAAGTTTGTCAAATACGGACCCTTTATAAAGCATATGAAGACCATACATAAGTCTACGAAAAAGGTGCACTATCGAGCGACGGTCAAGGCCGAACGGTGCGTCGTGTGCGGCGAAGACTTCCCGAACTTGCACAACCACTACCGCAGTCACTTGCAGAACCAGTGCCAGCTCTGCCGTAAATATTTCACGTCGTCCAAACTCTTCTCTCATCACGAATGCGATAAACCTGATTCCGATCCATCTAAAGTATTCACGAGCGACGAGAACTTGCATGCGCTTATCAAATCTTACGTCCCTAAGGACGAGAAGGATGACGAAAAGTTCTACGGTTACACTGACACCGAAGAGGAGGAAGAAGAAAATACACCTGAATTACAATACGACGAGAGTCAGAATTCCGTAGACGATTTAATACAGCAACCCTTTGTAATATCAGATGTTCTATCGCTTTTCGAGAAAAAGGAAGAATTACTAGCTCTTTACCAAAACAATGATAACGGAATTGATGCAAAAAAGAAGTCTGCTCATAAGACATACGATGGCCCTAAAAAGAAAGGCGCTGGTTCAAAAAAGAAGGAAGAAAAGAATATTGATGAAACACAAAATGGGGTAGATAGTGATGTCGAAATAGTTGATCTTTCAGACGATTCTGTAGGCGTTGAACATAGCGTGCCTATTATTACTATAGATGATTAA
Protein Sequence: MALKLGKCRLCLKLGDFYSIYTVDNTMQLSEMVMECARVKIYDGDGLPDKVCGECIQKLSSAYIFKQQCERADQELRRNYVPPPGFSVTPPPPNRQSSDSAFSSAHTDISTHQKPSSSVEKVTPARSRKRSRDSADDASETSQYRPTTSKRIEELKKKPRHRSPNASADSDFEDNSFTQFSGETDSDEPLIHNKLKCPMCPKEFMSGISLSNHMRIHSKDKNIGKAVVDIPKKNIEDAKDVEDKLSCDKCQKTFKLKIMLKRHQKVCEKIPQLSPRKELLISLEPIDAVLPKPQQHQKIECDLCTTRFKTMDNLEKHMRVVHAAVVKKDRKSIEPKVEVKIAVPCLYCQNIFDDYYTHSAHFSVCSKRDDSKPFTCPLCERVMAKKASYFIHLKNMHFWAREKYMESSPAKNDLECRMCHMKLASQDQLIKHLAAHMSNVEDDDDDGVEDAAESRPSTAEDAMSIASVASMQSEYSSATISNGPLKCDNCDKSFKYKKSFETHQLKCTEIKIKSEPPDRPSTSILDQSYQEFESESSDGEEDMTCEICEKQFSYKRLLIQHKKTKHNMSSGTKRAKITLKNCLVRCLICDLEMKVSNINEHNQKHITANIKPRNQYTCGDCSEKFKSCSALATHIKMVHRLKQPPPPKLVEGVDPSDFCEVVVAKSEPLDELQSHNGFGEVPITQNSPLVDLAGFTCHICNKKMKTLISLRRHVNWHTNVGNNLEKQIECFVCNESFRFQRHYRLHMREHYHDTTLDPKHLTCPICNRRSKHLRAAQAHMNFHKQTRFKNKDYQCSICKRIFQHRKVYLSHMAIHYKRGEGQNAIVGDNLAKTAVDGLTCPQCGKVCDSENSLKCHVTWHKSKSSLYGSRHECSICHVQFTNKRTLELHTRTHYEDDNGPFKCTTCGKGYIDEEYFRRHVKGHNFDSMSHKKRIEKLRKDKVKCPICTRYYPDVVKLIRHLRRTHPESKMIKTDPDAPPPNYFTCKLCAKVFLDERRLQHHEEAHLRKPEFFKCKFCLKNTNSLQKHRLHVKQKHLTQKYVDNPLKCPQCEETFIRGYALHHHLRDAHGIDETWIAERTEQKLGPLREFQCSICLKVLASKGNYERHIDYHNTLRCNYCFDYFSSLKFLEGHLAFHCEKRKLLGDTETYPKRVKCHVCYKAFHLQVKLDCHLRTQHGIKVSREASECKQEIVCDFCFRVFENDYALTMHKIYHRTVGYLGCIYCNRKFSNLTLYNKHKNHHYSQLNVDNPTKCEHCDETFVAFRDMIYHMRDDHGDDKDWLVKPKESIEETCPICNKVFFNLHRHLMYHEENRCKKCREYFFSRLDFDNHLCPIDSDDEEAENNEDDSRPKYEECEFCFKPITRKCTYKKHNVLHKVSGAISCRFCSLKFKTIDAFNIHAFSHRSRKYNKKPIKCRICKEKFVKYGPFIKHMKTIHKSTKKVHYRATVKAERCVVCGEDFPNLHNHYRSHLQNQCQLCRKYFTSSKLFSHHECDKPDSDPSKVFTSDENLHALIKSYVPKDEKDDEKFYGYTDTEEEEEENTPELQYDESQNSVDDLIQQPFVISDVLSLFEKKEELLALYQNNDNGIDAKKKSAHKTYDGPKKKGAGSKKKEEKNIDETQNGVDSDVEIVDLSDDSVGVEHSVPIITIDD

Similar Transcription Factors

Sequence clustering based on sequence similarity using MMseqs2

100% Identity: iTF_00028000;
90% Identity: iTF_00028000;
80% Identity: -