Basic Information

Insect: Philaethria dido
Gene Symbol: -
Assembly: GCA_033558755.1
Location: JAKGSA010000044.1:323703-330452[+]

Transcription Factor Domain

TF Family: zf-C2H2
Domain: zf-C2H2 domain
PFAM: PF00096
TF Group: Zinc-Coordinating Group
Description: The C2H2 zinc finger is the classical zinc finger domain. The two conserved cysteines and histidines co-ordinate a zinc ion. The following pattern describes the zinc finger. #-X-C-X(1-5)-C-X3-#-X5-#-X2-H-X(3-6)-[H/C] Where X can be any amino acid, and numbers in brackets indicate the number of residues. The positions marked # are those that are important for the stable fold of the zinc finger. The final position can be either his or cys. The C2H2 zinc finger is composed of two short beta strands followed by an alpha helix. The amino terminal part of the helix binds the major groove in DNA binding zinc fingers. The accepted consensus binding sequence for Sp1 is usually defined by the asymmetric hexanucleotide core GGGCGG but this sequence does not include, among others, the GAG (=CTC) repeat that constitutes a high-affinity site for Sp1 binding to the wt1 promoter [1].
Hmmscan Out: # of c-Evalue i-Evalue score bias hmm coord from hmm coord to ali coord from ali coord to env coord from env coord to acc

1 30 0.038 2.7 9.0 3.8 1 21 189 209 189 211 0.92

2 30 0.0023 0.16 12.9 0.8 2 20 240 258 239 260 0.93

3 30 4.2e-05 0.003 18.3 0.4 3 23 287 308 285 308 0.96

4 30 3.1 2.2e+02 3.0 0.6 2 12 329 339 328 341 0.86

5 30 0.013 0.95 10.4 2.3 1 23 359 381 359 381 0.97

6 30 0.0031 0.22 12.4 0.2 1 23 399 421 399 421 0.96

7 30 5.4e-05 0.0038 18.0 1.9 2 23 461 482 460 482 0.96

8 30 0.0022 0.16 12.9 5.6 2 23 523 545 523 546 0.96

9 30 0.0013 0.089 13.7 0.7 1 23 595 618 595 618 0.95

10 30 0.0023 0.16 12.9 0.3 1 23 670 692 670 692 0.97

11 30 0.01 0.73 10.8 5.7 2 23 704 725 703 725 0.97

12 30 0.01 0.72 10.8 1.0 2 23 737 758 736 758 0.96

13 30 0.0041 0.29 12.0 0.8 1 23 768 790 768 790 0.97

14 30 0.015 1 10.3 8.5 1 23 819 841 819 841 0.96

15 30 0.00051 0.036 14.9 2.8 1 23 852 874 852 874 0.98

16 30 9.5e-05 0.0067 17.2 1.3 1 23 882 904 882 904 0.98

17 30 0.0038 0.27 12.2 0.1 2 23 924 946 923 946 0.97

18 30 9.4 6.7e+02 1.5 0.3 1 10 964 973 964 986 0.83

19 30 0.079 5.6 8.0 4.6 1 23 993 1015 993 1015 0.98

20 30 0.053 3.7 8.6 1.3 2 23 1026 1048 1025 1048 0.95

21 30 0.00072 0.051 14.4 0.2 2 23 1071 1092 1070 1092 0.95

22 30 7.9 5.6e+02 1.7 5.9 2 23 1135 1157 1134 1157 0.94

23 30 0.0053 0.37 11.7 0.3 2 23 1173 1194 1172 1194 0.94

24 30 3.9 2.8e+02 2.7 5.8 5 23 1204 1222 1202 1222 0.92

25 30 0.031 2.2 9.3 0.9 2 23 1233 1255 1232 1255 0.95

26 30 1.5 1.1e+02 4.0 6.2 2 23 1272 1290 1272 1290 0.88

27 30 0.018 1.2 10.1 0.8 2 21 1294 1313 1294 1314 0.94

28 30 0.7 50 5.0 1.0 2 23 1363 1384 1362 1384 0.93

29 30 0.0025 0.18 12.7 1.4 2 23 1395 1417 1394 1417 0.96

30 30 9.2 6.5e+02 1.5 3.7 2 21 1455 1474 1454 1475 0.92

#	of	c-Evalue	i-Evalue	score	bias	hmm coord from	hmm coord to	ali coord from	ali coord to	env coord from	env coord to	acc
1	30	0.038	2.7	9.0	3.8	1	21	189	209	189	211	0.92
2	30	0.0023	0.16	12.9	0.8	2	20	240	258	239	260	0.93
3	30	4.2e-05	0.003	18.3	0.4	3	23	287	308	285	308	0.96
4	30	3.1	2.2e+02	3.0	0.6	2	12	329	339	328	341	0.86
5	30	0.013	0.95	10.4	2.3	1	23	359	381	359	381	0.97
6	30	0.0031	0.22	12.4	0.2	1	23	399	421	399	421	0.96
7	30	5.4e-05	0.0038	18.0	1.9	2	23	461	482	460	482	0.96
8	30	0.0022	0.16	12.9	5.6	2	23	523	545	523	546	0.96
9	30	0.0013	0.089	13.7	0.7	1	23	595	618	595	618	0.95
10	30	0.0023	0.16	12.9	0.3	1	23	670	692	670	692	0.97
11	30	0.01	0.73	10.8	5.7	2	23	704	725	703	725	0.97
12	30	0.01	0.72	10.8	1.0	2	23	737	758	736	758	0.96
13	30	0.0041	0.29	12.0	0.8	1	23	768	790	768	790	0.97
14	30	0.015	1	10.3	8.5	1	23	819	841	819	841	0.96
15	30	0.00051	0.036	14.9	2.8	1	23	852	874	852	874	0.98
16	30	9.5e-05	0.0067	17.2	1.3	1	23	882	904	882	904	0.98
17	30	0.0038	0.27	12.2	0.1	2	23	924	946	923	946	0.97
18	30	9.4	6.7e+02	1.5	0.3	1	10	964	973	964	986	0.83
19	30	0.079	5.6	8.0	4.6	1	23	993	1015	993	1015	0.98
20	30	0.053	3.7	8.6	1.3	2	23	1026	1048	1025	1048	0.95
21	30	0.00072	0.051	14.4	0.2	2	23	1071	1092	1070	1092	0.95
22	30	7.9	5.6e+02	1.7	5.9	2	23	1135	1157	1134	1157	0.94
23	30	0.0053	0.37	11.7	0.3	2	23	1173	1194	1172	1194	0.94
24	30	3.9	2.8e+02	2.7	5.8	5	23	1204	1222	1202	1222	0.92
25	30	0.031	2.2	9.3	0.9	2	23	1233	1255	1232	1255	0.95
26	30	1.5	1.1e+02	4.0	6.2	2	23	1272	1290	1272	1290	0.88
27	30	0.018	1.2	10.1	0.8	2	21	1294	1313	1294	1314	0.94
28	30	0.7	50	5.0	1.0	2	23	1363	1384	1362	1384	0.93
29	30	0.0025	0.18	12.7	1.4	2	23	1395	1417	1394	1417	0.96
30	30	9.2	6.5e+02	1.5	3.7	2	21	1455	1474	1454	1475	0.92

Sequence Information

Coding Sequence: ATGGCTCTCAAGCTTGGAAAATGTAGGCTTTGCCTCAAACTCGGCGACTTTTATTCCATCTTCACGGTGGACAACAACTTACAACTCGCTGAAATGGTCATGGAATGTGCCCGAGTAAAGATATGTGAAGGTGACGGACTTCCAGATAAAATTTGTAGTGAATGTATTCAGAAACTCAGCAGTGCCCATATATTTAAACAGCAATGCGAACGATCTGATCAAGAATTACGGCGAAACTATGTTCCGCCTCCAGGCTTTGGTACATCAACGCCTACTGTGCAAAGTAGCGATTCAGCTTTGTCAGCCGAATTATTAAAACCTACATCATCTGTCGAGAGTAAAGTCACGCCTATCTCTAGAACACGAAAAAGAAGTAAGGATAGTGTAGACAATGTGTCTTTGGGCAGTCGCTCCCGAGATTATCAACCGGGAAGTTCAAAGCGCGTCGATGAATTACGTTTTTCTCAGAAAAAGCCAAGATTTTCCATAAATTCGGATTCAGATTATGAAGAAAATAGTGGTTCGTTCTATTCCGCGGGAACTGATTCCGACGAACCTTTACGACACAAGTGCATTGAATGTGGAAAGGCATTTAAATCGAATCTCAGCTTAACAGCACATAGAAAATGTCACAAGCGAAGAGGTGCACAAAAACCTGCGCTAGTGGTCGAAGTGCCCAAGGAAATCAAAGACGCAACTGATTCTGATGATAAACTTAGTTGCGACAAATGTGGAAAACAGttcaaattgaaaataatgCTCAAGCGCCATCATGACGTTTGTTTGAAATCACCCAGAAAAGAGCTCATGGTGTCTCTAGAACCGATCGACGCTGTCCATCCGTTTGTCAAAATAGATTGCCAGATGTGCTCAACGAAGTTTAAGACGATCGAAAACTTGGAAAAACATATGCGTGTTGTTCATGCTGCAGTTCTGAAAAAGGAAGACACATCAACGGCGttcgaaaatgaaaaaataagcgTTCCATGTTTTTATTGCGGACAAACTTTCGacgattattatattcatagtgCTCATTTCAACGTTTGTCCTCAAAAAACTGACGCTGTTAATTTCGAGTGTACAGTTTGCAATAAAGTGGTCACTAAGAAGGGCTGCTACTTTTTACATCTTAAAGCGCATTTTTTTCCTGTGACCTCGAGTAAAGCGACGCCAGAGCCAGTGAAAAACAATTTTCAATGTCGCATGTGTAATAAGAAATTGCCGAGTCAAGAATTGTTGATCACACATCTTGCGGCTCACATGTCTAACGTGGATGAAGCTGACGACGGTGGAGATGAAGAATCCAGggCAAGTACGATGGAAGACTCTGCTTCTATACATTCCGAGTACAGCGGTAATGTATCAAGTGGACCgcttaaatgtaaaatttgtgaTAAATCCTTTAAATATCGAAAATCTTTATTATCACACGAAATAAAACACGcagaagttaatataaaaagagaagTTCTAGATACTTCGACAGatttgttaaatgaaactactgaTACATACAACCAATACGATTCAGAATCTAGTCAAGACGACGGTGACGATGATAATACGTGCGATATATGTGAGAAGGAGTTCTCCTACAAAAGACTGCTATTGCATCACAAACGCACAAAGCATCACATGACATCAGGTACAAAGAGAGCCAAGATAAATCTAAAAGATTGTTCCGTACGCTGTCTTATATGTGACATAGAGATGAAAGTGAGTGCTATCAACGAACACAATCAAACGCATATAAGTGTGAACATAAAGCCAAGAAACCTGTACACATGTATTGAATGTGGACAACAGTTTAAAAGTTGCAGTGCTCTGGCCAATCATATCAAATTGGTGCATCGCTTAAAGCAACAGCCAATAACGGTGGCGGCCGATTTGGCGGATTTTTGTGAGGTCGTTGTGACGAAGGCGGAACCCCTGGACTATGTCCAGAGTCACAACGGCTTTGAGGATTCCGCCGGAAATGGCAAGCCATTGGTCAATTTGAGTGGTTTCACTTGTACTATATGCAGCAAACAGTTGCCCACGTTGATATCGCTCAAGAGACACGTCAACTGGCACAACCATGTCGGCAAAAACATGGAGAAACAGTTGCAGTGTTTTGTTTGTCAAGAGaaCTTCCGATTTCAGTGTCACTACAAGGCTCATATGCGTGAACACTACAATGATACAAACCTCGATCCCAAGTACCTCACTTGTCCCATCTGCAACAGAAAGAGCAAGCACTTGCGCGCGGCACAAGCCCACATGAACTATCATAAACAAACACGCTTCCAGAACAAAGACTACGAGTGTtctatttgcaagaaagtgttCCAGTTCAGAAAAGTCTACCTGTCCCATATGGCGATCCATTATAAGAGAGGGGAGAGTGCGAACAATACTATAGTTGGCTGCGTTTTACCTAATTCtgtcgataaaaaaaaattcgatgGAACTCACACTTGTCATCATTGTGGCAAAATATGTGATTCCGAAAACTCCTTAAAACATCACATAATCTGGCATAACTCTAAAACTTCATTGTACGGCGCTCGGCATGAGTGTGATATATGCAACTTGCAGTTCACTAACAAGAGACGGCTAGAACTACACACTCGGACACATTTTGAAGATGACAATGGACCTTACAAATGTCACATATGTGGCAAAGGATACATTGTAGAAGATTACTTCAAGAGACACGTGAAGGGCCACAACTTTGATCACCAGTCACATAAAAAGAGAATAGAGAAACTAAGGAAAAATAAAGTGAAATGTCCTATTTGTGCTCGTTTCTACCCGGATGTGGTGAAACTTATTCGCCACTTGCGTCGTACTCATCCTGAGAGCAAAATGATAAAAGAAGATCCGGACGCGCCCGCGCCGCGGTACTACTCCTGCAAGCTGTGTGCCAAAGTGTTTTTGGATGAAAGGAGATTACAATTCCACGAGGAATCTCATCTGAGAAAGccagaatttttcaaatgcaaatTCTGTGGTAAAAAGACCATTTCGCTGAAGAACCACAGAATCCACATCAAAAGTCATTTAACGCAGAAGTATATCGACGATCCACTAAAATGTTCACAGTGCGAAGAAAAATTCATGAGAGGCTACGATCTACATTATCATCTAAGAGATGCACACGGTATTAATGAGACCTGGATAGCGGAACGTGGAGTTCAAACGTTAGACGGTCCTTTGAAAGAGCTTCAGTGCTCCATCTGCTACAAAGTGTTGGCCAGTAAAGGAAATTTCGAAAGACATATAGACTATCACAACTCTTTGCGGTGTAATTATTGCTTTGACTACTTCAGCTCGTTACGTTTCCTCGAAGGACATTTAGCTTTCAGCTGTGATAAAAAGAAACTCATTGGTGATACAGAAATACATCCGAGAAAAGTAAAGTGCCATATTTGCTACAAAGCGTTCCATTTGCAAGTAAAGTTGGACTGTCACTTGCGCACGCAACATGAAATAAAAGTGTTCAAAGAAGTGTCTGAAAGCAAAAAGGAACTTGTGTGCGATTATTGTTTTAGAGTTTTCGAAAACGAATACGCGTTGAGTACCCACAAGATATATCATCGGACTATTGGTTACTTTGGGTGTATTTATTGTAACAGAAAGTTTAATACTATGACTCAGTTTAGGAAGCATAAAACCCACCATTTCTCGCAATTGAATGTAGATGATCCGACAAAGTGTGAACATTGCGACGAGAAGTTTGTCGCGTTCAGAGAAATGATCTACCATATGAGAGACGTACACGGAGATGACAAAGAATGGGCTGTCCTTCCCAAGGAGTCGATTGAAGAAAAGTGTCACATTTGTAATAAAACCTTCTTCAATCTTCATAAGCATTTGGCGTATCATGAAGAAAACAGATGTAAGAAGTGTGGAGAATATTTCTATTCACGCGCCGACCTCGATAATCATCTTTGTGCGATAGACAGCGATGAAGAAGTCGCGGAGGCCAACAATGATGGAATTCGGCAAGTTTACGAGGAGTGCAGCTTCTGTTTCAAACCTGTTACCAAGAAGAATTCCAAGAAAAAACACGATCAAATCCACCGAGGGTCAGGGTCCATATCGTGTCGATTCTGttcctttaaatttaaaactattgaCGCCTTTAATATCCACGCTTTCTCTCATAGAAgtagaaaatataagaaaaaacccATCAAGTGTCGTAAATGTGGGGAGAAGTTTGTGCAATATGGaccatttataaaacatatgaaACATGTGCACAAGTCTTCTCAGAAAATGCATTACCGAACCGTTGTGATGCCTGAACAGTGTGTAGTCTGTAACGACTACTTCCCAAATTTGCATAACCACTACAGAGCTCATTTACAAAATCAGTGTCAACAGTGTTACAAATATTTCACTTCATTCAAAGTGTTTTCTCAACACCAATGTGATAAAGAGGACTCGGATACGTCTAAAGTTTTCATATCTGATGCTAATTTACCTGTACTCATAAATACATACGTACCAAAAGATGAGAAGGACGATGAAAAGTATTACGGGCATGAAGAAGAAGCTGAAGAAGAAGATGAAAAAGTAGTCCCAGAAATAGAAAACACAGAAATAAGTAAGATAGAAATAGTATCTCAAGATGAAGATAGCCAAAATTCAATAGATATAGATGAAGGTCAAGTGCATGAAATGGTGCACACACCTATTATATCAGATGTGCTTTCATTGTACAAGAAAGATGATACAAGTAATGATAAGGACAGTCAAAGTGTTAGCGGCAATGTTGTGATTTTGACAGATGATGAGGATTCTATAGGCTTTAAGGATACTGCAAGTGTAATAACTATTGAAGATTGA
Protein Sequence: MALKLGKCRLCLKLGDFYSIFTVDNNLQLAEMVMECARVKICEGDGLPDKICSECIQKLSSAHIFKQQCERSDQELRRNYVPPPGFGTSTPTVQSSDSALSAELLKPTSSVESKVTPISRTRKRSKDSVDNVSLGSRSRDYQPGSSKRVDELRFSQKKPRFSINSDSDYEENSGSFYSAGTDSDEPLRHKCIECGKAFKSNLSLTAHRKCHKRRGAQKPALVVEVPKEIKDATDSDDKLSCDKCGKQFKLKIMLKRHHDVCLKSPRKELMVSLEPIDAVHPFVKIDCQMCSTKFKTIENLEKHMRVVHAAVLKKEDTSTAFENEKISVPCFYCGQTFDDYYIHSAHFNVCPQKTDAVNFECTVCNKVVTKKGCYFLHLKAHFFPVTSSKATPEPVKNNFQCRMCNKKLPSQELLITHLAAHMSNVDEADDGGDEESRASTMEDSASIHSEYSGNVSSGPLKCKICDKSFKYRKSLLSHEIKHAEVNIKREVLDTSTDLLNETTDTYNQYDSESSQDDGDDDNTCDICEKEFSYKRLLLHHKRTKHHMTSGTKRAKINLKDCSVRCLICDIEMKVSAINEHNQTHISVNIKPRNLYTCIECGQQFKSCSALANHIKLVHRLKQQPITVAADLADFCEVVVTKAEPLDYVQSHNGFEDSAGNGKPLVNLSGFTCTICSKQLPTLISLKRHVNWHNHVGKNMEKQLQCFVCQENFRFQCHYKAHMREHYNDTNLDPKYLTCPICNRKSKHLRAAQAHMNYHKQTRFQNKDYECSICKKVFQFRKVYLSHMAIHYKRGESANNTIVGCVLPNSVDKKKFDGTHTCHHCGKICDSENSLKHHIIWHNSKTSLYGARHECDICNLQFTNKRRLELHTRTHFEDDNGPYKCHICGKGYIVEDYFKRHVKGHNFDHQSHKKRIEKLRKNKVKCPICARFYPDVVKLIRHLRRTHPESKMIKEDPDAPAPRYYSCKLCAKVFLDERRLQFHEESHLRKPEFFKCKFCGKKTISLKNHRIHIKSHLTQKYIDDPLKCSQCEEKFMRGYDLHYHLRDAHGINETWIAERGVQTLDGPLKELQCSICYKVLASKGNFERHIDYHNSLRCNYCFDYFSSLRFLEGHLAFSCDKKKLIGDTEIHPRKVKCHICYKAFHLQVKLDCHLRTQHEIKVFKEVSESKKELVCDYCFRVFENEYALSTHKIYHRTIGYFGCIYCNRKFNTMTQFRKHKTHHFSQLNVDDPTKCEHCDEKFVAFREMIYHMRDVHGDDKEWAVLPKESIEEKCHICNKTFFNLHKHLAYHEENRCKKCGEYFYSRADLDNHLCAIDSDEEVAEANNDGIRQVYEECSFCFKPVTKKNSKKKHDQIHRGSGSISCRFCSFKFKTIDAFNIHAFSHRSRKYKKKPIKCRKCGEKFVQYGPFIKHMKHVHKSSQKMHYRTVVMPEQCVVCNDYFPNLHNHYRAHLQNQCQQCYKYFTSFKVFSQHQCDKEDSDTSKVFISDANLPVLINTYVPKDEKDDEKYYGHEEEAEEEDEKVVPEIENTEISKIEIVSQDEDSQNSIDIDEGQVHEMVHTPIISDVLSLYKKDDTSNDKDSQSVSGNVVILTDDEDSIGFKDTASVITIED

Similar Transcription Factors

Sequence clustering based on sequence similarity using MMseqs2

100% Identity: iTF_01079240;
90% Identity: -
80% Identity: -