Basic Information

Insect: Hypomecis punctinalis
Gene Symbol: -
Assembly: GCA_949316475.1
Location: OX438821.1:13756082-13758415[+]

Transcription Factor Domain

TF Family: zf-GAGA
Domain: zf-GAGA domain
PFAM: PF09237
TF Group: Zinc-Coordinating Group
Description: Members of this family bind to a 5'-GAGAG-3' DNA consensus binding site, and contain a Cys2-His2 zinc finger core as well as an N-terminal extension containing two highly basic regions. The zinc finger core binds in the DNA major groove and recognises the first three GAG bases of the consensus in a manner similar to that seen in other classical zinc finger-DNA complexes. The second basic region forms a helix that interacts in the major groove recognising the last G of the consensus, while the first basic region wraps around the DNA in the minor groove and recognises the A in the fourth position of the consensus sequence [1].
Hmmscan Out: # of c-Evalue i-Evalue score bias hmm coord from hmm coord to ali coord from ali coord to env coord from env coord to acc

1 15 0.14 6.8e+03 -1.3 0.1 27 49 8 30 2 33 0.81

2 15 0.24 1.2e+04 -2.1 0.0 27 48 67 88 62 91 0.83

3 15 1.3e-05 0.63 11.6 0.3 26 48 97 119 89 123 0.92

4 15 0.0064 3.1e+02 3.0 0.2 26 48 127 149 122 154 0.87

5 15 3.5e-08 0.0017 19.8 0.6 16 49 147 180 133 185 0.79

6 15 0.0068 3.3e+02 2.9 0.2 26 48 186 208 180 211 0.88

7 15 0.19 9.1e+03 -1.7 0.0 19 45 230 256 224 260 0.76

8 15 0.22 1.1e+04 -2.0 0.0 21 48 284 311 280 313 0.86

9 15 0.019 9.1e+02 1.5 0.0 27 50 396 419 389 423 0.83

10 15 3.2e-05 1.5 10.4 0.2 26 49 453 476 446 480 0.90

11 15 0.0096 4.6e+02 2.4 0.1 26 48 482 504 477 509 0.86

12 15 0.063 3e+03 -0.2 1.7 18 48 501 534 495 540 0.69

13 15 0.015 7.1e+02 1.8 0.0 27 51 543 567 539 570 0.83

14 15 0.063 3e+03 -0.2 0.0 27 48 573 594 571 597 0.91

15 15 0.018 8.9e+02 1.5 0.1 27 46 609 628 602 632 0.86

#	of	c-Evalue	i-Evalue	score	bias	hmm coord from	hmm coord to	ali coord from	ali coord to	env coord from	env coord to	acc
1	15	0.14	6.8e+03	-1.3	0.1	27	49	8	30	2	33	0.81
2	15	0.24	1.2e+04	-2.1	0.0	27	48	67	88	62	91	0.83
3	15	1.3e-05	0.63	11.6	0.3	26	48	97	119	89	123	0.92
4	15	0.0064	3.1e+02	3.0	0.2	26	48	127	149	122	154	0.87
5	15	3.5e-08	0.0017	19.8	0.6	16	49	147	180	133	185	0.79
6	15	0.0068	3.3e+02	2.9	0.2	26	48	186	208	180	211	0.88
7	15	0.19	9.1e+03	-1.7	0.0	19	45	230	256	224	260	0.76
8	15	0.22	1.1e+04	-2.0	0.0	21	48	284	311	280	313	0.86
9	15	0.019	9.1e+02	1.5	0.0	27	50	396	419	389	423	0.83
10	15	3.2e-05	1.5	10.4	0.2	26	49	453	476	446	480	0.90
11	15	0.0096	4.6e+02	2.4	0.1	26	48	482	504	477	509	0.86
12	15	0.063	3e+03	-0.2	1.7	18	48	501	534	495	540	0.69
13	15	0.015	7.1e+02	1.8	0.0	27	51	543	567	539	570	0.83
14	15	0.063	3e+03	-0.2	0.0	27	48	573	594	571	597	0.91
15	15	0.018	8.9e+02	1.5	0.1	27	46	609	628	602	632	0.86

Sequence Information

Coding Sequence: ATGTCTCAAGGCGATTTCGTTTGTGACTACTGCAGTCGCTCTTTTACAAGAAAATACAACCTTCAAACTCACATAGAAAACTGTCATATAACATCCTCAAGTTATTGCGAGATATGTGACCAAAAATTTGGGAGCCCCAGTGGCCTACAATTACACCTCCTTCGCGGCCACAACAGATATGGCCAATCATTCCCGGAATGCGACATTTGTGGCAGAATCTTCACAAGAAAACAGAACATCATGTCTCATATGATCACCGTTCATCTACAAGGTCTAGGACCAGAGATCCGATGCCGTATTTGCTTCAAAACCTTTACAACAGAACGAAATTTGAAGAGACATGTGAAACTGCTACATAATCCAGATTTAGAATATCCGACTTGTGATATTTGTAACAAGATTTTTAGAAGCAAACATTCACTCGTTTCTCATATACACGCTGCACATAATCATACCGATAAAACAATTACATGCCACATGTGTGATAAGGTGTTCACTAATAATAGAAATCTGAGAAGGCACATAGAAATGTTACACGGGGAGAAAGAAGACCACAAATGCCATATTTGTCCCAAAGTGTACACATCTAATCAAAGTCTAAAACGACATATCAGGACTACGCATTCTGATGAAGACAGTATCCAATGCGAGGCTAAATTAAGTTCCGAGAATGATGACTCTAGTGATTCCgatgaaagtgacatagtcacTTGTGATACGTGCAACGAATCATTCGCGGAAGAGTCAATTTTACGTCAGCATGTAAAAAACGACCACCCATTCCAAGTCTTCTACGATTACTGCAAGCGCTCGCTCGAGAAATTGGCCAATATGAATCAGCCGACATCGAGTAAACAGATCTTCAAATGCGAATTCTGCTCGTCAAGATTTCACAACGTTTACGAATTGAAAGAGCACATGAAAGTCAACCACGATACGGATTACAACTTGTGTAATTGCAACGTTTGCTTTTCCAAGTTTTTCTGTAAAGAGATTTTGGCTAAGCATAGGAAGATTTGTATACCGCCACCTGATGCCCACTCTTGCGATCACTGCGATAGGCTTTTTACAGATATTTCCAGTTTAGAGTTCCATTTGAGGATATTTCATCCGCAAGCACAGTTAGCTGATCCTAACATAACTTCTACTAAACCTGATGAGGCTACAGATCTTAGTTCTTTCAAATGTGGTCATTGCGACCGAATGTACTACAGCGACCGCTCATTAAAGCACCACATCAAGTTGAAACATACAACAGATGAAGCAGTAGAATGTGGTTACTGCAACAAAATttgtaacaacaaatattacCTCGCCTCTCATATCAAAATCGTGCACAGCGCTGTGGATTTATCGAAATGTGactattgtgataaacttttcaaATCCAAACGAAATATACGACGTCACATCGAGTATACGCACATGGGGATGCAAAGATACAAGTGCATAGAATGCGAGACCCTCTTCAAAGAAAAGCGAAGTCTTCGTAAACACGTTCGCTCGAAGCATCCTAATTCTGCGACCTTTCCTCAATGCCATATTTGTCATAAAAGGTTCGAGTCTGCAAAATCCTGCAAGATACATTTGAAGCTCTTACATTCGTTCAACATGAACACTTATCCTTGCGACTTGTGTTCAGTGTCTTTTGGCTCAAAAGAGGCTTTGAAAATTCACTTAGAAACTAAGCATCTAGCTGAAGACGAGATTTACAAATGCGAAGAGTGCAACGCAGTCTTCAAAGGATCTCTAAAATTTGAGGAGCATAACGAAATCTCTCACGCGTTTGTAACTAATAACGCGAAGCAGAAATTCTTGCCACATTGCGTGATTTGTATGAAAGATTTCAGCACGCGAAAAACTCTGAGACGGCACATAAAGAAATTTCACGAGGAATTCCACGCTGAAGATCTGGCGAACTTTGGCTGTCGCAACCGCGAGTTCACCGTTGAGTGCGAGGATTGTTTGAAAAACATAAACAACGAATACTATATAAACTTGTATAACAAAGTGAAGCATATCAAGGATTCGATAGTATTCAAATGCGAGACATGTAGGTCGTCGTTCAACTCTATAGAATTTGCGATTCAAAGGCGTAAAATTTCAGCGGACGATGATAAATCGCATTTGATATTGAGTGATCTGTGCACGACACAGATGAGCGATGGCGAGGCCAGCTACTCTGGATTTGGCTCTTTACACGAATATATGGAAGCGGAGAGTACGACTGCGGATATCAAAGAAGAACAATTGGAAACGAAATATGAGGATATCAAAATGGAATTTGAGGAAATGAATTTGGTACGCGTCAAAATGGAACCTGTTTCTCCTTGA
Protein Sequence: MSQGDFVCDYCSRSFTRKYNLQTHIENCHITSSSYCEICDQKFGSPSGLQLHLLRGHNRYGQSFPECDICGRIFTRKQNIMSHMITVHLQGLGPEIRCRICFKTFTTERNLKRHVKLLHNPDLEYPTCDICNKIFRSKHSLVSHIHAAHNHTDKTITCHMCDKVFTNNRNLRRHIEMLHGEKEDHKCHICPKVYTSNQSLKRHIRTTHSDEDSIQCEAKLSSENDDSSDSDESDIVTCDTCNESFAEESILRQHVKNDHPFQVFYDYCKRSLEKLANMNQPTSSKQIFKCEFCSSRFHNVYELKEHMKVNHDTDYNLCNCNVCFSKFFCKEILAKHRKICIPPPDAHSCDHCDRLFTDISSLEFHLRIFHPQAQLADPNITSTKPDEATDLSSFKCGHCDRMYYSDRSLKHHIKLKHTTDEAVECGYCNKICNNKYYLASHIKIVHSAVDLSKCDYCDKLFKSKRNIRRHIEYTHMGMQRYKCIECETLFKEKRSLRKHVRSKHPNSATFPQCHICHKRFESAKSCKIHLKLLHSFNMNTYPCDLCSVSFGSKEALKIHLETKHLAEDEIYKCEECNAVFKGSLKFEEHNEISHAFVTNNAKQKFLPHCVICMKDFSTRKTLRRHIKKFHEEFHAEDLANFGCRNREFTVECEDCLKNINNEYYINLYNKVKHIKDSIVFKCETCRSSFNSIEFAIQRRKISADDDKSHLILSDLCTTQMSDGEASYSGFGSLHEYMEAESTTADIKEEQLETKYEDIKMEFEEMNLVRVKMEPVSP

Similar Transcription Factors

Sequence clustering based on sequence similarity using MMseqs2

100% Identity: iTF_00827237;
90% Identity: iTF_00827237;
80% Identity: iTF_00827237;