Basic Information

Insect: Agriopis leucophaearia
Gene Symbol: -
Assembly: GCA_949125355.1
Location: OX421290.1:1266199-1268517[-]

Transcription Factor Domain

TF Family: zf-GAGA
Domain: zf-GAGA domain
PFAM: PF09237
TF Group: Zinc-Coordinating Group
Description: Members of this family bind to a 5'-GAGAG-3' DNA consensus binding site, and contain a Cys2-His2 zinc finger core as well as an N-terminal extension containing two highly basic regions. The zinc finger core binds in the DNA major groove and recognises the first three GAG bases of the consensus in a manner similar to that seen in other classical zinc finger-DNA complexes. The second basic region forms a helix that interacts in the major groove recognising the last G of the consensus, while the first basic region wraps around the DNA in the minor groove and recognises the A in the fourth position of the consensus sequence [1].
Hmmscan Out: # of c-Evalue i-Evalue score bias hmm coord from hmm coord to ali coord from ali coord to env coord from env coord to acc

1 12 0.14 3.9e+03 -1.3 0.1 26 49 7 30 2 33 0.80

2 12 0.073 2.1e+03 -0.4 0.0 23 48 62 88 46 93 0.79

3 12 0.00013 3.7 8.4 0.4 26 48 97 119 89 122 0.85

4 12 1.1e-06 0.031 15.1 0.1 25 49 156 180 147 184 0.87

5 12 0.0013 38 5.1 0.4 26 48 186 208 181 211 0.88

6 12 0.011 3.3e+02 2.2 0.0 22 48 237 263 229 267 0.82

7 12 0.012 3.4e+02 2.1 0.0 27 49 401 423 386 426 0.88

8 12 3.6e-05 1 10.2 0.2 26 49 458 481 455 484 0.90

9 12 0.0078 2.2e+02 2.7 0.2 26 48 487 509 482 512 0.87

10 12 0.083 2.4e+03 -0.6 0.3 26 48 517 539 510 545 0.88

11 12 0.013 3.8e+02 2.0 0.0 27 51 548 572 540 575 0.84

12 12 0.011 3.1e+02 2.2 0.2 26 46 612 632 599 636 0.84

#	of	c-Evalue	i-Evalue	score	bias	hmm coord from	hmm coord to	ali coord from	ali coord to	env coord from	env coord to	acc
1	12	0.14	3.9e+03	-1.3	0.1	26	49	7	30	2	33	0.80
2	12	0.073	2.1e+03	-0.4	0.0	23	48	62	88	46	93	0.79
3	12	0.00013	3.7	8.4	0.4	26	48	97	119	89	122	0.85
4	12	1.1e-06	0.031	15.1	0.1	25	49	156	180	147	184	0.87
5	12	0.0013	38	5.1	0.4	26	48	186	208	181	211	0.88
6	12	0.011	3.3e+02	2.2	0.0	22	48	237	263	229	267	0.82
7	12	0.012	3.4e+02	2.1	0.0	27	49	401	423	386	426	0.88
8	12	3.6e-05	1	10.2	0.2	26	49	458	481	455	484	0.90
9	12	0.0078	2.2e+02	2.7	0.2	26	48	487	509	482	512	0.87
10	12	0.083	2.4e+03	-0.6	0.3	26	48	517	539	510	545	0.88
11	12	0.013	3.8e+02	2.0	0.0	27	51	548	572	540	575	0.84
12	12	0.011	3.1e+02	2.2	0.2	26	46	612	632	599	636	0.84

Sequence Information

Coding Sequence: ATGTCTCAAGGCAGCTTTGTTTGTGACTATTGTAGTAGATCTTTCACAAGGAAATACAACCTGCAGACTCATATAGAAAACTGCCACATAACATCGTCGAGCTACTGCGATATTTGTGACCAGAAATTTGGGAGCCCCAGCGGCCTACAATTACACCTCTCTCGGGGCCACAACAGATATGGCCAGCCGTTCCCAGAATGCGACATCTGCGGAAGAATTTTCACAAGAAAACAGAATATAATGTCCCATATGCTCACTATGCATTTACAAGGGATAGGGCCGGCGATACAATGCCGAGCTTGTGGCAAAACCTTTACTACAGAACGTAATTTGAGGAGACACATAAAGCTATTACACAACCCTGATTTGGAATACCCCACCTGCGACGAATGCCACAAAACTTTTAAGAGCAAAAATTCACTTGTCGCTCACATACAGGCAGCTCACAACCACACCGATGGATCTAATCAGTGCCTCATGTGCGATAAAGTCTACACTAATAGTAGAAACCTGAAACGACACATAGAGATGTTACACGGAGAGAAAGAGGACCACAGATGCCATATTTGTCCTAAAGTCTACACGTCCAGTCAAAGCCTAAAGCGACATATCAGGACTATGCATAATCCTGACGAAGAAGGTCTCCAATGGGAGCAAAAAGCAAcagattttgaaaatattgacgGAAAGAGTAATGGTTCTAACGATAGCAACACGGTCACATGTGAAACTTGCTACAAACCGTTTCCAGAAGAGACTCTATTACGCCAGCATGTTAAAAACGAACATAGTTTCAAAATCTTTTATGAATACTGCAAACGGTATTTGGAGAAGTTTGCCCATACAGATGAGCAGATCACTAGCAGTCGGAACTTATTCAAATGTGAATTTTGCTTATCCGCTTACTTCAGTGTGTACGAACTGAAAGAGCACATGAAAGTTAATCACGATACTGAATACAATTTGTGCAATTGTAACGTCTGCTTTTCCAAGTTTTACAGTAAAGAAACGTTGATTGAACATAAGAAGATCTGCTTGCCGCCGCTAGATGTCAACTCTTGCAATCATTGCGATAAACTATTTACAGATATTTCTAGTTTAGAGTTCCACACAAGAATATTCCATCCCCAAGCTCAACTGGCTGATCCAAACATAAGCTCTACGAAGTCTGATGACGCTGCCGACTTCAGCTCGTTTAGATGTGACCGTTGCAACCGTATATACTACAGCGATAGATCTTTGAAGCATCACATAAAACTAAAACACACAACAGTTGAGGCAATGGAATGTGAATACTGTAGCAAAATCTGCAACAATAAATATTACCTCGCGTCCCATATAAAAATTGTCCACAGCGTTGTAGATTTATCCAAATGTGATTATTGCGATAAACTCTTCAAGTCCAAGCGCAATATTCGCAGGCATATAGAGTACACGCACATGGGAATGCAAAGATACAAGTGCATTGAATGCGAAACCCTTTTCAAAGAAAAGCGGAGTCTTCGCAAACATGTCCGAACGAAGCATCCTAATTCTACATCTTTTCCTCAATGTCATATCTGTCACAAAAGATTTGAGTCTGCAAAGTCCTGCAAGATACACTTAAAACTTTTACATTCTTTCAATATGAACACCTATCCATGCGACTTGTGTTCAGTGTCATTTGGGTCCAAAGAGGCTTTGAAAATTCATTTGGAAACGAAACATCTAGCCGAGGATGAGATTTACAAATGTGAAGAATGCAACTTGGTTTTTAAAGGGCCTCTGAAATTTGAAGAACATAACAATGCTACTCATTCTTGTGTTACCATTACAAAGCAGAAAGCTTTACCTTGCTGCGTGATTTGCATGAAAGACTTCAGCACACGGAAGACTTTGAGACGTCACATAAAGAAATTCCACGGAGAATTGTATGCAGAAGATCTTGCCAACTTTGGCTGTGGAAACCGAGCATCTAACGTTGATTGTGAAGATTGCTTGAAGAAGATCAACACTGAATACTACATcaacttatataataaaatcaagcATGATAAAAACTCTATAATATTCAAGTGTGAGACTTGTGACTCTACGTATAACACTGTACAGTTTGCGATACAGAGTTACAAAGTTGGTGATGGGAAACAGACGAAAGTGATCTTGAGTGATCTGTGTACGACTCAAATGAGCGAAGACGAAGCTAGTTATTCAGGATTCGGATCTCTACATGAGTACATGGAAGCAGAGAGTACAACCACAGACATCAAAGTCGGCTTGGAAGAAATAGACGCTAATATCATAGTGGGACTAGACGAAAATGATTCTGGGGAGATGTAA
Protein Sequence: MSQGSFVCDYCSRSFTRKYNLQTHIENCHITSSSYCDICDQKFGSPSGLQLHLSRGHNRYGQPFPECDICGRIFTRKQNIMSHMLTMHLQGIGPAIQCRACGKTFTTERNLRRHIKLLHNPDLEYPTCDECHKTFKSKNSLVAHIQAAHNHTDGSNQCLMCDKVYTNSRNLKRHIEMLHGEKEDHRCHICPKVYTSSQSLKRHIRTMHNPDEEGLQWEQKATDFENIDGKSNGSNDSNTVTCETCYKPFPEETLLRQHVKNEHSFKIFYEYCKRYLEKFAHTDEQITSSRNLFKCEFCLSAYFSVYELKEHMKVNHDTEYNLCNCNVCFSKFYSKETLIEHKKICLPPLDVNSCNHCDKLFTDISSLEFHTRIFHPQAQLADPNISSTKSDDAADFSSFRCDRCNRIYYSDRSLKHHIKLKHTTVEAMECEYCSKICNNKYYLASHIKIVHSVVDLSKCDYCDKLFKSKRNIRRHIEYTHMGMQRYKCIECETLFKEKRSLRKHVRTKHPNSTSFPQCHICHKRFESAKSCKIHLKLLHSFNMNTYPCDLCSVSFGSKEALKIHLETKHLAEDEIYKCEECNLVFKGPLKFEEHNNATHSCVTITKQKALPCCVICMKDFSTRKTLRRHIKKFHGELYAEDLANFGCGNRASNVDCEDCLKKINTEYYINLYNKIKHDKNSIIFKCETCDSTYNTVQFAIQSYKVGDGKQTKVILSDLCTTQMSEDEASYSGFGSLHEYMEAESTTTDIKVGLEEIDANIIVGLDENDSGEM

Similar Transcription Factors

Sequence clustering based on sequence similarity using MMseqs2

100% Identity: iTF_00033115;
90% Identity: iTF_00033115;
80% Identity: iTF_00033115;