Basic Information

Insect: Eupithecia subumbrata
Gene Symbol: -
Assembly: GCA_949316285.1
Location: OX438645.1:18483045-18488887[+]

Transcription Factor Domain

TF Family: zf-GAGA
Domain: zf-GAGA domain
PFAM: PF09237
TF Group: Zinc-Coordinating Group
Description: Members of this family bind to a 5'-GAGAG-3' DNA consensus binding site, and contain a Cys2-His2 zinc finger core as well as an N-terminal extension containing two highly basic regions. The zinc finger core binds in the DNA major groove and recognises the first three GAG bases of the consensus in a manner similar to that seen in other classical zinc finger-DNA complexes. The second basic region forms a helix that interacts in the major groove recognising the last G of the consensus, while the first basic region wraps around the DNA in the minor groove and recognises the A in the fourth position of the consensus sequence [1].
Hmmscan Out: # of c-Evalue i-Evalue score bias hmm coord from hmm coord to ali coord from ali coord to env coord from env coord to acc

1 11 0.0011 20 6.3 0.0 26 40 44 58 36 63 0.86

2 11 0.02 3.5e+02 2.3 0.0 22 52 231 261 224 263 0.86

3 11 0.12 2.2e+03 -0.2 0.1 22 44 259 281 255 289 0.82

4 11 0.0025 43 5.3 0.0 21 45 314 338 300 343 0.80

5 11 0.3 5.3e+03 -1.4 0.0 22 44 399 421 397 425 0.81

6 11 0.018 3.1e+02 2.5 0.3 21 43 426 448 420 454 0.85

7 11 0.003 52 5.0 0.1 21 46 514 539 506 545 0.85

8 11 0.018 3.1e+02 2.5 0.0 21 46 542 567 538 573 0.84

9 11 0.0025 43 5.3 0.0 20 45 569 594 559 598 0.86

10 11 0.094 1.6e+03 0.2 0.2 22 34 599 611 593 625 0.71

11 11 0.0019 32 5.7 0.1 21 43 626 648 618 652 0.88

#	of	c-Evalue	i-Evalue	score	bias	hmm coord from	hmm coord to	ali coord from	ali coord to	env coord from	env coord to	acc
1	11	0.0011	20	6.3	0.0	26	40	44	58	36	63	0.86
2	11	0.02	3.5e+02	2.3	0.0	22	52	231	261	224	263	0.86
3	11	0.12	2.2e+03	-0.2	0.1	22	44	259	281	255	289	0.82
4	11	0.0025	43	5.3	0.0	21	45	314	338	300	343	0.80
5	11	0.3	5.3e+03	-1.4	0.0	22	44	399	421	397	425	0.81
6	11	0.018	3.1e+02	2.5	0.3	21	43	426	448	420	454	0.85
7	11	0.003	52	5.0	0.1	21	46	514	539	506	545	0.85
8	11	0.018	3.1e+02	2.5	0.0	21	46	542	567	538	573	0.84
9	11	0.0025	43	5.3	0.0	20	45	569	594	559	598	0.86
10	11	0.094	1.6e+03	0.2	0.2	22	34	599	611	593	625	0.71
11	11	0.0019	32	5.7	0.1	21	43	626	648	618	652	0.88

Sequence Information

Coding Sequence: ATGTCTGTTTGCAGAATGTGTTTACTTGGCAATGTTACACTGAAACCCATATTTAACTCACAATTACAAGAATTGTTTGAATTGCTTTCAAACAACAAGTTGAACACAGAAGATCACAGACCTGAATCATTATGCTATGTTTGCTATGCTCTGCTGAGGAGAAGCCATAAATTAATGACTGTCTCCAGAAAAGCTGAACAGATACTTAATAAACTCTACTGTAATGGCTTGATGGTCACTCCAGCAGCAGTAACATTACTAAATGGAGGCCTTCCCCTTGTCACTGCAGCAGCTACTATACAACCTGTTACAATCCACCAATACCCTGAGGATACCGAGGAAAACTGTCAGGTCAAAAGGGAACCTGATGATGATAGCAATGATGTTGAATGGTTCCTTGAGGAagttaaaaatgattttgatGAAGAGACTGCAACTGTGATTAAAGACGAACACACGGGAACTCACGCGGAAAACCAAATATTCATTGAACCTTACAATGTGAAACAGGAGGCGACCAACCcgccaattaaaaaaattaaaacaaaagccCCTGTGAAATCTAAAGtgaagaaaattaatattcacCATGGGGAAAAATCGTTTAAATGTAGTGTTTGTGGAGAAACTTTCAGCCAAATGTATCTCTTCAAGTTACATAAACGACAACATTTACGTAAAACTAGAGTATCCCACCCACTGGCCTGCACATTCTGTGATAAAATCGTAGTGGATAAGTATGAACTGGAAAAACATCTCTTATTGCATGAGGGAAAGAAACCATATTCCTGCAACATATGCAGCAAGACTTATTCTAGCAAATATGTCCTAAAACGTCATCACAAAACTCATTCAGGACAACGACCTTATCTCTGCGGCGCGTGCGGCAAATCTTTTGCAGAGAAAGGAGACCTTAAAAAACACATGAGAATCCATTCCGGAGAAAAACCCTTCACCTGCAAAATATGTCTGAAACAGTTCaccgaaaactataaattaaaatcacaCATGAGCATCCATGAAGGCAAAGAGTTCATATGCAAATTGTGTGATAAACCCTTTCCTGAGAGGCATCAACTGAAACGGCATGTTAGTAGAATGCATGCAAACAATAAGCGATACGCGTGTGAATATTGCGATAagaaattttatgaaaacaacCAACTGCTGagtcatttaaaaattcacaCAGGAGATAAACCTTATTCCTGTGACGTatgcaaaaaaacatttaatgaCAAGCGCCGTCTAATCGTACATTTCAGATATCACAGCGGCGAAAGGCCGTACAGCTGCAAAATATGTGATACAAGATTTGTCTCCAGCACTATTTTAAGAAATCACAATCTAACACACACAGATGGGAAACTTTTCGCTTGTGATAGTTGTGAGAAGACCTTTACCGTTTTAGGCTATTTAAAAAGTcacttaaaaaaacatatacaAAGAAGAAAAGAAGGATCAGCGTGCGCTTGCGACCGTTGCGGGAAAACGTTTTACGACGCGAGCGTTCTAAAAAAACACATGAAAATTCACACCGGAGAAAGACCATACGCCTGTGATTCGTGCCATAAAACTTTCATTGAGAAGAGTAACTTGAAACGTCATATCCGAACGCACACGGAAGAAAAACCTTTCCGTTGTGACTTGTGTGACAAGTCATTTGCTGACAGCGGGAATTTGAAGACTCACAGACGGGTACACACTGGAGAAAAGCCATTTTCTTGCGACGCCTGTGGAAAAGGCTTCGCGCAGTCCACGTCATTAAAGAAACATCTGACAACACACACTGGCGAACGTCAATTTTCCTGTCCCATATGCAACAAAGCTTTCTCAGCTAAGAACAGCGTGAAAATACATATGAGAATTCACAGCGGGGAAAAGCCGTACACTTGCAATGTTTGCAGTAAATCTTTTTATGAGAGCAGCTCGCTGAGTAGGCATAAGAGAACACATGGAGGAGAAACCCCGTATATGTGTCTTATGTGTGACAAAACGTTTAGTAGGAAATCTTATTTGCAGCAGCATGTTGCGTTTTGTAAACGTTAG
Protein Sequence: MSVCRMCLLGNVTLKPIFNSQLQELFELLSNNKLNTEDHRPESLCYVCYALLRRSHKLMTVSRKAEQILNKLYCNGLMVTPAAVTLLNGGLPLVTAAATIQPVTIHQYPEDTEENCQVKREPDDDSNDVEWFLEEVKNDFDEETATVIKDEHTGTHAENQIFIEPYNVKQEATNPPIKKIKTKAPVKSKVKKINIHHGEKSFKCSVCGETFSQMYLFKLHKRQHLRKTRVSHPLACTFCDKIVVDKYELEKHLLLHEGKKPYSCNICSKTYSSKYVLKRHHKTHSGQRPYLCGACGKSFAEKGDLKKHMRIHSGEKPFTCKICLKQFTENYKLKSHMSIHEGKEFICKLCDKPFPERHQLKRHVSRMHANNKRYACEYCDKKFYENNQLLSHLKIHTGDKPYSCDVCKKTFNDKRRLIVHFRYHSGERPYSCKICDTRFVSSTILRNHNLTHTDGKLFACDSCEKTFTVLGYLKSHLKKHIQRRKEGSACACDRCGKTFYDASVLKKHMKIHTGERPYACDSCHKTFIEKSNLKRHIRTHTEEKPFRCDLCDKSFADSGNLKTHRRVHTGEKPFSCDACGKGFAQSTSLKKHLTTHTGERQFSCPICNKAFSAKNSVKIHMRIHSGEKPYTCNVCSKSFYESSSLSRHKRTHGGETPYMCLMCDKTFSRKSYLQQHVAFCKR

Similar Transcription Factors

Sequence clustering based on sequence similarity using MMseqs2

100% Identity: iTF_00700663;
90% Identity: iTF_00704245; iTF_00705648; iTF_00705281; iTF_00702197; iTF_00701279; iTF_00701633;
80% Identity: iTF_00704245;