Basic Information

Insect: Coenonympha glycerion
Gene Symbol: -
Assembly: GCA_963855885.1
Location: OY979637.1:1102655-1105295[+]

Transcription Factor Domain

TF Family: zf-GAGA
Domain: zf-GAGA domain
PFAM: PF09237
TF Group: Zinc-Coordinating Group
Description: Members of this family bind to a 5'-GAGAG-3' DNA consensus binding site, and contain a Cys2-His2 zinc finger core as well as an N-terminal extension containing two highly basic regions. The zinc finger core binds in the DNA major groove and recognises the first three GAG bases of the consensus in a manner similar to that seen in other classical zinc finger-DNA complexes. The second basic region forms a helix that interacts in the major groove recognising the last G of the consensus, while the first basic region wraps around the DNA in the minor groove and recognises the A in the fourth position of the consensus sequence [1].
Hmmscan Out: # of c-Evalue i-Evalue score bias hmm coord from hmm coord to ali coord from ali coord to env coord from env coord to acc

1 5 3.6e-05 1 10.2 0.0 21 49 75 103 69 108 0.89

2 5 0.0004 11 6.8 0.0 21 49 156 184 150 189 0.88

3 5 0.0031 87 4.0 0.0 21 47 237 263 231 268 0.84

4 5 0.0022 62 4.5 0.0 21 48 318 345 307 348 0.82

5 5 0.0028 80 4.1 0.0 21 48 395 422 389 425 0.84

#	of	c-Evalue	i-Evalue	score	hmm coord from	hmm coord to	ali coord from	ali coord to	env coord from	env coord to	acc
1	5	3.6e-05	1	10.2	21	49	75	103	69	108	0.89
2	5	0.0004	11	6.8	21	49	156	184	150	189	0.88
3	5	0.0031	87	4.0	21	47	237	263	231	268	0.84
4	5	0.0022	62	4.5	21	48	318	345	307	348	0.82
5	5	0.0028	80	4.1	21	48	395	422	389	425	0.84

Sequence Information

Coding Sequence: ATGCTACCTACGAGTACCTCTTACAACTACGCCAACCTGTCCAAACATAAGCGCCTAATGCACATGAAGCTCAACAGTGTAACTCCTAACcgctatcccacttctgatcctGATTCTGAAATTCATTCAGAGGATCTTGATGAAGATGAATTTATAACAAGCGATgccattaataaaaataacaatttgaaCACGCTTATAGTCGATAGCAAGGGAGGATCAAATCAACAGCCCTGCAAATGTGCGGTTTGTCACAAAGCGTTCGACAACTACGCCAACCTGTCCAAACATATGCGCCTAATGCACATGAAGCTCAACAGTGTAACTCCTAACcgctatcccacttctgatcctGATTCTGAAATTCATTCAGAGGATCTTGGTGAAGATGAATTTATAACAAGCGATgccattaataaaaataacaatttgaaCACGCTTATAGTCGATAGCAAGGGAGGATCAAATCAACAGCCCTACAAATGTGCGGTTTGTCACAAAGCGTTCGACAACTACGCCAACCTGTCCAAACATAAGCGCCTAATGCACATGAAGCTCAACAGTGTAACTCCTAACcgctatcccacttctgatcctGATTCTGAAATTCATTCAGAGGATCTTGGTGAAGATGAATTTATAACAAGCGATgccattaataaaaataacaatttgaaCACGCTTATAGTCGATAGCAAGGGAGGATCAAATCAACAGCCCTACAAATGTGCGGTTTGTCACAAAGCGTTCGACAACTACGAAAACCTGTCCAAACATACGCGCCGAGTGCACATGAAAATCAATACTGTAACTATTAACCacaatcccacttctgatgctGATGCTGAAACTTATTCAGAGAATCTTGGTGAAgatgaaattataaaaagtgatgccattaataaaaacaacaatttgAACACGCCTAGAGTCGATAACAAGGCAGGATCGAATCAACAGCCCTACAAATGTGCGGTTTGTCACAAAACGTTCGGAAACAACGCCAACCTATCCAAACATAAGCGCCGAATGCACATGAAGCTCAATACTGAAACTTTTAACcataatcccacttctgatgctGATGCAGAGAATCTTGGTGAAgatgaaattattaaaagtgattccattaataaaaacaacaatttgAACACGCCTGCAATCGATAACAAGGCAGGATCAAATCAACAGCCCTACAAATGTGCGGTTTGTCACAAAGCGTTCGGCAACAACGCCAACCTATCCAAACATAAGCGCCGAATGCACATGAAGTTCAATACTGAAAATGTTAACCacaatcccacttctgatgctGATGCTGAAATTCATTCAGAGAATCTTGGCGAAGATGACTTTATAACAAGTGATGccattaataaaaacaacaatttgAACACGCCTACAGATAACAAGGCAGGATCGAATCAACGTAAACGCCCAAAAAAGATGGTgtctgaaaatataatttataaaaaacgcCATTCCACCTTTGATGTCAAAAATAATTTAGAGAGTATTAACGATGAAGAAGCTCTACAGAGTGACGCCATTGATAAATATAACAATTTGAACACACCTGAAATGGATAAAAAATTGGGAGAATCAAATGGACGTCAACGCCAAGCGAATATTATACTCACAAATAACCCCACGTCTGACGCTAAGCCTGAAAACCGTTCAAGGAATTTTGAAGAAGAtaaatttaaaacaagtcaTGGTCATTTAAAAGAGCCAAAAATGGAGAAAGTCGTTATATTGGATATCCAACATGTATATTATCCTATGCAAAATAACATGGTGAAGCAGGATCACATTGATATGGAGCCAGAGCCTATAGACCGCATTGATTTGGAGAAGGAGCTGCAGTTGATAGAGAATATTTCGAAGAGCGTGGATAACAAAGAAGCTGTGTATGGGGACGTGCTGTCAAATAGTAACACCTCTTTTGATTATGAAGGCATAGAAGGATTCTCCACTACAGGTTCCTCGGAACAAACCAACTACCCTCAGGAGTACGGGCCCGATTTCGCAGTCCAAGACTGCGGGATCCTCAACCTGGACGACCATATACTGCCCCACATCGATCCACTCCTCACCATCAAGACTGTGGACTATCCAACCCCCAACGGCTTCCTACCCCCAAACCACGAGGCTAGCAGCTATCAAGAATACCAAACCCCAATGTGGGAGCCCCCCATTTTCAAATGCCCGGATTACAACTACCACGGGACCAGCACGTACCAGGAATACCAAGCCCCAGGATGGGAGCCCCCAGTTTTCACCAAGGTATGTCCGGAGTACACATATTACGCGGACATGGCTGACTCGAACCGGGCCTCGATCATGAACACCGATATATTTTGA
Protein Sequence: MLPTSTSYNYANLSKHKRLMHMKLNSVTPNRYPTSDPDSEIHSEDLDEDEFITSDAINKNNNLNTLIVDSKGGSNQQPCKCAVCHKAFDNYANLSKHMRLMHMKLNSVTPNRYPTSDPDSEIHSEDLGEDEFITSDAINKNNNLNTLIVDSKGGSNQQPYKCAVCHKAFDNYANLSKHKRLMHMKLNSVTPNRYPTSDPDSEIHSEDLGEDEFITSDAINKNNNLNTLIVDSKGGSNQQPYKCAVCHKAFDNYENLSKHTRRVHMKINTVTINHNPTSDADAETYSENLGEDEIIKSDAINKNNNLNTPRVDNKAGSNQQPYKCAVCHKTFGNNANLSKHKRRMHMKLNTETFNHNPTSDADAENLGEDEIIKSDSINKNNNLNTPAIDNKAGSNQQPYKCAVCHKAFGNNANLSKHKRRMHMKFNTENVNHNPTSDADAEIHSENLGEDDFITSDAINKNNNLNTPTDNKAGSNQRKRPKKMVSENIIYKKRHSTFDVKNNLESINDEEALQSDAIDKYNNLNTPEMDKKLGESNGRQRQANIILTNNPTSDAKPENRSRNFEEDKFKTSHGHLKEPKMEKVVILDIQHVYYPMQNNMVKQDHIDMEPEPIDRIDLEKELQLIENISKSVDNKEAVYGDVLSNSNTSFDYEGIEGFSTTGSSEQTNYPQEYGPDFAVQDCGILNLDDHILPHIDPLLTIKTVDYPTPNGFLPPNHEASSYQEYQTPMWEPPIFKCPDYNYHGTSTYQEYQAPGWEPPVFTKVCPEYTYYADMADSNRASIMNTDIF

Similar Transcription Factors

Sequence clustering based on sequence similarity using MMseqs2

100% Identity: iTF_00354539;
90% Identity: iTF_00354539;
80% Identity: iTF_00354539;