Basic Information

Transcription Factor Domain

TF Family: zf-GAGA
Domain: zf-GAGA domain
PFAM: PF09237
TF Group: Zinc-Coordinating Group
Description: Members of this family bind to a 5'-GAGAG-3' DNA consensus binding site, and contain a Cys2-His2 zinc finger core as well as an N-terminal extension containing two highly basic regions. The zinc finger core binds in the DNA major groove and recognises the first three GAG bases of the consensus in a manner similar to that seen in other classical zinc finger-DNA complexes. The second basic region forms a helix that interacts in the major groove recognising the last G of the consensus, while the first basic region wraps around the DNA in the minor groove and recognises the A in the fourth position of the consensus sequence [1].
Hmmscan Out: # of c-Evalue i-Evalue score bias hmm coord from hmm coord to ali coord from ali coord to env coord from env coord to acc

1 4 0.013 73 4.4 0.2 22 48 185 211 176 215 0.87

2 4 5.6e-05 0.31 12.1 0.0 21 51 212 242 209 243 0.88

3 4 0.027 1.5e+02 3.5 0.1 21 46 240 265 238 268 0.91

4 4 0.00028 1.5 9.8 0.1 21 47 268 294 266 301 0.88

#	of	c-Evalue	i-Evalue	score	bias	hmm coord from	hmm coord to	ali coord from	ali coord to	env coord from	env coord to	acc
1	4	0.013	73	4.4	0.2	22	48	185	211	176	215	0.87
2	4	5.6e-05	0.31	12.1	0.0	21	51	212	242	209	243	0.88
3	4	0.027	1.5e+02	3.5	0.1	21	46	240	265	238	268	0.91
4	4	0.00028	1.5	9.8	0.1	21	47	268	294	266	301	0.88

Coding Sequence: ATGCATATAAAAAGTCTGCAACATGCTCATGCTGCTGCAGCAGCGGCAGCCATGCCAAACTGTGAAATTGTAATCGTATCATCTTCGCCTAatcataataacaacaacaataataacaataatgataGTACAAATGGGGGATCGAGTAATGGCAGTGGAGGCGGTGGTGGTGGCGCTAACAACGGTCACCAgcaccaacaacagcaacatggTTCCTCAGCCCCAACACCCACTGAGATTCCAATACCGTTTATGCATTTGGCAGGAGTGACAGCAGAGGCTCATGCTGCCGCCCAAGCGGCTGCTATGGCAGCAGCACAAGCGGCGGCCGCTCAAGCAGCTGCTGCTGAACAAGGAGGCGGTGCACCACCACCGGGCAGTGCTCTGGCCCACCATCATGCCATATTGCAGCAACATCCCCTAGCACATCTGGTGGCCACGGCTGCGCACAGTCCTGCTTTATCCGAACAACACTTTATAGCCCGCGATGCTACCGTCTTGACTAATGGCCATAATGGCAACTCAACGTCGGTGTCGGGTGGACCCGCCCCCGAAAAACCATTTCAGTGTAATGTCTGCGAACGACGCTTCCGCCAATTGAGTACTCTCACAAATCATGTAAAAATCCATACTGGAGAAAAGCCGTACAAATGTAATGTTTGTGATAAAACCTTTCGTCAATCGTCCACTTTGACTAATCACTTGAAAATACATACCGGTGAGAAGCCATTTAATTGTACCTATTGTCCAAAACATTTTCGCCAATTGAGTACATTAACAAATCATTTGAAAATTCATACAGGTGAAAAACCCTTTGAATGTGCCGTTTGTAAAAAACAATTCCGTCAATCTAGTACTCTGAATAATCACATAAAAATCCATGTTATGGACAAAGTTTACGTGCCCGTAAAGATTAAAACTGAGGAGGAGGAAGGGTGA
Protein Sequence: MHIKSLQHAHAAAAAAAMPNCEIVIVSSSPNHNNNNNNNNNDSTNGGSSNGSGGGGGGANNGHQHQQQQHGSSAPTPTEIPIPFMHLAGVTAEAHAAAQAAAMAAAQAAAAQAAAAEQGGGAPPPGSALAHHHAILQQHPLAHLVATAAHSPALSEQHFIARDATVLTNGHNGNSTSVSGGPAPEKPFQCNVCERRFRQLSTLTNHVKIHTGEKPYKCNVCDKTFRQSSTLTNHLKIHTGEKPFNCTYCPKHFRQLSTLTNHLKIHTGEKPFECAVCKKQFRQSSTLNNHIKIHVMDKVYVPVKIKTEEEEG

Sequence clustering based on sequence similarity using MMseqs2

100% Identity: iTF_00655752;
90% Identity: iTF_00200194; iTF_01138375; iTF_01138628; iTF_01162599; iTF_00655752; iTF_00655560; iTF_01315150; iTF_01313416; iTF_01315820; iTF_01314960; iTF_01313241; iTF_01315993; iTF_01314330; iTF_01314143; iTF_00998023; iTF_00998211; iTF_01237103; iTF_01237317; iTF_01259503; iTF_01259743; iTF_00350464; iTF_01166032; iTF_01376913; iTF_01377127; iTF_01261554; iTF_01194928; iTF_01194685; iTF_01261341; iTF_00921624; iTF_00922373; iTF_00922574; iTF_00921760; iTF_01374629; iTF_00045794; iTF_01374402; iTF_00900203; iTF_00900011; iTF_00259437; iTF_00045610; iTF_00260336; iTF_00260090; iTF_00259232; iTF_01174737; iTF_01174533; iTF_01398897; iTF_01397874; iTF_01399128; iTF_01399806; iTF_00760436; iTF_00901140; iTF_00900945; iTF_01202135; iTF_01201932; iTF_01177272; iTF_00742235; iTF_00742434; iTF_01075038; iTF_01074828; iTF_01236088; iTF_01236322; iTF_00893210; iTF_00717102; iTF_00331995; iTF_00331801; iTF_01238012; iTF_01238221; iTF_01427741; iTF_01427950; iTF_00371583;
80% Identity: iTF_00200194;