Basic Information

Transcription Factor Domain

TF Family: zf-GAGA
Domain: zf-GAGA domain
PFAM: PF09237
TF Group: Zinc-Coordinating Group
Description: Members of this family bind to a 5'-GAGAG-3' DNA consensus binding site, and contain a Cys2-His2 zinc finger core as well as an N-terminal extension containing two highly basic regions. The zinc finger core binds in the DNA major groove and recognises the first three GAG bases of the consensus in a manner similar to that seen in other classical zinc finger-DNA complexes. The second basic region forms a helix that interacts in the major groove recognising the last G of the consensus, while the first basic region wraps around the DNA in the minor groove and recognises the A in the fourth position of the consensus sequence [1].
Hmmscan Out: # of c-Evalue i-Evalue score bias hmm coord from hmm coord to ali coord from ali coord to env coord from env coord to acc

1 7 0.085 68 3.8 1.4 25 48 138 161 124 164 0.70

2 7 0.0013 1 9.6 0.1 20 48 162 190 159 192 0.89

3 7 0.0053 4.2 7.7 0.2 21 48 192 219 188 221 0.89

4 7 0.002 1.6 9.0 0.6 20 48 220 248 216 253 0.83

5 7 0.00093 0.73 10.1 0.2 19 48 248 277 245 282 0.85

6 7 0.0011 0.88 9.8 0.7 23 48 281 306 279 311 0.88

7 7 0.054 43 4.4 1.1 23 48 310 335 306 337 0.81

#	of	c-Evalue	i-Evalue	score	bias	hmm coord from	hmm coord to	ali coord from	ali coord to	env coord from	env coord to	acc
1	7	0.085	68	3.8	1.4	25	48	138	161	124	164	0.70
2	7	0.0013	1	9.6	0.1	20	48	162	190	159	192	0.89
3	7	0.0053	4.2	7.7	0.2	21	48	192	219	188	221	0.89
4	7	0.002	1.6	9.0	0.6	20	48	220	248	216	253	0.83
5	7	0.00093	0.73	10.1	0.2	19	48	248	277	245	282	0.85
6	7	0.0011	0.88	9.8	0.7	23	48	281	306	279	311	0.88
7	7	0.054	43	4.4	1.1	23	48	310	335	306	337	0.81

Coding Sequence: ATGATGGAGTGTGTCTACATTAAAGAAGAACACACAACTGATGATGAATATCCTCCTTCTTCTCCAGATGACGCTTCATCGATTGGAGATACCCCTCCAACAGAAGAAGAACCTCATCCCAACGTTGATCAGAGTCTCGCTTCCACTTCAGATGGGGAAGGCGTGATGGTCGAATGTCTGTTTGTTGAAGAAGAGCAAGAGTATGTTCCCCCATCTCCAGATCCATCATTAGTGGATGACGAACACCAAACTGAGGTCGACTATGGGTCATTGGAATCGAGCATCCTCTACAGCAGTGATGGAGCTATGGAGAATTGGACTGGGAGCAGTATGGCAGACACCCAGGGCTTTCCTATAGAAGATCAATATCCCAGAAAACCGTTGAGCAAGAAGCGTATAAGAAGCAAAGTTTACAATTGCCCTCATTGTGATTATAGAACTGTTAGGTCGAGCCATTTGAAAAGGCACGTTATAGCTAAGCACACTAGCGACAGGCCCCTCGGCTGCCCCCATTGCGGGTTCAGCACAGTCCAGTCTAGCTACTTGAAGCGGCATATCATCGCTCAGCACACCAATGAGAAACCGCTCACTTGTCAGTATTGTGACTTCAGCACAGTACACTCGAGCCACTTGAAGCGCCATATAATGGCAAAGCACACAAACGAAAGGCCCCTCACCTGCCCTCATTGCGACTACTGCGCTATTCAGGCTGTCAAACTCAAGAACCACATAATGTCTAAGCATACTCATGACAAGCCTTTCCCGTGTCCCCACTGTAGCTACAGCACTGTGCAATCCGATACGCTCAAGCGTCATATAATGGCTAAACATACCGATGTAAAACCACTCACTTGCCCACATTGTGACTATAGTACAGTTCAGTCGTGCATATTAAAGCGGCATATAGTCGCCAAACATACCAATTACAAGCCGCTCAGCTGCACTCACTGTAGTTATAGCACTGTTGATCCTAGCAATTTAAAGCGCCATATCAGGGCTAGGCATTCGTATGACTAA
Protein Sequence: MMECVYIKEEHTTDDEYPPSSPDDASSIGDTPPTEEEPHPNVDQSLASTSDGEGVMVECLFVEEEQEYVPPSPDPSLVDDEHQTEVDYGSLESSILYSSDGAMENWTGSSMADTQGFPIEDQYPRKPLSKKRIRSKVYNCPHCDYRTVRSSHLKRHVIAKHTSDRPLGCPHCGFSTVQSSYLKRHIIAQHTNEKPLTCQYCDFSTVHSSHLKRHIMAKHTNERPLTCPHCDYCAIQAVKLKNHIMSKHTHDKPFPCPHCSYSTVQSDTLKRHIMAKHTDVKPLTCPHCDYSTVQSCILKRHIVAKHTNYKPLSCTHCSYSTVDPSNLKRHIRARHSYD

Sequence clustering based on sequence similarity using MMseqs2