Basic Information

Insect: Anopheles melas
Gene Symbol: -
Assembly: GCA_000473525.2
Location: KI922019.1:11687-24216[-]

Transcription Factor Domain

TF Family: zf-GAGA
Domain: zf-GAGA domain
PFAM: PF09237
TF Group: Zinc-Coordinating Group
Description: Members of this family bind to a 5'-GAGAG-3' DNA consensus binding site, and contain a Cys2-His2 zinc finger core as well as an N-terminal extension containing two highly basic regions. The zinc finger core binds in the DNA major groove and recognises the first three GAG bases of the consensus in a manner similar to that seen in other classical zinc finger-DNA complexes. The second basic region forms a helix that interacts in the major groove recognising the last G of the consensus, while the first basic region wraps around the DNA in the minor groove and recognises the A in the fourth position of the consensus sequence [1].
Hmmscan Out: # of c-Evalue i-Evalue score bias hmm coord from hmm coord to ali coord from ali coord to env coord from env coord to acc

1 12 1.5 4.7e+03 -2.4 0.0 13 30 45 62 36 64 0.80

2 12 0.00084 2.6 8.0 0.1 21 43 81 103 73 112 0.86

3 12 0.0017 5.2 7.1 0.2 23 47 111 135 107 141 0.83

4 12 0.0046 14 5.7 0.1 23 48 139 164 135 169 0.85

5 12 0.0054 17 5.4 0.1 23 48 167 192 165 197 0.84

6 12 0.0038 12 5.9 0.0 23 48 195 220 192 225 0.84

7 12 0.37 1.1e+03 -0.4 0.0 23 48 223 248 219 253 0.80

8 12 0.012 37 4.3 0.0 23 49 251 277 247 282 0.85

9 12 0.37 1.2e+03 -0.4 0.0 23 49 279 305 276 310 0.82

10 12 0.37 1.2e+03 -0.4 0.0 23 51 307 335 299 338 0.82

11 12 0.063 2e+02 2.0 0.0 23 52 335 364 332 365 0.85

12 12 0.03 94 3.1 0.0 23 46 363 386 359 389 0.87

#	of	c-Evalue	i-Evalue	score	bias	hmm coord from	hmm coord to	ali coord from	ali coord to	env coord from	env coord to	acc
1	12	1.5	4.7e+03	-2.4	0.0	13	30	45	62	36	64	0.80
2	12	0.00084	2.6	8.0	0.1	21	43	81	103	73	112	0.86
3	12	0.0017	5.2	7.1	0.2	23	47	111	135	107	141	0.83
4	12	0.0046	14	5.7	0.1	23	48	139	164	135	169	0.85
5	12	0.0054	17	5.4	0.1	23	48	167	192	165	197	0.84
6	12	0.0038	12	5.9	0.0	23	48	195	220	192	225	0.84
7	12	0.37	1.1e+03	-0.4	0.0	23	48	223	248	219	253	0.80
8	12	0.012	37	4.3	0.0	23	49	251	277	247	282	0.85
9	12	0.37	1.2e+03	-0.4	0.0	23	49	279	305	276	310	0.82
10	12	0.37	1.2e+03	-0.4	0.0	23	51	307	335	299	338	0.82
11	12	0.063	2e+02	2.0	0.0	23	52	335	364	332	365	0.85
12	12	0.03	94	3.1	0.0	23	46	363	386	359	389	0.87

Sequence Information

Coding Sequence: ATGCTCCAGCAGGATCATCTGGTTGACAATAAGCATTTTGTCGTGTCGCTATCCCTGGGCAATACGCTTATCAATCTCAACAAAATCAAGTGTCCACAGTGCCGGAAGCGTTTCGATACGATGGAGGAAATGGAACAGCATCGGACGAAGCATTTGACGGAGAACAAGTTTAAGTGCGAAATATGCAGCAAAGAATTTCCCAGCCATAGTTCCATGTGGAAGCACACCAAGGCACACACGGGCGAACGTCCTTTCGTTTGTCAGATTTGTAACAAAGGCTTCACGCAACTGGCCAACCTGCAACGACATGATCTCGTCCACAATGGATTAAAGCCGTTCAAGTGTCCCATCTGTGAAAAATGCTTTACCCAGCAAGCCAACATGCTGAAACATCAACTTCTGCATACCGGTCTTAAGCCGTACAAATGTCCGGTGTGCGAGAAAGCGTTCTCGCAACATGCAAACATGGTTAAACATCAAATGCTTCATACAGGATTAAAGCCGTACAAGTGTCCCGTTTGCGAAAAGGCATTTACGCAACACGCCAACATGATTAAACATCAAATGTTACATACTGGTCTCAAGCCATACAAATGTCCTGTTTGTGATAAAGCCTTTACGCAGCAGGCCAACATGGTGAAACATCAAATGTTGCACACCGGCCTTAAACCGTACAAATGTTCCACCTGCGGCAAGGCGTTCGCCCAGCAGGCCAACATGGTCAAACACGAGATGCTTCATACCGGTATTAAACCGTACAAGTGTCCCACCTGTGACAAAGCATTTGCCCAGCAAGCGAACATGATGAAGCATCAAATGTTGCACACGGGATTGAAGCCGTACAAGTGCGGCACGTGCGACAAAGCGTTTGCCCAGCAGGCCAATATGGTCAAGCATCAGATGCTGCATACCGGTTTAAAACCGTACAAATGCAATACCTGTGGCAAGGCATTCGCCCAGCAGGCCAACATGGTCAAACACGAGATGCTTCATACCGGAATAAAGCCATACAAATGCTCGGTTTGTGATAAAGCCTTTGCCCAGCAGGCCAACATGGTCAAACATCAGATGCTCCACAGCGGAATTAAACCATACAAATGTCCTACCTGCGACAAAGCATTTGCCCAGCAGGCGAACATGGTGAAGCATCAGATGCTCCATACGGTATATGTATTTGATTACTACAAGAATTCCACCTCACTTTCGAATGTAAACATTGTGAACTTTCACCATCCGCACATCTCCCACCTGCCGAACATATCGCACAAGATCCTGTCGCCGCTGTTCCACATTCCGCCGTTCAACAACAACCACAGCACATAA
Protein Sequence: MLQQDHLVDNKHFVVSLSLGNTLINLNKIKCPQCRKRFDTMEEMEQHRTKHLTENKFKCEICSKEFPSHSSMWKHTKAHTGERPFVCQICNKGFTQLANLQRHDLVHNGLKPFKCPICEKCFTQQANMLKHQLLHTGLKPYKCPVCEKAFSQHANMVKHQMLHTGLKPYKCPVCEKAFTQHANMIKHQMLHTGLKPYKCPVCDKAFTQQANMVKHQMLHTGLKPYKCSTCGKAFAQQANMVKHEMLHTGIKPYKCPTCDKAFAQQANMMKHQMLHTGLKPYKCGTCDKAFAQQANMVKHQMLHTGLKPYKCNTCGKAFAQQANMVKHEMLHTGIKPYKCSVCDKAFAQQANMVKHQMLHSGIKPYKCPTCDKAFAQQANMVKHQMLHTVYVFDYYKNSTSLSNVNIVNFHHPHISHLPNISHKILSPLFHIPPFNNNHST

Similar Transcription Factors

Sequence clustering based on sequence similarity using MMseqs2

100% Identity: iTF_00101359;
90% Identity: iTF_00104529; iTF_00095773; iTF_00096052;
80% Identity: iTF_00104529; iTF_00095773; iTF_00096052;