Basic Information

Insect: Anopheles sinensis
Gene Symbol: -
Assembly: GCA_000441895.2
Location: KE525263.1:1128266-1139567[+]

Transcription Factor Domain

TF Family: zf-GAGA
Domain: zf-GAGA domain
PFAM: PF09237
TF Group: Zinc-Coordinating Group
Description: Members of this family bind to a 5'-GAGAG-3' DNA consensus binding site, and contain a Cys2-His2 zinc finger core as well as an N-terminal extension containing two highly basic regions. The zinc finger core binds in the DNA major groove and recognises the first three GAG bases of the consensus in a manner similar to that seen in other classical zinc finger-DNA complexes. The second basic region forms a helix that interacts in the major groove recognising the last G of the consensus, while the first basic region wraps around the DNA in the minor groove and recognises the A in the fourth position of the consensus sequence [1].
Hmmscan Out: # of c-Evalue i-Evalue score bias hmm coord from hmm coord to ali coord from ali coord to env coord from env coord to acc

1 13 0.0018 4 7.4 0.1 21 43 102 124 95 133 0.86

2 13 0.0035 7.8 6.5 0.2 23 47 132 156 128 162 0.83

3 13 0.0067 15 5.6 0.1 23 48 160 185 157 190 0.85

4 13 0.011 23 5.0 0.1 23 48 188 213 184 218 0.85

5 13 0.0052 11 6.0 0.1 23 52 216 245 212 247 0.87

6 13 0.96 2.1e+03 -1.3 0.0 23 48 244 269 241 274 0.80

7 13 0.03 66 3.5 0.0 23 49 272 298 263 303 0.86

8 13 0.81 1.8e+03 -1.0 0.0 23 48 300 325 297 330 0.82

9 13 0.87 1.9e+03 -1.2 0.0 23 51 328 356 324 358 0.81

10 13 0.12 2.7e+02 1.6 0.0 23 52 356 385 352 386 0.85

11 13 0.034 75 3.4 0.0 23 48 384 409 380 413 0.84

12 13 0.056 1.2e+02 2.7 0.0 21 45 410 433 408 439 0.87

13 13 0.00013 0.28 11.1 0.1 23 45 440 462 437 467 0.91

#	of	c-Evalue	i-Evalue	score	bias	hmm coord from	hmm coord to	ali coord from	ali coord to	env coord from	env coord to	acc
1	13	0.0018	4	7.4	0.1	21	43	102	124	95	133	0.86
2	13	0.0035	7.8	6.5	0.2	23	47	132	156	128	162	0.83
3	13	0.0067	15	5.6	0.1	23	48	160	185	157	190	0.85
4	13	0.011	23	5.0	0.1	23	48	188	213	184	218	0.85
5	13	0.0052	11	6.0	0.1	23	52	216	245	212	247	0.87
6	13	0.96	2.1e+03	-1.3	0.0	23	48	244	269	241	274	0.80
7	13	0.03	66	3.5	0.0	23	49	272	298	263	303	0.86
8	13	0.81	1.8e+03	-1.0	0.0	23	48	300	325	297	330	0.82
9	13	0.87	1.9e+03	-1.2	0.0	23	51	328	356	324	358	0.81
10	13	0.12	2.7e+02	1.6	0.0	23	52	356	385	352	386	0.85
11	13	0.034	75	3.4	0.0	23	48	384	409	380	413	0.84
12	13	0.056	1.2e+02	2.7	0.0	21	45	410	433	408	439	0.87
13	13	0.00013	0.28	11.1	0.1	23	45	440	462	437	467	0.91

Sequence Information

Coding Sequence: ATGTTCTACCCGCTGCAAAACACATTCGAGGATGGTGAAATCGAGCTGGGTCGTACGGAAATGCTTAACCACGATCAATTGACTGACAATAAGCACTCGTTGGCCTTGTCCCTCTCCCTGGGCAATACGCTCATCAATCTCAACAAAATCAAGTGTCCACAATGTCGGAAGCGTTTTGATACGATGGAAGAGATGCAGCAACATCGGACGAAGCATCTGACGGAGAACAAATTCAAGTGTGAAATTTGTAGCAAAGAATTTCCCAGCCATAGTTCCATGTGGAAGCATACCAAGGCTCACACTGGCGAAAGACCTTTCGTGTGCCAGATATGCAACAAGGGCTTTACTCAACTAGCCAACCTCCAACGACATGATCTCGTTCACAATGGACTGAAACCCTTCAAGTGTCCGATCTGCGAAAAATGTTTTACCCAACAGGCAAACATGCTCAAACATCAACTGCTGCACACTGGACTTAAACCATACAAATGTCCCGTGTGCCAGAAGGCATTTTCGCAACACGCAAACATGGTCAAACATCAAATGCTTCATACAGGTCTGAAGCCGTACAAGTGTCCAGTGTGCGAAAAGGCGTTCACTCAGCATGCCAACATGATAAAACATCAAATGCTGCATACCGGTCTCAAACCATACAAATGTCCTGTCTGCGAGAAAGCCTTCACTCAGCAGGCGAATATGGTCAAACATCAAATGTTACATACTGGTGTGAAGCCGTACAAGTGTGGCACCTGCGGCAAGGCCTTCGCTCAGCAGGCCAACATGGTCAAGCATGAGATGCTTCATACCGGTATTAAACCATACAAATGTCCAACTTGTGGCAAGGCGTTTGCCCAGCAGGCGAATATGATGAAACATCAGATGCTTCATACGGGACTTAAGCCGTACAAGTGCGGCACTTGCGACAAAGCATTCGCCCAGCAGGCCAACATGGTTAAACACCAGATGCTTCATACCGGTTTAAAACCGTACAAATGTGGCACCTGTGGCAAGGCATTCGCCCAACAGGCCAACATGGTCAAACACGAGATGCTTCACACCGGAGTAAAACCGTACAAATGTTCGGTTTGCGATAAAGCCTTTGCCCAGCAGGCAAACATGGTCAAACATCAGATGCTCCACAGCGGAATCAAACCGTACAAATGTCCAACCTGTGACAAAGCATTTGCCCAGCAGGCCAATATGGTGAAGCATCAGATGCTCCATACCGGAGAAAAACCATTCAAATGCAAAAGCTGTGATAAGGCTTTCTCGCAACGTGCCAATTTGAAGAAACACGAAATGGTACATCTCGGCATCCGGCCACACACCTGCCCCCTGTGCACGAAGTCCTACTCGCAGTATTCGAACCTGAAAAAGCATTTGCTCGTCCATCAGAAGCAGGCGTTGAAGCAGCAGCATCAAAACGGGCAAGTGATGGTCATACTCTACAACTGCCAAACGTGCAAGATGCAGTTCGAAGATATTATCGAATTCGAGCGGCACACCAAGCAATGTGATATCAACAACGGCCAGCAGCAGCATAGCGTGAAGCTGGAAACGATCAAGAGCGAAGTCGACATCGATGGCAGCTCGAGCTCTGGGATGCAGCAGCACCTGGCGACGTCCAGCAACGGTAGCAACGGCAGTGCGATCAACGTCAGCCAACCGCAGCAGCCCCCTCCAACGCCGATGCACATTCCATCGGCCATCCTTACCTCAGTCATTTCGTCGTCGATCGGTGCAAACGTGACCGCACATAACCTACCACCGACGGCACACTCCTCGCACGTGTCTCACATCCTGTCCCCGCTGTTCCACATTCCGCCGTTCAACAATAACCACAGCACATAA
Protein Sequence: MFYPLQNTFEDGEIELGRTEMLNHDQLTDNKHSLALSLSLGNTLINLNKIKCPQCRKRFDTMEEMQQHRTKHLTENKFKCEICSKEFPSHSSMWKHTKAHTGERPFVCQICNKGFTQLANLQRHDLVHNGLKPFKCPICEKCFTQQANMLKHQLLHTGLKPYKCPVCQKAFSQHANMVKHQMLHTGLKPYKCPVCEKAFTQHANMIKHQMLHTGLKPYKCPVCEKAFTQQANMVKHQMLHTGVKPYKCGTCGKAFAQQANMVKHEMLHTGIKPYKCPTCGKAFAQQANMMKHQMLHTGLKPYKCGTCDKAFAQQANMVKHQMLHTGLKPYKCGTCGKAFAQQANMVKHEMLHTGVKPYKCSVCDKAFAQQANMVKHQMLHSGIKPYKCPTCDKAFAQQANMVKHQMLHTGEKPFKCKSCDKAFSQRANLKKHEMVHLGIRPHTCPLCTKSYSQYSNLKKHLLVHQKQALKQQHQNGQVMVILYNCQTCKMQFEDIIEFERHTKQCDINNGQQQHSVKLETIKSEVDIDGSSSSGMQQHLATSSNGSNGSAINVSQPQQPPPTPMHIPSAILTSVISSSIGANVTAHNLPPTAHSSHVSHILSPLFHIPPFNNNHST

Similar Transcription Factors

Sequence clustering based on sequence similarity using MMseqs2

100% Identity: iTF_00107813; iTF_00402433; iTF_00401904; iTF_00400796; iTF_00401373; iTF_00098508; iTF_00098694; iTF_00107373; iTF_00107116;
90% Identity: iTF_00107813;
80% Identity: iTF_00107813;