Basic Information

Insect: Metallyticus violacea
Gene Symbol: -
Assembly: GCA_030762175.1
Location: CM060830.1:17447001-17475708[-]

Transcription Factor Domain

TF Family: zf-GAGA
Domain: zf-GAGA domain
PFAM: PF09237
TF Group: Zinc-Coordinating Group
Description: Members of this family bind to a 5'-GAGAG-3' DNA consensus binding site, and contain a Cys2-His2 zinc finger core as well as an N-terminal extension containing two highly basic regions. The zinc finger core binds in the DNA major groove and recognises the first three GAG bases of the consensus in a manner similar to that seen in other classical zinc finger-DNA complexes. The second basic region forms a helix that interacts in the major groove recognising the last G of the consensus, while the first basic region wraps around the DNA in the minor groove and recognises the A in the fourth position of the consensus sequence [1].
Hmmscan Out: # of c-Evalue i-Evalue score bias hmm coord from hmm coord to ali coord from ali coord to env coord from env coord to acc

1 11 0.86 6.5e+02 2.3 0.0 22 51 169 198 163 200 0.83

2 11 0.012 9.4 8.2 0.0 22 51 197 226 194 228 0.85

3 11 0.083 64 5.6 0.0 22 51 225 254 222 256 0.85

4 11 0.11 87 5.1 0.0 22 45 253 276 250 283 0.87

5 11 4.5 3.4e+03 0.0 0.0 26 44 285 303 279 309 0.87

6 11 0.0089 6.8 8.7 0.0 20 51 307 338 305 340 0.86

7 11 0.56 4.3e+02 2.9 0.0 22 48 337 363 334 367 0.84

8 11 0.12 91 5.1 0.0 22 49 365 392 362 396 0.87

9 11 0.087 66 5.5 0.1 22 52 394 424 391 425 0.88

10 11 0.11 81 5.2 0.3 17 52 417 452 413 453 0.85

11 11 0.92 7.1e+02 2.2 0.3 22 48 450 476 447 481 0.85

#	of	c-Evalue	i-Evalue	score	bias	hmm coord from	hmm coord to	ali coord from	ali coord to	env coord from	env coord to	acc
1	11	0.86	6.5e+02	2.3	0.0	22	51	169	198	163	200	0.83
2	11	0.012	9.4	8.2	0.0	22	51	197	226	194	228	0.85
3	11	0.083	64	5.6	0.0	22	51	225	254	222	256	0.85
4	11	0.11	87	5.1	0.0	22	45	253	276	250	283	0.87
5	11	4.5	3.4e+03	0.0	0.0	26	44	285	303	279	309	0.87
6	11	0.0089	6.8	8.7	0.0	20	51	307	338	305	340	0.86
7	11	0.56	4.3e+02	2.9	0.0	22	48	337	363	334	367	0.84
8	11	0.12	91	5.1	0.0	22	49	365	392	362	396	0.87
9	11	0.087	66	5.5	0.1	22	52	394	424	391	425	0.88
10	11	0.11	81	5.2	0.3	17	52	417	452	413	453	0.85
11	11	0.92	7.1e+02	2.2	0.3	22	48	450	476	447	481	0.85

Sequence Information

Coding Sequence: ATGGATGTCAAACTAGAAATAAAGGAAGAACCAGAGGACCCTAATACATATTCATTTGAATTGCAACCagaaataaaagaggaaactAATTATGATGCTACTCATGAGACTCTGTTGGAAAATGAGGAGGAGAAAGAGGTTGATATAGCTTTCATGAAGCAGGACATCTCAGTTGAGGGATTAACTTTTCCATACAGTGATCAAAGGTTCAAACCTGGTTCAGTTTCATCTCAGaatatatcaaacatttgtgGAGCTCTACCACCAACAAAAAGCAGTCTTTGCGATAAAATGTATCAGGGAGTTACAAATGAATACAGCAACTCTGAGAAAACAAATACTAAACTGACAATTAAGGAAGAGGTGCTGGACCGTAATATGGATACATATGAGTTAAAATCTGAAGCTGTGGAAGAGAACTCATATAAGGCTGCTCATAATACTGGGTTGGAGACTGAGGTAAAGGAATCAGCATTGTTAAATCATATTTCCATTCATGAAGGCAAAAAACCATACAAGTGTGAAGTATGCGGAAAGAGTTTTACTCAGACAGGTCATATGGgtagacatcttttgattcatgagggtaagaagccccataagtgtgaagtttgtggtaagagctttactCAGGCAGGTAATATGAggaaacatcttttaattcatgagggcaagaaaccacataaatgtgaagtttgtaacAAGAGCTTTACTCACACAGGTAATATGAggaaacatcttttaattcatgaaggcaaaaaacctcataaatgtgaagtgtgtggtAAGAGCTTTACTCAGGCAGGTACTctgaggaaacatcttttgattcacgaaGGCAAGAAACTttataagtgtgaaatttgtggaaaaagttTTACCCAGACATCTTATTTAAGAactcattttttaattcataacaGTAAGAAACCCCAtatgtgtgaagtttgtggtaagagctttactCAGGCAAGCAGtttgaggaaacatcttttgattcatgatggtaagaagcctcataaatgtgaggtttgtggtaagagctttactCAGGCAAGTAGTcaaaggaaacatcttttgattcatgaaggtaagaagcctcataaatgtgaactttgtgCTAAGAGCTTTACTCAAGCAGGTAGTCTGAGGACACATCTTTTGGTTGTTCATGAAGGCAAGAAAccccataagtgtgaaatttgtggaaaaagttTTTATCATGCATCTAAATTGAGGAAACATCTCTCAGTCCATGAGAGCAGGAAGCCACTTGAGTGTGAAGTTTGCGGGAAGAATTTTTATCATGCATCTAAactaaggaaacatcttttgattcacgaaTGCAAAAAACCACTTAAGTGTGAATTATGTGGGAAGAGGTTTTCCCATTCATCTACTCTAAggaatcatcttttgattcacgaggTCTGTAAGAACCCCAACTTTGGAGGAGGCCATAATCATATAGTTGAAGAACCATTCACCAGTGCATGTCCAATAGTTCATGCTATGGGAGCAATGCAGAGTACCTTGGAAGGTGTTATAGGAGGATGTACTTGA
Protein Sequence: MDVKLEIKEEPEDPNTYSFELQPEIKEETNYDATHETLLENEEEKEVDIAFMKQDISVEGLTFPYSDQRFKPGSVSSQNISNICGALPPTKSSLCDKMYQGVTNEYSNSEKTNTKLTIKEEVLDRNMDTYELKSEAVEENSYKAAHNTGLETEVKESALLNHISIHEGKKPYKCEVCGKSFTQTGHMGRHLLIHEGKKPHKCEVCGKSFTQAGNMRKHLLIHEGKKPHKCEVCNKSFTHTGNMRKHLLIHEGKKPHKCEVCGKSFTQAGTLRKHLLIHEGKKLYKCEICGKSFTQTSYLRTHFLIHNSKKPHMCEVCGKSFTQASSLRKHLLIHDGKKPHKCEVCGKSFTQASSQRKHLLIHEGKKPHKCELCAKSFTQAGSLRTHLLVVHEGKKPHKCEICGKSFYHASKLRKHLSVHESRKPLECEVCGKNFYHASKLRKHLLIHECKKPLKCELCGKRFSHSSTLRNHLLIHEVCKNPNFGGGHNHIVEEPFTSACPIVHAMGAMQSTLEGVIGGCT

Similar Transcription Factors

Sequence clustering based on sequence similarity using MMseqs2

100% Identity: iTF_00995500;
90% Identity: iTF_00995500;
80% Identity: iTF_00995500;