Basic Information

Insect: Metallyticus violacea
Gene Symbol: -
Assembly: GCA_030762175.1
Location: CM060834.1:2545261-2576212[+]

Transcription Factor Domain

TF Family: zf-GAGA
Domain: zf-GAGA domain
PFAM: PF09237
TF Group: Zinc-Coordinating Group
Description: Members of this family bind to a 5'-GAGAG-3' DNA consensus binding site, and contain a Cys2-His2 zinc finger core as well as an N-terminal extension containing two highly basic regions. The zinc finger core binds in the DNA major groove and recognises the first three GAG bases of the consensus in a manner similar to that seen in other classical zinc finger-DNA complexes. The second basic region forms a helix that interacts in the major groove recognising the last G of the consensus, while the first basic region wraps around the DNA in the minor groove and recognises the A in the fourth position of the consensus sequence [1].
Hmmscan Out: # of c-Evalue i-Evalue score bias hmm coord from hmm coord to ali coord from ali coord to env coord from env coord to acc

1 11 0.25 1.9e+02 4.0 0.0 21 54 97 129 93 129 0.91

2 11 3.2 2.4e+03 0.5 0.0 23 44 126 147 122 152 0.84

3 11 0.45 3.5e+02 3.2 0.1 21 47 152 178 145 185 0.85

4 11 1 7.7e+02 2.1 0.0 23 43 182 202 179 208 0.89

5 11 0.019 15 7.6 0.1 21 43 208 230 205 239 0.88

6 11 0.7 5.3e+02 2.6 0.0 23 46 238 261 231 267 0.85

7 11 2 1.5e+03 1.2 0.0 23 43 266 286 262 292 0.86

8 11 0.0094 7.2 8.6 0.1 21 44 292 315 281 323 0.87

9 11 0.46 3.5e+02 3.2 0.1 24 47 323 346 318 352 0.84

10 11 0.99 7.6e+02 2.1 0.1 23 52 350 379 347 381 0.90

11 11 0.35 2.7e+02 3.6 0.4 23 44 406 427 396 432 0.89

#	of	c-Evalue	i-Evalue	score	bias	hmm coord from	hmm coord to	ali coord from	ali coord to	env coord from	env coord to	acc
1	11	0.25	1.9e+02	4.0	0.0	21	54	97	129	93	129	0.91
2	11	3.2	2.4e+03	0.5	0.0	23	44	126	147	122	152	0.84
3	11	0.45	3.5e+02	3.2	0.1	21	47	152	178	145	185	0.85
4	11	1	7.7e+02	2.1	0.0	23	43	182	202	179	208	0.89
5	11	0.019	15	7.6	0.1	21	43	208	230	205	239	0.88
6	11	0.7	5.3e+02	2.6	0.0	23	46	238	261	231	267	0.85
7	11	2	1.5e+03	1.2	0.0	23	43	266	286	262	292	0.86
8	11	0.0094	7.2	8.6	0.1	21	44	292	315	281	323	0.87
9	11	0.46	3.5e+02	3.2	0.1	24	47	323	346	318	352	0.84
10	11	0.99	7.6e+02	2.1	0.1	23	52	350	379	347	381	0.90
11	11	0.35	2.7e+02	3.6	0.4	23	44	406	427	396	432	0.89

Sequence Information

Coding Sequence: ATGAACACCAATGTGCCAATGAACAGCTCTCTGATACTTCCAGGAACATCAGAGGAATGTGGCAGACCTGTGAAATCTTTTGGTGACCTAGTGCATATGATACCAAACAGGTTGGGTATGCATGATTCTCCACAAGGACTGCACATGTGTTGGGCTTGTGGGGACAGATTCTTAGATCTGACTTCACTCAAGGAACACATCTATGTGCACACTGATGTCAAGGTGACTGAAACATTAGGCAAGCAAATGCCTATAATTCCTCAGGATTACCTGCAAGTAGACATAAATTCTGAAAGCCAACTTACATGCAACACGTGTGGTAAAATATTTGCTGATTTAGGAAATCTACATAAACATGAGGTGGTGCATCAAGTAAAACCTCATGTGTGTAACATCTGTGGGCGAGGCTTCAATgctgaaggaaatttaaaaaagcatgaGGTACTTCATGCTGGGGAAAGGCCCTACAAATGCAAGACTTGTGAAAAGACGTTTAGCCAACAAGGAAACCTCCACAAGCATGAACGAATACATACAGGCATAAAACCATATTCTTGTAGTGTTTGTGGCAAGCAGTTCTACCAACAAGGCAATCTGAAAAAGCATGAAGTAATACATACAGGAGAAAAACCTCACTCCTGTCGCATATGTGGCAAGTCTTTCTCTCAGCAGGGCAATATGAGAAAACATGAGCGTAGTCACACTGGCATTAAACCATATAGATGTGATATCTGTGGAAAAGGTTTCACACAAGCAGGAAATGTCAAGAAACACCAGATCCTCCACACAGGACAGATGCCCTACTCCTGCAAAGTCTGTGGCAAACCTTTCTATCAGGAGGGAAACTTGAAAAAGCATGAAGTAACTCACACTGGCGAGAAGCCATATTCTTGTAGCATCTGTTCCAAGCAATTTTCACAGCAAGGAAACATGCGTAAACATGAACGAGTGCATACAGGAATAAGGCCTTATGAGTGTAAAGTGTGTGGTAAATGCTTCACACAGCGGGGAAACCTTAAGAAACACGAGGTTCTGCACTCTGGTTTGAAGCCTTTCTGTTGCAAGACCTGTGGAAAGAGATTCAGCCAGGAAGTGAATCTTCAGAAACACAAGACTGTTCACACAGGGGCCAAACCTTACCCATGCAGGGTATGTGGACGGACATTTTCACAACTAGGCAACATGCTGAAGCATGCAGTGATACACACAGGTAGTAAACCATACCAGTGTAGACTGTGCAGCAAGAGATTCACACAACAAGGAAACCTGCGTAAACATCAGCTAGCCTGCCATTCTGGGATCAAGGCCCTTCTGGGATCATTGAGCACATCCTGTGATGGCAAGAGTTACATAGTGTTTCTCCAAATGGACAGCAACCCAGGACATGTGCAAGCTTTTCTGTCTGTGGCTGTACTGACAGAGTTGTTGTCCTGA
Protein Sequence: MNTNVPMNSSLILPGTSEECGRPVKSFGDLVHMIPNRLGMHDSPQGLHMCWACGDRFLDLTSLKEHIYVHTDVKVTETLGKQMPIIPQDYLQVDINSESQLTCNTCGKIFADLGNLHKHEVVHQVKPHVCNICGRGFNAEGNLKKHEVLHAGERPYKCKTCEKTFSQQGNLHKHERIHTGIKPYSCSVCGKQFYQQGNLKKHEVIHTGEKPHSCRICGKSFSQQGNMRKHERSHTGIKPYRCDICGKGFTQAGNVKKHQILHTGQMPYSCKVCGKPFYQEGNLKKHEVTHTGEKPYSCSICSKQFSQQGNMRKHERVHTGIRPYECKVCGKCFTQRGNLKKHEVLHSGLKPFCCKTCGKRFSQEVNLQKHKTVHTGAKPYPCRVCGRTFSQLGNMLKHAVIHTGSKPYQCRLCSKRFTQQGNLRKHQLACHSGIKALLGSLSTSCDGKSYIVFLQMDSNPGHVQAFLSVAVLTELLS

Similar Transcription Factors

Sequence clustering based on sequence similarity using MMseqs2

100% Identity: iTF_00995492;
90% Identity: iTF_00995492;
80% Identity: iTF_00995492;