Basic Information

Insect: Xanthostigma xanthostigma
Gene Symbol: -
Assembly: GCA_963575645.1
Location: OY754474.1:5701023-5703888[-]

Transcription Factor Domain

TF Family: zf-GAGA
Domain: zf-GAGA domain
PFAM: PF09237
TF Group: Zinc-Coordinating Group
Description: Members of this family bind to a 5'-GAGAG-3' DNA consensus binding site, and contain a Cys2-His2 zinc finger core as well as an N-terminal extension containing two highly basic regions. The zinc finger core binds in the DNA major groove and recognises the first three GAG bases of the consensus in a manner similar to that seen in other classical zinc finger-DNA complexes. The second basic region forms a helix that interacts in the major groove recognising the last G of the consensus, while the first basic region wraps around the DNA in the minor groove and recognises the A in the fourth position of the consensus sequence [1].
Hmmscan Out: # of c-Evalue i-Evalue score bias hmm coord from hmm coord to ali coord from ali coord to env coord from env coord to acc

1 8 0.00069 0.53 11.0 0.4 18 44 253 279 248 284 0.86

2 8 0.00052 0.4 11.4 0.1 21 43 284 306 282 312 0.90

3 8 0.023 17 6.1 0.1 21 44 312 335 309 343 0.86

4 8 0.22 1.7e+02 2.9 0.4 21 43 340 362 338 374 0.83

5 8 0.027 21 5.9 0.3 12 43 375 408 366 414 0.73

6 8 0.0049 3.7 8.3 0.0 21 44 414 437 411 442 0.91

7 8 0.00029 0.22 12.2 0.3 21 44 442 465 439 470 0.89

8 8 0.012 8.9 7.0 0.7 21 43 470 492 467 497 0.91

#	of	c-Evalue	i-Evalue	score	bias	hmm coord from	hmm coord to	ali coord from	ali coord to	env coord from	env coord to	acc
1	8	0.00069	0.53	11.0	0.4	18	44	253	279	248	284	0.86
2	8	0.00052	0.4	11.4	0.1	21	43	284	306	282	312	0.90
3	8	0.023	17	6.1	0.1	21	44	312	335	309	343	0.86
4	8	0.22	1.7e+02	2.9	0.4	21	43	340	362	338	374	0.83
5	8	0.027	21	5.9	0.3	12	43	375	408	366	414	0.73
6	8	0.0049	3.7	8.3	0.0	21	44	414	437	411	442	0.91
7	8	0.00029	0.22	12.2	0.3	21	44	442	465	439	470	0.89
8	8	0.012	8.9	7.0	0.7	21	43	470	492	467	497	0.91

Sequence Information

Coding Sequence: ATGCAACAATTAAAAGTAACTGATAATGGTTTTCACCAAATGTGCAGATTATGCCTATCAGGCGATCTGAGTAAAAcagacatatttttgttttcctcTGAATTTGGGAAACAAATAGCTGACATAATAATGGAATGTGTTCCCGTTCACATTACCAGACACGATAGGATGCCGGCCTGTATTTGTCAGTTATGTTTCACTCAACTGAAGAAATTTCACCAGTTTCAAATGCAAGCAGTACAATCTGATAGAACACTGCAGCGCTATCTACAGCCTTCGAGAGACTGTCATCCTCAGATCAATGTTGAATCGACCCTCGGAGAACAATCTAATAATTCCGTAAGTCGGAATTACAATGCTGAACCTTTCGAAAATAATGACGCAATTAATTTTGTCCATTCGAAATCGAAAgtacatgaaaataaatttaacgagggaatattttttaaatccgaaatcaaagacgagCCAATGGATGATGATTCATTATCTCCAACAGAGTGTGTTGACACACTGCAAATTTTATCTAAAGATGGCGGTAGCGAAGATTCAGTGACGGCTTTTGACGATACTAAAGCAGGTGTAGAAACGCCGAGAAATGTTGAGTGTATGACTGAGAAGATATTTGTGAAATCAGAAGAAACATACGAGTACTTACCGTTTAAAGATGGCGTCGAAGATAATTCGAACAGATCTGAACATCCTGGTGAAAATCAAACTTTCAACTTTCGaaagatattattaaaaaagtcagcGGCTTCAACTGAAAATAAACCTCACCGATgcgacatttgtcaaatgtgtttcagtaaatcgagcaatttaaaaagacATACATTAATACATACAGGGGAGAAACCCTACCAGTGTGAGATTTGTCAAATGCTTTTCAGAGAGGCgcgcaatttaaaaattcataatttaatacaCACCGGGGAGAAACCGTTCCAGTGTGAGATTTGCAAAATGTGTTTTAGAACGGCGCACACTTTAAAGAAACACAAtttaatacatacaggagagaaaccgtaccaatgtgacgtttgtcaaatgtgtttcagacataccatttcattaaaaaatcataaactaGAGCATACCGGAGAGAAACAACCTGGTAAACATCAAAAGTGTCGCGGCTTAAAGAAGTCGGCTGGTAAAAAAACTTACCAGTGTGGCGTTTGTCAAATGCGTTTCACCAAGtcgagcaatttaaaaagacATAACTTAATACATACAggggagaaaccgtaccagtgtgacatttgcaaACTGTGTTTCAATGAGTCGGGCAAtttaaagaaacatattttaatacataccggagagaaaccgtaccagtgtgagaTTTGCAAGAAGTGTTTCAGACAGTCGCAAACTTTAaagaaacataatttattacataCGGGGGAGAGGCCTTACAAGTGCagtatttgtaaaaagtgttacaGACGTTCAACGTCTCTAAAGAAACATAGTTTAGTTCACACAGAAGATAATCCATAA
Protein Sequence: MQQLKVTDNGFHQMCRLCLSGDLSKTDIFLFSSEFGKQIADIIMECVPVHITRHDRMPACICQLCFTQLKKFHQFQMQAVQSDRTLQRYLQPSRDCHPQINVESTLGEQSNNSVSRNYNAEPFENNDAINFVHSKSKVHENKFNEGIFFKSEIKDEPMDDDSLSPTECVDTLQILSKDGGSEDSVTAFDDTKAGVETPRNVECMTEKIFVKSEETYEYLPFKDGVEDNSNRSEHPGENQTFNFRKILLKKSAASTENKPHRCDICQMCFSKSSNLKRHTLIHTGEKPYQCEICQMLFREARNLKIHNLIHTGEKPFQCEICKMCFRTAHTLKKHNLIHTGEKPYQCDVCQMCFRHTISLKNHKLEHTGEKQPGKHQKCRGLKKSAGKKTYQCGVCQMRFTKSSNLKRHNLIHTGEKPYQCDICKLCFNESGNLKKHILIHTGEKPYQCEICKKCFRQSQTLKKHNLLHTGERPYKCSICKKCYRRSTSLKKHSLVHTEDNP

Similar Transcription Factors

Sequence clustering based on sequence similarity using MMseqs2

100% Identity: iTF_01531190;
90% Identity: iTF_01531190;
80% Identity: iTF_01531190;