Basic Information

Insect: Xanthostigma xanthostigma
Gene Symbol: -
Assembly: GCA_963575645.1
Location: OY754468.1:1404228-1409148[-]

Transcription Factor Domain

TF Family: zf-GAGA
Domain: zf-GAGA domain
PFAM: PF09237
TF Group: Zinc-Coordinating Group
Description: Members of this family bind to a 5'-GAGAG-3' DNA consensus binding site, and contain a Cys2-His2 zinc finger core as well as an N-terminal extension containing two highly basic regions. The zinc finger core binds in the DNA major groove and recognises the first three GAG bases of the consensus in a manner similar to that seen in other classical zinc finger-DNA complexes. The second basic region forms a helix that interacts in the major groove recognising the last G of the consensus, while the first basic region wraps around the DNA in the minor groove and recognises the A in the fourth position of the consensus sequence [1].
Hmmscan Out: # of c-Evalue i-Evalue score bias hmm coord from hmm coord to ali coord from ali coord to env coord from env coord to acc

1 15 0.0033 2.5 8.8 0.0 21 47 188 214 180 220 0.85

2 15 2.4 1.8e+03 -0.4 0.0 22 49 217 244 214 249 0.77

3 15 0.32 2.5e+02 2.4 0.0 21 45 244 268 237 273 0.88

4 15 1.3 9.7e+02 0.5 0.0 21 43 340 362 328 367 0.85

5 15 0.0082 6.2 7.5 0.1 21 52 368 399 365 401 0.89

6 15 1.2 9e+02 0.6 0.1 21 31 396 406 394 422 0.82

7 15 1.4 1e+03 0.4 0.1 21 32 424 435 412 449 0.73

8 15 0.00081 0.62 10.7 0.0 21 46 667 692 659 699 0.85

9 15 2.5 1.9e+03 -0.4 0.1 21 48 695 722 692 728 0.74

10 15 2.7 2.1e+03 -0.5 0.1 21 45 723 747 704 758 0.80

11 15 3.7 2.9e+03 -1.0 0.0 21 44 764 787 747 791 0.70

12 15 0.81 6.2e+02 1.1 0.0 21 48 819 845 807 850 0.83

13 15 0.0098 7.5 7.3 0.1 21 52 847 878 845 880 0.88

14 15 1.5 1.2e+03 0.3 0.1 21 31 875 885 871 900 0.83

15 15 0.32 2.4e+02 2.4 0.1 21 43 903 925 892 930 0.79

#	of	c-Evalue	i-Evalue	score	bias	hmm coord from	hmm coord to	ali coord from	ali coord to	env coord from	env coord to	acc
1	15	0.0033	2.5	8.8	0.0	21	47	188	214	180	220	0.85
2	15	2.4	1.8e+03	-0.4	0.0	22	49	217	244	214	249	0.77
3	15	0.32	2.5e+02	2.4	0.0	21	45	244	268	237	273	0.88
4	15	1.3	9.7e+02	0.5	0.0	21	43	340	362	328	367	0.85
5	15	0.0082	6.2	7.5	0.1	21	52	368	399	365	401	0.89
6	15	1.2	9e+02	0.6	0.1	21	31	396	406	394	422	0.82
7	15	1.4	1e+03	0.4	0.1	21	32	424	435	412	449	0.73
8	15	0.00081	0.62	10.7	0.0	21	46	667	692	659	699	0.85
9	15	2.5	1.9e+03	-0.4	0.1	21	48	695	722	692	728	0.74
10	15	2.7	2.1e+03	-0.5	0.1	21	45	723	747	704	758	0.80
11	15	3.7	2.9e+03	-1.0	0.0	21	44	764	787	747	791	0.70
12	15	0.81	6.2e+02	1.1	0.0	21	48	819	845	807	850	0.83
13	15	0.0098	7.5	7.3	0.1	21	52	847	878	845	880	0.88
14	15	1.5	1.2e+03	0.3	0.1	21	31	875	885	871	900	0.83
15	15	0.32	2.4e+02	2.4	0.1	21	43	903	925	892	930	0.79

Sequence Information

Coding Sequence: ATGTTAATGGCGTGTGCTTCAGTTCAGGCATCTGAAGGAGACGGTTTACCCAGTAAAATGTGTTTCTCTTGCATTGCACAAATGAATcaagcattttctttcaaaagaCAGTGTGAAGAAGCTGACGCAAATTTTCGTTTGTACCTTTTCAATCGCATATCTAGCGAACAGAAAAAATCTGACACTGACGAAATAAAGAAAGAAATTAAGGTGGAAGAGCTGCAATTAAATGAGACTGGTGATGAAAATATAGTTGAATATGACAATCCCttagatttatataaaatgAGTCCAAATGAAAATAATTCAGATAATCAAGAAAAGGAAGGAATCGTACAAATAGCGaaacttaaaaaagacagaaaaacACAACGCAAAAAAACGaacataatgaaaaaaaataacaacgaaTGTCAAAATTGCAATCTTCAGTTTGATACACGAGCTGAATATCTAGATcacgtaaaaaacaaaaaacatcaaCGACGATTACATCCTTGTAGcatatgcaataaaaaatttacaggTTTTCGTCTTAAAGAACACATGAGAATACACACTCAGGAAAAACCTTTTACATGCAACATTTGTGGTGTAAAATTCAGCCTTGCTGGTAATTTGACACGACATATGAAGATACATACCGGGGAACGTCCTCGTAAGTGTCATGTTTGTGGTAAAGGGTTCATTCGATCGACAACCCTTGTTGAACATCTCAGAACACATACTGGGGAGAAACCGTTCGTTTGCAGTACTTGCGGGAAGAAATTCACACAATCAAGCCAGTTGTCAAATCACCTAAGGAAGCATGATTTAAAAGGTGATGATAATAAACATGTTAAACTAAAACGGAATGACCCGAAGCCAACTTGCAAGATATGTGGTAAATTGTTTTCAACTAATGCCACAATGAAAACACATATGTTAATACATGGCCCGAAGAAGTTTTTATGCAGTAATTGCGGAAGAGGTTTTTCTAGCCAGCCAGGCTTGCAGTCTCATATGAAACtacatacaggtgagaaaccatatccgTGCCAAACTTGCGGGAAATTATTTAGACAAATAAGCGGTTTAAAATCACATCAATTAATCCATACGGGAGAAAAACCGCACGTTTGTAAAATATGCGATAAGTCTTTTACCCAGAGCAACCACTTGAAGTATCATGTTCGTATACATAATGGGGAGAAGCCCCACACCTGTTCTGTTTGCAATAAAAGTTTTACACTGAACGGAACTTTGACGGTTCATATGAGAACACACACGGGAGAGACCCCCTATTTGTGTCCGGTTTGCGGAAAAGGATTTTATGATTCTAGCAGAGAAttgcaacacatttttattactaGAATAGAAGATAACCGTTTAACATTATCGGAAATGCTAGAGGCGTGTGCTTCAGTTCAGgtatcTGAAGGAGACGGTTTACCCAGTAAAATGTGTTTCTCCTGCATTGAACAAATGAATcaagcattttctttcaaaagaCGTTGTGAAGAATCTGATGCAAACCTTCGTTTGTACCTTTTCAATGGAATATCAAGCGAacagaaaaaatcatacactgTAGAAAACAAGATGGAGGATATCCACTTAGAAGAATTAAATGATATCGGCGACGGAAATATAATCGAATATGGCAGTCCTTTAGATTTAAATGATATGGTATCGAAGGAACAGGAAAAATCTGACAATGACGTAATAAAGAAAGAAATCAAGGTGGAAGAGCTGCAATTAAATGAGACTGGTGATGAAAATATAGTCGAATATGACAATCCCttagatttatataaaatgtttccAAATGAAAATAATTCAGATAATCAAGAAAAGGATGGCATCGTACAAATAGCGAAagttaaaaaagacagaaaaacACGAGCTGAATATCTAGATCACGTAAAAAACAAACATCAACGACGATTACATCCTTGTAGcatatgcaataaaaaatttacaagtttTCGTCTTAAAGAACACATGAGAATACACACTCAGGAAAAACCTTTTACATGCAACATTTGTGGTGTCAAATTCAGACTTGTTGGTAATTTGACACGACATATGATGATCCATACCGGGGAACGTCCACATAAGTGTCATATTTGCGATAAAGCGTTCAATCGACCGGCAACGCTTGCTGATCATGTGAGAATACATACTGGGGAGAAACCGTTCGTTTGCAGTACTTGCGGGAAGAAATTCGCACAAAAATGCAAGTTGTCAAATCACCTAAGAAAGCATGATTTGAAAGGTGGTGATAATAAACCTGTTAAACTAAAGCCGAATGACCCGAAGCCAACTTGCAAGATATGTGGTAAATTGTTTTCAACTAACGCTACAATGAAAAAGCATATGTTAATACATGGCCCGAAGAAGTTTTTATGCAGTAATTGCGGAAGAGGTTTTTCAAACCAGCCAGGCTTGCAGTCTCATATGAAAGTACATacgggtgagaaaccatatccgTGCCAAACTTGCGGgaaattatttagaaaaataagcGGTTTGAGAACACATGAATTAATCCATACGGGAGAAAAACCGCACGTTTGTAAAATATGCGATAAGTCTTTTACCCAGAGCAACACTTTGAAGTATCATGTTCGTATACATAATGGGGAGAAGCCCTACACCTGTTCTGTTTGCAATAAAAGTTTTACACTGAACGGAACTTTGACCGTTCATATGAGAACACACACGAGAGAGACCCCCTATTTTTGTCCGATTTGCGGAAAAGGGTTTTATCATTCTGGCAGTATGAAAAAACATtgtataaaacataaaattgaggacaatcttaaaataaaatgtgataaatcgtaa
Protein Sequence: MLMACASVQASEGDGLPSKMCFSCIAQMNQAFSFKRQCEEADANFRLYLFNRISSEQKKSDTDEIKKEIKVEELQLNETGDENIVEYDNPLDLYKMSPNENNSDNQEKEGIVQIAKLKKDRKTQRKKTNIMKKNNNECQNCNLQFDTRAEYLDHVKNKKHQRRLHPCSICNKKFTGFRLKEHMRIHTQEKPFTCNICGVKFSLAGNLTRHMKIHTGERPRKCHVCGKGFIRSTTLVEHLRTHTGEKPFVCSTCGKKFTQSSQLSNHLRKHDLKGDDNKHVKLKRNDPKPTCKICGKLFSTNATMKTHMLIHGPKKFLCSNCGRGFSSQPGLQSHMKLHTGEKPYPCQTCGKLFRQISGLKSHQLIHTGEKPHVCKICDKSFTQSNHLKYHVRIHNGEKPHTCSVCNKSFTLNGTLTVHMRTHTGETPYLCPVCGKGFYDSSRELQHIFITRIEDNRLTLSEMLEACASVQVSEGDGLPSKMCFSCIEQMNQAFSFKRRCEESDANLRLYLFNGISSEQKKSYTVENKMEDIHLEELNDIGDGNIIEYGSPLDLNDMVSKEQEKSDNDVIKKEIKVEELQLNETGDENIVEYDNPLDLYKMFPNENNSDNQEKDGIVQIAKVKKDRKTRAEYLDHVKNKHQRRLHPCSICNKKFTSFRLKEHMRIHTQEKPFTCNICGVKFRLVGNLTRHMMIHTGERPHKCHICDKAFNRPATLADHVRIHTGEKPFVCSTCGKKFAQKCKLSNHLRKHDLKGGDNKPVKLKPNDPKPTCKICGKLFSTNATMKKHMLIHGPKKFLCSNCGRGFSNQPGLQSHMKVHTGEKPYPCQTCGKLFRKISGLRTHELIHTGEKPHVCKICDKSFTQSNTLKYHVRIHNGEKPYTCSVCNKSFTLNGTLTVHMRTHTRETPYFCPICGKGFYHSGSMKKHCIKHKIEDNLKIKCDKS

Similar Transcription Factors

Sequence clustering based on sequence similarity using MMseqs2

100% Identity: iTF_01530491;
90% Identity: iTF_01530491;
80% Identity: iTF_01530491;