Basic Information

Insect: Xanthostigma xanthostigma
Gene Symbol: -
Assembly: GCA_963575645.1
Location: OY754474.1:5775775-5780639[+]

Transcription Factor Domain

TF Family: zf-GAGA
Domain: zf-GAGA domain
PFAM: PF09237
TF Group: Zinc-Coordinating Group
Description: Members of this family bind to a 5'-GAGAG-3' DNA consensus binding site, and contain a Cys2-His2 zinc finger core as well as an N-terminal extension containing two highly basic regions. The zinc finger core binds in the DNA major groove and recognises the first three GAG bases of the consensus in a manner similar to that seen in other classical zinc finger-DNA complexes. The second basic region forms a helix that interacts in the major groove recognising the last G of the consensus, while the first basic region wraps around the DNA in the minor groove and recognises the A in the fourth position of the consensus sequence [1].
Hmmscan Out: # of c-Evalue i-Evalue score bias hmm coord from hmm coord to ali coord from ali coord to env coord from env coord to acc

1 25 0.26 2e+02 2.7 0.0 19 43 293 314 285 321 0.71

2 25 1.5 1.2e+03 0.3 0.0 26 47 325 346 322 351 0.84

3 25 0.048 37 5.1 0.1 21 43 348 370 345 376 0.90

4 25 0.044 34 5.2 0.1 21 44 376 399 373 407 0.87

5 25 0.049 38 5.0 0.0 21 48 404 430 401 432 0.88

6 25 0.055 42 4.9 0.6 21 43 432 454 427 465 0.85

7 25 0.00041 0.31 11.7 0.0 21 48 488 514 475 517 0.87

8 25 0.13 1e+02 3.7 0.2 22 43 664 685 656 691 0.75

9 25 0.055 42 4.9 0.1 21 47 691 717 688 723 0.85

10 25 0.64 4.9e+02 1.5 0.1 21 45 719 743 715 751 0.84

11 25 0.082 63 4.3 0.1 21 43 747 769 740 775 0.90

12 25 0.041 31 5.3 0.1 21 44 775 798 772 807 0.87

13 25 3.3 2.5e+03 -0.8 0.1 21 43 803 825 800 830 0.80

14 25 0.036 27 5.5 0.2 23 47 833 856 827 859 0.83

15 25 0.2 1.5e+02 3.1 0.2 19 43 1001 1022 993 1028 0.71

16 25 0.0068 5.2 7.8 0.1 21 43 1028 1050 1025 1056 0.89

17 25 0.00076 0.58 10.8 0.1 21 44 1056 1079 1052 1087 0.86

18 25 0.11 85 3.9 0.2 21 44 1084 1107 1081 1115 0.86

19 25 1 7.7e+02 0.9 0.1 22 43 1113 1134 1109 1139 0.77

20 25 0.00091 0.7 10.6 0.2 21 43 1140 1162 1134 1167 0.90

21 25 0.089 68 4.2 0.1 21 43 1168 1190 1166 1197 0.86

22 25 0.61 4.6e+02 1.5 0.0 21 48 1293 1319 1285 1325 0.84

23 25 7.1 5.5e+03 -1.9 0.0 21 32 1321 1332 1316 1347 0.75

24 25 4.6e-05 0.035 14.8 0.4 21 45 1349 1373 1338 1382 0.85

25 25 1.9 1.4e+03 -0.0 0.0 21 43 1377 1399 1374 1404 0.83

#	of	c-Evalue	i-Evalue	score	bias	hmm coord from	hmm coord to	ali coord from	ali coord to	env coord from	env coord to	acc
1	25	0.26	2e+02	2.7	0.0	19	43	293	314	285	321	0.71
2	25	1.5	1.2e+03	0.3	0.0	26	47	325	346	322	351	0.84
3	25	0.048	37	5.1	0.1	21	43	348	370	345	376	0.90
4	25	0.044	34	5.2	0.1	21	44	376	399	373	407	0.87
5	25	0.049	38	5.0	0.0	21	48	404	430	401	432	0.88
6	25	0.055	42	4.9	0.6	21	43	432	454	427	465	0.85
7	25	0.00041	0.31	11.7	0.0	21	48	488	514	475	517	0.87
8	25	0.13	1e+02	3.7	0.2	22	43	664	685	656	691	0.75
9	25	0.055	42	4.9	0.1	21	47	691	717	688	723	0.85
10	25	0.64	4.9e+02	1.5	0.1	21	45	719	743	715	751	0.84
11	25	0.082	63	4.3	0.1	21	43	747	769	740	775	0.90
12	25	0.041	31	5.3	0.1	21	44	775	798	772	807	0.87
13	25	3.3	2.5e+03	-0.8	0.1	21	43	803	825	800	830	0.80
14	25	0.036	27	5.5	0.2	23	47	833	856	827	859	0.83
15	25	0.2	1.5e+02	3.1	0.2	19	43	1001	1022	993	1028	0.71
16	25	0.0068	5.2	7.8	0.1	21	43	1028	1050	1025	1056	0.89
17	25	0.00076	0.58	10.8	0.1	21	44	1056	1079	1052	1087	0.86
18	25	0.11	85	3.9	0.2	21	44	1084	1107	1081	1115	0.86
19	25	1	7.7e+02	0.9	0.1	22	43	1113	1134	1109	1139	0.77
20	25	0.00091	0.7	10.6	0.2	21	43	1140	1162	1134	1167	0.90
21	25	0.089	68	4.2	0.1	21	43	1168	1190	1166	1197	0.86
22	25	0.61	4.6e+02	1.5	0.0	21	48	1293	1319	1285	1325	0.84
23	25	7.1	5.5e+03	-1.9	0.0	21	32	1321	1332	1316	1347	0.75
24	25	4.6e-05	0.035	14.8	0.4	21	45	1349	1373	1338	1382	0.85
25	25	1.9	1.4e+03	-0.0	0.0	21	43	1377	1399	1374	1404	0.83

Sequence Information

Coding Sequence: atggaacAGTTAAAAGTAATTGGTAATAGTATAACTCGAATGTGCAGATTATGTCTGTCACACGATGTGATTATGGATGACGTGTTTTGGTTTTCTTCCGAATTAGGAAAGAAAATAGCGGATATTATAATGGAATGTGCTCCGGTTCGAATTACCAGACAAGATAAGATGCCGACCTGTATTTGTCAATTATGTTTCAATCAACTGAAGAAATTTCACCAGTTTCAAATGCAAGCAGTGCGGTCTGATAGAACACTACAGCGCTATCTACATCAGTTGAGCGACTGTCGTCGTCACAACGAAGTTGAGTTGACCAACGACGAACAATCTGATAATTCCGAAAGTCAGACTTATAACACTGCTACGAAGTGTGACCCTTTGGAAATTAGCGATGAGTTTGataatttttcatcaaaacaTAAAGTGCTTGCAAATTTTACCTCAGTAAATAGAGTTAACGTggaaatatctttaaaatccgaaatcaaagacgaaccaatggatgataataattctttaattcTAACAGAGTGTGCTGACACAGCAGAAACTCTATCAATGTATGATAGTGGTAAAAACAGTTGCGAAGATTCAATGATCGAAGTTGGCGATACAAAAGTAGGAAACTTTGAGTGCCccattaaatttgaaattaatacgACAGAGAAAATACCCCTGAAAAAGAAAGAAACTTACATACCGTTAAAAGATGACGATAGTAGCCTGTGGTCTGAAAATGTTAAAGACGTCGAAGGTCTTCGTTCTTTTGAAGATAATTTGAACGGAACTGAACGTCCTagtaaacgtcaaaatttaaacGATAAATTACACGACTTTCACTCCGAACTTTTAAAACAATCAGCAACTTCTACTGAGAGTAAATCTCACCAATGCGATATTTGCCAAATGTGTTTCAGTAAGTCGGGCAATTTAAAGAATCATAAATTAACGCATACAGGAGTGAAACGGTacaagtgtgacatttgtcaaatgcgTTTCAGACATAGTGGTCTTTTAAAAAGTCATCTTTTAATACATTCAGGAgaaaaaccgtaccagtgtgacctttgtaaaatgtgttttagaCAATTGGGTCACTTAAAAAGACATAAATTAAtccatacaggagagaaaccatatcagtgtgacatttgtaaaatgtgtttcgcGGAGTCGAGTAAATTAAAGAGACATAGTTTCATAcacacaggagagaaaccataccagtgtgacatttgtaaaatgtgtttcacgGAGTCGGGTACTTTAAAGAGAcacaaattaaaacatacaggagagaaaccataccagtgtgacatttgtaaaacgTGTTTTAGACAATTGTGTCacttaaaaagtcataaattaacacatacaggagagaagccatatcagtgtgactttTGTAAAATGCGTTTCGCTGAGTTGGGTACATTAAAGAGACATAAATTCGTACATACCGGAGAGAAACcctaccagtgtgacatttgtaaaatgggTTTCAGACAAGCACAGAATTTTAAAAGGCATAAGTTAAAACATGCACAAAATTTTAgctcagtaaataaaataaacgaggAAATATCTCTTAAATCTGAATTTAAAAACGAACCAATGAAtgaaattaattcattaattctAGCTGAGACTGTTGAAACAGTAAAATCTCTATCAATTCATGACGGTAATGAAATCAGTTGCGAAGATTCAATGATCGAAATTGACGATACAAAAGTAGGAAACTTTGAGTGCCccattaaatttgaaattgataCGACAGAGAAAATACCCCTGAAAAAGGAAGAAACTTACATACCGTTAAAAGATGACGATAGTAGTCTGTGCCTCGATAATGTTAAAGACGTCGAAGGTCTTTGTTCTTTTGAAGATAATTTGAACAAAACCGAACATCCTagtaaacgtcaaaatttaaacGATAAATCACACGACTTTCGCGACTTGTTAAAACAATCAGCAAATTCTACTGAAAGTAAATCTCACCAATGTGACATTTGCCAAATGTGTTTCAAACAGTCTACGACTTTAAAGAATCATAAATTAacgcatacaggagagaaaccgcaccaatgtgacatttgtaaaatgcgTTTCAGACAAACTGGTCTTTTAAAAAGTCATATATTAATACATACAGGGgaaaaaccgtatcagtgtgacatttgtaaatatCGTTTTAGACTATTGGGTCACTTAAAAAGACATAAAGtaatacatacaggagagaaaccgtaccggtgtgacatttgtaaaatttgtttcaCGGAGTCGGGTTCTTTAAAAAGACATAATTTAATACATACCGGAGAGAAACCAttccagtgtgacatttgtaaaatgtgtttcagagAGGCGTCCAAGTTGAGAAGTCATAAATTCGTACATACCGGAGAGAAACcctaccagtgtgacatttgtaaaatgaattTCATACAACTGGCTCACTTAAAAACACATAAACTacaacatacaggagagaaacgattcgagtgtgatatttgtaaaaagtgtttctgtcaatctaagaatttaaaaatgcataaattgaAACATACACAATATTTAAgctcagtaaataaaattaacgaggAAATATCTCTTAAATCTGAATTTAAAAACGAACCAATGGatgaaaataattcattaattctAGCTGAGAGTGTTGAAACAGTAAAAACTCTATCAATTCATGACATAAATGAAATCAGTTGCGAAGATTCGATGATCGAATTTGGCGATACAAAAGTAGGAAACTTTGAGTGccccaaaaaatttgaaattgatgCGATAGAAAAAATACCCCTGAAAAAGGAAGAAACTTACATACCGTTAAAAGATGAAAATGTTAAAGACGTCGAAGGTCTTTGTTCTTTTGAAGATAATTTGAACGGAACCGAACACCCTagtaaacgtcaaaatttaaacGATAAATCACACGACTTTCGCGACGAATTGTTAAAACAATCAGCAACTTCTACTGAAAGTAAATCTCACCAATGCGATATTTGCCAAATGTGTTTCAGTAAGTCGAGCAATTTAAAGAATCATAAATTAacgcatacaggagagaaaccgcacCAGTGTGACATATGTCAAATGTTTTTCAGACAGTCTGCGACattaaataatcataaattaacgCATACAGTGgaaaaaccgtaccagtgtgacatttgtaaaatgtgttttagaCTATCGGGTAACTTAAAAAgacataaattaatacatacaggagagaaaccataccagtgtgacatttgtaaaaggTGTTTCGCGATGTCGCGTACTCTAAAGGCACATAAtttaatacatacaggagagaaaccacaccagtgtgacatttgtaaaatgtgttttagaCTATTggatcaattaaaaaatcataaattaacacatacaggGGAGAAACCATACGAGtgttatatttgtaaaatgcgttTCAGTCAATCACAGAATTTAAAAAGgcataaattaacacataccggagagaaaccccaccagtgtgacatttgtaaaaagggTTTTAGACGAGCACAGAATTTGATAGggcataaattaaaacatacacaATATTTTAgcttagtaaataaaattaacgaggAAATATCtctaaaatccgaaatcaaaaACGAGCCAATGGATGATAGTAATCCTTTAAGTCTAACAGAGTGTGCTGATACAGCAGAAACTCTATCTATGTGTGATGATGGAGAAATCAGTAGCGAAAATCCAATGTTCGAATTTTGCGATACTAAAGCGGGAAACGTTATTTGTcctattaaatttgaaaatgataTGACGTCCCAGAAATCTGAAGAAAATTACACACATTCAAAAAAACACGTTGTTACACATGCAGAAGAGAAGCCGTACAtgtgtgatatttgtaaaatgggTTTCAGAAAAATGGCTTACTTAAAAACTCATAAGctaaaacatacaggagaaaaaccgtaccagtgtgacatttgtaaaatgcgTTTTGCTGAGTTGGGTACTTTgaagaaacataatttaatacatacaggggagaaaccataccaatgtgacatttgtaaaatgtgtttcagacaagCACAGAATTTAAAAAgacataaattaatacatacaggagagaaaccataccagtgtgacatttgtaaaatgggTTTCACTCGATCGAATTATTTAAAGATTCATCAATTAAAACAcacgcaataa
Protein Sequence: MEQLKVIGNSITRMCRLCLSHDVIMDDVFWFSSELGKKIADIIMECAPVRITRQDKMPTCICQLCFNQLKKFHQFQMQAVRSDRTLQRYLHQLSDCRRHNEVELTNDEQSDNSESQTYNTATKCDPLEISDEFDNFSSKHKVLANFTSVNRVNVEISLKSEIKDEPMDDNNSLILTECADTAETLSMYDSGKNSCEDSMIEVGDTKVGNFECPIKFEINTTEKIPLKKKETYIPLKDDDSSLWSENVKDVEGLRSFEDNLNGTERPSKRQNLNDKLHDFHSELLKQSATSTESKSHQCDICQMCFSKSGNLKNHKLTHTGVKRYKCDICQMRFRHSGLLKSHLLIHSGEKPYQCDLCKMCFRQLGHLKRHKLIHTGEKPYQCDICKMCFAESSKLKRHSFIHTGEKPYQCDICKMCFTESGTLKRHKLKHTGEKPYQCDICKTCFRQLCHLKSHKLTHTGEKPYQCDFCKMRFAELGTLKRHKFVHTGEKPYQCDICKMGFRQAQNFKRHKLKHAQNFSSVNKINEEISLKSEFKNEPMNEINSLILAETVETVKSLSIHDGNEISCEDSMIEIDDTKVGNFECPIKFEIDTTEKIPLKKEETYIPLKDDDSSLCLDNVKDVEGLCSFEDNLNKTEHPSKRQNLNDKSHDFRDLLKQSANSTESKSHQCDICQMCFKQSTTLKNHKLTHTGEKPHQCDICKMRFRQTGLLKSHILIHTGEKPYQCDICKYRFRLLGHLKRHKVIHTGEKPYRCDICKICFTESGSLKRHNLIHTGEKPFQCDICKMCFREASKLRSHKFVHTGEKPYQCDICKMNFIQLAHLKTHKLQHTGEKRFECDICKKCFCQSKNLKMHKLKHTQYLSSVNKINEEISLKSEFKNEPMDENNSLILAESVETVKTLSIHDINEISCEDSMIEFGDTKVGNFECPKKFEIDAIEKIPLKKEETYIPLKDENVKDVEGLCSFEDNLNGTEHPSKRQNLNDKSHDFRDELLKQSATSTESKSHQCDICQMCFSKSSNLKNHKLTHTGEKPHQCDICQMFFRQSATLNNHKLTHTVEKPYQCDICKMCFRLSGNLKRHKLIHTGEKPYQCDICKRCFAMSRTLKAHNLIHTGEKPHQCDICKMCFRLLDQLKNHKLTHTGEKPYECYICKMRFSQSQNLKRHKLTHTGEKPHQCDICKKGFRRAQNLIGHKLKHTQYFSLVNKINEEISLKSEIKNEPMDDSNPLSLTECADTAETLSMCDDGEISSENPMFEFCDTKAGNVICPIKFENDMTSQKSEENYTHSKKHVVTHAEEKPYMCDICKMGFRKMAYLKTHKLKHTGEKPYQCDICKMRFAELGTLKKHNLIHTGEKPYQCDICKMCFRQAQNLKRHKLIHTGEKPYQCDICKMGFTRSNYLKIHQLKHTQ

Similar Transcription Factors

Sequence clustering based on sequence similarity using MMseqs2

100% Identity: -
90% Identity: -
80% Identity: -