Basic Information

Insect: Xanthostigma xanthostigma
Gene Symbol: -
Assembly: GCA_963575645.1
Location: OY754475.1:16981484-16983087[+]

Transcription Factor Domain

TF Family: zf-GAGA
Domain: zf-GAGA domain
PFAM: PF09237
TF Group: Zinc-Coordinating Group
Description: Members of this family bind to a 5'-GAGAG-3' DNA consensus binding site, and contain a Cys2-His2 zinc finger core as well as an N-terminal extension containing two highly basic regions. The zinc finger core binds in the DNA major groove and recognises the first three GAG bases of the consensus in a manner similar to that seen in other classical zinc finger-DNA complexes. The second basic region forms a helix that interacts in the major groove recognising the last G of the consensus, while the first basic region wraps around the DNA in the minor groove and recognises the A in the fourth position of the consensus sequence [1].
Hmmscan Out: # of c-Evalue i-Evalue score bias hmm coord from hmm coord to ali coord from ali coord to env coord from env coord to acc

1 10 6.6 5.1e+03 -1.8 0.0 27 43 225 241 222 247 0.77

2 10 0.036 28 5.5 0.2 21 44 247 270 244 279 0.87

3 10 0.76 5.8e+02 1.2 0.0 22 43 276 297 272 303 0.87

4 10 0.00013 0.097 13.3 0.1 21 44 303 326 292 331 0.89

5 10 0.018 14 6.4 2.2 21 45 331 355 328 363 0.85

6 10 0.91 7e+02 1.0 0.1 21 46 359 384 356 391 0.76

7 10 0.0016 1.2 9.8 0.0 23 43 389 409 384 415 0.89

8 10 0.0031 2.3 8.9 0.3 21 44 415 438 412 446 0.86

9 10 0.19 1.4e+02 3.2 0.1 23 43 445 465 441 470 0.89

10 10 0.0012 0.92 10.2 0.4 21 48 471 497 468 500 0.87

#	of	c-Evalue	i-Evalue	score	bias	hmm coord from	hmm coord to	ali coord from	ali coord to	env coord from	env coord to	acc
1	10	6.6	5.1e+03	-1.8	0.0	27	43	225	241	222	247	0.77
2	10	0.036	28	5.5	0.2	21	44	247	270	244	279	0.87
3	10	0.76	5.8e+02	1.2	0.0	22	43	276	297	272	303	0.87
4	10	0.00013	0.097	13.3	0.1	21	44	303	326	292	331	0.89
5	10	0.018	14	6.4	2.2	21	45	331	355	328	363	0.85
6	10	0.91	7e+02	1.0	0.1	21	46	359	384	356	391	0.76
7	10	0.0016	1.2	9.8	0.0	23	43	389	409	384	415	0.89
8	10	0.0031	2.3	8.9	0.3	21	44	415	438	412	446	0.86
9	10	0.19	1.4e+02	3.2	0.1	23	43	445	465	441	470	0.89
10	10	0.0012	0.92	10.2	0.4	21	48	471	497	468	500	0.87

Sequence Information

Coding Sequence: atgaagccTTTTAAAAAACTAGGAGAAGACTTAAGTAAACTCTGCAGAATATGTTTAACGCCAAATTTGAAAATGACTGGCATATTTCATTTCCCCCCCAAATTGGGAAGAGAAATAGCTGATTTAATAATGCAATGTGCCCCCGTTCAGATAAAGAGATACGATAATATGCCAACTTCGATCTGTCGATTATGTTACATTCAACTGAAAAAATTTCATAAGTTTCAAATACAAATCGTAAAATCTGACAAATCACTGCGATGCTATCAAAAGCAGCAAAATTTATCTGATCAGCCGATCAAACTAGAAAATTCGGCTGAAGAAGAAATGTCTGACAACCCCGTAAGCCAAACCTTTTCATCTGATGTCATCGTGAAATGTAAATCTTCAGAAGTTAGTTATACATTTGACGAGGCTTACAAATTAGAAAAGGTCTTTATTAAAGAAGAACCAACTGATGATACCTCATTGAATCAAATCGAATATACTGACGATGTAATTAACAGTTATTCTAATATTGATTGCAAGGAAAGCAGTAGAGAAGAAAGAAAGTTCGAAATTGGTGACACTAAAGTTGATCAAAACGTCGGATATCCTTGTCTTACAAACGATATAAAAATTTCTGAATGTTCCGATAAATGcgacattgaaaaaaataaaaaactatatcaATGTCACGCTTGCGAAATGTGTTTTAGAAAATCCAAAATACTAAATGAGCATAcattaatacatacaggagagaaaccgcatcggtgtgacatttgtaacaaGTATTATAGAAAATTAGGTCATTTAAAGAGACATAAGTTAAATCATACTGGAGacaaaccatatcagtgtgacgtttgtaaaatgtgtttcaaagAGTCTGGTACCTTAAAGAATCATGCATTAATTCATgcaggagagaaaccatatcagtgcgatatttgtaaaatatatttcaggCAGTCAAGTACTTTAAAAAGACATTATTTAACTCATACGAAAGAGAGACCTCACAGATGTGAAGTTTGTAATAGTTGTTTCAGGCAACCAGCTGCTTTAAACAgacataaattaatacatacgGGAGAGAAACCTCACCAGtgcaatatttgtgaaatgcgtTTCAGTGAATTCAGTGCTTTAAAGAAACACACGTACATCCATGAAGGAGTGAAACcctatcagtgtgacgtttgtaaaatgtGGTTCAGACAGTCAGATAATTTAAAGAAgcataaattaacacatacaggagagaaaccgcaccaatgtgatatttgtaaaatgtgtttcagacaaCCGGGTACTTTAAATagacataaattaacacataccGGAgtgaaaccataccagtgtgacgtttgtaaattgtttttcagacaattagaTACGCTGAATAGACATAAATTAacgcatacaggagagaaaccgcaccggtgtgacgtttgtgaaatgtgtttcagacagtcaaaacatttaaaaagtcataaattaaaacatacagtaGAGACGCTGTTCTAG
Protein Sequence: MKPFKKLGEDLSKLCRICLTPNLKMTGIFHFPPKLGREIADLIMQCAPVQIKRYDNMPTSICRLCYIQLKKFHKFQIQIVKSDKSLRCYQKQQNLSDQPIKLENSAEEEMSDNPVSQTFSSDVIVKCKSSEVSYTFDEAYKLEKVFIKEEPTDDTSLNQIEYTDDVINSYSNIDCKESSREERKFEIGDTKVDQNVGYPCLTNDIKISECSDKCDIEKNKKLYQCHACEMCFRKSKILNEHTLIHTGEKPHRCDICNKYYRKLGHLKRHKLNHTGDKPYQCDVCKMCFKESGTLKNHALIHAGEKPYQCDICKIYFRQSSTLKRHYLTHTKERPHRCEVCNSCFRQPAALNRHKLIHTGEKPHQCNICEMRFSEFSALKKHTYIHEGVKPYQCDVCKMWFRQSDNLKKHKLTHTGEKPHQCDICKMCFRQPGTLNRHKLTHTGVKPYQCDVCKLFFRQLDTLNRHKLTHTGEKPHRCDVCEMCFRQSKHLKSHKLKHTVETLF

Similar Transcription Factors

Sequence clustering based on sequence similarity using MMseqs2

100% Identity: -
90% Identity: -
80% Identity: -