Basic Information

Insect: Synanthedon myopaeformis
Gene Symbol: -
Assembly: GCA_944738625.1
Location: CALYFO010001437.1:10063-14419[-]

Transcription Factor Domain

TF Family: zf-GAGA
Domain: zf-GAGA domain
PFAM: PF09237
TF Group: Zinc-Coordinating Group
Description: Members of this family bind to a 5'-GAGAG-3' DNA consensus binding site, and contain a Cys2-His2 zinc finger core as well as an N-terminal extension containing two highly basic regions. The zinc finger core binds in the DNA major groove and recognises the first three GAG bases of the consensus in a manner similar to that seen in other classical zinc finger-DNA complexes. The second basic region forms a helix that interacts in the major groove recognising the last G of the consensus, while the first basic region wraps around the DNA in the minor groove and recognises the A in the fourth position of the consensus sequence [1].
Hmmscan Out: # of c-Evalue i-Evalue score bias hmm coord from hmm coord to ali coord from ali coord to env coord from env coord to acc

1 9 0.21 1.1e+03 0.0 0.1 27 35 95 103 89 107 0.80

2 9 0.0031 16 5.9 0.1 19 48 186 217 179 224 0.78

3 9 0.0005 2.6 8.4 0.0 22 46 245 269 233 275 0.88

4 9 0.017 86 3.6 0.0 23 49 318 344 305 349 0.85

5 9 0.00078 4 7.8 0.0 24 49 350 375 347 377 0.92

6 9 0.1 5.2e+02 1.1 0.0 26 48 382 404 378 407 0.84

7 9 0.035 1.8e+02 2.5 0.2 21 48 407 434 403 439 0.81

8 9 0.016 82 3.6 0.0 24 48 440 464 436 467 0.88

9 9 0.012 60 4.1 0.1 23 49 469 495 464 497 0.84

#	of	c-Evalue	i-Evalue	score	bias	hmm coord from	hmm coord to	ali coord from	ali coord to	env coord from	env coord to	acc
1	9	0.21	1.1e+03	0.0	0.1	27	35	95	103	89	107	0.80
2	9	0.0031	16	5.9	0.1	19	48	186	217	179	224	0.78
3	9	0.0005	2.6	8.4	0.0	22	46	245	269	233	275	0.88
4	9	0.017	86	3.6	0.0	23	49	318	344	305	349	0.85
5	9	0.00078	4	7.8	0.0	24	49	350	375	347	377	0.92
6	9	0.1	5.2e+02	1.1	0.0	26	48	382	404	378	407	0.84
7	9	0.035	1.8e+02	2.5	0.2	21	48	407	434	403	439	0.81
8	9	0.016	82	3.6	0.0	24	48	440	464	436	467	0.88
9	9	0.012	60	4.1	0.1	23	49	469	495	464	497	0.84

Sequence Information

Coding Sequence: ATGCCAGCACCGCACTTTATTGGGACAGCGGTGGTAAGTGCGATGTCGCCTCCAGTAATACATATTAGCTCAATGACACAGACCACTGAGTTCATCACTCCACCAGGGGACATTATGCTTGGGTGGCTTCCTTTTCCGGGGAGGAAACGCAGCCTTGCACGCATTATCAATACATTCCGTATATTTACTTATCAGTTCCTCGCAACTCGTATGATTTCCAATCCAATTTCCATTCTCTCCAGGGGAATGGATCTTCTCACCGCTGACCCTCCATCGTTTTTATGTCCGCGCTGCTATTATGTTACGCAACGACATAAGAGCGGAGCGCTGCTCTGCCCATTCAGCCAAAGTGCGCTGCGCAGTGTCAACCGCGGAGCCACAATGAAATCACTCCTTGAAGTACCGTTGATTAAAGTCGACGTAAAAGTTGAAAAGGAAAAGCCTCCCACTCACAACGATGAAGACTATCGCTCAGATGTAAATGTGGTTTTAGATGAAGTATCCAATCAAGATGGCAGAATTGAAGAGAACCGAAACGAATTAGGTGAAACCTTCAGTCAATCTGAGAACGGCAGACACGAGAATAAATGCAATATTTGCAATAAAATTTTTAGGTCAAAAAAGTACCTAAAAAGTCACATCAAAACGCACTTTAAACATCGCTGTGAAGTATGCAATAGAGATTATCAGAGCAAAGGTGGATTACGTAGGCACGAAATTGTGCATAAGGATGAGAGAAAGTTTAAGTGCACAATATGTAATAATGGGTTTACACTGAGCAGAAATTTGAAGGCTCACATGGAAACACACAAGGACAGAACACCACACGAACACCGCAATAGACAAATGTTGACGCATGCTGATATAAAAGAGCGCGACATTTGCAAGAAAACATTTAAATCCAAGGACAGTATACAAAAGCACATGTCGGCTGTACATTCGGGCCTTAAGCCACCCACTCAGTGCGACATTTGCGAAAAGACATTTAAATCTAAGAAGATTATACGCAGCCACATGATGGTTGTGCATTTGGGCTTTAAACCAACGCCCACTGAGTGCAACATTTGCAAGAAGACATTTAAATACAAACAGAATTTAAGCAAGCACCTGTCTGTAGTACATTTGGACCTTTTGCCATCCACTCAGTGCGAAATTTGCAAGAAGTCATTTAAACACAAAGAGAGTTTAAGCAGGCACATGTCGGCTCTACATTCGGACCGTGAGCCACATACTCAGTGCGACATATGCAAGAAGACATTTAAACACAAACACAGTTTAAACAGGCATAAGTCGGCAGTACATTTGGGCATTAAGCCACCCACTCAGTGCGACATATGCAAAAAGACATTTAAACACAAAGAGAGTTTAAGCAGACACATGTCGGCTTTACATTCGGGCCGTGAGCCATCCACTGAGTGCGACATATGCAAGAAGACATTTAAACATAAACACAGCTTAAGCAGGCATAAGTCGGCTGTACATTTTGGCAATTAG
Protein Sequence: MPAPHFIGTAVVSAMSPPVIHISSMTQTTEFITPPGDIMLGWLPFPGRKRSLARIINTFRIFTYQFLATRMISNPISILSRGMDLLTADPPSFLCPRCYYVTQRHKSGALLCPFSQSALRSVNRGATMKSLLEVPLIKVDVKVEKEKPPTHNDEDYRSDVNVVLDEVSNQDGRIEENRNELGETFSQSENGRHENKCNICNKIFRSKKYLKSHIKTHFKHRCEVCNRDYQSKGGLRRHEIVHKDERKFKCTICNNGFTLSRNLKAHMETHKDRTPHEHRNRQMLTHADIKERDICKKTFKSKDSIQKHMSAVHSGLKPPTQCDICEKTFKSKKIIRSHMMVVHLGFKPTPTECNICKKTFKYKQNLSKHLSVVHLDLLPSTQCEICKKSFKHKESLSRHMSALHSDREPHTQCDICKKTFKHKHSLNRHKSAVHLGIKPPTQCDICKKTFKHKESLSRHMSALHSGREPSTECDICKKTFKHKHSLSRHKSAVHFGN

Similar Transcription Factors

Sequence clustering based on sequence similarity using MMseqs2

100% Identity: iTF_01387818;
90% Identity: iTF_01387818;
80% Identity: iTF_01387818;