Basic Information

Insect: Synanthedon formicaeformis
Gene Symbol: -
Assembly: GCA_945859765.1
Location: CAMAON010000091.1:212193-219785[+]

Transcription Factor Domain

TF Family: zf-GAGA
Domain: zf-GAGA domain
PFAM: PF09237
TF Group: Zinc-Coordinating Group
Description: Members of this family bind to a 5'-GAGAG-3' DNA consensus binding site, and contain a Cys2-His2 zinc finger core as well as an N-terminal extension containing two highly basic regions. The zinc finger core binds in the DNA major groove and recognises the first three GAG bases of the consensus in a manner similar to that seen in other classical zinc finger-DNA complexes. The second basic region forms a helix that interacts in the major groove recognising the last G of the consensus, while the first basic region wraps around the DNA in the minor groove and recognises the A in the fourth position of the consensus sequence [1].
Hmmscan Out: # of c-Evalue i-Evalue score bias hmm coord from hmm coord to ali coord from ali coord to env coord from env coord to acc

1 11 0.067 2e+02 2.4 0.0 26 52 176 202 170 203 0.86

2 11 3.7 1.1e+04 -3.1 0.0 27 44 287 304 285 309 0.80

3 11 0.12 3.6e+02 1.6 0.1 27 47 318 338 315 341 0.87

4 11 0.034 1e+02 3.4 0.0 24 47 346 369 343 372 0.86

5 11 0.03 89 3.6 0.0 27 49 380 402 378 404 0.93

6 11 0.018 54 4.2 0.0 24 49 439 464 435 469 0.89

7 11 0.0036 11 6.5 0.1 7 48 450 492 447 498 0.77

8 11 0.074 2.2e+02 2.3 0.0 21 48 493 521 485 525 0.78

9 11 0.0012 3.7 8.0 0.1 7 48 508 550 503 554 0.83

10 11 0.064 1.9e+02 2.5 0.1 24 48 555 579 547 583 0.79

11 11 2.1e-05 0.064 13.6 0.2 24 49 584 609 576 615 0.88

#	of	c-Evalue	i-Evalue	score	bias	hmm coord from	hmm coord to	ali coord from	ali coord to	env coord from	env coord to	acc
1	11	0.067	2e+02	2.4	0.0	26	52	176	202	170	203	0.86
2	11	3.7	1.1e+04	-3.1	0.0	27	44	287	304	285	309	0.80
3	11	0.12	3.6e+02	1.6	0.1	27	47	318	338	315	341	0.87
4	11	0.034	1e+02	3.4	0.0	24	47	346	369	343	372	0.86
5	11	0.03	89	3.6	0.0	27	49	380	402	378	404	0.93
6	11	0.018	54	4.2	0.0	24	49	439	464	435	469	0.89
7	11	0.0036	11	6.5	0.1	7	48	450	492	447	498	0.77
8	11	0.074	2.2e+02	2.3	0.0	21	48	493	521	485	525	0.78
9	11	0.0012	3.7	8.0	0.1	7	48	508	550	503	554	0.83
10	11	0.064	1.9e+02	2.5	0.1	24	48	555	579	547	583	0.79
11	11	2.1e-05	0.064	13.6	0.2	24	49	584	609	576	615	0.88

Sequence Information

Coding Sequence: ATGGCTGCAATATTAAACCAAACACAAACACCGTTATGCAGATGTTGTCACAAGAATGGCATATTCAAGAGTCTATTTTCCGACTATATCTACAACGAGAATGAGGTTGAAAATTATTCCCAGATGCTGCACGCTACATTCGGAATCTTATTTGAACCCTCGGAACGTGACAAAATATATACAATATGCGACGAGTGTATTGAAAAACTACGTATCTCAACGGATTTGAAGATTGCCTGTGGGAAAATTATTAAACAGGAGCCATTAATTGAAAATGATGTCCCAATTAAAATAGAGAAAATGTGGAGTTATGTTTGCAGCGATAAAGAAAGACAGTTGATTAAAGTTGAAAAGGAAGAGACTCCGACACCCAACGATGAAGACTCAGATAGAAATGTGGTTTTAGACGAAGTATCCAATCAAGATGGAATCAGAATTGAAAAGAGCGGAAACGTATTAGATGAAAACATCAGTGAATCTGAGAACGACAGACAGACATACACACATAAGGATGTGAGAAAGTTTAAGTGCTCAATATGTAATAATGGGTTTACACTGAGCAGAAGTTTGAAGGCTCACATGAAAACACACAAGGACGGAAAACCGCACGAGTGCCAAGAGTGCGGCCAGAAATTCAAAGTAAAAAATAGCTTATTGAGGCATCGTCAAAACATGCACAAAACAAACAAGTATCAGTGCGAAAAATGCAATAAATCGTTCAGAAGCAAATATGCTTTGGTAAGTCATAATAAAGTGCATGAGAAAAATGAGTCTTACAATTGTAACCTGCGTGAAAATAGATTCAAAAGAAGAGAAAATTTCAATAGACAAATGTTGACGCATGCTGAGATAAAAAAGTGCGATATTTGCAAAAAGACATTTAAATACAAACAGGGTTTAAGCAAGCACATGTTGGCTGTACATTTGGGCTTTCAGTTAACGCGCTTTGAATGCGACATTTGCAAAAAGACATATAAATACAAGCGAAGTCTACGTGACCACATGTTGGCTGTACATTTGGGCTTTCAGTTAACGCCCTTTGAATGCGACATTTGCAAAAAGACATATAAATACAAGCGAAGTCTACGCGACCACATGTTGGCTGTACATTTGGGCTTTGAGTTAACGCTCTTTGAATGCGACATTTGCAAAAAGACATATAAATACAAGCGAAGTCTACGCGACCACATGTTGGCCGTGCATTTTGACCCTGAATTAACGTCCTTTAAGTGCGACACTTGCAATAAGACATATAAATACAAGCGAAGTCTACACGAGCACATGTTCGCTGTGCATTTGGGCACTAATCCAACGCCCACTGAATGCGAAATTTGCAAAAAGACTTTTAAACACAAACAGAGTTTAAGCAAGCACTTGTCGGTTATACATTCGGACATTCCGCCCACTCAGTGCGACATTTGTAAAAAGACATTTAAACACAATTACAATTTAAGCAAGCACATGTCGGCTGTACATTCGGACCTTCCACCCACTCAGTGCGACATTTGCAAGAAGACATATAAAAATAAACAGGGTTTAAGCAAGCACATGTCGACTGCACATTCGGACCTTCCACCCACTCAGTGCGACATTTGCAATAAGACATTTAAAAATAAACACGGTTTAAGCAGGCACATGTCGACTGCACATTCGGACCTTCCACCCACTCAGTGCGACATTTGCAAAAAGACATTTAATTCCAAGCTTTATTTACGCAAGCACATGTCGGCTATACATTCGGACCTTCCTCCCGCTCGGTGCGACATTTGCAAAAAGACATTTAAATACAAACAGAATTTAAGAAGGCATATGTCGACTGTACATTTGGGCTTGAAGCCAACGACCGTTGCCAGTGAGTGCGACATGTGCAAGAAGACATTTAAATCCAAGCCTTATATACGCAAGCACATGTTGGCTGTACATTTGGGCTTGAAGAGAACACGCACTAAAAGAAAAGTTATTTAA
Protein Sequence: MAAILNQTQTPLCRCCHKNGIFKSLFSDYIYNENEVENYSQMLHATFGILFEPSERDKIYTICDECIEKLRISTDLKIACGKIIKQEPLIENDVPIKIEKMWSYVCSDKERQLIKVEKEETPTPNDEDSDRNVVLDEVSNQDGIRIEKSGNVLDENISESENDRQTYTHKDVRKFKCSICNNGFTLSRSLKAHMKTHKDGKPHECQECGQKFKVKNSLLRHRQNMHKTNKYQCEKCNKSFRSKYALVSHNKVHEKNESYNCNLRENRFKRRENFNRQMLTHAEIKKCDICKKTFKYKQGLSKHMLAVHLGFQLTRFECDICKKTYKYKRSLRDHMLAVHLGFQLTPFECDICKKTYKYKRSLRDHMLAVHLGFELTLFECDICKKTYKYKRSLRDHMLAVHFDPELTSFKCDTCNKTYKYKRSLHEHMFAVHLGTNPTPTECEICKKTFKHKQSLSKHLSVIHSDIPPTQCDICKKTFKHNYNLSKHMSAVHSDLPPTQCDICKKTYKNKQGLSKHMSTAHSDLPPTQCDICNKTFKNKHGLSRHMSTAHSDLPPTQCDICKKTFNSKLYLRKHMSAIHSDLPPARCDICKKTFKYKQNLRRHMSTVHLGLKPTTVASECDMCKKTFKSKPYIRKHMLAVHLGLKRTRTKRKVI

Similar Transcription Factors

Sequence clustering based on sequence similarity using MMseqs2

100% Identity: iTF_01386919;
90% Identity: iTF_01386919;
80% Identity: iTF_01386919;