Basic Information

Insect: Anoplophora glabripennis
Gene Symbol: -
Assembly: GCA_000390285.2
Location: NW:27892-32616[+]

Transcription Factor Domain

TF Family: zf-GAGA
Domain: zf-GAGA domain
PFAM: PF09237
TF Group: Zinc-Coordinating Group
Description: Members of this family bind to a 5'-GAGAG-3' DNA consensus binding site, and contain a Cys2-His2 zinc finger core as well as an N-terminal extension containing two highly basic regions. The zinc finger core binds in the DNA major groove and recognises the first three GAG bases of the consensus in a manner similar to that seen in other classical zinc finger-DNA complexes. The second basic region forms a helix that interacts in the major groove recognising the last G of the consensus, while the first basic region wraps around the DNA in the minor groove and recognises the A in the fourth position of the consensus sequence [1].
Hmmscan Out: # of c-Evalue i-Evalue score bias hmm coord from hmm coord to ali coord from ali coord to env coord from env coord to acc

1 10 0.48 1.4e+03 -0.8 0.1 25 43 174 192 168 197 0.86

2 10 5.4e-07 0.0016 18.3 0.0 21 49 289 317 284 322 0.92

3 10 0.0059 17 5.3 0.0 21 44 390 413 385 418 0.91

4 10 0.17 4.8e+02 0.7 0.1 27 46 455 474 450 482 0.85

5 10 0.28 8.1e+02 -0.0 0.3 21 44 477 500 458 508 0.84

6 10 0.023 67 3.4 0.2 10 48 493 532 485 534 0.82

7 10 0.00014 0.42 10.5 0.1 21 48 534 561 530 563 0.89

8 10 0.066 1.9e+02 2.0 0.0 24 44 806 826 799 832 0.85

9 10 0.018 51 3.8 0.0 21 52 915 946 912 948 0.88

10 10 0.0019 5.6 6.9 0.2 21 48 971 998 960 1003 0.88

#	of	c-Evalue	i-Evalue	score	bias	hmm coord from	hmm coord to	ali coord from	ali coord to	env coord from	env coord to	acc
1	10	0.48	1.4e+03	-0.8	0.1	25	43	174	192	168	197	0.86
2	10	5.4e-07	0.0016	18.3	0.0	21	49	289	317	284	322	0.92
3	10	0.0059	17	5.3	0.0	21	44	390	413	385	418	0.91
4	10	0.17	4.8e+02	0.7	0.1	27	46	455	474	450	482	0.85
5	10	0.28	8.1e+02	-0.0	0.3	21	44	477	500	458	508	0.84
6	10	0.023	67	3.4	0.2	10	48	493	532	485	534	0.82
7	10	0.00014	0.42	10.5	0.1	21	48	534	561	530	563	0.89
8	10	0.066	1.9e+02	2.0	0.0	24	44	806	826	799	832	0.85
9	10	0.018	51	3.8	0.0	21	52	915	946	912	948	0.88
10	10	0.0019	5.6	6.9	0.2	21	48	971	998	960	1003	0.88

Sequence Information

Coding Sequence: atgaataataaatatatgaatatttcAATTCACGATTTTTCAAGAATATGTCGGATCTGTCTATTATCCAATGAATCTAAAGTAACTTCAATAGAATCCTTAGATTTATATGTAAAAGTTACTAATATTCAGatAAAACAAGATGATAATCTTCCTAAAAATATATGTGAAACATGTGTGATCGAGTTGAAAAGTGTGGcatcttttatagaaaaatgtaaagaaatcGATATATTTTTAGTGTCAATTTTAGAGAAATCCAAACAAGGTAGCTTTAGCTACGATATACCCGATTATGAATCAGACTCTCACTCGTATGACGATCGTCCAataaaacttgaaaatgaagatTCATTTGCCGGTGCCAAAGACATTAAATTTGAAAGTGatacaaaaaatgtacaggttaattttaatgattctgtattaaaacattttcactGTGCAAATTGTGGGAAAGGATTCTGTACCAAAAGAGAATTAGTAGTACACATAAAGACCCATACGGAAACAAAATCGTTCACTTGTTCATTCTGCAGTATGAAGTTTAGATTTAGACAATCATTGCAAAGGCATCGTCTGATTCACAGTACCATAAGGTCCTATAATTGTGATATTTGTGGGAAAGGGTTCAAGAGGGCATTTTCAAGAAATAAGCACAGAAAGATTCATAACAGAGTAAAAATGCTTCTGGACACTGACCTTAAATACAGCTGTACTCAATGTGACAGAGTTCTAACCTCTCACTCGGCACTGAGCAGTCATATGAAAACTCACACCGGGGAAAAACCTTATTCTTGCACATATTGCGACAAACGTTTTCCTTATGTTAGCAGCTTAACCGTTCATACTCGCCTCCACACAGGTGAAACTCCTTTTGTGTGTCCAATATGCAATAAGGGCTACCGCAGCTCGACAAGTCTCAAAAAACATAAGGAAGTGAAACACTTTGAAATCGAAGATGTTAAACAAGAAGACGAGAACGACGACAGAAACGCAGATTCAGATAAAAGGGAAtgtaaaatttgtaacaaaatacTTCACAAACACGGGTTTGGTACACATATGAGAATTCATACAGTCGAGAAGAAGAAGTTCGTGTGTAcgttttgcaataaaaatttccagaaaaactccCACCTGGAGAGGCATATTAGGATACATACAGGGGAAAGGCCGTACGTCTGCAAACTGTGCAGTAAAACGTTCAAACAGGACGGAGACCTAAAACGCCACGTCCTAACGCACACCGGCGAGAAACTATTCCAATGCCAACACTGCGGCAAGCAATATTACACAAAAGGCTCGCTGGACACTCACATGACCGCCCACACGGGAATAAGGCGGCCGGTCAATTACGAGTGCAACATTTGCAAGAAATCATTCAGACAATGTACCCACTTCAAAACCCACATGAACTCTCACACTGGGGAAAAGCCTTATCTGTGTACGATATGCGGGAAGGCCTTCACCGCAAGCGGAACGTTAAAAGTGCACACTCGGATTCATACGGGGGAAACCCCGTTCGTTTGTTCGCACTGCAGCAAAGGGTACAATAATTCGAGCAGCTTGAAACGTCACATCATGAGGAATCATACGGGAGAGAAACCTTATGTTTGTATGATTTGTAACAAGGGTTTCCACGACTCCACTAATTTAAAGCGGCACATAAAACGTGTGCACTCCGTCGTAGAGATCAAGAAAGATAATGAGGTTGCAGATGCGACAAAATCTGTACTGATatgtgtcTGTTGCACTGTTATGGCaaataaagaaacaaatatCCACGTAGCCTATGAAGACTTTCCAGTAATCTGTAGAGTTTGTTTACTCTACAACGATGTACAaccttttgaaatgaaattattagaactttttaaagctataataaataattcagaagaggaaattgaagaaaaactgCCCCATAACATCTGCGAAATCTGTTTAGTGCAATTGAaagatttcgaaaattttattcataagTGTAGAATAAACGAAGCAACattaaaaagtgtatacttGGAAAGAAAGAATAAGTATGTTGATTCGTCGGATGCAGATAGTGACGTAGAAGACAAGTTTGATCCAGATTATGTAAAGTGTGAGGAGGAAGAAGAAACAATCAAAACTAATACTAAGTTAAATAGAAGAGAAGAGGTGCAATCAGACAGTGACAGTCCCGAGTCAAAAAAGCAATTAAGGAGAGCCCttagaaaaataaagaacaaagcAAACCCAGTAAAATgtgaaatatgcaataaaacgTTTTATGGAAAATCCGCTTTCGCCAATCACACTAGAACGCATAAACACAAACGAGAACACAAGAAATTCCTGTGCAACatatgtggaaaaaattttatcaagaATTCTCACTTGGAGAGGCACATCCGGACACATACCGGAATAAAACCTTACGAATGCAAAGACTGCGGGAAACACTTTGGTCAAAGTAACGATCTTAAAAGACACCTTCTAACACATACACGAGAGAAAGTGTTTCAATGTAACCAGTGTGAAAAAGCCTTTCATCAGAAATCCTGCTTGGACAACCACATATTAACACACACGAATGAAAGAAATTTCGAGTGCAGTTTTTGTGATAAAAAGTTTACGATGAAGGCTTACTTAGAGGTCCATACTAGAACTCATACGGGTATAAAACCGTACCAGTGTTCCCATTGCGAAAAGCAGTTCTACCAGAAGAGCGGGTTAAACAATCATATTTTGACCCATACGGGAGAAAAGCCTTACAAATGTACGGGATGTGAGAAAACTTTCATCCAATCTAACCATCTTAAGGAACACTTGCGGATTCATAGCGGAGAAAAGCCTTTTTTGTGTACTTACTGCGGGAAGGCTTTCGCCTACAGCAGTACGTTGAAGGTGCATTTAAGGCAGCACACTGGTGAAACACCGTTCATTTGTTCGTATTGTAATAAGGGGTTTCATGACGCAAGCAATCTGAGGCGACACGTTCATCGGAATCATACAAATATCAGACcacccaaaaataaaaatgtcagtcaaaaCATAATGAGCCAATATTAA
Protein Sequence: MNNKYMNISIHDFSRICRICLLSNESKVTSIESLDLYVKVTNIQIKQDDNLPKNICETCVIELKSVASFIEKCKEIDIFLVSILEKSKQGSFSYDIPDYESDSHSYDDRPIKLENEDSFAGAKDIKFESDTKNVQVNFNDSVLKHFHCANCGKGFCTKRELVVHIKTHTETKSFTCSFCSMKFRFRQSLQRHRLIHSTIRSYNCDICGKGFKRAFSRNKHRKIHNRVKMLLDTDLKYSCTQCDRVLTSHSALSSHMKTHTGEKPYSCTYCDKRFPYVSSLTVHTRLHTGETPFVCPICNKGYRSSTSLKKHKEVKHFEIEDVKQEDENDDRNADSDKRECKICNKILHKHGFGTHMRIHTVEKKKFVCTFCNKNFQKNSHLERHIRIHTGERPYVCKLCSKTFKQDGDLKRHVLTHTGEKLFQCQHCGKQYYTKGSLDTHMTAHTGIRRPVNYECNICKKSFRQCTHFKTHMNSHTGEKPYLCTICGKAFTASGTLKVHTRIHTGETPFVCSHCSKGYNNSSSLKRHIMRNHTGEKPYVCMICNKGFHDSTNLKRHIKRVHSVVEIKKDNEVADATKSVLICVCCTVMANKETNIHVAYEDFPVICRVCLLYNDVQPFEMKLLELFKAIINNSEEEIEEKLPHNICEICLVQLKDFENFIHKCRINEATLKSVYLERKNKYVDSSDADSDVEDKFDPDYVKCEEEEETIKTNTKLNRREEVQSDSDSPESKKQLRRALRKIKNKANPVKCEICNKTFYGKSAFANHTRTHKHKREHKKFLCNICGKNFIKNSHLERHIRTHTGIKPYECKDCGKHFGQSNDLKRHLLTHTREKVFQCNQCEKAFHQKSCLDNHILTHTNERNFECSFCDKKFTMKAYLEVHTRTHTGIKPYQCSHCEKQFYQKSGLNNHILTHTGEKPYKCTGCEKTFIQSNHLKEHLRIHSGEKPFLCTYCGKAFAYSSTLKVHLRQHTGETPFICSYCNKGFHDASNLRRHVHRNHTNIRPPKNKNVSQNIMSQY

Similar Transcription Factors

Sequence clustering based on sequence similarity using MMseqs2

100% Identity: iTF_00110749;
90% Identity: iTF_00110749;
80% Identity: iTF_00110749;