Basic Information

Insect: Prosopocoilus inquinatus
Gene Symbol: -
Assembly: GCA_036172665.1
Location: CM069876.1:49556500-49560557[+]

Transcription Factor Domain

TF Family: zf-GAGA
Domain: zf-GAGA domain
PFAM: PF09237
TF Group: Zinc-Coordinating Group
Description: Members of this family bind to a 5'-GAGAG-3' DNA consensus binding site, and contain a Cys2-His2 zinc finger core as well as an N-terminal extension containing two highly basic regions. The zinc finger core binds in the DNA major groove and recognises the first three GAG bases of the consensus in a manner similar to that seen in other classical zinc finger-DNA complexes. The second basic region forms a helix that interacts in the major groove recognising the last G of the consensus, while the first basic region wraps around the DNA in the minor groove and recognises the A in the fourth position of the consensus sequence [1].
Hmmscan Out: # of c-Evalue i-Evalue score bias hmm coord from hmm coord to ali coord from ali coord to env coord from env coord to acc

1 9 8.4 5e+03 -1.3 0.0 36 44 41 49 32 53 0.83

2 9 0.0033 2 9.6 0.0 21 45 56 80 50 86 0.87

3 9 0.04 24 6.1 0.1 18 52 107 141 104 142 0.92

4 9 0.27 1.6e+02 3.5 0.2 21 43 166 188 157 194 0.87

5 9 0.15 90 4.3 1.7 5 44 178 217 176 226 0.87

6 9 0.18 1.1e+02 4.0 0.0 21 51 274 304 264 306 0.89

7 9 0.0071 4.2 8.5 0.0 18 52 357 391 349 392 0.88

8 9 0.33 2e+02 3.2 0.0 24 43 419 438 408 448 0.83

9 9 0.16 92 4.2 0.1 21 48 472 499 468 500 0.93

#	of	c-Evalue	i-Evalue	score	bias	hmm coord from	hmm coord to	ali coord from	ali coord to	env coord from	env coord to	acc
1	9	8.4	5e+03	-1.3	0.0	36	44	41	49	32	53	0.83
2	9	0.0033	2	9.6	0.0	21	45	56	80	50	86	0.87
3	9	0.04	24	6.1	0.1	18	52	107	141	104	142	0.92
4	9	0.27	1.6e+02	3.5	0.2	21	43	166	188	157	194	0.87
5	9	0.15	90	4.3	1.7	5	44	178	217	176	226	0.87
6	9	0.18	1.1e+02	4.0	0.0	21	51	274	304	264	306	0.89
7	9	0.0071	4.2	8.5	0.0	18	52	357	391	349	392	0.88
8	9	0.33	2e+02	3.2	0.0	24	43	419	438	408	448	0.83
9	9	0.16	92	4.2	0.1	21	48	472	499	468	500	0.93

Sequence Information

Coding Sequence: atgaggggaGAAACGTCAGGGGCTaggttaATTACAGAAAGCGTTGTGCCCCCAGAAGATCGCAAGGGAGTCTCGCCCGCCCCAAAAAAGCGAACGCCGGCGCCGTTTAAACGCCTCCTCGCCTCTAAAGCTTTAAGAAGACACGTGACCGCCGCCGCATGCGAAGCGGAAAACAAATTCGTGTGCGAAATCTGCGGTTACAAAACGCATAAATCCCTAAACCTGAAGCGGCACCTCGAAAAGCACGGGCGTTCGTTTCAGTGCGACCGCTGCGGCCTCAAATTAATCTCGCGCACCACTTTGAATATTCACATGAGGCGacacaccggcgaaaaaccTTACAAGTGCGGcgtttgcgattataaaagtGCCCAGTCATGTCAGCTGGCGGCGCACATGACGATACACACCGGCGCGAAGCCCTATCAATGCAGCAAATGCGACTACAGGGCCGCCTTGAGGGGCAGCATCACGAAACACATGGTGACGCATTCCGCGGAGAAGCCGTTCAAGTGCAAGATCTGCGATTTTAGGGCGAAAACGCCCAAGACTTTGAAAAGGCACCAGATCAAGCACACCGGCGAGCGCACGGTCGAATGCGTCATCTGCCGGAAGCGGTTCGCCTGTTCCACGCACCTGAAGCGTCACGTTTTGACGCACACCAACGAAAAGCCGTTCGCGTGTAACTTGTTAATCTCAAAAAGCAACGGCGCTCTCGAAGAGCTCACCGTCACCCCGAATCAGCTGTTTAAGTGTAAACGTTGCGATTTCAACTGTGACCGTCCGGACCGCATGACGGAGCATGCCTTGACGCATTCCGGCGAAAAACCCTTCGGCTGTAAGATGTGCGGCTTGAAATACAGCGCGACCAAAGGCTTAAGACATCACATGAGGCAGAAGCATTCGACGAAAGCCATTGGTCAATTCGTTTGTGAGATTTGCGGTTATGAGACGGACGAGGCGGCGTACCTCAAGAAGCACGTCAACAACACGCACGAGAAGCCGTACCAGTGCGATCGATGCGGCGACACGTTCACCGCGCTCTCCGGCCTGAAATCGCACATGATGcgacacaccggcgagaaaccgtacaAGTGCAGCCTTTGCGATTACAGAAGCATCCAGTCGTCTCAACTCTCCACGCACATGAAGCTACACACGGGCGCGAAACCTTTCCAATGCACCGAGTGCGATTACAGGGCCGCCCTCAAAGGCAACCTCACGAAGCACATGTACAAACATTACAAGGAAACTCAGTTCAAGTGTAGCATCTGCGGTGTCGGAGCGAGAAACGCGTCGGACCTAAAGAGGCACAACAtgaaacacaccggcgagaagacGGTCGAATGTGGCACGTGCGCCAAGAAATTCTCAACTTACACGCACATGAGGAGGCACGTTTTGATACAtgccggcgagaaaccgtacgCGTGTGACTTGTGCGATTACAAATCTACTCAGCGGTATAACGTGAAGGTGCACATGAAACACAGACATAAACTATAG
Protein Sequence: MRGETSGARLITESVVPPEDRKGVSPAPKKRTPAPFKRLLASKALRRHVTAAACEAENKFVCEICGYKTHKSLNLKRHLEKHGRSFQCDRCGLKLISRTTLNIHMRRHTGEKPYKCGVCDYKSAQSCQLAAHMTIHTGAKPYQCSKCDYRAALRGSITKHMVTHSAEKPFKCKICDFRAKTPKTLKRHQIKHTGERTVECVICRKRFACSTHLKRHVLTHTNEKPFACNLLISKSNGALEELTVTPNQLFKCKRCDFNCDRPDRMTEHALTHSGEKPFGCKMCGLKYSATKGLRHHMRQKHSTKAIGQFVCEICGYETDEAAYLKKHVNNTHEKPYQCDRCGDTFTALSGLKSHMMRHTGEKPYKCSLCDYRSIQSSQLSTHMKLHTGAKPFQCTECDYRAALKGNLTKHMYKHYKETQFKCSICGVGARNASDLKRHNMKHTGEKTVECGTCAKKFSTYTHMRRHVLIHAGEKPYACDLCDYKSTQRYNVKVHMKHRHKL

Similar Transcription Factors

Sequence clustering based on sequence similarity using MMseqs2

100% Identity: iTF_01258382;
90% Identity: iTF_01258382;
80% Identity: iTF_01258382;