Basic Information

Insect: Dynastes hyllus
Gene Symbol: -
Assembly: GCA_029619255.2
Location: JAROYC020000003.1:1118017-1119777[+]

Transcription Factor Domain

TF Family: zf-GAGA
Domain: zf-GAGA domain
PFAM: PF09237
TF Group: Zinc-Coordinating Group
Description: Members of this family bind to a 5'-GAGAG-3' DNA consensus binding site, and contain a Cys2-His2 zinc finger core as well as an N-terminal extension containing two highly basic regions. The zinc finger core binds in the DNA major groove and recognises the first three GAG bases of the consensus in a manner similar to that seen in other classical zinc finger-DNA complexes. The second basic region forms a helix that interacts in the major groove recognising the last G of the consensus, while the first basic region wraps around the DNA in the minor groove and recognises the A in the fourth position of the consensus sequence [1].
Hmmscan Out: # of c-Evalue i-Evalue score bias hmm coord from hmm coord to ali coord from ali coord to env coord from env coord to acc

1 12 5.8 1.9e+04 -2.7 0.1 38 44 193 199 181 214 0.56

2 12 0.021 67 5.1 0.0 21 47 232 258 226 263 0.81

3 12 0.089 2.9e+02 3.1 0.1 21 44 260 283 258 291 0.78

4 12 0.18 5.7e+02 2.1 0.0 21 44 288 311 281 317 0.82

5 12 0.027 89 4.7 0.1 22 49 317 344 312 347 0.85

6 12 0.0025 8.2 8.0 0.0 21 47 344 370 342 377 0.86

7 12 0.14 4.6e+02 2.4 0.1 21 36 372 387 368 396 0.77

8 12 0.016 51 5.5 0.0 21 46 400 425 394 431 0.85

9 12 0.019 62 5.2 0.2 21 47 428 454 424 463 0.71

10 12 0.015 48 5.6 0.0 21 46 484 509 481 516 0.85

11 12 0.059 1.9e+02 3.6 0.0 21 46 512 537 508 543 0.84

12 12 0.035 1.1e+02 4.4 0.3 21 44 540 563 536 575 0.78

#	of	c-Evalue	i-Evalue	score	bias	hmm coord from	hmm coord to	ali coord from	ali coord to	env coord from	env coord to	acc
1	12	5.8	1.9e+04	-2.7	0.1	38	44	193	199	181	214	0.56
2	12	0.021	67	5.1	0.0	21	47	232	258	226	263	0.81
3	12	0.089	2.9e+02	3.1	0.1	21	44	260	283	258	291	0.78
4	12	0.18	5.7e+02	2.1	0.0	21	44	288	311	281	317	0.82
5	12	0.027	89	4.7	0.1	22	49	317	344	312	347	0.85
6	12	0.0025	8.2	8.0	0.0	21	47	344	370	342	377	0.86
7	12	0.14	4.6e+02	2.4	0.1	21	36	372	387	368	396	0.77
8	12	0.016	51	5.5	0.0	21	46	400	425	394	431	0.85
9	12	0.019	62	5.2	0.2	21	47	428	454	424	463	0.71
10	12	0.015	48	5.6	0.0	21	46	484	509	481	516	0.85
11	12	0.059	1.9e+02	3.6	0.0	21	46	512	537	508	543	0.84
12	12	0.035	1.1e+02	4.4	0.3	21	44	540	563	536	575	0.78

Sequence Information

Coding Sequence: ATGGCTACAGAATACGATAAGTTGCATGAACACTCCATTCATAACTTTGAAGAATACAGCAGTGACGCAGATATCAAATTAGGAAATTCTATAGTTCAAACggaagattttcttgattcaaaaacaggaatatctttgataagtGACGCCAACGTAGCACAAAGTGTCTTactggaaaatattaaagtcgAAAATTTAGACGAGCAGTTGAGCAAAGATATTGGTGGTGCTGAGAActgtgaaaaatataatagtgaCGCAGACATTAAATCAGAAGATTTTATAGTTCAAACGGGAGATTCtcttgattcaaaagcaggaatatctttgataagcgACGATGtcttattggaaaatgttaaagttgaaaatttgaacGGCCAAAGCGATAAGAACTTTAAACACAAACATGAACTAACAGATCACGCCTGTCATAAGCTCGATAAGACTGGTGTTTGTGCGCAATGTGGAGAATCGTTCGAAGGGAAAAACAAACTATACCAACATTTTAGGAACGTACATTTTACCAGGAAGATTTACTCATGTAGTTATTGTGGCTGGGCATATCGTCGTAAGATTGATCTGATGAGACATGTTAGaaaacacaccggtgaaaagctaTTTACTTGCGAGGTTTGTAAGAAGTCGTTTTCTAAGAAGAGTGGATTGATGATTCATACTAAAAAACATACCGgtgaaaaaccttttacttgcggaatttgtaaaaaatcattttcttggaatatTGGACTGAGGATTCATATGAAAATACACACTGGTGAGaagccttttacttgtgaaATTTGTAAAGAATCATTTTGTTGGATGAAAGAACTTATCAAACATATTAAGACACACCCGGGTGAAAAGCCATTCACTTGCGAAGTTTgtcaaaaatcattttcttggataAGCTCACTGAGGACTCATACAAAAATACACACTGGTAAAAGGCCTTATACTTGCAAGatatgtaaaaagtcattttctgaGAAATGTACGTTAAGGACTCACATTAAaatacacaccggtgaaaagccttttacttgcgaggtttgtaaaaactcattttctcagAAGAGCGGACTGAGAAGTCATATGAaaacacacaccggtgaaaagccttttacttgcgagatttgtgAAAGGTCGTTTTCCCAGAAGGGTGGACTAATGATTCATACCAGAACccacactggtgaaaagccgTTTACTTgcgaattttgtaaaaaatcattttcccaGAAGAGTGGACTGATAAGGcatattaaaacacacaccggcgaaaaaccttttacttgtgaagtttgtaaaaagtcgttTTATGCGAGGCATCGTCTGAATAGACATATGAAAACAcataccggtgaaaagccttttgcTTGCGAATTTTGTACGAAATCATTTAGCTGGAAGAGTAGTCTGATAGGTCATATTGGAACGCATACCGGTGAAatgccttttacttgcgagatttgtaaaaaatcattttctgacAAGCAAGGACTGAGGACTCACATTAAAAAACACACCGgcgaaaagccttttacttgcgaattttgcaaaaaatcattttggtCGAGGAAAGGACTGAGAAATCATATTAAAACGcataccggtgaaaagccttttacttgcgagatttgtaaaaagtcgtttTGTGTGAGAGATCGACTGAATAGGCATATTAAAACACACGCTGATGAAAGGCGTCTTACTGCGAACTTAGAAAAAAGTCATTTGGCTGCCCCTCAGGactaa
Protein Sequence: MATEYDKLHEHSIHNFEEYSSDADIKLGNSIVQTEDFLDSKTGISLISDANVAQSVLLENIKVENLDEQLSKDIGGAENCEKYNSDADIKSEDFIVQTGDSLDSKAGISLISDDVLLENVKVENLNGQSDKNFKHKHELTDHACHKLDKTGVCAQCGESFEGKNKLYQHFRNVHFTRKIYSCSYCGWAYRRKIDLMRHVRKHTGEKLFTCEVCKKSFSKKSGLMIHTKKHTGEKPFTCGICKKSFSWNIGLRIHMKIHTGEKPFTCEICKESFCWMKELIKHIKTHPGEKPFTCEVCQKSFSWISSLRTHTKIHTGKRPYTCKICKKSFSEKCTLRTHIKIHTGEKPFTCEVCKNSFSQKSGLRSHMKTHTGEKPFTCEICERSFSQKGGLMIHTRTHTGEKPFTCEFCKKSFSQKSGLIRHIKTHTGEKPFTCEVCKKSFYARHRLNRHMKTHTGEKPFACEFCTKSFSWKSSLIGHIGTHTGEMPFTCEICKKSFSDKQGLRTHIKKHTGEKPFTCEFCKKSFWSRKGLRNHIKTHTGEKPFTCEICKKSFCVRDRLNRHIKTHADERRLTANLEKSHLAAPQD

Similar Transcription Factors

Sequence clustering based on sequence similarity using MMseqs2

100% Identity: iTF_00626375;
90% Identity: iTF_00626375;
80% Identity: iTF_00626375;