Basic Information

Insect: Hermaeophaga mercurialis
Gene Symbol: -
Assembly: GCA_951812935.1
Location: OX638358.1:51339656-51342262[-]

Transcription Factor Domain

TF Family: zf-GAGA
Domain: zf-GAGA domain
PFAM: PF09237
TF Group: Zinc-Coordinating Group
Description: Members of this family bind to a 5'-GAGAG-3' DNA consensus binding site, and contain a Cys2-His2 zinc finger core as well as an N-terminal extension containing two highly basic regions. The zinc finger core binds in the DNA major groove and recognises the first three GAG bases of the consensus in a manner similar to that seen in other classical zinc finger-DNA complexes. The second basic region forms a helix that interacts in the major groove recognising the last G of the consensus, while the first basic region wraps around the DNA in the minor groove and recognises the A in the fourth position of the consensus sequence [1].
Hmmscan Out: # of c-Evalue i-Evalue score bias hmm coord from hmm coord to ali coord from ali coord to env coord from env coord to acc

1 14 0.019 92 4.2 0.0 17 45 66 95 59 99 0.77

2 14 0.00057 2.8 9.0 0.2 20 44 126 150 118 158 0.89

3 14 1.2 5.8e+03 -1.6 0.0 23 43 157 177 152 181 0.83

4 14 0.057 2.8e+02 2.6 0.0 21 45 239 263 230 269 0.81

5 14 0.0031 15 6.7 0.1 22 46 324 348 315 352 0.88

6 14 0.071 3.5e+02 2.3 0.1 22 45 373 396 354 402 0.83

7 14 0.29 1.4e+03 0.4 0.1 22 46 400 424 397 429 0.85

8 14 0.0055 27 5.9 0.0 25 45 589 609 583 615 0.89

9 14 3.4 1.6e+04 -3.0 0.0 27 45 647 665 646 673 0.85

10 14 0.0037 18 6.4 0.0 22 44 670 692 667 701 0.88

11 14 1.4 6.7e+03 -1.8 0.0 23 45 699 721 693 725 0.83

12 14 5.7 2.8e+04 -3.8 0.1 23 30 783 790 780 792 0.76

13 14 0.33 1.6e+03 0.2 0.1 22 47 810 835 803 841 0.65

14 14 0.049 2.4e+02 2.9 0.0 26 46 842 862 836 865 0.87

#	of	c-Evalue	i-Evalue	score	bias	hmm coord from	hmm coord to	ali coord from	ali coord to	env coord from	env coord to	acc
1	14	0.019	92	4.2	0.0	17	45	66	95	59	99	0.77
2	14	0.00057	2.8	9.0	0.2	20	44	126	150	118	158	0.89
3	14	1.2	5.8e+03	-1.6	0.0	23	43	157	177	152	181	0.83
4	14	0.057	2.8e+02	2.6	0.0	21	45	239	263	230	269	0.81
5	14	0.0031	15	6.7	0.1	22	46	324	348	315	352	0.88
6	14	0.071	3.5e+02	2.3	0.1	22	45	373	396	354	402	0.83
7	14	0.29	1.4e+03	0.4	0.1	22	46	400	424	397	429	0.85
8	14	0.0055	27	5.9	0.0	25	45	589	609	583	615	0.89
9	14	3.4	1.6e+04	-3.0	0.0	27	45	647	665	646	673	0.85
10	14	0.0037	18	6.4	0.0	22	44	670	692	667	701	0.88
11	14	1.4	6.7e+03	-1.8	0.0	23	45	699	721	693	725	0.83
12	14	5.7	2.8e+04	-3.8	0.1	23	30	783	790	780	792	0.76
13	14	0.33	1.6e+03	0.2	0.1	22	47	810	835	803	841	0.65
14	14	0.049	2.4e+02	2.9	0.0	26	46	842	862	836	865	0.87

Sequence Information

Coding Sequence: ATGGAAGAATCAAAGAACATTAAAAACGAATATACAACCACCCACAATCCAGATGAAATTTCTAAAACCCAAGAAGCCTTAAAAGTCGAAGAATTTGACAAAACCTACGTTAAAGCCgaagatgaaataaataaatccgaaaataatgtaaaaaatattataaaatcagACGATGACAGTGACGAAGATGACAAGAGTAAAAGTAgtcataaaaagaaaaaatatggttGTACCTTATGTTTCGCAAGTTTTGACAAAACCGTCCTCCTTAAAAGGCATTTACGATCCCAtccagaagaaaaaaaatacagatgCAACTCTTGCAATCGTAGTTTCGGCCATTTTGGACACTACAAGCGGCACATGGTCAGTCACACTAGCGAAAGAAATTACATTTGCGAAATTTGTAGCAGCAGCTTCCGCCAcgaagataatttaaaaagacataTATTAATTCATACcggagaaaaaaattatagatgtGCTACATGTGGAAAAGCTTTCACCCAAAGCTCTTCACTTAAACAACATTACATCACTCATAATGGagagaaaaaattcaagtgtgAAACTTGTAAAAAGTGTTTTAGCAGGATGAATGCTTACAAGAAACATTTGTTGATTCACACTGGCGAGAAGAAgtttaattgtaatatatgtGGGAAAGCTTTCTATGGAAAACGAGATGTTATTCGTCATAGGGTTACGCACACAGGAGAAAAGAATTACATTTGTCCAATTTGTGGTCATGGTTTCGGCCACGAAAATTCCTTAAGAATGCACCTTCTTATACATTCCGGAAAAAGAAAACACAAGTGCAACATTTGCGAAAAGTCTTTCTTCACTAACGCAGCTTTAAAATCGCACCAAATAAGTCACACAGGCGAGAAGAACTACAAATGTGAAATTTGCCATAATAACTTCGCTTATCTAAACACTTACAAGAAGCACATGCTAACTCATACCGGCGAGAAAAAGTATAAATGCCACATTTGTGAAACCGCATTCACTCAAAGCTACTGTCTTTCAAGGCATCTCAAAATTCACACTAGGGAAAACTCTACTTCGAAAATTCGCGAACGTGAGAAAACTGAAACTCTAATAACTCGTCCAGgtgagaaaaattttaaatgtgaaatttgcgGCAGCACTTACGcccatctaaaaaattataaaaggcaCTTACTAGTCCATACCGAAAAGAAATTCAAGTGCAGTATTTGCGATAGGGGCTTCACAAGAAGTTTTTGTCTAAAAAGGCATTACAAAATCCATATTACCGAGAAGAAATCTGAGGCACCGACAGCTCCAAGTGCACCACCAGGTGCATGTGCACCAACAGATGATTTAATACTACAGAACAGTCCACAGcttgtaaaaatagaaaatgttccaATAAACAACTATGTCGAAGCATACAACCAGTCAGTAGAAGAGAACAATGTTGAAGTAGACGTTAAAACTACTTCAAGAAATGACTGTGACTCTCAACAAAATACAGACTGGTCTACAGATATAAACTCAAATTCACAGGATAGTTTCTTATTTACTATGGATAATTATGGTTCgaatgataatgatgatgatgatgataaagaTGATACCTTTGAAGAATACGAAAAAAATGAAACTGAAAATGAAGCTGCTAATGAAATAATTCCTGAAGAAGTTACGTCTGAAAATGCAAACTCAAATCCTGACGACATAGAAGTGGATATCAAGAAGTTATTAAATTACGAGTACGCAGAAGATGGTAAAAAGAAGTATACGTGTACCTTATGCTTCGCAGAATTTGATAAAACAGTCCATCTTAAAAGACATCTTAGAACTCATCcggaaaaaaagaaatacaaatgcATTGCTTGTAATCAGAGTTTCGGTCACTTCGGGCATTTTAAACGACACGTTCTGACACATACcggtattaaaaattatatctgtgAAGTATGCAGTAAAGGATTTCGATTAGAAGACACCTTAAAGAAACATCTTCTGATTCATACGggagagaaaaaatataaatgcacaatttgtgaaaagaCCTTTACTCAGAGCTCCACTCTAAGACAGCATCTTGTAACTCACACAGGTGAAAAGAAGTACAAATGTAACACTTGCAATAAGAATTTTGGACAAGTAAGTAACtataaaaaacacttgttaATACATACTGGGGTGAAGAAATTCAAGTGTAACTTCTGTGATAAGGCCTTTTACGATACGGCTTGCTTAAAACGTCACAGATTAATACATACTGGCGAAAAGAACTTTATGTGTAACATCTGCAATAGAAGTTTCAGCAGAGAAAAATGCCTGAAGAGCCACCAAGCGATTCACACCGGAGAGAAGAAATATAAATGCCCCGTTTGCGAGAAATCCTTCTTCACTTACTCCGGCTTAAAAAGCCACGAAATAAACCACACGGGAGAACAAAAATATCAGTGCGAGACGTGTAACAAGTGTTTCATTCACAAGAGCAATTACAAAAAACATCTGGCGATTCATGATGTCGATAAAAAGTTTAAGTGTCCGGTTTGTAATAAGGGATTTTATCGTAGTGATCATTTAAAGAAGCATCTAATGCGAATGCACGGAAGGgctgaataa
Protein Sequence: MEESKNIKNEYTTTHNPDEISKTQEALKVEEFDKTYVKAEDEINKSENNVKNIIKSDDDSDEDDKSKSSHKKKKYGCTLCFASFDKTVLLKRHLRSHPEEKKYRCNSCNRSFGHFGHYKRHMVSHTSERNYICEICSSSFRHEDNLKRHILIHTGEKNYRCATCGKAFTQSSSLKQHYITHNGEKKFKCETCKKCFSRMNAYKKHLLIHTGEKKFNCNICGKAFYGKRDVIRHRVTHTGEKNYICPICGHGFGHENSLRMHLLIHSGKRKHKCNICEKSFFTNAALKSHQISHTGEKNYKCEICHNNFAYLNTYKKHMLTHTGEKKYKCHICETAFTQSYCLSRHLKIHTRENSTSKIREREKTETLITRPGEKNFKCEICGSTYAHLKNYKRHLLVHTEKKFKCSICDRGFTRSFCLKRHYKIHITEKKSEAPTAPSAPPGACAPTDDLILQNSPQLVKIENVPINNYVEAYNQSVEENNVEVDVKTTSRNDCDSQQNTDWSTDINSNSQDSFLFTMDNYGSNDNDDDDDKDDTFEEYEKNETENEAANEIIPEEVTSENANSNPDDIEVDIKKLLNYEYAEDGKKKYTCTLCFAEFDKTVHLKRHLRTHPEKKKYKCIACNQSFGHFGHFKRHVLTHTGIKNYICEVCSKGFRLEDTLKKHLLIHTGEKKYKCTICEKTFTQSSTLRQHLVTHTGEKKYKCNTCNKNFGQVSNYKKHLLIHTGVKKFKCNFCDKAFYDTACLKRHRLIHTGEKNFMCNICNRSFSREKCLKSHQAIHTGEKKYKCPVCEKSFFTYSGLKSHEINHTGEQKYQCETCNKCFIHKSNYKKHLAIHDVDKKFKCPVCNKGFYRSDHLKKHLMRMHGRAE

Similar Transcription Factors

Sequence clustering based on sequence similarity using MMseqs2

100% Identity: iTF_00792366;
90% Identity: iTF_00792366;
80% Identity: iTF_00792366;