Basic Information

Insect: Prosopocoilus inquinatus
Gene Symbol: -
Assembly: GCA_036172665.1
Location: CM069876.1:45025793-45032724[-]

Transcription Factor Domain

TF Family: zf-GAGA
Domain: zf-GAGA domain
PFAM: PF09237
TF Group: Zinc-Coordinating Group
Description: Members of this family bind to a 5'-GAGAG-3' DNA consensus binding site, and contain a Cys2-His2 zinc finger core as well as an N-terminal extension containing two highly basic regions. The zinc finger core binds in the DNA major groove and recognises the first three GAG bases of the consensus in a manner similar to that seen in other classical zinc finger-DNA complexes. The second basic region forms a helix that interacts in the major groove recognising the last G of the consensus, while the first basic region wraps around the DNA in the minor groove and recognises the A in the fourth position of the consensus sequence [1].
Hmmscan Out: # of c-Evalue i-Evalue score bias hmm coord from hmm coord to ali coord from ali coord to env coord from env coord to acc

1 19 0.35 2.1e+02 3.1 0.1 21 48 17 43 15 48 0.87

2 19 1.6 9.7e+02 1.0 0.1 26 46 50 69 42 75 0.83

3 19 0.27 1.6e+02 3.5 0.3 25 43 76 94 71 100 0.89

4 19 0.0038 2.3 9.4 0.0 21 47 128 154 125 160 0.86

5 19 9 5.4e+03 -1.4 0.0 21 44 156 179 154 183 0.84

6 19 0.002 1.2 10.3 0.1 21 51 184 214 181 216 0.92

7 19 1.5 8.9e+02 1.1 0.0 26 45 230 249 218 255 0.85

8 19 1.2 6.9e+02 1.4 0.1 14 47 274 307 268 312 0.84

9 19 4.9 2.9e+03 -0.6 0.2 22 44 310 332 305 337 0.84

10 19 0.0029 1.7 9.8 0.4 21 44 337 360 335 366 0.91

11 19 0.12 71 4.6 0.6 17 44 388 416 375 421 0.83

12 19 0.0026 1.5 9.9 0.1 21 51 421 451 418 452 0.87

13 19 0.035 21 6.3 0.2 21 44 449 472 447 477 0.90

14 19 5.6e-05 0.033 15.3 0.3 21 47 477 503 474 509 0.86

15 19 7.7 4.6e+03 -1.2 0.0 24 47 549 572 545 577 0.81

16 19 0.2 1.2e+02 3.9 0.1 21 44 574 597 570 604 0.89

17 19 1.7 1e+03 0.9 0.1 23 50 663 690 659 693 0.84

18 19 0.42 2.5e+02 2.9 0.0 21 44 689 712 687 719 0.87

19 19 0.0022 1.3 10.1 0.1 18 47 741 770 734 778 0.85

#	of	c-Evalue	i-Evalue	score	bias	hmm coord from	hmm coord to	ali coord from	ali coord to	env coord from	env coord to	acc
1	19	0.35	2.1e+02	3.1	0.1	21	48	17	43	15	48	0.87
2	19	1.6	9.7e+02	1.0	0.1	26	46	50	69	42	75	0.83
3	19	0.27	1.6e+02	3.5	0.3	25	43	76	94	71	100	0.89
4	19	0.0038	2.3	9.4	0.0	21	47	128	154	125	160	0.86
5	19	9	5.4e+03	-1.4	0.0	21	44	156	179	154	183	0.84
6	19	0.002	1.2	10.3	0.1	21	51	184	214	181	216	0.92
7	19	1.5	8.9e+02	1.1	0.0	26	45	230	249	218	255	0.85
8	19	1.2	6.9e+02	1.4	0.1	14	47	274	307	268	312	0.84
9	19	4.9	2.9e+03	-0.6	0.2	22	44	310	332	305	337	0.84
10	19	0.0029	1.7	9.8	0.4	21	44	337	360	335	366	0.91
11	19	0.12	71	4.6	0.6	17	44	388	416	375	421	0.83
12	19	0.0026	1.5	9.9	0.1	21	51	421	451	418	452	0.87
13	19	0.035	21	6.3	0.2	21	44	449	472	447	477	0.90
14	19	5.6e-05	0.033	15.3	0.3	21	47	477	503	474	509	0.86
15	19	7.7	4.6e+03	-1.2	0.0	24	47	549	572	545	577	0.81
16	19	0.2	1.2e+02	3.9	0.1	21	44	574	597	570	604	0.89
17	19	1.7	1e+03	0.9	0.1	23	50	663	690	659	693	0.84
18	19	0.42	2.5e+02	2.9	0.0	21	44	689	712	687	719	0.87
19	19	0.0022	1.3	10.1	0.1	18	47	741	770	734	778	0.85

Sequence Information

Coding Sequence: ATGTTTGCCTCCAAAGGAAGCTTGAAGACTCACGTgctgatacacaccggcgagaaaccattcagttgcgatctttgcgactACAAGTGCCGGTACACCTCGTCATTGAAACGCCACACGTTGAAACACACCGGCGATACGGCGTTCGgttgcgacctttgcgattacaagggCCGCCAACACCGATACTTGAAGCAGCACATGTTGACGCACGCCGGAAAGTCGCTGACTTGCgacgtttgcgattataaatgccgacagccCACCAGTCTGAAGCGACACAAACTGgggcacaccggcgagaagctgTTCGGTTGCCGCCTTTGCGAGTACAAATCCCTCAAAGCATCGGACGTAAAACGGCACACGTTAATACACAACGGCGAAAAGCCGTTCGCCTGTGAGATTTGCGATAATAAATTCAGAGACCGCGGACACTTGAGACGTCACATgttgatacacaccggcgagaagccgttcggctgCGATCTTTGCGACTACAAGTGCCGATATAACGCGTCGTTGAAATGCCACATGTTGAttcacaccggcgagaagccgttcagttgcgacctttgcgattacaagtgcggGCAAAGCAAATATTTGAAACAGCACATGTTAATAAGACATACCGGAAAGTGCAAACGGACTCCTAAACCTGAACTCGAGGACAAAAGAAAACTCGACTGCCGCATATGCGATTCTACGTTCTCGTCAAGAGGAAACTTGAAGAAGCACTTgctgatacacaccggcgagaagcggTTCAGCTGCGAcgtctgcgattacaaatgcggACGCTCCGACACCATGAAGAAGCACAGACTAACGCATTCCGCCGAGAAGCGCTTCAGCTGCGGAATCTGCCGCAACAAGTTCAAGCGACTCGAATACCTGAGACTCCACATGTCgttgcacaccggcgagaagcgaTTCGCCTGCGAACTTTGCGACTACCAGTGTCGACAAATCACGCATCTCAAACACCAcatgttaatacacaccggcgaaaagccgTACGCCTGCGATCtatgcgattacaagtgccgacaACCTCGAAGCTTGAAACGGCACGTCTCGAAACACGACGGAAAGTCGTTGAGTTGCGacgtttgcgattacaagtgtcgACGCTCCGACACCATGAAGCTTCACAAGTCGAGGCAGcacgccgacgagaagccgtcCGGCTGTAGTCTCTGCGAATACACGTGCTCGCAAGCGTCACAATTAAAACAACACATGCTGACACACGGTAGCGAAAAGCTGTTCACTTGCGAAACTTGCGATAGGATGTTCAGGCGACACGAAAACCTGAAGCGGCACATGTTACTgcacaccggcgaaaaaccGTTCACTTGctatctttgcgattacaaatgccggcaGTACCAAAGTCTGAAGCAGCACGTGTTGATGCACAACGACGAAAAGCCGTTCACCTGCGAGATTTGTGATAAAAAGTTCAGACAACGCGCGCACTTGAGACGCCACATGTTGATACATACCGACGAAAAACCGGAAACAGCACATGTTAAGATCAAACGAAAACTCTTAACTTTAAAACGGTTAACACCGTTAACACATGTTAACACGTACCGgtGCAAACGAACTTCTAAATTCAAACTCGAGGACAAAACAAAGGCGCAATGCCACGTATGCGATTctaaatttacaacaaaaacatCTTTGAAGAAGCACCTACTgatacataccggcgagaagccgttcagttgcgacctCTGCAATTACAAGTGCCGGCTGCATTCGAACTTGAAGAAGCACGTGCTGACTCACGGCGAAAAATCGTTGAGCTGCGACgcttgcgattacaagtgtcgACGCTCCGACAAGATGAAGCTGCACAAGTTGAGACACACCGGCGACGACGAGAAACGTCACGCATGCAGTATCTGCGAATACAAGTGCTTCGAAACGTCGACCTTAAAATCGCACATGTTAATACACGACGGCGACAGGCCGCGGCCCTTCGCCTGCGAAATCTGCGACACCAAATTCACGAAACTCCACCACCTGAGATGCCACATGAcgatacacaccggcgaaaagccgttcagttgcgatctcTGCGACTACAAGGGTCGAAACAACTCGAAGTTGAAGCGGCACATGCTAACGCACGCCGAGAAGTCGTTGAGCTGCGACGTTTGCGATTTCAAGTGCAGTCGTTCGGATTCGATGAAGGCGCACAAACTCAGACACACCGACGAAAAGCCGTTCCTCTGTGGAATTTGCGCCAAACAATTCAGGCTAATCAGGCACTTGAAACGCCAcatgttaatacacaccggcgaaaagccgttcggttgcgatctttgcgattacaagggACGAGACCTCTCAGTTTTGAAACGACACCGGATGACACACTCTGTCGAGAAACGGTTGTAG
Protein Sequence: MFASKGSLKTHVLIHTGEKPFSCDLCDYKCRYTSSLKRHTLKHTGDTAFGCDLCDYKGRQHRYLKQHMLTHAGKSLTCDVCDYKCRQPTSLKRHKLGHTGEKLFGCRLCEYKSLKASDVKRHTLIHNGEKPFACEICDNKFRDRGHLRRHMLIHTGEKPFGCDLCDYKCRYNASLKCHMLIHTGEKPFSCDLCDYKCGQSKYLKQHMLIRHTGKCKRTPKPELEDKRKLDCRICDSTFSSRGNLKKHLLIHTGEKRFSCDVCDYKCGRSDTMKKHRLTHSAEKRFSCGICRNKFKRLEYLRLHMSLHTGEKRFACELCDYQCRQITHLKHHMLIHTGEKPYACDLCDYKCRQPRSLKRHVSKHDGKSLSCDVCDYKCRRSDTMKLHKSRQHADEKPSGCSLCEYTCSQASQLKQHMLTHGSEKLFTCETCDRMFRRHENLKRHMLLHTGEKPFTCYLCDYKCRQYQSLKQHVLMHNDEKPFTCEICDKKFRQRAHLRRHMLIHTDEKPETAHVKIKRKLLTLKRLTPLTHVNTYRCKRTSKFKLEDKTKAQCHVCDSKFTTKTSLKKHLLIHTGEKPFSCDLCNYKCRLHSNLKKHVLTHGEKSLSCDACDYKCRRSDKMKLHKLRHTGDDEKRHACSICEYKCFETSTLKSHMLIHDGDRPRPFACEICDTKFTKLHHLRCHMTIHTGEKPFSCDLCDYKGRNNSKLKRHMLTHAEKSLSCDVCDFKCSRSDSMKAHKLRHTDEKPFLCGICAKQFRLIRHLKRHMLIHTGEKPFGCDLCDYKGRDLSVLKRHRMTHSVEKRL

Similar Transcription Factors

Sequence clustering based on sequence similarity using MMseqs2

100% Identity: iTF_01258308;
90% Identity: iTF_01258308;
80% Identity: iTF_01258308;