Basic Information

Insect: Leptopilina syphax
Gene Symbol: -
Assembly: GCA_032872505.1
Location: CM065476.1:4612096-4615608[+]

Transcription Factor Domain

TF Family: HTH
Domain: HTH_psq domain
PFAM: PF05225
TF Group: Helix-turn-helix
Description: This DNA-binding motif is found in four copies in the pipsqueak protein of Drosophila melanogaster [1]. In pipsqueak this domain binds to GAGA sequence [1].
Hmmscan Out: # of c-Evalue i-Evalue score bias hmm coord from hmm coord to ali coord from ali coord to env coord from env coord to acc

1 5 1.6e-06 0.0025 18.8 0.1 2 42 198 238 197 241 0.87

2 5 3.9e-09 5.9e-06 27.2 0.0 5 42 251 288 248 291 0.86

3 5 0.0024 3.6 8.7 0.0 19 33 316 330 303 335 0.77

4 5 6.1 9.2e+03 -2.2 0.0 31 45 345 360 345 360 0.85

5 5 8.3e-12 1.3e-08 35.8 0.0 5 42 363 400 362 403 0.93

#	of	c-Evalue	i-Evalue	score	bias	hmm coord from	hmm coord to	ali coord from	ali coord to	env coord from	env coord to	acc
1	5	1.6e-06	0.0025	18.8	0.1	2	42	198	238	197	241	0.87
2	5	3.9e-09	5.9e-06	27.2	0.0	5	42	251	288	248	291	0.86
3	5	0.0024	3.6	8.7	0.0	19	33	316	330	303	335	0.77
4	5	6.1	9.2e+03	-2.2	0.0	31	45	345	360	345	360	0.85
5	5	8.3e-12	1.3e-08	35.8	0.0	5	42	363	400	362	403	0.93

Sequence Information

Coding Sequence: ATGTCAGAGGTCAACAATCAAATTCAAGTTGTTGAAAGAACTTGTCTACAATGGGAAGATTATCAAAATCAATTCTCAGGTGTTGTTCGACAACTTCTAGACGAAAATTGCATGGTGGATGTTACACTATGTGTATCGGGACAACGCATTCTTGCTCATCGCATCGTTCTTTGTGCTTTCAGCACTTTCTTCAAAgATTTGTTGAGTCAGGTGACTGACGATCATCCAGTTATTATTTTAACCGGCGTGTCTCCTGAATGTGTCAAAGGAATTATTGAGTTTATTTATCAAGGAGAAGCCTATTTTCCCGCagatagtataaaaaatattttggatacTGCATTTTATCTTAAAATTGCTGGATTAATGGAGTACAAAATCAGTGAAACAGTTTCGAAATTGAAGGAAGATGCGGAAGAAATTGAAATATCGGATacaaatttgaatgaaatggAGGAGGAGGAAGAAGTTTTGGATGTTTTCGAGCATGTTTATGAAGAGGCGAATGATCAATCGGAACAGAGTGCAACTGAGGAAAATTCtgatagtaaaaaaagaaaaagacgtTATTCAATGAAACGGGAATACAGTGAAGATATGCTTGCTGCGGCTATTAATAATTTACGTGAGGGACAAACATTAATTGAAGCTGCTACTAAAAATCATATTCCTCGTTCTACATTGTATATGCGAGCAAAAgccttaggaattcaattgcaGGCTTGCAGAAATGAATATCCCGCCGAGTGTATGAAAGGAGCAATTGACGCCGTCATcggaGGATCGAGTTTGCAGACTGCTTCGGAAATGTTCGGTATTCCAAAAACAGTTCTTTGGCGACGAATGCAAAAGGAGGGTTATCAAGTTTTTCGACCAGAACTGAAGAGGAGTTATGGTTCGGATAAAAGAGAAGCGGCAGTAAAAGCATTAGAAAGAGGGGAAAATCTATCGAAAGTGGCGCAAGAATATCAAaTACCAAAGACAACGTTGTTCAGGGACAAGACAAAATTAATTGATCAAGGTAAGTTACCAACGTCGTTTTGGAAGAAGAGAAAAACAGAAAACGAAGCTGTTAAACAATTTCGACTCGAGGAAGCAGTAGCTGCGTGCAAAAGTGGAAAAATGTCACAAGCCGCCGCATCAGTTTGTTATCGAATTCCAAAAACAACGATATGGAGGCGATTGCAGCAGGACAATTCGAAAAATAAGAGGAAAACTAAATCAACTGGTGCAATTAATGCAACCGCTAACACTATTGACGCTAATGAATTCACATTTTGTGAAGTTACATCAGGAATTCCAATCACTTATATAGACGAGAATAGTATTCCCGAAGATTCCGTCATAATTCTCACAACAGAAGATGTCGACGAATTGAGTTTGGAAAATCGAGCCCAAATTATTGTCAATTCGaacGTCAATGAAGAATTCATTTCCAATTCGGAAGCGGAGCCCACCTACACTGTTTCGAAGAGTTAG
Protein Sequence: MSEVNNQIQVVERTCLQWEDYQNQFSGVVRQLLDENCMVDVTLCVSGQRILAHRIVLCAFSTFFKDLLSQVTDDHPVIILTGVSPECVKGIIEFIYQGEAYFPADSIKNILDTAFYLKIAGLMEYKISETVSKLKEDAEEIEISDTNLNEMEEEEEVLDVFEHVYEEANDQSEQSATEENSDSKKRKRRYSMKREYSEDMLAAAINNLREGQTLIEAATKNHIPRSTLYMRAKALGIQLQACRNEYPAECMKGAIDAVIGGSSLQTASEMFGIPKTVLWRRMQKEGYQVFRPELKRSYGSDKREAAVKALERGENLSKVAQEYQIPKTTLFRDKTKLIDQGKLPTSFWKKRKTENEAVKQFRLEEAVAACKSGKMSQAAASVCYRIPKTTIWRRLQQDNSKNKRKTKSTGAINATANTIDANEFTFCEVTSGIPITYIDENSIPEDSVIILTTEDVDELSLENRAQIIVNSNVNEEFISNSEAEPTYTVSKS

Similar Transcription Factors

Sequence clustering based on sequence similarity using MMseqs2

100% Identity: iTF_00879877;
90% Identity: iTF_00882322; iTF_00883187; iTF_00881914; iTF_00879877; iTF_00879878; iTF_00879535; iTF_00879536; iTF_00880621; iTF_00880361; iTF_00881151; iTF_00881422;
80% Identity: iTF_00883187;