Basic Information

Insect: Exephanes ischioxanthus
Gene Symbol: KBTBD4_1
Assembly: GCA_958510785.1
Location: OY294017.1:4423665-4425817[+]

Transcription Factor Domain

TF Family: HTH
Domain: HTH_psq domain
PFAM: PF05225
TF Group: Helix-turn-helix
Description: This DNA-binding motif is found in four copies in the pipsqueak protein of Drosophila melanogaster [1]. In pipsqueak this domain binds to GAGA sequence [1].
Hmmscan Out: # of c-Evalue i-Evalue score bias hmm coord from hmm coord to ali coord from ali coord to env coord from env coord to acc

1 5 2.3e-06 0.0025 17.8 0.0 3 42 206 245 204 248 0.85

2 5 1.2e-14 1.4e-11 44.3 0.0 2 39 255 291 254 298 0.86

3 5 0.0021 2.3 8.3 0.0 7 34 312 338 308 344 0.86

4 5 6.8 7.4e+03 -2.9 0.0 32 45 353 367 353 367 0.87

5 5 1.8e-10 1.9e-07 31.0 0.2 4 39 369 404 366 408 0.93

#	of	c-Evalue	i-Evalue	score	bias	hmm coord from	hmm coord to	ali coord from	ali coord to	env coord from	env coord to	acc
1	5	2.3e-06	0.0025	17.8	0.0	3	42	206	245	204	248	0.85
2	5	1.2e-14	1.4e-11	44.3	0.0	2	39	255	291	254	298	0.86
3	5	0.0021	2.3	8.3	0.0	7	34	312	338	308	344	0.86
4	5	6.8	7.4e+03	-2.9	0.0	32	45	353	367	353	367	0.87
5	5	1.8e-10	1.9e-07	31.0	0.2	4	39	369	404	366	408	0.93

Sequence Information

Coding Sequence: ATGTCTGCGATAGGAGCGTGCGGTCAGCCCCACATCGAGGAGAGCTATTGTTTCAAATGGAGCGATTATCAGAATCACTTGTCGGGCGTCGTTCGCCAGCTTCTCGAGGAGGAATGCATGGTCGACGTGACCCTTGTCGCTGCCGGGGAACGCATACACGCCCATCGTATCGTACTCTGCTCCTGCAGCACTTTGTTTCAAGAGGTACTGAGTCAGGTGACCGAGGATCACCCGACGATAATACTGAGCGATATATCGGCGCAGGACGTGAGATCCATCGTAGAGTTCAGTTATCACGGAGAAGTTAGAATTCCTGTTGAGAACATAAGCAACTTACTCGAGGCTGCCCACTCGCTGAAGATATGCGGCCTCATGGAGatcgatgGACTCGACGAGAACGATGCGATCATAAGCGCGAGAGATCTGAGCGAGGACAATGCCGATTCACTGGCCGACTTCAACGACTCGGACGGTAAGGGATCCGAGCACTTGGAGGATGCACAGATGAGTCGGAACGAGGACAAGAATTTCGATTGCATAGACAAGGACAGCAACGGTGtgcctggaaaaaaaagaaaacgcagAAAGGACACGTTGAAGCGAGAATACAACGACGACATGCTAGTGTCGGCGATAAATGATCTGAGGTCGGGCCAAACGCTCATAGAGGCGGCGACGAAAAACAATATACCGCGATCGACGCTGTACATGAGAGCCAAAGCGCTCGGAATACAATTGAGCGCCTCGCGAAACGAGTATCCACCGGAATGCATGAAAGCGGCGATCGAGGCGGTCGTGGGAGGATTGAGTTTGCAGCAAGCCTCGGAGAAATTCGACATACCGAAAACTGTTCTCTGGCGACGAATACAGAAGGAGGGCTACCAGATACTGCGCACAGAGATGAAAAGATCTTACGGCTCGGAGAAGAGAGAGGCGGCGGTTAAAGCGCTGCAACGCGGTGAAAATCTCTCGAAAGTCGCCATGGAATTTCAGATACCGAAGACCACGCTGTTTCGCGACAAAGCGAGACTGGTCGACGAGGGAAAGCTACCGGAGTccttctggaaaaaaagaaaaaccggcGACGAGCACGTGAAGAGATTGCGACTCGAGGAGGCGGTGGCTGCGTGCAAGGGCGGAAGAATGTCTCAGGCGGCGGCGTCGATGGCCTATCGAATACCGAAAACAACGATCTGGCGACGACTCCAGCAGGAAGGAAAGAGCATCGAACGCCCCGCAGGTTCCAAGGAATCGGGCATCGACGAGATCGAAGACCACAAAGGCGTACAACAGCATCCCGAATTCTCGTTCTGCGAGGTTTCCTCGGAAATTCCCATAACGTACATAGACGAGAACATACCGGAGAACTCTGTCATAATATTGACGACCCAAGAAGTCGACGGTCTAAATCTCGAAGCTGGCAGACAGATAATCGTTAATCAAgATTCCGGACACGAGTATGTTCGATGCGCTCTGAGCATCGGGGAAAACAGCGACACCACCGAATACCAGCCAGCGGAGAGTTAG
Protein Sequence: MSAIGACGQPHIEESYCFKWSDYQNHLSGVVRQLLEEECMVDVTLVAAGERIHAHRIVLCSCSTLFQEVLSQVTEDHPTIILSDISAQDVRSIVEFSYHGEVRIPVENISNLLEAAHSLKICGLMEIDGLDENDAIISARDLSEDNADSLADFNDSDGKGSEHLEDAQMSRNEDKNFDCIDKDSNGVPGKKRKRRKDTLKREYNDDMLVSAINDLRSGQTLIEAATKNNIPRSTLYMRAKALGIQLSASRNEYPPECMKAAIEAVVGGLSLQQASEKFDIPKTVLWRRIQKEGYQILRTEMKRSYGSEKREAAVKALQRGENLSKVAMEFQIPKTTLFRDKARLVDEGKLPESFWKKRKTGDEHVKRLRLEEAVAACKGGRMSQAAASMAYRIPKTTIWRRLQQEGKSIERPAGSKESGIDEIEDHKGVQQHPEFSFCEVSSEIPITYIDENIPENSVIILTTQEVDGLNLEAGRQIIVNQDSGHEYVRCALSIGENSDTTEYQPAES

Similar Transcription Factors

Sequence clustering based on sequence similarity using MMseqs2

100% Identity: iTF_00397441;
90% Identity: iTF_00721382; iTF_00059368; iTF_01364552; iTF_01364778; iTF_00058603; iTF_00058834; iTF_00057843; iTF_00059574; iTF_00058071; iTF_00905533; iTF_00905336;
80% Identity: iTF_00721382;