Basic Information

Insect: Cecidostiba fungosa
Gene Symbol: bab1_1
Assembly: GCA_900474305.1
Location: UCOJ01000262.1:91011-93016[+]

Transcription Factor Domain

TF Family: HTH
Domain: HTH_psq domain
PFAM: PF05225
TF Group: Helix-turn-helix
Description: This DNA-binding motif is found in four copies in the pipsqueak protein of Drosophila melanogaster [1]. In pipsqueak this domain binds to GAGA sequence [1].
Hmmscan Out: # of c-Evalue i-Evalue score bias hmm coord from hmm coord to ali coord from ali coord to env coord from env coord to acc

1 5 1.8e-07 0.00016 21.4 0.0 2 38 215 250 214 257 0.88

2 5 1.8e-12 1.6e-09 37.4 0.0 1 38 264 300 264 303 0.95

3 5 0.00053 0.48 10.3 0.0 7 34 322 348 318 354 0.86

4 5 5.1 4.6e+03 -2.5 0.0 31 44 362 376 362 377 0.77

5 5 4.6e-12 4.2e-09 36.1 0.0 4 43 379 418 376 420 0.92

#	of	c-Evalue	i-Evalue	score	hmm coord from	hmm coord to	ali coord from	ali coord to	env coord from	env coord to	acc
1	5	1.8e-07	0.00016	21.4	2	38	215	250	214	257	0.88
2	5	1.8e-12	1.6e-09	37.4	1	38	264	300	264	303	0.95
3	5	0.00053	0.48	10.3	7	34	322	348	318	354	0.86
4	5	5.1	4.6e+03	-2.5	31	44	362	376	362	377	0.77
5	5	4.6e-12	4.2e-09	36.1	4	43	379	418	376	420	0.92

Sequence Information

Coding Sequence: ATGTCCGAGGCTAACCAGGCGACACTTGGCACAGACCACACGCAGGTCGACACCTCTTACTGCTTCAAATGGGGCAATTACCAGAGTCACCTGTCCGAGGTCGTGCGCCAACTGCTGGAAGAAGAATGTATGGTCGACGTGACCCTCTACGCCGGCGGCGAACGCATACAGGCACACCGACTCGTCCTCTGCGCCTGCAGCACTCTATTCCAGGAAATTTTGAGCCAGGTTAACGATGAGCACGCTACCATTATTCTGAGCGACATATCTCCTCAAGATGTGAGGTCCATCGTTGAGTTCAGTTACAACGGAGAGGTGAGAATCCCTGTGGAGAATATCAACAATCTCCTGGATGCTGCTCATTCATTGAAGATATGTGGTTTGATGGAGATTGAAGGTCTGGATGAGTCTGAAATAGCTCAGGACAAAGATATGTGTGCTGATGATAGTTATGTCTTAAGTGAGTTTCCTGATGTTGATGAAGAAGATGAGAATATTCAGTCACAAACTTTTGAAAAGCCACAAACAGAGAAAataagcgaaaataaaagaagaatttcaacaaatgatgaagaagaagatgcgGATGGAAGTCTCAAAAAGCGAAAACGTAGAAAGAGCGTTTGCAAGAAAGAGTACAGTGATGAAATGTTAGCTGCAGCAATCAGTGACATTAAAGAGGGAAAGTCATTGTTGGAGGCAGCTATGAGACACCATATTCCCAGATCCACACTATACATGAGAGCAAAAGTTCTGGGTCTGTCTCTCAATCCATCTCGGAGTGAATATACAAATGAAGATATGAAAGGAGCCATACAGGCAGTCATAGCTGGATCTAGCTTACAACAGGCGTCTGACTGTTATGGCATTCCGAAAACAGTTTTGTGGCGAAGGATTCAGAAAGAAGGTTGTCTACCACCAAGAAaggaacaaaagaaaacatatGCAACTGACAGAAGAGAAGCTGCGGTGAAGGCATTGGAAAGAGGAGATTCTCTCACAAAAGTTGCCAATGAATACAAAATTCCAAAAACGACGCTCTTTCGAGATAAAGCTCGTTTAGTTGATCAAGGAAAATTGCCGACAACGTTCTGGAAAAAGCGAAAGACTAATGGAGAAGATATAAAACGATCTCGTTTGGAGGAAGCTGTGGCTGCTTGCAAAGATGGTAAGATGTCACAAGCTGTAGCTTCAGTTACTTATCAAATACCTAAAACTACTATATGGAGACGACTTCAAAAAGAAATGGGGAAATCCGATTCAGGTTCATCTGTAAAGAAGCAGCAAAAGAGGGTCATCCCCACTTTTCAAAAGAGCACAGAGATGGTTAAATCAGAAGAGTTACAAGAAACTGATTTTGAGGCATATTGTCCAgAGGATACAGACATGAATATAACGTACATTGATGAAAGTAACATATCAGATGATCCAGTAATAATTCTTGCTAGCAGCGATGTAGATGAGCTTAATTTACCAAATAATAGATCTTTAGTGGTGGTACATGAAggttctgaaaattttatatcatgCGGGCTGGAGTTGGATGACAATACAACTTTCgttgaaaaaagttaa
Protein Sequence: MSEANQATLGTDHTQVDTSYCFKWGNYQSHLSEVVRQLLEEECMVDVTLYAGGERIQAHRLVLCACSTLFQEILSQVNDEHATIILSDISPQDVRSIVEFSYNGEVRIPVENINNLLDAAHSLKICGLMEIEGLDESEIAQDKDMCADDSYVLSEFPDVDEEDENIQSQTFEKPQTEKISENKRRISTNDEEEDADGSLKKRKRRKSVCKKEYSDEMLAAAISDIKEGKSLLEAAMRHHIPRSTLYMRAKVLGLSLNPSRSEYTNEDMKGAIQAVIAGSSLQQASDCYGIPKTVLWRRIQKEGCLPPRKEQKKTYATDRREAAVKALERGDSLTKVANEYKIPKTTLFRDKARLVDQGKLPTTFWKKRKTNGEDIKRSRLEEAVAACKDGKMSQAVASVTYQIPKTTIWRRLQKEMGKSDSGSSVKKQQKRVIPTFQKSTEMVKSEELQETDFEAYCPEDTDMNITYIDESNISDDPVIILASSDVDELNLPNNRSLVVVHEGSENFISCGLELDDNTTFVEKS

Similar Transcription Factors

Sequence clustering based on sequence similarity using MMseqs2

100% Identity: iTF_01036936; iTF_01035341; iTF_01274637; iTF_01037170; iTF_01274387; iTF_01035572; iTF_00286552; iTF_00143792; iTF_00143982; iTF_01036116; iTF_01036339; iTF_01487162; iTF_01486969; iTF_00287388; iTF_00287107; iTF_01190239; iTF_01190545;
90% Identity: iTF_00286552;
80% Identity: iTF_00286552;