Basic Information

Insect: Tenthredo amoena
Gene Symbol: bab1_1
Assembly: GCA_963966615.1
Location: OZ016488.1:975469-977963[+]

Transcription Factor Domain

TF Family: HTH
Domain: HTH_psq domain
PFAM: PF05225
TF Group: Helix-turn-helix
Description: This DNA-binding motif is found in four copies in the pipsqueak protein of Drosophila melanogaster [1]. In pipsqueak this domain binds to GAGA sequence [1].
Hmmscan Out: # of c-Evalue i-Evalue score bias hmm coord from hmm coord to ali coord from ali coord to env coord from env coord to acc

1 4 2.5e-08 1.6e-05 25.0 0.0 2 37 205 240 204 247 0.88

2 4 3.9e-11 2.5e-08 34.0 0.0 3 39 256 291 254 296 0.88

3 4 1.2 7.9e+02 0.4 0.0 26 34 332 340 325 345 0.83

4 4 1.1e-09 7.2e-07 29.4 0.0 4 39 371 406 356 412 0.94

#	of	c-Evalue	i-Evalue	score	hmm coord from	hmm coord to	ali coord from	ali coord to	env coord from	env coord to	acc
1	4	2.5e-08	1.6e-05	25.0	2	37	205	240	204	247	0.88
2	4	3.9e-11	2.5e-08	34.0	3	39	256	291	254	296	0.88
3	4	1.2	7.9e+02	0.4	26	34	332	340	325	345	0.83
4	4	1.1e-09	7.2e-07	29.4	4	39	371	406	356	412	0.94

Sequence Information

Coding Sequence: ATGTCCGAAGGCGATATTCCGTCGAGCGGTAGTCAACAACAGCCCACAATATCTCAAAGTTACTGTTTTAAATGGAACGATTACGAGAATCAAGTACCATGCGTTATTCGACAATTGTTAGAAGAGAACTCCATGGTGGACGTTACCGTTTCTGCTGACGGAATCAAGATTCATGCTCATCGCATCGTATTGTCTGCCTGTAGCACCTTCTTTCAAGAAGTATTAAACCAAGTTAATGAAGACTCTCCGACTATAATACTCAGCGGTATATCTGCGCAGGATATTCGTTGCATTATAGATTTTATGTATAATGGAGAAGTCAGTATACCGGTCGAGAATATCAGCAGTTTGTTGGACACTGCTCATTTTTTGAAGATTCATGGCCTTATGGAgATCGATGGTTTGGACGAGAGTGACGGTGTAACGTGTGAAGATTTCAGTGAAGAGACGGTAGAATCGTTGAGTGAGCTGAACGAAACTGAAGATCAGGATTTAAATGCGTTAGAACAGGAGTTTGAGAATGTGACTAATAATTCTTTGGATGGAAACAACGTCTCTACTacaaatcagaaaaaaaaacggagacgAGATACAGTTAAGAAAGAATACAGCGAAGACATGCTCATAGCTGCTATAAACGATCTAAGAACAGGGCACACTTTGATAGAGGCTGCAACTAATCACGGAATACCAAGGTCTACTTTGTATATGCGAGCCAAGGCCTTAGGTTTGCATCTAAATGCTTCTAGGAATGAATATTCTGCGGAATGTATGAAGGCGGCGATAAATGCTGTGCTAGagGGTTCGAGCTTGCAACAGGCATCGGAAATGTTTTCTATACCTAAAACTGTACTTTGGCGAAGAATTCAAAAGGAAGGATACCAAATACTTGGCCAGCGTACCGAAATGAAGAAATCTTATGACGCCGATAAGAGGGAAGCTGCGGTTAAAGCATTGGAGAGAGGGGAAAATCTCACCAAAGTTTCTTTGCAGTTTCAAATACCAAAAACGACGTTATTTAGAGACAAGGCTAGACTAGTAGATGAGGGAAAGCTCCCACTGTCGTTTTGGAAGAAACGTAAAACGGAAAACGAAGATTTAAAGAAATCGCGACTGGAAGAAGCAGTGGCAGCTTGTAAGTGTGGGAGAATGTCTCAAGCAGCAGCGTCCATGGCTTATCGAATCCCGAAGACTACAATATGGAGAAGGCTGCAgcaggatggaaaaaaattaaatcgtcCAGTAGATAACCCGAGTCAACAAAAATCTGATGATCTGGACGATATTGATGACCAAAAGGAGCAAGGGACTGAATTCACGTATTGCGAGGTCACTTCGGAGATACCGATAACATACATAGACGAAAACGGAATACCAGAAGATTCGGTGATAATTTTAACGACTGACGATGTGGATGGTATGAATCTGGAAGAAGGTACACAAATAATAGTAAGTTCGATAAATCTTGATGTATTTGTCGATTCCGCTCAAGAATACGTATCCTGCGCATTAAACATTGAGGACAGCTCAAATTACACTAACAGTGAAAGTTAA
Protein Sequence: MSEGDIPSSGSQQQPTISQSYCFKWNDYENQVPCVIRQLLEENSMVDVTVSADGIKIHAHRIVLSACSTFFQEVLNQVNEDSPTIILSGISAQDIRCIIDFMYNGEVSIPVENISSLLDTAHFLKIHGLMEIDGLDESDGVTCEDFSEETVESLSELNETEDQDLNALEQEFENVTNNSLDGNNVSTTNQKKKRRRDTVKKEYSEDMLIAAINDLRTGHTLIEAATNHGIPRSTLYMRAKALGLHLNASRNEYSAECMKAAINAVLEGSSLQQASEMFSIPKTVLWRRIQKEGYQILGQRTEMKKSYDADKREAAVKALERGENLTKVSLQFQIPKTTLFRDKARLVDEGKLPLSFWKKRKTENEDLKKSRLEEAVAACKCGRMSQAAASMAYRIPKTTIWRRLQQDGKKLNRPVDNPSQQKSDDLDDIDDQKEQGTEFTYCEVTSEIPITYIDENGIPEDSVIILTTDDVDGMNLEEGTQIIVSSINLDVFVDSAQEYVSCALNIEDSSNYTNSES

Similar Transcription Factors

Sequence clustering based on sequence similarity using MMseqs2

100% Identity: iTF_01200321; iTF_01412230; iTF_01414343; iTF_01411660; iTF_00939443; iTF_01412467; iTF_01413491; iTF_00939736; iTF_01303226; iTF_01200059; iTF_01303579; iTF_01413019; iTF_00938588; iTF_00938879; iTF_01414080; iTF_00174434; iTF_00174085; iTF_00175851; iTF_00175182; iTF_00175676; iTF_00174944; iTF_00719554; iTF_00719313; iTF_00718739; iTF_00718455; iTF_01048334; iTF_01048822; iTF_01048152; iTF_01049051; iTF_00060463; iTF_00060103;
90% Identity: iTF_01303579;
80% Identity: iTF_01411660;