Basic Information

Insect: Lucilia cuprina
Gene Symbol: bab1_1
Assembly: GCA_001187945.1
Location: JRES01000611.1:852864-854605[-]

Transcription Factor Domain

TF Family: HTH
Domain: HTH_psq domain
PFAM: PF05225
TF Group: Helix-turn-helix
Description: This DNA-binding motif is found in four copies in the pipsqueak protein of Drosophila melanogaster [1]. In pipsqueak this domain binds to GAGA sequence [1].
Hmmscan Out: # of c-Evalue i-Evalue score bias hmm coord from hmm coord to ali coord from ali coord to env coord from env coord to acc

1 2 1e-17 1.6e-14 53.0 0.0 1 43 56 99 56 101 0.95

2 2 4.9 7.7e+03 -3.6 2.9 4 19 194 212 191 218 0.65

#	of	c-Evalue	i-Evalue	score	bias	hmm coord from	hmm coord to	ali coord from	ali coord to	env coord from	env coord to	acc
1	2	1e-17	1.6e-14	53.0	0.0	1	43	56	99	56	101	0.95
2	2	4.9	7.7e+03	-3.6	2.9	4	19	194	212	191	218	0.65

Sequence Information

Coding Sequence: GCGAAAATGTTGGAAAACTCACATGCATGGATGGGAGCTTCGGGTTCCTCAATAGCAGACAGTTATCAATATCAACTGCAGTCTATGTGGCAAAAATGTTGGAACACCAATCAAAGTTTAATGCATCATTTGCGATTTCGTGAACGAGGTCCCTTAAAGTCGTGGCGTCCCGAAACGATGGCAGAAGCAATTTTTAGTGTACTAAAAGAAGGTTTATCACTTTCACAGGCAGCACGAAAGTACGATATACCTTATCCCACATTTGTTCTCTATGCCAATCGAGTGCACAACATGTTGGGTCCTTCGATTGATGGAGGCCCCGATTTGAGACCGAAAGGCAGAGGACGGCCACAACGCATACTGCTGGGCATCTGGCCAGATGAACATATCAAAGGTGTCATAAAAACCGTTGTCTTCCGTGATGCCAAAGATCTGAAGGAGGAAGGTCTGGCGCACTTGCCCTATGGACGGCATTCGcCTGTTTTTCCATTTCAGGAAGGACCATTGAGTTATCCTGGTGTAGGTGGTCAATGTCCAAATGGAATGCCGGGGGCCACTGGTGACCAAATGTCACAAGAGGCAACAGCTGCAGCAGTGGCGGCGGTAGCTCATAATATACGTCAGCAAATGCAAATGGCGGCGGCGgctcaacagcaacagcagatGGGCGAAAGTCATGGTGGTCCAAATCTATTTAATCTTCCGCCTCATATGGCTAGTGGTGGACCAATGTCTGGACCACCTGGTTCAGGAGGTGTACCTCTTCCTAAAGCCAGCATTTCACCGGCTTTAAGCTCCTCATCGAATACCGCTAGTATGAGCGCAATGATGGGGCCAAGACATGTTCCTTCACCTTGTGGACCCAATTTACCGGGCATGCCACAACTGCCGCCTGGTATGGCGGTAGCTTTGCATATGGCCGGCAGTGGTCCTGGTGGTCGATGTGATCCCACTTCCGTGTTAagtcaacagcaacaacatcaactcCAACATTTGCACTTACAACAGCAGCACGCACTTCACCAGCAGCAACAAaagcatcaacaacaacatcaaatggCATTTGGTCCACACGGCACATCCTTGAGTCATACATCTGTTGGCGGCACTCCCTCACACACGGTCGTTCATCCCTCACTACAAAAATCAACGACGGCAACCTCAACAAAACCACACTCTTCCACTTCATCGCCGTCCAGACGTAACAGTCCTCACAGTCTGACACCCTTACATTCCCCCCTAACGGAACTTGGTCTAGAAATGAGTTTTAAACCAAGCCGACCATTTTCACCCTCCCGTCTATTTTCCGATGATATATCCGATATTGTTGGCGTTGCGGCCTCGCCATTACGCTCTCCCTCAACGTCAACACATCCGTCATCCTCTCTAGCAGCAGTTACGACAGCAACGATAACTACCACTAGCAGTATTAATACAGCCACCGTCAGAGCATCTTCCTCAGAGCCATCAGGGTCCGCCGCTACATCACAAACAACAACGGCGACATCAGCCGGAGGTATTGACAGTACAGCATCCGCATCAAGTAACATAAGTTCCACGGGGATTAAACTCGAACCTATTACGACAAGTAGCGATTAA
Protein Sequence: AKMLENSHAWMGASGSSIADSYQYQLQSMWQKCWNTNQSLMHHLRFRERGPLKSWRPETMAEAIFSVLKEGLSLSQAARKYDIPYPTFVLYANRVHNMLGPSIDGGPDLRPKGRGRPQRILLGIWPDEHIKGVIKTVVFRDAKDLKEEGLAHLPYGRHSPVFPFQEGPLSYPGVGGQCPNGMPGATGDQMSQEATAAAVAAVAHNIRQQMQMAAAAQQQQQMGESHGGPNLFNLPPHMASGGPMSGPPGSGGVPLPKASISPALSSSSNTASMSAMMGPRHVPSPCGPNLPGMPQLPPGMAVALHMAGSGPGGRCDPTSVLSQQQQHQLQHLHLQQQHALHQQQQKHQQQHQMAFGPHGTSLSHTSVGGTPSHTVVHPSLQKSTTATSTKPHSSTSSPSRRNSPHSLTPLHSPLTELGLEMSFKPSRPFSPSRLFSDDISDIVGVAASPLRSPSTSTHPSSSLAAVTTATITTTSSINTATVRASSSEPSGSAATSQTTTATSAGGIDSTASASSNISSTGIKLEPITTSSD

Similar Transcription Factors

Sequence clustering based on sequence similarity using MMseqs2

100% Identity: iTF_00922028; iTF_00975522; iTF_01259138; iTF_01236580; iTF_01174148; iTF_01237576; iTF_01235644; iTF_01373988; iTF_00899463; iTF_01137921; iTF_00741774; iTF_00760016; iTF_00435446; iTF_00900506; iTF_01312937; iTF_01315431; iTF_01313730; iTF_01260919; iTF_01194319; iTF_01314585; iTF_00997647; iTF_01376559; iTF_00258790; iTF_01427399; iTF_00199792; iTF_00259697; iTF_01109267; iTF_01176858; iTF_01201525; iTF_01162182; iTF_00655247; iTF_00350105;
90% Identity: iTF_00922028; iTF_00258790; iTF_00259697; iTF_00199792;
80% Identity: -