Basic Information

Insect: Crataerina pallida
Gene Symbol: bab2_1
Assembly: GCA_949710015.1
Location: OX453292.1:28537797-28539659[+]

Transcription Factor Domain

TF Family: HTH
Domain: HTH_psq domain
PFAM: PF05225
TF Group: Helix-turn-helix
Description: This DNA-binding motif is found in four copies in the pipsqueak protein of Drosophila melanogaster [1]. In pipsqueak this domain binds to GAGA sequence [1].
Hmmscan Out: # of c-Evalue i-Evalue score bias hmm coord from hmm coord to ali coord from ali coord to env coord from env coord to acc

1 4 5.1e-07 0.001 18.7 0.0 8 39 393 424 391 427 0.88

2 4 2.6e-15 5.1e-12 45.3 0.0 2 44 443 485 442 486 0.96

3 4 0.01 20 5.0 0.0 27 37 515 525 511 530 0.88

4 4 1.5e-16 2.9e-13 49.2 0.1 4 41 553 590 553 592 0.92

#	of	c-Evalue	i-Evalue	score	bias	hmm coord from	hmm coord to	ali coord from	ali coord to	env coord from	env coord to	acc
1	4	5.1e-07	0.001	18.7	0.0	8	39	393	424	391	427	0.88
2	4	2.6e-15	5.1e-12	45.3	0.0	2	44	443	485	442	486	0.96
3	4	0.01	20	5.0	0.0	27	37	515	525	511	530	0.88
4	4	1.5e-16	2.9e-13	49.2	0.1	4	41	553	590	553	592	0.92

Sequence Information

Coding Sequence: ATGAATCATTTAAAGTGGATGGGGCACTCGGCCACCATATTagatatacataaaaatttacgtaGTGATTTGGAGAGTTGTGAAGTGACACTAATCGCAAAGGGACATACCGTAAAGGCACATCGTTTTGTTTTGTCCTCCTGCAGCGATTTATTACGTATCTTGCTAAGCGATGTGCCACTGGGTCAAGAGTGCACTGTTATGGTACCCGATATTAAAGGGCCATTGCTGGATAGTGTCTTGGCTTTCATATATATGGGTGAAACATGTATATCATCCAGTAATCTATCGGAGTTTTTAGAAGCCATAAATGTTTTAGGCATTAAATCGGCGATTAGTTTTGAATGCAATACCAACGCTTTGCAAAATGCCTCCCCAACCACCCTAAATACAATTGCCAATGGTGGCAGCCCCAGTGCAGCGCAAACTGTAAGTGATTGTGCTGTAACTGGTGATACTTTAACGTTAACTTCAGCAGATATTATAGCTCATGACAATTTAATGGCACCCAAATTGGGATCTTCTCATATTATCGCTACCAATTCGCGGGAATTGGAACTTCTTGATGTGTACCAGGAAGGGGCACATCATAAAATTACATATTCCATTGAACATATACCAGGTGCTGACAGTGGTAGTGAGTTTATATTAACTGAAAATTCGGGAACATTTACGATAACACAAAATCCCAAAATTGAATCCACTTCTAGCACAGCATCTGGCCAAATGGATGTTAGCGAAGAAGATGATGCTGATACTGTTGAAGCGCATATCATTGAAGAGTACAACAGTACGGAAGATCCTTTACTACAATTAACAGAAAATGCTAACGAAAATGCAACTGAGGTGAACGTCACACAAACTCAGACTACTGACTCCAGTACGCCTCTTTTTCATGCTAAACCAACCAAGAGCagatatttgaaatttaaaccGCAAGGTGGCGCCaccaatatacaaaaattagaacaaaatctTAATAGTGTTATGGATACGACTGAATCCGGCTCAGATGATCAGCTTGGTAGCAGTACATTGCAAATATCCAATGAAAGTTGTGACATGGATAAAGACAATAAGGACATTAGCAATGAAATAAGCACCGTCAATGAATCAAACTCAAAGTATTTTACAGCCTCATCAACCAACACCAGCAATTTAAGTGCCACCGATTTGGCATATCAAGCCATGGTAAATGATAATTTAAGTTTGCCGAAAGCTGCCGTGAAATTCAATGTTTCCAAAACGGAATTATGGCGGCGAGTACGAAATACTGGTGTAGACACCTACATAACATCCGAGGCCCAAGCTAAACCCTCCCGCCAAGAAGAAGCCATCGACTTGGCCTGTCAGGCGGTCATCTCTGAGGGTTATAGTTTGCAAAAGGCTGCCGTAAAATATGACATTTCTAAGACGGTTTTATGGAGACGGGTGCGCAAACATCCCGATTATATGAAAACGGTACGTGAGAATCCGGTAATAACGAAAGCTTATGAAAGATTGAAAACGGGTGAATCATTAAAAAGTATTAGTCGCGATTTGGATATACCCATGTCTACGTTGCACCGCCACAAAGTACGTCTCTCCCAACAAGGCCAACTTCCCCACTTTGTAACATGCAAACGTCGTGACATCTCCAAAGAtgatttgaaaattaaattagcTAAAGCGGTACACGCCTGTGTACATGAGGGTATGTCACAAAATCATGCCgctaatttatatgaaatatcgAAAAGTACTTTGTGGCGTCATTTGCAAAAACGCGTTGCTGAAGCTGAATCGGCTGATGTGGCTGAACTGCAATCCATGGAATCAATggtagatgatgatgaagtCAAAGACGAGGTCATACTTTCTTAG
Protein Sequence: MNHLKWMGHSATILDIHKNLRSDLESCEVTLIAKGHTVKAHRFVLSSCSDLLRILLSDVPLGQECTVMVPDIKGPLLDSVLAFIYMGETCISSSNLSEFLEAINVLGIKSAISFECNTNALQNASPTTLNTIANGGSPSAAQTVSDCAVTGDTLTLTSADIIAHDNLMAPKLGSSHIIATNSRELELLDVYQEGAHHKITYSIEHIPGADSGSEFILTENSGTFTITQNPKIESTSSTASGQMDVSEEDDADTVEAHIIEEYNSTEDPLLQLTENANENATEVNVTQTQTTDSSTPLFHAKPTKSRYLKFKPQGGATNIQKLEQNLNSVMDTTESGSDDQLGSSTLQISNESCDMDKDNKDISNEISTVNESNSKYFTASSTNTSNLSATDLAYQAMVNDNLSLPKAAVKFNVSKTELWRRVRNTGVDTYITSEAQAKPSRQEEAIDLACQAVISEGYSLQKAAVKYDISKTVLWRRVRKHPDYMKTVRENPVITKAYERLKTGESLKSISRDLDIPMSTLHRHKVRLSQQGQLPHFVTCKRRDISKDDLKIKLAKAVHACVHEGMSQNHAANLYEISKSTLWRHLQKRVAEAESADVAELQSMESMVDDDEVKDEVILS

Similar Transcription Factors

Sequence clustering based on sequence similarity using MMseqs2

100% Identity: iTF_01115135;
90% Identity: iTF_00384692; iTF_01114934; iTF_01115135; iTF_01114131; iTF_01114380;
80% Identity: iTF_00384692;