Basic Information

Insect: Drosophila mettleri
Gene Symbol: -
Assembly: GCA_035047625.1
Location: JAWNPI010000103.1:8107337-8108911[+]

Transcription Factor Domain

TF Family: HTH
Domain: HTH_psq domain
PFAM: PF05225
TF Group: Helix-turn-helix
Description: This DNA-binding motif is found in four copies in the pipsqueak protein of Drosophila melanogaster [1]. In pipsqueak this domain binds to GAGA sequence [1].
Hmmscan Out: # of c-Evalue i-Evalue score bias hmm coord from hmm coord to ali coord from ali coord to env coord from env coord to acc

1 3 1.6e-16 2.4e-13 49.5 0.0 2 45 357 400 356 400 0.95

2 3 0.065 95 2.8 0.0 28 37 430 439 429 444 0.90

3 3 5.4e-19 7.8e-16 57.5 0.0 2 42 466 506 465 509 0.94

#	of	c-Evalue	i-Evalue	score	hmm coord from	hmm coord to	ali coord from	ali coord to	env coord from	env coord to	acc
1	3	1.6e-16	2.4e-13	49.5	2	45	357	400	356	400	0.95
2	3	0.065	95	2.8	28	37	430	439	429	444	0.90
3	3	5.4e-19	7.8e-16	57.5	2	42	466	506	465	509	0.94

Sequence Information

Coding Sequence: ATGGGCCACTCGTCCACAATAATGGATATACAGCGAGTTCTGCTGCATCAACAAAGCAACAATCAGCAATGCGAGGTATTGCTTGTGGCCAAAGATGGCATCAGCGTACGTGCACATCTTTTCGTTCTAAGCACTTGCAGCGACTTAATGCGCAATCTGCTTGTCGATTTACCCGCCGGTCAGGAGGCGACTGTCATTTTGCCAGACATCCGTGGTGAGCTGCTCGAGAATGTGTTATCGTTTATTTACATGGGAGAAACTAGCTTAACCTCTGCCATGCTGCCCGAGTTTCTCGGAGCCATTAACTTACTGGGCATCAAGTCAGCCATAAGCTTTGATACCAATCCAACCTCCATGACGACCACTAATGTTATTAGTGGTGCTACGACAGTCGAGGAAGCCAAATCAATTAGCGGCTTGCATATTGCGAATACAGCTCTTATGGAGGAGGAAGAAGATGCTGGAGCTGTAGTTGGTAAATTGGAAGTGGATAATGCCGTACTCACAAATACTCAACAGCAGCATGAGCAGCAAAGCCGAACCCTAGAATTCCTGGATATGTACGGCGACCAGCCAAAAATAACATATTCAATCGAACACATGGACGGCACAACCACCGGAAATCAGTACATTTATACAGAGAATACTGGAACATTTACTATAACACAATCATCTGTAGCCAAGTTGGGAGTGCAAGGCAGCTCAGCTGTGGTCGACTCTGTGGAGACAGCGGAGCTGGGTGACGAGGATGCCGACGCAGAGGTGACAGACGAGCACGAAGAATCCGAATCACAATTAATCGAGGAGGAGTATGTTGGAACGTCTGATCCGTTGATAGAGATGAGCGCAGAGGCAGGTGTTGACATGCATGAAGATGATATGCATGATGGAgacgaggaggaggatgaTGAACTGTTGGATGTGAAACCTCGCAAATCACATCTCGATATGAAAATGTTAAAGAGCAAGGCACGTCAGCGTCCAGCATCATCGAAGGCAATGAAAAAAGCGATGACcaaacagcatcagcaacacgCGGCTTTTAAAAAAGAATGCAAAGAGGACATTAATGAAGCACTTGACCTTGCAGCGGCTGCCGTACTTCACGAAGGTCTCAGCTTGCAAAAGGCTGCCGATCGCTACGACATATCGAAAACTGTGCTTTGGCGGCGTGTGCGTTCCAATCCAGCCTACATGAGAATAAAACGAGAGAAACCTTCGCTCTCGGAAGCATATGAACGCCTAAAGAATGGCGATTCGTTGAAAAGCATAAGCCAGGATCTACATATACCCATGTCGACGCTGCATCGACACAAAGTACGTCTTGCGGCACAGGGTCGTCTGCCAGATTTCGTTTCCTGCCGGCGGCGCGACAGTACGCCAAAGGATGAGTTGCGTGAAAAGCTAGCTAAAGCAGTGCATGCCTGCACCAATGGGGGCATGACACAAAATCACGCAGCTAATCTCTTTGAAATACCTAAGAGCACGCTCTGGCGGCATTTGCAGAGGCGCGCGACAGAGGAGCGCAAAGTCAAGGAAGAACATGAAGAGGAGGATGATGATgttatgaattaa
Protein Sequence: MGHSSTIMDIQRVLLHQQSNNQQCEVLLVAKDGISVRAHLFVLSTCSDLMRNLLVDLPAGQEATVILPDIRGELLENVLSFIYMGETSLTSAMLPEFLGAINLLGIKSAISFDTNPTSMTTTNVISGATTVEEAKSISGLHIANTALMEEEEDAGAVVGKLEVDNAVLTNTQQQHEQQSRTLEFLDMYGDQPKITYSIEHMDGTTTGNQYIYTENTGTFTITQSSVAKLGVQGSSAVVDSVETAELGDEDADAEVTDEHEESESQLIEEEYVGTSDPLIEMSAEAGVDMHEDDMHDGDEEEDDELLDVKPRKSHLDMKMLKSKARQRPASSKAMKKAMTKQHQQHAAFKKECKEDINEALDLAAAAVLHEGLSLQKAADRYDISKTVLWRRVRSNPAYMRIKREKPSLSEAYERLKNGDSLKSISQDLHIPMSTLHRHKVRLAAQGRLPDFVSCRRRDSTPKDELREKLAKAVHACTNGGMTQNHAANLFEIPKSTLWRHLQRRATEERKVKEEHEEEDDDVMN

Similar Transcription Factors

Sequence clustering based on sequence similarity using MMseqs2

100% Identity: iTF_00549654;
90% Identity: iTF_00546759; iTF_00568171; iTF_00568360; iTF_00573237; iTF_00573427; iTF_00549654; iTF_00554306; iTF_00545157; iTF_00545350; iTF_00551690; iTF_00479403; iTF_00559596; iTF_00516176; iTF_00551504; iTF_00473170; iTF_00559410; iTF_00516371; iTF_00554486; iTF_00520023; iTF_00544599; iTF_00472984; iTF_00540475; iTF_00544411; iTF_00549468; iTF_00479583; iTF_00519839; iTF_00540288; iTF_00572517; iTF_00572705; iTF_00532486; iTF_00532293; iTF_00502442; iTF_00502629; iTF_00493565; iTF_00599501; iTF_00599694; iTF_00493758; iTF_00586783; iTF_00586596; iTF_00509920; iTF_00509736; iTF_00476543; iTF_00476732;
80% Identity: iTF_00546759;