Basic Information

Insect: Melanostoma scalare
Gene Symbol: -
Assembly: GCA_949752695.1
Location: OX456984.1:158779432-158781292[-]

Transcription Factor Domain

TF Family: HTH
Domain: HTH_psq domain
PFAM: PF05225
TF Group: Helix-turn-helix
Description: This DNA-binding motif is found in four copies in the pipsqueak protein of Drosophila melanogaster [1]. In pipsqueak this domain binds to GAGA sequence [1].
Hmmscan Out: # of c-Evalue i-Evalue score bias hmm coord from hmm coord to ali coord from ali coord to env coord from env coord to acc

1 3 1e-13 1.4e-10 42.6 0.0 3 43 294 334 292 336 0.91

2 3 0.033 45 5.8 0.0 27 37 365 375 356 380 0.87

3 3 7.5e-16 1e-12 49.5 0.0 4 40 404 440 402 443 0.92

#	of	c-Evalue	i-Evalue	score	hmm coord from	hmm coord to	ali coord from	ali coord to	env coord from	env coord to	acc
1	3	1e-13	1.4e-10	42.6	3	43	294	334	292	336	0.91
2	3	0.033	45	5.8	27	37	365	375	356	380	0.87
3	3	7.5e-16	1e-12	49.5	4	40	404	440	402	443	0.92

Sequence Information

Coding Sequence: atgaatcaCTTAAAATGGATGGGCCACACGGCGACCATCCTTGATATACAAAAAGCTTTGAAGAATGATCCAGCAACGTGTGACATTACACTTACCTGCAGAGGTAAATCTGTAAGAGCTAATCGTTTTGTTCTATGCTCCTGTAGTGATTTACTGCGTGATATTTTAAATGATGTGCCCGTTGGACAGGAGGCAACCATAATAGTGCCAGACATTAAAGGTTCACTCCTTGACAGTGTTTTGAGTTTCGTGTATATGGGAGAGACGAGCCTATCTTCAACAAATCTGTCAGACTTTCTAGAGGCTATCAACGTTCTTGGaataaaaagtgcaataagcttTGAATGTGCCAGCAGTTTTCACAGTACCAACATCAAGACTGTTACGGAAATGGCAGAGATGGAAGAGGAACTTATGGAAGCTGAACCAGAGCAAGAACTAGTTGAAAAGGACGATGAAGAGgaTCAAACAGGTCCAGAGGGTGGAAGTGTGCGTGAATTAGAGTTCCTTGAGGTCTACAACGAGCAAGAAAAAATCAGCTACACCATAGAAAATATCGCACCAAACAATCCAAATGAATATATTCTTACAGAAAGCTCTGGAACATTTACTCTTACACCAAATGCAAAAATAGAATCTAGTAGAGATGGCAACCTTGTAGAGAAGCAAGAAGATGATAATCAATTGATGGACCATTATGTTAACGATCCTATAGGGGACAGCAGCCAGTGTTCCAGCAACgaaatgaaagaaataaaacctGAAAAGAAACTCAAAGATGAGTTTAGTGGATTTCAAGCACTTAGCCCGGTAGAAAGTAAGGATGGCAAAGTAACAGCaaactatcaaaattttaatgaaaccCAATCGGCACGCGTAGAGGCATTAGAAAATGCAGTTCTGGCTGTTGTCGATGAAGGCATGAGTTTACAAAAGGCCGCAATTAAGTTCAACATATCAAAGACTGTACTGTGGAGAAGGGTAAAAAAGCACCCGTTGTATATGAAAACAGCCCGAGAGAATCCTTTAATTACCGCCGCCTGTGAACGTCTTAAAAATGGAGATTCATTAAAAAGTATCAGCCAGGCATTAGACATACCAATGTCCACTCTGCACAGACATAAAGTAAGATTAGCTCAAGAAGGTAGGCTCCCCGAATATGTAACATTTAAAAAGCGAGGCCCTTTGTCAAAGGAAATGTTGAAAGCCAAACTTTCCAAAGCAGTAAATGCCTGTTTAGGGAATGGAATGTCTCAGAATCATGCAGCAAATGTTTTTGATGTGCCAAAGAGCACATTGTGGAgacacttgcaaaaaaaaatttaccggACAAAAGATGGTACCAACGCTCTGTGTATTAAGGAGGAAATTGTTATTCCAGaaaattaa
Protein Sequence: MNHLKWMGHTATILDIQKALKNDPATCDITLTCRGKSVRANRFVLCSCSDLLRDILNDVPVGQEATIIVPDIKGSLLDSVLSFVYMGETSLSSTNLSDFLEAINVLGIKSAISFECASSFHSTNIKTVTEMAEMEEELMEAEPEQELVEKDDEEDQTGPEGGSVRELEFLEVYNEQEKISYTIENIAPNNPNEYILTESSGTFTLTPNAKIESSRDGNLVEKQEDDNQLMDHYVNDPIGDSSQCSSNEMKEIKPEKKLKDEFSGFQALSPVESKDGKVTANYQNFNETQSARVEALENAVLAVVDEGMSLQKAAIKFNISKTVLWRRVKKHPLYMKTARENPLITAACERLKNGDSLKSISQALDIPMSTLHRHKVRLAQEGRLPEYVTFKKRGPLSKEMLKAKLSKAVNACLGNGMSQNHAANVFDVPKSTLWRHLQKKIYRTKDGTNALCIKEEIVIPEN

Similar Transcription Factors

Sequence clustering based on sequence similarity using MMseqs2

100% Identity: iTF_00311727;
90% Identity: iTF_00976669;
80% Identity: iTF_00976669;