Basic Information

Insect: Lucilia cuprina
Gene Symbol: -
Assembly: GCA_001187945.1
Location: JRES01000318.1:139160-141037[-]

Transcription Factor Domain

TF Family: HTH
Domain: HTH_psq domain
PFAM: PF05225
TF Group: Helix-turn-helix
Description: This DNA-binding motif is found in four copies in the pipsqueak protein of Drosophila melanogaster [1]. In pipsqueak this domain binds to GAGA sequence [1].
Hmmscan Out: # of c-Evalue i-Evalue score bias hmm coord from hmm coord to ali coord from ali coord to env coord from env coord to acc

1 4 5.6e-08 8.8e-05 21.8 0.0 8 39 405 436 402 441 0.86

2 4 2.1e-14 3.4e-11 42.4 0.0 5 44 456 495 453 496 0.93

3 4 0.01 17 4.9 0.0 27 38 525 536 521 542 0.88

4 4 2.3e-15 3.6e-12 45.5 0.0 4 41 564 601 564 603 0.92

#	of	c-Evalue	i-Evalue	score	hmm coord from	hmm coord to	ali coord from	ali coord to	env coord from	env coord to	acc
1	4	5.6e-08	8.8e-05	21.8	8	39	405	436	402	441	0.86
2	4	2.1e-14	3.4e-11	42.4	5	44	456	495	453	496	0.93
3	4	0.01	17	4.9	27	38	525	536	521	542	0.88
4	4	2.3e-15	3.6e-12	45.5	4	41	564	601	564	603	0.92

Sequence Information

Coding Sequence: atgaataatttaaagtGGATGGGCCATTCGGCCACAATATtagatatacataaaaatttacgaGCCGATCTAAAGAGTTGTGAAGTGACTCTGGTGGCTAAGGGACACTGTGTTAAGGCTCATCGTTTTGTTTTATCCTCCTGCAGTGATTTGCTACGTTGCCTGCTGACGGATGTGCCCATTGGCCAGGAATGTTGTGTAATGGTGCCCGATATAAAAGGCCACTTGCTAGACAATGTATTGGCATTTATATATTTGGGTGAATGTTCTCTGTCATCCACCAATTTGTCGGAGTTTTTGGAAGCCATTAATATATTGGGCATTAAAAGTGCCATTAGTTTTGAGTGCAATACGAATGCTTTACAGACTGCTCAGAATTCCCAGCAAAATAGTATTACACTGGATGGTGCAAGTACTTCGATGGCACCGGTAAGTAGTACATCTTTGGGCAGTAGTCGTCAAGTGTCAGTGGCAGCAACAGTTGAGGCCACATTGCATCAGGAGGAAATTATTGAGACACAAAGTGTTATGCATACTGAAGCCAATACACCAACCACTAGCAATAGTGCCACTAATCCTGGCGCAAATCGAGAACTGGACTTTTTGGATGTGTATCATGAACCTCAACACAAAATTACCTATTCCATAGAACATGTTCCTGGTTCAACCGCTGGTAATGAGTTTATTTTAACCGAAAACTCTGGCACCTTTACACTAACACACAGTGGCAAATTGGAACCTACATCATCGCCGGCAGAATCCTCTAATATGGAAGTTACCGAAGATGATAACTGTGAATCTCATATTATAGAAGAATACAGTAGTGGCGATGAACCTTTAATACAAATTGGTGAAACAGCACAGGAACATCATGTTACTGTAGTACAACAGCcgccacaacaacaacatcataatCAGACCAATACAATACCCATTTCCAGTACAGCAACAACTACCACATCCATAATACAAGTAAAACCAAAAATGAAATCACTTAAGCTAAAACATCAGCCAGCAACACAACAGATTATAACGAAAATGGAACAACTTGCGGAGGATACTCCACCAGACGATCCCATCTCAATACTACAAACATCAAATGAAAGTTTTGCCCTGCTCAAAGATGCCAGCATGATGTCCACCAGTAATACTAGTCATGAGGAATCAACGGATTTTTCCCTAAACAATTCAGGTCCTTCGGCCACCGAATTGGCCTATCAGGCTATGGTTAATGAAGGCATGTCCTTGCCAAAGGCGGCagataaatttaatgtttcaaaGGCAGAACTATGGCGTCGTGTACGCAGCACGGGAGTGGAACAGCAAAACAAATCAATCAAACTAGATCCCGACAAGATAGATGTTATAGAACTAGCTAGCAAGGCTGTCATAAATGAGGGTCTTTCTCTGCAAAAGGCTGCCATACGCTATGACATTTCAAAGACTGTACTCTGGCGACGAGTACGCAAGCATCCACAATATATGAAGACGGCCAGAGAAAATCCCATAATATCCAAGGCTTATGAACGTCTAAAATCGGGTGAATCACTTAAGAGTATATCACAAGATCTCGATATACCCATGTCCACTTTGCATCGTCATAAAGTGCGACTTTCGCAAACTGGCCAATTACCAGATTTTGTAACGTGTAAGAAACGTGATAGCATGTCCAAAGATGATCTTAAGCTGAAACTAGCAAAAGCTGTGCATGCCTGCGTCCATGAGGGTATGTCACAAAATCATGCCGccaatttgtttcaaatttccAAAAGTACTTTGTGGCGTCATTTGCAAAAACGTGTAGCCGAAGCTGAGGCCGCCGAGACAGAGTCAATGGGCGATGATGATGAAATTAAGCAGGAGGTGATACTTTCATAA
Protein Sequence: MNNLKWMGHSATILDIHKNLRADLKSCEVTLVAKGHCVKAHRFVLSSCSDLLRCLLTDVPIGQECCVMVPDIKGHLLDNVLAFIYLGECSLSSTNLSEFLEAINILGIKSAISFECNTNALQTAQNSQQNSITLDGASTSMAPVSSTSLGSSRQVSVAATVEATLHQEEIIETQSVMHTEANTPTTSNSATNPGANRELDFLDVYHEPQHKITYSIEHVPGSTAGNEFILTENSGTFTLTHSGKLEPTSSPAESSNMEVTEDDNCESHIIEEYSSGDEPLIQIGETAQEHHVTVVQQPPQQQHHNQTNTIPISSTATTTTSIIQVKPKMKSLKLKHQPATQQIITKMEQLAEDTPPDDPISILQTSNESFALLKDASMMSTSNTSHEESTDFSLNNSGPSATELAYQAMVNEGMSLPKAADKFNVSKAELWRRVRSTGVEQQNKSIKLDPDKIDVIELASKAVINEGLSLQKAAIRYDISKTVLWRRVRKHPQYMKTARENPIISKAYERLKSGESLKSISQDLDIPMSTLHRHKVRLSQTGQLPDFVTCKKRDSMSKDDLKLKLAKAVHACVHEGMSQNHAANLFQISKSTLWRHLQKRVAEAEAAETESMGDDDEIKQEVILS

Similar Transcription Factors

Sequence clustering based on sequence similarity using MMseqs2

100% Identity: iTF_00199788;
90% Identity: iTF_00922023;
80% Identity: iTF_00921517;