Basic Information

Insect: Philonicus albiceps
Gene Symbol: -
Assembly: GCA_963969385.1
Location: OZ017772.1:52835271-52836656[-]

Transcription Factor Domain

TF Family: HTH
Domain: HTH_psq domain
PFAM: PF05225
TF Group: Helix-turn-helix
Description: This DNA-binding motif is found in four copies in the pipsqueak protein of Drosophila melanogaster [1]. In pipsqueak this domain binds to GAGA sequence [1].
Hmmscan Out: # of c-Evalue i-Evalue score bias hmm coord from hmm coord to ali coord from ali coord to env coord from env coord to acc

1 3 7.9e-14 1.1e-10 41.9 0.0 2 44 262 304 261 304 0.93

2 3 0.0045 6.1 7.5 0.0 8 38 315 344 311 349 0.76

3 3 1.5e-16 2.1e-13 50.6 0.0 5 38 371 403 369 406 0.95

#	of	c-Evalue	i-Evalue	score	hmm coord from	hmm coord to	ali coord from	ali coord to	env coord from	env coord to	acc
1	3	7.9e-14	1.1e-10	41.9	2	44	262	304	261	304	0.93
2	3	0.0045	6.1	7.5	8	38	315	344	311	349	0.76
3	3	1.5e-16	2.1e-13	50.6	5	38	371	403	369	406	0.95

Sequence Information

Coding Sequence: ATGAACCATTTGAAGTGGATGGGCCACACCGATACGGTCCTAGAAATCCAGCGGGGCCTCTACACCGACTCGAGCACCTGTGACGTGACCGTGTCTTGTGGCCATGGCGAAAAGTCCCACCAGGCGCACAGATTTATCCTGTCCTCGTGCAGCGACTACTTCCGCGACATGCTGGCAGACATTCCCAACGACCAGGAGACGACAATTATTATTCCGGACCTCAAAGAGGCGATCCTGGACAGCGTGCTCAAGTTTATCTACTTGGGCGAAGTGTCCGTGAGATCGTCTAACCTTTCCGAATTCCTCGAGACCATGAATCTGCTCGGGATTAAGAGCGCAATCAGTTTCGATTGCCACCTGAACAAGAGGAAACCGACGAGCGTCTTCACCCCCGTCGAAGTCGAGACTATTGAGGTCGACAAGACGCCCCCCACTGAGGACGAGGAAACTGCCCCGGTGGAGAGCTGCGCCCCAAAGGACTTCGAATACTTGGAGGTGTACAACGATGAAGCAAAGATCGGACAATTCACGATAGAGCACATAGAGCAGGATTCCAACGGCGATTACATTTTGGGGGATAACTCTGAAAATTCCTTCCATCTAGCCGCTGAGGAGAAGAGCGGTGATATTAAAAACTCAGACTCGCTGCAGTTTAACGAGGACACCGCTGGCGACGATATCGTCATGAAGGAGGAGGACGACGAGGAGgaggaagaagaaaaatctCTGGATGAAAAAGATAAAGTGGACACCTCCTCTTTCAGTGATCTGATGCAAACACGAAACGCTGCATTTGAAGGGGCTGCCCGGGCGGTAATTGAGTGCGGCATGAGTCTCCAAAAAGCAGCCACAAAATTCAACATATCCAAAACAGTTCTCTGGCGGCGAGTGAAGAAACACCCTCAGTACAAAATATACAGGGAAAATCCGATTATAGTATCCGCGATTGAGAAACTCCAAAGAGGGGAATCTCTGAAGAGTATTAGCTCCGCCCTGGACATACCCATGTCAACCCTTCACAGACATAAAATGCGCCTCCACCAGGAGGGTCGTCTGCCCGAACATATGCAGGTTAAGAAGCGCGACTCCAAAGAGACCCTGAAGATGCGTCTCTCGAAAGCCGTTGAAGCATGCCGGCAGGGCATGTCCCAGAATCATGCAGCGAACGTGTTCGGTGTCCCCAAATCGACACTGTGGAGGCACCTTCAGAAGCAGAAGATAAAGGGCGAAATTATAGAAGAAGTCTCCCTCTCAATAGCCTCCTTTGCGAAAGATAAACAAGTAGTAAAAGAGGAACCAGACAGAGAAGATCCACTGCCGAGCTAA
Protein Sequence: MNHLKWMGHTDTVLEIQRGLYTDSSTCDVTVSCGHGEKSHQAHRFILSSCSDYFRDMLADIPNDQETTIIIPDLKEAILDSVLKFIYLGEVSVRSSNLSEFLETMNLLGIKSAISFDCHLNKRKPTSVFTPVEVETIEVDKTPPTEDEETAPVESCAPKDFEYLEVYNDEAKIGQFTIEHIEQDSNGDYILGDNSENSFHLAAEEKSGDIKNSDSLQFNEDTAGDDIVMKEEDDEEEEEEKSLDEKDKVDTSSFSDLMQTRNAAFEGAARAVIECGMSLQKAATKFNISKTVLWRRVKKHPQYKIYRENPIIVSAIEKLQRGESLKSISSALDIPMSTLHRHKMRLHQEGRLPEHMQVKKRDSKETLKMRLSKAVEACRQGMSQNHAANVFGVPKSTLWRHLQKQKIKGEIIEEVSLSIASFAKDKQVVKEEPDREDPLPS

Similar Transcription Factors

Sequence clustering based on sequence similarity using MMseqs2

100% Identity: iTF_01183951; iTF_00628502; iTF_00937190; iTF_00937426; iTF_00628158; iTF_01256330; iTF_01256519; iTF_01049804; iTF_00717925; iTF_00717657; iTF_01049567; iTF_01461303; iTF_01461060; iTF_00936701; iTF_00936464;
90% Identity: iTF_00717657;
80% Identity: iTF_01183951;