Basic Information

Insect: Chalcosyrphus nemorum
Gene Symbol: pol_1
Assembly: GCA_949716465.1
Location: OX454333.1:72927176-72932542[-]

Transcription Factor Domain

TF Family: HTH
Domain: HTH_psq domain
PFAM: PF05225
TF Group: Helix-turn-helix
Description: This DNA-binding motif is found in four copies in the pipsqueak protein of Drosophila melanogaster [1]. In pipsqueak this domain binds to GAGA sequence [1].
Hmmscan Out: # of c-Evalue i-Evalue score bias hmm coord from hmm coord to ali coord from ali coord to env coord from env coord to acc

1 4 2.1e-10 2.4e-07 30.5 0.0 5 37 1 33 1 40 0.91

2 4 4.8 5.6e+03 -2.7 0.0 14 22 119 127 115 130 0.68

3 4 8.3 9.7e+03 -3.5 0.0 29 38 226 235 220 237 0.76

4 4 2.3 2.7e+03 -1.7 0.0 23 36 404 418 400 423 0.76

#	of	c-Evalue	i-Evalue	score	hmm coord from	hmm coord to	ali coord from	ali coord to	env coord from	env coord to	acc
1	4	2.1e-10	2.4e-07	30.5	5	37	1	33	1	40	0.91
2	4	4.8	5.6e+03	-2.7	14	22	119	127	115	130	0.68
3	4	8.3	9.7e+03	-3.5	29	38	226	235	220	237	0.76
4	4	2.3	2.7e+03	-1.7	23	36	404	418	400	423	0.76

Sequence Information

Coding Sequence: ATGGATGAAGCAATGGAGAAGGTTCAAAATAAAACGTTGGGAGTAAATGAAGCAAGTAGGGAGTTCAATATTCCATCCAGAACCCTGAGGAGACACATTCTAAAAGGCAAGTCAAATAAATTGCTTGGTCGGTCAACTGCTTTATCATTGGAGCAAGAAAAAATATTGGTTGCccacataaaaaaattggaaaaagttgGTTTTGCTCCTGACCGAAAAGACGTTAAAGAAATCGCTTATCGTTTCGCCGATCGTCTTGGATTAGCACACCGTTTCTCAAACGACATTAAGGCGGCTGGTAATGTTTGGCTTAATGGTTTCTTAAAACGTAATCCAGAGTTATCAATAAGGAAATCTGAAGGCCTATCGCTAGCAAGAGCCTATGGTATGAATCGAGCTGACGGTAAAGACTTTTTCGACGTATTAAAAACTATATACCAAGAGCATGATCTTCTAAAGAATCCTGGTAACATATACAATATGGATGAGACAGGAATCCAAGTCAACAACAAACCAGCAAAGGTTTTGGCATCAAAAGGAGCTAAGGATGTTTTTACTCTAACAAGTTCCGAAAAAGGAGAAAACGTTACTGTCATAGCCTGGTGCAATGCTAAAGCTAAGTTGGAAGCGAATGGAGGAGTTCGATTCATTAACCAGGAATTGGCAAGGCACTTCCCGCAGAGGACGTTGGAAGCGATAAAGAAAGCTAGGCAGAAAGCTACATATCGCTCCGACGGCGACGCGGGATGCGTCCAGTTCTTCAACACCTTCGACACCAGGAATGGATGCGACCTTTTGATCCAACATCTTCAGGACCTCCCTTCACTTAGCGTAACCACATACAGCAGCGGTCATCTATACAACATCATCCAGGAAGCCGCGTCAGCCGGGAGGGACGCGGCGACAATACTCCTTGGCCTTTACTTAAAGGAGATCCTTCCATCAGGAACCACTGCACCTAGAGCGCGAGACCGTGCAGCAGCTGGAGGCGATAACACCAGTAGAAGGAAACTGAGGCGTATGGAATACAGCAGAACCCAACGGAATTGTTCGAAGCACCAACAGAGGTGCATCAAGACGATTCTTGAGCTTCCCAGTGTAGCCAGGATGCCACCCGCCAACATTATGGAGCCCTACTGGCGAAGGATCATGGAGCAAAGGACAACATCAGCACCAGCCTACTCGACTCGGTTGGACACCCATCACGGAAGCAGACATCAAGGACTCCCGGCCGCCACTCTCTACATCACCAGGACCGGACGGGGTCTCGGCGAGGCAGCTCAGAGCGATTCCCAATGA
Protein Sequence: MDEAMEKVQNKTLGVNEASREFNIPSRTLRRHILKGKSNKLLGRSTALSLEQEKILVAHIKKLEKVGFAPDRKDVKEIAYRFADRLGLAHRFSNDIKAAGNVWLNGFLKRNPELSIRKSEGLSLARAYGMNRADGKDFFDVLKTIYQEHDLLKNPGNIYNMDETGIQVNNKPAKVLASKGAKDVFTLTSSEKGENVTVIAWCNAKAKLEANGGVRFINQELARHFPQRTLEAIKKARQKATYRSDGDAGCVQFFNTFDTRNGCDLLIQHLQDLPSLSVTTYSSGHLYNIIQEAASAGRDAATILLGLYLKEILPSGTTAPRARDRAAAGGDNTSRRKLRRMEYSRTQRNCSKHQQRCIKTILELPSVARMPPANIMEPYWRRIMEQRTTSAPAYSTRLDTHHGSRHQGLPAATLYITRTGRGLGEAAQSDSQ

Similar Transcription Factors

Sequence clustering based on sequence similarity using MMseqs2

100% Identity: -
90% Identity: -
80% Identity: -