Basic Information

Insect: Chloromyia formosa
Gene Symbol: pol_2
Assembly: GCA_964017055.1
Location: OZ024817.1:53141557-53172216[-]

Transcription Factor Domain

TF Family: PC4
Domain: PC4 domain
PFAM: PF02229
TF Group: Unclassified Structure
Description: This domain is found at the C-terminal end of Activated RNA polymerase II transcriptional coactivator p15 from humans, YdbC from Lactococcus lactis, and other PC4 family members. p15 has a bipartite structure composed of an N-terminal regulatory domain and a carboxy-terminal cryptic DNA-binding domain [1-4]. Activity is controlled by protein kinases that target the regulatory domain.
Hmmscan Out: # of c-Evalue i-Evalue score bias hmm coord from hmm coord to ali coord from ali coord to env coord from env coord to acc

1 1 2.9e-13 3.2e-10 40.5 0.1 1 43 1887 1929 1887 1932 0.94

#	of	c-Evalue	i-Evalue	score	bias	hmm coord from	hmm coord to	ali coord from	ali coord to	env coord from	env coord to	acc
1	1	2.9e-13	3.2e-10	40.5	0.1	1	43	1887	1929	1887	1932	0.94

Sequence Information

Coding Sequence: ATGTCTGAAGCGGTGTTAGGTGATGATGATCAAAGGAGGTCTCAGACAGGGACCATCCCGAAAGACCTTGGTCCTGTCACTCGGGCTCGATCTAGAATGCAAAGGGCGACATCTCCCAAAAGGGGCTCCCGACTTGAGCCTATTATTCAAAGGGAAGCTCAGCGAGAGCGGTCTTTTGATTTGGGACGGAGATCTCGAGTTGAGAATTTGGAGACTGAAGACGGGAACATTCCCGTTACTACAGGCTCTCTTGACTTAACTCTTAAATCACAAATTAGAGAGTTGATTGGAGAAGTGCTCCGTGAGCAATTAAATGAATTTTCTTGCAATCAAACTGCAAAGAAAATCAGTGATCCATCGAACTCCAGTCGAGAAGGGAACGCGATAGTTAGCCATGCTCCTCCAGCTGTCCCCATGCCCGAACAGTTAAATGTTGCTTCGAATATAATTCGGGATAACAATGTGCAGCGTGGCCGGgagtttactattccatatcagATGGTGGATAGAGACATGAATGCCTATCACGAGGTACCGAGAGGGGTTGCACCGTTAGCACAACGATTGTCGCACCCAAGTTTAAACGTTCCTCGTACAGGGGCCTCTGATGTGCGTTACGTGCCGTTAGTGAGGAATTCGCCTGCGGCTAATATTTCTCGCGACTCGTCTTTGACGTCTCGGAGGGCCGATCACCCTAGTAGCCATCAGACTTTCGTATCGGAAGCGCATAACCAAAACGCGTTATTTACACCAGTTACAGGATTTCCTCTCGAAAAAGTGGCTCGTATTATCAGTAGTTGGAACCTGCACTTCAGCGGAGAAAATCCACACTTGTCGGtggaaaaattcctcttccaagTTCGGACTTTGGCGAATCATACGTTAAATGGACAGCTCCAACTTGTAACCAATTATTTGCACTTGCTGCTGGTTGGCAAGGCGGCCAATTGGTTCTGGAGATTCCATAGAGCCATCATAAGATTCGATTGGGATCAGTTTTGTGAAGCCCTACGGGAACAGTTCCAAGAAAGACTGTCGGACTACGACTTAATGGAAATGATTCGTAACAAAAAACAGGGTCAGTCTGAGTCTTTTGATGCGTTCTATGAGAGTATCATGGAACTGGCTGACCGCCTTGCTTTACCGGTAGCAGAGTGGGAGCTCATAGAAATCCTTCGCAGAAACGTAAAAATGGGACTTCGTTGCCATCTACTAAATGTCCCTATTTATTCCGTGAGACAGCTACGCACCCTAGTATTTCATTGGGAAAAACTACAGGAGGAAATTACACCTACCTTCCCACCAGATCGGATGATTCCATCAAGGAGGAATATCTCCGAGATGGTTATGACAGACCCGGCTATCCCAGTCGATGATTCTGGTCCCGAATTTGTCTCCGCCATCGGTGACAAAATGATTTGTTGGAACTGTCGCAACGAGGGACATCGTTTTGACGAGTTCACCAAAAAACGGGATGAGATCGAGGGTCCCAAACAGGAACCGACCCTCGATTCCACCACCGAATACGAAGGAAGTGACTCCTCAATAACACCTGCTTCTGTAACCATACCAGACACACTAGTCAAGACATCTCCTAATACTGTGGGTTTGTCTCGGGATTCTACCTCAACCCTGACAGTATCAATCAATCCGTCTTCTACATTTAAGGAGAAAAACAAGACCCGGAGTCACCACAGCTTCAAACCTTGGCACGTGCGTTGGCAGGAATACCAAGCCGcgcgcgaccgaatttttaaagCGGAAGAGATTTCGTTGCGTCGTTCTAAGCGTTCGACTTTGCGTTGGCGAGCTTTTTGGAAACGGATTAAAGAAGCTCGTCGATTTTATTGTTCAGCCTTCTGTTCTAGCTCCCAACTAACCGACGTACGCCCTTATGCGGAAGTTTCGTTGTTGGGGGAACCAGTTTCGGGGCTTATCGACACAGGTGCCACTATTAGCTGCTTAGCTTCTGACTTGGCAAAAAGATTCATCAAAGAGAATAAATTTAGTTGGGAACGGTTTAAAGTCAATGTCAACACTGCTGATGGGACGGCGCATTCCGCTATCGGAAGGGTTGCCGCAGATATTACTTTTAAGGGTAGGACTCAGACGATGACATTTTTAATCATTCCTTCCTTGTCACAACAGCTATATTTAGGAGTGGATTTTGTTCGGCTCTTCGATTTGGCCTCGGACTTATTCGTGTCTTCTTTGCGATCAGAGTTTCCGGCTGATACCTCATGTCATAATAACGACAACCGACATACCTTGACTGCAGCCCAACAGAACAAACTTAATGCGGCGATTGCGATGTTCCCCTCGTTTGCAGTGGAGGGTTTGGGACACACAGATTTAATCAAGCACGTCATTGACGTGGGTGAAAATAAGCCCATCAAACAACGGCATTTCGCTGTTTCTCCCGCTGTGGAGAAACAGCTTTACAGCGAGATTGACCGCATGCTGGCTCTTGGCGTTATAGAGGAGTCTCAAAGCGCCTGGTCGTCGCCAGTAACTTTGGTAGTGAAACCTGGGAAGGTCCGCCTATGCCTGGACGCCCGAAAGGTAAACTCAGTCACAGTGAAGGATGCTTATCCCTTGCCACTCATCGAGGGTATATTGAGTAGGCTCCCTAAGGCTAAATTTATTACGAGTTTAGacttaaaggatgccttttggcagatacctcTGGATGAGTGTTCTAGGGATAAAACCGCCTTCACTGTACCagggaggccgttgtatcagttcgtgactatgccgttcggactgtgcaacgcgcctcaaacGATGCAACGACTGATGGATCGGGTGATTCCAGCCCACCTTCGCCACCAGGTGTTCATTTATCTCGATGACCTGTTGCTGGTGACTGAGACTTTTGAGGAGCATCTCCTTTTATTACAGGAAGTTGCTTTATGCATGAGGAAAGCTGGACTTACTCTGAACGTTGAGAAGTCCAAATTCGTAATGAAGGAAGTACGATATTTGGGACACCTTATTGGAGACGGTACTATCCGCACAGATCCTGACAAAGTACAGGGAATTGCTGAATTTCCGCGCCCAAAGACCATTAAGCAATTACGACGTTTTCTGGGCATGTGCGGGTGGTATCGTCGCTTTATAGATAACTTTGCTACATTGGCGTCTCCGTTGACAGATATGTTGAGCCGAAAACGTGCATTTAGTTGGACGGAAGACGGGCTCAAAGCTTTCGAGGCTTTAAAGGCAAGTCTGACTTCCGCGCCCGTTTTGCAAAGCCCAGATTTTAAGCGACCCTTTTCGATACACTGCGACGCTAGTCAATTTGGAATTGGTGCCGTTTTAGTGCAGACTTCAGATGATGGCGTTGAAGTACCGGTCGCTTATATGTCTCAAAAGCTAAACTCCGCCCAACGTAATTACACGGTTTCGGAACAagagtgtctggcagcggtggcggcaataaaaaaatttcgcgcTTACGTGGAGGGCTACGAATTTGAAATCGTCACCGATCACGCCTCGTTAAAATGGCTGATGTCATTAACGGATCTGCACGGCAGATTGGCCCGGTGGGCCTTAAAACTTCAGGGTTTTCGGTTCACGATTAAACATCGTAGAGGTAACCAACACATTGTTCCGGATACCTTGTCGCGTGTCCATGCTGCTGATGCAATTGAATCTCTTGCCTTGTTTGATCcttcgattgaagttgatttaaaTTCACCAGCTTTTAAAGCCGATTCATACACATCATTAATAGCAAAGATTGCGGACAAACAACGTTTACTTCCGGATATAAAAGTCATTGATGGTTTCATATATCGGCGTTCGGAATATGCGACCGGGGATGAAACTCAAGAGGAGAGTTCGTGGAGATTGTGGATTCCTCATGAATTGACGTCGACTTTGATAACACGCGCGCATGAACATCCTTTATGTGCACATGGCGGAATTGGTAAAACACTGAAACGCTTAAAAACGTTTTACTTTTGGCCACGAATGTCAATCGATGTTAAAAACTTTGTCAACGAGTGTGTCAAATGTAAGGAGACGAAGGCTACCCATGAAATACTCCGACCTCCTATGGGAAAACTGATTGTCCCCGATCGAATATTCCAACGCCTGTATGTGGACTTTTTAGGTCCTTACCCACGGTCTCGTTTAGGCAACATTGGAATCATCGTTGTTCTAGATCATCTTTCCAAGTTTACATTTGTGGAACCTATTCGTAAGATGACTGCAACAAATCTAGTGAATTTCCTTGAAAAAAGGATCTTTCACACATTTGGGGTTCCTGAATCTATAACGTCAGATAACGGTGTCCAATTCAAGTCTGCGTTGCTCAAAAGCTTTCTTGAATCTTATGGGGTAAAGCACATATTCACGGCCTTGTACTCGCCCCAGGCCAATGCCTCAGAACGAGTCAATCGATCATTGGTAGCTGGCATTCGCAATTATGTTCATCCAAATCAGAAGGATTGGGATGCCAAGTTGTCCTCTATCAATAGTGCTTTGCGCTCGGCAAATCATTCTTCCATCGGATTCTCCCCGTACTTTGCAGTGTTTGGTCAAAATATGGTTTCACATGGGGACACGTATTCACTGCTTAGGAGCTTGGATCTCCTTAATGAGCCAACTGCAAGTACGATAACTGAGAAAAAAGAGTTAATTCGAGCAAAAGTACAAGAAAATATTCGCCGAGCGTACGACACTAATGCTAGGATCTATAACTTGAGATCTAAACCGGTTGCGTACCAATTTCCCACCGACGAGAATGATCGAAAATTATGGGTGGAAAAAATTGGAGACGTTGCTTTGAGGAAAAGCAGTGTGATCTGTTCGGATCATTTCCACCCGGATATGAAAATAAGGATCTCCAATCGATCATTTCTGAGAGAAGGAGCCGTCCCCGAACTGAACCTCTGGAAACGAAAACCATCACCTTTAACAGAGTCGACTACTGCGGAGGGTTCGATATCGTCGGGAAGATTGATTTTGGAGAATTTCGGTCACCAGCCGTTGTATGGAGCATATGATGCTCATGCTGCGCATTCCAATTGGGCCAATTTGGATGTTCCAACAGATGCCATGAATAGTACGCAGCCAACCTTTACCGAACACATTGGGGAAGATCTGAACACAATGAGCGATTACATGATGGTTGACGTAATTGAcAAAATTGCCGACCTGTCGCAAGGATTGTTGCTCGGTGGCTTGAAACTACTCTACGACAATGCTGTTCGTGATATGAAAGTGGAGCGTAGTAAGCTGGGCTGGCGATTCGTTAATTTCGACAAGAATTTGGATGCAATGCAAAAGTCATTAGTAGTTTGGGGGCCGGAACTTTTGAACATGTACGTCGGTCAAAGTGAGCACAACATCCGGGAATTTTTCTCACGGGCACGATCTGCAGCTCCGTGTGTCCTGTTTTTGGACAAATTGGATTCACTGGCTCCGAATCGTGGTGTTGCTGGCGACTCAGGCGGTTTTATGGATTGGTTGTTCCAATCAGTCAATCGGGAAAACCAAAAATTGCCAAAGATCAAGAAAGTTTCCAGCGATAGCGACAGCGATTCTGGCCCCGAAGACAGAAATCCACCGGCAAAGAAGTTGAAGGACACCTCGGATGATAGCAAGAAGAGCAGCAGCGTTTCCGGCAACAGCGGTGAAAAGGAGTGGGTGCTGGAGAAGATGCGTCTGGTGCGTATAAACGAGTTCCGCGGTCGCAAGATGGTCGACATTTGCGAGCATTATGAAAAAGATGGCAAAATTCTTCCCGGGCGCAAGTGGATCTCGCTGCCTGCTGTTCAACGGGGCTATGTAGTGCGTTGCACAACGAGAAAATTCTATAAACGTGTTTTCCTTTACGAACAcatacaaaaacataaaaatccgGACACATTTAAGTGCCATTTTTTCGACAAAGTCTACTGCAGCGCATCTGTTCTGAGAAGTCATTTATTAACGCATGACGCCTCTTTCGAGAAATTGTACCAGTGCGATAAGTGCCCGCGACGATTTGCCAAACTATCCGTTCTAATCACCACAAAATTATACATATTCCCAAGGAGGAACATTCTTTCTCCTGTGATATCTGTGGTAAATCGTTTCCTTCCAAAAACACAATGCCGACACATAGGAAATCGGTTCACGAAAAGGCTTATTCGAAAATGTGTCACATTTGTGCTAAAGTCATTAACGGCAAAACACTTTTCGCCAAACATCAGTTAG
Protein Sequence: MSEAVLGDDDQRRSQTGTIPKDLGPVTRARSRMQRATSPKRGSRLEPIIQREAQRERSFDLGRRSRVENLETEDGNIPVTTGSLDLTLKSQIRELIGEVLREQLNEFSCNQTAKKISDPSNSSREGNAIVSHAPPAVPMPEQLNVASNIIRDNNVQRGREFTIPYQMVDRDMNAYHEVPRGVAPLAQRLSHPSLNVPRTGASDVRYVPLVRNSPAANISRDSSLTSRRADHPSSHQTFVSEAHNQNALFTPVTGFPLEKVARIISSWNLHFSGENPHLSVEKFLFQVRTLANHTLNGQLQLVTNYLHLLLVGKAANWFWRFHRAIIRFDWDQFCEALREQFQERLSDYDLMEMIRNKKQGQSESFDAFYESIMELADRLALPVAEWELIEILRRNVKMGLRCHLLNVPIYSVRQLRTLVFHWEKLQEEITPTFPPDRMIPSRRNISEMVMTDPAIPVDDSGPEFVSAIGDKMICWNCRNEGHRFDEFTKKRDEIEGPKQEPTLDSTTEYEGSDSSITPASVTIPDTLVKTSPNTVGLSRDSTSTLTVSINPSSTFKEKNKTRSHHSFKPWHVRWQEYQAARDRIFKAEEISLRRSKRSTLRWRAFWKRIKEARRFYCSAFCSSSQLTDVRPYAEVSLLGEPVSGLIDTGATISCLASDLAKRFIKENKFSWERFKVNVNTADGTAHSAIGRVAADITFKGRTQTMTFLIIPSLSQQLYLGVDFVRLFDLASDLFVSSLRSEFPADTSCHNNDNRHTLTAAQQNKLNAAIAMFPSFAVEGLGHTDLIKHVIDVGENKPIKQRHFAVSPAVEKQLYSEIDRMLALGVIEESQSAWSSPVTLVVKPGKVRLCLDARKVNSVTVKDAYPLPLIEGILSRLPKAKFITSLDLKDAFWQIPLDECSRDKTAFTVPGRPLYQFVTMPFGLCNAPQTMQRLMDRVIPAHLRHQVFIYLDDLLLVTETFEEHLLLLQEVALCMRKAGLTLNVEKSKFVMKEVRYLGHLIGDGTIRTDPDKVQGIAEFPRPKTIKQLRRFLGMCGWYRRFIDNFATLASPLTDMLSRKRAFSWTEDGLKAFEALKASLTSAPVLQSPDFKRPFSIHCDASQFGIGAVLVQTSDDGVEVPVAYMSQKLNSAQRNYTVSEQECLAAVAAIKKFRAYVEGYEFEIVTDHASLKWLMSLTDLHGRLARWALKLQGFRFTIKHRRGNQHIVPDTLSRVHAADAIESLALFDPSIEVDLNSPAFKADSYTSLIAKIADKQRLLPDIKVIDGFIYRRSEYATGDETQEESSWRLWIPHELTSTLITRAHEHPLCAHGGIGKTLKRLKTFYFWPRMSIDVKNFVNECVKCKETKATHEILRPPMGKLIVPDRIFQRLYVDFLGPYPRSRLGNIGIIVVLDHLSKFTFVEPIRKMTATNLVNFLEKRIFHTFGVPESITSDNGVQFKSALLKSFLESYGVKHIFTALYSPQANASERVNRSLVAGIRNYVHPNQKDWDAKLSSINSALRSANHSSIGFSPYFAVFGQNMVSHGDTYSLLRSLDLLNEPTASTITEKKELIRAKVQENIRRAYDTNARIYNLRSKPVAYQFPTDENDRKLWVEKIGDVALRKSSVICSDHFHPDMKIRISNRSFLREGAVPELNLWKRKPSPLTESTTAEGSISSGRLILENFGHQPLYGAYDAHAAHSNWANLDVPTDAMNSTQPTFTEHIGEDLNTMSDYMMVDVIDKIADLSQGLLLGGLKLLYDNAVRDMKVERSKLGWRFVNFDKNLDAMQKSLVVWGPELLNMYVGQSEHNIREFFSRARSAAPCVLFLDKLDSLAPNRGVAGDSGGFMDWLFQSVNRENQKLPKIKKVSSDSDSDSGPEDRNPPAKKLKDTSDDSKKSSSVSGNSGEKEWVLEKMRLVRINEFRGRKMVDICEHYEKDGKILPGRKWISLPAVQRGYVVRCTTRKFYKRVFLYEHIQKHKNPDTFKCHFFDKVYCSASVLRSHLLTHDASFEKLYQCDKCPRRFAKLSVLITTKLYIFPRRNILSPVISVVNRFLPKTQCRHIGNRFTKRLIRKCVTFVLKSLTAKHFSPNIS

Similar Transcription Factors

Sequence clustering based on sequence similarity using MMseqs2

100% Identity: iTF_00322611;
90% Identity: iTF_00322611;
80% Identity: iTF_00322611;