Basic Information

Insect: Lucilia sericata
Gene Symbol: grh_1
Assembly: GCA_015586225.1
Location: NW:846836-985276[+]

Transcription Factor Domain

TF Family: CP2
Domain: CP2 domain
PFAM: PF04516
TF Group: Beta-Scaffold Factors
Description: This family represents a conserved region in the CP2 transcription factor family.
Hmmscan Out: # of c-Evalue i-Evalue score bias hmm coord from hmm coord to ali coord from ali coord to env coord from env coord to acc

1 1 4e-63 2.9e-59 199.7 0.2 24 221 794 986 780 988 0.94

#	of	c-Evalue	i-Evalue	score	bias	hmm coord from	hmm coord to	ali coord from	ali coord to	env coord from	env coord to	acc
1	1	4e-63	2.9e-59	199.7	0.2	24	221	794	986	780	988	0.94

Sequence Information

Coding Sequence: ATGTCATCATCGCCTGCTACAACAAGTGTAATAACTGCTAACGAACTTGCTTTGACGGCTGCCCAAGCCAATATGCATCATCGTGGTGGACACATGAATGAGGCACCTCTTTCGCCGGCTCGTGCTAATTCCGTATCGGTGGCTGGTGCAACTGGCACAACGACAGGAAATATAGTGACAACAAGTATGGCCAATTCGGGTGCTGGAACGGGCAATGGCTTGCCGTTGATATCACCGAATGCAATGCATCGTTCACCCGACAGTCCTCAGCCGGAATTGGCTACCATGACGAATGTAAATGTTTTAGACTTGCACACAGATTCATCCAAACTTTACGATAAGGATGCTGTTTTTATCTATGAAAGTCCAAAGGTGGTGATGACCGGTGGCAGTCAACAAGACGATCATGTCATTGATGCTCGCATGGTGGCTCAGTTAAATCAGCAACAGTCTGCTGTACAAACAGCTCACGAGAACCAACCTCTGGCCAAGATTGAGTTCGATGAGAATCAAATAATACGCGTGGTGGGTCCAAATGGAGAACAACAACAGATTATTTCGCGAGAAATCATAAATGGAGAACATCACATATTATCGCGCAACGAGGCTGGCGAACACATTCTCACTCGTATTGTTAGTGATCCATCAAAGTTGATGCCGAACGATAATGCTGTAGCTGCAGCCATGTTTAATCAGGCCCAGAAGTTGGCCAATGATCACAACGTCTACCAGACCTCGCCATTGGATGCTTCTGTTCTTCAACACTATGACTCCGAGGCAGTGGTTAAAACTGAAGTTGACATTTATGACGAACAAAAGAAACACAATGCAGGCCAAATTATCTACACTACATCTGATCAAGATGGCGGCGGCGGTGGTGGAGGTGGCAACACAAAACAATTGTCTCACTTGCCCATGGGTGCCAAACTGGACCCCGATATGTATCCGTCAGATAAACATATCGATTTGATCTACAATGATGGCAACAAAACAGTCATCTACACTACAACATCGGATCAGAAGGGCTTAGAAATTTATTCTGGCAGCGATTTAAGTGGTTTAGTGGCCGATGGCCAAGTCGTTGTACAAGGTGGTCTACAATATGCCGGTCCCGGCGGTGCTGGTGGTCAGCCCGTTTACATTGTATCAGATGGTGCCTTACCACCTGGAGTGGAAGGTCATATTCAAAGTGCTCCCAGTGCAAAGCTAAACGGTCAAACCACACCTCTTGATGTGTCGAGCCTATCGCAAAACGAGATACAAGGCTTATTGCTTGGCTCACACCCATCAGCAACTACGGCTGCTGTGGCGGCTGCTGCCGCAAATGTCACCACAACAACAACTCtagcacaacaacaacagcagcaacaacaacaacaacagcagcagcaatcaACCATAGTTAGTGCAGCTGGTGGGGGTACGGGTACAGTGGTCATAACAGCTGATCAACATCGTCAACAGGCCACCACAACCACGATAAACATTAAAAGGGAACCGGAAGATTTGCGTAAAGATCCTAAAAATGGTACCGCTAGTAATGGCTCAACAGCCAGTAGCGGACAAAAGGTTATTGTATTACAACAATCACCATCGCCCACACAAATACATATCAAAGAACCGCCACTTAGTCCTGGAAGCCCAACAAATCATACAGAAGCCATGTACGCTGCCGGCGGCGGCACTCAAATTTATCTGCAGGGTCCTCATCAAAACTCAGCAGCTGGACCGGGCAGCAATGTAAACACACAAACACCCAGCcctggaccttatataggagccgATGGCTATGGCATGTATACAACTAGTCGCTTGACAACAGCTCCAACCACCACATTCATCTCGGAACCCTACTATCGTGAATATTTCCCAACAGATGGTCAAGGTTATGCACCTACCCGCACTATATACGGCGACAGTGAAGGTCCCCATCCGGGCACCACTTATGAAGGACGTTTCACTACCACAACCACCAACAGTGGTGGTATACCACCTCCCCATCCATCGGCGAATGTAACGAAAAACAATGGCGGCACCCCCATCTATGCAAAGACAGTAACAGCTGCTGGTCTTACAGTCGACTTACCCAGTCCGGATTCGGGCATAGGAGCAGACGCCATAACACCGCGAGATCAAAACAATATACAACAGTCCTTCGATTATACGGAACTTTGTCAGCCCGGTTCATTGCTGGATAACAATGGCGGCATACCTGTTTCGGTTAATAGCATACAACGTGGTGCTGTTAGTGTCCATGGCGGCCAGAATAGTCCCACAACCTCATTAGGTGGCACCAGTGCTAATGGTAGTGCTACTCGTTCTAGGCCATGGCACGATTTTGGTCGACAAAATGATGCTGATAAAATACAAATACcaaaaatATTCACAAATGTTGGTTTCAGATATCATCTAGAGTCGCCAATAAGTTCATCCCAAAGACGAGAAGATGATCGAATAACCTACATCAACAAGGGACAATTCTATGGCATCACCTTGGAATATATACCCGATCCCGATAAGCCCATCAAAAATACAACAGTTAAGAGTGTGATTATGTTAATGTTCCGTGAAGAGAAATCGCCTGAAGATGAAATTAAAGCCTGGCAATTTTGGCACAGTCGACAACATTCTGTGAAACAAAGAATCTTAGATGCAGATACCAAGAACTCAGTGGGTCTAGTTGGCTGTATTGAGGAAGTCTCCCACAATGCCATAGCAGTCTATTGGAATCCTTTAGAAAGTTCTGCCAAgATAAATATCGCCGTGCAATGTTTAAGTACAGATTTTAGCAGTCAAAAGGGTGTGAAGGGTTTACCACTACATGTACAAATCGATACATTTGAAGATCCTCGTGATGCCCAAGTCTTTCATCGAGGCTATTgtcaaattaaagttttctgcGATAAGGGTGCCGAACGTAAAACTCGTGATGAGGAACGTCGTGCTGCTAAGCGTAAAATGACCGCTACGGGACGTAAAAAATTAGACGAACTTTATCATCCGGTTACAGATCGTTCAGAGTTTTATACAATGCAGGATCTTACCAAGCCGCCGGTATTATTTTCACCAGCCGACGATTTGGATAAGGGCTTCTATGGCCATGAGTCTGATGGAGCGCCAGATTTAAAAGGTGCCTCACCATTCCTCTTGCATGGACAAAAGGTAGCCACACCAACATTGAAATTTCACAATCACTTTCCGCCCGACATGCAGACTGACAAAAAAGACCATATTTTGGATCAAGGTTTAGCCATGGGTGAATTTGGACCTCCTTTGAAGCGTGGCCGCATGACACCGCCCACCAGCGAACGGGTTATGTTGTATGTGAGACAAGAAAATGAAGATGTTTACACCCCCCTACATGTTGTGCCACCCACCACCATCGGCCTCTTAAATGCGattgaaaataaatataaaatatccaCAACgagtataaataatatttatcgaACAAATAAAAAGGGgATTACGGCGAAAATTGATGATGACATGATTTCGTATTATTGCAACGAAGACATTTTCTTATTGGAGGTGCAACAACTGGAGGAGGAATTGTATGATATAACGTTAACAGAATTGCCAAACCACTGA
Protein Sequence: MSSSPATTSVITANELALTAAQANMHHRGGHMNEAPLSPARANSVSVAGATGTTTGNIVTTSMANSGAGTGNGLPLISPNAMHRSPDSPQPELATMTNVNVLDLHTDSSKLYDKDAVFIYESPKVVMTGGSQQDDHVIDARMVAQLNQQQSAVQTAHENQPLAKIEFDENQIIRVVGPNGEQQQIISREIINGEHHILSRNEAGEHILTRIVSDPSKLMPNDNAVAAAMFNQAQKLANDHNVYQTSPLDASVLQHYDSEAVVKTEVDIYDEQKKHNAGQIIYTTSDQDGGGGGGGGNTKQLSHLPMGAKLDPDMYPSDKHIDLIYNDGNKTVIYTTTSDQKGLEIYSGSDLSGLVADGQVVVQGGLQYAGPGGAGGQPVYIVSDGALPPGVEGHIQSAPSAKLNGQTTPLDVSSLSQNEIQGLLLGSHPSATTAAVAAAAANVTTTTTLAQQQQQQQQQQQQQQSTIVSAAGGGTGTVVITADQHRQQATTTTINIKREPEDLRKDPKNGTASNGSTASSGQKVIVLQQSPSPTQIHIKEPPLSPGSPTNHTEAMYAAGGGTQIYLQGPHQNSAAGPGSNVNTQTPSPGPYIGADGYGMYTTSRLTTAPTTTFISEPYYREYFPTDGQGYAPTRTIYGDSEGPHPGTTYEGRFTTTTTNSGGIPPPHPSANVTKNNGGTPIYAKTVTAAGLTVDLPSPDSGIGADAITPRDQNNIQQSFDYTELCQPGSLLDNNGGIPVSVNSIQRGAVSVHGGQNSPTTSLGGTSANGSATRSRPWHDFGRQNDADKIQIPKIFTNVGFRYHLESPISSSQRREDDRITYINKGQFYGITLEYIPDPDKPIKNTTVKSVIMLMFREEKSPEDEIKAWQFWHSRQHSVKQRILDADTKNSVGLVGCIEEVSHNAIAVYWNPLESSAKINIAVQCLSTDFSSQKGVKGLPLHVQIDTFEDPRDAQVFHRGYCQIKVFCDKGAERKTRDEERRAAKRKMTATGRKKLDELYHPVTDRSEFYTMQDLTKPPVLFSPADDLDKGFYGHESDGAPDLKGASPFLLHGQKVATPTLKFHNHFPPDMQTDKKDHILDQGLAMGEFGPPLKRGRMTPPTSERVMLYVRQENEDVYTPLHVVPPTTIGLLNAIENKYKISTTSINNIYRTNKKGITAKIDDDMISYYCNEDIFLLEVQQLEEELYDITLTELPNH

Similar Transcription Factors

Sequence clustering based on sequence similarity using MMseqs2

100% Identity: iTF_01019201;
90% Identity: iTF_00921210;
80% Identity: -