Basic Information

Insect: Empis stercorea
Gene Symbol: grh_1
Assembly: GCA_949752835.1
Location: OX457088.1:58718470-58785150[-]

Transcription Factor Domain

TF Family: CP2
Domain: CP2 domain
PFAM: PF04516
TF Group: Beta-Scaffold Factors
Description: This family represents a conserved region in the CP2 transcription factor family.
Hmmscan Out: # of c-Evalue i-Evalue score bias hmm coord from hmm coord to ali coord from ali coord to env coord from env coord to acc

1 3 0.74 7.8e+03 -3.3 0.3 112 133 73 93 48 117 0.58

2 3 0.13 1.3e+03 -0.8 0.8 85 116 264 297 243 316 0.53

3 3 4.1e-63 4.3e-59 200.3 0.2 27 221 571 760 557 762 0.94

#	of	c-Evalue	i-Evalue	score	bias	hmm coord from	hmm coord to	ali coord from	ali coord to	env coord from	env coord to	acc
1	3	0.74	7.8e+03	-3.3	0.3	112	133	73	93	48	117	0.58
2	3	0.13	1.3e+03	-0.8	0.8	85	116	264	297	243	316	0.53
3	3	4.1e-63	4.3e-59	200.3	0.2	27	221	571	760	557	762	0.94

Sequence Information

Coding Sequence: atgaataataataacGGTAATGGTGGTATTAATGGTGGTGTTGTTGTTTCACCAACATCTACAGATCAAGTAATTGGTACTGAAGTTATAAATCATGTTACAGCTGGTGGACAAATAACTGTAGTTACATCACAATCACAATATAATATGCAATCAACATCACCATCAATTCAAACACGTTATTTTCATCAACCATTACAAGTTAATGATacaaatacaatattaaatttaccatCCCAGCatcaaaatcataataataataataataataatattaataatcatcataatcatcatcatcaacaacaacaacaacaaccaccacCGCCacaatatcaacaacaacatcatatACAacatgatgataataataatggtgatttaaataatacaaattgttcatcaccaacaaaaatatttaatttaacaacatTAAATGGTGTACCACATCAGGTGCTCCATCAAGTACAAAATTCAAATGGTAGTACATcatatgtatatgaatattataaattatctgataaggataataataatggtggtaCTTTACATTGGAGTTCCCCTACCACAGGTAAATTAAATGGTCAGACCACACCTCTAGATGTATCTGGCCTATCACAAAGTGAAATACAAGGTATATTATTAGGTTCACACCCATCATcgtcaacatcatcatcaacaacaactacATCAACTGTTGTGTCGCAATCAAATGGtggtaatggtaataataatagtaatggtAATAATAGTAATGTTGCTGTTACTGGTAATACTGTTGTTGTAACTGAACataataatcaacaacaacaacaacaacatcatcataatcagcatcaacaacatcatcataATCAGCATCATCAAGGACAACAACAATCAATTAGTATTAAACGTGAACCAGAAGATTTACGTAAAGATCCAAATGGACGAAATCAAAAgGTTTTGGTTGTACAATCACCATCACCATCAATACAAATTAAAGACCCACCTCCCAGTCCTGGAAGTCCATCAAACGAAACAATGTACGCTGCCACAGGCGGCACTCAAATTTACCTTCAGGGACCACATCAAACAAGTTCAACAACACAATCAAATGTCAATGGAGGACACTCACCTAGCCCTGGACCATATGTAACAACTGATCAATATGGTATGTACACAACACGTTTAGCATCGGGACCAAGTTCAACATTTATATCAGAGCCATATTATCGTGAATATTTTGCACCTGATGGACATGGTTATGCACCAACAGCACGTACAATATATGGTGATAATGATGGACCACAACCTGGTACAACATATGAAGGTAGATTTACAACCGTTCATGCATCATCTGCAtcacatataacaaaaaatgttacACCAGTTTATGCTAAAACTGTAACAGCAGCTGGTTTAACAGTTGATTTACCAAGTCCTGATTCTGGTATTGGTGCTGATGCAATAACACCAAGAgatcaaaataatatacaacagTCATTTGATTATACAGAATTATGTCAACCGGGAACATTATTAGATGGTAATGGTGCAATACCAGTTTCAGTTAATAATATACAAAGAGCAGTTAGTGTACATCCAGGACAAAATAGTCCAACAACATCACTTGGTAATAGTAGTGCGGTAACAACAAGATCAAGACCATGGCATGATTTTGGTAGACAAAATGATGTTGATAAAATTCAAATACCAAAAATATTTATAAATGCAGGATTTAGATATATTCTGGAAAGTCCAATTAGTTCATCACAACGTCGTGAAGATGATCgaataacatatataaataaaggacAATTTTATGGTCTTACATTAGAATATATACCGGATGCAGATAAACCCCTTAAAAATACAACAGTCAAAaGTGTCATAATGTTAATGTTCCGAGAAGAGAAATCACCTGAAGATGAAATTAAAGCATGGCAATTTTGGCATAGTCGACAACATTCTATTAAACAAAGAATATTAGATGCTGATACAAAAAATTCTATTGGTCTTGTTGGATGCATAGAAGAAGTTGCCCATAATGCAATTGCTGTATATTGGAATCCATTGGAAAGTTCTGCAAAAatAAATGTTGCTGTACAATGTTTAAGTACCGATTTTAGCAGTCAGAAGGGAGTTAAGGGTCTACCACTTCACATTCAAATTGATACATTTGAGGATCCACGAGATTCTTCAATATTCCATCGAGGCTATTGCCAAATAAAAGTCTTTTGCGATAAAGGTGCTGAAAGAAAAACACGTGATGAAGAACGTCGTGCTGCTAAACGAAAAATGACAAATACTGGTcgaaaaaaattagaagaattATATCATACAGTTGCTGATCGATCTGAATTTTATTCAATGCAAGATTTGGTTAAATTACCAGTACTATTTACACCCTCGGAAGACATGGAAaagCTTTCTGGATTGATTCAACAGAACTTCTATGGTCAAGAGACTGATTCACTTTCAGATGGTCTTAAAAGTACACCGTTCGTTTTGCATGGACAAAAAGCATCAACACcaacattaaaatttcataatcatTTTCCACCTGATGTCCAGACTGATAAAAAGGATCATATATTGGAACAAGCTCTTGCACCTGGACCAATGACAGAATTTGGTCCACCAATGAAACGAGGCCGTATTACACCACCAATTAATGAACGTGTCATGTTATATGTACGACAAGAAAATGAAGAAGTTTATACACCATTACATGTTGTACCACCAACAACAATTGGACTCTTAAATGCgAtcgaaaataaatacaaaatatcaacaacaagtataaataacatttatcgAACAAATAAAAAAGGGATTACAGCGAAAATTGATGATGATATGTTATCTTATTATTTGAACGAAGATATATTCTTGTTAGAAGTACAACAAATTGAAGAAGATCTGTATGACATTACGTTAACTGAActtcaaaatcattaa
Protein Sequence: MNNNNGNGGINGGVVVSPTSTDQVIGTEVINHVTAGGQITVVTSQSQYNMQSTSPSIQTRYFHQPLQVNDTNTILNLPSQHQNHNNNNNNNINNHHNHHHQQQQQQPPPPQYQQQHHIQHDDNNNGDLNNTNCSSPTKIFNLTTLNGVPHQVLHQVQNSNGSTSYVYEYYKLSDKDNNNGGTLHWSSPTTGKLNGQTTPLDVSGLSQSEIQGILLGSHPSSSTSSSTTTTSTVVSQSNGGNGNNNSNGNNSNVAVTGNTVVVTEHNNQQQQQQHHHNQHQQHHHNQHHQGQQQSISIKREPEDLRKDPNGRNQKVLVVQSPSPSIQIKDPPPSPGSPSNETMYAATGGTQIYLQGPHQTSSTTQSNVNGGHSPSPGPYVTTDQYGMYTTRLASGPSSTFISEPYYREYFAPDGHGYAPTARTIYGDNDGPQPGTTYEGRFTTVHASSASHITKNVTPVYAKTVTAAGLTVDLPSPDSGIGADAITPRDQNNIQQSFDYTELCQPGTLLDGNGAIPVSVNNIQRAVSVHPGQNSPTTSLGNSSAVTTRSRPWHDFGRQNDVDKIQIPKIFINAGFRYILESPISSSQRREDDRITYINKGQFYGLTLEYIPDADKPLKNTTVKSVIMLMFREEKSPEDEIKAWQFWHSRQHSIKQRILDADTKNSIGLVGCIEEVAHNAIAVYWNPLESSAKINVAVQCLSTDFSSQKGVKGLPLHIQIDTFEDPRDSSIFHRGYCQIKVFCDKGAERKTRDEERRAAKRKMTNTGRKKLEELYHTVADRSEFYSMQDLVKLPVLFTPSEDMEKLSGLIQQNFYGQETDSLSDGLKSTPFVLHGQKASTPTLKFHNHFPPDVQTDKKDHILEQALAPGPMTEFGPPMKRGRITPPINERVMLYVRQENEEVYTPLHVVPPTTIGLLNAIENKYKISTTSINNIYRTNKKGITAKIDDDMLSYYLNEDIFLLEVQQIEEDLYDITLTELQNH

Similar Transcription Factors

Sequence clustering based on sequence similarity using MMseqs2

100% Identity: iTF_01297136;
90% Identity: -
80% Identity: -