Basic Information

Insect: Drosophila ochracea
Gene Symbol: grh_1
Assembly: GCA_035044125.1
Location: JAWNML010000060.1:3394934-3426955[+]

Transcription Factor Domain

TF Family: CP2
Domain: CP2 domain
PFAM: PF04516
TF Group: Beta-Scaffold Factors
Description: This family represents a conserved region in the CP2 transcription factor family.
Hmmscan Out: # of c-Evalue i-Evalue score bias hmm coord from hmm coord to ali coord from ali coord to env coord from env coord to acc

1 4 0.44 2.5e+03 -2.6 0.0 115 146 170 199 165 219 0.71

2 4 3 1.7e+04 -7.9 11.2 78 113 241 276 198 299 0.53

3 4 0.23 1.3e+03 -1.6 0.9 91 108 554 571 526 594 0.58

4 4 4.1e-63 2.3e-59 200.3 0.5 24 221 697 889 683 891 0.94

#	of	c-Evalue	i-Evalue	score	bias	hmm coord from	hmm coord to	ali coord from	ali coord to	env coord from	env coord to	acc
1	4	0.44	2.5e+03	-2.6	0.0	115	146	170	199	165	219	0.71
2	4	3	1.7e+04	-7.9	11.2	78	113	241	276	198	299	0.53
3	4	0.23	1.3e+03	-1.6	0.9	91	108	554	571	526	594	0.58
4	4	4.1e-63	2.3e-59	200.3	0.5	24	221	697	889	683	891	0.94

Sequence Information

Coding Sequence: ATGATGCAGGATGCAACCAGCAGCTATGCCATCTCCTACACGGACTGGATAGCTGAGTCACGGCGCTATACCTTGGAGCCTGCACAGCAAGCAACGCCGCCCccgccaccagcaccactacagcagcagcaacaccagcagcaacagcagcagcaacagcagcgacttcatcatcagcaacagctgcatccgcatccacatccacatcatcaGCTTCAAGCACACCATCttaatcatcatcagcatcatcatcagcattatGCGAGTCAATCGCCACCGCATTACTCGTATGTGCCGCCGCCCAAGGATGCAGCAGCTCAGTTGCAACAGCATCTGCCGCTGACCGCCGCTGGGCTCATGCAATCGGTGGCCGATGAGATTCAACTGAGCGAACAGCAATCGACACCGCCGCCAGCACCACCGCccccaccgccaccaccgccgccgccgccaacaGCCCACGCCTCCAACACCACCTATGCGGTCTACAGCTACTACCGAGATGTCGATGTGGATGccgagcaacagcagcagcaacagcaacagcagcacaatgATAGATCACAACaagatcagcagcagcttctgtGGAGCAATGCGAGCAGCACCGGCAAACTGAATGGCCAGACCACACCTATCGATGTCTCTGGCCTAtcgcaaaatgaaattcaaggCTTTCTGCTTGGCTCACACCCCTCATCGTCGGCAGCCACAACCGGCGTTGTgtccacaacaacaatctcaaatcagcaacatcagcaacaacaacaacaacaacagcaacaacaacagcaacatcagcagcaacagcaacaacagcagcagcagcatcaacagcagcagcaacagcaacaacaacaaccgccaCATCCCAGCGACATTGTAACCATAACCACGGCGGGAGTGGGGAGTGCGGGCTCAATTGTCTCCGCCgcagtgcaacagcagcaacagcagcagcagcagcaacaattgctgagCATCAAACGTGAACCCGAAGACTTGAGCAAGGATCCCAAGAATGGCAATCTGGGCGCCGCAGCAAACGGTTCAGTCATAGCGCAGAAGATATTGCGCGTGGATGCAGCTAGAGCTGAAGCtgaggcaactgcaacttcaacttcaactgcaactgcaactgcaactgcaactgcattcGAAATTAGCGAtaaaacagctgctgcagcaacaacaacagcaacaacaagtgaaacTGCAACTAGTTCCGCCAGCGCCACAACAGATCTAGAGATGTATGCTACAACGGGCGGCACACAGATTTATCTACAGACCTCACATCAGAACAGCACCGGCCCCAGTACACAGCAGAGCACACTGCAAGCCCAGAGTCCCAGTCCCGGGCCGTACATCACAACGGATAGCTATGGCATGTATACGGCCACACGATTGCCGCCCGGCCCACCGCCCGCAACCACATTTATAACGGAACCCTATTACCGTGAATACTTTGCGCCCGATGGCCAGGGTGGCTATGTGCCCGCCGGCACAGCGCGCAGCCTCTACGGCGAGGATGTATCCGTGGCGGCGGCCACACAACCACAGCCCGTGGGCGGTGTCTATGAGGCGCGATTCACCAGCAATGggcccaccaccaccacagtGCTAACCAGCAGCAATGTACACCACCacagtcaacagcagcagcagcaacagcagcaacagcaacagcagcagcagcaacagcagcaacaacagcagcagcaggaacagtcGGGCAAAAGCGGCGGTACTCCACTATATGCCAAGGCTATAACGGCGGCGGGTCTGACCGTCGATTTGCCCAGTCCCGATTCGGGCATTGGCACGGATGCCATTACGCCGCGGGATCAAAATCACATACAGCagTCCTTCGACTACACGGAACTTTGTCAGCCGGGCACCTTAATTGATGCGAATGGCAGCATACCCGTTTCGGTGAACAGCATCCAGCAGCGCACTGTGGTGCATGGCAGCCAGAATAGTCCAACCACATCGCTGGTGGACACAAGCACAAATGGCTCGACACGCTCGAGACCTTGGCACGATTTCGGACGCCAAAATGATGctgataaaatacaaataccaaaaatCTTCACAAATGTGGGTTTCCGTTACAATTTGGAGAGCCCGATCAGCTCGTCACAGCGTCGAGAGGACGATCGCATCACCTACATCAACAAGGGTCAGTTCTATGGCATTACGCTGGAGTATGTGCACGATGCGGATAAGCCAATCAAGAATACAACAGTTAAGAGTGTGATCATGTTGATGTTTCGCGAGGAGAAGAGTCCCGAAGATGAGATAAAGGCCTGGCAATTCTGGCACAGTCGTCAGCATTCCGTGAAGCAAAGAATCTTGGATGCAGATACAAAGAACTCGGTTGGTCTCGTTGGTTGCATTGAGGAAGTGTCGCACAATGCCATCGCCGTCTACTGGAATCCGCTCGAGAGCTCTGCCAAGATCAACATTGCAGTTCAGTGCCTCAGCACGGATTTCAGCAGTCAAAAGGGTGTTAAGGGTCTGCCGTTGCACGTACAAATCGATACGTTTGAGGATCCGCGGGATGCGACAGTCTTTCATCGCGGCTACTGTCAGATAAAGGTCTTCTGCGATAAGGGCGCGGAGCGTAAGACGCGCGATGAGGAGCGTCGTGCTGCCAAGCGCAAAATGACAGCCACTGGACGCAAGAAGCTGGATGAGCTCTATCACCCGGTCACAGATCGTTCCGAGTTCTATGGCATGCAGGATCTGGCCAAGCCGCCAGTGCTCTTCTCGCCCGCCGAGGATATGGAAAAGAGCTTCTATGGGCATGAGACTGACTCGCCGGAGCTGAAAGGTGCCTCGCCGTTCTTGCTTCACGGTCAGAAGGTGGCCACGCCCACGCTCAAATTTCACAATCATTTTCCGCCCGACATGCAGACTGACAAAAAGGATCATATATTGGATCAGAATATGTTAACCAGTACGCCCATGTCCGATTTTGGCCCACCAATGAAGCGGGGCAGAATGACGCCGCCGACAACGGAGCGTGTCATGTTATATGTGCGACAGGAGAACGAGGAGATCTACACGCCGCTCCATGTGGTGCCCCCAACCACCATCGGCCTGCTAAATGCGattgaaaacaaatacaaaatctCAACAACGAgcataaataacatatatcGCACAAATAAGAAGGGGATTACGGCGAAAATTGATGATGATATGATATCCTTCTACTGCAACGAGGACATTTTCTTGCTGGAAGTGCAACAGATTGAGGATGATCTGTACGATGTGACGCTCACGGAGCTGCCCAATCAGTAG
Protein Sequence: MMQDATSSYAISYTDWIAESRRYTLEPAQQATPPPPPAPLQQQQHQQQQQQQQQRLHHQQQLHPHPHPHHQLQAHHLNHHQHHHQHYASQSPPHYSYVPPPKDAAAQLQQHLPLTAAGLMQSVADEIQLSEQQSTPPPAPPPPPPPPPPPPTAHASNTTYAVYSYYRDVDVDAEQQQQQQQQQHNDRSQQDQQQLLWSNASSTGKLNGQTTPIDVSGLSQNEIQGFLLGSHPSSSAATTGVVSTTTISNQQHQQQQQQQQQQQQQHQQQQQQQQQQHQQQQQQQQQQPPHPSDIVTITTAGVGSAGSIVSAAVQQQQQQQQQQQLLSIKREPEDLSKDPKNGNLGAAANGSVIAQKILRVDAARAEAEATATSTSTATATATATAFEISDKTAAAATTTATTSETATSSASATTDLEMYATTGGTQIYLQTSHQNSTGPSTQQSTLQAQSPSPGPYITTDSYGMYTATRLPPGPPPATTFITEPYYREYFAPDGQGGYVPAGTARSLYGEDVSVAAATQPQPVGGVYEARFTSNGPTTTTVLTSSNVHHHSQQQQQQQQQQQQQQQQQQQQQQQQEQSGKSGGTPLYAKAITAAGLTVDLPSPDSGIGTDAITPRDQNHIQQSFDYTELCQPGTLIDANGSIPVSVNSIQQRTVVHGSQNSPTTSLVDTSTNGSTRSRPWHDFGRQNDADKIQIPKIFTNVGFRYNLESPISSSQRREDDRITYINKGQFYGITLEYVHDADKPIKNTTVKSVIMLMFREEKSPEDEIKAWQFWHSRQHSVKQRILDADTKNSVGLVGCIEEVSHNAIAVYWNPLESSAKINIAVQCLSTDFSSQKGVKGLPLHVQIDTFEDPRDATVFHRGYCQIKVFCDKGAERKTRDEERRAAKRKMTATGRKKLDELYHPVTDRSEFYGMQDLAKPPVLFSPAEDMEKSFYGHETDSPELKGASPFLLHGQKVATPTLKFHNHFPPDMQTDKKDHILDQNMLTSTPMSDFGPPMKRGRMTPPTTERVMLYVRQENEEIYTPLHVVPPTTIGLLNAIENKYKISTTSINNIYRTNKKGITAKIDDDMISFYCNEDIFLLEVQQIEDDLYDVTLTELPNQ

Similar Transcription Factors

Sequence clustering based on sequence similarity using MMseqs2

100% Identity: iTF_00476386;
90% Identity: iTF_00535075;
80% Identity: -