Basic Information

Insect: Drosophila kambysellisi
Gene Symbol: grh_1
Assembly: GCA_035042185.1
Location: JAWNLS010000946.1:3202312-3233814[+]

Transcription Factor Domain

TF Family: CP2
Domain: CP2 domain
PFAM: PF04516
TF Group: Beta-Scaffold Factors
Description: This family represents a conserved region in the CP2 transcription factor family.
Hmmscan Out: # of c-Evalue i-Evalue score bias hmm coord from hmm coord to ali coord from ali coord to env coord from env coord to acc

1 3 0.6 2.8e+03 -2.6 5.4 79 112 238 272 169 298 0.55

2 3 0.42 2e+03 -2.1 1.4 92 127 550 562 520 584 0.56

3 3 5.4e-63 2.5e-59 200.3 0.5 24 221 689 881 675 883 0.94

#	of	c-Evalue	i-Evalue	score	bias	hmm coord from	hmm coord to	ali coord from	ali coord to	env coord from	env coord to	acc
1	3	0.6	2.8e+03	-2.6	5.4	79	112	238	272	169	298	0.55
2	3	0.42	2e+03	-2.1	1.4	92	127	550	562	520	584	0.56
3	3	5.4e-63	2.5e-59	200.3	0.5	24	221	689	881	675	883	0.94

Sequence Information

Coding Sequence: ATGATGCAGGATGCAACCAGCAGCTATGCCATCTCCTACACGGACTGGATATCTGAGTCACGGCGCTATAGCTTGGAGCCCGCACAGCAAGCAACGCCGCCCCCGCCACCAGCACCatcagagcaacagcaacagcagcaacagcagcagcatcagcaactccatcatcagcagcatccacatccacaaccacatcatcatcttcaAGCACACCATCttaatcatcatcagcatcatcatcagcattatGCGAGTCAATCGCCACCGCATTACTCATATGTGCCGCCGCCCAAGGATGCAGCAGCTCAGTTGCAACAGCATCTGCCGCTGACCGCCGCTGGGCTCATGCAATCGGTGGCCGATGAGATTCAACTGAACGAACAGCAATCGACAccgccaccagcaccaccgcccccaccaccaccgccgccgccgccaacaGCACACGCCTCCAACTCCACCTATGCGGTCTACAGCTACTACCGAGATGTCGATGTGGACGTCGATGTGGAtgtcgagcagcagcagcagcagcagcagcagcagcatcacaaTGCTAGATCACAACAAGATCAGCAGCTACTGTGGAGCAATGCGAGCAGCACCGGCAAACTGAATGGCCAGACCACACCTATCGATGTCTCTGGCCTAtcgcaaaatgaaattcaaggCTTTCTGCTTGGCTCACACCCCTCATCGTCGGCCGCCACAACCGGCGTTGtgtccacaacaacaatctcaaatcagcaacatcagcagcaacagcaacaacaacagcaacatcagcagcaacagcaacaacagcagcagcagcagcagcatcaacaacagcagcagcagcaacaacaacaaccgccaCATCCCAGCGACATTGTAACCATAACCACGGCGGGAGTGGGGAGTGCGGGCTCAATTGTCTCCGCCgcagtgcaacagcagcagcagcaacagcaacaattgctgagCATCAAACGTGAACCCGAAGACTTGAGCAAGGATCCCAAGAATGGCAATCTTGGCGCCGCAGCAAACGGTTCAGTCATAACGCAGAAGATATTGCGCGTGGATGCAGCTAGAACTGAAGCtgaggcaactgcaacttcaactgcaactgcaactgcattcGAAATTAGCGATAAAACAGCTGctggagcaacaacaacaacaacaagaacaacaagtgAAACTGCAACTAGTCCCGCCAGCGCCACAACAGATCTAGAGATGTATGCTACAACGGGCGGCACACAGATTTATCTACAGACCTCACATCAGAACAGCACCGGCCCCAGCACACAGCAGAGCACACTGCAAGCCCAGAGTCCCAGTCCCGGGCCGTATATCACAACGGATAGCTATGGCATGTATACGGCCACAAGATTGCCTCCCGGCCCACCGCCCGCAACCACATTCATAACGGAACCCTATTACCGCGAATACTTTGCGCCCGATGGCCAGGGTGGCTATGTGCCCGCCGGCACAGCGCGCAGCCTCTACGGCGAGGATGTATCCGTGGCGGCGGCCACCCAACCACAGCCCGTGGGCGGTGTCTATGAGGCGCGATTCACCAGCAATGggcccaccaccaccacagtGCTAACCAGCAGCAATGCACACCACCacagtcaacagcagcagcagcagcaacaacagcagcagcagcagcagcaacagcagcaacatcagcagcagcagcagcaggaacagtcCGGCAAAAACGGCGGTACTCCACTATATGCCAAGGCTATAACGGCGGCGGGTCTGACCGTCGATTTGCCCAGTCCCGATTCGGGCATTGGCACGGATGCCATCACGCCGCGGGATCAGAATCACATACAGCagTCCTTCGACTATACGGAACTTTGTCAGCCGGGCACCTTAATTGATGCAAATGGCAGCATACCCGTTTCGGTCAACAGCATCCAGCAGCGCACTGTGGTGCACGGCAGCCAGAATAGTCCAACCACATCGCTGGTGGACACAAGCACAAATGGCTCGACCCGCTCGAGACCCTGGCACGATTTCGGACGCCAAAATGATGctgataaaatacaaataccaaaaatCTTCACAAATGTGGGCTTTCGTTATAATTTGGAGAGCCCGATCAGCTCGTCACAGCGTCGCGAGGACGATCGCATCACCTACATCAACAAGGGTCAGTTCTATGGCATTACGCTGGAGTATGTGCACGATGCGGATAAGCCAATCAAGAATACAACAGTTAAgAGTGTGATCATGTTGATGTTTCGCGAGGAGAAGAGTCCCGAAGATGAGATAAAGGCCTGGCAATTCTGGCACAGTCGTCAGCATTCCGTGAAGCAAAGAATCTTGGATGCAGaTACAAAGAACTCGGTTGGTCTCGTTGGTTGCATTGAGGAAGTGTCGCACAATGCCATCGCCGTCTACTGGAATCCGCTCGAGAGCTCTGCCAAGATCAACATTGCAGTCCAATGCCTCAGCACGGATTTCAGCAGTCAAAAGGGTGTTAAGGGTCTGCCGTTGCACGTCCAAATCGATACGTTTGAGGATCCTCGGGATGCGACAGTCTTTCATCGCGGCTACTGTCAGATAAAGGTCTTCTGCGATAAGGGCGCGGAGCGAAAGACGCGCGACGAGGAGCGTCGTGCCGCCAAGCGCAAGATGACAGCCACTGGACGCAAGAAGCTGGATGAGCTCTATCACCCGGTCACAGATCGTTCCGAGTTCTATGGCATGCAGGATCTGGCCAAGCCGCCAGTGCTCTTCTCGCCCGCCGAGGATATGGAAAAGaGCTTCTATGGGCATGAGACTGACTCGCCGGAGCTGAAAGGTGCCTCGCCGTTCTTGTTGCACGGTCAGAAggtggccacgcccacgctCAAATTTCACAATCATTTTCCCCCCGACATGCAGACTGACAAAAAGGATCATATATTGGATCAGAATATGTTAACCAGTACGCCCATGTCCGATTTTGGGCCACCAATGAAACGGGGCAGAATGACGCCGCCGACAACGGAGCGGGTCATGTTATATGTGCGGCAGGAGAACGAGGAGATCTACACGCCGCTCCATGTGGTGCCCCCAACCACCATTGGCCTGCTAAATGCGattgaaaacaaatacaaaatctcAACAACGAGcataaataacatatatcGCACAAATAAGAAGGGgATTACGGCGAAAATTGATGATGATATGATATCCTTTTACTGCAACGAGGACATTTTCCTGCTGGAAGTGCAGCAGATCGAAGATGATCTGTACGATGTGACGCTCACGGAGCTGCCCAATCAGTAG
Protein Sequence: MMQDATSSYAISYTDWISESRRYSLEPAQQATPPPPPAPSEQQQQQQQQQHQQLHHQQHPHPQPHHHLQAHHLNHHQHHHQHYASQSPPHYSYVPPPKDAAAQLQQHLPLTAAGLMQSVADEIQLNEQQSTPPPAPPPPPPPPPPPTAHASNSTYAVYSYYRDVDVDVDVDVEQQQQQQQQQHHNARSQQDQQLLWSNASSTGKLNGQTTPIDVSGLSQNEIQGFLLGSHPSSSAATTGVVSTTTISNQQHQQQQQQQQQHQQQQQQQQQQQQHQQQQQQQQQQPPHPSDIVTITTAGVGSAGSIVSAAVQQQQQQQQQLLSIKREPEDLSKDPKNGNLGAAANGSVITQKILRVDAARTEAEATATSTATATAFEISDKTAAGATTTTTRTTSETATSPASATTDLEMYATTGGTQIYLQTSHQNSTGPSTQQSTLQAQSPSPGPYITTDSYGMYTATRLPPGPPPATTFITEPYYREYFAPDGQGGYVPAGTARSLYGEDVSVAAATQPQPVGGVYEARFTSNGPTTTTVLTSSNAHHHSQQQQQQQQQQQQQQQQQQHQQQQQQEQSGKNGGTPLYAKAITAAGLTVDLPSPDSGIGTDAITPRDQNHIQQSFDYTELCQPGTLIDANGSIPVSVNSIQQRTVVHGSQNSPTTSLVDTSTNGSTRSRPWHDFGRQNDADKIQIPKIFTNVGFRYNLESPISSSQRREDDRITYINKGQFYGITLEYVHDADKPIKNTTVKSVIMLMFREEKSPEDEIKAWQFWHSRQHSVKQRILDADTKNSVGLVGCIEEVSHNAIAVYWNPLESSAKINIAVQCLSTDFSSQKGVKGLPLHVQIDTFEDPRDATVFHRGYCQIKVFCDKGAERKTRDEERRAAKRKMTATGRKKLDELYHPVTDRSEFYGMQDLAKPPVLFSPAEDMEKSFYGHETDSPELKGASPFLLHGQKVATPTLKFHNHFPPDMQTDKKDHILDQNMLTSTPMSDFGPPMKRGRMTPPTTERVMLYVRQENEEIYTPLHVVPPTTIGLLNAIENKYKISTTSINNIYRTNKKGITAKIDDDMISFYCNEDIFLLEVQQIEDDLYDVTLTELPNQ

Similar Transcription Factors

Sequence clustering based on sequence similarity using MMseqs2

100% Identity: iTF_00476386;
90% Identity: iTF_00535075;
80% Identity: -