Basic Information

Insect: Drosophila longiperda
Gene Symbol: grh_1
Assembly: GCA_035042125.1
Location: JAWNLV010000107.1:19053973-19084888[-]

Transcription Factor Domain

TF Family: CP2
Domain: CP2 domain
PFAM: PF04516
TF Group: Beta-Scaffold Factors
Description: This family represents a conserved region in the CP2 transcription factor family.
Hmmscan Out: # of c-Evalue i-Evalue score bias hmm coord from hmm coord to ali coord from ali coord to env coord from env coord to acc

1 3 0.1 9.2e+02 -1.1 3.4 84 109 256 281 207 332 0.56

2 3 0.91 8e+03 -4.2 3.4 102 121 562 570 532 590 0.48

3 3 2.8e-63 2.4e-59 200.3 0.5 24 221 704 896 690 898 0.94

#	of	c-Evalue	i-Evalue	score	bias	hmm coord from	hmm coord to	ali coord from	ali coord to	env coord from	env coord to	acc
1	3	0.1	9.2e+02	-1.1	3.4	84	109	256	281	207	332	0.56
2	3	0.91	8e+03	-4.2	3.4	102	121	562	570	532	590	0.48
3	3	2.8e-63	2.4e-59	200.3	0.5	24	221	704	896	690	898	0.94

Sequence Information

Coding Sequence: ATGATGCAGGAAGCAACCAGCAGCTATGCCATCTCCTACACGGACTGGATAGCTGAGTCACGGCGCTATAGCTTGGAGGCTGCACAGCATGCCACGCCGCCCCCGCCATCAGCAacaccacagcaacagcagcagcagcagcagcagccgcaacagcagcagcatcaccaacttgatcatcagcaacaacagcatccacatccacatccacatccgcaaACACATCATCAGCTTCAAGCACACCATCttaatcatcatcagcaacatcatcagcattaTGCGAGTCAATCGCCACCGCATTACTCATATGTGGTGCCGCCCAAGGATGCAGCAGCTcagttgcaactgcatctGCCGCTGACCGCCGCTGGGCTCATGCAATCGCTGGCCGATGAGATTCAACTAAGCGAACAGCAATCGACACAGCCGCCAGCAGCACCGCccccaccaccgccgccgccgctgtcgctgccgctgccgccaaCAGCACACGCCTCCAACTCCAGCTATGCGGTCTACAGCTACTACCGAGATGGCGATGTGGATGTCGATGTGGatgtcgagcagcagcagcagcaacacaattCTAGATCACAACAAGATCAGCAGCTACTGTGGAGCAATGCGAGCAGCACCGGCAAACTGAATGGCCAGACCACACCTATCGATGTCTCTGGCCTATcgcaaaatgaaattcaagGCTTTTTGCTTGGCTCACACCCCTCATCGTCGGCCGCCACAACCGGCGTTGTgtccacaacaacaatctcaaatcagcaacatcagcagcaacagcaacaacaacagcaacatcagcagcaacagcagcagcaacagcagcatcaacagcagcagcagcagcaacaacagcaacaacagccgccaCATCCCAGCGACATTGTGACCATAACCACGGCGGGAGTGGGGAGTGCGGGCTCAATTGTCTCCGCCgcagtgcaacagcagcaacagcaacagcagcagcagcaacaattgctgagCATCAAACGTGAACCCGAAGACTTGAGCAAGGATCCCAAGAATGGCAATCTGGGTGCCGCAGCAAACGGTTCAGTCATAACGCAGAAGATATTGCGCGTGGATGCAGCTAGAACTGAAGCTgaggcaactgcaacttcaactgcaactgcaactgcattcGAAATTAGCGATaaaacagctgctgcagcaacaacaacaacaacaacaacaagtgaaaCTGCAACTAGTCCCGCCAGCGCCACAACAGATCTCGAGATGTATGCTACAACGGGCGGCACACAGATTTATCTACAGACCTCACATCAGAACAGCACCGGCCCCAGCACACAGCAGAGCACACTGCAAGCCCAGAGTCCCAGTCCTGGGCCGTACATCACAACGGATAGCTATGGCATGTATACGGCCACAAGATTGCCACCAGGCCCGCCGCCCGCCACCACATTCATAACGGAACCCTATTACCGGGAATACTTTGCGGCCGATGGCCAGGGTGGCTATGTGCCCGCCGGCACAGCACGAAGCCTCTACGGCGAGGATGTATCCGTGGCTGCGGCCACACAACCACAGCCCGTGGGCGGTGTTTACGAGGCGCGATTCACCAGCAATGGCCCAACCACAACCACAGTGCTAACCAGCAGCAATGCACACCACCacagtcaacagcagcagcagcagcagcaacagcagcagcagcagcagcaacaacagcaacaacagcaacagcaaccacagcatcagcagcaggaacaaTCGGTCAAAAGCGGCGGTACTCCACTATATGCCAAGGCTATAACCGCGGCGGGTCTCACCGTCGATTTGCCAAGTCCCGATTCGGGCATAGGCACCGATGCAATTACACCGCGGGATCAAAATCACATACAGCagTCCTTCGACTACACGGAACTTTGTCAGCCGGGCACCTTAATTGATGCGAATGGCAGCATACCCGTTTCGGTCAACAGCATCCAGCAGCGCACCGTGGTGCATGGCAGCCAGAATAGTCCAACCACATCGCTGGTGGACACAAGCACAAATGGCTCGACTCGTTCGAGACCCTGGCACGATTTCGGACGCCAAAATGATGctgataaaatacaaataccaaaaatctTCACAAATGTGGGCTTTCGTTATAATTTGGAGAGCCCCATCAGCTCGTCACAGCGTCGGGAGGACGATCGCATCACCTACATCAACAAGGGTCAGTTCTATGGCATTACGCTGGAATATGTGCACGATGCGGATAAGCCAATCAAGAATACAACAGTTAAGAGTGTGATCATGTTGATGTTTCGCGAGGAGAAGAGTCCCGAAGATGAGATAAAGGCCTGGCAATTCTGGCACAGTCGTCAGCATTCCGTGAAGCAAAGAATCTTGGATGCAGatACAAAGAACTCGGTTGGTCTCGTTGGTTGCATTGAGGAAGTGTCGCACAATGCCATCGCTGTCTACTGGAATCCGCTCGAGAGCTCTGCCAAGATCAACATCGCAGTTCAGTGCCTCAGCACGGATTTCAGCAGTCAAAAGGGTGTCAAAGGTCTGCCGTTGCACGTGCAAATCGATACGTTTGAGGATCCGCGGGATGCGACGGTCTTTCATCGCGGCTACTGTCAGATAAAGGTCTTCTGCGATAAGGGCGCGGAGCGTAAGACGCGCGATGAGGAGCGTCGCGCCGCCAAACGCAAAATGACAGCCACTGGACGCAAGAAGCTGGATGAGCTCTATCATCCGGTCACAGATCGCTCCGAGTTCTATGGCATGCAGGATCTGGCCAAGCCGCCAGTACTCTTCTCGCCCGCCGAGGATATGGAAAAGAGCTTCTATGGGCATGAGACTGACTCGCCGGAGCTGAAAGGTGCCTCGCCGTTCTTGTTGCACGGTCAGAAGGTGGCCACGCCCACGCTCAAATTTCACAATCATTTTCCGCCCGACATGCAGACTGACAAAAAGGATCATATATTGGATCAGAATATGTTAACCAGTACGCCCATGTCCGATTTTGGGCCACCAATGAAGCGGAGCAGGATGACGCCGCCGACAACGGAGCGTGTCATGTTATATGTGCGGCAGGAGAACGAGGAGATCTACACGCCACTCCATGTGGTGCCCCCGACCACCATTGGCCTGCTAAATGCGattgaaaacaaatacaaaatctcAACAACGagcataaataacatatatcgCACAAATAAGAAGGGaaTTACGGCGAAAATTGATGATGATATGATTTCATTCTACTGCAACGAGGACATTTTCTTGCTGGAAGTCCAACAGATTGAGGAAGATCTGTATGATGTGACGCTCACCGAGCTGCCCAATCAGTAG
Protein Sequence: MMQEATSSYAISYTDWIAESRRYSLEAAQHATPPPPSATPQQQQQQQQQPQQQQHHQLDHQQQQHPHPHPHPQTHHQLQAHHLNHHQQHHQHYASQSPPHYSYVVPPKDAAAQLQLHLPLTAAGLMQSLADEIQLSEQQSTQPPAAPPPPPPPPLSLPLPPTAHASNSSYAVYSYYRDGDVDVDVDVEQQQQQHNSRSQQDQQLLWSNASSTGKLNGQTTPIDVSGLSQNEIQGFLLGSHPSSSAATTGVVSTTTISNQQHQQQQQQQQQHQQQQQQQQQHQQQQQQQQQQQQPPHPSDIVTITTAGVGSAGSIVSAAVQQQQQQQQQQQQLLSIKREPEDLSKDPKNGNLGAAANGSVITQKILRVDAARTEAEATATSTATATAFEISDKTAAAATTTTTTTSETATSPASATTDLEMYATTGGTQIYLQTSHQNSTGPSTQQSTLQAQSPSPGPYITTDSYGMYTATRLPPGPPPATTFITEPYYREYFAADGQGGYVPAGTARSLYGEDVSVAAATQPQPVGGVYEARFTSNGPTTTTVLTSSNAHHHSQQQQQQQQQQQQQQQQQQQQQQQPQHQQQEQSVKSGGTPLYAKAITAAGLTVDLPSPDSGIGTDAITPRDQNHIQQSFDYTELCQPGTLIDANGSIPVSVNSIQQRTVVHGSQNSPTTSLVDTSTNGSTRSRPWHDFGRQNDADKIQIPKIFTNVGFRYNLESPISSSQRREDDRITYINKGQFYGITLEYVHDADKPIKNTTVKSVIMLMFREEKSPEDEIKAWQFWHSRQHSVKQRILDADTKNSVGLVGCIEEVSHNAIAVYWNPLESSAKINIAVQCLSTDFSSQKGVKGLPLHVQIDTFEDPRDATVFHRGYCQIKVFCDKGAERKTRDEERRAAKRKMTATGRKKLDELYHPVTDRSEFYGMQDLAKPPVLFSPAEDMEKSFYGHETDSPELKGASPFLLHGQKVATPTLKFHNHFPPDMQTDKKDHILDQNMLTSTPMSDFGPPMKRSRMTPPTTERVMLYVRQENEEIYTPLHVVPPTTIGLLNAIENKYKISTTSINNIYRTNKKGITAKIDDDMISFYCNEDIFLLEVQQIEEDLYDVTLTELPNQ

Similar Transcription Factors

Sequence clustering based on sequence similarity using MMseqs2

100% Identity: iTF_00476386;
90% Identity: iTF_00496354; iTF_00500067; iTF_00552069; iTF_00521926; iTF_00481993; iTF_00609642; iTF_00576107; iTF_00582723; iTF_00498631; iTF_00494872; iTF_00573807; iTF_00516755; iTF_00558419; iTF_00521111; iTF_00592855; iTF_00559992; iTF_00543504; iTF_00570160; iTF_00619603; iTF_00548565; iTF_00524885; iTF_00485623; iTF_00566551; iTF_00497912; iTF_00542201; iTF_00497146; iTF_00511034; iTF_00499351; iTF_00597120; iTF_00615962; iTF_00576827; iTF_00518206; iTF_00527807; iTF_00564415;
80% Identity: -