Basic Information

Insect: Drosophila pseudotalamancana
Gene Symbol: grh_1
Assembly: GCA_037075185.1
Location: JBAMCK010000282.1:116391-147795[-]

Transcription Factor Domain

TF Family: CP2
Domain: CP2 domain
PFAM: PF04516
TF Group: Beta-Scaffold Factors
Description: This family represents a conserved region in the CP2 transcription factor family.
Hmmscan Out: # of c-Evalue i-Evalue score bias hmm coord from hmm coord to ali coord from ali coord to env coord from env coord to acc

1 5 2.1 1.3e+04 -4.8 2.1 89 107 45 63 37 77 0.45

2 5 0.21 1.3e+03 -1.5 4.9 80 110 226 258 168 308 0.59

3 5 0.1 6e+02 -0.5 0.8 84 125 343 387 321 401 0.58

4 5 0.33 1.9e+03 -2.2 1.1 92 109 566 583 540 601 0.50

5 5 4.2e-63 2.5e-59 200.3 0.5 24 221 708 900 694 902 0.94

#	of	c-Evalue	i-Evalue	score	bias	hmm coord from	hmm coord to	ali coord from	ali coord to	env coord from	env coord to	acc
1	5	2.1	1.3e+04	-4.8	2.1	89	107	45	63	37	77	0.45
2	5	0.21	1.3e+03	-1.5	4.9	80	110	226	258	168	308	0.59
3	5	0.1	6e+02	-0.5	0.8	84	125	343	387	321	401	0.58
4	5	0.33	1.9e+03	-2.2	1.1	92	109	566	583	540	601	0.50
5	5	4.2e-63	2.5e-59	200.3	0.5	24	221	708	900	694	902	0.94

Sequence Information

Coding Sequence: ATGctgacgcagacgcagacgctgACGCAGGCGCTGGCGCAAACGTTTCTCACACTCAACGCTGTAGAAATGCGCAGCGGGCAGGGACAACGACgcggcgccagcagcagctacagcctagatgcgcaacaacagcaacagcagcaacaacaacaacaacttcatcatcagcaccagcagcagcaacatgtgcagcagcagccgcatttgCAGACGCTGCAGCATCATTTTGGCAGCCACTATGCGCCGCCCAAGGACGAGGcactccagcagcagcagcagcaacacttgcaacaccTGCCGCTGACCGCCGCTGGGCTCATGCAAGCAGTTGCCGCTGAGATACAATTGAGCGAGCAGCAGAGCACACCCCCGCCCCCAGTCACAGACGCAgttgcagccacagccgcCGCCCCCGCCGCCACCTCCTGCTCGAGTGCATCCTACGCTGTTTACAGCTATTACAGAGATGCTGATGCCGatcagcaggaggagcagcacaatgccagtcaacaacaacagcagcagcaacttgtGTGGAGCAATGCGAACAGCGCCGGCAAACTGAATGGCCAGACCACACCTATCGATGTCTCTGGCCTATcgcaaaatgaaattcaaggCTTTCTGCTTGGTTCACACCCCTCATCGTCGGCCGCCACAACGGGCGTTGtgtccacaacaacaatttcccatcagcaacagcagcagcagcaacagcagcagcagcaacagcagcagcagcaacatcaccagcagcaacagcagcagcagcagcagcatcaacagcagcagcagcagcagccgccacatCCCAGCGATATTGTAACCATCAGCACTGCGGGTTCGATTGTCTCCACTgctgtgcagcagcaacagcaacagcagcagcagcagcagctgctgagcaTCAAGCGTGAGCCCGAAGACTTGAGCAAGGATCCGAAAAATGGCAGCCTGGGCGCCACGGCTAACGGTTCAGTCATAACGCAGAAGGCACAACAAGTGCTGGGAAATTGCGCGACTGTTGCAAgtagcaacaagcagcagcagcagcagcagcagcagcagcagcagcagcagcagcagcagcaacaagctaAGCCAAAGGCGACAAAAATATTGCGCGTGGATGCATCTAGAGGTGAGGCAAGagaggcaactgcaactgcaactgcaactgcattcGATATAACCAATAaaagagcaacagctgcaacagctgctacagctgcaacaagtgcaacaactgcaactgcaactgcaactagtCCCGCCAGCGCGACAGCAGATCTAGAGATGTATGCTACCACGGGCGGCACACAGATTTATCTACAGACCTCACATCAAAACAGCAATGGAACACCCCAGAGCACGTTGCAAGCGCAGAGTCCCAGTCCGGGTCCGTATATCACAGCCGATAGCTACGGGATGTACACAACCACACGATTGCCTCCCGGACCGCCGCCCGCCACCACATTCATAACGGAGCCCTATTATCGTGAATATTTCGCACCGGACGGACAGGGAGGCTACGTGCCGGCGGGCACCGCTCGCAGCCTTTACGGCGAGGACGTTTCCGTATCCGCTGCCGGACAGCCGCAGCCGGTGGGCGGGGTCTATGAGGCGCGAttcagcagcaacggcaacaccACAACCACAGTGCTAACCAGCAGCAATGCGCACCACCacagtcaacagcagcaacagcagcaacagcagcagcaacagcagcaacagcagcagcagcagcagcaggagcagtcGGTCAAGAGTGGGGGTACGCCGCTCTATGCCAAGGCTATTACGGCGGCGGGTCTGACCGTCGACTTGCCCAGTCCCGATTCGGGCATTGGCACGGATGCCATAACGCCGCGGGATCAGAATCACATACAGCagtCCTTCGATTATACGGAACTCTGCCAGCCGGGCCCCCTAATCGATGCCAATGGCAGCATACCCGTTTCGGTGAACAGCATACAGCAGCGGACGGTGGTGCATGGCAGCCAGAATAGTCCAACCACATCGCTGGTGGATACCAGCACGAATGGTTCGACACGTTCCAGGCCCTGGCACGATTTTGGACGACAGAATGATGCtgataaaatacaaataccaaaaatCTTCACAAATGTGGGCTTTCGCTACAATCTGGAGAGTCCGATCAGCTCGTCGCAGCGTCGGGAGGACGATCGCATCACCTACATCAACAAGGGTCAGTTCTATGGCATTACGCTGGAGTATGTGCACGATGCGGATAAGCCAATCAAGAATACAACGGTTAAGAGTGTGATCATGTTGATGTTTCGGGAAGAGAAGAGTCCCGAGGACGAGATCAAGGCCTGGCAATTCTGGCACAGTCGCCAGCATTCCGTGAAGCAGAGAATCTTGGATGCAGataCAAAGAACTCGGTTGGTCTCGTTGGCTGCATTGAGGAAGTGTCGCACAATGCCATTGCCGTCTATTGGAATCCGCTCGAGAGCTCCGCCAAGATTAACATTGCGGTTCAGTGCCTCAGCACGGACTTCAGCAGTCAGAAAGGTGTTAAGGGTCTGCCGCTGCACGTACAAATCGATACGTTCGAGGATCCGCGCGATGCGACGGTCTTTCATCGCGGCTACTGTCAGATAAAAGTCTTCTGCGATAAGGGCGCCGAGCGGAAGACGCGCGACGAGGAGCGACGCGCGGCCAAGCGCAAAATGACGGCCACTGGACGCAAGAAGCTGGACGAGCTCTATCATCCCGTTACGGATCGCTCCGAGTTCTATGGCATGCAGGATCTGGCCAAGCCGCCGGTGCTCTTCTCGCCCGCCGAGGATATGGAAAAGAGCTTCTATGGCCATGAGACTGACTCGCCGGAACTGAAGGGCGCTTCGCCTTTTCTGCTGCACGGCCAGAaggtggccacgcccacgctcAAATTTCACAATCACTTTCCGCCCGACATGCAGACTGATAAGAAGGATCACATATTGGATCAGAGTATGTTAACCAGCACGCCGATGGCCGACTTTGGGCCGCCGATGAAACGGGGCCGAATGACGCCTCCGACCACGGAGCGGGTGATGCTGTACGTCCGGCAGGAGAACGAGGAGGTGTACACGCCCCTACATGTGGTGCCGCCCACCACGAGTGGCCTGCTCAATGCGattgaaaacaaatacaaaatctcAACAACGagcataaataacatatatcgCACAAATAGGAAGGGGATTACGGCGAAAATTGATGACGATATGATATCCTTCTACTGCAACGAGGACATCTTTTTGCTGGAAGTGCAACAGATCGAGGACGATTTGTATGATGTGACGCTCACAGAGCTGCCCAATCAGTAG
Protein Sequence: MLTQTQTLTQALAQTFLTLNAVEMRSGQGQRRGASSSYSLDAQQQQQQQQQQQLHHQHQQQQHVQQQPHLQTLQHHFGSHYAPPKDEALQQQQQQHLQHLPLTAAGLMQAVAAEIQLSEQQSTPPPPVTDAVAATAAAPAATSCSSASYAVYSYYRDADADQQEEQHNASQQQQQQQLVWSNANSAGKLNGQTTPIDVSGLSQNEIQGFLLGSHPSSSAATTGVVSTTTISHQQQQQQQQQQQQQQQQQHHQQQQQQQQQHQQQQQQQPPHPSDIVTISTAGSIVSTAVQQQQQQQQQQQLLSIKREPEDLSKDPKNGSLGATANGSVITQKAQQVLGNCATVASSNKQQQQQQQQQQQQQQQQQQAKPKATKILRVDASRGEAREATATATATAFDITNKRATAATAATAATSATTATATATSPASATADLEMYATTGGTQIYLQTSHQNSNGTPQSTLQAQSPSPGPYITADSYGMYTTTRLPPGPPPATTFITEPYYREYFAPDGQGGYVPAGTARSLYGEDVSVSAAGQPQPVGGVYEARFSSNGNTTTTVLTSSNAHHHSQQQQQQQQQQQQQQQQQQQQQEQSVKSGGTPLYAKAITAAGLTVDLPSPDSGIGTDAITPRDQNHIQQSFDYTELCQPGPLIDANGSIPVSVNSIQQRTVVHGSQNSPTTSLVDTSTNGSTRSRPWHDFGRQNDADKIQIPKIFTNVGFRYNLESPISSSQRREDDRITYINKGQFYGITLEYVHDADKPIKNTTVKSVIMLMFREEKSPEDEIKAWQFWHSRQHSVKQRILDADTKNSVGLVGCIEEVSHNAIAVYWNPLESSAKINIAVQCLSTDFSSQKGVKGLPLHVQIDTFEDPRDATVFHRGYCQIKVFCDKGAERKTRDEERRAAKRKMTATGRKKLDELYHPVTDRSEFYGMQDLAKPPVLFSPAEDMEKSFYGHETDSPELKGASPFLLHGQKVATPTLKFHNHFPPDMQTDKKDHILDQSMLTSTPMADFGPPMKRGRMTPPTTERVMLYVRQENEEVYTPLHVVPPTTSGLLNAIENKYKISTTSINNIYRTNRKGITAKIDDDMISFYCNEDIFLLEVQQIEDDLYDVTLTELPNQ

Similar Transcription Factors

Sequence clustering based on sequence similarity using MMseqs2

100% Identity: iTF_00476386;
90% Identity: -
80% Identity: -