Basic Information

Insect: Scaptomyza tumidula
Gene Symbol: grh_1
Assembly: GCA_035044465.1
Location: JAWNNW010000444.1:4839830-4880775[-]

Transcription Factor Domain

TF Family: CP2
Domain: CP2 domain
PFAM: PF04516
TF Group: Beta-Scaffold Factors
Description: This family represents a conserved region in the CP2 transcription factor family.
Hmmscan Out: # of c-Evalue i-Evalue score bias hmm coord from hmm coord to ali coord from ali coord to env coord from env coord to acc

1 4 0.56 4.9e+03 -3.5 1.1 95 105 186 196 172 223 0.47

2 4 2 1.8e+04 -13.3 16.1 59 109 647 698 588 748 0.43

3 4 0.49 4.3e+03 -3.3 2.5 107 127 960 976 934 993 0.50

4 4 5.3e-63 4.7e-59 199.3 0.5 24 221 1103 1295 1089 1297 0.93

#	of	c-Evalue	i-Evalue	score	bias	hmm coord from	hmm coord to	ali coord from	ali coord to	env coord from	env coord to	acc
1	4	0.56	4.9e+03	-3.5	1.1	95	105	186	196	172	223	0.47
2	4	2	1.8e+04	-13.3	16.1	59	109	647	698	588	748	0.43
3	4	0.49	4.3e+03	-3.3	2.5	107	127	960	976	934	993	0.50
4	4	5.3e-63	4.7e-59	199.3	0.5	24	221	1103	1295	1089	1297	0.93

Sequence Information

Coding Sequence: ATGTCCACATCCACGGCGACAACGAGCGTCATTACGTCCAACGATATATCGCTGTCTGCCCATCATCACGGCCACgcccaccaccaacaacaacaacagcaacagcaacaacaacactcgcacaacacacactcactgcacacacacaccacacaccgaTTGAGTGTGGGCGGCGTGAGTGTGGGTGGCGTTGTCGTTGGCGGCGTTGGCGGTCATCTTAGCGACGCCTCACTGTCACCCATACAGCAGGGTGCCAACATtgtggcaagcagcaacagctcgcCATTGGGCCAAAACGGCATACCACTACTCACCACCATGCATCGCTCCCCGGACAGTCCACAGCCCGAGTTGGCCACAATGACAAATGTCAATGTTCTCGATCTGCACACAGATTCGTCCAAGCTGTACGACAAGGAAGCGGTGTTCATCTATGAGACGCCCAAAGTGGTGATGCCACCCGACAATGGCAATGGCTCGAATAATGGTcatgatgatggtggtggtggtcaGGTGATAGATGCacgcatgcaacaacaacatcagcagcaacagcaacaacaacagcagcaacagcagcaacagcaacaggcacaGGAACATCAACCGCTGGCTAAGATTGAGTTCGATGAGAATCAAATAATACGCGTTGTGGGACCAAATGGTGAACAACAGCAGATCATATCGCGCGAGATCATCAATGGGGAGCATCACATCCTGTCCAGAAACGAGGCCGGCGAGCACATACTCACCCGCATCGTTAGCGATCCGTCCAAGCTGATGCCGAACGATAATGCTGTCGCCACGGCGATGTACAATCAGGCCCAGAAGATGAACAACGAACATCAGGGTGTCTATCAAACATCACCACTACCGTTGGACGCCTCGGTGCTGCACTATGGCAATGATAATGTGATCAAGACCGAGGCAGAGATCTATGAGGATCATAAGAAGCATGCGGCTGCTGGTGGCGGTGGTTCCATCATCTATACCACAACCGATCCGAATGGCGTCAATGTGAATGTCAAACAGTTGCCACATCTGGCGGGCGTGCCACAGAAACTCGATCCCGAACTCTATCAGACCGACAAGCACATCGATCTGATCTACAATGATGGCAGTAAAACTGTCATCTACTCCACAAGCGATCAGAAGGGTCTCGAGATCTATTCCGGCGGCGATATCGGCAGTCTTGTCTCCGATGGTCAGGTTGTGGTGCAAGCGGGTCTGCCATATGCCACAACCACCAGTGCCACAGGTCAACCCGTCTATATAGTCGCCGATGTTGAGGAACATTTGCAGGGGCGCTTTAGCCTggatcagcagcaacaaacgccGCCCCCGccgcaccaacaacaccaccaccaacacccacaacagcaacagcagcaacaagaacttcagcaacatcatcattatcccagtcatcatcatcatcatgatcatcatcatgatcattaTGGTAGTCAATCGCCACCGCATTACACATATGTGCCGCAAAAGGATGCAACAACACAGttagtgcaacaacaacaacaacaacaacatgtgcCACTAACTGCCGCTGGGCTCATGCAATCTGTCGCTGCCGAGATACAACTAAGTGAACAGCACTCGACACCACCACCCCCACCAACTCCCCACCTTCCACCACAACCACCCCAGGCACACGCctccaatgccaatgccaatgccaatgccagcTATGCTGTCTACAGCTACTATCGTCCCGATGTCGATGTGGATGtcgatgatgttgatgttgatgttgatcaacaacagcagcagcaacaggagcaaccacaacaccaacaccaccaccaccaacaacaacaacaacaacaacaagatcaaCAGCTACTGTGGAGcaaTGCGAGCAGCGCCGGCAAACTGAACGGCCAGACCACACCTATCGATGTCTCTGGTTTATcgcaaaatgaaattcaagGCTTTCTGCTTGGTTCACACCCCTCATCGTCGGTTGCCACAACTGGCGTTgtatccacaacaacaatctcaaatcagcaacatcatcagcagcagcagcagcaacaacaacagcaacaacaacaacatcagcaacatcaacaacagcaacaacaacaacaacaggcgaCACATCCCAGCGATATTGTGACCATAAGCACAGCGGGTGTGGGGAGCGCAGGCTCAATTGTCTCTGCAgccgtgcaacaacaacagcagcaacaacagcagcaacaacagcaattgctgAGCATCAAACGTGAACCCGAAGATCTAAGCAAGGATCCCAAGAATGGCAATCTGAGCGCCGCAGCAAACGGTGGCGGTTCAGTCATAACGCAAAAGATATATCGCGTGGATGCAGCTAGAACTGAAGTTGAGgcaagtgcaactgcaactgcttacgaaataagcaataaaacaacaacaacaagtgaaacTGCAACTAGTCCAGCCAGAGCCACACCCGATCTAGAGATGTATGCTACCACGGGCGGCACACAGATTTATCTACAGACCTCACATCAGAACAGCACCGGCCCCAGCACACAGCAGAGCACACTGCAAGCCCAGAGTCCCAGTCCCGGGCCGTACATTACAACGGATAGTTATGGCATGTATACGGCAACGAGACTGCCGCCCGGCCCACCGCCCGCCACCACATTCATAACGGAACCCTACTACCGCGAATACTTTGCACCCGATGGTCAGGGCGGCTATGTGCCCGCCGGTACGGCGCGCAGTCTCTACGGCGAGGATGTATCCGTTTCGGCAGCCACACAGCCACAGCCTGTGGGCGGCGTTTATGAGGCACGTTTTACCAGCAATGgtcccaccaccaccacagtGCTAACTAGCAGCAATGCacaccagcagcaccacagtcagcagcaacaacagcagcaacaacagcagcagcaacagcagcagcaacagcagcaacaacaacagcaacaggaacagtCGGTTAAAAACGGCGGTACTCCACTATATGCCAAGGCTATAACGGCGGCAGGTCTGACCGTCGATTTGCCCAGTCCCGATTCTGGCATTGGCACAGATGCCATAACGCCGCGGGATCAAAATCACATACAGCAGTCCTTCGATTATACGGAACTTTGTCAGCCGGGTAGCTTAATTGATGCTAATGGCAGCATACCCGTTTCAGTTAACAGCATCCAGCAGCGAACTGTTGTGCATGGCAGCCAGAATAGTCCAACCACATCGTTGGTGGATACCAGCACAAATGGTTCGACACGTTCAAGACCCTGGCACGACTTCGGGCGCCAAAATGATGCtgacaaaatacaaataccaaaaatCTTCACAAATGTGGGCTTCCGTTATAATTTGGAGAGCCCGATCAGCTCGTCACAGCGTCGGGAGGACGATCGCATCACCTACATCAACAAGGGTCAGTTCTATGGCATAACGCTTGAATATGTTCACGATGCGGATAAGCCAATCAAAAATACAACTGTTAAGagTGTGATCATGTTAATGTTTCGCGAGGAGAAGAGTCCCGAAGATGAGATAAAGGCCTGGCAATTCTGGCACAGTCGTCAGCATTCCGTGAAGCAAAGAATCTTGGATGCAGaTACAAAGAACTCGGTTGGTCTCGTCGGTTGCATCGAGGAAGTGTCGCACAATGCCATTGCCGTCTACTGGAATCCGCTCGAGAGCTCTGCCAAGATCAACATTGCGGTTCAGTGTTTGAGCACGGATTTTAGCAGTCAAAAGGGTGTTAAGGGTCTGCCGTTGCACGTACAAATCGATACGTTCGAGGATCCACGGGATACGACAGTCTTTCATCGTGGCTACTGTCAGATAAAGGTCTTCTGCGATAAGGGCGCTGAGCGTAAGACGCGCGATGAGGAGCGTCGTGCCGCCAAACGTAAAATGACAGCAACTGGACGCAAGAAGCTCGATGAGCTCTATCATCCGGTCACAGATCGTTCCGAGTTCTATGGCATGCAGGATCTGGCCAAGCCGCCAGTGCTCTTCTCGCCCGCCGAGGATATGGAGAAGAGCTTCTATGGGCATGAGACTGACTCGCCGGAGCTGAAAGGTGCCTCACCATTCTTGTTGCACGGTCAGAAGGTGGCAACGCCAACGCTCAAATTTCACAATCACTTTCCGCCCGACATGCAGACTGACAAGAAGGATCATATATTGGACCAGAGTATGTTAACCAGCACGCCCATGGCCGATTTTGGGCCACCAATGAAACGGGGCAGAATGACGCCGCCAACAACGGAACGCGTCATGTTGTACGTGCGGCAAGAGAACGAAGAGGTCTATACGCCGCTCCATGTGGTACCTCCCACCACAATTGGCCTGCTTAATGCGattgaaaacaaatacaaaatctcAACAACGAGCATAAATAACATATATCGCACAAATAAGAAGGGGATTACGGCGAAAATTGATGACGATATGATATCCTTCTACTGCAACGAGGACATTTTCTTGCTGGAAGTGCAACAAATCGAGGATGATCTGTACGATGTAACGCTCACGGAGCTGCCCAATCAATAG
Protein Sequence: MSTSTATTSVITSNDISLSAHHHGHAHHQQQQQQQQQQHSHNTHSLHTHTTHRLSVGGVSVGGVVVGGVGGHLSDASLSPIQQGANIVASSNSSPLGQNGIPLLTTMHRSPDSPQPELATMTNVNVLDLHTDSSKLYDKEAVFIYETPKVVMPPDNGNGSNNGHDDGGGGQVIDARMQQQHQQQQQQQQQQQQQQQQAQEHQPLAKIEFDENQIIRVVGPNGEQQQIISREIINGEHHILSRNEAGEHILTRIVSDPSKLMPNDNAVATAMYNQAQKMNNEHQGVYQTSPLPLDASVLHYGNDNVIKTEAEIYEDHKKHAAAGGGGSIIYTTTDPNGVNVNVKQLPHLAGVPQKLDPELYQTDKHIDLIYNDGSKTVIYSTSDQKGLEIYSGGDIGSLVSDGQVVVQAGLPYATTTSATGQPVYIVADVEEHLQGRFSLDQQQQTPPPPHQQHHHQHPQQQQQQQELQQHHHYPSHHHHHDHHHDHYGSQSPPHYTYVPQKDATTQLVQQQQQQQHVPLTAAGLMQSVAAEIQLSEQHSTPPPPPTPHLPPQPPQAHASNANANANASYAVYSYYRPDVDVDVDDVDVDVDQQQQQQQEQPQHQHHHHQQQQQQQQDQQLLWSNASSAGKLNGQTTPIDVSGLSQNEIQGFLLGSHPSSSVATTGVVSTTTISNQQHHQQQQQQQQQQQQQHQQHQQQQQQQQQATHPSDIVTISTAGVGSAGSIVSAAVQQQQQQQQQQQQQLLSIKREPEDLSKDPKNGNLSAAANGGGSVITQKIYRVDAARTEVEASATATAYEISNKTTTTSETATSPARATPDLEMYATTGGTQIYLQTSHQNSTGPSTQQSTLQAQSPSPGPYITTDSYGMYTATRLPPGPPPATTFITEPYYREYFAPDGQGGYVPAGTARSLYGEDVSVSAATQPQPVGGVYEARFTSNGPTTTTVLTSSNAHQQHHSQQQQQQQQQQQQQQQQQQQQQQQQEQSVKNGGTPLYAKAITAAGLTVDLPSPDSGIGTDAITPRDQNHIQQSFDYTELCQPGSLIDANGSIPVSVNSIQQRTVVHGSQNSPTTSLVDTSTNGSTRSRPWHDFGRQNDADKIQIPKIFTNVGFRYNLESPISSSQRREDDRITYINKGQFYGITLEYVHDADKPIKNTTVKSVIMLMFREEKSPEDEIKAWQFWHSRQHSVKQRILDADTKNSVGLVGCIEEVSHNAIAVYWNPLESSAKINIAVQCLSTDFSSQKGVKGLPLHVQIDTFEDPRDTTVFHRGYCQIKVFCDKGAERKTRDEERRAAKRKMTATGRKKLDELYHPVTDRSEFYGMQDLAKPPVLFSPAEDMEKSFYGHETDSPELKGASPFLLHGQKVATPTLKFHNHFPPDMQTDKKDHILDQSMLTSTPMADFGPPMKRGRMTPPTTERVMLYVRQENEEVYTPLHVVPPTTIGLLNAIENKYKISTTSINNIYRTNKKGITAKIDDDMISFYCNEDIFLLEVQQIEDDLYDVTLTELPNQ

Similar Transcription Factors

Sequence clustering based on sequence similarity using MMseqs2

100% Identity: -
90% Identity: -
80% Identity: -