Basic Information

Insect: Drosophila nasuta
Gene Symbol: grh_1
Assembly: GCA_017165715.1
Location: Scf:28348-58814[-]

Transcription Factor Domain

TF Family: CP2
Domain: CP2 domain
PFAM: PF04516
TF Group: Beta-Scaffold Factors
Description: This family represents a conserved region in the CP2 transcription factor family.
Hmmscan Out: # of c-Evalue i-Evalue score bias hmm coord from hmm coord to ali coord from ali coord to env coord from env coord to acc

1 4 1.5 1e+04 -4.9 1.2 15 24 59 68 44 93 0.47

2 4 2 1.4e+04 -5.5 8.2 78 110 213 264 173 292 0.44

3 4 0.51 3.5e+03 -3.4 1.0 98 106 534 542 509 560 0.51

4 4 2.5e-63 1.7e-59 200.4 0.5 24 221 671 863 657 865 0.93

#	of	c-Evalue	i-Evalue	score	bias	hmm coord from	hmm coord to	ali coord from	ali coord to	env coord from	env coord to	acc
1	4	1.5	1e+04	-4.9	1.2	15	24	59	68	44	93	0.47
2	4	2	1.4e+04	-5.5	8.2	78	110	213	264	173	292	0.44
3	4	0.51	3.5e+03	-3.4	1.0	98	106	534	542	509	560	0.51
4	4	2.5e-63	1.7e-59	200.4	0.5	24	221	671	863	657	865	0.93

Sequence Information

Coding Sequence: ATGGGCGGCATGAAGGAAATGGAGCACATAATGCAGGATGCCAGCAGCAGCAGCTATGCCATATCCTACACCGACTGGATAGCTGCTGAGTCACGACGCGGCGCCAGCAGCTACAATCTGGACACAGAGCAGCATCATCAACATCATCATTCACAGCAGCAACACGAGCAGCTTCATCATCAGCAGCAGCAGCAACAGCAACAGCCTCAACATCATCATCATCATCATTACTACGAGGCAGCCAAGGACGACCCAGCACAGCTGCAACACCTGCCACTGACTGCCGCAGGCATCGAGCTGCAACTGAACGAACAGCAGCAGCAGCAGCAACCTTCACATCCGCCGCCCCCAACACTGCCGCAGCCAGCGCCAACGGATGATGTTATTGCCGTGCCGCCCACCTCGAGTGCCTCCTCCTCCTCGTTTGCCGTCTACAACTATTACAGGCATGAGGAACACGAGGAGGATCAACAACAGCAACAGCAACAGCAGCAGCAGCAACAACAGTTGGTGTGGAGCAATGCGAGCAGCGCCGGCAAATTAAATGGCCAGACCACACCTATCGATGTCTCTGGCCTATCGCAAAATGAAATTCAAGGCTTTCTGCTTGGTTCACACCCCTCATCGTCGGCGACCACAACCGGCGTGGTGTCCACCACAACCATCTCGAATCAGCAGCAGCAACAGCAGCAGCAACATCAACAACAGCAGCAGCAGCAACAACAGCAGCAGCACCAACAACAGCATCCCAGCGATATTGTAACCATCACCACGGCGGGTGTGGGGAGTGCGGGCTCAATTGTCTCCGCTGCCGTTCAACAGCAGCAGCAACAGCAACAACAACAGCAGCAGCAGCTGCTGAGCATCAAACGAGAACCCGAAGACTTGAGCAAGGATCCCAAGAATGGCAACATTGGCGCCGTCGCAGCCAATGGCGGCACCGTGATAACGCAGAAGATATTGCGCGTGGATGCCAACCAAACAGAGGCACAACAACAACAAGAAACTAACCTTAAATCAGCTGCAACAAGTGCAACAGCAACCGAAGTAGCAGCAGCAACAACAACAGCAACAACAACAGCATCTAGTCCCGCCAGATCATCGACAGCAGATCTAGAGATGTATGCTTCCACGGGCGGCACACAGATTTATCTACAGGTGAGTGAGAGCGAGCGAGAGCAACTGAGTGAGAGAGAGACAGAGATTGATCCCGAACTCCTGCAGACCTCACACCAGAGCACAACTGGCCCCACACAGCAGCAGAGCTCGTTGCAAGCCCAAAGTCCCAGCCCCGGACCGTACATCACAACCGATAGCTATGGCATGTATACGGCTACCCGACTGCCGCCCGGTCCCCCGCCCACAACGACCTTCATAACGGAGCCCTACTATCGGGAATACTTTGCCCCCGATGGCCAAGGTGGCTACGTTCCCGCCGGCTCAGCGCGCAGTCTCTACGGCGAGGATGTTTCCGTCTCCGCAGCCACGCAGGCGCAGCCCGTGGGCGGGGTTTATGAGGCGCGTTTCACCAGCAATGCACCGACCACAACCACAGTGCTTACCAGCAGTAATGCACACCATCACAGTCAACAACAGCAGCAGCAACAGCAACAACAGCAGCAGCAACAACAGCAGCAACAACAGCAACAGGATACGGGCAAAAATGGCAGCACGCCGTTGTATGCCAAGGCCATAACGGCAGCGGGTCTAACGGTGGATTTGCCGAGTCCCGATTCGGGAATTGGCACGGATGCCATAACGCCGAGGGATCAGAATCACATACAGCAGTCCTTTGACTACACGGAACTCTGCCAGCCGGGCACGCTGATCGATGCCAATGGCAGCATACCCGTCTCGGTGAACAGCATCCAGCAGCGGACTGTGGTCCACGGCAGTCAGAATAGTCCAACCACATCGCTGGTGGATACCAGCACAAATGGCTCAACACGCTCGAGGCCCTGGCACGATTTCGGACGTCAAAACGATGCTGATAAAATTCAAATACCAAAAATCTTCACAAATGTCGGCTTTCGCTATCATCTGGAGAGCCCGATTAGTTCGTCGCAGAGGCGTGAGGACGATCGCATCACCTACATCAATAAGGGACAGTTCTATGGCATCACCTTGGAGTATGTGCACGATGCGGAAAAGCCAATCAAGAATACAACAGTTAAGAGTGTGATCATGTTAATGTTTCGCGAGGAGAAGAGCCCCGAAGATGAGATAAAGGCCTGGCAATTCTGGCACAGTCGTCAGCATTCCGTGAAGCAAAGAATCTTGGATGCAGACACAAAGAACTCGGTTGGTCTCGTTGGCTGCATTGAGGAAGTGTCGCACAATGCCATCGCTGTCTATTGGAATCCGCTCGAGAGCTCTGCCAAGATCAACATTGCCGTACAGTGTCTCAGCACGGACTTTAGCAGTCAAAAAGGTGTCAAGGGTCTGCCGCTGCACGTTCAGATCGATACGTTCGAGGATCCACGAGATGCGACGGTCTTCCATCGGGGCTACTGTCAGATAAAGGTCTTCTGCGATAAGGGTGCGGAACGCAAGACGCGCGATGAGGAGCGACGTGCCGCAAAGCGCAAGATGACAGCAACTGGACGCAAGAAGCTGGATGAGCTCTATCATCCGGTGACGGATCGCTCCGAGTTCTATGGCATGCAGGATCTGGCCAAGCCCCCGGTGCTCTTCTCGCCCGCCGAGGACATTGAGAAGGTAACAACAACAACAACAACAACTAGCGCTAGCATGCCACCAGTTGAAGAACAAACGTTACACTCAATTGCTTATGCTCCACAGAGCTTCTATGGCCACGAGACTGACTCGCCGGAACTGAAAGGCGCCTCACCGTTCTTGTTGCACGGCCAAAAGGTTGCCACGCCCACGCTCAAATTCCACAATCACTTTCCGCCCGACATGCAGACTGACAAGAAGGATCACATATTGGATCAGAGCATGTTAACCAGCACTCCCATGTCCGACTTTGGGCCACCGATGAAACGGGGACGAATGACGCCGCCAACCACGGAGCGTGTCATGCTCTATGTGCGGCAGGAGAACGAGGAGGTCTACACGCCCCTTCATGTGGTGCCGCCCACCACAATTGGCCTGCTCAATGCGATTGAAAACAAATACAAAATCTCAACAACGAGCATAAATAACATTTATCGCACAAATAAGAAGGGGATTACGGCGAAAATTGATGATGATATGATATCTTTCTACTGCAACGAGGACATCTTCTTGCTGGAGGTGCAACAAATCGAGGATGACCTGTACGATGTGACGCTCACGGAGCTGCCCAATCAGTAG
Protein Sequence: MGGMKEMEHIMQDASSSSYAISYTDWIAAESRRGASSYNLDTEQHHQHHHSQQQHEQLHHQQQQQQQQPQHHHHHHYYEAAKDDPAQLQHLPLTAAGIELQLNEQQQQQQPSHPPPPTLPQPAPTDDVIAVPPTSSASSSSFAVYNYYRHEEHEEDQQQQQQQQQQQQQLVWSNASSAGKLNGQTTPIDVSGLSQNEIQGFLLGSHPSSSATTTGVVSTTTISNQQQQQQQQHQQQQQQQQQQQHQQQHPSDIVTITTAGVGSAGSIVSAAVQQQQQQQQQQQQQLLSIKREPEDLSKDPKNGNIGAVAANGGTVITQKILRVDANQTEAQQQQETNLKSAATSATATEVAAATTTATTTASSPARSSTADLEMYASTGGTQIYLQVSESEREQLSERETEIDPELLQTSHQSTTGPTQQQSSLQAQSPSPGPYITTDSYGMYTATRLPPGPPPTTTFITEPYYREYFAPDGQGGYVPAGSARSLYGEDVSVSAATQAQPVGGVYEARFTSNAPTTTTVLTSSNAHHHSQQQQQQQQQQQQQQQQQQQQQDTGKNGSTPLYAKAITAAGLTVDLPSPDSGIGTDAITPRDQNHIQQSFDYTELCQPGTLIDANGSIPVSVNSIQQRTVVHGSQNSPTTSLVDTSTNGSTRSRPWHDFGRQNDADKIQIPKIFTNVGFRYHLESPISSSQRREDDRITYINKGQFYGITLEYVHDAEKPIKNTTVKSVIMLMFREEKSPEDEIKAWQFWHSRQHSVKQRILDADTKNSVGLVGCIEEVSHNAIAVYWNPLESSAKINIAVQCLSTDFSSQKGVKGLPLHVQIDTFEDPRDATVFHRGYCQIKVFCDKGAERKTRDEERRAAKRKMTATGRKKLDELYHPVTDRSEFYGMQDLAKPPVLFSPAEDIEKVTTTTTTTSASMPPVEEQTLHSIAYAPQSFYGHETDSPELKGASPFLLHGQKVATPTLKFHNHFPPDMQTDKKDHILDQSMLTSTPMSDFGPPMKRGRMTPPTTERVMLYVRQENEEVYTPLHVVPPTTIGLLNAIENKYKISTTSINNIYRTNKKGITAKIDDDMISFYCNEDIFLLEVQQIEDDLYDVTLTELPNQ

Similar Transcription Factors

Sequence clustering based on sequence similarity using MMseqs2

100% Identity: iTF_00476386;
90% Identity: -
80% Identity: -