Basic Information

Insect: Megachile willughbiella
Gene Symbol: CSRNP3_1
Assembly: GCA_945859635.1
Location: CAMAOE010000018.1:344890-348910[-]

Transcription Factor Domain

TF Family: CSRNP_N
Domain: CSRNP_N domain
PFAM: PF16019
TF Group: Unclassified Structure
Description: This presumed domain is found at the N-terminus of cysteine/serine-rich nuclear proteins. These proteins act as transcriptional activators [1].
Hmmscan Out: # of c-Evalue i-Evalue score bias hmm coord from hmm coord to ali coord from ali coord to env coord from env coord to acc

1 3 0.27 6.3e+03 -2.8 0.4 78 120 106 148 50 177 0.55

2 3 0.35 8.4e+03 -3.2 0.7 54 107 377 433 368 451 0.50

3 3 3.7e-101 8.9e-97 323.7 8.6 1 218 723 933 723 933 0.92

#	of	c-Evalue	i-Evalue	score	bias	hmm coord from	hmm coord to	ali coord from	ali coord to	env coord from	env coord to	acc
1	3	0.27	6.3e+03	-2.8	0.4	78	120	106	148	50	177	0.55
2	3	0.35	8.4e+03	-3.2	0.7	54	107	377	433	368	451	0.50
3	3	3.7e-101	8.9e-97	323.7	8.6	1	218	723	933	723	933	0.92

Sequence Information

Coding Sequence: ATGGAATCATCTTCGGCCGAGGGTCGTCTTCTCGAAGCCAAAGAAGATTCCATGTCAGTGGAATCTGTCGCCAGTCCTGGACCGAGCACGTCCATCGTGGAGGGAGAAAAGACGGCGGTACTCGAGGATGTCGGTATACCAGAGGAAAAGAAGCAGAATGCGTGTCACAGGTCCAAGGACAGTCAAGGGTTCGTGAATATAGAATCGCGCGAGACTTCGATCGATCACGAGGTCTCGAACAACCCTTCCGTGCCAGAGGATCAATCGAACCTTAACATGGGATTGAAGATGGGAAAACAGAGCAACCAGAGTGAAGGTTCGACCGCGGTTGCTGCGTCCACCGAATCCGCGGAAACGTCGTCGGCGGTCAATGTTCCCGACAAGCTGGAGGACAAGGGAGAAGTTTCGGAGTTCGTTACCTCGTCGCCGATATGCAGGAAGAGGCCAGCCAACGATTTCCTGCCGATCAACGCGGAGATTAAACGAATAGAGATGGAGGGTACAGAAAACGACGCGAACCAAGTGAGGAGCGACGTGAGGAGGATCTCGCCGGTTCTGGTGAGCCTTCGAGAGCGCACCCTGGGCGAGATATCCTTGTCGTCGGACTCGTGTCTTTTCGACGACGACGCGAACGGTCGCTGCGTCTCGAGGAACAGCAGCATTCTCGAGGATTTGTTGACCGGTACCTACAAGCTGAACAACAGCTTGAACAGTAGCACGAACAGCACGCTGAACAACAGCCAGAACAGTAGTCTGACTCTCGACAGCTGCGCTCAAACTGGTAGTGACAATCCTGCGTCGACGGTGGGAGGCTGTTCGGATTCGGAGCACAGGATCAACGGGACAACGTCACAGGGTGGCGAACGCACGGAGGATCCGTTCATCGACGAGGACTCCTGTTATTCGCTGCCTCGCGACAGTCCTGGCAGGGACCTGAACTCGTGTCAGCAACCGAAACAGTGCGAGGAGCCGATCGAGCCGTGTTCCTATAACGACACTTCCTCGCCCGCGCACGATGGTTGCCCTTACGTCCCGAGATCCCCCAAGATGCCGACCAAACTGATGGATTATTCGTCGTTTCCTTATTTAACCGTGACGTTGGAACGCGTGGAATCTCTGACGCCGGAAAGGAAGGACAAGAAGCGGACGATCGTGAAGAAGAAACCGAAAAGTGCAACGTGCGACGACGTCGGTGGCACGGAGGCGACTACTGATCCGAAGAATACGTCCAAGGAGTCGAGTTTGGTCCAGAGGTGTGTTCGCGAGAAGAAGGAGCAACCGCAGGAGGAGCAACACCAAGTGGATTCTCCCTCGCTGGAACCGTTCTGCGAGAAGTCGTGTTCGCCTAATGTAAATGCTATGAAACAATGCAGAGTGATCGTGGAAAGAGTAAACTCGCCGAAACCGGTGAGGACCGCGGTGCAAAAGCTTTGTCCGGACAAGGGAGAGCAAAGCCCGAAAGTGGTCGTTAAGCAGTTGGCCGAAGACGAGGAAATGGTGTTCACCTCTACCCTGTCCGACAAAGACAAAAGTCTTCTGCCGGTAAACACCTCGAATTCGTCCGACACGACAGCCGACTCCTCCGACCAGACGTTGGAGCCTTCCACGGACGTTCCGGAAGCCGTTGACACGGAGACCGAGACCGAGACCGGGTCCGATAGTTCGGAAGTGACGTCCGTGAACGCACGACTTCGGGGATGCGACGATGACACCGTGTCCGATCAGATATCTTGCCCAGAAAGCGAATCCATGTGCTGCGTCGACATCAACCCGGAGATTATCACCAGGTTGGAACCGGAAAGACCGGAAGCGTTCACGGAGGACTCCGCGGAAAGTCTAGCTCTTGCCGCTGGTGCTCGGGACGAAGTTAGGTCGGACGGTAGCGATTCTGGCCTGGGAAGCGAGATACCTGGTGAATCTGGACCTGCACCGGCTCCAGAAAGCGATTCTGAAACTTCTTTCTTGGATAGGATACCCGATGATATTCTTTCCGATAAAGAAAAAGTGGTGAATCAGTTGGAGTCGGTCGGAGTGGATGTAACCGGTACCCCGCAGACGCCGTTGACTAACTTCCGGAGTCCATCGAAGAGCAGCTTGAAACGGAGATTGATCGACTGCATGGAAGGTGCACCGAGTCCGAAGAAGAGCAATACCGATGAGTCCATGAAGAAGAAGCGCAACATTCAGTTCGATGCTGTAACCGTGTATTACTTTCCCAGGGCACAGGGTTTTACTTGCGTGCCTTCTCAGGGTGGCAGCACTCTTGGTATGAGCGCGACGCACACTCACGCCGAACGGTTCTCGTTATCGGAACACGCTGCCGAACAGAGACGGATTCATCGTGCTAGGCTTGCACAATTGCGCTCCGAGCGCGCTGCAAATTGCGTGTCCGAGGCGGCGTCCAGTTCCGAGGATCCTAGCGACGACACGGACGAAGAACAAAGCGATAACGAGGAGCTGGACATCGATAGTTATTATTTCCTGCAGCCGGTGCCAACGTGGCAAAGACGAGCGTTGCTTCGTGCCGCGGGAGTTCGTCGAATAGACGCCATCGAAAAGGACGAGTGTCGCGATATCAGAGCTAGCAGAGAACACTGTGGTTGTGGATGCAAAGGATATTGCGATCCAGAGAGTTGTCCTTGTAGCCGAGCCAATGTCAAGTGCCAGGTCGATCGAGCAGGTTTCCCTTGCGGATGTACTCGAGACGGATGCGCGAATAGTTCAGGCAGAATCGAGTTCAATCCCGTCAGAGTACGAACGCATTTCATCCACACGTTGATGCGGTTAGAGTTAGAGAAAAAGCATCGAGAAGAAGAGGAGGGTACGGATCACGATGCATCTGACAATCAGAACGGTAGAAGTCCGTTAAGAGAGATTAACTTGGGATCTGTGATGGAGAATAGGAACGCGGAATCGTGTTTGAACGGCGGTGGATTCACGACGTTACACTATGAGAACCACGACGCGAGGGATGCCGGAACAAATTGTCAGCCAGAGATAACCGGCACCAGAGAGGATAGTCTGGATCTGTACGCTATCAGAGACGATTGTTATCCGAGCGAAGACACTGTCGATGGTACGCAGGGACCTCAAAGGAAACTTCATCCTGAATTTAGTCAAGCTTTTCAAACGTTCACGGGTCAAACCGGTGCCGGTGTTAATTTTCAACAGCCTACTTATCAGGATTACCAGCCTTACGCTAACCTTCCTTCCACGTCTAGGGTGCAATTTCAGCCACAATTCCAAACGGTGCCAGGAAATCCAGGGTTCTCGCATTACTCGCCTTACGGGCAAGACGCTGGATCGATTCAGGGGAACTGCCAAGTCCACTCGGGACAACATTCTTCCGCCTATGAGACCAGCTTCGCCCAAGACGAGACAACAGGATCGCAGTACACGAATCTGAACTCGGTGCAGCCAATGAACACTGTGGTTCAACAAATGGGTAAACTAGAACCATTCTCGGAACTCTTGTCTGCCAGATATTCGTACTACGGTGAAATGGAGCCGCAAGCGCACGGTACTTATCACGGGAACGGAACCAAGGTCGACGTCGAGAAGAATCATCAAGGTAACGAGCAACAATCGGAAAGTACGGAGGAGTGCGACGAAAACTTCGGGGAGATCATCAAGAAGTCGATGGTCGAGACTGTATCCGCTTAA
Protein Sequence: MESSSAEGRLLEAKEDSMSVESVASPGPSTSIVEGEKTAVLEDVGIPEEKKQNACHRSKDSQGFVNIESRETSIDHEVSNNPSVPEDQSNLNMGLKMGKQSNQSEGSTAVAASTESAETSSAVNVPDKLEDKGEVSEFVTSSPICRKRPANDFLPINAEIKRIEMEGTENDANQVRSDVRRISPVLVSLRERTLGEISLSSDSCLFDDDANGRCVSRNSSILEDLLTGTYKLNNSLNSSTNSTLNNSQNSSLTLDSCAQTGSDNPASTVGGCSDSEHRINGTTSQGGERTEDPFIDEDSCYSLPRDSPGRDLNSCQQPKQCEEPIEPCSYNDTSSPAHDGCPYVPRSPKMPTKLMDYSSFPYLTVTLERVESLTPERKDKKRTIVKKKPKSATCDDVGGTEATTDPKNTSKESSLVQRCVREKKEQPQEEQHQVDSPSLEPFCEKSCSPNVNAMKQCRVIVERVNSPKPVRTAVQKLCPDKGEQSPKVVVKQLAEDEEMVFTSTLSDKDKSLLPVNTSNSSDTTADSSDQTLEPSTDVPEAVDTETETETGSDSSEVTSVNARLRGCDDDTVSDQISCPESESMCCVDINPEIITRLEPERPEAFTEDSAESLALAAGARDEVRSDGSDSGLGSEIPGESGPAPAPESDSETSFLDRIPDDILSDKEKVVNQLESVGVDVTGTPQTPLTNFRSPSKSSLKRRLIDCMEGAPSPKKSNTDESMKKKRNIQFDAVTVYYFPRAQGFTCVPSQGGSTLGMSATHTHAERFSLSEHAAEQRRIHRARLAQLRSERAANCVSEAASSSEDPSDDTDEEQSDNEELDIDSYYFLQPVPTWQRRALLRAAGVRRIDAIEKDECRDIRASREHCGCGCKGYCDPESCPCSRANVKCQVDRAGFPCGCTRDGCANSSGRIEFNPVRVRTHFIHTLMRLELEKKHREEEEGTDHDASDNQNGRSPLREINLGSVMENRNAESCLNGGGFTTLHYENHDARDAGTNCQPEITGTREDSLDLYAIRDDCYPSEDTVDGTQGPQRKLHPEFSQAFQTFTGQTGAGVNFQQPTYQDYQPYANLPSTSRVQFQPQFQTVPGNPGFSHYSPYGQDAGSIQGNCQVHSGQHSSAYETSFAQDETTGSQYTNLNSVQPMNTVVQQMGKLEPFSELLSARYSYYGEMEPQAHGTYHGNGTKVDVEKNHQGNEQQSESTEECDENFGEIIKKSMVETVSA

Similar Transcription Factors

Sequence clustering based on sequence similarity using MMseqs2

100% Identity: iTF_00963841;
90% Identity: iTF_00963841;
80% Identity: -