Basic Information

Insect: Megachile lagopoda
Gene Symbol: CSRNP3_1
Assembly: GCA_036983795.1
Location: CM072796.1:2583174-2587194[-]

Transcription Factor Domain

TF Family: CSRNP_N
Domain: CSRNP_N domain
PFAM: PF16019
TF Group: Unclassified Structure
Description: This presumed domain is found at the N-terminus of cysteine/serine-rich nuclear proteins. These proteins act as transcriptional activators [1].
Hmmscan Out: # of c-Evalue i-Evalue score bias hmm coord from hmm coord to ali coord from ali coord to env coord from env coord to acc

1 3 0.22 6.1e+03 -2.5 0.2 77 135 105 165 66 177 0.58

2 3 0.19 5.1e+03 -2.3 0.7 54 115 377 441 366 462 0.52

3 3 3.7e-101 9.9e-97 323.7 8.6 1 218 723 933 723 933 0.92

#	of	c-Evalue	i-Evalue	score	bias	hmm coord from	hmm coord to	ali coord from	ali coord to	env coord from	env coord to	acc
1	3	0.22	6.1e+03	-2.5	0.2	77	135	105	165	66	177	0.58
2	3	0.19	5.1e+03	-2.3	0.7	54	115	377	441	366	462	0.52
3	3	3.7e-101	9.9e-97	323.7	8.6	1	218	723	933	723	933	0.92

Sequence Information

Coding Sequence: ATGGAATCATCTTCGGCCGAGGGTCGTCTTCTCGAAGCCAAAGAAGATTCCATGTCAGTGGAATCTGTCGCCAGTCCTGGACCGAACACGTCCATCGTGGAGGGAGAAAAGACGGCGGTACTCGAGGATGTCGGTATACCAGAGGAAAAGAAGCAGAATGCGTGTCACAGGTCCAAGGACAGCCAAGGGTTCGTGAATATAGAATCGCGCGAGACTTCGATCGATCACGAGGTCTCGAACAACCCTTCCGTGCCAGAGGATCAATCGAACCCTAACATGGGATTGAAGATGGGAAAACAGAGCAACCAGAGTGAAGGTTCGACCGCGGTTGCTGCGTCCACCGAATCCGCGGAAACGTCGTCGGCGGCCAATGTTCCCGACAAGCTGGAGGACAAGGGAGAAGTTTCGGAGTTCGTCACCTCGTCGCCGATATGCAGGAAGAGGCCAGCCAACGATTTCCTGCCGATCAACGCGGAGATTAAACGAATAGAGATGGAGGGTCCAGAAAACGAAGCGAACCAAGTGAGGAGCGACGTGAGGAGGATCTCGCCGGTCCTGGTGAGCCTTCGAGAGCGCACCCTGGGCGAGATATCCTTGTCGTCGGACTCGTGTCTGTTCGACGACGACGCGAACGGTCGCTGCGCCTCGAGGAACAGCAGCATCCTCGAGGATTTGTTGACCGGTGCCTACAGGCTGAACAACAGCTTGAACAGTAGCATGAACAGCACGCTGAACAACAGCCAGAACAGTAGTCCGACTCTCGACAGCTGCGCTCAAACTGGTAGTGACAATCCTGCGTCGACGGTGGGAGGCTGTTCGGATTCGGAGCACAGGATCAACGGGATAACGTCACAGGGTGGCGAACGCACGGAGGATCCGTTCATCGACGAGGACTCCTGTTATTCGCTGCCTCGCGACAGTCCTGGCAGGGACCTGAACTCGTGTCAGCAACCGAAACAGTGCGAGGAGCCGATCGAGCCGTCTTCCTATAACGACACTTCCTCGCCCGCGCACGACGGTTGCCCTTACGTCCCGAGATCCCCCAAGATGCCGACCAAACTGATGGATTATTCGTCGTTTCCTTATTTAACCGTGACGTTGGAACGCGTGGAATCTCTGACGCCGGAAAGGAAGGACAAGAAGCGGACGATCGTGAAGAAGAAACCGAAAAGTGCAACGTGCGACGACGTCGGTGGCACGGAGGCGACTACTGATCCGAAGAATACGTCCAAGGAGTCGAGTTTGGTCCAGAGGTGTGTTCGCGAGAAGAAGGATCAACCGCAGGAGGAGCAACACCAAGTGGATTCTCCCTCGTTGGAACCGTTCTGCGAGAAGTCGTGTTCGCTTAATGTAAATGCTATGAAACAATGCAGAGTGATCGTGGAAAGAGTAAACTCGCCGAAACCGGTGAGGACCGCGATGCAGAAGCTTTGTCCGGACAAGGGAGAGCAAAGCCCGAAAGTGGTCGTTAAACAATTGGCCGAAGACGAGGAAATGGTGTTCACCTCTACCCTGTCCGACAAAGACAAGAGTCTTCTACCGGTAAACACCTCGAATTCGTCCGAGACGACAGCCGACTCCTCCGACCAGACTTTGGAGCCTTCCACGGACGTTCCGGAAGCCGTGGACACGGAGACCGAGACCGAGACTGGGTCCGATAGTTCGGAAGTGACGTCCGTGAACGCACGACTTCGGGGATGCGACGATGACACCGTGTCCGACCAGATATCTTGCCCAGAAAGCGAATCCATGTGCTGCGTCGACATCAACCCGGAGATTATCACCAGGTTGGAACCGGAAAGACCGGAAGCGTTCACGGAGGACTCCGCGGAAAGTCTAGCTCTTGCCGCTGGTGCTCGGGACGAAGTTAGGTCGGACGGTAGCGATTCTGGCCTGGGAAGCGAGATACCTGGTGAATCTGGCCCTGCACCGGCTCCAGAAAGCGATTCTGAAACTTCCTTCTTGGATAGGATACCCGATGATATTCTATCCGATAAAGAAAAAGTGGTGAATCAGTTGGAGTCGATCGGAGTGGATGTACCCGGTACCCCGCAGACGCCGTTGACTAACTTCCGGAGTCCATCGAAGAGCAACTTGAAACGGAGATTGATCGACTGTATGGAAGGTGCACCGAGTCCGAAGAAGAGCAATACCGATGAGTCCATGAAGAAGAAGCGCAACATTCAGTTCGATGCTGTAACCGTGTATTACTTCCCCAGGGCACAGGGTTTTACTTGCGTGCCTTCTCAGGGTGGCAGCACTCTTGGTATGAGCGCGACGCACACTCACGCCGAACGGTTCTCGTTATCGGAACACGCTGCCGAACAGAGGCGGATTCATCGTGCTAGGCTTGCACAATTGCGCTCCGAGCGCGCTGCAAATTGCGTGTCCGAGGCGGCGTCCAGTTCCGAGGATCCTAGCGACGACACGGACGAAGAACAAAGCGATAACGAGGAGCTGGACATCGATAGTTATTATTTCTTGCAGCCGGTGCCAACGTGGCAAAGACGAGCGTTGCTTCGTGCCGCGGGAGTTCGTCGAATAGACGCTATCGAAAAGGACGAGTGTCGCGATATCAGAGCTAGCAGAGAACACTGTGGTTGTGGATGCAAAGGATTTTGCGATCCCGAGAGTTGTCCTTGTAGCCGAGCCAATGTCAAGTGCCAGGTTGATCGAGCAGGTTTCCCTTGCGGATGTACTCGAGACGGCTGCGCGAATAGTTCAGGTAGAATCGAGTTCAATCCCATCAGAGTACGAACGCATTTCATCCACACGTTGATGCGGTTAGAGTTGGAGAAAAAGCATCGGGAAGAAGAGGAGGGTACGGATCACGATGCATCTGACAATCAGAACGGTAGAAGTCCGTTAAGAGAGATTAACTTGGGATCTGTGATGGAGAATAGGAACGCGGAATCGTGTTTGAACGGTGGTGGATTCACGACGTTACACTATGAAAACCACGACGCGAGGGATGCCGGAACAAATTGTCAGCCAGAGATAACCGGTACCAGAGAGGATAGTCTGGATTTGTACGCTATCAGAGACGATTGTTATCCGAGCGAAGACACTGTCGATGGTACGCAGGGACCTCAAAGGAAACTTCATCCTGAATTTAGTCAAGCTTTTCAAACGTTCACGGGTCAAACCGGTGCCGGTGTTAATTTTCAACAGCCTACTTATCAGGATTACCAGCCTTACGCTAACCTTCCTTCCACGTCTAGGGTGCAATTTCAGCCACAATTCCAAACGGTGCCAGGAAATCCAGGGTTCTCGCATTACTCGCCTTACGGGCAAGACGCTGGATCGATTCAGGGGAACTGCCAAGTCCACTCGGGACAACATTCTTCCGCCTATGAGACCAGCTTCGCCCAAGACGAGACAACAGGATCGCAGTACACGAATCTGAACTCAGTGCAGCCAATGAATACTGTGGTTCAACAAATGGGTAAACTAGAACCATTCTCGGAACTCTTGTCTGCCAGATATTCGTACTACGGTGAAATGGAGCCGCAAGCGCACGGTACTTATCACGGGAACGGAACCAAGGTCGACGTCGAGAAGAATCATCAAGGTAACGAGCAACAATCGGAAAGTACGGAGGAGTGCGACGAAAACTTCGGGGAGATCATCAAGAAGTCGATGGTCGAGACTGTATCCGCTTAA
Protein Sequence: MESSSAEGRLLEAKEDSMSVESVASPGPNTSIVEGEKTAVLEDVGIPEEKKQNACHRSKDSQGFVNIESRETSIDHEVSNNPSVPEDQSNPNMGLKMGKQSNQSEGSTAVAASTESAETSSAANVPDKLEDKGEVSEFVTSSPICRKRPANDFLPINAEIKRIEMEGPENEANQVRSDVRRISPVLVSLRERTLGEISLSSDSCLFDDDANGRCASRNSSILEDLLTGAYRLNNSLNSSMNSTLNNSQNSSPTLDSCAQTGSDNPASTVGGCSDSEHRINGITSQGGERTEDPFIDEDSCYSLPRDSPGRDLNSCQQPKQCEEPIEPSSYNDTSSPAHDGCPYVPRSPKMPTKLMDYSSFPYLTVTLERVESLTPERKDKKRTIVKKKPKSATCDDVGGTEATTDPKNTSKESSLVQRCVREKKDQPQEEQHQVDSPSLEPFCEKSCSLNVNAMKQCRVIVERVNSPKPVRTAMQKLCPDKGEQSPKVVVKQLAEDEEMVFTSTLSDKDKSLLPVNTSNSSETTADSSDQTLEPSTDVPEAVDTETETETGSDSSEVTSVNARLRGCDDDTVSDQISCPESESMCCVDINPEIITRLEPERPEAFTEDSAESLALAAGARDEVRSDGSDSGLGSEIPGESGPAPAPESDSETSFLDRIPDDILSDKEKVVNQLESIGVDVPGTPQTPLTNFRSPSKSNLKRRLIDCMEGAPSPKKSNTDESMKKKRNIQFDAVTVYYFPRAQGFTCVPSQGGSTLGMSATHTHAERFSLSEHAAEQRRIHRARLAQLRSERAANCVSEAASSSEDPSDDTDEEQSDNEELDIDSYYFLQPVPTWQRRALLRAAGVRRIDAIEKDECRDIRASREHCGCGCKGFCDPESCPCSRANVKCQVDRAGFPCGCTRDGCANSSGRIEFNPIRVRTHFIHTLMRLELEKKHREEEEGTDHDASDNQNGRSPLREINLGSVMENRNAESCLNGGGFTTLHYENHDARDAGTNCQPEITGTREDSLDLYAIRDDCYPSEDTVDGTQGPQRKLHPEFSQAFQTFTGQTGAGVNFQQPTYQDYQPYANLPSTSRVQFQPQFQTVPGNPGFSHYSPYGQDAGSIQGNCQVHSGQHSSAYETSFAQDETTGSQYTNLNSVQPMNTVVQQMGKLEPFSELLSARYSYYGEMEPQAHGTYHGNGTKVDVEKNHQGNEQQSESTEECDENFGEIIKKSMVETVSA

Similar Transcription Factors

Sequence clustering based on sequence similarity using MMseqs2

100% Identity: iTF_00963841;
90% Identity: iTF_00963841;
80% Identity: -