Basic Information

Insect: Lasioglossum pauxillum
Gene Symbol: CSRNP3_1
Assembly: GCA_028455745.1
Location: CM052305.1:18163984-18168446[-]

Transcription Factor Domain

TF Family: CSRNP_N
Domain: CSRNP_N domain
PFAM: PF16019
TF Group: Unclassified Structure
Description: This presumed domain is found at the N-terminus of cysteine/serine-rich nuclear proteins. These proteins act as transcriptional activators [1].
Hmmscan Out: # of c-Evalue i-Evalue score bias hmm coord from hmm coord to ali coord from ali coord to env coord from env coord to acc

1 3 0.16 4.3e+03 -2.1 2.3 84 109 357 383 337 408 0.51

2 3 0.65 1.7e+04 -4.1 0.3 85 99 499 513 461 538 0.43

3 3 9.9e-101 2.6e-96 322.3 8.2 1 218 700 910 700 910 0.92

#	of	c-Evalue	i-Evalue	score	bias	hmm coord from	hmm coord to	ali coord from	ali coord to	env coord from	env coord to	acc
1	3	0.16	4.3e+03	-2.1	2.3	84	109	357	383	337	408	0.51
2	3	0.65	1.7e+04	-4.1	0.3	85	99	499	513	461	538	0.43
3	3	9.9e-101	2.6e-96	322.3	8.2	1	218	700	910	700	910	0.92

Sequence Information

Coding Sequence: ATGGAATCGCCTTCGGTCCAGGAGCGTCCTGTCGAGGCTCAAGAGGATTCCAGCCCGATAAGGTCACCGGGACCGGTCGCCGAGTCCACGGAGCCCGTCGATGACGCCGGCCCGACGACCGATCCCGAGAACCATCACCGAGGATCGTCCAGCGGCGACGATGATGTCGACAGTGCTGTGCTATGTCCCGCGTCCGAGAACGTTACTCCGAACGTCAAGGTGAACTCTGAGACCATAGGTCTGAAGTTGGGCGAGTGCGACTCGACGGCAAAGGTCGAGGACAATGAGGTCGGAACAACGACGATGAACGAGCCGATCGAACTGCGGAATTGTGTCGACGCGGACGCGCCGTTGAAGTGCCCGGACCAAGAAGAGGATCGCGTGATCAGCAGTGGGGGCGGCGTGCTGATAGGCTCGCCAGTGTCCAGAAAGAGGCCGGCCAGCGACTTCCTGCCGATCAACGCCGAGATCAAGCGGATTGGCGTGGAAATCCCGGAGAACGAGGGGAACAACCAAGTGAGGAGCGACGTGAGAAGGATCTCGCCGGTGCTGGTGAGTCTGCGGGAGCGAACCCTGGGCGAGATATCCCTCTCCTCGGACTCCTGTCTGTTCGACGACGACGTGAACGCTCGGTGTCTGTCGCGGAACGGCAGGTTGCTAGACAATTCGCTGTCCACCAGTTGTAGATTGAGTTTGAACAATTCCGTTGAACACGAGGCCGAGATCATCGGCTCGGAGCCTAGGCCGTACGGAGTGTCCACGCCGATTGCGGAACGCGTGAACGCCGCGGACGAGGTGGACTGTAACCGAAAACTAGAGTTCGCCGACGCGTTCATCGACGAGGACTCTTGTTGCTCGCTGCCCAGCGAGAGTCTCGAGAGGGATTACCGCCCGTGCCAGGAGAAACAGTGCGAGGAGCCGATCGAGACGTGTCCTTGCAAGACCAACGGTGCCGAAGATGTTCCCAACAGTGCGAATCAGACGGAGGAGCACCCCTATCTGGTGGTTATGTTGGAGCGGGTCGACTGTTCGAATATCATGACGCCGGACAAGTCCGACAAGAAGGGGTTGAACAAGAAGAAGCAGGAGACGAGCAACGAAGACGCTGTGCAGGACGCGGAAACGGAGTCGGAAGACGCGTCGCAGAAGTCGAGTTACGGCCAGAGGTGCACCCCCGAGAAGAAGCTCGTCCAGAAGACTAAGCAGGACTCCGCGAATAAACAGCCAGGATCGCCCATGATGACCAGGTCGAAAACGCCGCCCGTTGAGCCGCATACGCCGACTTCAAGCGACATCAAGCTGTGCACAGTGCTTTTGGAGAGAATGGGCTCGTCGCCCAAGGTGCCAATGCCGGGAAAGTCGACCAATGACGAATCGACACCCGGATGCGCGAAGAAGAACGTGGACCAGGCCGAGGAAGTCGCGTCACCCGCGTCGATAACCTCCGCGGAGAGTCTCCAAGCGTTGAGCAAACGGAATTCGTCCGAAGCGAGACCCAACTCGCCTGAAGAACCTCTGGAAGCCTCAACCGATGCAGCGGAAGCTGTCGATACCGAGACTGAGACTGAAACCGGCTCCGACAGCTCTGAAATGCCCTCCATGACGAACGTGCGTCTTCGTGCATGCGACGACGACGCCGTTTCCGACCAAGTGTCTTGCCCCGAGAGCGAGTCCATGTGCTGCGTCGATATCAACCCTGAAATCATCACCAGGCTCGAGGCGGAGAGACCGGAGGCTTTCACCGAGGACTCCGCCGAGAGTCTGGCGCTTGCCACAGGTACTAGGGACGAAGTTAGGTCCGATGGCAGCGATTCCGGACTGGGGAGCGAGATTCCTGGGGATCCTGGACCTGCGCCGGCACCTGAAAGCGATTCCGAGACCTCGTTCTTGGATAGGATACCTGACGATATCCTGTCCGATAAGGAGAAGGCCGTGAATCAACTGGACGGTTTCGTCCCCAACGTAGCCGTGCCAGGGACGCCGCAGGCGCCGTTGACGACGTTCCCCAGTCCACCGAAGAGCAACCTAAAAAGAAGATTGACGGACTGCATGGAAGGAGCACCCAACCCGAAGAGGAGCAACACCGACGAGTCCATGAAAAAGAAACGCAATATTCAGTTCGACGCGGTGACCGTCTACTACTTTCCCAGGGCACAGGGATTCACCTGCGTGCCTTCTCAGGGCGGCAGCACACTTGGTATGAGCGCGACGCACACTCACGCTGAGAGGTTCTCGTTGTCTGAGCATGCCGCTGAGCAGAGGCGGATTCATCGTGCCAGGTTGGCCCAGCTGCGTTCCGAGCGAGCTGCGAATTGCGTTGTTGAAGCGGCATCCAGCTCGGAGGATCCCAGCGACGACACCGACGAAGAGCAGAGCGACAACGAGGAGCTCGACATTGACAGCTACTACTTCCTGCAACCGGTCCCCACATGGCAAAGACGAGCTCTGCTCAGGGCTGCCGGGGTGCGAAGAATAGACGGCATCGAGAAAGACGAGTGTCGAGACATCAGAGCCAGTAGGGAACACTGCGGCTGTGGGTGCAAAGGGTACTGCGACCCTGAGAGCTGTCCTTGCAGTCGTGCGAACGTAAAGTGCCAGGTTGATCGAGCAGGGTTCCCGTGCGGGTGCACTCGCGATGGCTGCGCGAACAGCTCGGGCCGGATCGAATTTAATCCAGTACGCGTGCGGACGCATTTCATTCACACGCTGATGCGGCTAGAGCTGGAGAAGAAGCAGCGGGAGGAAGAGGACGGTACGGATCATGATGCTTCCGACAATCAGAATGGTAGAAGTCCCTTGAGGGAGATTAATTTGGGGTCCGTGATGGAGAATAGAAATACAGAGTCCTGTTTGAACGGTGGCGGTTTCACGACGTTGCATTACGAGAACCACGATGCCGGAGACGGTGGGCCAAATTGTCAGCCAGACGTACCTGGCGCCAGAGAGGATAGTCTTGATCTGTATGCGATTAGAGATGATTGTTATCCTAGCGAGGACACTGTCGATGGAACGCAGGGACCTCAAAGGAAACTACATCCTGAGTTTAGTCAAGCATTTCAAACGTTCTCGGGGCAAACCGGCCCCGGTGTCAACTTCCAGCAGCCCGCTTATCAGGACTACCAACCTTACGCTAACCTTCCTTCTACATCTAGGGTGCAATTCCAGCCGCAGTTTCAAACGGTACCAGGAACACCCGGGTTCTCGCATTACGCGACCTACGGACAGGACGCGGCAGCTACGCTACAAGGGAATTGTCAAGTCCATCCAGGCCAGCATTCCGCCGCTTACGAGACCACATTCGCCCAGGACGAGACGACCGGATCGCAGTACACAAACCTGAACTCGGTCCAGCCGCACGCAGCTGTACAACAAATAGGCAAACTGGAACCGTTCTCCGAGCTGTTGTCCGGCAGATACTCGTACTACGGTGAAATGGAACCGCAGGCGCACGGTACTTACCACGGAAACGGAACGAAGGTTGAGGTAGAGAAGGGTCAAGGTAACGAGCAACAGTCCGAGGGCACGGAGGAGTGCGACGAGAACTTCGGGGAGATTATTAAAAAGTCGATGGTCGAGACCGTGTCCGCTTAA
Protein Sequence: MESPSVQERPVEAQEDSSPIRSPGPVAESTEPVDDAGPTTDPENHHRGSSSGDDDVDSAVLCPASENVTPNVKVNSETIGLKLGECDSTAKVEDNEVGTTTMNEPIELRNCVDADAPLKCPDQEEDRVISSGGGVLIGSPVSRKRPASDFLPINAEIKRIGVEIPENEGNNQVRSDVRRISPVLVSLRERTLGEISLSSDSCLFDDDVNARCLSRNGRLLDNSLSTSCRLSLNNSVEHEAEIIGSEPRPYGVSTPIAERVNAADEVDCNRKLEFADAFIDEDSCCSLPSESLERDYRPCQEKQCEEPIETCPCKTNGAEDVPNSANQTEEHPYLVVMLERVDCSNIMTPDKSDKKGLNKKKQETSNEDAVQDAETESEDASQKSSYGQRCTPEKKLVQKTKQDSANKQPGSPMMTRSKTPPVEPHTPTSSDIKLCTVLLERMGSSPKVPMPGKSTNDESTPGCAKKNVDQAEEVASPASITSAESLQALSKRNSSEARPNSPEEPLEASTDAAEAVDTETETETGSDSSEMPSMTNVRLRACDDDAVSDQVSCPESESMCCVDINPEIITRLEAERPEAFTEDSAESLALATGTRDEVRSDGSDSGLGSEIPGDPGPAPAPESDSETSFLDRIPDDILSDKEKAVNQLDGFVPNVAVPGTPQAPLTTFPSPPKSNLKRRLTDCMEGAPNPKRSNTDESMKKKRNIQFDAVTVYYFPRAQGFTCVPSQGGSTLGMSATHTHAERFSLSEHAAEQRRIHRARLAQLRSERAANCVVEAASSSEDPSDDTDEEQSDNEELDIDSYYFLQPVPTWQRRALLRAAGVRRIDGIEKDECRDIRASREHCGCGCKGYCDPESCPCSRANVKCQVDRAGFPCGCTRDGCANSSGRIEFNPVRVRTHFIHTLMRLELEKKQREEEDGTDHDASDNQNGRSPLREINLGSVMENRNTESCLNGGGFTTLHYENHDAGDGGPNCQPDVPGAREDSLDLYAIRDDCYPSEDTVDGTQGPQRKLHPEFSQAFQTFSGQTGPGVNFQQPAYQDYQPYANLPSTSRVQFQPQFQTVPGTPGFSHYATYGQDAAATLQGNCQVHPGQHSAAYETTFAQDETTGSQYTNLNSVQPHAAVQQIGKLEPFSELLSGRYSYYGEMEPQAHGTYHGNGTKVEVEKGQGNEQQSEGTEECDENFGEIIKKSMVETVSA

Similar Transcription Factors

Sequence clustering based on sequence similarity using MMseqs2

100% Identity: iTF_00862556;
90% Identity: iTF_00864630;
80% Identity: -