Basic Information

Insect: Ceratosolen fusciceps
Gene Symbol: CSRNP3_1
Assembly: GCA_018883505.1
Location: RCIC01000049.1:521465-529048[+]

Transcription Factor Domain

TF Family: CSRNP_N
Domain: CSRNP_N domain
PFAM: PF16019
TF Group: Unclassified Structure
Description: This presumed domain is found at the N-terminus of cysteine/serine-rich nuclear proteins. These proteins act as transcriptional activators [1].
Hmmscan Out: # of c-Evalue i-Evalue score bias hmm coord from hmm coord to ali coord from ali coord to env coord from env coord to acc

1 4 0.44 8.5e+03 -3.5 0.0 107 129 70 91 17 108 0.54

2 4 5.1e-100 9.9e-96 320.0 8.2 1 218 382 592 382 592 0.91

3 4 0.21 4.2e+03 -2.5 0.7 39 94 600 628 595 658 0.49

4 4 0.2 4e+03 -2.4 0.1 81 117 770 806 720 812 0.57

#	of	c-Evalue	i-Evalue	score	bias	hmm coord from	hmm coord to	ali coord from	ali coord to	env coord from	env coord to	acc
1	4	0.44	8.5e+03	-3.5	0.0	107	129	70	91	17	108	0.54
2	4	5.1e-100	9.9e-96	320.0	8.2	1	218	382	592	382	592	0.91
3	4	0.21	4.2e+03	-2.5	0.7	39	94	600	628	595	658	0.49
4	4	0.2	4e+03	-2.4	0.1	81	117	770	806	720	812	0.57

Sequence Information

Coding Sequence: ATGGAATCAGTTTCAGAATATGAAGTTACAGTCGAAGATGGTAACTCTATGGAAAATTTACTTCGCGAATCTTCGATTGCCTCAGAAGAAAAAACCACTTTGTTCATTCAAGATGGACATCGTTTTACTTTCCTCGATGATTTTACGCATGAATCGTCATCCTCTAATCGGTTAGAACAATTGTCCAAGCCCAGTTCCAACTTCATTTCAAATTCCACTCTAAACCTTGTTACTACATCATCAAGGAGAAGACCAATATTAATGTCTAGTGGAGCTTCAGACTTCCAACCGATTGGCACTGAAGTTTCTGAGGAAAAAGCCGAGCAGCTGCGTAATGATGTGAAACGTCTCTCGCCGGTACACGTAAGTCTGCACGAACGCACCCTTGGAGAAATATCTTTGACGTCAAACAATAGAAGAAAACCAAGTGAGTTGGATGTAACGATTGAAAATTCATCTAATACATACCAGCAAACCCTCGAAATACGGCTGCCGTTAATCGATGAAGTCAAAGGAATAGACTTCGAGCTCAATTCATTGAAGAAACCTAGTCCCCTCAATTCAGAGTATAGCGTTGAGCACTGTGATCACGTAAAGCTTGACGAGGTTCTCCCTAAATCCAAAAACATTGTCAAGAAATTGCACATTGGCGATGAAGTTAAATTTCTAGGCTGTCGGCCGAGTATGCTTCCAATAATGTTCACTGGCGTAGAAGTCGGTACATCTACTACGAGAATTGAACACGAGGAACTGGAAGCTTTTACCGATGATTCCGCTCAAAGTCTTGCTCTCGTCAATGTCCGAGATGAGGTTCGATCTGATGGTAGTGACTCCGGTCTCGGTAGTGAAATGACAGGAGATATCTGTCCTACTCCAGCCCCAGAGAGTGACTCCGAAAGCTCTTTTCTCGACCGAATATCAAATGATTTACTCTCCGAAAAGGAGAAAGTTAGAAACGATGAATATAGCTTGATTACGGGCAAGTCAGAATCATCTAAATTCCGAATCCCTTCAAAAAGTAATCTGAAGCGTAGACTGTCAAATTGTATGCCAAAAGATGAAGACCATTCGGATCCAAAAAAATTCAACGTTAATGACGCTTCCACGCCATTGTCTGTAGTCAACAATTTTCCGACTACTACCAAGAAGAAACGTAACATACAATTTGATGCGGTAACAGTCTATTACTTCCCTAGAGCTCAAGGATTCACTTGCGTGCCTTCACAGGGTGGCAGTACTTTAGGCATGAGTGCAACACACACACATGCAGAGTGCTTTTCCCTATCGGAACACGCGGCGGAACAGCGTCGATTACATCGGGCTCGTCTCGCTCAACTGCGTTCCGAAAGAGCGATGAACTGTACGGTAGAGGTGGCATCGAGTTCCGAAGATCCGAGCGACGATACCGATGATGAACCAAGTGATAATGATGAGCTCGATATTGATAGCTATTACTTTCTCCAACCGGTACCAACTTGGCAAAGGCGGGCGCTTCTCCGAGCGGCTGGCGTCCGTAGGATTGACACTCTTGAAAAGGATGAATGCAGAGATATTAGGGCTAGTAGAGAGCATTGTGGCTGTGGCTGTAAAGGTTATTGCGATCCAGAGAGTTGTCCTTGCAGTAGGGCTAATGTGAAATGTCAGGTGGATAGAGCAGGGTTCCCATGCGGTTGTTCACGTGACGGTTGTGCTAATAGTACAGGTCGAATTGAGTTCAACCCTGTACGTGTCCGCACACATTTTATCCACACACTTATGCGACTTGAGCTCGAAAAAAAACCACATTACGATGAGGAACATCAAGAGAGCCAACAACACCATGTACACCACTATCATCACCATCTTCAATACTATCACCATCATAATCAAGAGCGAATGACAGTTTCAAATATATCGAATATTGATACATCATCTAACTGTCTTGCTGGAGGTTTTGCAGACGGACTGCATTATGACAATCAAGATCAAGGAGTAACGCGGTCTAACAGTCTCGATCTTTATGCTCTTAGGGACGACTGTTATTCGGGTAATGATTGCTCAGGTGATTCTGACATTCAAAGCCCACAATATCAAAGAAAACTTCATGCAGCTTTTGATCAGAATTTTGAACAATACGAATCACAAATGTCCAGTATTTCTTCTTATCACCAGAATCCTTATGCCAATTATCAGAGCTATCAGACATTGCCATCGACTTCTAGGTCAACATTTCAACCAATCATACCCATTTCAAGCTTCTCACAATACAGCCCTTATTCTCAAGAACCGACCTCCAGCTCTACATCACTCAACTGCCAAATGACCCAATTACCCATACATCAACAACAGCACAGTGGTCTCATTTATGAAACTTCCTTATCCCGAGAAGAGATCTCAAATTCGCAATATGCAAATCTTAATTCATTGCAGCCAATGAATTCAGTTGTTCAGCAAATTGGTAAACTTGAACCTTTTTCGGAACTATTGTCATCCAGGTATTCATATTACGATGATGTGATTGAACAAAATCAGCAACATCAGGATTCTTATAATCTGAATGATTCTAAAATTAAAATGGGAAAAGAGAAATTAATAGGTGGAAATGAGCAGCAAATACAAATTATTGACAAAGACTGTGAAGAAAACTTTGGCGAGATTATTAAAAAATCGATGGTTGAGACTGTATCTGCTTAG
Protein Sequence: MESVSEYEVTVEDGNSMENLLRESSIASEEKTTLFIQDGHRFTFLDDFTHESSSSNRLEQLSKPSSNFISNSTLNLVTTSSRRRPILMSSGASDFQPIGTEVSEEKAEQLRNDVKRLSPVHVSLHERTLGEISLTSNNRRKPSELDVTIENSSNTYQQTLEIRLPLIDEVKGIDFELNSLKKPSPLNSEYSVEHCDHVKLDEVLPKSKNIVKKLHIGDEVKFLGCRPSMLPIMFTGVEVGTSTTRIEHEELEAFTDDSAQSLALVNVRDEVRSDGSDSGLGSEMTGDICPTPAPESDSESSFLDRISNDLLSEKEKVRNDEYSLITGKSESSKFRIPSKSNLKRRLSNCMPKDEDHSDPKKFNVNDASTPLSVVNNFPTTTKKKRNIQFDAVTVYYFPRAQGFTCVPSQGGSTLGMSATHTHAECFSLSEHAAEQRRLHRARLAQLRSERAMNCTVEVASSSEDPSDDTDDEPSDNDELDIDSYYFLQPVPTWQRRALLRAAGVRRIDTLEKDECRDIRASREHCGCGCKGYCDPESCPCSRANVKCQVDRAGFPCGCSRDGCANSTGRIEFNPVRVRTHFIHTLMRLELEKKPHYDEEHQESQQHHVHHYHHHLQYYHHHNQERMTVSNISNIDTSSNCLAGGFADGLHYDNQDQGVTRSNSLDLYALRDDCYSGNDCSGDSDIQSPQYQRKLHAAFDQNFEQYESQMSSISSYHQNPYANYQSYQTLPSTSRSTFQPIIPISSFSQYSPYSQEPTSSSTSLNCQMTQLPIHQQQHSGLIYETSLSREEISNSQYANLNSLQPMNSVVQQIGKLEPFSELLSSRYSYYDDVIEQNQQHQDSYNLNDSKIKMGKEKLIGGNEQQIQIIDKDCEENFGEIIKKSMVETVSA

Similar Transcription Factors

Sequence clustering based on sequence similarity using MMseqs2

100% Identity: -
90% Identity: -
80% Identity: -