Basic Information

Insect: Pseudomyrmex elongatus
Gene Symbol: CSRNP3_1
Assembly: GCA_014825605.1
Location: QVNY01018447.1:36095-40759[-]

Transcription Factor Domain

TF Family: CSRNP_N
Domain: CSRNP_N domain
PFAM: PF16019
TF Group: Unclassified Structure
Description: This presumed domain is found at the N-terminus of cysteine/serine-rich nuclear proteins. These proteins act as transcriptional activators [1].
Hmmscan Out: # of c-Evalue i-Evalue score bias hmm coord from hmm coord to ali coord from ali coord to env coord from env coord to acc

1 4 0.091 4.6e+03 -1.2 6.1 68 109 81 121 53 162 0.48

2 4 0.24 1.2e+04 -2.6 0.5 77 106 232 260 201 274 0.52

3 4 0.35 1.8e+04 -3.2 0.1 81 137 317 375 283 390 0.45

4 4 1e-100 5.1e-96 322.2 9.2 1 218 711 923 711 923 0.91

#	of	c-Evalue	i-Evalue	score	bias	hmm coord from	hmm coord to	ali coord from	ali coord to	env coord from	env coord to	acc
1	4	0.091	4.6e+03	-1.2	6.1	68	109	81	121	53	162	0.48
2	4	0.24	1.2e+04	-2.6	0.5	77	106	232	260	201	274	0.52
3	4	0.35	1.8e+04	-3.2	0.1	81	137	317	375	283	390	0.45
4	4	1e-100	5.1e-96	322.2	9.2	1	218	711	923	711	923	0.91

Sequence Information

Coding Sequence: ATGGCACAGTTGCCCGAGATGGAATCGCCTTCGGCCTGTCAGGAGTATCTCGTTGAGGCCCAAGAGGATTCCACCTCAGTGGATCTCGCAAGTNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNCCAGTAGAAGATGCCGCGCGTCAATCCGTCAATGGGGACTTGCGTGAGAATTCGGTGATGGTGCATGAGAGGGTAAACGAAAACTCGGAGAACGGAGAACTCGAGGAAAGACAATCCAGTGATAATCTTTGTTTAGAAAAAGAAGAAAATGAAAAGAAAGAAGAGAAAAAAGAAGTGGAAGATCAGACAGTGGAAGATAAGGCCAATGAAGACAAAGAAGATTCGGTAGAGAAACTTCTTCAGGAACCTAAGGAGTCGATAAAGACAGTCGGTCCTCAAACTCATGATCTTGACGACGAGGAAACTAGGCTTGAGGAACCAGTCTGCATTTCCAGGAAGAGATCGGTCGAAAGCGATTTCCTACCAATCGACGAGGAAGTGAAGAAAGTGGGTCTTGAGATTTCGGAAGAGCAGGCGATGCAGCTGAAAAACGATATCAGGAGGCTGTCGCCGGTGCTTGTAAGCACGCGGGAGAGAACGCTTGGCGAAATATCTTTGATTTCGGAATCATGTTCCTTCAAGGACGACATCGATGATAAAACAATGTCGAAGAGCAGCAACGATAATCATGACGAATTGTCGCAGGAGAACGAGATTCCGGTTACCAAGAACCGTGCGGAAAAAGATGTCGACGAAGCGAAACAGAAAGCTATTGCCAAGGTTATTGCGAGTTCTCCGGCAGAGTGCACGAGTTGCGATGGTGCACTCGAGATCATCTCGGATCGCGAAGAGAGAAAGACAGTTGAGTGCGACAGTCAAGAGAAGATATTCGATGTTGATTCTTCAGTGTCCTCAGGGTGCGACAGTTTCAAATCGACGGAATCGAATCAACACGACAACGTCAGTGATATCGGGAGCGCGCCTGACGTTTCGATTGAAAAGTGCGTCGACGAAACGACGAGTATTGTAGTCTCAAGCCCCGTCTGTCGGCGTTTGTCGGTGGTGCTAAATCGCATCGACAACGTAGACGTGATAAAACCGAAAGAGGATGCCGTTGAAAAAGACTCAATGTATTCCGAAAGAAAAAGAAATCTTGAAGAGGAATACAGCTCGTCAGATAAGACTCCCTCGAAGAAACAGCGGTGGCATAACGACACTTCGCCGATGACTAGATCAAGGACAAGCGAGATGATGGAACCTGTCCGTAGTCCAAATAATCTGGTTTTGAAGAAGTGCAAAGTGGTGCTAGAACGAATCAGCGACGAGAAACAATCTCAATCGGTAAAAGCCGATGAAACCGGTACTACTTCGCAGAAACTCGAGAGAGAAGGATCCGCGCCGGTGTCCGTAATCGGCCAGTTGGAGGAAGACGAAGAGGTGGTGCTGGCGGGTGCTTCGCTTTCTGGCGAACGAGATCAAGTGTTCAACGAACTGGACTCCTCGGAGACGATGCCAAGTTCGCCGGAGGAGATGTCGGAACCAGCAATGGACGTCGTCGAGAGTGTCGACACAGAGACGGAAACTGAGACCGGCTCCGACAGTTCGGAGGTGTCGCCTATCGTGAACATTCGGGAATTGCGCAACGTCGACATAGCGTCCGATCAGTTGCCGTGTCCAGAAGCGGAACCGCTTTGCTGCGTGGAGACGATGGCGCCGATTATGACAAGGCTGGAGACCGAGCGGCCGGAAACTTACACCGAGGATTCCGCCGAGAGTTTGGCTCTGACAACTGGCGCCAGAGACGACGTTAGATCTGATGGGAGCGATTCCGGTCTAGGTAATGAAATTCCTGGTGATCCTGGTCCCACACCGGCCCCTGAAAGCGATTCCGAAACCTCTTTTCTCGATAGGCTGCCGGATGATATCCTCTCCGACAAAGAAAAAGGCATGAACCAACTGGACAACTTCGCGACGTCGTCGGGCGCGACCGGGATACCGGAACAGCCGCCCATGACGAGCTTTCGACCACTGCCGGCTAAGAGCAATCTAAAGCGCAGATTGATCGACTGCATGGAGAATGATGAGTCCCGGAGCAATACCGAAGAGCCTGTGAAGAAGAAGCGCAATATCCATTTCGACGCCGTAACTGTTTATTACTTTCCAAGGGCGCAGGGTTTTACCTGCGTACCTTCGCAGGGCGGCAGCACGCTCGGGATGAGCGCCACACACACACACGCCGAGAGATTCTCATTATCGGAACACGCCGCCGAACAGAGGCGAATTCATCGCGCCCGCTTGGCGCAGCTGCGCTCCGAGCGCAACTGCGCGATCAACTGCGTGACCGAAACGGCGTCCAGCTCGGAAGATCCGAGCGACGACACCGACGAGGAGCCGAGCGATAATGAGGATCTTGACATCGATAGCTACTACTTTTTGCAACCGGTGCCGACGTCGCAGCGTCGGGCGCTGCTTAGAGCGGCCGGTGTCAGAAGAATAGATGCCGTTGAGAAGGACGAATGTCGTGACATTCGGGCGAGCAGAGAGCACTGCGGATGTGGTTGTAAGGGATATTGCGATCCTGAAAGCTGTCCCTGCAGTCGAGCCAATGTCAAATGTCAGGTGGATCGACCTGGCTTTCCTTGCGGCTGCACGCGAGACGGTTGCGCGAATAGCTCCGGCAGGATCGAATTCAATCCTATACGAGTGCGAACGCATTTTATTCACACTCTAATGCGATTAGAATTGGAGAAGAAACAACGCGAGGAAGAGGGTAGCGGCGATCACGATCAGACGGACAATCAGGGCCAAAGCAATAGAAATGGATCATTGAGGAATATCGGTTCCCTCGGCTCTGTGATGGACACTGCCGGTAACGGCGACGTGTGTACAATTCCAGGACCTAGGAGCGGAAATGGAGGCGGGGGTGGATTTACAACTCTGCACTACGAGACGAGTCATGACGGCGGCATAGTTACGGCCGGTTGCCAGCCGGAAGTGCCCGGTACGCGAGAGGACAGTCTGGATTTGTACGCAATCAGTGACGATTGTTATCCGAGCGAAGACGCAGTAGACGGCAGCCAATCGATCGTACAGCGAAAGCTGCATCCAGAGTTCAGCCAAGCCTTCCAGAGCTTCTCGCCGGGTGGCGCACAAAGCCCCGGTGGCAATGGTGGCGGTATGAGCTTCCAGCAGTCTTCGTATCAGGATTACGGCTCGCCGTATGCGGGCCTCCCGTCCACGTCGCGGGTGCCACAGTTTCAACAGCCCCAGTTCCAATCCTCGGCACCGCCCAATCCGGCCGCGTTTTCGCACTACGGACCGTACGGCGCGGCCCAAAACACTGCAAGCGCCGGTCTTCAGAGTAACTGTGCCGCCCAGGTGCACCAGGTGCCACCTCCGGGTCAGCAGCAACAGCAACACTCGTCTTACGAGACGGCGGTGTTCGCGCAAGATGACGCCACGAGTACCGCGCAGTACACGAATTTAACTAATTCGGTGCAGCCGATGAATGCGAGTGTCGTGCAGCAGATGCAGAACAAGCTTGAGCCTTTCTCGGAACTGCTCAGCGGCAGATATTCGTACTACGGCGAGATGCACGAGCCGCAACAACATCACGGTACTTACAGTACTCACGGAACGACTTCGAAGATTGCGGAATTAGTCGAACCCGGCCAAGTTACCGGCGAGCAACAGTCCGAGAACACGTCCGAGGATTGCGACGAAAACTTCGGCGAAATCATTAAGAAATCCATGGTGGAGACCGTATCTGCCTAG
Protein Sequence: MAQLPEMESPSACQEYLVEAQEDSTSVDLASXXXXXXXXXXXXXXXPVEDAARQSVNGDLRENSVMVHERVNENSENGELEERQSSDNLCLEKEENEKKEEKKEVEDQTVEDKANEDKEDSVEKLLQEPKESIKTVGPQTHDLDDEETRLEEPVCISRKRSVESDFLPIDEEVKKVGLEISEEQAMQLKNDIRRLSPVLVSTRERTLGEISLISESCSFKDDIDDKTMSKSSNDNHDELSQENEIPVTKNRAEKDVDEAKQKAIAKVIASSPAECTSCDGALEIISDREERKTVECDSQEKIFDVDSSVSSGCDSFKSTESNQHDNVSDIGSAPDVSIEKCVDETTSIVVSSPVCRRLSVVLNRIDNVDVIKPKEDAVEKDSMYSERKRNLEEEYSSSDKTPSKKQRWHNDTSPMTRSRTSEMMEPVRSPNNLVLKKCKVVLERISDEKQSQSVKADETGTTSQKLEREGSAPVSVIGQLEEDEEVVLAGASLSGERDQVFNELDSSETMPSSPEEMSEPAMDVVESVDTETETETGSDSSEVSPIVNIRELRNVDIASDQLPCPEAEPLCCVETMAPIMTRLETERPETYTEDSAESLALTTGARDDVRSDGSDSGLGNEIPGDPGPTPAPESDSETSFLDRLPDDILSDKEKGMNQLDNFATSSGATGIPEQPPMTSFRPLPAKSNLKRRLIDCMENDESRSNTEEPVKKKRNIHFDAVTVYYFPRAQGFTCVPSQGGSTLGMSATHTHAERFSLSEHAAEQRRIHRARLAQLRSERNCAINCVTETASSSEDPSDDTDEEPSDNEDLDIDSYYFLQPVPTSQRRALLRAAGVRRIDAVEKDECRDIRASREHCGCGCKGYCDPESCPCSRANVKCQVDRPGFPCGCTRDGCANSSGRIEFNPIRVRTHFIHTLMRLELEKKQREEEGSGDHDQTDNQGQSNRNGSLRNIGSLGSVMDTAGNGDVCTIPGPRSGNGGGGGFTTLHYETSHDGGIVTAGCQPEVPGTREDSLDLYAISDDCYPSEDAVDGSQSIVQRKLHPEFSQAFQSFSPGGAQSPGGNGGGMSFQQSSYQDYGSPYAGLPSTSRVPQFQQPQFQSSAPPNPAAFSHYGPYGAAQNTASAGLQSNCAAQVHQVPPPGQQQQQHSSYETAVFAQDDATSTAQYTNLTNSVQPMNASVVQQMQNKLEPFSELLSGRYSYYGEMHEPQQHHGTYSTHGTTSKIAELVEPGQVTGEQQSENTSEDCDENFGEIIKKSMVETVSA

Similar Transcription Factors

Sequence clustering based on sequence similarity using MMseqs2

100% Identity: iTF_01268264;
90% Identity: iTF_01271206;
80% Identity: -