Basic Information

Insect: Pseudomyrmex concolor
Gene Symbol: CSRNP3_1
Assembly: GCA_014839585.1
Location: QVOB01010923.1:6044-11293[+]

Transcription Factor Domain

TF Family: CSRNP_N
Domain: CSRNP_N domain
PFAM: PF16019
TF Group: Unclassified Structure
Description: This presumed domain is found at the N-terminus of cysteine/serine-rich nuclear proteins. These proteins act as transcriptional activators [1].
Hmmscan Out: # of c-Evalue i-Evalue score bias hmm coord from hmm coord to ali coord from ali coord to env coord from env coord to acc

1 5 0.033 7.8e+02 0.2 8.2 42 122 50 128 18 157 0.53

2 5 0.28 6.6e+03 -2.8 0.5 95 109 213 227 186 273 0.51

3 5 0.24 5.7e+03 -2.6 1.6 83 153 284 362 244 369 0.53

4 5 9.9e-101 2.3e-96 322.3 9.0 1 218 674 886 674 886 0.91

5 5 0.68 1.6e+04 -4.1 0.6 65 86 1106 1128 1093 1152 0.43

#	of	c-Evalue	i-Evalue	score	bias	hmm coord from	hmm coord to	ali coord from	ali coord to	env coord from	env coord to	acc
1	5	0.033	7.8e+02	0.2	8.2	42	122	50	128	18	157	0.53
2	5	0.28	6.6e+03	-2.8	0.5	95	109	213	227	186	273	0.51
3	5	0.24	5.7e+03	-2.6	1.6	83	153	284	362	244	369	0.53
4	5	9.9e-101	2.3e-96	322.3	9.0	1	218	674	886	674	886	0.91
5	5	0.68	1.6e+04	-4.1	0.6	65	86	1106	1128	1093	1152	0.43

Sequence Information

Coding Sequence: ATGGCACAGTTGCCCGAGATGGAATCGCCTTCGGCCTGTCAGGAGTATCTCGTTGAGGCCCAAGAGGATTCCACCTCAAATTCGGTGATGGTGCACGAGAGGATAAACGAAAGATCGGAGAACGGAGAACTCGAGGAAAGACAATCCAGTGATAATTTTTGTTTAGAAAAAGAAAAGAAAGAAGAAAATGAAAAGGAAGAAGAGAACAAAAAAGTGGAAGATCAGAAAGCGGAAGAAGACAAGGTCAATGAAGACAAAGAAGATTTGATGGAGAAGCTTCTTCAGGAACCTGAGGAGTCGATAAAGACAGTCGGTCCTCAAACTCATGATCTTGACGACGAGGAAACCAGGTTTGAGGAACCAGTCTGCATTTCCAGGAAGAGATCGGTCGAAAGCGATTTCCTAATTGACGAAGAAGTGAAGAAAGTGGGTCTTGAGATTTCGAAAGAGCAGGCGATGCAGCTGAAAAACGACATCAGGAGGCTGTCGCCGGTGCTTGTAAGCACGCGGGAGAGAACGCTGGGCGAAATATCTTTGATTTCGGAATCGTGTTCCTTCAAGAACGACATCGATGACAAAATAATGTCGAAGAGCGGTCACGACGAATTGTCGCAGGAGAACAAGATTCCGGTTACTAAGAACCGTGCGGAAAAAGATGTCGACGAAGCTAAACAGGAAGCGATTGCCAAGGTTACCGCGAGTTCTCCGGCAGAGTGCACAAGTTGCGACAATGTACTCGAGATCACCTCGGATCGCGAAGAGAGAAAGACAATTGAGTGCGACAGTCAAGAGAAGATATTCGATGTTGATTCTTCAGTGCTTTCCTCGGGGTGCGACGGTTTCAAATCGACGGAATCGAATAAACACGAAAACGTCAGTGATATCGGGAGCGCGCCTGACGTTTCGATTGAAAAGTGCGTCGACGAAACGACGAGTACTGTAGTCTCGAGTCCCGTCTGTCGGCGTTTGTCGGTGATGCTAAACCGCATCGACAACGTAGACGTGATAAAATCGAAAGATGATGCCGTTGAAAAAGACTCACTATATTCCGAAAGAAAAAGAAATTTTGAAGAGGAGTGCGGCGCGTCAGATAAGACTCCCTCGAAGAAACAGCGGTGGCATAACGACACTTCGCCGATGACCAGATCAAGAACAAGCGAGCTGATGGAACCTGTCCATAGTCCAAATAATCTGGTTTTGAAGAAGTGCAAAGTGGTGCTAGAACGAATCAGCGATGAGAAACAATCAGTAAAAACCGATGAAACCGATACTACTTCGCAGAAACTTGAGAGAGAAGGATCCGCGCCGGTGTCCGTAATCGGCCAGTTGGAGGAAGACGAAGAGGTGGTGCTGGCGGGTCCTTCGCTTTCTGGCGAACGCGACCAAGTGTTCAACGAACTGGACTCGTCGGAGACGATGCCAAGTTCGCCGGAGGAGATGTCGGAACCGGCAATGGACGTCGTCGAAGGTGTCGACACAGAAACGGAAACTGAGACTGGGTCTGACAGTTCGGAGGTGTCACCTATCGTGAACATTCGGGAATTGCGTGATGTCGACATAGCGTCCGATCAGTTGCCGTGTCCAGAAGCGGAACCGCTTTGCTGCGTGGAGGCGATGGCGCCGATTATGACAAGGCTGGAGACCGAGCGACCGGAAACTTACACCGAAGATTCCGCTGAGAGTTTGGCTCTGACAACTGGCGCCAGAGACGACGTTAGATCCGATGGGAGCGATTCCGGTCTAGGTAATGAAATTCCTGGTGATCCTGGTCCCACACCGGCCCCTGAAAGCGATTCCGAAACCTCTTTTCTCGATAGGCTGCCGGATGATATCCTCTCCGACAAAGAAAAAGGCATGAACCAACTGGAAAACTTTGCGACGTCGTCGGGCGCGACCGGGATACCGGAACAGCCGCCCATGACGAGCTTTCGGACACTGCCGGCTAAGAGCAACTTGAAGCGCAGATTGATCGACTGCATGGAGAATGATGAGTCGCGGAGCAACACCGAAGAACCTGTGAAGAAGAAGCGCAATATCCATTTCGACGCCGTAACTGTTTATTACTTTCCAAGAGCGCAGGGTTTTACCTGCGTACCTTCGCAGGGCGGCAGCACGCTCGGGATGAGCGCCACACACACGCACGCCGAGAGATTCTCATTATCGGAACACGCCGCCGAACAAAGGCGAATTCATCGCGCCCGTTTGGCGCAGCTGCGGTCCGAGCGCAACTGCGCGATCAACTGCGTGACTGAAACGGCATCTAGCTCGGAAGACCCGAGCGACGATACCGACGACGAGCCGAGCGATAACGAGGATCTTGACATCGATAGCTACTATTTTTTGCAGCCGGTGCCGACCTCGCAGCGTCGGGCGCTGCTTAGAGCGGCCGGTGTCAGGAGAATAGATGCCGTTGAGAAGGATGAATGTCGTGACATCCGGGCGAGCAGAGAACATTGCGGATGTGGTTGTAAGGGATATTGCGATCCTGAAAGCTGTCCCTGCAGTCGAGCCAATGTCAAATGTCAGGTGGATCGACCTGGGTTTCCTTGCGGCTGCACGCGAGACGGTTGCGCGAATAGCTCCGGCAGGATCGAATTCAATCCTATACGAGTGCGAACGCATTTTATTCACACTCTAATGCGATTAGAATTGGAAAAGAAACAACGCGAGGAAGAGGGTAGCGGCGATCACGATCAGACGAACAATCAGGGCCAAAGCAATAGAAATGGATCATTGAGGAATATCGGTTCTCTCGGCTCTGTGATGGACACTGCCGGTAACGGCGACGTGTGTACAATTCCAGGACCTAGAAGCGGAAATGGAGGCGGGGGTGGATTTACGACTCTGCACTACGAGACGAGTCATGACGGCGGCATAGTGACGGCCAGTTGCCAGCCGGAAGTGCCCGGCACGCGAGAGGACAGTTTGGATTTGTACGCAATCAGTGACGATTGTTATCCGAGCGAAGACGCCGTAGACGGCAGCCAATCGATCGTACAGCGAAAGCTGCATCCAGAGTTCAGCCAAGCCTTCCAGAGCTTCTCGCCGGGTGGCCCACAAAGCCCCGGTGGCAATGGCGGCGGTATGAGCTTCCAGCAATCTTCGTATCAGGATTACGGCTCGCCGTATGCGGGTCTCCCGTCCACGTCGCGGGTGCCGCAGTTTCAACAACCGCAGTTCCAATCCTCGGGGCCGCCCAATCCGGCCGCGTTTTCGCACTACGGACCATACGGCGCGGCCCAAAACACTGCGAGCGCCGGTCTTCAGAGTAACTGCGCCGCCCAGGTGCACCAGGTGCCACCCCCGAGTCAGCAGCAGCAGCAGCAGCAGCAACACTCGTCTTACGAGACGGCGGTGTTCGCGCAAGATGACGCCACGAGTACCGCGCAGTATACGAATTTAACCAATTCGGTGCAGCCAATGAACACGAGTGTCGTGCAGCAGATGCAGAACAAGCTCGAGCCTTTCTCGGAACTGCTCAGCGGCAGATATTCGTACTACGGCGAGATGCACGAGCCGCAACAACACCACGGTACTTACGGTGCTCACGGAACGACTTCGAAGATCGCGGAAATAATCGAACCCGGCCAAGTTGTCGGCGAGCAACAGTCCGAGAACACGTCCGAGGATTGCGACGAAAACTTCGGCGAAATTATTAAGAAATCCATGGTGGAAACCGTATCTGCCTAG
Protein Sequence: MAQLPEMESPSACQEYLVEAQEDSTSNSVMVHERINERSENGELEERQSSDNFCLEKEKKEENEKEEENKKVEDQKAEEDKVNEDKEDLMEKLLQEPEESIKTVGPQTHDLDDEETRFEEPVCISRKRSVESDFLIDEEVKKVGLEISKEQAMQLKNDIRRLSPVLVSTRERTLGEISLISESCSFKNDIDDKIMSKSGHDELSQENKIPVTKNRAEKDVDEAKQEAIAKVTASSPAECTSCDNVLEITSDREERKTIECDSQEKIFDVDSSVLSSGCDGFKSTESNKHENVSDIGSAPDVSIEKCVDETTSTVVSSPVCRRLSVMLNRIDNVDVIKSKDDAVEKDSLYSERKRNFEEECGASDKTPSKKQRWHNDTSPMTRSRTSELMEPVHSPNNLVLKKCKVVLERISDEKQSVKTDETDTTSQKLEREGSAPVSVIGQLEEDEEVVLAGPSLSGERDQVFNELDSSETMPSSPEEMSEPAMDVVEGVDTETETETGSDSSEVSPIVNIRELRDVDIASDQLPCPEAEPLCCVEAMAPIMTRLETERPETYTEDSAESLALTTGARDDVRSDGSDSGLGNEIPGDPGPTPAPESDSETSFLDRLPDDILSDKEKGMNQLENFATSSGATGIPEQPPMTSFRTLPAKSNLKRRLIDCMENDESRSNTEEPVKKKRNIHFDAVTVYYFPRAQGFTCVPSQGGSTLGMSATHTHAERFSLSEHAAEQRRIHRARLAQLRSERNCAINCVTETASSSEDPSDDTDDEPSDNEDLDIDSYYFLQPVPTSQRRALLRAAGVRRIDAVEKDECRDIRASREHCGCGCKGYCDPESCPCSRANVKCQVDRPGFPCGCTRDGCANSSGRIEFNPIRVRTHFIHTLMRLELEKKQREEEGSGDHDQTNNQGQSNRNGSLRNIGSLGSVMDTAGNGDVCTIPGPRSGNGGGGGFTTLHYETSHDGGIVTASCQPEVPGTREDSLDLYAISDDCYPSEDAVDGSQSIVQRKLHPEFSQAFQSFSPGGPQSPGGNGGGMSFQQSSYQDYGSPYAGLPSTSRVPQFQQPQFQSSGPPNPAAFSHYGPYGAAQNTASAGLQSNCAAQVHQVPPPSQQQQQQQQHSSYETAVFAQDDATSTAQYTNLTNSVQPMNTSVVQQMQNKLEPFSELLSGRYSYYGEMHEPQQHHGTYGAHGTTSKIAEIIEPGQVVGEQQSENTSEDCDENFGEIIKKSMVETVSA

Similar Transcription Factors

Sequence clustering based on sequence similarity using MMseqs2

100% Identity: iTF_01268264;
90% Identity: iTF_01271206;
80% Identity: -