Basic Information

Insect: Lasius platythorax
Gene Symbol: CSRNP3_1
Assembly: GCA_963971435.1
Location: OZ020549.1:450928-458092[+]

Transcription Factor Domain

TF Family: CSRNP_N
Domain: CSRNP_N domain
PFAM: PF16019
TF Group: Unclassified Structure
Description: This presumed domain is found at the N-terminus of cysteine/serine-rich nuclear proteins. These proteins act as transcriptional activators [1].
Hmmscan Out: # of c-Evalue i-Evalue score bias hmm coord from hmm coord to ali coord from ali coord to env coord from env coord to acc

1 4 0.33 1.8e+04 -3.1 1.1 117 117 87 87 20 166 0.57

2 4 0.3 1.6e+04 -2.9 0.7 48 76 423 451 367 487 0.61

3 4 1.8e-99 9.5e-95 318.2 10.6 1 218 707 919 707 919 0.92

4 4 0.04 2.2e+03 -0.1 2.7 63 96 1147 1179 1142 1207 0.43

#	of	c-Evalue	i-Evalue	score	bias	hmm coord from	hmm coord to	ali coord from	ali coord to	env coord from	env coord to	acc
1	4	0.33	1.8e+04	-3.1	1.1	117	117	87	87	20	166	0.57
2	4	0.3	1.6e+04	-2.9	0.7	48	76	423	451	367	487	0.61
3	4	1.8e-99	9.5e-95	318.2	10.6	1	218	707	919	707	919	0.92
4	4	0.04	2.2e+03	-0.1	2.7	63	96	1147	1179	1142	1207	0.43

Sequence Information

Coding Sequence: ATGGCAGAAACACCCGAGATGGAATCGCCTTCGGCCCATCAGGACTGTCTCGTTGAGGCCCAAGAGGATTCCACCTCAGTGGAGCCTGAAGCGGAAAGCGTATCATCTCCAAGCAAGACGATGACGCCAGCAACAGAAGCTGAGAACGACGCGCGAGATTCTCACGAAGACTTGGTGCGCGAGACACTGGACAAAGGATCGGAAAATCAAGGATCTCAGGAGAGACAATTGAGTGACTATCCTTGCCTCCAAAAActggagggagagagagacgtgGATCTAAAGTTGGAAAAAGAAACCAGCGAAATCGggaaaaattcagatattgattTCGACGTGGAATCGACGAAGGATCCTCTTCAAGAACCCGAAGAGTCGTTGAAGATGCCTGATTCTCAGGATTGGAACATGGAGGATGAGGAAGATAGAGTCGAAAAGAAGAGGTCGAGCGATTTTCTGCCGATCGGCGCGGAGATCAGGAGGGTTGGCGTCGAGATCTCGGAGGAAGAGGCGACCCAAATGAGAAATGACGTCAGAAGGTTGTCGCCAGTATTAGTGAGCTTGCGGGAGAGGACCTTGGGCGAGGTTTTCCTGTCTTCGCAATCCTGTCTCTTCGGGGACGAGGTTGACGGCAAGGCAGCGTCGCGGAGTAATGACGTCCCGCAAGAATCATTTGTGAAGAACGATTCCAGAATTCAGGATGTCGATCAAAGCGAAAAGCGGCGTGTCGACGAGGCGGAAACGGTCATCAAGATCGGCGCGAGTCTTTCAGATTGCGCAAACGGGAAGCTGAATTGTGAAGAGGAGACGCTCGGCGTCGACGTAGCGTCTTCGGTTCTCTCTAGGTCCGATAATTCAGACGGAACGAGTCAGGACGACGTCAATAACGCGAATGCGACTGCGAATATCAGGGACGCATCCTGCACGCCGACCAAGGAAGCGACATCGAGCCCTGCATCGTCGAGTCCCGCCTGTCGACGTTTAGCGGTGGTGTTGAACCGCATCAAGGAGGAAGACGTGAAAGGAAACGAACTGACAGACGAAAATGACGATGGGAGCATCTGGAACGTCGAGGAAGGTTCTCTGTGTTccaaaagaagaagagattcCGTCGAAGAAGAGTGCGATTCGTCTTCGGAGATTTCGAAAGCCAGGGAGAGAAGCCCGAAGAAGCCGCGGTGGCAAAATAACTCCTCCCCGATGACGAGATCGAAGAAGTGCGAGCCGTCAGAAGATGGTCAAAGTCCAGATCGCAATCTGATGCTAAAAAAGTGCAAGGTGGTGCTGGAGCGAATCAGGAGCGAGATCGAGCAATCTCAAGAAGAGGAGTCCCACGTCGAGGAACTCGAGGCGCTGAAAAGATCCGAGAGAGAGGAACTCGCGCCCGTGGCGGTGATTGGCAAGCTGGAGGAGGATGAAGAGGTTGTACTGACGAGCTCATCGCCCTCCACGGGCGAGAATAGCCGCGCGTTTAACGAACTGGACTCGTTGGAGACGACGCCGAGCTCGCCGGAAGAGGGTGAGACGACGCCGGAAGAAACATCGGTTGACGTCGGCGCCGAGGGTGTCGACACCGAGACGGAAACCGAGACCGGCTCCGACAGCTCGGAGGTGTCTCCCATGACAAACATCCGGGAGCTACGTGACGTCGACATGGCGTCCGATCATCAGCTGCCCTGCTCCGAGGAAGGGCCGCTGTGCTGCGTGGAGGCGATGGCGCCGATCATGACGAGGTTGGAGGCCGAACGACCGGAAGCGTACACGGAGGACTCTGCCGAGAGTCTGACATTGGCCACCGGTGCCAGAGACGAAGTTAGATCCGATGGAAGCGATTCCGGTCTAGGGAATGAGATCTCTGGTGATCCTGGACCGGCGCCCGCACCGGAGAGCGACTCGGAGACCTCTTTTCTCGACAGACTGCCGGACGATATCCTATCTGACAAGGAGAAAGGCGTGAATCAACTAGATGGCTTCGCGCCGTCTTCAGGTACGCCTGAGACCCCGAGCCAGGCACCCCTGACAAGTTTCCGGACACTTCCGGCCAAGAGTAATTTGAAACGCAGGCTGACCGACTGCATGGAGGGCGATGAATCGCGAACCAACCCCGATGAGCCCGTGAAGAAAAAGCGCAACATCCAGTTCGATGCAGTGACAGTTTATTACTTCTCCAGGACGCAGGGCTTCACCTGCGTACCTTCCCAGgGCGGCAGCACTCTGGGTATGAgcgccacacacacacacgccgAGAGATTCTCGTTGTCGGAACACGCGGCTGAGCAGAGGCGAATCCATCGCGCGCATCTCGCGCAGTTGCGCTCGGAGCGCAACTGCGCGACCAGCTGCGTGACGGAGACGGCGTCGAGCTCGGAGGATCCGAGCGACGACACCGACGAGGAGCCTAGCGACACCGAGGAGCTCGACATCGATAGTTACTACTTCCTGCAGCCGGTGCCGACGTGGCAGCGCCGGGTGATGCTGAGGAATGCCGGGGTGCGGAGGATAGATGCCGTCGAGAAGGATGAGTGTCGCGACATACGCGCTAGCAGAGAACACTGCGGATGCGGCTGCAAAGGATACTGCGACCCTGAAAGCTGCCCTTGCAGCAGGGCCAGCGTCAAGTGTCAAGTGGACCGACCGGGATTCCCTTGCGGCTGCACGCGAGACGGTTGCGCAAACAGCTCCGGCAGAATCGAATTTAATCCGGTGCGTGTGCGAACGCACTTTATTCACACGCTAATGCGACTCGAGCTGGAGAAGAAGCAGCGCGAGGAGGAGGTCGGCGGCGAGCACGCGGATCAGGTTGCGGACAATCAGAGGCAGGGCGGCAGAGGTAACGGCGGTTCTCTCAGAGACATCGATTCCCTAGGGATGGAGATTGCCGGCAGGAGCGGCGACGCGTGCGCGATTCCTGGTCCCGGGGGCGGAGGGGGATTCACGACCTTGCACTACGAGACGGGTCACGAGGGCGGCGTGGTTACGGCGGGCTGCCAGCCGGAAGTGCCTGGCACGAGGGAGGACAGCTTAGACCTGTACGCGATCAGGGACGATTGTTACGCGAGCGAGGACGCGGTGGACGGCAGTCAGTCGGTCGCGGTACAGCGGAAGTTGCATCCCGAGTTCGGCCAGGCCTTCCAGAGCTTCTCGACGGGCGCGCAAAATGGCGGCGGAGGGGGCGCCGGGGGTGGCATGAGCTTCCAACAATCCTCGTATCAGGATTACGTCAACTCGCCGTACGCGAATCTGCCGTCCACGTCGCGGGTCTCGCAATTtcagccgccgccgccgccgccgcaaTTTCAATCGTCGCCGAATCCGGCCGCGTTCGCGCACTACGGACCTTACGGCGGCACCCAGGATCCCGCAAACGCCGCTCTTCAGGGTAATTGCACCGCGCAGCTTCATCAAGTGCCGgcaccaccgccgccgccaggtcagcagcaacagcaacagcaacagcaacagcagcaacagcagcaacaacacTCGTCCTATGACACGACGGTGTTCGCGCAGGACGAGGCTGCGAGTACGACGCAGTACACGAATCTCACTAATTCGGTACAGCCGATGAACGCGACGACGGTGGTGCAGCAGATGCAGAGCAAGCTCGAGCCCTTCTCGGAGCTTCTCAGCGGCAGGTACTCGTATTACGGCGAGATGCACGAACCGCAGCAGCATCACGGTACTTACGGCGGTCACGGAGGTGCCGCCGGCAAGATGACGGAGATGGTAGTCGAACCAGGTCAGGTCGCCGGCCAGCAACAGTCCGAGGGCACCTCCGAGGATTGCGACGAGAATTTTGGCGAGATTATCAAAAAGTCGATGGTCGAGACCGTGTCCGCTTAA
Protein Sequence: MAETPEMESPSAHQDCLVEAQEDSTSVEPEAESVSSPSKTMTPATEAENDARDSHEDLVRETLDKGSENQGSQERQLSDYPCLQKLEGERDVDLKLEKETSEIGKNSDIDFDVESTKDPLQEPEESLKMPDSQDWNMEDEEDRVEKKRSSDFLPIGAEIRRVGVEISEEEATQMRNDVRRLSPVLVSLRERTLGEVFLSSQSCLFGDEVDGKAASRSNDVPQESFVKNDSRIQDVDQSEKRRVDEAETVIKIGASLSDCANGKLNCEEETLGVDVASSVLSRSDNSDGTSQDDVNNANATANIRDASCTPTKEATSSPASSSPACRRLAVVLNRIKEEDVKGNELTDENDDGSIWNVEEGSLCSKRRRDSVEEECDSSSEISKARERSPKKPRWQNNSSPMTRSKKCEPSEDGQSPDRNLMLKKCKVVLERIRSEIEQSQEEESHVEELEALKRSEREELAPVAVIGKLEEDEEVVLTSSSPSTGENSRAFNELDSLETTPSSPEEGETTPEETSVDVGAEGVDTETETETGSDSSEVSPMTNIRELRDVDMASDHQLPCSEEGPLCCVEAMAPIMTRLEAERPEAYTEDSAESLTLATGARDEVRSDGSDSGLGNEISGDPGPAPAPESDSETSFLDRLPDDILSDKEKGVNQLDGFAPSSGTPETPSQAPLTSFRTLPAKSNLKRRLTDCMEGDESRTNPDEPVKKKRNIQFDAVTVYYFSRTQGFTCVPSQGGSTLGMSATHTHAERFSLSEHAAEQRRIHRAHLAQLRSERNCATSCVTETASSSEDPSDDTDEEPSDTEELDIDSYYFLQPVPTWQRRVMLRNAGVRRIDAVEKDECRDIRASREHCGCGCKGYCDPESCPCSRASVKCQVDRPGFPCGCTRDGCANSSGRIEFNPVRVRTHFIHTLMRLELEKKQREEEVGGEHADQVADNQRQGGRGNGGSLRDIDSLGMEIAGRSGDACAIPGPGGGGGFTTLHYETGHEGGVVTAGCQPEVPGTREDSLDLYAIRDDCYASEDAVDGSQSVAVQRKLHPEFGQAFQSFSTGAQNGGGGGAGGGMSFQQSSYQDYVNSPYANLPSTSRVSQFQPPPPPPQFQSSPNPAAFAHYGPYGGTQDPANAALQGNCTAQLHQVPAPPPPPGQQQQQQQQQQQQQQQQHSSYDTTVFAQDEAASTTQYTNLTNSVQPMNATTVVQQMQSKLEPFSELLSGRYSYYGEMHEPQQHHGTYGGHGGAAGKMTEMVVEPGQVAGQQQSEGTSEDCDENFGEIIKKSMVETVSA

Similar Transcription Factors

Sequence clustering based on sequence similarity using MMseqs2

100% Identity: iTF_00264988;
90% Identity: iTF_00867391;
80% Identity: -