Basic Information

Insect: Lepidotrigona ventralis
Gene Symbol: CSRNP3_1
Assembly: GCA_002806875.1
Location: NIPQ01091986.1:834-5044[+]

Transcription Factor Domain

TF Family: CSRNP_N
Domain: CSRNP_N domain
PFAM: PF16019
TF Group: Unclassified Structure
Description: This presumed domain is found at the N-terminus of cysteine/serine-rich nuclear proteins. These proteins act as transcriptional activators [1].
Hmmscan Out: # of c-Evalue i-Evalue score bias hmm coord from hmm coord to ali coord from ali coord to env coord from env coord to acc

1 4 0.74 2e+04 -4.2 0.2 64 66 56 58 25 91 0.45

2 4 1 2.6e+04 -5.1 2.4 144 177 328 363 320 376 0.54

3 4 0.27 7.3e+03 -2.8 2.0 140 140 436 436 374 516 0.53

4 4 3e-101 8e-97 324.0 8.8 1 218 757 967 757 967 0.92

#	of	c-Evalue	i-Evalue	score	bias	hmm coord from	hmm coord to	ali coord from	ali coord to	env coord from	env coord to	acc
1	4	0.74	2e+04	-4.2	0.2	64	66	56	58	25	91	0.45
2	4	1	2.6e+04	-5.1	2.4	144	177	328	363	320	376	0.54
3	4	0.27	7.3e+03	-2.8	2.0	140	140	436	436	374	516	0.53
4	4	3e-101	8e-97	324.0	8.8	1	218	757	967	757	967	0.92

Sequence Information

Coding Sequence: ATGGAATCGCCTTCGGCCCCGGATTGTCTTATTGAGGCCCAAGAAGATTCCACCTCGGCAGGATCGGCGGAGACGATCGATGCGTCGTCGTTGACGGTGTCGTCATCGTCAGTATCCTCGCCGGCTACGTCGAGGAACGAGTCAACGGAGCGCGATAACGATGTTAATAAGCAAGAGTTTACCAGTATAGAATCGTGCGAGATCTCGGCGGTCGCTTCGGATGCCTCGAACCAGCCTTCGGAGACCTCGAACGACTCTTCGCCCGGCGAAGGTCAATTAGATATTTCCGACATGGGTCTTAAGCTTGGCAAGGACAAGAAGCAACTTCGAAGCACGGACGACGATGTCGAAGTGAAGTTGAACGTATCTGTGGACGAACGAGATTGTTCGACGCCGACGCCGACGCCGATGTCGCCGTTGGTTCAGTGTACCGAAAAAGAGACAGAGTCTGATTTTAAAGTGTTGGATAACAACGACGAAGGATTCGTCCCCTCGTCGCcattatgtagaaaaagacCGGCCAGTGATTTCCTGCCGATCAATGCGGAGATCAAGCGGATTGACGTTGAGATTCCCGAGAATGATCTGAATCAAGTAAGAAGCGATGTGAGGAGGATCTCGCCGGTGTTGGTGAGCCTTCGAGAGCGCACCCTCGGCGAAATATCCCTGTCCTCGGACTCGTGCCTGTTCGACGACGACGTTAACAGTCGATGCGCCTCGAGGAACAATAGGATTATCGACGACCTGTTAACGAGTGCTTGTAGGTTATCTACGACAACGGTCGTGGACGGTTCTTTTCAAACGGATGATGATCCCGAGGGAGCAACTTGCACCGAGTCGGAGCACAGGATCATCTGCAGAGAAGCGACGTCACCGGAAGGTGAATGTACTAATGGCAGCGTCGAGGAGGCGCTGGCAGAGCCCTGTAAAAACCTCGAATACTCGGGCTCGTTCATCGACGAGGACTCATGTTGTTCGCTGTCGCGCGAGAGCCCCGAGAGGAATTTCAGCAAGTGCCAGGAACCGAAACAGTGCGAGGAGCCTATCGAGGAGTGCTCATGCAACGATATCATGCCTACGAACGATGCTTGCGCGATACCGGTCGCGGTGaacaaacaaatgaaacaaacttCGTTACCCCATTTAATAGTTAAGATGGAACACGTCGACTTGTCGCAGTACTTGTCGCCGGACCGGAAGAACGTGAAATACATGGTCGTCAGCtcgaagaagaaacagaagaagaacaCGGCGTGCAATGATGATGATAGCAACGTAGCCGTAAGAACTACTGATTCCAAAGACACGTTGAAGGAAATACGTTGTATCGTTGAAAATTGCGCTTACGAGAAAAACGTCCAAAAGACTGAGTCACAGGACCACATGGAGAATTCGACGGATTCTCCTATAGTATCCAATCTGAAACAGACCAAATTAACAAAATCATCTACCGCTGGCGTTGTGAAGGAATGCAAGGTGGTCTTGCAGAGGATATCGTTGCCGATGACGACGAGAATTACGTCGACGGAGAAATCGGAGAACGAAGAAACGGGACCGAGATCGGTAATGGAGAAGTTGGAGACCGACGAGAAGATTGTGTTTTCCCCGTCTTTATCCTCCGCCGAGAATCTACAATCGCTGAACAATTTAGATTCGTCTGAAAAGACGCTAGGCTCGCCGGTGATGTTGGAGCCAACCGCGGATGTTCCAGAAACGATCGACACAGAGACGGAAACCGAGACTGGGTCTGATAGCTCCGAAATATCGGCCATGACGAGCGTACCTCTTCGTGGATGCGAAGACGATGCCGCTTCTGATCAAATATCGTGTCAAGAGAGCGAGTCCATGTGCTGCGTCGATATTAATCCGGAGATTATATCCAGGTTGGAGCCGGAAAGGCCGGAAGCTTTTACGGAAGATTCAGCAGAGAGTCTGGCACTTGCCGCTGGTGCACGGGACGAAGTTAGATCGGATGGAAGCGATTCTGGTCTAGGCAGCGAGATTCCCGGTGATTCCGGGCCTGCACCGGTCCCCGAAAGTGATTCCGAGACATCTTTCTTAGATAGGATACCCGATGATAGTCTCTCCGACAAAGAAAAAGCCGTGAATCAATTGGACAGCTTTGTGTCGAACGTGGGTATACCAAGTACAGCACAGTCGCCATTGACGAACTTTCGGAGTCCTACAAAGAGTAATCTAAAACGAAGATTAATAGATTGCATGGAAGAGGCTCCTAGTCCGAAGAGAAGCAACACGGATGaatcgatgaaaaagaaacgcaATATTCAGTTCGATGCCGTCACcgtttattattttcctaGGGCACAGGGCTTCACTTGTGTGCCTTCTCagGGTGGCAGCACTCTTGGCATGAGCGCGACGCATACTCACGCAGAACGGTTCTCGTTGTCGGAGCATGCTGCTGAACAGAGGCGAATTCATCGTGCTCGACTAGCTCAATTGCGCTCGGAGCGTGCCGCCAATTGCGTATCGGAAGCAGCTTCCAGCTCTGAGGATCCCAGCGACGACACGGACGAGGAGCAAAGTGATAATGAGGAACTGGACATTGATAGTTATTACTTTCTACAACCAGTGCCTACATGGCAGAGACGAGCTTTGCTTAGAGCTGCTGGAGTACGTAGAATAGATGCGGTCGAGAAGGACGAGTGCCGCGACATTAGAGCTAGTAGAGAACATTGCGGTTGCGGGTGCAAAGGATACTGCGATCCAGAGAGCTGTCCTTGTAGCCGAGCCAATGTAAAGTGTCAGGTGGATAGAGCGGGTTTCCCTTGTGGATGCACCCGAGATGGTTGTGCGAATAGTTCAGGCAGAATCGAGTTTAATCCAGTACGGGTGCGAACACATTTCATTCATACTCTAATGCGgttagaattagaaaaaaaacaacgagaAGAAGAGGGCGCGGATCATGACGCTTCCGACAATCAAAACGGCCGTAGTCCGTTAAGGGAAATCAATTTGGGATCTGTGATGGAGAATAGGACCACAGAATCGTGTCTGAACGGTGGCGGATTTACAACGCTTCATTACGAGAATCACGACGCTAGAGACGGCGGGACGAATTGTCAGCCAGAAGTACCTGGTACTAGAGAGGATAGTCTGGATCTTTACGCAATTAGAGATGATTGTTATCCCAGCGAAGACACCGTTGATGGTACGCAGGGACCTCAAAGGAAACTTCATCCTGAGTTTAGTCAAGCTTTTCAAACATTCTCAAGCCAAACGAGTGCTGGAGTGACTTTTCAACAACCTACTTATCAGGATTATCAACCTTACGCTAACCTTCCTTCTACATCTAGGGTGCAATTTCAGCCGCAATTCCAAACGGTGCCAGGAAATCCAGGGTTCTCACACTACGCGCCTTACGGACAAGACACCGGATCAATTCAGGGGAACTGCCAGGTCCATCCCGGACAACACTCTTCCAACTACGAGGCTAGCTTCGCCCAAGACGAAACAACTGGATCGCAGTACACGAATTTGAATTCGGTGCAGCCAATGAACACTGTGGTTCAACAGATGGGTAAACTAGAACCATTTTCAGAACTTTTGTCTGGTAGATATTCGTATTATGGTGAAATGGAGCCTCCGGCGCATGGTACTTATCATGGGAACGGAACGAAGGTCGAGGTAGAAAAGAACCAAGGTAACGAGCAACAATCGGAAAGTACGGAAGAGTGCGACGAAAACTTTGGTGAGATTATTAAAAAGTCAATGGTTGAGACTGTATCCGCTTAG
Protein Sequence: MESPSAPDCLIEAQEDSTSAGSAETIDASSLTVSSSSVSSPATSRNESTERDNDVNKQEFTSIESCEISAVASDASNQPSETSNDSSPGEGQLDISDMGLKLGKDKKQLRSTDDDVEVKLNVSVDERDCSTPTPTPMSPLVQCTEKETESDFKVLDNNDEGFVPSSPLCRKRPASDFLPINAEIKRIDVEIPENDLNQVRSDVRRISPVLVSLRERTLGEISLSSDSCLFDDDVNSRCASRNNRIIDDLLTSACRLSTTTVVDGSFQTDDDPEGATCTESEHRIICREATSPEGECTNGSVEEALAEPCKNLEYSGSFIDEDSCCSLSRESPERNFSKCQEPKQCEEPIEECSCNDIMPTNDACAIPVAVNKQMKQTSLPHLIVKMEHVDLSQYLSPDRKNVKYMVVSSKKKQKKNTACNDDDSNVAVRTTDSKDTLKEIRCIVENCAYEKNVQKTESQDHMENSTDSPIVSNLKQTKLTKSSTAGVVKECKVVLQRISLPMTTRITSTEKSENEETGPRSVMEKLETDEKIVFSPSLSSAENLQSLNNLDSSEKTLGSPVMLEPTADVPETIDTETETETGSDSSEISAMTSVPLRGCEDDAASDQISCQESESMCCVDINPEIISRLEPERPEAFTEDSAESLALAAGARDEVRSDGSDSGLGSEIPGDSGPAPVPESDSETSFLDRIPDDSLSDKEKAVNQLDSFVSNVGIPSTAQSPLTNFRSPTKSNLKRRLIDCMEEAPSPKRSNTDESMKKKRNIQFDAVTVYYFPRAQGFTCVPSQGGSTLGMSATHTHAERFSLSEHAAEQRRIHRARLAQLRSERAANCVSEAASSSEDPSDDTDEEQSDNEELDIDSYYFLQPVPTWQRRALLRAAGVRRIDAVEKDECRDIRASREHCGCGCKGYCDPESCPCSRANVKCQVDRAGFPCGCTRDGCANSSGRIEFNPVRVRTHFIHTLMRLELEKKQREEEGADHDASDNQNGRSPLREINLGSVMENRTTESCLNGGGFTTLHYENHDARDGGTNCQPEVPGTREDSLDLYAIRDDCYPSEDTVDGTQGPQRKLHPEFSQAFQTFSSQTSAGVTFQQPTYQDYQPYANLPSTSRVQFQPQFQTVPGNPGFSHYAPYGQDTGSIQGNCQVHPGQHSSNYEASFAQDETTGSQYTNLNSVQPMNTVVQQMGKLEPFSELLSGRYSYYGEMEPPAHGTYHGNGTKVEVEKNQGNEQQSESTEECDENFGEIIKKSMVETVSA

Similar Transcription Factors

Sequence clustering based on sequence similarity using MMseqs2

100% Identity: iTF_00982283;
90% Identity: iTF_01417699; iTF_01420269; iTF_01418343; iTF_01420926;
80% Identity: -