Basic Information

Insect: Gastracanthus pulcherrimus
Gene Symbol: CSRNP3_1
Assembly: GCA_949152435.1
Location: OX424576.1:37879619-37894940[+]

Transcription Factor Domain

TF Family: CSRNP_N
Domain: CSRNP_N domain
PFAM: PF16019
TF Group: Unclassified Structure
Description: This presumed domain is found at the N-terminus of cysteine/serine-rich nuclear proteins. These proteins act as transcriptional activators [1].
Hmmscan Out: # of c-Evalue i-Evalue score bias hmm coord from hmm coord to ali coord from ali coord to env coord from env coord to acc

1 4 0.013 1.3e+03 1.5 0.0 80 130 228 280 171 291 0.52

2 4 5.4e-100 5.4e-95 319.9 7.9 1 218 646 856 646 856 0.90

3 4 0.0027 2.6e+02 3.8 4.2 60 117 1031 1087 980 1097 0.49

4 4 0.5 4.9e+04 -3.7 0.2 63 97 1115 1149 1107 1158 0.59

#	of	c-Evalue	i-Evalue	score	bias	hmm coord from	hmm coord to	ali coord from	ali coord to	env coord from	env coord to	acc
1	4	0.013	1.3e+03	1.5	0.0	80	130	228	280	171	291	0.52
2	4	5.4e-100	5.4e-95	319.9	7.9	1	218	646	856	646	856	0.90
3	4	0.0027	2.6e+02	3.8	4.2	60	117	1031	1087	980	1097	0.49
4	4	0.5	4.9e+04	-3.7	0.2	63	97	1115	1149	1107	1158	0.59

Sequence Information

Coding Sequence: ATGGAATCGCCTTcggcccagcagcagcagcagctgtcCACGGAGGCCCAAGAGGATTCCAGCTCAGTGCAGGCACTTTTACCGCGGAGCGCGACGACAATTGCCGTGGAGGAGCCAGCGCAGGATGCCGGAAACAGCAACAATGGATTCTGCTTTCTCGATGACCTGGGCCAGCTAGCAACGACCGACGTCGCGTCATCGCCCATCGTCAGCCGCCTCGACGAGAACGACCTGCTACCGCATGACATGGGCAGCTACGCATCTAGACACTCCCCCGAGGACGAATTTAGGTTAGACCCCTCCGCAAGTGCTTGCAACCCCGAGGAATCCGAGACTCCAGGTGCTTTCTCACCGTTCCCTGCCTCCAGCGACACAGTCCCAACAGCCGCATCCATCTCTCCGAGGAGAAGGCCGACGCTCTCGACCGTCAGCGTCGCTTCGGACTTCCAGCCGATCGGCGTCGAGGTCTCGGAGGAGAAGGCCCAGCAGTTGAAGAACGACGTGAAGCGACTCTCGCCCGTTCACGTGAGCCTGCGCGAACGAACCCTCGGCGAGTTCTCGCTCACGGCCGACGCCCTCGGTCGCGGCGGCAGCAGTGGCAACAATAGTATACACAGTGGCCTACCCCAGGCGCTCCCGAGCGGTGCGCAAACCGATCGCACGAACGACACCGATCGCGAGACGACCGCCGGTGCGGACCGCGCGACTGCCAGCCAGACCGACTTGGACGACGAGTCCTGCTCGAGCCTGAACAATAGTAACGATAATAACGATAGCGGTAGTAGCTGCAGCGACTCGAGTGCCCGGCGTCGCGAGCTGGTGATCCGTCTGTCGCGCGTAGACGCGAGCGGTAAAGCCCCGGCGAGCCCGACGACGTGCGGTGCAAGCGCCGGTGCGGTCGAGCTAGGCTTTCCCGAGCCGACCGACGAGCCGACCGACGAGCCGATCATGAACGAGTGCGGCGAGGCCTCCGGTGCCGCGACGATGATGGACGTGGACAAGTCTTCCGGCGAGGAGGGCACCACGTCGCCCTGTCCCTTCGGCGCGAACCTCGTGCTCGAGCGCTGCAACGCGCCGGGCTTCGCCGAGAACCGCGTGCTCTCGAGCTGCGGCCGGGTCACGCTCCTCGACAAGTTCGATCCGGATTTGCCGATGCCGGGGGGCCAGCCCTGCGCCCTGGCCACCTCCAAGTCCATCGTCGAGAAGCTGCACATCGGCGACGAGATCGAGTTCTCGAGCCCCGGGGCGAGTGGCAATTACGCCAACGGCGCTCACTGTCGCGTCTCGTCCCCGCCGCCCCAGCCGACGCCGACGCCGACGTCGCAGCCGATCTTCGGCGCGGAGGCGGAGGAGGGCGAGATCGAAACCGGCTCCGAGGGCTCGGACGCGCCGCTCGGCTCGATGGCGGCCGGCGAGGCCGGCAACGCGGTGGACATGGCCTGCGAGGAGGGCCTCGACCAGGAGATCATGACCAGGCTGGACCGGCCCGAGGCCTTCACCGAGGACTCGGCCGAGAGCCTGGCCCTGGCCACCGGGGTCAGGGACGAGGTCAGGTCGGACGGGAGCGACTCCGGACTGGGCAGCGAGATGCCCGGGGAGCCGTGTCCAGCGCCCGCGCCTGAGAGCGACTCCGAGACGTCGTTCTTGGACAGGATACCAGATGACATTCTGTCCGATAAGGATAAACCCGTGAGTCAACTGGACGGCTTCGCGGTGGACGTGCCTAAGACGCCGACGACGCCACTGCCGAGCTTCCGGGCGCCGTCGAAGAGCAGCCTCAAGCGCCGGCTGGCGGACTGCATGGAGGAGGCCGACGACCAGCCGGGCGCCAAGAGGATCAACGTCGACGAGTCCGCGTCgacctcgtcctcgtcgtcttCCGCCGATGCcggtgccgccgccgccgccgccgccgtcgccgacGTCGCCGTGCCCAAGAAGAAGCGCAACATACAGTTCGACGCGGTCACGGTCTACTACTTTCCCAGGGCTCAAGGCTTCACCTGCGTGCCTTCACAGGGTGGCAGTACGCTGGGCATGAGCGCGATGCACACGCACGCGGAGCGCTTCTCGCTGTCGGAGCACGCGACCGAGCAGCGCCGTCTGCACAGGGCCCGGCTGGCCCAGTTGCGCTCGGAGCGCGCGGCCAACTGCACGCTCGAGGCGGCCTCGAGCTCGGAGGAGCCGAGCGACGACACGGACGAGGAGCCGAGCGACACCGAGGAGCTCGACATCGACAGCTACTACTTCCTGCAGCCGGTGCCGACCTGGCAGAGGCGGGCTCTGCTCAGGTCGGCGGGCGTGCGCAGGATAGACGCCATGGAGAAGGACGAGTGCAGGGACATCAGGGCCAGTAGGGAGCACTGCGGCTGCGGCTGCAAGGGCTACTGCGACCCGGAGAGCTGTCCCTGCAGCAGGGCCAACGTCAAGTGTCAGGTCGACCGAGCGGGCTTCCCGTGTGGCTGCTCGCGGGACGGCTGCGCCAACAGCTCCGGCCGCATCGAGTTCAATCCCGTCCGCGTGCGGACCCACTTCATCCACACCCTCATGCGGCTCGAGCTCGAGAAGAAGCCCGCCCACCGGGACGAGGAGTCCCACCAGGAgagccaccaccaccaccaccaccaccagagCCGACTCGCCGTGCCGCTCTCCTCGGTCCTCGAGTCCTCGCCGAGCGACTGCCTGAGCGGCGGCTTCACCGGCCTGCACTACGACAGCCAGGACGCCGGCGCGCGCACCGACAGTCTCGACCTCTACACCATACGCGACGACTGCTATCCCAGCGAGGACTGCCTCGTCGCGGGACCCGGGGTTGGCGGAGCCGGCGACGTTGGCTCGCAGAACCAGCAGCAGAGAAAGCTGCACTCCGAGTTCGGCCCGAGCTTCCAGCACTACGCCAGCCAGGGGCCGAGCGTCGGATTCCAGCAAAATCCGTACGCCGAGTATCAGAGCTATCAGTCCCTGCCGTCGACGTCTAGGTCGCCATTTCACCCGCAATTCCAGCCGGTCGCCGCGAATACCGGCTTCTCGCACTATGGCTCTTACTCGCAGGAGTCAACCTCCACTTCGACCTCCAGCGTCTGTCACCAGACTCACTCGCTCatgcagcaacaacagcaacaacagcagcaacaacaacaacagcaacaccagcagcagcagcagcagcacaatAGCGTCATATACGATGCGCCTTTTGCGCAGGACGAAATGACGGGCTCGCAGTACACCAATCTCAACTCGATCCAGCCGATGAGCTCGGTGGTCCAGCAGATCGGCAAACTCGAGCCCTTCTCGGAGCTGCTCTCCGCCAGGTACTCCTACTACGACGATGTCcagcagcagcatcacgGTGCTTATCACGTGAACGGTGTCAAGATGGAAATGGAGAAGGACGAAATGGTCGTGAATGAGCAACATGAACAACTGGCCGAGGAGAACTGCGACGAGAACTTCGGCGAAATTATTAAGAAGTCCATGGTCGAGACTGTGTCCGCTTAG
Protein Sequence: MESPSAQQQQQLSTEAQEDSSSVQALLPRSATTIAVEEPAQDAGNSNNGFCFLDDLGQLATTDVASSPIVSRLDENDLLPHDMGSYASRHSPEDEFRLDPSASACNPEESETPGAFSPFPASSDTVPTAASISPRRRPTLSTVSVASDFQPIGVEVSEEKAQQLKNDVKRLSPVHVSLRERTLGEFSLTADALGRGGSSGNNSIHSGLPQALPSGAQTDRTNDTDRETTAGADRATASQTDLDDESCSSLNNSNDNNDSGSSCSDSSARRRELVIRLSRVDASGKAPASPTTCGASAGAVELGFPEPTDEPTDEPIMNECGEASGAATMMDVDKSSGEEGTTSPCPFGANLVLERCNAPGFAENRVLSSCGRVTLLDKFDPDLPMPGGQPCALATSKSIVEKLHIGDEIEFSSPGASGNYANGAHCRVSSPPPQPTPTPTSQPIFGAEAEEGEIETGSEGSDAPLGSMAAGEAGNAVDMACEEGLDQEIMTRLDRPEAFTEDSAESLALATGVRDEVRSDGSDSGLGSEMPGEPCPAPAPESDSETSFLDRIPDDILSDKDKPVSQLDGFAVDVPKTPTTPLPSFRAPSKSSLKRRLADCMEEADDQPGAKRINVDESASTSSSSSSADAGAAAAAAAVADVAVPKKKRNIQFDAVTVYYFPRAQGFTCVPSQGGSTLGMSAMHTHAERFSLSEHATEQRRLHRARLAQLRSERAANCTLEAASSSEEPSDDTDEEPSDTEELDIDSYYFLQPVPTWQRRALLRSAGVRRIDAMEKDECRDIRASREHCGCGCKGYCDPESCPCSRANVKCQVDRAGFPCGCSRDGCANSSGRIEFNPVRVRTHFIHTLMRLELEKKPAHRDEESHQESHHHHHHHQSRLAVPLSSVLESSPSDCLSGGFTGLHYDSQDAGARTDSLDLYTIRDDCYPSEDCLVAGPGVGGAGDVGSQNQQQRKLHSEFGPSFQHYASQGPSVGFQQNPYAEYQSYQSLPSTSRSPFHPQFQPVAANTGFSHYGSYSQESTSTSTSSVCHQTHSLMQQQQQQQQQQQQQQHQQQQQQHNSVIYDAPFAQDEMTGSQYTNLNSIQPMSSVVQQIGKLEPFSELLSARYSYYDDVQQQHHGAYHVNGVKMEMEKDEMVVNEQHEQLAEENCDENFGEIIKKSMVETVSA

Similar Transcription Factors

Sequence clustering based on sequence similarity using MMseqs2

100% Identity: -
90% Identity: -
80% Identity: -