Basic Information

Insect: Eupelmus annulatus
Gene Symbol: CSRNP3_1
Assembly: GCA_900480025.1
Location: UDEW01000302.1:52993-64170[-]

Transcription Factor Domain

TF Family: CSRNP_N
Domain: CSRNP_N domain
PFAM: PF16019
TF Group: Unclassified Structure
Description: This presumed domain is found at the N-terminus of cysteine/serine-rich nuclear proteins. These proteins act as transcriptional activators [1].
Hmmscan Out: # of c-Evalue i-Evalue score bias hmm coord from hmm coord to ali coord from ali coord to env coord from env coord to acc

1 4 0.32 3.8e+03 -2.0 1.0 38 105 178 221 159 258 0.52

2 4 7.7e-102 9.2e-98 326.9 5.3 1 218 587 800 587 800 0.92

3 4 0.33 4e+03 -2.1 2.2 54 91 809 834 801 861 0.39

4 4 0.14 1.7e+03 -0.9 1.2 51 103 1044 1090 1031 1103 0.47

#	of	c-Evalue	i-Evalue	score	bias	hmm coord from	hmm coord to	ali coord from	ali coord to	env coord from	env coord to	acc
1	4	0.32	3.8e+03	-2.0	1.0	38	105	178	221	159	258	0.52
2	4	7.7e-102	9.2e-98	326.9	5.3	1	218	587	800	587	800	0.92
3	4	0.33	4e+03	-2.1	2.2	54	91	809	834	801	861	0.39
4	4	0.14	1.7e+03	-0.9	1.2	51	103	1044	1090	1031	1103	0.47

Sequence Information

Coding Sequence: ATGGAATCGCCTTCGGCCGTCCAGCTTCCCGCCGAGGCCCAAGAGGATTCCAGCCGAGTGGAGGCCCTACTTCTGTCGAGCTCGACGTCAACGGCGACGGAATGCAACGGACCGGAAGAGCCGGCGCCGGATGCCGCTGGCATCGCCTTTCTCGATGACCTGAGCCAGCTGACGGCGACGAGCAAGGATACGGCCTGCGAGGCGAGCCGGCTTCTCGACGGTGAGGGCCAGCGCGAATTGTTATTGTTAGAGCAGCAAGACATGGGCAGCTACGCGTCCAGGAATTCTTCCGAGGAAGATATTAGCAGGTTAGAGGCCTCCGCCGCAAGTGCTAACCCTCCCCAGGAGCCGCAGGCTCCCAGCGGTGCTACAGCCGAGCCCGAGGCAGCCTCCCCGGGCCCCTCGGCCAGCTCATCCCCGCGACGAAGGCCTAGCTGCGCGGCCGGCGTCACCGACTTCCAGCCCCACGGCGTCGAGGTCTCCGAGGAGAAAGCCCAGCAGCTGAAGAACGAGGTGAAGCGGCTCTCGCCGATCCACGTGAGCCAGCGCGAGCGCACGCTCGGCGAGATATCGCTGACGTCGGACTCGCTGCTCAGGCGCGAGGCCAGCGGCCAGGACACTGCCAGTAGTGAGAGCGTTAAAAGTAGTGAGAGCGCCTCGGCGGAGAGCGAGGCGAGACTGAACGCTAGTGGTGAGGTTAAGAGCCGGCGCGAGCTGGTGATCCGGCTGTCGCGCGTcgacggcagcagcagcagcaggcgcaGTAGCTGCCAGTCGCCGCCAGTTGGTGCCAGTGGTGCTAGTAGTGCCGCCGGCGACGAGGAGTTCGCCGCCATGATGATGGCCGAGTGCGGGATGATGGACgtagagcagcagcagcagcaagccAAGTCTTCcgaggagcagcagcagcagcggctggTCTCGTCGCCGGTCTGCCCGTTCGGCGCCAACCTAGTGCTGGAGCGCTGCAACGCGCCCGGCTACTCCGAGAACCGCGTGCTGTCCAGCTGCGGCCGCGTCACCCTCCTCGATCCCAAGTACGAGGAGACGCGCAACAATAGCGGCTCCCAGATGGAGAGCTCGGCGTCGATCGTCGAGAAGCTGCACATCGGCGACGAGATCGAGTTCTCGAGCCCGGTGGCTGCGGCCTCGGCCGTCCACTGCAGGGTGAGCTCGCCGCCGCCTATCTTCAACGTCGACGTGGTAGAGGAGAACGAGCTGGAGACGGGCTCGGACAGCTCGGAGGTGCTGGCTTCGATAGcagcggcggctgcggcggccgGGGTTGACATGCTGTCGGCCTGCGAGGAGGACGGACTGACCCAGGCGATAATGACGAGGCTGGAGCAGGACAGGCCCGAGGCTTTCACGGAGGACTCGGCGGAGAGTTTGGCTCTGGCGGCGGCCGCGAGGGACGAGGTCAGGTCGGACGGCAGCGATTCGGGACTGGGCAGCGAGATGCCCGGCGAGACGTGCCCCTCGGCGCCGGCGCACGAGAGCGACTCGGAGACGTCGTTTTTGGACAGGATACCGGACGATATTCTGGCGGATAAGGCTGATAAAGGCGCGAATCAGCTGGACGGCTTCGCGGCCGACGTGCCCAAGCAGCCTCTGCCTCTGAACTTCGGCGCGCCCGCCAAAAGCAGCCTGAAGCGCCGACGACTGACCGAGGACTGCATCGAGGACGCGACGAGCAGCGGCGAGCCCGATGCGAAGAGGCTCAACGTAGACGAGGCCTCCTCGGCGAGCGGCGCCAAGAAGAAGCGCAACATACAGTTCGACGCGGTCACGGTCTACTACTTTCCCAGGGCCCAAGGCTTCACCTGCGTGCCTTCACAGGGCGGCAGCACGCTGGGCATGAGCGCGACGCACACGCACGCCGAGCGTTTCTCGCTGACGGAGCACGCCGCGGAGCAGCGCCGGCTCCACCGGGCGAGGCTGGCCCAGCTGCGCTCGGAGCGCGCCGCGGCCAACCTGAACGCGGCCGAGGCCGCCTCGAGCTCGGAGGACCCGAGCGACGACACCGACGACGAGCCGAGCGACAGCGCCGAGGAGCTCGACATCGACAGCTACTACTTCCTGCAGCCGGTGCCCACCTGGCAGAGGCGGGCTCTGCTCAGGGCGGCCGGAGTGCGCAGGATAGATGCTGTGGAGAAGGACGAGTGCAGGGATATCAGGGCGAGCAGGGAGCATTGCGGCTGTGGGTGTAAAGGATACTGCGATCCCGAGAGCTGTCCGTGTAGTAGGGCCAACGTCAAGTGTCAGGTCGACCGAGCTGGCTTCCCTTGCGGCTGCTCGCGGGACGGCTGCGCCAACAGTTCCGGCCGCATCGAGTTCAATCCCGTCCGCGTGCGCACACACTTCATCCACACTCTCATGCGGCTCGAGCTTGAAAAGAAGCCGGCCCACCACCACccgcagcagcaacagcagcgcgACGAGTCCGAGCACCAGCAGGAGTCGACGAGCGGCGCCAGCAGTCATCACCAGCATCATCATGCACAGGCCAACCACCACCACCTTCATCAAAGTCGACTCGCCGTGCCGCTCTCCTCGGTCCTGGACTCGGCCAACGACTGTCTCACAGGTGGCTTCACGAGCCTCCACTACGACAGCCAGGATAGCGCGCGGCCCGACAGTCTCGATCTCTACACGATAAGGGATGACTGTTACGGGAGCGAGGACTGCCTGCTGGATGGGGGCCAGAGAAAGATGCACTCGGAGTTTAGCCAGAGCTTTCAGCACTACGGGGCCCAAGGGCCCAGCGTTGGATTCCAGCAGAATCCGTACGCCGATTACCAGAGCTACCAGTCCCTGCCGTCGACCTCTAGGTCGCCCTTTCAGCCGCAATTTCAGACAAATTCCGGCTTCTCTCACTACGGCTCGTACTCGCAGGACTCCAGTTCCAACTCAAACGGCTGCCACCAGAGTCACTCGCTcatacagcagcagcaacaacagcacaGCAACGTCATCTACGACGCCCCCTTCGCACAGGACGAGGTGACAGGCTCCCAGTACACCAACCTCAACTCGATCCAGCCCATGAATTCGGTCGTCCAGCAGATTGGCAAGCTCGAACCCTTCTCCGAGCTATTGTCTGCCAGGTACTCCTATTACGACGAAGTCGTTAATCAGCAGCAAAATcaccagcagcaacagcagcatcaCGGTGCATACCACGCGAACACCGGCAAGATGGAGATAGAAAAGGGagaattaaatgttaatgcgCCGCAGGAACAGTTGACCGAGGAGGATTGCGACGAGAACTTCGGCGAGATCATCAAGAAGTCTATGGTCGAAACTGTGTCTGCTTAG
Protein Sequence: MESPSAVQLPAEAQEDSSRVEALLLSSSTSTATECNGPEEPAPDAAGIAFLDDLSQLTATSKDTACEASRLLDGEGQRELLLLEQQDMGSYASRNSSEEDISRLEASAASANPPQEPQAPSGATAEPEAASPGPSASSSPRRRPSCAAGVTDFQPHGVEVSEEKAQQLKNEVKRLSPIHVSQRERTLGEISLTSDSLLRREASGQDTASSESVKSSESASAESEARLNASGEVKSRRELVIRLSRVDGSSSSRRSSCQSPPVGASGASSAAGDEEFAAMMMAECGMMDVEQQQQQAKSSEEQQQQRLVSSPVCPFGANLVLERCNAPGYSENRVLSSCGRVTLLDPKYEETRNNSGSQMESSASIVEKLHIGDEIEFSSPVAAASAVHCRVSSPPPIFNVDVVEENELETGSDSSEVLASIAAAAAAAGVDMLSACEEDGLTQAIMTRLEQDRPEAFTEDSAESLALAAAARDEVRSDGSDSGLGSEMPGETCPSAPAHESDSETSFLDRIPDDILADKADKGANQLDGFAADVPKQPLPLNFGAPAKSSLKRRRLTEDCIEDATSSGEPDAKRLNVDEASSASGAKKKRNIQFDAVTVYYFPRAQGFTCVPSQGGSTLGMSATHTHAERFSLTEHAAEQRRLHRARLAQLRSERAAANLNAAEAASSSEDPSDDTDDEPSDSAEELDIDSYYFLQPVPTWQRRALLRAAGVRRIDAVEKDECRDIRASREHCGCGCKGYCDPESCPCSRANVKCQVDRAGFPCGCSRDGCANSSGRIEFNPVRVRTHFIHTLMRLELEKKPAHHHPQQQQQRDESEHQQESTSGASSHHQHHHAQANHHHLHQSRLAVPLSSVLDSANDCLTGGFTSLHYDSQDSARPDSLDLYTIRDDCYGSEDCLLDGGQRKMHSEFSQSFQHYGAQGPSVGFQQNPYADYQSYQSLPSTSRSPFQPQFQTNSGFSHYGSYSQDSSSNSNGCHQSHSLIQQQQQQHSNVIYDAPFAQDEVTGSQYTNLNSIQPMNSVVQQIGKLEPFSELLSARYSYYDEVVNQQQNHQQQQQHHGAYHANTGKMEIEKGELNVNAPQEQLTEEDCDENFGEIIKKSMVETVSA

Similar Transcription Factors

Sequence clustering based on sequence similarity using MMseqs2

100% Identity: iTF_00692907;
90% Identity: iTF_00692907;
80% Identity: -