Basic Information

Insect: Sycophila quercilanae
Gene Symbol: CSRNP3_1
Assembly: GCA_035582995.1
Location: JAWWEP010000039.1:2574904-2585943[+]

Transcription Factor Domain

TF Family: CSRNP_N
Domain: CSRNP_N domain
PFAM: PF16019
TF Group: Unclassified Structure
Description: This presumed domain is found at the N-terminus of cysteine/serine-rich nuclear proteins. These proteins act as transcriptional activators [1].
Hmmscan Out: # of c-Evalue i-Evalue score bias hmm coord from hmm coord to ali coord from ali coord to env coord from env coord to acc

1 4 1.9e-101 5.8e-97 324.6 7.3 1 218 509 719 509 719 0.91

2 4 0.035 1.1e+03 0.1 5.4 49 81 727 760 721 772 0.45

3 4 0.006 1.8e+02 2.6 3.7 66 117 897 949 845 959 0.48

4 4 0.15 4.5e+03 -1.9 0.2 51 98 975 1022 966 1033 0.74

#	of	c-Evalue	i-Evalue	score	bias	hmm coord from	hmm coord to	ali coord from	ali coord to	env coord from	env coord to	acc
1	4	1.9e-101	5.8e-97	324.6	7.3	1	218	509	719	509	719	0.91
2	4	0.035	1.1e+03	0.1	5.4	49	81	727	760	721	772	0.45
3	4	0.006	1.8e+02	2.6	3.7	66	117	897	949	845	959	0.48
4	4	0.15	4.5e+03	-1.9	0.2	51	98	975	1022	966	1033	0.74

Sequence Information

Coding Sequence: ATGGAACCGCCTTCGGCTGCCGACCATCTGCTCGCCGAGGCCCGGGACAATTCGAACACAGTGGAGACCATGCTCCGGGAGTCGGAGGTCATCCAGCCAGTGCAGGACGGCTTCGCCTTTCTCGATGACCTGGGCCCGATAACGGCAAGCGACTCGTCGTCATCGTCATCGCTCCTCGACGTCGAGCGACTCGACGACAACGGCTCCCATCTGCTCAACATGGGCAGCTTTGCCAGCAAGAGTACCTCCGATGATGATGTTAGGTTAGACCCTTCCGCAAGTGCTAAAGAATCCGAGGAATCGACGGCGGTGCCATCGACGAGCGGCGCAGCGAGCCCGCCGTCACCCACGCCTGCGTCGCGCCGCAGATCGTCGGCCCTCTCCGGCGGCAGTGCCGCCTCCGACTTCCAGCCCATAGGCATCGAGGTGTCCGAGGAAAAGGCCCAGCAGCTGAAAAACGACGTGCGCCGGCTGTCCCCGGTGCACGTGAGCCCCTGCGAGCGAACCCTCGGCGAGATCTCGCTGACGTTCGAGGCCGCGCCGGCGGAGTCTCACCGCAGCGAACCCAACACAGACTATAGTGACGCGAGTGCCGCGAAAAGTGCCGAAGAAGACTCGGGGTCGAGCAGGGTGCACCGCGAGCTCGTGATACGATTGTCGCGCGTCGACGGGGTCGCCTCCCCCAAACCCACGGACGACGCCGAAAGTTGCCCGATGGagcagccgcagcagcagcagcagccggaGGCGGACAAGTCTTCCGAGAGCCTCGGCGCCGGCTCCCCCTGCCCCTTCGGCACCAACCTCGTACTGGAGCGCTGCAACGCGCCCGGCTACGCGGAGAACCGCGTGCTCTCGAGCTGCGGCCGCGTCACCCTCCTCGACAAGTTCGACGCGGCCTCCGAGCTGCAGATCGGCCCGCGCGGCCAGCTGGTGGGCAGCAGCCCCAAGGCCCTCGTCGAGAAGCTGCACATCGGCGACGAGATCGAATTCTCCAGTCCCGGCagaacgacgacgacgacctTCGCCGAGGAGCTCGAGGCGGGCTGCGATGGCGCCGAGGTACTGGCCTCGATGGCAGCCGCGGCGATCGGCGACGGCGGTCTCTCGCAGGTCGTACTAACGAGGCTCGAGCAGGACAGGCCCGTGCCCTTCACCGACGACTCCGCCGAGAGCTTGGCTCTGGCGGCGGGCGCGCCCGACGAGGTCAGGTCGGACGGCAGCGACTCGGGCCTGGGCAACGAGATGCCCGGCGACCCCACTTGCCCCGCCCCCGCACCCGAAAGCGACTCCGAGACCTCCTTCCTCGACAGGATACCCGACGATATTCTTTCCGATAAGGAGAaatTGGTGAATCCCTTGGAAGACTACGTAACGGACGAGCCGAAGGCGCTGGCGATGCCGCCCCTGGGACCCCCGGCGAAGAGCAACCTGAAGCGCCGGCTGACGGATTGCATGGAGGACGAGCAGCCTGGCATCAAGAGGCTGAACGTCGATCAGGGCGCGGCGCCGGAATCGCCGGGCAAGGAGAAGCGCAAGATTCACTTCGACGCCGTCACGGTCTACTACTTTCCCAGGGCCCAAGGCTTCACCTGCGTACCTTCACAGGGCGGCAGCACGCTGGGCATGGCAGCGGCGCACACGCACGCGGAGCGCTTCTCGCTGTCGGAGCACGCGGCGGAGCAGCGGCGGGCCCATCGAGCCCGCCTGGCCCAGCTGCGCTCGGAGCGCGCGGCCAACAGCTCGGCCGAGGCGGCCTCGAGCTCGGAGGACCCCTCCGACGACACGGACGAGGAGCCGAGCGACACCGAGGAGGTCGACATCGACAGCTACTACTTCCTGCAGCCGGTGCCCACCTGGCAGAGGCGGGCCCTGCTCAGGGCCGCGGGCGTGCGCAGGATAGACGCCGTGGAGAAGGACGAGTGCCGGGACATCAGGGCCAGCAGAGAGCATTGCGGTTGCGCCTGCAAGGGCTACTGCGACCCCGAGAGCTGTCCCTGCAGCCGGGCTAACGTCAAGTGTCAGGTCGACCGCCAAGGCTTCCCGTGCGGCTGTTCTCGGGACGGTTGCGCCAACAGTTCCGGCCGCATCGAGTTCAATCCCGTCCGCGTGCGCACGCATTTCATCCACACGCTAATGCGCCTCGAGCTCGAGAAGAAGCCGCACCGCGAGGAGGAGCAGCACCACCAGGAGAGCCACCACCATCATCATCAGCAACAGCAGcatcagcagcaacagcagcaacagcagcaacagagCCGACTGGGTCTGTCGCTGTCCTCGGTCGTCGAGCAGTCGTCGGGCGGCGACTGCCTCGGCGGCGGCTTCACCGGCCTCCACTACGACAGCCCTGACGGGACGCGCGCCGATAGCCTCGATCTCTACGCGATGAGGGACGACTGCTATCCGGGCGACGACTGCCTCGGCGACCCCAGTCAGGGCCAACAGCAGCGCAAGCTTCACAACGAGTTCGGCCAGAGCTTTCAGCACTACGGCAATCCCGGGCCCAGCATCTCCTTTCAACAGAACCCCTACGCTGACTATCAGAGCTATCAGAATCTGCCCTCAACCTCGAGGTCGCCCTTTCAGCCGCAATTTCAGTCGGTTGGGTCAAATCAGGGCTTCTCTCACTACGGCTCGTACTCGCAGGAGTCAGACTCCGCCCCAAACAACGACTGTCAGCAGGGTCACTCGCTCAtccagcaacagcaacaacaacagcagcaacagcagcagcagcagcaacaacagcagcaccAACAGCACAGCATATACGAAGCACCATTCGCACAGGATGAAGTAACGGGCTCCCAATACACGAATCTGAATTCGATTCAACCCATGAGCTCCGTCGTCCAGCAGATAGGCAAACTCGAGCCCTTCTCCGAGCTGCTCTCCGCTCGGTATTCTTACTACGGCGACATGGTCGAGCAGCAACAGACCCACCACCAGTCGGAGCAACCGCACCACGGCGCCTACCACGAGAACGGCGTCAAGCTCGACATGGGGAAGGACGGGCTGAACGTCAACGAGCAGCAAGAGCAGCTGACCGAGGGGGACTGCGACGAGAATTTCGGCgagatcattaaaaaatccatggTCGAGACTGTGTCCGCTTAA
Protein Sequence: MEPPSAADHLLAEARDNSNTVETMLRESEVIQPVQDGFAFLDDLGPITASDSSSSSSLLDVERLDDNGSHLLNMGSFASKSTSDDDVRLDPSASAKESEESTAVPSTSGAASPPSPTPASRRRSSALSGGSAASDFQPIGIEVSEEKAQQLKNDVRRLSPVHVSPCERTLGEISLTFEAAPAESHRSEPNTDYSDASAAKSAEEDSGSSRVHRELVIRLSRVDGVASPKPTDDAESCPMEQPQQQQQPEADKSSESLGAGSPCPFGTNLVLERCNAPGYAENRVLSSCGRVTLLDKFDAASELQIGPRGQLVGSSPKALVEKLHIGDEIEFSSPGRTTTTTFAEELEAGCDGAEVLASMAAAAIGDGGLSQVVLTRLEQDRPVPFTDDSAESLALAAGAPDEVRSDGSDSGLGNEMPGDPTCPAPAPESDSETSFLDRIPDDILSDKEKLVNPLEDYVTDEPKALAMPPLGPPAKSNLKRRLTDCMEDEQPGIKRLNVDQGAAPESPGKEKRKIHFDAVTVYYFPRAQGFTCVPSQGGSTLGMAAAHTHAERFSLSEHAAEQRRAHRARLAQLRSERAANSSAEAASSSEDPSDDTDEEPSDTEEVDIDSYYFLQPVPTWQRRALLRAAGVRRIDAVEKDECRDIRASREHCGCACKGYCDPESCPCSRANVKCQVDRQGFPCGCSRDGCANSSGRIEFNPVRVRTHFIHTLMRLELEKKPHREEEQHHQESHHHHHQQQQHQQQQQQQQQQSRLGLSLSSVVEQSSGGDCLGGGFTGLHYDSPDGTRADSLDLYAMRDDCYPGDDCLGDPSQGQQQRKLHNEFGQSFQHYGNPGPSISFQQNPYADYQSYQNLPSTSRSPFQPQFQSVGSNQGFSHYGSYSQESDSAPNNDCQQGHSLIQQQQQQQQQQQQQQQQQQHQQHSIYEAPFAQDEVTGSQYTNLNSIQPMSSVVQQIGKLEPFSELLSARYSYYGDMVEQQQTHHQSEQPHHGAYHENGVKLDMGKDGLNVNEQQEQLTEGDCDENFGEIIKKSMVETVSA

Similar Transcription Factors

Sequence clustering based on sequence similarity using MMseqs2

100% Identity: iTF_00714374;
90% Identity: iTF_01381325;
80% Identity: -