Basic Information

Insect: Euplagia quadripunctaria
Gene Symbol: CSRNP3_1
Assembly: GCA_963859945.1
Location: OY982563.1:7124333-7126588[+]

Transcription Factor Domain

TF Family: CSRNP_N
Domain: CSRNP_N domain
PFAM: PF16019
TF Group: Unclassified Structure
Description: This presumed domain is found at the N-terminus of cysteine/serine-rich nuclear proteins. These proteins act as transcriptional activators [1].
Hmmscan Out: # of c-Evalue i-Evalue score bias hmm coord from hmm coord to ali coord from ali coord to env coord from env coord to acc

1 4 0.27 9.5e+03 -2.8 2.5 89 103 43 56 8 112 0.54

2 4 1.7e-103 6.2e-99 331.3 7.8 1 218 222 431 222 431 0.94

3 4 0.14 4.8e+03 -1.8 2.1 31 139 563 668 547 676 0.49

4 4 0.12 4.2e+03 -1.6 2.0 38 116 638 720 618 725 0.51

#	of	c-Evalue	i-Evalue	score	bias	hmm coord from	hmm coord to	ali coord from	ali coord to	env coord from	env coord to	acc
1	4	0.27	9.5e+03	-2.8	2.5	89	103	43	56	8	112	0.54
2	4	1.7e-103	6.2e-99	331.3	7.8	1	218	222	431	222	431	0.94
3	4	0.14	4.8e+03	-1.8	2.1	31	139	563	668	547	676	0.49
4	4	0.12	4.2e+03	-1.6	2.0	38	116	638	720	618	725	0.51

Sequence Information

Coding Sequence: ATGGGGGACGCAAACTTGGAAATGGGCCTGCAGCCGAAAGAACAGCTTGATCCAGATTTAAATGAGCGTGATAAAGATGCGGCTGCAGAACAAGAGGAAGACGATGGTTTTCTTGTGATAAAAGATGAAAAAAGTAGTGACAGTGACACTCACAGTGACGATCTTAGTTCTAATGATGAACAAAGTAATGCAATCGTTAGTGGTAACTCTCAGTTTTATGAGAGCAGTGATAGTAAACTAGACTATGCTTTAAAAATGGATGACAATGACACGCTTAGTGATATTGACGATATCAAAACGGACAGTGCTTCAGCTGATAGTGAAGATTCTGCTCTTGGCAGTCTGCCGCCGGATAGTGCTCTTAATGATAGGGAAGAAGAAGCTCAAGAGAGGTCAGAAGGAAGTGATTCAGGCCTTGGATCAGAATCTATTGATGACTTAAAAATGCCTAGCTTTAACATTGCACTGCCATGCACAAGTAGTCTAAAAAATGCCAACTCATCAGAAATACCAGAGCACAACAACCCTAATTCTAGCAGTAGCAATAGTAATGCAAACAGTGTAGATAAAGGCCATATTCCTGTAGCACAAGATAAGGTACCAACTAAAAGTAATCTTAAGAGAAAATGGAGTGAAGACAACAAAACTGAACCACCGCCTAAGAAACGGAAAGAGAGCATTCGATTCGATAATGTAACTGTGTTTTACTTTCCACGAGCTCAGGGTTTTTCATGCGTACCATCACAAGGAGGTTCAACACTAGGAATGGAATGGAAGCATTCTCATATACAGAATTTTACCTTAGCTGAGCATGCTTTAGAACAGAGGAGACTACATAGACAAATACTGCAACAACTGAAGAGTGAGCGCCATACTTTACAAGGTGCATCGTTATCCTCTAGTGAGGACAGTGACACGGAAGAAGAGGCGAGTGATATTTCTGAATCAGAGTTAGATTTAGATAGCTACTTTTTTCTACAACCCGTTTCAACCAAACAAAGGCGAGCGCTATTACGAGCTGCAGGTGTAAGGAAAATAGAGGGTTATGAAAAAGATGAATGTAGAGATATAAGAACCTCTCGTGAATTTTGTGGTTGCGCCTGTAAAGGAACCTGCAACCCAGAAACTTGTTCTTGCAGTTTGGCTGGTATAAAATGTCAAGTCGACAGATTAAATTTTCCTTGTGGATGTACTAGAGATGGATGCGCCAACACAACTGGCCGGATAGAATTTAATCCTGTAAGAGTAAGGACGCATTTCATACAGACCCTTATGAGATTAGGCcttgaaaagaaaaatgaagaACACCAAGAAGCTCTCAGGAGACAGTGGCTAGAGGTCCATAATAGTAACTCTGCATCGTGTTCCTCTAACTCGTCATATGAGAGAGAACGCTGTCTTAGTCACGAAGATGGAATGTTGCGTGATGTAAGTCTAACTCCTAGAGTGGAAGTCGAATCTTGCGTCAACACAGGCAGTTTTAACAACGTTCATTGTGATATGAATAATTCGTTAACACAAAGTAGCATGCCAGATGATATGTCATATGGTTTTAGACATGAATCCTCCAACCTCAGCAATTTTGGTAACACCATGCACtatgaaaatacaaataatcatcaCAATCACATCGGCGCTTACACATCGAACATAATACAAGGTAAAGGCCCGCCGTACTCAGCGGCAAACACCATGGGCTTTGATGCTATTACTAATAATATGCAAAGATTTCAGTGTGATCTGAACTACACTTATGAACAGCAAACTGAAAATCATCATTTCAAAGGTTTACAAACCTTTTCCGCGACCAGTTTTGAGGAGTTTGCACACAATTCCCAGATGTCTATGTTTAGTCACTACGGCCATATGTACGTACCAGACTATTTGCATAAATCGAATGCGAACATGCACGATCACAATGCCCTGCAGTACCATAGTGCACAACAGAACCACTACGAAATGTACAAAAACAGTTCGGAGTgtgtaaataatgaaaacaaaactaataCTCATTACACCACTTTAATGACTTTGCCATATCAGCCTAATAATAAGATACAAACTGTAGATAATGACGAGAATTGGTTCAGTCACAACACGCTACTTAACTTGGATCACTCTGACCGGACAACCCAAGATGCTTCAGACTTACAACCTCATTCCGCAGGCACGACAACAGAAAGCAATAACGCCGAGACTACTGAAAATTTCGGTGAACTAATTAAGAAAACTATGGTAGAATCTGTTACTGTGTAG
Protein Sequence: MGDANLEMGLQPKEQLDPDLNERDKDAAAEQEEDDGFLVIKDEKSSDSDTHSDDLSSNDEQSNAIVSGNSQFYESSDSKLDYALKMDDNDTLSDIDDIKTDSASADSEDSALGSLPPDSALNDREEEAQERSEGSDSGLGSESIDDLKMPSFNIALPCTSSLKNANSSEIPEHNNPNSSSSNSNANSVDKGHIPVAQDKVPTKSNLKRKWSEDNKTEPPPKKRKESIRFDNVTVFYFPRAQGFSCVPSQGGSTLGMEWKHSHIQNFTLAEHALEQRRLHRQILQQLKSERHTLQGASLSSSEDSDTEEEASDISESELDLDSYFFLQPVSTKQRRALLRAAGVRKIEGYEKDECRDIRTSREFCGCACKGTCNPETCSCSLAGIKCQVDRLNFPCGCTRDGCANTTGRIEFNPVRVRTHFIQTLMRLGLEKKNEEHQEALRRQWLEVHNSNSASCSSNSSYERERCLSHEDGMLRDVSLTPRVEVESCVNTGSFNNVHCDMNNSLTQSSMPDDMSYGFRHESSNLSNFGNTMHYENTNNHHNHIGAYTSNIIQGKGPPYSAANTMGFDAITNNMQRFQCDLNYTYEQQTENHHFKGLQTFSATSFEEFAHNSQMSMFSHYGHMYVPDYLHKSNANMHDHNALQYHSAQQNHYEMYKNSSECVNNENKTNTHYTTLMTLPYQPNNKIQTVDNDENWFSHNTLLNLDHSDRTTQDASDLQPHSAGTTTESNNAETTENFGELIKKTMVESVTV

Similar Transcription Factors

Sequence clustering based on sequence similarity using MMseqs2

100% Identity: iTF_00040832;
90% Identity: iTF_01502101;
80% Identity: -