Basic Information

Insect: Dioctria linearis
Gene Symbol: CSRNP3_1
Assembly: GCA_963930735.1
Location: OZ005744.1:201753031-201760940[-]

Transcription Factor Domain

TF Family: CSRNP_N
Domain: CSRNP_N domain
PFAM: PF16019
TF Group: Unclassified Structure
Description: This presumed domain is found at the N-terminus of cysteine/serine-rich nuclear proteins. These proteins act as transcriptional activators [1].
Hmmscan Out: # of c-Evalue i-Evalue score bias hmm coord from hmm coord to ali coord from ali coord to env coord from env coord to acc

1 4 0.46 5.4e+04 -3.5 0.8 81 109 192 219 158 225 0.58

2 4 1.9e-97 2.2e-92 311.6 11.5 2 218 297 497 296 497 0.92

3 4 0.13 1.6e+04 -1.8 1.3 85 134 868 913 824 960 0.47

4 4 0.21 2.4e+04 -2.4 0.2 38 77 1000 1041 984 1097 0.54

#	of	c-Evalue	i-Evalue	score	bias	hmm coord from	hmm coord to	ali coord from	ali coord to	env coord from	env coord to	acc
1	4	0.46	5.4e+04	-3.5	0.8	81	109	192	219	158	225	0.58
2	4	1.9e-97	2.2e-92	311.6	11.5	2	218	297	497	296	497	0.92
3	4	0.13	1.6e+04	-1.8	1.3	85	134	868	913	824	960	0.47
4	4	0.21	2.4e+04	-2.4	0.2	38	77	1000	1041	984	1097	0.54

Sequence Information

Coding Sequence: ATGCTTCAACCAATTAAGAATTTCCTAACATATTTCCAGAAGAGCACGAATAATACGTCATTATTGGGTGTAACAACAAATATGAATGAAAATACTAATCGAGTGGTTGGCGACCATCATCATACTGAAAATCCATCTTATGGTAGCCAAAACAAAAATCCATCAGAAAATTTGTGCTCTTCTTCTCCTATAAAATCCCACGATCAAAATGAGAATGAGGTGATAGTAATTACGGAGGAATCTTCACCACCCGAAAGAAATGATGAGAGAAACGACAATTTTCTGAATGAAAGTAAAGAAATTACTCACAATATAACTATCGAGTGCTTATCAGATACAGAGGCGGAAATGAGTAATGATGGATTCACTGTTGACGAAATCATACTGGATGAAAATGATGCACATAACTCATCATTAACTGATCCAGGTACAGATCCATTAGCCATTGAAGATTATCATGCTGATGTCAGTAATAATAAATCATTGATGATAAATTCTGagcgaaatcctataaatttggatACTTCTACTGATGAAGGTGAAACGATTTTAATTATtgatgttgaagaaataaaagatAGTGAAAATCTTACAGATGAAGCTAATAGTAAAAATGATACTATTAATAGTGACGCTGATAGAGATGAGcatcgagaggaactttttgaaACTCCAAGATTAATTTTGGATGATATTGGTGAAGAACAAGAAATTCGTAGTGATGGTTCAGATTCTGGTCTTGGATCTGAAACATCTGCTCTGCAGACAACTACCAATAGTGTCGATACAAGTGTTGTTTCTATAGATTCTACTGTTACAAACCTTGGACCAGCACGTAGTAATCTCAAACGTCAGTCAAATGAAATAACCATTGTGccagaaaagaaattaaaacgtTCGATTCACTTTGATAGTGTGAAAGTTTATTATTTTCCACGAATACAAGGTTTCGCTTGTGTTCCATCACAAGGTGGATGTACTTTAGGAATGGGATCTAGACATACTCATTGCAGAAATTTTACATTAGCTGAACATGCAGCCGAACAACGGAGAGTACATAAACAGCAAATGCAAGAAATAAATCCTAGAGGTTCGTCTAGTGAAGAAACTGATAGTGATGAAGAATTAAGTGAAGCGAGCGGATCAGATTTAGATGCAGATGCAAATGGTTTCCTTCAACCAGTACCAGCTAGACAAAGGAGAGCAATTTTAAAAGCAGCAGGAATCAGAAAAATTGATTCTACAGAGAAAGATGAATGTCGTACCATTCGTAGTTCTCGGGAATTTTGCGGATGTAGCTGTAGGGGATATTGTGATCCTGAAACATGTTCTTGCAGTCAAGCTGGAATTAAATGTCAGgtTGATCGTCCAAGTTTTCCATGCGGTTGTACACGAGATGGTTGTGCTAATGTTGTTGGACGAATTGAATTCAATCCGAATAGAGTACGAACGCATTTTATTCATACAATTATGCGTTTGgaattagaaaataaagaaaagaccTCATTAGAGCTAAATTCCGAATCAAATCATTTGCTGTCCTATGGAAATAGTTGCGCATCCTCCAACATTAGTAATATGTCAGTTACTGGTGCCGCTAATGCTACCACTAATAATTTAAGTAATATATGCAATTATAGCTTAAGTAATATTAGTATGATACGATCCCAGCACTATGGTCATATTCCAATGCAACAACATAATCAGAACTATTTGGCTAGTAACGCTCATAGCAGCAATAATAGCAACATGTACACGAATGTCCTACAAAATGGTGTGATTTCTGAACATTGTACACTTCCACATATGTCGTCAGCACAGCATCATCATCAACCACAACAACAAATTATCAATTCTGGAACTGGATGTATCAATATGTTGAATAGTAGTGCTAATATTACTGCTGATGGAGAAACAAGTGTTTGCCAAACTCAACAGATGGACATTAGTTATGGTTCATTTAGAGATATTGGCACGACAGATACTTCTGCAGTATGCTCCTCTTCTCGAAATGAAAATCCTAGTGGTGGTGCAAATATGCTTCTAGATTATTCATCAGAAAATTATCATCATGGTACATATGGTAATCAATCGTATTTGAATCATTCTTATCATAATTCTGTGCTGAATTCAGACAGTAGCTACAGCTCAGTTGTTCCAACATATTCAAATTATCAACAGCACTATATTGCATATGCTTCGTCTAgctgtaataataataacaatgaaaGTATGGAAATACATGATTTAACAACAGATGACGAATCGAATAGTTATATTAATTTACATCCACCAACAGGGAACACTACCCGATTGGATGCTATTAATGATCTTCTACACAGTAATCGTAATACACTTCCAGCGGCTCCATCGATATCAGATACAACACCCTTAATAGATTCTGTTGCCATTAAATCACCTTCTACAAATGTCGTTACTACACCAATTATGTGCACATTAGCGCCATCTGCCCAGACATCAACATCGATAACAGATGGCACATCAACAACAGTTTCACCTCAAAAAAATAAGACAGTTAGTCAATTAAATACATCGTCGAATGTTGAAAATTTTGTAGATTTAACAGATGATGGTACTACAAGTTCACACAAATCGTACACTACTACTGTACTTTTTGTACAAAATTCCAAAGAAGAATCACTACAGGATTCATCATCACAATTAGATAATATGATGATTGTAAGGAAGCGAAGGGATAGTGACGTTGAAATTATAGAATCTACAGAAAATACATCGAATATTCAAAAATCAGTTTTAGAATATTCCACAAGCattttatcacctaaatcgcCTGAAAAAAATATAGACAGAAATGCTGATAAAGAAATCGAAACAATTTTAACATCCTGCGAGAATTATGAACTGCTAACAGATACATCAAAGTATAACGAAGAAATTGCCTTTTTCGATTGTCATAAAGAGGAATGCTTTTCTGGTGAAGTCTCTGTGTCCCTTGAAGATGTTGATGGTTCAAAGAAACATCAGAACTTAAAAGATATAGATTTAGTTGAAGATAGTAATTATAAATGCAATTCTGAAATATCTGTAGAAAATACAAGAGAATTGCATAAACAAAGAACGCTTCGAACATTAGAAGAAATCGATGATGTTGAACTTGTTGGAATTACTGTGAACAACACTGCCTTAGCGAATAGTATTGAAATTATTGATGTTGAGTCTATACAAAATACTGGTGAACATCTCGATTCAAAAGTTTCATCTATTGTTGAATTATCGCCATCGAAGACGACGACGAGGACGACAACAGCAACATCCACCACCATTACTACATCGACGTCTATTTCAAGTAAAACTACCGAATTTGGTAAGCCTCCTCACGAAAGTGATGAAAATTTAACTGAAATCATTAACAAAAGTATTGTAAAAATAGTTTCCGTATAG
Protein Sequence: MLQPIKNFLTYFQKSTNNTSLLGVTTNMNENTNRVVGDHHHTENPSYGSQNKNPSENLCSSSPIKSHDQNENEVIVITEESSPPERNDERNDNFLNESKEITHNITIECLSDTEAEMSNDGFTVDEIILDENDAHNSSLTDPGTDPLAIEDYHADVSNNKSLMINSERNPINLDTSTDEGETILIIDVEEIKDSENLTDEANSKNDTINSDADRDEHREELFETPRLILDDIGEEQEIRSDGSDSGLGSETSALQTTTNSVDTSVVSIDSTVTNLGPARSNLKRQSNEITIVPEKKLKRSIHFDSVKVYYFPRIQGFACVPSQGGCTLGMGSRHTHCRNFTLAEHAAEQRRVHKQQMQEINPRGSSSEETDSDEELSEASGSDLDADANGFLQPVPARQRRAILKAAGIRKIDSTEKDECRTIRSSREFCGCSCRGYCDPETCSCSQAGIKCQVDRPSFPCGCTRDGCANVVGRIEFNPNRVRTHFIHTIMRLELENKEKTSLELNSESNHLLSYGNSCASSNISNMSVTGAANATTNNLSNICNYSLSNISMIRSQHYGHIPMQQHNQNYLASNAHSSNNSNMYTNVLQNGVISEHCTLPHMSSAQHHHQPQQQIINSGTGCINMLNSSANITADGETSVCQTQQMDISYGSFRDIGTTDTSAVCSSSRNENPSGGANMLLDYSSENYHHGTYGNQSYLNHSYHNSVLNSDSSYSSVVPTYSNYQQHYIAYASSSCNNNNNESMEIHDLTTDDESNSYINLHPPTGNTTRLDAINDLLHSNRNTLPAAPSISDTTPLIDSVAIKSPSTNVVTTPIMCTLAPSAQTSTSITDGTSTTVSPQKNKTVSQLNTSSNVENFVDLTDDGTTSSHKSYTTTVLFVQNSKEESLQDSSSQLDNMMIVRKRRDSDVEIIESTENTSNIQKSVLEYSTSILSPKSPEKNIDRNADKEIETILTSCENYELLTDTSKYNEEIAFFDCHKEECFSGEVSVSLEDVDGSKKHQNLKDIDLVEDSNYKCNSEISVENTRELHKQRTLRTLEEIDDVELVGITVNNTALANSIEIIDVESIQNTGEHLDSKVSSIVELSPSKTTTRTTTATSTTITTSTSISSKTTEFGKPPHESDENLTEIINKSIVKIVSV

Similar Transcription Factors

Sequence clustering based on sequence similarity using MMseqs2

100% Identity: iTF_00454806;
90% Identity: iTF_00454806;
80% Identity: -