Basic Information

Insect: Dioctria rufipes
Gene Symbol: CSRNP3_1
Assembly: GCA_963924295.1
Location: OZ002744.1:8889144-8896112[+]

Transcription Factor Domain

TF Family: CSRNP_N
Domain: CSRNP_N domain
PFAM: PF16019
TF Group: Unclassified Structure
Description: This presumed domain is found at the N-terminus of cysteine/serine-rich nuclear proteins. These proteins act as transcriptional activators [1].
Hmmscan Out: # of c-Evalue i-Evalue score bias hmm coord from hmm coord to ali coord from ali coord to env coord from env coord to acc

1 3 0.39 4.5e+04 -3.3 1.3 79 109 190 219 148 226 0.54

2 3 3.5e-97 4e-92 310.7 10.7 2 218 297 497 296 497 0.92

3 3 0.27 3.1e+04 -2.8 0.8 92 137 898 915 833 963 0.52

#	of	c-Evalue	i-Evalue	score	bias	hmm coord from	hmm coord to	ali coord from	ali coord to	env coord from	env coord to	acc
1	3	0.39	4.5e+04	-3.3	1.3	79	109	190	219	148	226	0.54
2	3	3.5e-97	4e-92	310.7	10.7	2	218	297	497	296	497	0.92
3	3	0.27	3.1e+04	-2.8	0.8	92	137	898	915	833	963	0.52

Sequence Information

Coding Sequence: ATGCTTCAACCAATTAAGAATTTCCTAACATATTTCCAGAAGAGCACAAATAATACAACATTATTGGGTGTAACTACAAATATGAGTGAAAATACCAATCGAGTGGTTGGCGACCATCATCATACGGAAAATCCATCTTATGGTAACCAAAACAAAAACCCATCAGAAAATTTGTGCTCTCCTTCTCCTATAAAATCCCACGATCAAAATGAGaatgaggtgatagtacttacggAGGAATCTTCACCACCCGAAAGAAATGATGAGAGAATTGACAATTTTCTGAATGAAAGTAAAGAAATTACTCACAATATAACTATCGAGTGCCTATCAGATACAGAGGCAGAAATGAGTAATGATGGATTCACTGTTGACGAAATCATACTGGATGAAAATGATGCACATAACTCATCATTAACGGATCCAGGTACAGATCCACTAGCCATTGAAGATTATCATGCTGACGTCAGTAATAATAAATCATTGATGATAAATTCTGAGCAAAATCCTATAAATTTGGATACTTCTACTGATGAAGCTGAAACGATTTTAATAATTGATGTTGAGGAAATAAAAGATAGTGAAAATCTTACAGATGAAGCTAACAGTAAAAATGATACTATTAATAGTGACGCTGATAGAGATGAACATCGAGAGGAACTTTTTGAAACTCCAAGATTACCCTTGGATGATATTGGTGAAGAACAAGAAATTCGTAGTGATGGTTCAGATTCTGGTCTTGGATCTGAAACATCTGCTCTGCAGACGACTACCAATAGTGTTGATACAAGTGTTGTTTCTATAGATTCTACTGTTACAAACCTTGGACCAGCACGTAGTAATCTCAAACGTCAATCAAATGAAATAACCATTGTGccagaaaagaaattaaaacgtgCGATTCACTTTGATGGTGTGAAAGTTTATTATTTTCCACGAATACAAGGTTTCGCTTGTGTTCCATCACAAGGTGGATGTACTTTAGGAATGGGATCTAGACATACTCATTGCAGAAATTTTACATTGGCTGAACATGCAGCCGAACAACGGAGAGTACATAAACAGCAAATGCAAGAAATCAATCCTAGAGGTTCGTCTAGTGAAGAAACTGATAGTGATGAAGAATTAAGTGAAGCGAGCGGATCAGATTTAGATGCAGATGCAAATGGTTTCCTTCAACCAGTACCAGCTAGACAAAGAAGAGCGATTTTAAAAGCAGCAGGAATCAGAAAAATTGATTCTACAGAGAAAGATGAATGTCGTGCCATTCGTAGTTCTCGGGAATTTTGCGGATGTAGCTGTAGGGGATATTGTGATCCTGAAACATGTTCTTGTAGTCAAGCTGGAATTAAATGTCAgGTTGATCGTCCAAGTTTTCCATGCGGATGTACACGAGATGGTTGTGCTAATGTTGTTGGACGAATTGAATTCAATCCGAATAGAGTGCGAACGCATTTTATTCATACAATAATGCGTTTGgaattagaaaataaagaaaagaccTCATTAGAGCTAAATTCCGAATCAAATCATTTGCTGTCCTATGGAAATAGTTGCGCATCCTCCAACAATAGTAATATGTCAGTTACTGCTGCTGCAAATGCTACCACTAATAATTTAAGTAATATATGCAATTATAGCTTAAGTAATATTAGTATGATACGATCCCAGCACTATGGTCATATTCCAATGCAACAACATAATCAGAACTATTTGGCTAGTAACGCTCATAGCAGCAATAATAGCAACATGTACACGAATGTCCTACAAAATGGTGTGATTTCTGAACATTGTACACTTCCACATATGTCATCGCAGCTTCATcatcaacagcaacaacaaattaTCAATTCTGGAACTGGATGTATCAATATGTTGAATAGTAGTGCTAATATTACTGCTGATGGAGCAACAAGTGTTTGCCAAACTCAACAGATGGACATTAGTTATAGTTCATTTCGAGATATTAGCACAACAGATACCTCGGCTGTATGCTCCTCTTCTCGAGAAAATCCTAGTGGTGGTGCAAATATGCTCTTAGATTATTCATCAGAAAATTATCATCATGGTACATATGGTAATCAATCGTATTTGAATCATTCTTATCATAATTCTGTGCTGAATTCAGGCAGTAGCTACAGCTCAGTTCCAACATATTCAAATTATCAACAGCACTATATTGCATATGCTTCGTctagctgtaataataataataataacaatgaaaATATGGAAATACATGATTTAACAACAGATGATGAATCGAATAGTTATATTAATTTACATCCACCAACAGGGAACACTACCCGATTGGATGCTATTAATGATCTTCTACAAAGTAATCGTAATACACTTCCAGCAGCTCCATCGATATCAGATACAGCACCCTTAATAGATTCTGTTGCCATTAAATCATCTTCTACAAATGTCGTTACTACACCAATTATGTGCACATTAGCGCCATCTGCCCAGACATCAACATCAATAACAGATGGCACATCAACAACAGTTTCACCTCAAAAAAATAAGACAGTTAGTCAATTAAATACATCGTCGAATGTTGAAAATTTTGTAGATTTAACAGATGATGGTACTACAAGTCCACACAAGTCGTACACTACTACTGTACTTTTTGTACAAAATTCCAAAGAAGAATCACTACAGGATTCATCATCACAATTGGATAATAAGATGATTGTAAGGAGGCGAAGGGATAGTGACGTTGAAATTATAGAATCTACAGAAAATAAATCGAATATTCAAAAATCAGTTTTAGAATATTCCACAAGCattttatcacctaaatcgcCTGAAAAAAATATAGACGGAAATGCTAATAAAGAAATGGAAACAATTTTAACATCCTGCGATAATTATGAACAGCTAACAGATACATTAGAGCAAAACgatgaaattgtttttttcgaTTGTCATAAAGAGGAATGCATTTCTGATGAAGTTTCTGAAGATGTTGATGGTCCAAAGAAACATCAGAACTTAAAAGATATAGATTTAATTGAAGATAGTAATTATAAATGCAATTCTGAAATATCTGTAgaaaatacaatacaattgcATAAAATAAAAACGCTTCGAACAATAGAAGAAATCGATGATGTTGAACTTGTTGGTATTACTGTGAACAACACTGCCTTAGCGAATAGTATTGAAATTATTGATGTTGAGTCTTTACAAAATACTGGTGAACATCTCGATTCAAATGTTTCATCTGTTGTTGAATTATCGCCATCGAAGACGAATACAACAGACACATCCACCACCATTACTACATCGACgtcaatttcaaataaaattaccGAATTCGGTAAGACTCCTCACGAAAGTGATGAAAATTTAACTGAAATCATTAACAAAAGTATTGTAGAAATAGTTTCCGTGTAG
Protein Sequence: MLQPIKNFLTYFQKSTNNTTLLGVTTNMSENTNRVVGDHHHTENPSYGNQNKNPSENLCSPSPIKSHDQNENEVIVLTEESSPPERNDERIDNFLNESKEITHNITIECLSDTEAEMSNDGFTVDEIILDENDAHNSSLTDPGTDPLAIEDYHADVSNNKSLMINSEQNPINLDTSTDEAETILIIDVEEIKDSENLTDEANSKNDTINSDADRDEHREELFETPRLPLDDIGEEQEIRSDGSDSGLGSETSALQTTTNSVDTSVVSIDSTVTNLGPARSNLKRQSNEITIVPEKKLKRAIHFDGVKVYYFPRIQGFACVPSQGGCTLGMGSRHTHCRNFTLAEHAAEQRRVHKQQMQEINPRGSSSEETDSDEELSEASGSDLDADANGFLQPVPARQRRAILKAAGIRKIDSTEKDECRAIRSSREFCGCSCRGYCDPETCSCSQAGIKCQVDRPSFPCGCTRDGCANVVGRIEFNPNRVRTHFIHTIMRLELENKEKTSLELNSESNHLLSYGNSCASSNNSNMSVTAAANATTNNLSNICNYSLSNISMIRSQHYGHIPMQQHNQNYLASNAHSSNNSNMYTNVLQNGVISEHCTLPHMSSQLHHQQQQQIINSGTGCINMLNSSANITADGATSVCQTQQMDISYSSFRDISTTDTSAVCSSSRENPSGGANMLLDYSSENYHHGTYGNQSYLNHSYHNSVLNSGSSYSSVPTYSNYQQHYIAYASSSCNNNNNNNENMEIHDLTTDDESNSYINLHPPTGNTTRLDAINDLLQSNRNTLPAAPSISDTAPLIDSVAIKSSSTNVVTTPIMCTLAPSAQTSTSITDGTSTTVSPQKNKTVSQLNTSSNVENFVDLTDDGTTSPHKSYTTTVLFVQNSKEESLQDSSSQLDNKMIVRRRRDSDVEIIESTENKSNIQKSVLEYSTSILSPKSPEKNIDGNANKEMETILTSCDNYEQLTDTLEQNDEIVFFDCHKEECISDEVSEDVDGPKKHQNLKDIDLIEDSNYKCNSEISVENTIQLHKIKTLRTIEEIDDVELVGITVNNTALANSIEIIDVESLQNTGEHLDSNVSSVVELSPSKTNTTDTSTTITTSTSISNKITEFGKTPHESDENLTEIINKSIVEIVSV

Similar Transcription Factors

Sequence clustering based on sequence similarity using MMseqs2

100% Identity: iTF_00453491;
90% Identity: iTF_00453491;
80% Identity: -