Basic Information

Insect: Chrysolina americana
Gene Symbol: CSRNP3_1
Assembly: GCA_958502065.1
Location: OY293410.1:105665062-105667167[+]

Transcription Factor Domain

TF Family: CSRNP_N
Domain: CSRNP_N domain
PFAM: PF16019
TF Group: Unclassified Structure
Description: This presumed domain is found at the N-terminus of cysteine/serine-rich nuclear proteins. These proteins act as transcriptional activators [1].
Hmmscan Out: # of c-Evalue i-Evalue score bias hmm coord from hmm coord to ali coord from ali coord to env coord from env coord to acc

1 2 0.18 1.3e+04 -2.2 1.0 46 107 43 104 38 117 0.65

2 2 4.3e-104 3.1e-99 333.3 8.5 1 218 203 412 203 412 0.93

#	of	c-Evalue	i-Evalue	score	bias	hmm coord from	hmm coord to	ali coord from	ali coord to	env coord from	env coord to	acc
1	2	0.18	1.3e+04	-2.2	1.0	46	107	43	104	38	117	0.65
2	2	4.3e-104	3.1e-99	333.3	8.5	1	218	203	412	203	412	0.93

Sequence Information

Coding Sequence: ATGGGTTCTAACGAGTCATCCACCATGGAACTAGCCACAATGTCAAACCGAAGCCAGACGGCCCATCCGCCATTACAATCGAAAATTGTTGATCCTGTTgatgttattgttgaaaaacCTTCAAGTACAATCCATGAAAGCTTGAACGAGTCGCGTGATATTTCTAAACCAGAGCCAAAATCAAACGAAGAAGCAATAGATGATAGTGAAGATAGGGCGGAAATCGAAGAAGTCGGGGAAGACTCCGCGACGGAAAGCCTGCCTCTCACAACCGACGAGCTGATAGAGGAACCACACGATAGGTCGGACGGCTCGGATTCCGGACTCGGATCGGAGTTGAGCGAAGAACGGCCACAAGAAAGCGCAACGATAATCGAAAGTGACAGCGAAACGTCCTTCCTGTACAGACTCAATGAGGGAACCATCACCAACACCCAGTTCGAGGAGTTCGCCAGTCAAGTGGCGATTTCAAGCTGTGAGGGAGGCTCCAACATAGACAAAGACATTGGTGACATTCTGAGCAGTGCACAATCAAAACTGAGCGTACCGACGAAAAGCTCCCTGAAGCGGAAGCTGTCCGCGGATGAACGCGAGCAACCGGAAGCCAAGAAGCGGCGCGGAATCACCTTCGACAGCGTCACCGTCTTCTACTTCCCGAGAGCGCAGGGCTTCACCTGCGTGCCTTCCCAAGGAGGCTCGACATTGGGCATGGGCGCGCAGCATAGTCACATGAAGAAGTTCTCTCTATCGGAGCATGCTCTGGAGCAGCGCCGGATCCACCGGCAATTGTTGCAACAACTGCGGTCGGAGAGGAACGCAACCGGAGGCATTGCCGCGTCCTCCAGCGAGGAAAGCGACAGCGAAGACGAGCCCAGCGACGCGTCAGAGTCCGAGATGGACCTCGACAACTACTACTTCCTGCAGCCCGTTCCCACGAGACAGCGCAGGGCGCTGTTGCGCTCTGCGGGCGTCAGGAAGATCGACACTATGGAGAAGGACGAATGCCGAGACATACGATCGTCCCGCGAGTTTTGCGGGTGCGGATGCAAAGGCTACTGTGACCCCGATACTTGCTCGTGCAGTCAAGCCGGCATAAAGTGTCAAGTTGATAGGTTGAACTTCCCGTGCGGCTGTTCGCGCGATAACTGCGGCAACTCCAGCGGCCGCATAGAGTTCAACCCCGTACGCGTCCGCACGCACTTCATACACACGCTGATGCGACTGGAGCtggagaaggagaaggaaggaATGAAGTCCGATAGCAAGAACGTTAATGCGGTGGACAACGACCGGCTAAACGTGGACGACAAAGAAACGGCGACGAATAAATCGAGCGTGAATAAATTCAATAGCAACTTGTTGAGGGACGTCAGTTTGGGCGCCAACGTGGAGGTTGAGAACTGCGTGAACATTGGCAGCTACACCAATCTGCATTACGGTGCTCCGGGGGAGGGGCCGGGACTCCATCCTCCCGGATTCTCCAACCTGCCGGATCGGGCCGACTCGCTGGATTTGTATACCTTTCGGGAGAACTGTTACGGCGAAGTGGAACATTCCGCGGTTGAAAGAAAACAGGCGTTTCCGGCCGCGCAGGGATTTCACTTTCCCGACCCCAGATTCTCGGATGTCGGCTTCCCGACTGGTGGTCCTTATCCCTCTACGTCTAATCAATACACCCAGCCGTATCCAAGCAGTTTCGGCGACTTCTCACCGGCGTTCAACCAGTACGGGGGGATTTACACGCCCGACTTCGGAACGAAGCCGGTAGAAGGAACGTTTCCGCCGTCATATGAACACTTCTCTAGTGACAGTTTTCCAGTTGCTAATGCGGTGTCCAAAGAAAGCCAGTACACAAGCCTAAATCCCGTCGGGGCCAATAACAAAGTTGAATCATTCGCTGACTTGCTGAGTGGAAAATTCAACACGTATTCGGGGTTTGAGGAGAGCAGCAGTTTCAATCCTGCGAATGGTGGACAAGCTCCGTCGCATGCCGTCGATAAAGCAAAAAATACGGGGAATGTTTCGAGTTCCGTTGGAGCAGAGGAGTGCgatgaaaattttggggaaatcaTAAAGAAGTCTATGGTAGAAACAGTTTCAGCATAA
Protein Sequence: MGSNESSTMELATMSNRSQTAHPPLQSKIVDPVDVIVEKPSSTIHESLNESRDISKPEPKSNEEAIDDSEDRAEIEEVGEDSATESLPLTTDELIEEPHDRSDGSDSGLGSELSEERPQESATIIESDSETSFLYRLNEGTITNTQFEEFASQVAISSCEGGSNIDKDIGDILSSAQSKLSVPTKSSLKRKLSADEREQPEAKKRRGITFDSVTVFYFPRAQGFTCVPSQGGSTLGMGAQHSHMKKFSLSEHALEQRRIHRQLLQQLRSERNATGGIAASSSEESDSEDEPSDASESEMDLDNYYFLQPVPTRQRRALLRSAGVRKIDTMEKDECRDIRSSREFCGCGCKGYCDPDTCSCSQAGIKCQVDRLNFPCGCSRDNCGNSSGRIEFNPVRVRTHFIHTLMRLELEKEKEGMKSDSKNVNAVDNDRLNVDDKETATNKSSVNKFNSNLLRDVSLGANVEVENCVNIGSYTNLHYGAPGEGPGLHPPGFSNLPDRADSLDLYTFRENCYGEVEHSAVERKQAFPAAQGFHFPDPRFSDVGFPTGGPYPSTSNQYTQPYPSSFGDFSPAFNQYGGIYTPDFGTKPVEGTFPPSYEHFSSDSFPVANAVSKESQYTSLNPVGANNKVESFADLLSGKFNTYSGFEESSSFNPANGGQAPSHAVDKAKNTGNVSSSVGAEECDENFGEIIKKSMVETVSA

Similar Transcription Factors

Sequence clustering based on sequence similarity using MMseqs2

100% Identity: iTF_00329378;
90% Identity: -
80% Identity: -