Basic Information

Insect: Magicicada septendecula
Gene Symbol: Csrnp2_1
Assembly: GCA_034769895.1
Location: CM068371.1:237921177-237932964[+]

Transcription Factor Domain

TF Family: CSRNP_N
Domain: CSRNP_N domain
PFAM: PF16019
TF Group: Unclassified Structure
Description: This presumed domain is found at the N-terminus of cysteine/serine-rich nuclear proteins. These proteins act as transcriptional activators [1].
Hmmscan Out: # of c-Evalue i-Evalue score bias hmm coord from hmm coord to ali coord from ali coord to env coord from env coord to acc

1 3 2.4e-09 0.0002 25.5 0.3 35 117 1 68 1 84 0.72

2 3 5.9e-68 4.7e-63 217.1 7.6 49 218 126 297 105 297 0.76

3 3 3.1 2.5e+05 -4.3 0.1 88 102 437 451 421 458 0.50

#	of	c-Evalue	i-Evalue	score	bias	hmm coord from	hmm coord to	ali coord from	ali coord to	env coord from	env coord to	acc
1	3	2.4e-09	0.0002	25.5	0.3	35	117	1	68	1	84	0.72
2	3	5.9e-68	4.7e-63	217.1	7.6	49	218	126	297	105	297	0.76
3	3	3.1	2.5e+05	-4.3	0.1	88	102	437	451	421	458	0.50

Sequence Information

Coding Sequence: ATGTCATGGACACATTCACATGCCCAGACATTCACATTACTCGAGCATGCAGCTGAACAACGCAGACTACACAGACATCTATTAGCACAAATTCGGTCTGCTACTGCTGCACCAGCATCATCTTCTAGTGATTCTGATACAGATGACCAACGCAGTGAATCAGAACTGGATCTTGACAACTACTACTTTCTACAGTGCTATGACAGGTTTACTCGTGTCAAAGCAGGAATAACATCAACTGATGAAAATCCAAGACCTGGTCACCCTTCAACGTCAATAAGTGACGATAAAATCTATGAAGTTTGCACTATGATACATGAAGATCATTGTTTAACTGTACGTGAGATTGCCGAGGAATTGGATATGAGCATGGATGATCAGAAAAAGAATCGTGTTAACATCAGTCAGGAACTGCTTGACGGTGCCAGTGCTGATGAAAGcttcatcaaaaacattataacGGGACAAGACATGGGTTATGGATACGATGTCGAAACGAAGACACAGTCTTCGCAGTGGGTGGAAAAAGGATCACCTCGAGCAgaaaaagcccagatgaCAATTTACCTACTGCTGCAGCCTGTTCCAACACGACAGAGACGTGCTTTGCTACGTGCTGCAGGGGTGCATAAGATAGATTCAAACGAAAAAGATGAATGTCGTGATATACGTACATCAAGAGAATTCTGTGGTTGTGCTTGTAAAGGCTATTGTGATCCTGACACATGTGCTTGTTCACAAGCAGGCATCAAGTGCCAGGTAGACCGATTGAATTTTCCATGTGGCTGCTCTCGTGATGGGTGTGCAAATTCCAGTGGGCGTATTGAATTTAATCCAGTCCGGGTGCGGACGCATTTCATTCACACACTGATGAGACTGGAATTAGAGAAAAAACAGGCACAAGAAGAAGAGGCTGCTCGTCGATTAGATCTTAACCTGAGTTCTGGAGCAGAGATCGAATCATGTGTTCACGGTGGTAGTTTTACCAACTTCCATTACCGTGATGATCTCTATGGATATCAGCCATATGAACCACCTCCAACTAGTTCAGGTTTTAGCTACAACTACACTGGACAGTACACACCAGCCTATGATCAGCCTGACACTAGTGATCTAGTTCCACCTGGTTTAGAGTTCCAGCACTCACCAGGATCATATGAATCGTTCACAAATGCTATTGGTTTTTCTCAGATGGAACCTAGCCGTTACCCATCTGCTGAAACCAAATTAGAATCATTTTCTGAGCTTTTACAAGGACGTTATTCAGAACCAGAACCTTCACTTTTAGAAGGTGAAGATACAATGGCAACGGAAAGTGAAAGTCAAGAAAAGGCAACGAGTTCAGAAGAATGTGAAGCTGAAAATTTTGGCGAAATTATAAAGAAAACTATGGTTGAAAGTGTAACAGCTTAG
Protein Sequence: MSWTHSHAQTFTLLEHAAEQRRLHRHLLAQIRSATAAPASSSSDSDTDDQRSESELDLDNYYFLQCYDRFTRVKAGITSTDENPRPGHPSTSISDDKIYEVCTMIHEDHCLTVREIAEELDMSMDDQKKNRVNISQELLDGASADESFIKNIITGQDMGYGYDVETKTQSSQWVEKGSPRAEKAQMTIYLLLQPVPTRQRRALLRAAGVHKIDSNEKDECRDIRTSREFCGCACKGYCDPDTCACSQAGIKCQVDRLNFPCGCSRDGCANSSGRIEFNPVRVRTHFIHTLMRLELEKKQAQEEEAARRLDLNLSSGAEIESCVHGGSFTNFHYRDDLYGYQPYEPPPTSSGFSYNYTGQYTPAYDQPDTSDLVPPGLEFQHSPGSYESFTNAIGFSQMEPSRYPSAETKLESFSELLQGRYSEPEPSLLEGEDTMATESESQEKATSSEECEAENFGEIIKKTMVESVTA

Similar Transcription Factors

Sequence clustering based on sequence similarity using MMseqs2

100% Identity: -
90% Identity: -
80% Identity: -