Basic Information

Insect: Ecitophya simulans
Gene Symbol: CSRNP3_1
Assembly: GCA_027574965.2
Location: JAODGE020025611.1:8892-11318[-]

Transcription Factor Domain

TF Family: CSRNP_N
Domain: CSRNP_N domain
PFAM: PF16019
TF Group: Unclassified Structure
Description: This presumed domain is found at the N-terminus of cysteine/serine-rich nuclear proteins. These proteins act as transcriptional activators [1].
Hmmscan Out: # of c-Evalue i-Evalue score bias hmm coord from hmm coord to ali coord from ali coord to env coord from env coord to acc

1 4 0.63 1.4e+04 -4.0 0.2 81 108 49 75 25 90 0.51

2 4 7.2e-105 1.7e-100 335.8 7.2 1 218 239 449 239 449 0.95

3 4 0.2 4.6e+03 -2.4 0.4 58 62 492 496 454 522 0.52

4 4 0.36 8.3e+03 -3.2 0.4 79 111 761 793 747 799 0.46

#	of	c-Evalue	i-Evalue	score	bias	hmm coord from	hmm coord to	ali coord from	ali coord to	env coord from	env coord to	acc
1	4	0.63	1.4e+04	-4.0	0.2	81	108	49	75	25	90	0.51
2	4	7.2e-105	1.7e-100	335.8	7.2	1	218	239	449	239	449	0.95
3	4	0.2	4.6e+03	-2.4	0.4	58	62	492	496	454	522	0.52
4	4	0.36	8.3e+03	-3.2	0.4	79	111	761	793	747	799	0.46

Sequence Information

Coding Sequence: ATGTCGATTGAgataaaaaacgaaaacttCGCGAATCTCGAGCGTCAACTAGAAAACTGCGAAATGGGTGCGTCGGGCACGAAGCAATGCGACAATGAGATTTCTTCGTCGAAGACTCTGAGCGCCGATGCcgtgcacgtcgtcggcgagacgcTCGACGCAATCGTCGACGCTGCGACGAGACACGAGAATTCTCTAGATAACGAAAACGACACCAACAGTACAAACGCAAACGATTCTAAACTAATCCCTTACAAGGAGCCACAATCAAACGACGATCTTCTCATGGGCGAGCCCATCGACGGAGAGGACTCGGCCACCGAGAGCCTGCCGGTGGAGGAGACGGGCATCGAAGAGCCGCACGATCGCAGCGACGGGTCGGACTCCGGCCTCGGGTTGGAGTTGTGCGACGAACGTCCGCACAGCGATTCCAACACCGTCACCACGTCGACCTTGGGGGAGAGCGACAGCGAGACGTCCTTTTTGGACAGGCTGGAAGACGCCTCCGGTCACCAGTTGCATCAGGGCGAGGACAGGGCCGACGATTTGCTCTTGAAGGCGACGAACATCGAAAACGACATCGGCGCCATTTTGGACGAGGCGAAGGTCAAGGAACCCGCGCCCGCCGTGCCGATCAAGAGCAGTTTGAAGCGAAAGCTGCACGTTGATCGCGGCGAACGGCAAACCGAGGCCGTCGACGGTGCGCCGATGTGCAAGAAGAAGCGCGGCATCACCTTCGACAGCGTGACGGTGTTTTATTTTCCTAGAGCGCAGGGCTTCACCTGCGTCCCGTCCCAGGGCGGGTCCACCCTCGGCATGGGTGCTCAGCACGCGTACTCGAAGAAGTTTTCCATCGCCGAACACGCCTTGGAGCAGAGACGTATTCACAGGCAATTGTTGCAACAACTGCGCTCCGAGCGACAGGTGACGACAAACGCCGGCATGGGTTCGTCCAGTGATGACAGCGATTCGGAGGAGGAGCCTTCGGACGTGTCCGAATCCGAATTGGATCTGGACAACTACTACTTTTTGCAGCCGGTCCCGACCCGGCAACGCAGGGCTTTGTTgagggcggcgggcgtgcggAAAATTGATTCGCTGGAAAAGGACGAGTGCAGAGATATTCGGACGTCGCGCGAGTTTTGCGGATGCGGTTGCAAAGGCTACTGCGATCCGGATACCTGTTCGTGCAGTCAGGCGGGGATCAAATGCCAGGTGGATAGGTTAAACTTTCCGTGCGGTTGTTCGCGCGATAACTGCGGCAACTCCAGCGGCCGGATAGAGTTCAACCCCGTTCGGGTGCGCACGCATTTTATACACACGCTGATGCGGCTGGAGCTGGAGAAAAAGCAGAAGTCGGAGGAGGATGCCGAGAATAAGAAATGGATGGAAAGCGAGCGGTTAGCGACGCCCTACTGCGCAACTTCTGCGGCCGGCCGGAGCGCCGCGAAGGACCAGAGCGAACAGAAGGCGCACTCATCGCATCAACATCAACACCATCAACACGCGCATCAAAAATATCTGAGTTCGCACGGAGACGCCGCGGATGGGGGCGTGCACGACGGCGGCTTCACCAATCTGCACTACGGTGCTCCGGGCGAGTGTCCGGGACCAGGAGTCACTAATTTACCGCATCCATCGTCCGGATTCGCTAACCTGCCTTCGAGAGAAGACTCATTAGACTTGTACACGTTTAGAGAGGACTGCTATCAAGAGAAGCAGCAGCATTTTCCTCTCCCCGCAGCCCCGCCGAATTTCCATTTCGCACAACAACCCGCCGAACAGCGATTCGCCAGCGACGTGGCATTCGCATACCACGGCCACCACCATCAGCAACATGCGCACCAACATCCGCAGCATCACCTCGGCGTTGGCCACGCGCAACAACCGCCTCAACATCCCACCCCGCCGAGCGGATCGTATCCGGCGTTCAGTGACTTCACTCCGGTGCCGGTCTTCAACCCCTATCAGCATTATCAGCCGGAGTTCGCGCCCACTGCGCAACAAATGTCCGCATCGAATAACGCCGAGAAGTGTCACGACGACTCCATGGCGAAAccctcgccggccggcgccgcgagcaGCTTCAACAACTTCGACCAGCAACAGGAGCAGCAGCAATACACCAATCTGAGCACGGTCGGGGCCAACAACAAGTCGATCGAGTCGTTCTCGGACCTACTCAACGCGCGCTATGCGGGCGCAAACGCGGTGGGCGGCTATCCTGCCTACGAGGACTTCAATCATATTCAAGAAGCAACGCCCACCACCACCGAAACAACCACAgacgctcgctcgcgcgtcgagatCAAGGAGGGGCAGGACGGCGACGATAGCAATGCCAATGATATTAATGTGATGgagaacgaaaacgaaaacttcGGTGAAATCATTAAGAAATCCATCGTCGAGACGGTTTCGACGTAG
Protein Sequence: MSIEIKNENFANLERQLENCEMGASGTKQCDNEISSSKTLSADAVHVVGETLDAIVDAATRHENSLDNENDTNSTNANDSKLIPYKEPQSNDDLLMGEPIDGEDSATESLPVEETGIEEPHDRSDGSDSGLGLELCDERPHSDSNTVTTSTLGESDSETSFLDRLEDASGHQLHQGEDRADDLLLKATNIENDIGAILDEAKVKEPAPAVPIKSSLKRKLHVDRGERQTEAVDGAPMCKKKRGITFDSVTVFYFPRAQGFTCVPSQGGSTLGMGAQHAYSKKFSIAEHALEQRRIHRQLLQQLRSERQVTTNAGMGSSSDDSDSEEEPSDVSESELDLDNYYFLQPVPTRQRRALLRAAGVRKIDSLEKDECRDIRTSREFCGCGCKGYCDPDTCSCSQAGIKCQVDRLNFPCGCSRDNCGNSSGRIEFNPVRVRTHFIHTLMRLELEKKQKSEEDAENKKWMESERLATPYCATSAAGRSAAKDQSEQKAHSSHQHQHHQHAHQKYLSSHGDAADGGVHDGGFTNLHYGAPGECPGPGVTNLPHPSSGFANLPSREDSLDLYTFREDCYQEKQQHFPLPAAPPNFHFAQQPAEQRFASDVAFAYHGHHHQQHAHQHPQHHLGVGHAQQPPQHPTPPSGSYPAFSDFTPVPVFNPYQHYQPEFAPTAQQMSASNNAEKCHDDSMAKPSPAGAASSFNNFDQQQEQQQYTNLSTVGANNKSIESFSDLLNARYAGANAVGGYPAYEDFNHIQEATPTTTETTTDARSRVEIKEGQDGDDSNANDINVMENENENFGEIIKKSIVETVST

Similar Transcription Factors

Sequence clustering based on sequence similarity using MMseqs2

100% Identity: iTF_00631489;
90% Identity: iTF_00631489;
80% Identity: -