Basic Information

Insect: Drosophila kanekoi
Gene Symbol: CSRNP3_1
Assembly: GCA_037075305.1
Location: JBAMCE010000577.1:12148398-12151723[-]

Transcription Factor Domain

TF Family: CSRNP_N
Domain: CSRNP_N domain
PFAM: PF16019
TF Group: Unclassified Structure
Description: This presumed domain is found at the N-terminus of cysteine/serine-rich nuclear proteins. These proteins act as transcriptional activators [1].
Hmmscan Out: # of c-Evalue i-Evalue score bias hmm coord from hmm coord to ali coord from ali coord to env coord from env coord to acc

1 2 0.14 2.6e+03 -1.9 1.1 59 105 76 128 50 139 0.50

2 2 4.9e-96 9.1e-92 306.9 13.0 2 218 303 508 302 508 0.90

#	of	c-Evalue	i-Evalue	score	bias	hmm coord from	hmm coord to	ali coord from	ali coord to	env coord from	env coord to	acc
1	2	0.14	2.6e+03	-1.9	1.1	59	105	76	128	50	139	0.50
2	2	4.9e-96	9.1e-92	306.9	13.0	2	218	303	508	302	508	0.90

Sequence Information

Coding Sequence: ATGAAAAGCATGTTCCGTCCGATCAAAAAGATTTTCACGTACATTCAGAAAAATGCCAGCAATGGGACAATGTTTGGCAACACGAGCAGCGTAAACGGCGACATTGaaggcgtcggcggcggcggcgtgaGGTCGGAGCCGCCGAAGGAGCTggtgctggagcagcagctgcagtcgctgGAGCAGGCgtcggagcagcagcagctcgatgATGATGACATTGAGCGTCAAATAAAAACCTCGATTATCGATGCATCCAAGGTGCATGCGGCCAAGACGAAAAttgtgctgccgctgcagctgcagctagacGATGAGCTGGCGGACTTTGCGCACGAGCCGGTGACGCTGGCGGATGAGGATGACGACGACCTGGACGAACAGTTTTTGGAGCTAGAGAACTTTCCTAACAATGAGATTATTGTGCTGAGCGACAATGAGCTCAATTCGTCGCTGGCTTCGGACAACGTATCCGAGGATCCGCTAGCGATAGACGACTTTACGCAGCCGCTTCTACGCGATGAGGACAAcgaggaggaagaggaggcGGCCGAGACAAGCGGCAATTTGCTGTGGCTCAAACTGGACACGCCAGCATCGGAGGCCTCCGGCAGCAGTAGAAGCCTCATTGTGCCCGCTCCAGGTTGCAGTAGTTCGGCGGTAGCTGCAGTCAAGCCGCCCACAAAGACCAAAGAGGAGGAGCTGCGTAGCGACGGTGGCTCCGATTCAGGATTGGGCAGTGAAAACGATAGACACAACACAGtaggaacaacagcaacaaccacgaGCGTGCCGAAGCCGCTGCGCTCGAATCTGAAGCGGCGCCTGGACGATGATGCCATGGAGTTGGCTCTGGGGCCGGACATGAGCAGTGCTGTCAGTTGCTGCTCCAGCACACAGAAACGCTCGAAGCGTTGCATTAACTTTGACAGCGTTAAGGTCTACTACTTCCCCAGGCAGCAGGGCTTCAGCTGTGTGCCCACCGCTGGCGGGTGTACGCTGGGCATGGGCGCCCGGCACATTGCTTTCAAGACCATGACGCTGGCCGAGCATGCGGCGGAGCTGAGGCGAGCGCATCGCAGCCAAaatcaggagcagcagcagctgcaagtgcGTGGCTCCAGCAGCGATGACAGCGAGGAATCCGAAGAGGATTACCTGAGCGAGGGCAGCGGCTCCGATGCCGACGATGGCTCCAATGGCTTCCTGCAGCCGGTGACACCCAAGCAGCGTCGTGCCCTGCTAAAGGCCGCCGGTGTGCGTAAGATCGATGCCAGCGAGAAGATCGACTGCCGAGACATACGCAATTCCCGCGAGGTGTGCGGCTGTTCGTGCCGCGAGTTCTGCGACCCGGAGACGTGCGCCTGCAGCCAGGCGGGCATCAAGTGCCAAGTAGATCGCGCCATGTTCCCCTGCGGCTGTACGCGCGAGGCCTGTGGCAACACTGTCGGCCGCGTCGAGTTCAATCCGACGCGAGTGCGCACCCATTACATACACACCGTCATGCGGCTGGACATGGAGCAGCGCCAGAGCCAGGGACCACCGACCTCGAGTAGCGTCAGCAGCTTGGTCTATGGCAGCAGCGCCACAGGCGTCAGCAGCCctggcgtcgctgctgttgccgctgtcgccgccgccgcctcgcACTGCTTCTTCATGCAGCCGCAGTCCAACTACAGCTCCGGCTATGCCTCGCCAGCGTACACGCCCGAGACGAGCGTCAGCTactaccagcagcaacagacgcCACAGTCGTCTGCTTCCCCCGGCTCGAACAGTGGCACGGCGCAGCAATCCAGCTATGCCGCCAGCTATCCGCAGCTGGACAGCCTCGACTCAGGCCTCTTTGCCAGCGGTAGCAATGCCACGCCCTCGTACGGTGAGCTGCTAACGCCCACCTATCATCAGACTCTCAGCTATGGTAGCGCCCAGCTAAATGCCTACACCGCCTATCAACAGACGACCACTTCATCTGGCGGCATTGTGTCGGCCGGGGCGTACAGCTCGTGTGCGGTACCGTCTGTGCCGCCGTTTGGTAATGCGACGACCACCGCCTCGAATGCTACGCAATATCAGCACGCGAATGCGCTAGAAACTACCGCCGTATCCCTGaataccagcagcagcatatccATAACGGCTAGCAGCTGCGCCACGGGCCTGGCACGGCTCGGCAGCGGAACTGGACCGGTCGACTTTATTAGCCTGAATGCGCCCATTGGCAGTTCGTCGCGCATCTCGCAGATCAATGATCTGCTGCAGCACAATCGTAATACCACCGTCGCTCTGGTGGCCGTCTCCGAGAGTTATACCTCTgtgcgcaacagcaacagcagcagcagcaatagcagcagcagcggcgccacAAACCCCACCAGCACCATCGATTCGATTGACACGCCGCCCATTGTGGAGGAGACGCAGCGCAGCTGCATGACGTTCGaggagctgccgccgccgctcaTCAATCCGACGCCCATTGTGGCCGTTGTggaacagcatcagcagcagcagcacaaacaaATGCTGGCCGTGTCCACAACGCCGCAGCCGCGCCAGCCGCTGGATGCCAGCGCCAGCGTAGCCGAGTCATTGTCGAGCGGCAGCAACTGA
Protein Sequence: MKSMFRPIKKIFTYIQKNASNGTMFGNTSSVNGDIEGVGGGGVRSEPPKELVLEQQLQSLEQASEQQQLDDDDIERQIKTSIIDASKVHAAKTKIVLPLQLQLDDELADFAHEPVTLADEDDDDLDEQFLELENFPNNEIIVLSDNELNSSLASDNVSEDPLAIDDFTQPLLRDEDNEEEEEAAETSGNLLWLKLDTPASEASGSSRSLIVPAPGCSSSAVAAVKPPTKTKEEELRSDGGSDSGLGSENDRHNTVGTTATTTSVPKPLRSNLKRRLDDDAMELALGPDMSSAVSCCSSTQKRSKRCINFDSVKVYYFPRQQGFSCVPTAGGCTLGMGARHIAFKTMTLAEHAAELRRAHRSQNQEQQQLQVRGSSSDDSEESEEDYLSEGSGSDADDGSNGFLQPVTPKQRRALLKAAGVRKIDASEKIDCRDIRNSREVCGCSCREFCDPETCACSQAGIKCQVDRAMFPCGCTREACGNTVGRVEFNPTRVRTHYIHTVMRLDMEQRQSQGPPTSSSVSSLVYGSSATGVSSPGVAAVAAVAAAASHCFFMQPQSNYSSGYASPAYTPETSVSYYQQQQTPQSSASPGSNSGTAQQSSYAASYPQLDSLDSGLFASGSNATPSYGELLTPTYHQTLSYGSAQLNAYTAYQQTTTSSGGIVSAGAYSSCAVPSVPPFGNATTTASNATQYQHANALETTAVSLNTSSSISITASSCATGLARLGSGTGPVDFISLNAPIGSSSRISQINDLLQHNRNTTVALVAVSESYTSVRNSNSSSSNSSSSGATNPTSTIDSIDTPPIVEETQRSCMTFEELPPPLINPTPIVAVVEQHQQQQHKQMLAVSTTPQPRQPLDASASVAESLSSGSN

Similar Transcription Factors

Sequence clustering based on sequence similarity using MMseqs2

100% Identity: iTF_00559475;
90% Identity: iTF_00475205;
80% Identity: -