Basic Information

Insect: Drosophila siamana
Gene Symbol: Csrnp3_1
Assembly: GCA_035047445.1
Location: JAWNPP010000016.1:2595378-2598796[+]

Transcription Factor Domain

TF Family: CSRNP_N
Domain: CSRNP_N domain
PFAM: PF16019
TF Group: Unclassified Structure
Description: This presumed domain is found at the N-terminus of cysteine/serine-rich nuclear proteins. These proteins act as transcriptional activators [1].
Hmmscan Out: # of c-Evalue i-Evalue score bias hmm coord from hmm coord to ali coord from ali coord to env coord from env coord to acc

1 3 0.069 1.1e+03 -0.9 0.6 79 104 36 64 16 88 0.57

2 3 1.5e-97 2.4e-93 311.8 10.6 2 218 299 506 298 506 0.92

3 3 0.011 1.8e+02 1.7 0.3 51 78 575 592 550 627 0.52

#	of	c-Evalue	i-Evalue	score	bias	hmm coord from	hmm coord to	ali coord from	ali coord to	env coord from	env coord to	acc
1	3	0.069	1.1e+03	-0.9	0.6	79	104	36	64	16	88	0.57
2	3	1.5e-97	2.4e-93	311.8	10.6	2	218	299	506	298	506	0.92
3	3	0.011	1.8e+02	1.7	0.3	51	78	575	592	550	627	0.52

Sequence Information

Coding Sequence: ATGAGGAGCATGTTCCGTCCGATCAAGAAGATATTCACGTACATCcaaaaaaatgccagcaacgGCACAATGTTTGGCAGCACAACAAGCGTAAACAGCGAGCTGGAAGTTGCCGCAAGCAGCGGCAAACAGGAGGAGCAGGCGacagaggagcagcagcaggatgaGGATGACATTGAGCGTCAGATTAAGACGTCCATCATTGATGCCAGCAAGGTGCATGCGGCGGTGGCGGCCAAAGCGAAAATGATGCtgccactgcagctgcagctggacgaTGAGCTGGCGGATTTCGCGCATGAGCCGCTCACCGACGACGAGGCGGCGCGACATGTGGGTGAtcgggaggaggaggaggatcTGGAAGAACAGTATCTGGAGCTCGATAGTTTTCCCAACAATGAGATTATTGTGCTCAGCGACAACGAGTTGAATTCATCGCTTGCCTCCGACAACATCTCGGAGGATCCGTTGGCCATCGATGAGTTTACGCAGCAGCCGCACGAagccgacgacgaggaggagggcATTGAGAACAATGGCGAGCTGCTCTGGCTGAAGCTGGACACACCGATGCCGGTGACGGGCGACAGCCACATCGATGGCCATATTGTGATGCCTGAAACGCCTGAAGCCGGCGGCGTCGTCAAGACGCCTGTGAAGACAaaggaggaggagctgcgCAGTGACGGCGGCTCCGATTCGGGCCTGGGCAGCGAGAACGAtagacaacagcaaccaacagCGCCGACTTCAACTCCTCCAGCGCCAGCGACGAAACCGCTGCGCTCCAATTTGAAGCGTCGCCTGGAGGACGATGCCATTGAGCTCGCTTTGCCGCCCGATCTCAATGGCAGCGTCTCGTCCACGTCCGCCGCCAGCACGCAAAAGCGCGCCAAGCGCTCGATCATCTTTGACAACGTCAAGGTCTACTACTTTCCACGCCAGCAGGGCTTCAATTGTGTGCCCACCGCCGGCGGCTGCACGCTCGGCATGGGCGCCATGCACATTGCCTTCAAGACCATGACGCTGGCGGAGCATGCGGCCGAATTGCGACGCGCCCATCGCAGCCAGAatcaggagcaacagcagcagcagttgcgctTGGGCGGCTccagcagcgacgacagcgaggAGTCCGAGGAGGATTACCTGAGCgagggcagcggcagcgatgCCGACGACGGTTCCAACGGCTTCCTGCAGCCGGTGACGCCCAAGCAACGCCGTGCGCTGCTCAAGGCAGCCGGCGTGCGCAAGATCGATGCCAGCGAGAAGATCGACTGCCGCGACATACGAAATTCGCGCGAGGTGTGCGGCTGCTCGTGTCGCGAGTTCTGCGACCCGGAGACGTGCGCCTGCAGCCAGGCGGGCATCAAGTGTCAGGTGGACCGCGCCATGTTCCCCTGCGGTTGCACGCGCGAGGCATGCGGCAACACGGTCGGACGCGTCGAGTTCAATCCGACGCGTGTGCGCACGCATTACATACACACTGTGATGCGCCTGGACATGGAGCAGCGCCAGAGCCAAGGACCACCTGTGGTCGCCAGCGGCACTCAGAGCGGCTTGGTCtacggcggcggcagcagcagctccgcTGGCGTTTCGCCAACTGCCGTTGCCGGCACCGCCTCGCATTGTTATTTCATGCAGCCGCAATCGAACTACAGCTCTGGCTATGCCTCGCCAGCCTACACGCCCGAGACGAGCGTCAGCTactatcagcagcagcaacaacaacagcagcagcagcaacaacaacagcagcagcagctcacgcCGCAGTCGAATGTGTCGCCTGTGTCGGCGACTGGCAGCAGCGTCGCTGTGCAGCAGTCCAGCTATGCGAGCGGCTATCCGCAGCTGGACAGCCTCGACTCGGGTCTCTttgccagcggcagcaatgcCACGCCCTCGTACGGTGAGCTGCTGACGCCCACCTATCATCAGACCATCAGCTATGGCGGCGCTCAGCTCAACTCCTACGGCGGCTACCCACAGACGACGGCCACGAGTGGCGGCAACGCATCGCCCGGCGCGTACAGCTCGTGTGCGGTGCCTTCGGTGCCGCCATACGGCAATGCGACCACAACAGCCTCGAATGCGACGCAATATCAGCACACGAATGCACTGGAAACCACCGCCGCCTCCATCATGAAcgcaaccaacagcagcagcagcagcagcagctgctccgtGATCACCGCCAGCAACTGCTCGACGGTCTTGGGACGTCTTGGCAGCGTCACGGGGCCCGCGGACTTCATCAGCTTGAATGCGCCCATTGGCAGCTCGTCGCGTTTATCGCAGATCAATGATCTGCTGCAGCACAATCGCAATACGACCGCCGCCTTGGTGGCCGTGTCCGAGGGCTATGCGGCGAACGCtgtgcgcagcagcagcagccaaagtaACAGCACCATTGACTCGATCGACACGCCGCCCATTGTCGAGGAGGCGCAACGCGGCAGTTGCATGACCTTCGAggagctgccgccgccgctcaTCAATCCCACGCCCATTGTGGCCGTTGTGGAGCAGCCGGAacgcaagcagcagccacaacagctgcTGACGTTGAGCTCAACGCCACAGCCACGTCAGCCGCTGGCTGCAGCCTTGGTGAGCAGTGGAGTGAAGACGGGAGCGACGGCGGAGGGCGACGGTGGCATCTAA
Protein Sequence: MRSMFRPIKKIFTYIQKNASNGTMFGSTTSVNSELEVAASSGKQEEQATEEQQQDEDDIERQIKTSIIDASKVHAAVAAKAKMMLPLQLQLDDELADFAHEPLTDDEAARHVGDREEEEDLEEQYLELDSFPNNEIIVLSDNELNSSLASDNISEDPLAIDEFTQQPHEADDEEEGIENNGELLWLKLDTPMPVTGDSHIDGHIVMPETPEAGGVVKTPVKTKEEELRSDGGSDSGLGSENDRQQQPTAPTSTPPAPATKPLRSNLKRRLEDDAIELALPPDLNGSVSSTSAASTQKRAKRSIIFDNVKVYYFPRQQGFNCVPTAGGCTLGMGAMHIAFKTMTLAEHAAELRRAHRSQNQEQQQQQLRLGGSSSDDSEESEEDYLSEGSGSDADDGSNGFLQPVTPKQRRALLKAAGVRKIDASEKIDCRDIRNSREVCGCSCREFCDPETCACSQAGIKCQVDRAMFPCGCTREACGNTVGRVEFNPTRVRTHYIHTVMRLDMEQRQSQGPPVVASGTQSGLVYGGGSSSSAGVSPTAVAGTASHCYFMQPQSNYSSGYASPAYTPETSVSYYQQQQQQQQQQQQQQQQQLTPQSNVSPVSATGSSVAVQQSSYASGYPQLDSLDSGLFASGSNATPSYGELLTPTYHQTISYGGAQLNSYGGYPQTTATSGGNASPGAYSSCAVPSVPPYGNATTTASNATQYQHTNALETTAASIMNATNSSSSSSSCSVITASNCSTVLGRLGSVTGPADFISLNAPIGSSSRLSQINDLLQHNRNTTAALVAVSEGYAANAVRSSSSQSNSTIDSIDTPPIVEEAQRGSCMTFEELPPPLINPTPIVAVVEQPERKQQPQQLLTLSSTPQPRQPLAAALVSSGVKTGATAEGDGGI

Similar Transcription Factors

Sequence clustering based on sequence similarity using MMseqs2

100% Identity: iTF_00614175;
90% Identity: iTF_00589535;
80% Identity: -