Basic Information

Insect: Drosophila innubila
Gene Symbol: Csrnp3_1
Assembly: GCA_004354385.1
Location: NW:20321090-20327002[-]

Transcription Factor Domain

TF Family: CSRNP_N
Domain: CSRNP_N domain
PFAM: PF16019
TF Group: Unclassified Structure
Description: This presumed domain is found at the N-terminus of cysteine/serine-rich nuclear proteins. These proteins act as transcriptional activators [1].
Hmmscan Out: # of c-Evalue i-Evalue score bias hmm coord from hmm coord to ali coord from ali coord to env coord from env coord to acc

1 3 0.035 4.6e+02 0.1 1.1 35 107 58 135 41 160 0.50

2 3 0.34 4.5e+03 -3.1 0.1 27 77 258 311 256 331 0.52

3 3 1.8e-98 2.4e-94 314.9 11.5 2 218 339 547 338 547 0.92

#	of	c-Evalue	i-Evalue	score	bias	hmm coord from	hmm coord to	ali coord from	ali coord to	env coord from	env coord to	acc
1	3	0.035	4.6e+02	0.1	1.1	35	107	58	135	41	160	0.50
2	3	0.34	4.5e+03	-3.1	0.1	27	77	258	311	256	331	0.52
3	3	1.8e-98	2.4e-94	314.9	11.5	2	218	339	547	338	547	0.92

Sequence Information

Coding Sequence: ATGAGGAGCATGTTCCGTCCGATAAAGAAGATTTTCACGTACATCCAAAAAAATGCCAGCAACGGGAAAATGTTTGGCAGCACAAATAGCATAAacactgatgatgatgatgtcgcAAGTGGCAGCAATGCCATCAAGCTGGTGCcgaaggaggaggagcaacAGCTGGAAAGGGAGCAAGAGCACAAACTGGAagtggaactggaactggagcaTGAAGATGATGATATTGAACGTCAAATAAAAACTTCTATTATCGATGCCACAAAGGTGCATGCAACTAAATCCAAAATTATATTgccactgcaactgcaactggatGATGAGCTGGCGGATTTTGCACACGAACCTGCAACGCTAGCGGATGAGGAGGCTGACAATGATATTGATAATGACaatgatcatgatgatgatgttgttgaaCTGGATGAACAGTATCTGGAGCTGGAAAACTATCCAAACAATGAGATTATTGTGCTAACTGAAAATGAGCTAAATTCATCGCTTGCCTCGGATAACATTTCGGAGGATCCTTTGGCCATTGATGAGTTTACACAGCCGACGGAGCAGGACAATGAGGAGGAAGAGATTGAAAATAATGGTGAATTGCTCTGGCTAAAGCTGGACACGCCCATGCAGGCGGTGGCGGGGACGGGGGCGGCGACAACCACCAATAGTGGCAATGTGGATGACATTGTTATCACAGCACCGTCTGTAACTGCATCGTCAGCCAAGGTGCCCGCCAAGACCAAAGAAGAGGAGCTGCTGCGTAGTGATGGTGGCTCCGATTCAGGATTGGGCGGTGAAAACGACAGAcacaatgcaacaacaacagcaacaacaacggaagCTGCTCCAGGTGAAGCAACGACCACCTTGCAGAAACCACTGCGTTCCAATTTGAAGCGTCGTCTGGAGGATGATGAGCTGTCTCTGGTGCCCGACATGAACAGCAGCTCCACCTCTTCCACCTCCACCGCCACCTCCGTTTGCTTGTCCAGCGCACAGAAACGCGCCAAGCGTTCCATTAACTTTGATAGCGTCAAGGTGTATTACTTTCCCCGCCAGCAGGGATTCAATTGTGTGCCCACTGCCGGCGGTTGCACCCTGGGAATGGGCGCCCGGCACATTGCCTTCAAGACTATGACCCTGGCGGAGCATGCAGCAGAGTTGAGGCGTGCCCATCGCAGCCAGAATCAGAgtcaggagcaacaacaacagctgcgcATTGGCGGCTCCAGCAGTGATGATAGCGAGGAATCCGAGGAGGACTACCTAAGCGAGGGCAGCGGCTCCGATGCCGACGACGGCTCCAATGGCTTCCTGCAACCGGTGACGCCAAAGCAGCGACGAGCGCTCCTCAAAGCCGCCGGCGTGCGAAAGATCGATGCAAGTGAGAAGATCGATTGCCGGGACATACGCAACTCACGCGAGGTGTGCGGTTGCTCCTGTCGCGAGTTCTGCGATCCAGAGACTTGTGCCTGCAGTCAGGCGGGCATCAAGTGTCAGGTGGATCGGGCCATGTTCCCCTGCGGTTGTACACGCGAAGCTTGTGGCAACACCGTCGGACGTGTGGAATTCAATCCGACCCGTGTGCGCACCCATTACATCCATACGGTAATGCGTCTGGACATGGAGCAGCGTCAGAGTCAAGGACCGCCAGCTGcgagtggcaacaacagcttgATCTATTCCAACAGCAGCGTTGGGGTCATTTCAACCGGAGCTGCTGCCGCCACATCcgcttcctcctcctccgccacCTCCTCGCATTGCTATTTCATGCAGCCGCAGTCCAACTACAGCTCCGGCTATGCCTCGCCAGCTTACACGCCCGAACCGAGTGTCAGCTActatcaacagcaacaacaacaacaacaacagacgcTACAGGCGACTGTCTCACCTCTTTCGACCAGTTATCCACAGCTGGATAGCTTGGATTCTGGTCTATTTGCCAGCGGTAGCAATGCCACACCCTCGTATGGTGAGCTACTGACGCCCACCTATCATCAAACCCTTGGCTATGGCAGCGCTCAGCTCAATTCCTACACTGGTTACCAGCAGACGACATCAACATCCGGCGGCAGTGCATCCCCCGAAGCGTACAGTTCGTGTGCAGTACCATCGGTGCCACCATTTGGCAatgccaccaccaccgcctcGAATGCAACGCAATATCAGCATGCAAATGCGTTGGAAACCACCGCATCCTCAATGaacgtcaacagcagcagtggaAGCAGCAGCATATCCGTAACGGCCAGCAGTTGTTCCGCGGGATTGGTGCGTCTCAGTGGCGCAGTTGCTGCTGATTTCATTAGCCTGAACACGCCCATTGGCAGTTCGTCGCGTCTCTCGCAGATTAATGATCTCTTGCAGCACAATCGTAATGCCACAAGCGCTTTGGTGGCCGTCTCCGAGTCATATACCTCCGTGCGAAACAGCAGCAGTAATATCAACAGCACCATTGATTCTATCGACACGCCGCCCATTATAGAGGAGGCGCAACGCAGCAGTTGCATGACCTTCGAGGAGTTGCCACCGCCGTTAATTAATCCCACGCCCATTGTGGCCGTCGTGGAGCACAGCGAACGTAAGCTACAGCTGCAGCAGGTGGTGAATTCAACACCCCAGCCTCGTCAGCCACTGGATACAAGTGGCAAGCATACCGAATCCTTGGCGAGCGATATTTGA
Protein Sequence: MRSMFRPIKKIFTYIQKNASNGKMFGSTNSINTDDDDVASGSNAIKLVPKEEEQQLEREQEHKLEVELELEHEDDDIERQIKTSIIDATKVHATKSKIILPLQLQLDDELADFAHEPATLADEEADNDIDNDNDHDDDVVELDEQYLELENYPNNEIIVLTENELNSSLASDNISEDPLAIDEFTQPTEQDNEEEEIENNGELLWLKLDTPMQAVAGTGAATTTNSGNVDDIVITAPSVTASSAKVPAKTKEEELLRSDGGSDSGLGGENDRHNATTTATTTEAAPGEATTTLQKPLRSNLKRRLEDDELSLVPDMNSSSTSSTSTATSVCLSSAQKRAKRSINFDSVKVYYFPRQQGFNCVPTAGGCTLGMGARHIAFKTMTLAEHAAELRRAHRSQNQSQEQQQQLRIGGSSSDDSEESEEDYLSEGSGSDADDGSNGFLQPVTPKQRRALLKAAGVRKIDASEKIDCRDIRNSREVCGCSCREFCDPETCACSQAGIKCQVDRAMFPCGCTREACGNTVGRVEFNPTRVRTHYIHTVMRLDMEQRQSQGPPAASGNNSLIYSNSSVGVISTGAAAATSASSSSATSSHCYFMQPQSNYSSGYASPAYTPEPSVSYYQQQQQQQQQTLQATVSPLSTSYPQLDSLDSGLFASGSNATPSYGELLTPTYHQTLGYGSAQLNSYTGYQQTTSTSGGSASPEAYSSCAVPSVPPFGNATTTASNATQYQHANALETTASSMNVNSSSGSSSISVTASSCSAGLVRLSGAVAADFISLNTPIGSSSRLSQINDLLQHNRNATSALVAVSESYTSVRNSSSNINSTIDSIDTPPIIEEAQRSSCMTFEELPPPLINPTPIVAVVEHSERKLQLQQVVNSTPQPRQPLDTSGKHTESLASDI

Similar Transcription Factors

Sequence clustering based on sequence similarity using MMseqs2

100% Identity: iTF_00585186;
90% Identity: iTF_00506853;
80% Identity: -