Basic Information

Insect: Drosophila sproati
Gene Symbol: CSRNP3_1
Assembly: GCA_018904355.1
Location: JAEIFY010000122.1:2409148-2415129[+]

Transcription Factor Domain

TF Family: CSRNP_N
Domain: CSRNP_N domain
PFAM: PF16019
TF Group: Unclassified Structure
Description: This presumed domain is found at the N-terminus of cysteine/serine-rich nuclear proteins. These proteins act as transcriptional activators [1].
Hmmscan Out: # of c-Evalue i-Evalue score bias hmm coord from hmm coord to ali coord from ali coord to env coord from env coord to acc

1 4 0.13 2e+03 -1.8 1.2 75 103 58 83 29 111 0.44

2 4 0.36 5.4e+03 -3.2 2.1 84 105 134 155 100 166 0.63

3 4 0.18 2.7e+03 -2.2 1.2 81 109 178 206 164 220 0.63

4 4 4.4e-100 6.7e-96 320.1 14.5 2 218 337 552 336 552 0.94

#	of	c-Evalue	i-Evalue	score	bias	hmm coord from	hmm coord to	ali coord from	ali coord to	env coord from	env coord to	acc
1	4	0.13	2e+03	-1.8	1.2	75	103	58	83	29	111	0.44
2	4	0.36	5.4e+03	-3.2	2.1	84	105	134	155	100	166	0.63
3	4	0.18	2.7e+03	-2.2	1.2	81	109	178	206	164	220	0.63
4	4	4.4e-100	6.7e-96	320.1	14.5	2	218	337	552	336	552	0.94

Sequence Information

Coding Sequence: ATGAGGAGCATGTTCCGTCCGATCAAGAAGATTTTCACGTACATTCAGAAAAATGCTAGTGCTGGAACAATGTTTGGGACAACAGCAAGCAGCATAATTAAGTCGGAGGATGCGAGCGCCACAAGTAATACAAGCAGCAACCAACTGGCGCAGGCAGAGAAACTGGAGCTGGAGCAGCGGCTGCCACTGGAGCAGGTGCAGGAGGTGAAGGCGGAGCAACAACAACAACTGGACGATGAGGACATTGAGCGTCAAATAAAAACATCGATCATTGATGCGAGTAAGGTGCATGCGGCAAAGGCGAAACTTGTGCAGCCTCTGCAACTGCAGCTGGACGATGAGCTGGCGGACTTTGCGGACGAACCGCTGGCACTGGCCAGTGTGGGTGTGGATGTCGAGGAGGAGGAGGAGGAGGATGACGACGACGACGACGACGATGTTGTCGATGAAGATCTGGAAGAACAGTTTCTCGAACTGGACAATTTTCCAAACAATGAGATTATTGTGCTGAGCGATCAAGATCTAAACTCATCGCTTGCCTCCGACAATATATCCGAGGATCCCCTGGCCATAGATGACTACGCCCAAAAGGAGGTTGACGACGACGAGGAGGAGGACGAAGAAGAAGCGGACAGCAGCGGCGATCTGCTCTGGCTCAAATTGGACACACCAAGTGCGCAGCTTACCATCGGCAGCAGCAGCAGCGTTCTTCCCGTTGCAGGCTGCAAAATCAGCAGCTCCTCCTCAGCAGCAGCTGTAACAGCAGGCACAGTTATTAAGCCACCCACCAGGCGGCGGGAGGAGGAGCTGCGCAGTGATGCTGGCTCCGATTCGGGTCTGGGTGGTGAAAACGAAAGACAAAACACAACAACAACAGCAACAACAATAACAACAACGACAAGCTTGCAGAAGCCGCTGCGCTCCAATTTAAAGCGTCGTCTGGATGATGATGCCATGGAGCTGGAACTGCTGCCCATCTCGAGCTGCTCGTCGAGCACACAGAAGCGGCCCAAGCGAAGCATTAATTTCGATAACGTTAAGATCTACTATTTTCCACGGCAACAGGGCTTTGGCTGTGTGCCCACCGCCGGCGGCTGTACGCTGGGCATGGGCGCCCGGCATATTGCCTTCAAGACCATGACGCTGGCGGAGCATGCGTCTGAGCTGCGGCGCGCCCATCGCAGCCAGAATCAGGAGCAGCAACAGCAACAACAGCAGCAGGCGCAGCAGCAACTGCAGCAGACGCGTGGCTCCAGCAGCGATGATAGCGAAGAGTCCGAGGAGGATTATTTGAGCGAGGGCAGCGGCTCCGATGCCGACGATGGCTCCAATGGGTTCCTGCAGCCGGTGACGCCCAAGCAGCGACGTGTCTTGCTCAAGGCGGCCGGTGTGCGCAAGATCGATGCCAGCGAGAAGATCGACTGCCGGGACATACGCAATTCGCGCGAGGTGTGCGGCTGCTCGTGTCGCGAATTCTGCGATCCGGAGACGTGCGCCTGCAGCCAGGCGGGCATCAAGTGTCAAGTGGATCGCGCCATGTTCCCATGCGGATGTTCGCGCGAGGCATGCGGCAACACCGTCGGTCGCGTCGAATTCAATCCGACGCGTGTGCGCACCCATTATATACACACCGTGATGCGGCTGGACATGGAGCAGCGCCAGAGCCAGGCACACTCCTCGGCGGCGAACAGTGGCAGTGGCAGCCGCAGCAGCATCGGCAACAGTTTGATCTACGGCAGCAGCAGCGTCTCCGGCAACAGCAGCTCGGCGGTGGCAGCCGCTGCTGCAGCTGCTGCTGCCTCCTCGCACTGTTTCTTCATGCAGCCGCAGTCGAATTACAGCTCCGGCTATGCCTCGCCAGCCTACACGCCCGAGACGAGCGTCAGCTACTATCAGCAGCAGCAGCAGACGCCGCAGACCTCGCCCGGTTCCACGGCCAATGGCAACGCGACGCAGCAGCAGTCCAGTTATGCAACGATCTATCCACAGTTGGACAGCCTCGATTCGGGCCTATTTGCCACCGGCAGCAATGCCACGCCCTCCTACGGTGAGCTACTAACGCCCACCTTTCATCAGACCATCAGCTATGGCAGCAACCAGCTCAACTCTTACAACGGGTATCAGCAGACGACGACAAATGCAGGAGGTGGCATTGCAGCCACCGTCGGTGGCTATAGTTCGTGTGCTGTGCCATCTGTGCCGCCGTTTGGAAATGCCACAACCACCGCCTCGAATGCGACGCAATATCAGAATGCGAATGCGTTAGGAACGACCGCCGCCACAATGATCAGCATCAGCAACAGCAGCAGCAGCAGCATATCCATAACGGCCAGCAGTTGTGCCACCGGCCTGGCCCGGATCGGTGGTGGTGGTGGTGGTGGTGTTGTTGTTGGCGCTGGCCCCGTGGATTTCATCAGCCTGAATGCGCCCATCGGCAGTTCGTCGCGTCTGTCACAGATCAACGACCTGTTGCAGCACAATCGTAATACCACCGTCGCTTTGGTTGCCGTCTCAGAGGGNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNCCAGTGGCACCACAACAACCATCAACACAAGCACCACCATCGATTCAATTGACACGCCGCCCATTGTGGAGGAGGCGCAGCGCAGCTGCATGACGTTCGAGGGCCTGCCACCGCCGCTAATCAATCCCACGCCAATTGTCGCCGTTCTCGATCAGCAGCCGCAGCACAAACAGCTCATGGGTGTGGCAACAACGCCACAACCACGCCAGCCGCTGGATGCCAGCGACAGTCTAGCCGAGTCCTTACCGAGCAGCAGCAATTAA
Protein Sequence: MRSMFRPIKKIFTYIQKNASAGTMFGTTASSIIKSEDASATSNTSSNQLAQAEKLELEQRLPLEQVQEVKAEQQQQLDDEDIERQIKTSIIDASKVHAAKAKLVQPLQLQLDDELADFADEPLALASVGVDVEEEEEEDDDDDDDDVVDEDLEEQFLELDNFPNNEIIVLSDQDLNSSLASDNISEDPLAIDDYAQKEVDDDEEEDEEEADSSGDLLWLKLDTPSAQLTIGSSSSVLPVAGCKISSSSSAAAVTAGTVIKPPTRRREEELRSDAGSDSGLGGENERQNTTTTATTITTTTSLQKPLRSNLKRRLDDDAMELELLPISSCSSSTQKRPKRSINFDNVKIYYFPRQQGFGCVPTAGGCTLGMGARHIAFKTMTLAEHASELRRAHRSQNQEQQQQQQQQAQQQLQQTRGSSSDDSEESEEDYLSEGSGSDADDGSNGFLQPVTPKQRRVLLKAAGVRKIDASEKIDCRDIRNSREVCGCSCREFCDPETCACSQAGIKCQVDRAMFPCGCSREACGNTVGRVEFNPTRVRTHYIHTVMRLDMEQRQSQAHSSAANSGSGSRSSIGNSLIYGSSSVSGNSSSAVAAAAAAAAASSHCFFMQPQSNYSSGYASPAYTPETSVSYYQQQQQTPQTSPGSTANGNATQQQSSYATIYPQLDSLDSGLFATGSNATPSYGELLTPTFHQTISYGSNQLNSYNGYQQTTTNAGGGIAATVGGYSSCAVPSVPPFGNATTTASNATQYQNANALGTTAATMISISNSSSSSISITASSCATGLARIGGGGGGGVVVGAGPVDFISLNAPIGSSSRLSQINDLLQHNRNTTVALVAVSEGXXXXXXXXXXXXXXXXXXSGTTTTINTSTTIDSIDTPPIVEEAQRSCMTFEGLPPPLINPTPIVAVLDQQPQHKQLMGVATTPQPRQPLDASDSLAESLPSSSN

Similar Transcription Factors

Sequence clustering based on sequence similarity using MMseqs2

100% Identity: iTF_00570381;
90% Identity: iTF_00609870;
80% Identity: -