Basic Information

Insect: Scaptomyza caliginosa
Gene Symbol: CSRNP3_1
Assembly: GCA_035044725.1
Location: JAWNNR010000310.1:989563-992300[+]

Transcription Factor Domain

TF Family: CSRNP_N
Domain: CSRNP_N domain
PFAM: PF16019
TF Group: Unclassified Structure
Description: This presumed domain is found at the N-terminus of cysteine/serine-rich nuclear proteins. These proteins act as transcriptional activators [1].
Hmmscan Out: # of c-Evalue i-Evalue score bias hmm coord from hmm coord to ali coord from ali coord to env coord from env coord to acc

1 5 0.31 5.1e+03 -3.0 0.3 80 101 50 70 30 98 0.48

2 5 0.17 2.8e+03 -2.2 0.7 78 108 152 182 118 205 0.71

3 5 0.12 1.9e+03 -1.6 0.0 27 64 239 279 236 298 0.71

4 5 1.9e-99 3.1e-95 318.1 11.4 2 217 302 514 301 515 0.91

5 5 0.46 7.5e+03 -3.5 0.2 77 98 794 812 766 831 0.46

#	of	c-Evalue	i-Evalue	score	bias	hmm coord from	hmm coord to	ali coord from	ali coord to	env coord from	env coord to	acc
1	5	0.31	5.1e+03	-3.0	0.3	80	101	50	70	30	98	0.48
2	5	0.17	2.8e+03	-2.2	0.7	78	108	152	182	118	205	0.71
3	5	0.12	1.9e+03	-1.6	0.0	27	64	239	279	236	298	0.71
4	5	1.9e-99	3.1e-95	318.1	11.4	2	217	302	514	301	515	0.91
5	5	0.46	7.5e+03	-3.5	0.2	77	98	794	812	766	831	0.46

Sequence Information

Coding Sequence: ATGAGGAGCATGTTCCGTCCGATTAAGAAGATTTTCACGTACATTCAGAAAAATGCCAGCAACGGAACAATGTTTGGCACCACAACAAGCATACTGAAGCTGGAGGATGAAGGCGCCGCTGcaagcagcagtggcaatAACCTGGAGCAGGAAGATCAGCTGCAGCGGGAAGTGGAGGCGGAACAACAACTCCAGCCGGATGACGAGGATATTGAGCgtcaaataaaaacatcaatCATTGATGCAAGCAAGGTTCatgcagccaaagcaaaacttgCGCTTCccctgcaactgcagctggacGATGAGCTGGCTGATTTTGCGGATGAACCTATAGTATTGTCAAATGGTATTGTAAGAGAGGAGGaggacgacgatgatgatctGGAAGAACAGTTTCTGGAACTAGAGAATTTTCCCAATAATGAGATAATTGTACTAAGCCATCAAGATCTTAACTCATCGCTTGCCTCTGATAACATATCTGAGGATCCGCTGGCCATAGATGACTTTAGGCAGAAAGAGGctgacgaggaggaggaggaggctgACAGCAGCGGTGACCTAATGTGGCTTAAACTGGATACGCCAACTACTATCagaaccagcagcagcgttcTTCCCGTTTCaggctgcagcagctcttTACAAGCttcgacaacagcagctacaccCGCTAAGCCACCGGCCAGGCGAAGGGAAGAGGAGCTGCGCAGCGATGGTGGCTCCGATTCTGGCTTGGGCAGTGAAAATGATAGACATaataccacaacaacaacaacaattgcaacaacagcaagtttGCAAAAGCCACTGCGCTCGAATTTAAAGCGTCGTCTTGTTGACGATGCCATGGAGCTGGCTTTGCTGCCCATCTCAAGCTGCTCTAATACACAAAAGCGCCCAAAACGTAGCATCAATTTTGACCACGTTAAAATCTATTATTTTCCACGGCAACAAGGCTTCAGCTGTGTGCCCACGGCCGGTGGCTGCACGCTTGGCATGGGCGCCCGGCATATTGCCTTTAAGACCTTGACATTGGCGGAGCATGCCTCCGAGTTGCGGCGCGCACATCGCAGTCAAAATCAGGAGcttcatcagcagcatcagcaacaagcgcagcagctgcaagcaCGCGGTTCAAGTAGCGATGATAGCGAAGAATCTGAAGAGGATTATTTGAGCGAAGGCAGCGGCTCCGATGCTGACGATGGCTCCAATGGCTTTCTGCAGCCGGTGACGCCCAAGCAGCGACGTGTTCTGCTTAAAGCAGCCGGCGTGCGCAAGATCGATGCCAGCGAGAAGATTGATTGTCGGGATATACGCAACTCACGCGAAGTGTGCGGCTGCTCGTGCCGCGAATTCTGCGATCCGGAGACATGCGCTTGCAGCCAAGCGGGCATCAAGTGTCAAGTAGATCGTGCCATGTTCCCCTGCGGTTGCACTCGCGAAGCTTGTGGCAATACTGTTGGTCGTGTGGAGTTCAATCCGACGCGAGTGCGCACCCACTACATACACACTGTGATGCGTCTGGACATGGAGCTGCGTCAGAGCCAGGGACAGTCGTCggcgaacagcagcagcagcggcaatggtTTGGTTTACGGCAGCAGCGTGCCTGGCAACAGCACTTCCGGCACTGTATCACCCTCTGCTGCATCTGGCGCCTCCTCCACCCACTGCTTCTTCATGCAACCTCAATCGAACTATAGCTCCGGCTATGCCTCGCCAGCTTACACGCCCGAGACGAGTGTAAGCTTctaccagcagcaacaacaaacgcctTTGGCAGCACATACATCACCGGTTGccgcaggcaacagcagcacggTGCAGCAATCCAGCTATGCCACAATCTATCCGCAGTTGGATAGTCTTGATGCTGGCCTTTTCGCCACCGGCAGCAATGCCACGCCCTCCTACGGTGAGCTCTTAACGCCCACGTTTCACCAGTCCCTCAGCTATGGCAGCACTCAGCTCAACTCTTACGGCTCGTATCAGCAGACAACGGCTACAGCTGGTGGCATTGCGACGTCGCCTGTTGGTTACAGCTCGTGTGCGGTGCCATCGGTGCCGCCATTTGGCAATGCCACAACCACCGCCTCGAATGCGACACAATATCAGCATGTGAATGCATTAGAAACCACCGCCGCCACATTgataaacaacagcagcagcagaagcataTCCATTACGGCTAGCAGCTGTGCTACTGGCCTGGCACGTCTCGGTGGCGCTGGACCTGTAGACTTTATCAGTCTGAATGCGCCCATTAGCAGTTCGTCGCGTTTGTCGCAGATCAATGATCTGTTGCAGCATAATCGTAATACCACCGCCGCTTTGGTTGCCGTCTCCGAGGGCTATGCCGCTGTgcgcaatagcaatagcagcagcagcagcagcagtagcacaaATACCAGCacgaacaacacaaacagcaccACCATTGACTCAATTGACACGCCACCCATTGTGGAGGAGGCGCAGCGTAGCTGCATGACCTTTGAGGGGCTGCCACCGCCGCTTATAAATCCCACGCCAATTGTCGCCGTTCTTGAGCAGCCGCACAAACAACTATTGGCTGTGTCCACAACGCCACAGCCACGCCAGCCACTAGATGTCAGCGCCAGTCGTACTGAAACGCTATCGggaacgagcagcagcagcaactaa
Protein Sequence: MRSMFRPIKKIFTYIQKNASNGTMFGTTTSILKLEDEGAAASSSGNNLEQEDQLQREVEAEQQLQPDDEDIERQIKTSIIDASKVHAAKAKLALPLQLQLDDELADFADEPIVLSNGIVREEEDDDDDLEEQFLELENFPNNEIIVLSHQDLNSSLASDNISEDPLAIDDFRQKEADEEEEEADSSGDLMWLKLDTPTTIRTSSSVLPVSGCSSSLQASTTAATPAKPPARRREEELRSDGGSDSGLGSENDRHNTTTTTTIATTASLQKPLRSNLKRRLVDDAMELALLPISSCSNTQKRPKRSINFDHVKIYYFPRQQGFSCVPTAGGCTLGMGARHIAFKTLTLAEHASELRRAHRSQNQELHQQHQQQAQQLQARGSSSDDSEESEEDYLSEGSGSDADDGSNGFLQPVTPKQRRVLLKAAGVRKIDASEKIDCRDIRNSREVCGCSCREFCDPETCACSQAGIKCQVDRAMFPCGCTREACGNTVGRVEFNPTRVRTHYIHTVMRLDMELRQSQGQSSANSSSSGNGLVYGSSVPGNSTSGTVSPSAASGASSTHCFFMQPQSNYSSGYASPAYTPETSVSFYQQQQQTPLAAHTSPVAAGNSSTVQQSSYATIYPQLDSLDAGLFATGSNATPSYGELLTPTFHQSLSYGSTQLNSYGSYQQTTATAGGIATSPVGYSSCAVPSVPPFGNATTTASNATQYQHVNALETTAATLINNSSSRSISITASSCATGLARLGGAGPVDFISLNAPISSSSRLSQINDLLQHNRNTTAALVAVSEGYAAVRNSNSSSSSSSSTNTSTNNTNSTTIDSIDTPPIVEEAQRSCMTFEGLPPPLINPTPIVAVLEQPHKQLLAVSTTPQPRQPLDVSASRTETLSGTSSSSN

Similar Transcription Factors

Sequence clustering based on sequence similarity using MMseqs2

100% Identity: iTF_01323364;
90% Identity: -
80% Identity: -