Basic Information

Insect: Ephydra gracilis
Gene Symbol: CSRNP2_1
Assembly: GCA_001014675.1
Location: JXPQ01002550.1:19163-22882[+]

Transcription Factor Domain

TF Family: CSRNP_N
Domain: CSRNP_N domain
PFAM: PF16019
TF Group: Unclassified Structure
Description: This presumed domain is found at the N-terminus of cysteine/serine-rich nuclear proteins. These proteins act as transcriptional activators [1].
Hmmscan Out: # of c-Evalue i-Evalue score bias hmm coord from hmm coord to ali coord from ali coord to env coord from env coord to acc

1 5 0.16 3.3e+03 -2.0 0.0 78 119 95 136 77 150 0.65

2 5 0.11 2.3e+03 -1.6 0.3 60 103 157 200 136 227 0.54

3 5 0.12 2.6e+03 -1.7 0.0 27 121 408 508 405 509 0.55

4 5 4.4e-20 9.2e-16 58.6 0.2 1 41 507 547 506 551 0.94

5 5 4e-68 8.2e-64 215.7 9.6 86 217 555 686 547 687 0.89

#	of	c-Evalue	i-Evalue	score	bias	hmm coord from	hmm coord to	ali coord from	ali coord to	env coord from	env coord to	acc
1	5	0.16	3.3e+03	-2.0	0.0	78	119	95	136	77	150	0.65
2	5	0.11	2.3e+03	-1.6	0.3	60	103	157	200	136	227	0.54
3	5	0.12	2.6e+03	-1.7	0.0	27	121	408	508	405	509	0.55
4	5	4.4e-20	9.2e-16	58.6	0.2	1	41	507	547	506	551	0.94
5	5	4e-68	8.2e-64	215.7	9.6	86	217	555	686	547	687	0.89

Sequence Information

Coding Sequence: ATGTTTAGACCAATTAAGAATTTCATCACGTACATACAGAAGAATGCCAGTGGGAGCACAATGTTCGGAAGCGGATCAACGACGACATCAACTATTGAGAGCAGCGCACAGCCTGAAATTACGACGGAGCAAATGCAACCAAGCGAGCAGGCCTTAGAAATAGCGGGAACGGAAGCAACTAGAGCAGCAATGAACGGCACAACCAGCGACAGGAGTGGCAGCAGCGGTAGCAACACCGTCAACANNAGCGGCAGCCGCGGTAGCAACACCGTCAACACGCCTCGAATAACAAATGAAACAGCAAAAGTGATAGAGTCGAGCGCAGCAACAGGTTACAGCGATGCCGATGCCGATGACATCGAGTTGCAGATAAAGAGCTCCGTCATGCTTAAGCCCACGCCCGTGCACACGAATGGCTGCGGAGCGCTGGTGCGAAAAGATGCCTTAACATTGAAGCAAATAGCCAGCGCCGCACTGCAAAAGCAGAAGCCCAATTGGAATGCCGAGTATAGGCAACACAATGCCACAACCAGCACAACAAGAGCCCAAAGCGATACTGCGCTGACGGACGCAGATCCATTGCAAGTGGAGCCAGCGGAAGACATGGACGAAGCATTGAGCGTAGCTCAAACGCCAACTGCAGACGCATGCCAGCAGCGTAGCGAATGCCTGGATAGCCGGCTTGCCACGCCAATCGATGATGAATTGCAAGATTTCGCGCATGATCCGATGGCACATATGCTCAACGACGACATCTGCTCGTTGGACAGTGCCACGGAGCGTACCGCCGATGAGGAGACCCTAGAAGACTTCATCACAGAGGAGGAAGTGGAGGTGGATGTGCAAGACTGCGACGACAGCTTCATCAAATTGGAGGATTTACGCAATCCTGATCTGATCATCGTAAATGACAGCGATTTGAACAGTTCCATTGCGTCGGATGCGCTGTCTGAGGATCCTCTGGCGACTGACAATGAAGTGCCTGTCGCTGGGGTGCTGGACAATTCGACAAATGACGACGCATCGGCGGGCAGCGTCGACATGCTCTGGGATATTAAGTTGCATGACGTGCATGCAGCGAACGTTGAGAGTGACGGTGGCATTGACAGCGTGGAGAGCACGCCCCAACGCTGCAAGGCgcagcagcaccaccagcaATCGCATGCGATTACACCAAAGAACGACAGCGCAATTGCAGGCGAACAGCCAGAAGAGCTGCGCAGCGACGGCGGCTCTGACTCGGGCTTAGGCAGCGAGACACCCGCGGCGCTGCAGACGACACTGCAAAGCCCTGGTATAGACAAAACGCAGAGCGACGGGAAGTTCCTGGACCAAATGAAGCCAAATGCAGTTGCGGCTAATGCTACACACCATAACGACGAGACGCACGGAGAATCAACGAAAACGGTGTCCCTGGTGCAGAAGCCGTTGCGCTCCAATCTGAAGCGTCGCCTTGAAGCTGACGCCGATTCGCTTGACCTAACGGATGGCACAACTGGCTCGTTGTTGCCGACTAAGAAACAGAAACGCTCGATAAACTTTGACAGGGTGCAAGTTTATTATTTTCCGCGCCAACAAGGTTTTGGCTGTGTGCCCTCCGCCGGCGGTTGCACACTGGGCATGGGGGCGCAACATGTTGCCGAGAATCCGCGCGGCTCGTCGAGCGAGGAGAGCGAAGAATCCGAAGAAGACTATCTCAGCGAGGGGAGCGGCTCCGATTTGGATGCGGAGTCGAATGGCTTTCTGCAGCCGATGTCGCCAAAACAGCGGCGAGCTTTGTTGAAAGCGGCTGGTGTGCGCAAAATCGACGCTAGCGAGAAATTTGAATGTCGTGATATACGCAACTCACGCGAAGTGTGCGGTTGTACTTGTCGTGATTTCTGTGATCCGGAGACATGTGCGTGCAGTCAGGCTGGCATTAAATGTCAGGTCGACCGCGCAATGTTCCCATGCGGATGCTCACGTGATGCTTGTGGCAATACTGTTGGGCGTGTCGAATTCAATCCAGCGCGTGTGCGGACGCACTTTATACACACGCTGATGCGTCTCGAGATGGAACATCGCTACGCCTCGCCCGCCTACATGCCTGAGCAAAACGCGAACAGCAGCGCCAACGTTTACTTTCAACAAACAACGGCAACGAGTGCGCACTTTGTCAGCGAATTGCACAGCACGACAGCTGGCGTGGCGGCGGCCATAGGCGGTGGCATACCAGCACAGTATCATCAGCTAGACAGCCTCGATGGCGGGCTCTTCAGTCATGCGGCACAGATTAACGGTCCAACAGCGCCTGCATATGGCGACATGCTACCCAACTACAACACCAACCCTGGCGCCGCAACCACCGGCTATCATACGCTCAATTATGGCAGTGCAACACCTGTTTCCTTGTACTCCAGCTACCATCATACGCTGACGACGACGAATTACGTCAATGCGGTGAGTATTAACAACACGTTTAGCTCGTGCGCGGTGCCTACGGCGCCACCATGCGGAAGCGCAACTACAACTGCCAGCGCAATAGACACACACTATCAGAACAGCGCGCCATGTTTGGCGCTCAGCACGATCACGCCAAGCTctataacaacaacaactttaaaaaCAAGCACGACTGAGCACGTCACCAGCAGTTTCATCAATTTGAATACGCCTGTTGCCAGTTCCTCACGCCTCTCACAAATCAACGATCTGCTGCAGCACAACCGCAACACGACCGCGGCCTTGGTGGCGGTGGCGAAATCACCGAACCTTCTGCTGGGAACCCGAAATTTTCACGAGCTGACCAAAGACGCTGCGACCAAGTTAGACACGCTTGCTGCCTCCGATTCCATAAATACGCCACCCATCATCGAGCCGCCTGCCGCCAACAGCCACACATTCGATTGCGCCGATTCCTTGGCCACGCCAGCTAGTCTAAGCACAACGCAGAACAACTTTATGTCGAATACCGACAGCACACCCGGTGCCAGTTTGCAGCCCATACAAATGGAGCCACCACCTTAA
Protein Sequence: MFRPIKNFITYIQKNASGSTMFGSGSTTTSTIESSAQPEITTEQMQPSEQALEIAGTEATRAAMNGTTSDRSGSSGSNTVNXSGSRGSNTVNTPRITNETAKVIESSAATGYSDADADDIELQIKSSVMLKPTPVHTNGCGALVRKDALTLKQIASAALQKQKPNWNAEYRQHNATTSTTRAQSDTALTDADPLQVEPAEDMDEALSVAQTPTADACQQRSECLDSRLATPIDDELQDFAHDPMAHMLNDDICSLDSATERTADEETLEDFITEEEVEVDVQDCDDSFIKLEDLRNPDLIIVNDSDLNSSIASDALSEDPLATDNEVPVAGVLDNSTNDDASAGSVDMLWDIKLHDVHAANVESDGGIDSVESTPQRCKAQQHHQQSHAITPKNDSAIAGEQPEELRSDGGSDSGLGSETPAALQTTLQSPGIDKTQSDGKFLDQMKPNAVAANATHHNDETHGESTKTVSLVQKPLRSNLKRRLEADADSLDLTDGTTGSLLPTKKQKRSINFDRVQVYYFPRQQGFGCVPSAGGCTLGMGAQHVAENPRGSSSEESEESEEDYLSEGSGSDLDAESNGFLQPMSPKQRRALLKAAGVRKIDASEKFECRDIRNSREVCGCTCRDFCDPETCACSQAGIKCQVDRAMFPCGCSRDACGNTVGRVEFNPARVRTHFIHTLMRLEMEHRYASPAYMPEQNANSSANVYFQQTTATSAHFVSELHSTTAGVAAAIGGGIPAQYHQLDSLDGGLFSHAAQINGPTAPAYGDMLPNYNTNPGAATTGYHTLNYGSATPVSLYSSYHHTLTTTNYVNAVSINNTFSSCAVPTAPPCGSATTTASAIDTHYQNSAPCLALSTITPSSITTTTLKTSTTEHVTSSFINLNTPVASSSRLSQINDLLQHNRNTTAALVAVAKSPNLLLGTRNFHELTKDAATKLDTLAASDSINTPPIIEPPAANSHTFDCADSLATPASLSTTQNNFMSNTDSTPGASLQPIQMEPPP

Similar Transcription Factors

Sequence clustering based on sequence similarity using MMseqs2

100% Identity: -
90% Identity: -
80% Identity: -