Basic Information

Insect: Hydrotaea diabolus
Gene Symbol: CSRNP3_1
Assembly: GCA_963513945.1
Location: OY740717.1:141956179-141963156[+]

Transcription Factor Domain

TF Family: CSRNP_N
Domain: CSRNP_N domain
PFAM: PF16019
TF Group: Unclassified Structure
Description: This presumed domain is found at the N-terminus of cysteine/serine-rich nuclear proteins. These proteins act as transcriptional activators [1].
Hmmscan Out: # of c-Evalue i-Evalue score bias hmm coord from hmm coord to ali coord from ali coord to env coord from env coord to acc

1 4 0.098 3.3e+03 -1.4 1.8 53 108 27 81 13 100 0.50

2 4 1 3.3e+04 -6.7 5.8 80 80 257 257 198 303 0.54

3 4 0.27 8.8e+03 -2.8 4.1 72 121 264 313 234 322 0.68

4 4 1.4e-94 4.6e-90 302.2 7.6 2 218 548 750 547 750 0.92

#	of	c-Evalue	i-Evalue	score	bias	hmm coord from	hmm coord to	ali coord from	ali coord to	env coord from	env coord to	acc
1	4	0.098	3.3e+03	-1.4	1.8	53	108	27	81	13	100	0.50
2	4	1	3.3e+04	-6.7	5.8	80	80	257	257	198	303	0.54
3	4	0.27	8.8e+03	-2.8	4.1	72	121	264	313	234	322	0.68
4	4	1.4e-94	4.6e-90	302.2	7.6	2	218	548	750	547	750	0.92

Sequence Information

Coding Sequence: ATGTTTACACCCATTAAAAGCCTAATAACGTATATACAAAAGAATGCCAGTTTTGGATCAAATACAGCAGCAGCCGAAGAAACCACTAAAATGGAAACCGAACAGTTAAAAGGTCAAAACGAAAGCACTGAAGGTGCATCTTTAAATGGAGATAAAGCTCCGTCATCCAGTGAAGATGATTCAACGAAAGAAAGAACTAAAAGTCCGATAAAAGACAAAGACACACAAACAGCGGAAACTACCACAGCTACCACATCTTCGCCTGCAGCTTCCAATGCAATCGCATTGAGAACGTCGCCGAGAAAAAATGCGACTGTGCCACCACCTAAAACAACAGCCACAGCGCCAACAACATCATCACCTACATTTGAAGACGATGATATTGAGGCACAAATCGAAAGTAGTATTATGTTGAAGAAGCCCGTCAAAGATGCCACAACCAATGGCACCGAAATTGTGGAACTAAAGAAATCGCCCGATCGTAGTGTTTTCATAAGTCACGATTATAATCGCAATCAAACGGCAACGCCCATCGACGACGAGCTGGAAGACTTTCGCCACGATCCCACAGAAATTGCAACATCATCGCCACTAAATACGACGAATATCGATGACAACTGTTCGGTGGATAGTGCAGAGGAGGCCAAGGATTGTAGCGCTGACGACAATGCTACGGAATGTAGTACAATTAATCTGGAAGAAGAGGACAAGTGCGACGATGGCAATGATGATAAGACAGAGGACGGAGCTGATATGATAGACTTAAGTAGAAACGAGAGTGGAAATGAAAGCGCTGAAAAGGTTATTTTAGTGGATTCTGAAGTAGAGGATGATTTGGATGAAGTCGTTGATATGGTAGATGAAGAAGAAGAGGACGAATTGGAAGAGGAGGACGTCGCGGAGGAATCGTTCTTAGACATTGATCAATTTACAGaTAGAGAAGTTATTGTCATCAGTGAAGATGCGCACGAGAACAGCGATATAATACCCATAGAAATCATAGACATAACAAATACAAGCGATGACCCTTTAGCTATTGCTTGCGAAGAACGCGAAGCATTTGCCACGGACAAAATAGCCGCTCTAGAAGAACTGAATTTACTAAATGCAAGTGGAAATTCTCAAGACGAAGACACCGCAACTACTGCAACGGACGACGATCTAATGTGGTTGAGAACCGATGCAACACTGCGTGACGAACAGCCTTCGTGCAGCAAAAGTTCAGCCAAGATTCCGACTACAAGTGGTACAACGCCCGAAAAGGATGAACGGAATGGTGAGGGATCGGATTCAGGATTAGGTAGTGAAACGTCAACATTGCACACAACCAACACGAGCATAGCGGACACCAGTCAACTGAATACGACGTCGTCGGCGGCGACACCCACCCAATCGCCCAGCAGTAGTCAAACACGTAGGAGTTCCGAAAAAGACAGTGATAAATTGACGGTGTCGAACCTCGTTCAATCGCCTTTGAAGGAATCTCCGAAACCATTGCGTTCGAATCTTAAGAGGCGCCTTGAAGTCGATGACGATGTTGTTGACAGTTTGCGAACTTTAACATCGTCTGCATCCACCACCGCAACCACTTCATCGTTAAGTGTCAATCACAGTGCAATGAGTGGAAGTTTACACAAGAAACCAAAGCGttcaattaattttgataatgtGCAAGTCTATTACTTTCCCCGACAACAAGGCTTTAGTTGTGTGCCTTCAGCGGGCGGCTGTACCCTGGGAATGGGTGCCCGTCACGTGGGTTTTAAAACCTTGACTCTGGCAGAACATGCTGCGGAATTGCGACGAGCACATCGCATGCAACTACAGGAGATAAATCCCCGGGGCTCTTCCAGCGATGATAGTGAAGAATCTGAAGAGGACTATTTGAGTGAGGGCAGTGGTTCAGATCTGGATGGTGAATCGAACGGTTTCTTACAGCCCGTCTCGCCCAAGCAGAGAAGGGCCGTCTTAAAAGCAGCGGGTATTCGAAAAATCGATCCTAGTGAAAAGGCGGAATGTCGCAATATACGCAATAGTCGAGAGGTGTGCGGTTGTACGTGTCGTGACTTCTGTGATCCGGAAACATGCGCCTGCTCACAATCGGGCATCAAATGCCAAGTTGATCGTGATATGTTTCCATGTGGATGCTCTCGCGATGCGTGCGGCAATACAATCGGCCGAGTTGAATTCAATCCAGCCCGCGTGCGCACCCATTTTATACACACTCTTATGCGCCTGGAAATGGAGAATCGACAACAGCAAAATCCCTATTCACCTGCCGTCGTACCCTCAGCCACAGCAACATCGTCTTCGTATTACCAATCACATTTGCAGCCACAATCGAATTACAGTTCTGGTTATGCCTCACCTGCTTACAACGCGACCGCGGAGATAAACCAACAAACAGCAGCTGCCAATACGTACTACCATCAACCAACACCTTCCAATGCTAGTAGCCTGTACGGCGGGCAGCCTACTTCAATTGAAATGCCACTAAGTGGCAGCAGTGCCTCTACAACATCCGTTGCTGCAGCGACGCCATACGGCATGGATAGTTTGGATTCCGGCTTATTTGGTGGCGCGGGAGCTGGTGCCACACCCTCATATGGTGAACTGATGCCAGTATCATCATATCATCACCACAATATGAATTTCGGAAATGTACAAACACAGCCACGTTCTCGACAAAAGTATAAGATGGGACGCCGCAATTGA
Protein Sequence: MFTPIKSLITYIQKNASFGSNTAAAEETTKMETEQLKGQNESTEGASLNGDKAPSSSEDDSTKERTKSPIKDKDTQTAETTTATTSSPAASNAIALRTSPRKNATVPPPKTTATAPTTSSPTFEDDDIEAQIESSIMLKKPVKDATTNGTEIVELKKSPDRSVFISHDYNRNQTATPIDDELEDFRHDPTEIATSSPLNTTNIDDNCSVDSAEEAKDCSADDNATECSTINLEEEDKCDDGNDDKTEDGADMIDLSRNESGNESAEKVILVDSEVEDDLDEVVDMVDEEEEDELEEEDVAEESFLDIDQFTDREVIVISEDAHENSDIIPIEIIDITNTSDDPLAIACEEREAFATDKIAALEELNLLNASGNSQDEDTATTATDDDLMWLRTDATLRDEQPSCSKSSAKIPTTSGTTPEKDERNGEGSDSGLGSETSTLHTTNTSIADTSQLNTTSSAATPTQSPSSSQTRRSSEKDSDKLTVSNLVQSPLKESPKPLRSNLKRRLEVDDDVVDSLRTLTSSASTTATTSSLSVNHSAMSGSLHKKPKRSINFDNVQVYYFPRQQGFSCVPSAGGCTLGMGARHVGFKTLTLAEHAAELRRAHRMQLQEINPRGSSSDDSEESEEDYLSEGSGSDLDGESNGFLQPVSPKQRRAVLKAAGIRKIDPSEKAECRNIRNSREVCGCTCRDFCDPETCACSQSGIKCQVDRDMFPCGCSRDACGNTIGRVEFNPARVRTHFIHTLMRLEMENRQQQNPYSPAVVPSATATSSSYYQSHLQPQSNYSSGYASPAYNATAEINQQTAAANTYYHQPTPSNASSLYGGQPTSIEMPLSGSSASTTSVAAATPYGMDSLDSGLFGGAGAGATPSYGELMPVSSYHHHNMNFGNVQTQPRSRQKYKMGRRN

Similar Transcription Factors

Sequence clustering based on sequence similarity using MMseqs2

100% Identity: -
90% Identity: -
80% Identity: -