Basic Information

Insect: Teleopsis dalmanni
Gene Symbol: CSRNP3_1
Assembly: GCA_002237135.5
Location: CM026972.3:21548917-21554157[+]

Transcription Factor Domain

TF Family: CSRNP_N
Domain: CSRNP_N domain
PFAM: PF16019
TF Group: Unclassified Structure
Description: This presumed domain is found at the N-terminus of cysteine/serine-rich nuclear proteins. These proteins act as transcriptional activators [1].
Hmmscan Out: # of c-Evalue i-Evalue score bias hmm coord from hmm coord to ali coord from ali coord to env coord from env coord to acc

1 3 0.87 1.3e+04 -2.9 0.2 43 112 37 105 28 116 0.39

2 3 9.2e-93 1.4e-88 297.8 10.2 1 218 410 613 410 613 0.92

3 3 2 3e+04 -4.1 2.7 68 77 1051 1060 1002 1139 0.52

#	of	c-Evalue	i-Evalue	score	bias	hmm coord from	hmm coord to	ali coord from	ali coord to	env coord from	env coord to	acc
1	3	0.87	1.3e+04	-2.9	0.2	43	112	37	105	28	116	0.39
2	3	9.2e-93	1.4e-88	297.8	10.2	1	218	410	613	410	613	0.92
3	3	2	3e+04	-4.1	2.7	68	77	1051	1060	1002	1139	0.52

Sequence Information

Coding Sequence: atgtttAAGCCGTTCAAGAACTTCATTAGTTATATACAAAAGAATGCCACTTCCACGACAATATTTGGTGCTCAATGTAATATAGCCAATAACAGCGAAGCTGAGCAGCAATCGCTAACTTTACCCTCTAATTGTAGAGAAAGTCAAGATTCTCCTAAGAGAAAAGCAacggatattttaaaaaaaatggaaccGACGAAAAAAATGAAACTTGAGGATTACAGTGTTGCCACTGTAATTGATAAGGACATCATGAAAAGTAATTTTGACTATGGTGATGTCGATATagaaacacaattaaaaactaCAATTATACCATTAAAAATACCGACGAAAAGCAGTAAAAATGCCTTCTGTGGTGATAATGACGAAAAAGAAATTATCgtttcagaaaatttaaatgaaccgGAAGGTATTAATGGTAAAGAATATATCAATTTgcaaaataaggaaataaatgGCTCAACTGAAGACTTTTACTCGGTAAGCAGTATTGAACTGAATTGTGATGAAGACACAGCTGAAGAGATCGTCATCGAAGACGAAGATGTGGaagaaaattttgttgatttatcaCAGGACGAGGATACTTATACTGCTGATAGAGAAATAATTGTGATAACTGATGTGGAAATGAATTCGTCTTTAGCTTCGGAAGCTCCTTCTGAGGATCCACTAGCACTTGAGGATTTTGCATCCGCTTGTagcaaaaaaacattttcaacatctATAGATGAATCTACAATTGATGAAGGTTCAGCTAACGAAGATATTATATGGTTAGATGTTAGTTCAGAAAAGTCAAAAGAATCAATAACACTACATTTCGATAAGGACTTATGTGATACCACACCAAATAGCACTTTATCTAGTTCATCCATAGAAACACCACAACGAACTGCACCAAAGTCAGCACACTCTCAAGAAAGTAACTTAATCAGCAGTCAAACGACTGCCGTTGTTGATACCACAGACGAGCTGCCCAGTGATAATTCAGACTCAGGTTTAGGTAATGAAACTATAAGATGCACTATAGATGCTAACTCCTTAGCTGCTGCCTCAAGCACAACACCAAAATCGCCACTACAAAAATCTaccaaacaaaatgaaaattttgttaatacttCGCCAAATCATTCGATAACTCCACTTAGAAGTGCGTTGCGGTCCAGTCTAAAGCGCCGTTTTATAGATAATAGCACTGAATCAGGAGTAGTGGATGAAAAAAAAGAGAAGcgttcaattaattttgactCAGTGCaagtgttttattttccacGGCAACAAGGTTTTGGATGTGTGCCATCGACAGGTGGTTGTACCCTTGGTATGGGTGCGCAGCATGTATCTTTTAAAACTCTTACCTTAGCTGAACATGCTGCAGAAATCAGACGTGCCCATCGGTTACAATTACAGGAGATAAACCCGCGCGGCTCTTCTGAGGATGAGACTGAAGAATCCGAAGAAGACTATTTGAGTGAAGGCAGTGGATCAGATTTAGATGGTGAAACAAATGGTTTCCTACAACCAGTTTCTCCACGGCAAAGACGATCAATATTAAAGGCAGCGGGAGTACGTAAAATTGATGCAAGCGAAAAAAAGGAATGCAGAGATATACGAAACTCTCGTGACAATTGTGGATGCACTTGTCGAGATTTTTGTGATCCGGAAACATGTTCATGTAACCAAGCAGGGATCAAGTGTCAGgTTGATCGTCTTATGTTTCCCTGTGGTTGTTCACGAGATGCATGTGGTAATACTATCGGTCGCGTGGAATTTAACCCATCACGTGTACGTACGCACTTTATTCATACAATTATGCGTTTAGAAATGGAGCAGCGTCCTCAGCAAAGTCCAAACAATGGTCTCGGCTATGGTTTACAGTCAGTTGGGGCACACGTGTTAAATTCACCACCGCATCAGCtcgcaacaaatttttatttatcaaatatgcATTCACAATCAAACTATAGCTCAGGATATGCCTCACctgcttataataataatgaacataCTGCCAATTATTATCAGTCGCAACAAGATCACCAACAGTTACCTCCTACGCATTACAATAGCGTATCAAGCACACATTTTGGGCTAGAAGGTTTAGATTCAAATCTATTTAATGGCACTACCAGTTCAACACCTGCTTATGGCGAAATAATTCCTGCCTATGGTAATATGAGCACTGCCCCTTCTCATACACCGTATTATACCATCAATTATCCAAATGTTAATACTGGTATACAAAATCAGgTATCAGAATATTCACCTTACCATCTGCCTTCATCCACGAGTTACCTACCACAAGCAACATTTAGTTCGTGTGCGGTACCTTCTGAACCACCGTACGGTTCGGCTACAACTACAGCAACTACTACGCAGTATCATAGTGGTTCTCCAATAAGCCTTGATACCACCGCCTCAACTAGTTGCACTGCAATTGAAGCAAGCGaaactaatttcattaatttgagCGCCCCAATCGCTAGTTCCTCGCGCTTGtcacaaataaatgatttactACAACATAATCGGAATACCACAGCAGCCTTAGTAGCTGTTACAGAGAGTGCGactgcgagtgcgagtgcaagtgcgAGTACAAACTGTTTAGCGTCACATACCGTAGTACTTTCACATACAGTAACAGTCGTAAATGATTCCATAGATACTCCACCGATTGAAAACATGCCCAAGCCGTACACAGTTTTCGAGGAACTGAAACCAGCAATAATTGTTTCTGATATAAGTAAGCAATGCAACGATGAAATTGAATTAGAAACTGTATGTATCGATAGTGACAGCAGCGTAGAAGTAGTTGATGTTGATAAGTCTACCGAACTAAATTGCAATTCACCAGTTGACATAATTGTAGATAATCTAGATGCcgttattgaaattaaatcgGATGATTTTGACGCCGCTGATGTTGATAATATTGATAAAGgaaatgataaaaatgatatagaagaaataattgaaataaaaactgatGGCAACTTTGTGGAAAGTCAGAATATAGAAAAGCTAGATTATACAGAAAATGCTGGAGACAATGAAGAATtagttgagaaaaaaattataagtgatTTCGTAGAAAACGTGGAAGCTaatgaaactaaaaatgaaatacaaaacagTGAACCAGAGCAACACATTGAGACGGTTACAATCacaaaagcaattttaattattgagacTGTCGAGGATACAGATAATTCTAAGAGTTTAGATAACAGCATGGAACTTACAGAAGCTTTAACAACTCGCAAGGAAATTATTGATGAGATTAATGAAAATACTAATGATACTAAAATTAGACTTATCAAGAATGAGACAAATGATGTAGATGttgttgaaaaaattgattgtaTTAACGCAAGTAACGCAAGTTGCGAAGTAGTTGATAAAGAAGAAGAACTTAAGCATTCTGTTTGTATAGATGTTGAAAATTCTCCAGAAGTAGTAGAATCTGTAgaagtaaaactaaatatttgtgCTGAAACAGAAAAAGTGAATTGTATTGaagataaagtaaataaatctgTTGTACCAGAAGTTCATGAAGAAACAGCATGCTCTGGACAACTAACTCAAAAAATTCAAAGTTCTGTGGAAGCTGAAAATATTGATAACATATCTGGTAAACCAGTCAAATGcgattaa
Protein Sequence: MFKPFKNFISYIQKNATSTTIFGAQCNIANNSEAEQQSLTLPSNCRESQDSPKRKATDILKKMEPTKKMKLEDYSVATVIDKDIMKSNFDYGDVDIETQLKTTIIPLKIPTKSSKNAFCGDNDEKEIIVSENLNEPEGINGKEYINLQNKEINGSTEDFYSVSSIELNCDEDTAEEIVIEDEDVEENFVDLSQDEDTYTADREIIVITDVEMNSSLASEAPSEDPLALEDFASACSKKTFSTSIDESTIDEGSANEDIIWLDVSSEKSKESITLHFDKDLCDTTPNSTLSSSSIETPQRTAPKSAHSQESNLISSQTTAVVDTTDELPSDNSDSGLGNETIRCTIDANSLAAASSTTPKSPLQKSTKQNENFVNTSPNHSITPLRSALRSSLKRRFIDNSTESGVVDEKKEKRSINFDSVQVFYFPRQQGFGCVPSTGGCTLGMGAQHVSFKTLTLAEHAAEIRRAHRLQLQEINPRGSSEDETEESEEDYLSEGSGSDLDGETNGFLQPVSPRQRRSILKAAGVRKIDASEKKECRDIRNSRDNCGCTCRDFCDPETCSCNQAGIKCQVDRLMFPCGCSRDACGNTIGRVEFNPSRVRTHFIHTIMRLEMEQRPQQSPNNGLGYGLQSVGAHVLNSPPHQLATNFYLSNMHSQSNYSSGYASPAYNNNEHTANYYQSQQDHQQLPPTHYNSVSSTHFGLEGLDSNLFNGTTSSTPAYGEIIPAYGNMSTAPSHTPYYTINYPNVNTGIQNQVSEYSPYHLPSSTSYLPQATFSSCAVPSEPPYGSATTTATTTQYHSGSPISLDTTASTSCTAIEASETNFINLSAPIASSSRLSQINDLLQHNRNTTAALVAVTESATASASASASTNCLASHTVVLSHTVTVVNDSIDTPPIENMPKPYTVFEELKPAIIVSDISKQCNDEIELETVCIDSDSSVEVVDVDKSTELNCNSPVDIIVDNLDAVIEIKSDDFDAADVDNIDKGNDKNDIEEIIEIKTDGNFVESQNIEKLDYTENAGDNEELVEKKIISDFVENVEANETKNEIQNSEPEQHIETVTITKAILIIETVEDTDNSKSLDNSMELTEALTTRKEIIDEINENTNDTKIRLIKNETNDVDVVEKIDCINASNASCEVVDKEEELKHSVCIDVENSPEVVESVEVKLNICAETEKVNCIEDKVNKSVVPEVHEETACSGQLTQKIQSSVEAENIDNISGKPVKCD

Similar Transcription Factors

Sequence clustering based on sequence similarity using MMseqs2

100% Identity: -
90% Identity: -
80% Identity: -