Basic Information

Insect: Villa cingulata
Gene Symbol: CSRNP3_1
Assembly: GCA_951394055.1
Location: OX596018.1:34354616-34358720[+]

Transcription Factor Domain

TF Family: CSRNP_N
Domain: CSRNP_N domain
PFAM: PF16019
TF Group: Unclassified Structure
Description: This presumed domain is found at the N-terminus of cysteine/serine-rich nuclear proteins. These proteins act as transcriptional activators [1].
Hmmscan Out: # of c-Evalue i-Evalue score bias hmm coord from hmm coord to ali coord from ali coord to env coord from env coord to acc

1 6 0.17 7.2e+03 -2.1 3.2 51 78 52 79 12 124 0.52

2 6 1.1e-95 4.9e-91 305.7 8.5 1 217 375 575 375 576 0.92

3 6 0.73 3.1e+04 -4.2 5.2 87 155 1055 1113 1000 1138 0.43

4 6 0.76 3.3e+04 -4.3 3.7 89 89 1108 1108 1054 1177 0.52

5 6 0.18 7.8e+03 -2.2 0.3 77 103 1169 1197 1126 1225 0.48

6 6 0.11 4.7e+03 -1.5 2.7 52 83 1255 1286 1218 1329 0.47

#	of	c-Evalue	i-Evalue	score	bias	hmm coord from	hmm coord to	ali coord from	ali coord to	env coord from	env coord to	acc
1	6	0.17	7.2e+03	-2.1	3.2	51	78	52	79	12	124	0.52
2	6	1.1e-95	4.9e-91	305.7	8.5	1	217	375	575	375	576	0.92
3	6	0.73	3.1e+04	-4.2	5.2	87	155	1055	1113	1000	1138	0.43
4	6	0.76	3.3e+04	-4.3	3.7	89	89	1108	1108	1054	1177	0.52
5	6	0.18	7.8e+03	-2.2	0.3	77	103	1169	1197	1126	1225	0.48
6	6	0.11	4.7e+03	-1.5	2.7	52	83	1255	1286	1218	1329	0.47

Sequence Information

Coding Sequence: ATGTTTACACCAATCAAGAATTTTATAAcatattttcaaagaaatacAACTGGAACAGAATTATTGAATTCAACCAATTCAAcacaaaataattcaaatgatACTGAAGAAATGGAAAATAATGATATACATTTATCTGTGCCcactgaaaaagaaaataacaaaacaaaattaaatgaaaaatctcTACAACACGATcagaatgaaaatgaagttaATAAAGGAATTATGAAAACTACAACTGGAACTAGCAGTAGCAGTAATAGTACAACAACTTCTACTATTGTAACAAAAGAAATAatagatgaaaataaatattttattgatgaaaagaattcaaattcaatagaTAATTGTTCTAGCCCAACGGAAGAAAGTAttgatttaataaaatgttCAACTGATTATAATCCATTAAATATAGACATAAATAaagatttaatgaaaaattatagtcCGAGTCCGGGTCCTTGTAGTCCAAGTCTAAATAAATCAAACGATATATTTGCAAATATTAGTCCAACAAAAATTTtcgtaaatgaaaataataaatattttgaatcgAATCATGACGATGATATAGAATTCATAGAAAAATTTGATAATGATGAAATAATTGTTGATGAAGAAATCATTGTACTGTCatcaaatgataataatttatcaattttagaTTCAGTATCAGATCCACTGGCAATAGATGATGAATATCAGAATGCTGATGAAGAGAATAATtcatcaaattttatacaaagtGGTACAAGTTCACCGGTAATTGAAACACCAGTAAATAATGGAATTATTTGTATAATAGATGTAGACAATATTAAAGAAACAGGAAATCACAATCATAcgaaaaggaataaaaattcTGCAACAAACTTTGAttcatcaaaaaataatgtaagtgCTTTTGATATAacgaatattaaaattgaaataggAAATGAAGAACAAGAATTAAGAAGTGATGGATCAGATTCTGGATTAGGTCTAGAAACTTCTGCTTCATCATCATCGGCAAATAGTGATTTCATATCTCATCCacttataattaataaattaccaCAAAAAAGTAGTTTGAAACGTCGATCGAATGAGGAACCAATATTTTCCGAAAAGAAAACGAAACGTTCAATTCATTTCAATGGAGTTAGTGTTTATTACTTTCCAAGAACTCAAGGTTTTGCATGTGTACCTTCACAAGGCGGTTGTACCTTAGGTATGGGATCAAGACACATACATTACAAAACATTTTCTTTAACGGATTATGCTGCTGAACAAAGAAGAGTTCATAAGCAACAGATGCAGGAAATAAATCCGAGAAGTTCTTCAAGTGATGAGTCGGACAGTGATGAAGAAGTAAGTGAAGCAAGTGGATCTGATTTGGATGCTGATGGAAGCGGATTTTTACAACCGGTGCCTGCTCGACAAAGAAGAGCATTATTAAAAGCAGCAGGAATAAGGAAAATTGACTCGGGTGAGAAAGATGAATGTCGCGCCATTCGTACATCAAGAGAATTTTGCGGATGTAATTGCAGAGGATATTGTGATCCGGATACCTGCTCATGTAGTCAAGCTGGAATTAAATGTCAGgtTGATCGACCAAGTTTTCCTTGTGGTTGCACTCGTGATGGCTGTGCCAATGTTGTAGGCAGAGTAGAATTTAATCCAGGAAGAGTTCGAACACATTTTATACACACAATTATGCGCTTAGAAATTGATAATAAACATAAGAGAAGAGATGAAATCGATTCAACCTTATCATCGCTGCCTATGTTGAATTATATGAATAATTGTATATCAGATAGTAGCAATATGTCTATGACTGCCAGTTTGAATACATGTCTTAGTAATAACAGTAGTTTAAGTACTATTTGCAATTATAATGTAAGTAATACGAGCCATGTCGGGACCCAACCATACCACCTTCATTTGCAACAGCAGCAACATAATCAAAATTTTGTTGGTGGTAACACCCATTATTCAAACATAATGCACAATAACAGCGTATCAACGCCATTCCCACAAGAAAACTGTGTAATCTCTCAGGTATTACATGATGGtaatcaacagcaacaacactTAATAAGTAATAACTGCATGCGTATGATGAATAATGGATCCAGCAATGGTCAAATCAACAATACACTagatataaatttaatgaacaCCAATTCTAATCACTCAATAGATTTATCTTATCCTCTACGTGATATGACAACTGAAAATTCAATATGTAACAATTTAATGATTGATTTTCCTACAAACAGTAACCAAATATTCCATCATGATGTATATAGCAGTCAATCTTATGTTAATCAATCGTATCAGaaccaaaatttaaattcaaatagtAATTACCATCTAGCCGCACCAACGTATTCGAATTATCAACAAagttttatttcttatataccACAAGCATGTGGTAATGAAGCGATAGAAATTCATGATCTTGCATCATCATCTAATGATAACACAaacaattacataaatttacatcCCCCAACAGCGAATTCATCACGTTTAGATGCAATTAATGATCTACTTCACAATAATCGAAATACTCCTCCGACTATTCCGACAGTACAACCATCAATTGCTACCAACAATATTATAATTGATCCATTACCTATGAAGCCGACAACTGTATCTGCACTTTCGGAATCCTGTAGTATAGCATCGTCTGGACAAACATCAACATCAGTTTGCGAAGGTACATCGACAAAAATAACATCATCCACTTCAACTCTAATTACTAGTTCTAGTAAACTTGAACTATCATCAGTAGTTGATTTAACAGATGATTTAGGCAAAAACGAAAATGTTTCAACGAAAATTACAACAGCAACATTGGATTATAATAATGAAGATGTCCAAATAATTAAACCGTTAGAAATTTTACAAGAAATTGTAAGTGatacagaaaaaattaataaattagacGACAGTATTGATTTTACAAcggcaacagcaacagcaacagttTCAGATAGAAATTTCATTGAAAACTTTATTGAAATCAATCAAGAGGAAGGAGAAGATGAAGCAACAGTTTTAAACATAGAAAATAACAATattaaactgaaaaataaaaaaaatagagaagATAATGATGATATAGAAATTATGGATATATCGTTAGATTTAAATAGAATTGAtgattatttttcaaatcatcCAAAAGATGTTGAAAATGTTGATAAAGATGATAAAGCGAAACAAAATACGAGAATTTTACAAGATAagaattcaacaaaaaaattattaaaaacgacGGATGAAACAGATACTAATAGTATTAGTGACAATAGAAGAAATTGTCCATTAAAGGTTATGGTAAAttcaaaagaagaaaattgtAATACAAATCGAAAAGAAATCGAatcaaaaagtgaaaataatttaGTGAAAAATGACATTAACTCAGgtaaaaatgtttttgaaaaagcagaaacagaagaaaaatgtaaaacagaTTTACTTACAGATGTGTTCATGAGTAGTACTAATAAAAATGTTGTACGATCACAAAATAATCATCAAATATTATCATCAGATTCAATAATGACAAGTTCAGACTCAGACACCAAACAAATTAATCGACAACAAAcaaatactataaaattattGGATATTAAAGTTAATAATAATGGTGTTACTCTTAATACAAATGCAATGAAAAACAATTATCAGAATCATTTAATAATTAATGAGGAAAATACTActgtaaaaaattcaataacattaaatttatgtaaagaaaagaatgaacaaaataaaaaaataacacaggaacaaaatttgaattctgaattgaaaattattgaaaaatcaaCAACAGAAAATCAAACATTATTATCATCTTCAACAATATCAACaataacaacatcaacaacaacaacaacaacatcatcgtcgtcgtcgtcaAGTAATAATGTGTCAATTGCAAATAGTAAATCATCggttgaaaatgatgaaaatttaatagATATAATCAAGAAACCAATTATCGAAACTGTTTCGGCGTAA
Protein Sequence: MFTPIKNFITYFQRNTTGTELLNSTNSTQNNSNDTEEMENNDIHLSVPTEKENNKTKLNEKSLQHDQNENEVNKGIMKTTTGTSSSSNSTTTSTIVTKEIIDENKYFIDEKNSNSIDNCSSPTEESIDLIKCSTDYNPLNIDINKDLMKNYSPSPGPCSPSLNKSNDIFANISPTKIFVNENNKYFESNHDDDIEFIEKFDNDEIIVDEEIIVLSSNDNNLSILDSVSDPLAIDDEYQNADEENNSSNFIQSGTSSPVIETPVNNGIICIIDVDNIKETGNHNHTKRNKNSATNFDSSKNNVSAFDITNIKIEIGNEEQELRSDGSDSGLGLETSASSSSANSDFISHPLIINKLPQKSSLKRRSNEEPIFSEKKTKRSIHFNGVSVYYFPRTQGFACVPSQGGCTLGMGSRHIHYKTFSLTDYAAEQRRVHKQQMQEINPRSSSSDESDSDEEVSEASGSDLDADGSGFLQPVPARQRRALLKAAGIRKIDSGEKDECRAIRTSREFCGCNCRGYCDPDTCSCSQAGIKCQVDRPSFPCGCTRDGCANVVGRVEFNPGRVRTHFIHTIMRLEIDNKHKRRDEIDSTLSSLPMLNYMNNCISDSSNMSMTASLNTCLSNNSSLSTICNYNVSNTSHVGTQPYHLHLQQQQHNQNFVGGNTHYSNIMHNNSVSTPFPQENCVISQVLHDGNQQQQHLISNNCMRMMNNGSSNGQINNTLDINLMNTNSNHSIDLSYPLRDMTTENSICNNLMIDFPTNSNQIFHHDVYSSQSYVNQSYQNQNLNSNSNYHLAAPTYSNYQQSFISYIPQACGNEAIEIHDLASSSNDNTNNYINLHPPTANSSRLDAINDLLHNNRNTPPTIPTVQPSIATNNIIIDPLPMKPTTVSALSESCSIASSGQTSTSVCEGTSTKITSSTSTLITSSSKLELSSVVDLTDDLGKNENVSTKITTATLDYNNEDVQIIKPLEILQEIVSDTEKINKLDDSIDFTTATATATVSDRNFIENFIEINQEEGEDEATVLNIENNNIKLKNKKNREDNDDIEIMDISLDLNRIDDYFSNHPKDVENVDKDDKAKQNTRILQDKNSTKKLLKTTDETDTNSISDNRRNCPLKVMVNSKEENCNTNRKEIESKSENNLVKNDINSGKNVFEKAETEEKCKTDLLTDVFMSSTNKNVVRSQNNHQILSSDSIMTSSDSDTKQINRQQTNTIKLLDIKVNNNGVTLNTNAMKNNYQNHLIINEENTTVKNSITLNLCKEKNEQNKKITQEQNLNSELKIIEKSTTENQTLLSSSTISTITTSTTTTTTSSSSSSSNNVSIANSKSSVENDENLIDIIKKPIIETVSA

Similar Transcription Factors

Sequence clustering based on sequence similarity using MMseqs2

100% Identity: -
90% Identity: -
80% Identity: -