Basic Information

Insect: Bombyx mandarina
Gene Symbol: -
Assembly: GCA_003987935.1
Location: NW:265343-271814[-]

Transcription Factor Domain

TF Family: CSRNP_N
Domain: CSRNP_N domain
PFAM: PF16019
TF Group: Unclassified Structure
Description: This presumed domain is found at the N-terminus of cysteine/serine-rich nuclear proteins. These proteins act as transcriptional activators [1].
Hmmscan Out: # of c-Evalue i-Evalue score bias hmm coord from hmm coord to ali coord from ali coord to env coord from env coord to acc

1 6 0.024 1.5e+02 1.6 0.0 24 53 17 46 5 81 0.82

2 6 0.036 2.2e+02 1.1 0.0 25 82 133 190 117 225 0.70

3 6 0.00026 1.6 8.0 0.0 14 97 326 409 318 437 0.78

4 6 8.6e-05 0.54 9.6 0.0 14 103 510 599 502 633 0.76

5 6 0.019 1.2e+02 1.9 0.0 22 51 710 740 694 796 0.65

6 6 0.00015 0.92 8.9 0.0 14 129 898 1014 890 1022 0.74

#	of	c-Evalue	i-Evalue	score	hmm coord from	hmm coord to	ali coord from	ali coord to	env coord from	env coord to	acc
1	6	0.024	1.5e+02	1.6	24	53	17	46	5	81	0.82
2	6	0.036	2.2e+02	1.1	25	82	133	190	117	225	0.70
3	6	0.00026	1.6	8.0	14	97	326	409	318	437	0.78
4	6	8.6e-05	0.54	9.6	14	103	510	599	502	633	0.76
5	6	0.019	1.2e+02	1.9	22	51	710	740	694	796	0.65
6	6	0.00015	0.92	8.9	14	129	898	1014	890	1022	0.74

Sequence Information

Coding Sequence: ATGTTCTGCGCTGTTGGATTTGAATTCGACCCAGCTACTGAGACTTGCGTCATCATCGCCGAGGGAGGCTGCACGTTGGGGACAAGACCTCCGACAGCTTCTACTCCTGAATATACAACTGTAGACTTTTCTACAACTGGAACGCCTTTTACAGTCACAGAAGAATCAACATATCTTACTACAGATGGGATCAGTACAGTGACTAATGAATTACCAAAGATTACTTCTACTCCAGAAGCGGAGACGACTACGCCCTCTATTTGTCCTCCTGGATTCTCTGGGAACCTTCCGCATCCGTATCTCTGTAATTCGTACTTTATGTGTATCAATGGCGTCGCGATACAAGTCTTCTGTGCTGAAGGATTTGAGTTTGATCCAATCACTGAGGCTTGCGTGATTATAGCTGAAGGAGGTTGCACATTAGGAACAAGACCTCCAACAGATACTACTCCTGGGTATACAACTACAGAATCATCTACCACTACATCACCAACAGCCACAGACGAATCTACTTATATTACCACTGACGAGCTAACCACAGCTACTGAAGGCACTTCTACTACTGAGCTGCCAACTTCAGTAACAGCAGAGAGTACTTCTACTATACAGCCTACTACAATAACTACAGAAGGCACTCCTACTAGTGACTCACCTACGACACTAACTACAGTTGATACGACAGTATCAACAGATGGCACCACAACCACTGAAGTAACCACTGATATACCCACTTCAGTTACTACTGAAGATTCTACGACGTTAACTACAGAAGGTACAAGTACGACTGAGTTATCTTCCACACCAACAACCCTTGCCCCATCAACTCCAGAAGTGACATCTACTACAGAAGCGGAGACGACTACGCCTTCGATTTGTCCTCCTGGTTTCTTCGGGAACATTCCGCATCCGTATCTCTGTAATTCATACTTCATGTGCGTCAACGGAATAGCTATACAACTCTTCTGCGGCGAAGGATATGAATTTGATCCGGTCAATGAGATTTGCGTCGTCATAGCTGAAGGAGGCTGCACGTTGGGAACAAGGCCGCCAACACATACTACCCCTGAGTATACTACTACAGACCATCCTAACACTGTGCTGCCTACTACAGTTACAGACGGATCTACGTATTTGACTACTGAGAGTTCTACTACAGTAACTACAGATTCTTCTACTGAGGATGCAGGTACTACTGAAGCTACTACTGAACTGCCTACCTCGGTTACTACAGAAAGTTCTACTACACTAGCTACTGAAGGTACTAGTAAAACTGAACTTCCCACTGCCACCACCACTGAAGAGTCTACCACAGTAACTACCGAGGGAACTTTCACTCCTGAAATATCTTCCACACCAACAACCCTTGTCCCCTCAACTCCCGAGATCACATCTACTACAGAAGCGGAGACGACCACGCCCTCTATTTGTCCTCCTGGATTCTTCGGGAACATTCCGCATCCATATCTCTGTAATTCATACTTCATGTGCGTCAACGGAATAGCTATACAACTCTTCTGCGGCGAAGGATATGAATTTGATCCGGCCAATGAGATTTGCGTCATCATAGCTGAAGGAGGATGCACGTTGGGAACGAGGCCGCCAACACATACTACCCCTGAGTATACTACTACAGACCACTCTACCACTGTGCTGCCTACTACAGTTACAGACGGATCTACATATCTGACTACTGACAGTTCTACGACAGTAACTACAGATTCTTCTACTGAGGATGCAAGTACTACTGAAGCTACTACTGAACTGCCTACCTCGGTCACTACGGAAAGTTCTACTACACTAGCTACTGAAGATACTAGTACAACTGAACTTCCCACTGCCAGCACCACTGAAGACTCTACCGCAGCAACTACTGCCGGTTCTACTATAGTAACTACCGAGGGAACCTTCACTACTGAAATATCTTCCACACCAACAACCCTCGTCCCCTCAACTCCAGAGATCACATCTACTACAGAAGTGGAGACGACCACGCCCTCTATTTGTCCTCCTGGATTCTTCGGGAACCTTCCGCATCCGACTCTCTGTAATTCGTACTTTATGTGTCTTAATGGCGTCGCGATACAAGTCTTCTGCGCCGAAGGATACGAGTTCGATCCTGCTACCGAGACTTGCGTCATCATAGCTGAGGGAGGATGCACGTTAGGAACCAGGCCGCCAACACATACTACTCCAGAGTATACAACTATCGACTCATCTACTACTGCAGCGTCTTCCACAGTCACAGATGAAACCACATATCTTACTACAGGCAGAATTACCACAACATCTCCTGAAAGTCCTACGACTACTGATCTGCCAACTTCAGTAACAATAGAAGAAACAACTACATTAACTACTTCTGAGGCCACAACAACGGAATTGCCTACTACTACGCCTCCTGTAACAGTCACAGATGAATCTACGTATCCCACTACAGACGCCACAGACGCTTCTTCTACTACTGAGTTGCCTACTACAATAACTACTGAGGGAACCATTACCACTGAAGTATCTTCCACGTTAACAACATTCCCCTCAACTCCAGAGATCACATCTACTACAGTAGTGGAGACGACTACGCCCTCGATTTGTCCTCCTGGATTCTTCGGGAACATTCCGCATCCGTATCTCTGTAATTCATACTTCATGTGCGTCAATGGAATAGCTATACAACTCTTCTGCGGCGAAGGATATGAATTTGATCCGGTCAATGAGATTTGCGTCGTCATAGCTGAAGGAGGATGCACGTTGGGAACGAGGCCGCCAACACATACTACCCCTGAGTATACTACTACAGATCATTCTACCACAGTGCTGCCTACTACAGTTACAGGCGGATCTACGTATTTGACTACTGACAGTTCTACTACAGTAACTACAGATTCTTCTACTGAGGATGCAGGTACTACTGAAGCTACTACTGAACTGCCTACCTCGGTCACTACGGAAAGTTCTACTACACTAGCTACTGAAGGTACCAGTACAACCGATCTTCCCACTGCTAGCACCACTGAAGACTCTACCATACTAACTACCGAAGGAACCTTCACTACTGAAATATCTTCCACACCAACAACCCTCGTCCCCTCAACTCCAGAGATTACATCTACTACAGAAGTGGAGACGACCACGCCCTCTATTTGTCCTCCTGGATTCTTCGGGAACCTTCCGCATCCGACTCTTTGTAATTCGTACTTTATGTGCATCAATGGCGTCGCGATACAAGTCTTCTGCGCTGAAGGATACGAGTTCGATCCTGCTACCGAGGTAATTTCTTTATTCTTCTAA
Protein Sequence: MFCAVGFEFDPATETCVIIAEGGCTLGTRPPTASTPEYTTVDFSTTGTPFTVTEESTYLTTDGISTVTNELPKITSTPEAETTTPSICPPGFSGNLPHPYLCNSYFMCINGVAIQVFCAEGFEFDPITEACVIIAEGGCTLGTRPPTDTTPGYTTTESSTTTSPTATDESTYITTDELTTATEGTSTTELPTSVTAESTSTIQPTTITTEGTPTSDSPTTLTTVDTTVSTDGTTTTEVTTDIPTSVTTEDSTTLTTEGTSTTELSSTPTTLAPSTPEVTSTTEAETTTPSICPPGFFGNIPHPYLCNSYFMCVNGIAIQLFCGEGYEFDPVNEICVVIAEGGCTLGTRPPTHTTPEYTTTDHPNTVLPTTVTDGSTYLTTESSTTVTTDSSTEDAGTTEATTELPTSVTTESSTTLATEGTSKTELPTATTTEESTTVTTEGTFTPEISSTPTTLVPSTPEITSTTEAETTTPSICPPGFFGNIPHPYLCNSYFMCVNGIAIQLFCGEGYEFDPANEICVIIAEGGCTLGTRPPTHTTPEYTTTDHSTTVLPTTVTDGSTYLTTDSSTTVTTDSSTEDASTTEATTELPTSVTTESSTTLATEDTSTTELPTASTTEDSTAATTAGSTIVTTEGTFTTEISSTPTTLVPSTPEITSTTEVETTTPSICPPGFFGNLPHPTLCNSYFMCLNGVAIQVFCAEGYEFDPATETCVIIAEGGCTLGTRPPTHTTPEYTTIDSSTTAASSTVTDETTYLTTGRITTTSPESPTTTDLPTSVTIEETTTLTTSEATTTELPTTTPPVTVTDESTYPTTDATDASSTTELPTTITTEGTITTEVSSTLTTFPSTPEITSTTVVETTTPSICPPGFFGNIPHPYLCNSYFMCVNGIAIQLFCGEGYEFDPVNEICVVIAEGGCTLGTRPPTHTTPEYTTTDHSTTVLPTTVTGGSTYLTTDSSTTVTTDSSTEDAGTTEATTELPTSVTTESSTTLATEGTSTTDLPTASTTEDSTILTTEGTFTTEISSTPTTLVPSTPEITSTTEVETTTPSICPPGFFGNLPHPTLCNSYFMCINGVAIQVFCAEGYEFDPATEVISLFF

Similar Transcription Factors

Sequence clustering based on sequence similarity using MMseqs2

100% Identity: -
90% Identity: -
80% Identity: -