Basic Information

Insect: Acrocera orbiculus
Gene Symbol: CSRNP3_1
Assembly: GCA_947359355.1
Location: OX375757.1:14594741-14597527[-]

Transcription Factor Domain

TF Family: CSRNP_N
Domain: CSRNP_N domain
PFAM: PF16019
TF Group: Unclassified Structure
Description: This presumed domain is found at the N-terminus of cysteine/serine-rich nuclear proteins. These proteins act as transcriptional activators [1].
Hmmscan Out: # of c-Evalue i-Evalue score bias hmm coord from hmm coord to ali coord from ali coord to env coord from env coord to acc

1 4 0.14 2.4e+03 -1.9 1.1 65 67 65 67 13 121 0.50

2 4 0.065 1.1e+03 -0.8 0.7 76 119 138 183 114 195 0.52

3 4 0.074 1.2e+03 -1.0 0.9 57 111 211 267 190 290 0.45

4 4 1.2e-96 2e-92 308.9 13.1 1 218 301 502 301 502 0.92

#	of	c-Evalue	i-Evalue	score	bias	hmm coord from	hmm coord to	ali coord from	ali coord to	env coord from	env coord to	acc
1	4	0.14	2.4e+03	-1.9	1.1	65	67	65	67	13	121	0.50
2	4	0.065	1.1e+03	-0.8	0.7	76	119	138	183	114	195	0.52
3	4	0.074	1.2e+03	-1.0	0.9	57	111	211	267	190	290	0.45
4	4	1.2e-96	2e-92	308.9	13.1	1	218	301	502	301	502	0.92

Sequence Information

Coding Sequence: ATGCTTAAACCTATTGTAAGCTTACTATTATCATACATTAAAAAGAATAAAAATAATGTACAAACAATGGGGGAAAATTCAAACACAATGAATAATGATAATATTGAAACGTTAATTAAAGAATTACCGGAAGAAGTTGATGAAAGTCAAACAGAAGCAATACCTTCAACTTCTAAGGCTTGCTTAGAAGAAAACGACGAACAAAAAGATGTGACAAATAAAAAAAACAAAGAAGTCCTAGAAAACAAAAGTACGATTCCTAATACATCGAAAACATTATCTGAGAACATTCTAGTTTTAGATGAGGAAAATACAGATCTAAAAGCTAACGTATGCTTTTTAGATAATGAAAGTTTAATTCAAACACCTTCCGAAAAATTCACAAATCAAATTACAACAGAGGATTATCAAGCCGATGTGAGTGCAAACACTACAAATAACTCTGAAAACATTATATCATCTACTTTAAATATATCAGATAAAGATGAGGATTCGTTTTTAAAAAGTAAAAATAATGAAATAGAATTTATGAATATATTTGAAAATGCTACCGAAAAAGTATTGGGAGAAGAAAAGAATGGAATAGTGGTTTTTAATTTAAACAATGATTTTCAAATGTCAGCAGATATTGCAGAGGAAAGTAAAAAAAGAGATCTAATGAATCAGCATAATGAAAGAAATGAACCGACAAGCTTAGTAATTGATGAGACAATTGAAGAACAAGAAGTAAGAAGCGATGGCTCTGATTCTGGTTTAGGATCGGAAACATCTACTGCTCATAATTCATCTGAAAATAATAATAGTTTAAATATTCAATCGCCTAGTTGTAAACGTTTAGGTCCGCTACGTAGTAATCTAAAAAGACGGTTTGCTGATAATATCGATCTAACGAATAGCAAAAAACAAAAACGTTCTATTCAATTTAATAATGTTCATGTATATTATTTTCCGCGTATCCAAGGTTTTGCTTGTGTTCCATCACAAGGTGGATGTACATTAGGGATGGGTAATCATCATGTCAATTGTAAAACTTTTACACTCGCCGAACATGCAGCTGAACAAAGACGTGTCCATAAGCAACAAATGCAAGAAATAAATCCACGAAGTTCGTCCAGTGATGAAACTGATAGCGATGAAGAAATTAGTGAAGCAAGTGGATCTGATTTAGATGTAGACTCAAATGGATTTTTACAACCTGTTTCAACAAGACAACGTCGTGCTTTGCTTAAAGTAGCTGGCATAAGAAAAGTTGATTCAAGTGAAAAAGATGATTGTAAGGCAATACGAAGCTCTAGAGAATTTTGTGGATGTAGCTGTAGAGGATTTTGTGATCCTGATACATGCTCATGTAGTCAAGCAGGAATTAAGTGTCAAGTTGATCGTCCAAATTTCCCTTGTGGATGTACAAGAGATGGCTGTGCGAATATAGTAGGTCGTGTTGAATTTAATCCAAGCAGAGTTCGTACACATTACATTCATACAATAATGCGTCTGGAGCTAGAAAATAAACAAGGAAGACCTGAAAGAATGAATAGCACATATTTATCATACAGCGATACTAACAGCTCCCATTTAAATATGGTTACTGCCTCATCAAGTAATAGCTTAAGTAATCCATGTAGTTTTAACTCGATAAATAGTAATTATTGTCGGCCTCAAGCATACGGACAATTACATATACAACCACATACCAATCAAAATTATCGTAATAGTAATTTTCTAAATAGTTATCATGAAAGTAATGATTATATCCCTCATGATAGCACGAATTTGATGCATCCGTCAGTAATTCATACTAATTGTAGTCGTTTAAATAATAATCCCACTATGGATATGGCTAATCAAAATTCAAATTTTTGCCATCCAATTAATTTAAATTATTCTTATCGTCAGCCAGATGATTTAATAAATATAGAAAAAGAAAATAGTTTAAATGAATTTGGTGGAATCGGTACCCCCCCAATATATGATAGTTTTGTACAGATCTCAAATGAAAGTAATAATTATGCATCACATGTTAATCCAACTACACATTCAATAAGTAGCTATTCCAGTTTTCAAGATCATTTTCTTAATTTTTCTTTAACGAGCTGTAATAGTAATTGCAATAATAACCTTGAAATACATGATCTAACTACTAATGAAGATGAACCAAGTAGTTATATTAATCTTCATCCACCAACAGGAAATTTATCTCGATTAAATGCTATCAATGATTTATTGCAAAATACTCGAAATAGTTCTATGGCAACAATTTCAACAACAGTTGCTTCATTATCACCAATTAAAACTTCATCGACTCTATCATTAGCTGTTTCATGTAATTTAGCATCTTCGGCACAAATGTCAACTTGTATAAGTGAGAGTACTTTAACAACAATTTCACCGGCTAAAAATTGTATTGTTAATAACATGAATATAGAATCCCAATATCCTGATTTTGTTGATTTAACAAATGAACATAATTATAAAGATAAAAATAATTTTGAAAATTCAATAGATTTATCATCCAGCTTAGAATCAAATGATATACCAGTAGTAAGTTTATTGGATAAAAATAATGATAAAAATTTTAGAGTAATAAGTCCAGCACCGACATGTAGCAATGAAAATAAGCAATGCAATTTAAAATCATCTGAAAGTGATGAAAACTTATGTGACATTTTAAAAAAAAGTATTGCTGAAACAGTTTCTGCATAA
Protein Sequence: MLKPIVSLLLSYIKKNKNNVQTMGENSNTMNNDNIETLIKELPEEVDESQTEAIPSTSKACLEENDEQKDVTNKKNKEVLENKSTIPNTSKTLSENILVLDEENTDLKANVCFLDNESLIQTPSEKFTNQITTEDYQADVSANTTNNSENIISSTLNISDKDEDSFLKSKNNEIEFMNIFENATEKVLGEEKNGIVVFNLNNDFQMSADIAEESKKRDLMNQHNERNEPTSLVIDETIEEQEVRSDGSDSGLGSETSTAHNSSENNNSLNIQSPSCKRLGPLRSNLKRRFADNIDLTNSKKQKRSIQFNNVHVYYFPRIQGFACVPSQGGCTLGMGNHHVNCKTFTLAEHAAEQRRVHKQQMQEINPRSSSSDETDSDEEISEASGSDLDVDSNGFLQPVSTRQRRALLKVAGIRKVDSSEKDDCKAIRSSREFCGCSCRGFCDPDTCSCSQAGIKCQVDRPNFPCGCTRDGCANIVGRVEFNPSRVRTHYIHTIMRLELENKQGRPERMNSTYLSYSDTNSSHLNMVTASSSNSLSNPCSFNSINSNYCRPQAYGQLHIQPHTNQNYRNSNFLNSYHESNDYIPHDSTNLMHPSVIHTNCSRLNNNPTMDMANQNSNFCHPINLNYSYRQPDDLINIEKENSLNEFGGIGTPPIYDSFVQISNESNNYASHVNPTTHSISSYSSFQDHFLNFSLTSCNSNCNNNLEIHDLTTNEDEPSSYINLHPPTGNLSRLNAINDLLQNTRNSSMATISTTVASLSPIKTSSTLSLAVSCNLASSAQMSTCISESTLTTISPAKNCIVNNMNIESQYPDFVDLTNEHNYKDKNNFENSIDLSSSLESNDIPVVSLLDKNNDKNFRVISPAPTCSNENKQCNLKSSESDENLCDILKKSIAETVSA

Similar Transcription Factors

Sequence clustering based on sequence similarity using MMseqs2

100% Identity: -
90% Identity: -
80% Identity: -