Basic Information

Insect: Magicicada septendecula
Gene Symbol: -
Assembly: GCA_034769895.1
Location: CM068372.1:430566765-430570886[-]

Transcription Factor Domain

TF Family: CSRNP_N
Domain: CSRNP_N domain
PFAM: PF16019
TF Group: Unclassified Structure
Description: This presumed domain is found at the N-terminus of cysteine/serine-rich nuclear proteins. These proteins act as transcriptional activators [1].
Hmmscan Out: # of c-Evalue i-Evalue score bias hmm coord from hmm coord to ali coord from ali coord to env coord from env coord to acc

1 5 0.0038 3.1e+02 5.2 0.0 6 37 19 50 15 70 0.78

2 5 0.0069 5.6e+02 4.4 0.0 6 34 81 109 77 130 0.81

3 5 0.0025 2e+02 5.8 0.0 6 50 143 187 139 195 0.78

4 5 0.0058 4.7e+02 4.6 0.0 6 36 205 235 201 256 0.78

5 5 0.013 1.1e+03 3.4 0.0 6 40 267 301 263 327 0.79

#	of	c-Evalue	i-Evalue	score	hmm coord from	hmm coord to	ali coord from	ali coord to	env coord from	env coord to	acc
1	5	0.0038	3.1e+02	5.2	6	37	19	50	15	70	0.78
2	5	0.0069	5.6e+02	4.4	6	34	81	109	77	130	0.81
3	5	0.0025	2e+02	5.8	6	50	143	187	139	195	0.78
4	5	0.0058	4.7e+02	4.6	6	36	205	235	201	256	0.78
5	5	0.013	1.1e+03	3.4	6	40	267	301	263	327	0.79

Sequence Information

Coding Sequence: ATGCTGTGTTGCAGGGGACGACCGTGTGCAATGTCGATCCTGTATTACGAGCACCTCAGGCTGCACGCTGTTGAGATACACGAGAACGACCGTCTGCAATGTCGATCCTGTATTACGAGCACCTCAGGCTGCACGCTGTTGAGATACACGGGTACGTCCAGACAGATAACATACGCGTGTTTAGACTATGCTGTGTTGCAGGGACGACCGTGTGCAATGTCGATCCTGTATTACGAGCACCTCAGGCTGCACGCTGTTGAGATACACGGGGACGATCGTGTGCAATGTCGATCCTGTATTACGAGCACCTCAGGCTGCACGCTGTTGAGATACACGGGTACGTCTAGACAGATAACATACGCGTGTTTAGACTACGCTGTGTTGCGGGGACGACCGTGTGCAATGTCGATCCTGTATTACGAGCACCTCAGGCTGCACGCTGTTGAGATACACGAGGACGACCGTGTGCAATGTCGATCCTGTATTACGAGCACCTCAGGCTGCACGCTGTTGAGATACACGAGTACGTCTAGACAGATAACATACGCGTGTTTAGACTATGCTGTGTTGCAGGGACGACCGTGTGCAATGTCGATCCTGTATTACGAGCACCTCAGGCTGCACGCTGTTGAGATACACGGGGACGACCGTGTGCAATGTCGATCCTGTATTACGAGCACCTCAGGCTGCACGCTGTTGAGATACACGGGTACGTCCAGACAGATAACATACGCGTGTTTAGACTACGCTTTGTTGCAGGGACGACCGTGTGCAATGTCGATCCTGTATTACGAGCACCTCAGGCTGCACGCTGTTGAGATACACGGGGACGACCGTGTGCAATATCGCTCCTGCATTACGAGCACCTCAGGCTGCACGCTGTTGAGATACACGGGTACGTCCAGACAGATAACATACGCGTGTTTAGACTATGCTGTGTTGCAGGGACGACCGTGTGCAATGTCGATCCTGTATTACGAGCACCTCAGGCTGCACGCTGTTGACATTCACGGGTACGCGGGAATGTTAACTAGACAGAAGAAAAACCCTCCTTTTGAGAGTGAAGACCAGAGGAACTACGCTATTGTTGATGCAGAGAAGTTTTTAGGTCTGTCAGCGAGTGACTTGGTAGTTGAAAGGAAAAATGAGGGCTTCACGAAAGTAAGTTCCCTTATAATAGAAAAGTCCGTAAATACTTGTAATGGATTACCTGTCATACACATTACTAGTGTTGAAAATAATCGGAGTGATCGAAGTTGGAGTGAGTTCCCAGCCACTATGAAAACCGCAAGGGGAGTGATGGTGTTCCGTGACTTATTAAACTGCACTGAAGAGGAGCTTGCAACGGAATTAGCACTACAAGGAGTCATAGCATGTTGA
Protein Sequence: MLCCRGRPCAMSILYYEHLRLHAVEIHENDRLQCRSCITSTSGCTLLRYTGTSRQITYACLDYAVLQGRPCAMSILYYEHLRLHAVEIHGDDRVQCRSCITSTSGCTLLRYTGTSRQITYACLDYAVLRGRPCAMSILYYEHLRLHAVEIHEDDRVQCRSCITSTSGCTLLRYTSTSRQITYACLDYAVLQGRPCAMSILYYEHLRLHAVEIHGDDRVQCRSCITSTSGCTLLRYTGTSRQITYACLDYALLQGRPCAMSILYYEHLRLHAVEIHGDDRVQYRSCITSTSGCTLLRYTGTSRQITYACLDYAVLQGRPCAMSILYYEHLRLHAVDIHGYAGMLTRQKKNPPFESEDQRNYAIVDAEKFLGLSASDLVVERKNEGFTKVSSLIIEKSVNTCNGLPVIHITSVENNRSDRSWSEFPATMKTARGVMVFRDLLNCTEEELATELALQGVIAC

Similar Transcription Factors

Sequence clustering based on sequence similarity using MMseqs2

100% Identity: -
90% Identity: -
80% Identity: -