Basic Information

Insect: Scrobipalpa costella
Gene Symbol: CSRNP3_1
Assembly: GCA_949820665.1
Location: OX463303.1:16180358-16183165[-]

Transcription Factor Domain

TF Family: CSRNP_N
Domain: CSRNP_N domain
PFAM: PF16019
TF Group: Unclassified Structure
Description: This presumed domain is found at the N-terminus of cysteine/serine-rich nuclear proteins. These proteins act as transcriptional activators [1].
Hmmscan Out: # of c-Evalue i-Evalue score bias hmm coord from hmm coord to ali coord from ali coord to env coord from env coord to acc

1 6 0.31 1.3e+04 -3.0 2.0 51 94 45 87 19 113 0.43

2 6 0.5 2.2e+04 -3.7 3.1 72 103 191 221 155 275 0.60

3 6 0.14 6.3e+03 -1.9 1.6 57 103 338 384 319 394 0.55

4 6 3.8e-101 1.7e-96 323.6 6.4 2 218 393 601 391 601 0.93

5 6 0.024 1.1e+03 0.6 0.2 26 79 741 795 721 805 0.79

6 6 0.16 7.1e+03 -2.1 0.2 62 102 845 886 813 903 0.43

#	of	c-Evalue	i-Evalue	score	bias	hmm coord from	hmm coord to	ali coord from	ali coord to	env coord from	env coord to	acc
1	6	0.31	1.3e+04	-3.0	2.0	51	94	45	87	19	113	0.43
2	6	0.5	2.2e+04	-3.7	3.1	72	103	191	221	155	275	0.60
3	6	0.14	6.3e+03	-1.9	1.6	57	103	338	384	319	394	0.55
4	6	3.8e-101	1.7e-96	323.6	6.4	2	218	393	601	391	601	0.93
5	6	0.024	1.1e+03	0.6	0.2	26	79	741	795	721	805	0.79
6	6	0.16	7.1e+03	-2.1	0.2	62	102	845	886	813	903	0.43

Sequence Information

Coding Sequence: atgttcctGTTACAGATCAACATGGAGAAGACTAGCGAAGGAGTGATTGACCCCCAAAATACAATCGAAGAAATGGTAGAACCCCAGAAGATAAACAAAGAAATGGTTGATCCCCAGAAGATCAACGAAGAAGTGATTGATCCCCAGAAGATCAAAGAAGTGATTGATCACCAGAAGATCAACGAAGAAGTGATTGATCCCCAGAAGATCAACGAAGAAGTGATTGATCCCCAGAAGATCAAAGAAGAAGTGATTGATCACCAGAAGATCAACGAAGAAGTGATTGATCCCCAGAAGATCAACGAAGAAGTGATTGATCCCCCGAAGGCCAGCAAAGAAGTGATAGAACCCCAGAAGGTCAACGAAGAAGTGATTGATCCCCCGAAGGCCAGCAAAGAAGTGATAGATCCCCAAAAGGTCAACGAAGAAGTGATTGATCCCCCGAAGGCCAGTGAAGAAGTGATTGATGCCCAGAAGACCAAGGACGTAGTGATAGATCCCCAGAACGTCAACGAAGAAGTTGATCTGCTCAATCCAGAAGAAACCCAAAGCAATAATGAAGATGTATTAGACTCTGTCGAAGAAAATAGAGAGCACGACTCTTTTTCTGTGATAAAAGATGAAAAAGGCAGTGACAGTGACGCTAACAGTGAGGACCTTAGCTCTAAtgaagaacaaaataatgtgatTAGTGGTAGCAGCCCTCAGTTCTATGAGAGCAGTGATAGCAAACTAGATTACGCTGTAAAAATAGACGATAATGATACTTTAAGTGACATAGATGACATTAAAACAGACACAGCGTCTGCTGATAGCGAAGACTCTGCGTTGGGGAGTTTACCACCTGACACGGTTGAGAGTCGTGACAGAGAAGATGAAACGCAAGATCGATCTGACGGAAGTGATTCCGGGATAGGTTCAGAAACACTTGAAGATGCTAAAATACCAAATTTTaatctttctcttccatgcGCAAATGAAATGAAAGAGGAGCAATCCACAGAAGATATTAAAAGTAACGATATTCTGGAAGAGAACAAAAACGAACCTGTTACAGAGCAAAGTGCTATGGAAATCTCAAGTAGTTCTACAGCACAAATAATAAAACCTCAGAAAAGTAATCTTAAGAGGAAATGTGATGACGAAACTAACGTGGATCAGCCTCAAGCAAAAAGAAGAAAGGAAGGTATAAAGTTTGATAGCGTAACTGTGTACTATTTTCCCAGAACGCAAGGATTCTCTTGTGTGCCGTCTCAAGGAGGCTCTACATTAGGAATGGAATTAAAGCATAGTCATGTTCAAAAGTTTACCCTAGCTGAACATGCTTTAGAACAGAGACGGTTACATCGACAAATATTACAACAGATAAAGAATGAAAGACATTCCCTAGAAGGCGAAGGACTTTCATCCAGTGAAGATAGCGATACAGAAGAAGAAAGTAGTGATATTTCTGAGTCTGAACTAGACTTggatagttattattttttacaacctGTACCAACTCGACAAAGAAGAGCTCTACTCAGAGCAGCAGGCGTCAAGAAAATAGAAGGTTATGAAAAAGATGAATGTAGAGACATAAGGACTTCACGGGAATTTTGTGGATGTGCGTGCAAAGGAACATGTAATCCCGAAACGTGTTTGTGTAGTTTAGGAGGCATAAAATGTCAAGTGGATAGGCTTAGCTTCCCATGTGGATGTACAAGAGATGGATGTGCTAATACTTCGGGACGGTTAGAATTCAACCCTGTAAGAGTACGAACTCATTTCATTCATACGCTAATGAGAGTAGGTCTTGAAAAGAAAAACGAGGAAAACCAGGAAGCTGCTAAAAGGCAATGGGCTGCACTTAATGCAAGTACAGCACATAATACCAGTACAGTACTTAATACGAGTACAGCATCAGCAAATACTTCATATGATAGCGAAAGACGCCTTAGCCACGAAGAAGGTTTACTGCGCGATGTCAGCCTCACTCCTAGAGTTGAAGTAGAGTCCTGTGTAAATAATGGCAGTTTTAATAACGTTCACTGTGAGATGAATAATCTCAATGTGGTGCACGCTAATATTCAAGATAATAGTACTAATTATAGTTATGGAAACGATGCGTTAAGTCAAACAAATATGAACGCAAATAATATTATGCATTTCGAAAATGGTAACACCCACCATAATCACAACCAAGCGTACACCAACAATATACTGCAAGGTAAAGGCCCGCCTTATACTACGGGTAACACTATGGGATTCGATACGATGTCTAATAATATGCAAACATTTCCCTGCGATCTCAATTACTCGTACGAACAACACATGGAAAACCATTACAAGGCGGCGCAGAGCTACTCAGCGTCTAGTTTTGAAGAATTCGCGCACAACTCACAAATGACAATGTTCAGTCATTACGGGCATATGTATGGCCCGGATTATTTCCACAAACAGGGCACAAGCATGCACGATCCCTCGCTACAGTATCATGCTATGCCCCAAAATAACCATTacgatatgtataaaactactCCAGAGTGTATAAACGCAGATAATAAGAATGAAACGCAATATACGACGTTGATGACAATGCCATATCAATCTAGCAATAAGATAGAGACAGTAGAGAATGACGAGAACTGGTTCAGTCAGAATAGTTTAATGAGCTTGGACCAATCGGACCAGACGACGCAGGACGCTCAAGAGCTGCTGGCCCAGCCTAGCCTGCCAATACCAGCGCCACCTGCAGACAACTCAGAACCCACGGAAAACTTCGGCGAACTTATCAAGAAAACTATGGTAGAATCTGTTACTGTGTAG
Protein Sequence: MFLLQINMEKTSEGVIDPQNTIEEMVEPQKINKEMVDPQKINEEVIDPQKIKEVIDHQKINEEVIDPQKINEEVIDPQKIKEEVIDHQKINEEVIDPQKINEEVIDPPKASKEVIEPQKVNEEVIDPPKASKEVIDPQKVNEEVIDPPKASEEVIDAQKTKDVVIDPQNVNEEVDLLNPEETQSNNEDVLDSVEENREHDSFSVIKDEKGSDSDANSEDLSSNEEQNNVISGSSPQFYESSDSKLDYAVKIDDNDTLSDIDDIKTDTASADSEDSALGSLPPDTVESRDREDETQDRSDGSDSGIGSETLEDAKIPNFNLSLPCANEMKEEQSTEDIKSNDILEENKNEPVTEQSAMEISSSSTAQIIKPQKSNLKRKCDDETNVDQPQAKRRKEGIKFDSVTVYYFPRTQGFSCVPSQGGSTLGMELKHSHVQKFTLAEHALEQRRLHRQILQQIKNERHSLEGEGLSSSEDSDTEEESSDISESELDLDSYYFLQPVPTRQRRALLRAAGVKKIEGYEKDECRDIRTSREFCGCACKGTCNPETCLCSLGGIKCQVDRLSFPCGCTRDGCANTSGRLEFNPVRVRTHFIHTLMRVGLEKKNEENQEAAKRQWAALNASTAHNTSTVLNTSTASANTSYDSERRLSHEEGLLRDVSLTPRVEVESCVNNGSFNNVHCEMNNLNVVHANIQDNSTNYSYGNDALSQTNMNANNIMHFENGNTHHNHNQAYTNNILQGKGPPYTTGNTMGFDTMSNNMQTFPCDLNYSYEQHMENHYKAAQSYSASSFEEFAHNSQMTMFSHYGHMYGPDYFHKQGTSMHDPSLQYHAMPQNNHYDMYKTTPECINADNKNETQYTTLMTMPYQSSNKIETVENDENWFSQNSLMSLDQSDQTTQDAQELLAQPSLPIPAPPADNSEPTENFGELIKKTMVESVTV

Similar Transcription Factors

Sequence clustering based on sequence similarity using MMseqs2

100% Identity: iTF_00844363;
90% Identity: -
80% Identity: -