Basic Information

Insect: Mylabris variabilis
Gene Symbol: CSRNP3_1
Assembly: GCA_037464815.1
Location: JAZBGW010001705.1:8691-11666[-]

Transcription Factor Domain

TF Family: CSRNP_N
Domain: CSRNP_N domain
PFAM: PF16019
TF Group: Unclassified Structure
Description: This presumed domain is found at the N-terminus of cysteine/serine-rich nuclear proteins. These proteins act as transcriptional activators [1].
Hmmscan Out: # of c-Evalue i-Evalue score bias hmm coord from hmm coord to ali coord from ali coord to env coord from env coord to acc

1 4 0.22 1.9e+03 -1.5 2.4 47 101 97 152 88 190 0.60

2 4 1.1e-102 9.4e-99 329.7 10.2 1 218 311 519 311 519 0.93

3 4 1.6 1.4e+04 -4.3 1.5 78 98 549 556 521 590 0.40

4 4 0.095 8.2e+02 -0.3 0.2 76 119 815 861 791 864 0.55

#	of	c-Evalue	i-Evalue	score	bias	hmm coord from	hmm coord to	ali coord from	ali coord to	env coord from	env coord to	acc
1	4	0.22	1.9e+03	-1.5	2.4	47	101	97	152	88	190	0.60
2	4	1.1e-102	9.4e-99	329.7	10.2	1	218	311	519	311	519	0.93
3	4	1.6	1.4e+04	-4.3	1.5	78	98	549	556	521	590	0.40
4	4	0.095	8.2e+02	-0.3	0.2	76	119	815	861	791	864	0.55

Sequence Information

Coding Sequence: ATGTCTGCAACGGATGCTGTTAATTGTAAGGATTCCAATGATGAGAGGGACGTCAATCTAATCCTGATCGAACCGAAGATTGAAACTGAAGgcaatacaacaataacaacgaccATGGGGTCAAATGGATCGATAATAaaagataacaacaacagcactAATAGTAATACTAAtagtttattaaaagaaattttaatgaatccTGTTGATTTGTTAAATTCGAATCTTGTTGaaactgttgaaaatttcattgttgttgataaGCCTTTAAGTACAAATAACGAAAACTTGAACGAATATAGTAATATTGAGCGTAATgattctaaatttatttataaagagCATCAATCAAATGAAGCAATagataatggtaataataatattaataaagaatCTAAAATTAATGCAACATCAAAAACGGTTGcaattaatgttgaaaatacAAGTGAAGATTCAGCAACTGAAAGTCTACCACCGACAGAGGAATTAACTGAAGAGCCCCATGATCGTTCAGATGGATCTGATTCTGGCCTAGGTTCTGAATTGGCAGAAGAACGACAAGAAACTGTAGTTGtaacaacaataccaacaacaacaacaacaattacaacaaatatagTTGAAAGTGATAGTGAAACATCATTTTTAGATCGTATTGATGATACTGCACAAATTACAAAtggtaatattgataatttcgatgataataataaagttgatgattttatattaccaacaacaaattgtaatgaaatcaataataaatcagaatCTAATTgtgatgttgataataataataaagaaccAAATCAAATCGATAAAGATATTTGTGATATCTTGAATGTTGCACaatcacaaaaaaatgtacaattaaaaagtaatttaaaacgaaaattatcgAATGAAGCGGATGATGATCAACCGAAATGCAAGAAAAAACGCGGAATATCATTCGATAGTGTTACCGTATTTTATTTTCCAAGGGCTCAAGGTTTCACCTGTATCCCCTCGCAAGGTGGATCGACATTAGGAATGGGGGCGCAACATACACATATGAGAAAGTTCTCAATTGTTGAACATGCAAACGAACAACGCCGCATCCATcgacaattattacaacagtTGCGTTCACAAAGACATTCAACTAcaacaacGGCTTCATCGAGCGATGAGAGTGACAGTGAAGAAGAGCCGAGCGATGCTTCTGAATCTGAAATGGATTtggataattattattttttacaaccGGTACCAATACGACAACGGCGTGCTCTATTACGGGCATCAGGTGTACGAAAAATTGATTCATATGAAAAGGATGAATGTCGTGATATTAGATCGTCACGGGAATTTTGCGGTTGTGGCTGTAAAGGTTATTGTGATCCGGACACTTGTTCTTGTAGTCAAGCTGGCATTAAATGCCAAGTGGACCGTTTAAACTTCCCATGTGGCTGTTCTAGAGACAATTGTGGCAATTCTAGTGGCCGTATTGAATTCAATCCAGTTAGAGTACGTACACATTTTATACATACATTAATGAGATTAGAATtggaaaagaaacaacaagatgAAATGAAAGTGGATAAGAAAGATGATTGGATGGATAATGAACGTTTGAATGCTAATTATCAAATCAAATCTAATAATTCACAATCGAATAAAGTTTGTAatcttaataataacaataataatagtaataatagtagtaatttgTTGaggaataataatttaaattcacgTACAGATATTGTTGATAGTTGTGTCCATGATTCGGgtagttttacaaatttacattATGGTGCCCCTGGTGAAGGTCCTGGTGGTCAAATTGTACCACATCATAATCCAACAACTGCCGGTTTTACAGATTTACCAGCACGTGAAGATTCATTAGATCTTTATACATTCAGAGAAGATTGGTATGGGGATGATACGTCACGGGACAGTCCCGTTGTCGGTGGTGGTGAAAGGCAAAAACAACATCCCCACCAACCATTACCGTCTACTactgcaacaacaacaacatcaacaactaGTGGTGGCGGCCAGAGTTTCCACTTTCCCGACCCTAGGTTTTCCGATGTTGGTTTTCCAAACAGTACCTCCCCCTATACATCCAATCAATACACGCAGCCGTACCAATCCAACTTCGCCGACTTTACTCCCGTCGCCTTCAATCCCTATAATAGTAGCAATGATAATACCACCACCGGTGGTAATAGTAAAAGTGGTAATATTACAGATGATggtaacaataatagtaataatgatgattgtaAAACTATTAATGGTAGAGATGGAGAAAATGGAAACAATAcgaccaccaccgccaccatcaCATCTCCTACCACTACTAGTGCCACTGTTGGAGACGTATATAATACAGAATTTGGGGCAACaattagaacaacaacagcaaaaaATCTGGATGGAAATTTTGCACAAAACACATCAACTAATgctacaattacaacaacaacaacaacgagaaatacaaatgtaaataattttacaacaaatgataataattttaatagtgcTAAAGAGAATCAATACACGAGTTTGAATCCAATTGGGGccaacaataaaatcgaatcGTTTTCGGATTTATTGAATGGGCGTTATACATATACTGGTTATGATGATACAAATAATTTCCCTAGTTTAAATCCAACtgatataacaacaacaattaataatgatggtggtaataataataatgatgatgtgaTACAGAAATGCGATTCGAATACTAcgaccaataataataatccaaaTAATTCAGATGATTGTGACGATAATTTTGGtgagattattaaaaaatccatGGTAGAAACTACGTCtgcttga
Protein Sequence: MSATDAVNCKDSNDERDVNLILIEPKIETEGNTTITTTMGSNGSIIKDNNNSTNSNTNSLLKEILMNPVDLLNSNLVETVENFIVVDKPLSTNNENLNEYSNIERNDSKFIYKEHQSNEAIDNGNNNINKESKINATSKTVAINVENTSEDSATESLPPTEELTEEPHDRSDGSDSGLGSELAEERQETVVVTTIPTTTTTITTNIVESDSETSFLDRIDDTAQITNGNIDNFDDNNKVDDFILPTTNCNEINNKSESNCDVDNNNKEPNQIDKDICDILNVAQSQKNVQLKSNLKRKLSNEADDDQPKCKKKRGISFDSVTVFYFPRAQGFTCIPSQGGSTLGMGAQHTHMRKFSIVEHANEQRRIHRQLLQQLRSQRHSTTTTASSSDESDSEEEPSDASESEMDLDNYYFLQPVPIRQRRALLRASGVRKIDSYEKDECRDIRSSREFCGCGCKGYCDPDTCSCSQAGIKCQVDRLNFPCGCSRDNCGNSSGRIEFNPVRVRTHFIHTLMRLELEKKQQDEMKVDKKDDWMDNERLNANYQIKSNNSQSNKVCNLNNNNNNSNNSSNLLRNNNLNSRTDIVDSCVHDSGSFTNLHYGAPGEGPGGQIVPHHNPTTAGFTDLPAREDSLDLYTFREDWYGDDTSRDSPVVGGGERQKQHPHQPLPSTTATTTTSTTSGGGQSFHFPDPRFSDVGFPNSTSPYTSNQYTQPYQSNFADFTPVAFNPYNSSNDNTTTGGNSKSGNITDDGNNNSNNDDCKTINGRDGENGNNTTTTATITSPTTTSATVGDVYNTEFGATIRTTTAKNLDGNFAQNTSTNATITTTTTTRNTNVNNFTTNDNNFNSAKENQYTSLNPIGANNKIESFSDLLNGRYTYTGYDDTNNFPSLNPTDITTTINNDGGNNNNDDVIQKCDSNTTTNNNNPNNSDDCDDNFGEIIKKSMVETTSA

Similar Transcription Factors

Sequence clustering based on sequence similarity using MMseqs2

100% Identity: -
90% Identity: -
80% Identity: -