Basic Information

Insect: Diogma glabrata
Gene Symbol: CSRNP3_1
Assembly: GCA_963693315.1
Location: OY856187.1:140057690-140075417[+]

Transcription Factor Domain

TF Family: CSRNP_N
Domain: CSRNP_N domain
PFAM: PF16019
TF Group: Unclassified Structure
Description: This presumed domain is found at the N-terminus of cysteine/serine-rich nuclear proteins. These proteins act as transcriptional activators [1].
Hmmscan Out: # of c-Evalue i-Evalue score bias hmm coord from hmm coord to ali coord from ali coord to env coord from env coord to acc

1 2 4.5e-97 4.7e-92 310.3 8.1 1 218 211 412 211 412 0.93

2 2 0.39 4e+04 -3.3 0.7 65 77 748 760 722 779 0.40

#	of	c-Evalue	i-Evalue	score	bias	hmm coord from	hmm coord to	ali coord from	ali coord to	env coord from	env coord to	acc
1	2	4.5e-97	4.7e-92	310.3	8.1	1	218	211	412	211	412	0.93
2	2	0.39	4e+04	-3.3	0.7	65	77	748	760	722	779	0.40

Sequence Information

Coding Sequence: ATGTTAAAACCATTTAAGTCATTTTTAAACTATTTGCAAAAGAATGCCAACGGTGCTGCTATATTTGGatTAACAACAAACATGAGTAACAATATTGAAGAAGAGTCAATTATTGTTACAACTTCGGaaaccaaaatcgaaaatgaTTTGTCCATCGATGTCGAGACTAATCAACGATCTCAAGAAATGATGATTGATCCGTTTGAAAGTGTTCCAAGTGATAGTTTCAAAGGTGATCCCTTAGCTTTCGATGAAAGCGGAATTGAAACATCTTTATTAGACTCATCCATTGAGGAGGAAACTCAAACTGAAGGAAGGATTATTATTGTGGATGTCAATGCATTAAAGAAAGGATGTGATGAAAATCTTTCCGAATTAAATTCTTCAAGTGAAACCGAACTCGATGAATCATACACTAGTAAggaaactattattttagaatcAAATCATGAAGGTGAAGAACCAAGTGATGGATCAGATTCAGGTATTGGTCCAGAGCCATCATCTGAAACagatattttcaatttatcatCACCAATGACATcagttttaacttttaaaactCCACGAAGTAGTTTAAAACGTCGTGCAGAATGTAATGAACTTGATGATGTAGATAATGGTGCTAAGAAAACAAAACGGAGCATAGCATTTGATGGTGTTACTGTATATTATTTTCCCAGAATACAAGGATTTGCTTGTGTCCCATCTCAAGGTGGGTGTACGCTTGGGATGGATGCAATTCATTCACATTTTAGAACGTTTTCATTAGCTGAACATGCAGCAGAACAAAGACGAGCACATCGTTTACAGTTACAGGAGTTAAATCCTAGAAGTTCGTCAAGTGATGATAGTGATAGTGATgaagaaattagtgaaaatagTGGCTCGGAATTAGATGCTGAATCAAATGGATTTTTACAACCTGTGGCAACAAAACAAAGACGAGCCTTATTAAAAGCGGCTGGTATTCGAAAAATTGATTCAAGTGAAAAAGATGAATGTCGTTTGATTAGAAGTTCTAGAGAAATTTGTGGATGTAATTGTAGAGGATATTGTGATCCAGATACATGCTATTGTAGTCAGTCCGGGATTAAGTGTCAGGTGGATCGTGTGAATTTTCCTTGCGGTTGTACACGCGATGGATGTGGTAATGTGATTGGTCGTGTAGAATTCAATCCAGGCCGTGTTAGAACTCATTTTATTCATACCATAATGCGTATTGAAttagaaaagaaacaaacaaattctGATGATTTAATTGATGGACGATCATGGGTTCCATCAATAAAACTACCAATTTTACCTAATAGTGATAGTTCTGTTTACAATCACCATTCAATTATTTATAGTCATATTGAATTAAATAGTGCATTACCTACATCATCATCTCTTAACAGTTTACAATTATCTCGACCAAATAGTAGTACCACTGGAAGTGGTGAATCATTAGATTTGCATTATGCATATCGAGATGATTATCCTGTTACTTCAAACAATATAATTGAACCTAGTCGTTTGCCAAACAGTGATACATCTAACTTTAAAATTCATCCATTTAATCATGAGGCTAATAGTTTAACTTATCAAACACATACATATAATACTTACACTAGTGattttatagaaacatctcAAAATAGCTTGATTTTATCCAATCAAACGTATGACACATCACCCACAGCTTCAATAACAACAACTCAAGAGGAACAACAACCGCAAATAAGTCaggaaaattatttacattcGGAATCGTTTGATATGTCATCCACAGTTGATACACCAACACATCTTGGAAATAATTTATCCGACAATATTCCAATCAAAGAACTTAAAAACGAAAATTTGTGTGATGAATTAAGCCTTCCGGAAAGTTTTGGATTAAGCCATGAAGATaacgataaaaataaaacaaatgcgAATGAAGATTTTATAAACTTACGTCCACCTGAGTCGAATTCACCTAGGTTAGAAGCGATTAATGATTTATTAGAACATAGTCGATTATCATCTGCAACAACATCATCATATTCGTCAGAagatgttttgattgataaTAATTGTTTAAGGATAACAACTATAGTTACATCATTGCCACCCCCCAAAACGGACGTTATATCGATTAATTCCAATGAAATAGATGATACTAATGatatcattaataataatttaattaaaacaatcattgaaacagaaacattaaatattaataataatattgaaaacaaTACAGAAAGTGATGATAAATGTGAAAATAGTTTagtgaaaatagaaaataaaacaaatgaaaacaataaCATAAAAGACGATGTAAATGAAAACTTGagtgaaattataaaaaaaggaaTTGTTGAAACTGTATCAGCataa
Protein Sequence: MLKPFKSFLNYLQKNANGAAIFGLTTNMSNNIEEESIIVTTSETKIENDLSIDVETNQRSQEMMIDPFESVPSDSFKGDPLAFDESGIETSLLDSSIEEETQTEGRIIIVDVNALKKGCDENLSELNSSSETELDESYTSKETIILESNHEGEEPSDGSDSGIGPEPSSETDIFNLSSPMTSVLTFKTPRSSLKRRAECNELDDVDNGAKKTKRSIAFDGVTVYYFPRIQGFACVPSQGGCTLGMDAIHSHFRTFSLAEHAAEQRRAHRLQLQELNPRSSSSDDSDSDEEISENSGSELDAESNGFLQPVATKQRRALLKAAGIRKIDSSEKDECRLIRSSREICGCNCRGYCDPDTCYCSQSGIKCQVDRVNFPCGCTRDGCGNVIGRVEFNPGRVRTHFIHTIMRIELEKKQTNSDDLIDGRSWVPSIKLPILPNSDSSVYNHHSIIYSHIELNSALPTSSSLNSLQLSRPNSSTTGSGESLDLHYAYRDDYPVTSNNIIEPSRLPNSDTSNFKIHPFNHEANSLTYQTHTYNTYTSDFIETSQNSLILSNQTYDTSPTASITTTQEEQQPQISQENYLHSESFDMSSTVDTPTHLGNNLSDNIPIKELKNENLCDELSLPESFGLSHEDNDKNKTNANEDFINLRPPESNSPRLEAINDLLEHSRLSSATTSSYSSEDVLIDNNCLRITTIVTSLPPPKTDVISINSNEIDDTNDIINNNLIKTIIETETLNINNNIENNTESDDKCENSLVKIENKTNENNNIKDDVNENLSEIIKKGIVETVSA

Similar Transcription Factors

Sequence clustering based on sequence similarity using MMseqs2

100% Identity: -
90% Identity: -
80% Identity: -