Basic Information

Insect: Polistes metricus
Gene Symbol: CSRNP3_1
Assembly: GCA_010416925.1
Location: QUOH01000018.1:1499791-1504955[-]

Transcription Factor Domain

TF Family: CSRNP_N
Domain: CSRNP_N domain
PFAM: PF16019
TF Group: Unclassified Structure
Description: This presumed domain is found at the N-terminus of cysteine/serine-rich nuclear proteins. These proteins act as transcriptional activators [1].
Hmmscan Out: # of c-Evalue i-Evalue score bias hmm coord from hmm coord to ali coord from ali coord to env coord from env coord to acc

1 3 0.18 2.5e+03 -2.2 2.3 64 134 268 338 245 355 0.53

2 3 0.056 7.9e+02 -0.6 2.3 43 116 464 522 416 532 0.52

3 3 7e-101 9.8e-97 322.8 7.7 1 218 868 1078 868 1078 0.92

#	of	c-Evalue	i-Evalue	score	bias	hmm coord from	hmm coord to	ali coord from	ali coord to	env coord from	env coord to	acc
1	3	0.18	2.5e+03	-2.2	2.3	64	134	268	338	245	355	0.53
2	3	0.056	7.9e+02	-0.6	2.3	43	116	464	522	416	532	0.52
3	3	7e-101	9.8e-97	322.8	7.7	1	218	868	1078	868	1078	0.92

Sequence Information

Coding Sequence: ATGATCGAGAAGTCGAGGGATCCTTCGGATTGCGAGATGGAGGTCGCGCGGGAAATTCTGGGAGGCCTAGTAGAAGCTACGGATCCGATTATGGAGAAGCAAGAGAAGGAAACGGTGGAtgggaagaataaaaatggaaCAATTGCAAcatcaacaacagcagcaacgcCATTACCATTGCAACCACCGCAatttccaccaccaccaccacaaccatcaacaacaacaacaacaacaacaacaaacgcAGCAACAACGATTCCCAGCGAATCGAGTTTTACACCTTCAGAGAAGATTGTTCCTGAATGTCTTGTAGAAGAAGAACCAAGTAAGCAGGCCGATGAAAATGTTGAATCACAAGCGAAGACGCCCAATGGCGTCTGTTCAGCTTCTTTGTCACCGGGATCGTTGTTGCCATCTTTGTCTTCCCCgccttcgtcgtcgtcgtcgttatcAAGAAAGAGGCCAGCCGGTAGCGACTTCCTGTCGATTGACTCCGATATTAAAAGAATCGGTGTCGAGATGTCTGAAGAAGAGACGAATCAGTTGAAAAACGATGTAAAGAAACTTTCACCCGTTGAGATAAGTCTTCGCGAATGTACGCTAGGTGAGATTTCATTGACACCAGATTCTCGATCATTTAGCGAGGATGTCAACAATGATTTGTCGGAAAATTCACTATTGTCTTCTAACGTATCGCGAAGTCGACGTAGGTATCAACCAACACCGTTAAATAACTTGGTTACTGAAGCAGACGAAGATATTATGTGGACACGATCAAGGTCTAGAATCTTTAAAATTGAATCTACGATTGAAAATGAGGAGGAGTGCTGTACTACGAGTAGCATCGAAAACACGGATAACAATGttcaaagtaaattaaattatatcaagGATAAAATCAATGGCGACGACAACGAAGACGACAAAGTCAATAAACAAACTTCCTGTTGCTTGTCGTCGTCCTTctgcaagaaaaatattttctccaaTGAAGACATAGACAGGGTCATTGACGATTCTAATGCTGAAAGGTCCAACGTTAAAAATACGAGAGTAGATTCTCTACGTCATTTGGTTGTCATGCTGGATCGTATAGATAAATCGGGTTTTAAGGAATGCCAAAACAACGTTCTTGGTCTTATAAAACCGAGGAAGATTCTTGCAGAAGAAGGTACAACTGAGAAGGACAAGGTGCACGAGAAGACGCAAAAGAGTTCTTTATTGCCTCGTAAATTGATCGTAATGTTAAATCGTATAGACATAAAGGAAGATTCTACAAACaaagaacgagaagaaatttttattcgtagtAATACAATAGAATCTATTGATTCTACGGTAAATtgtcgaagaaaaaatttaaattcgatGGATAAGATTTGTACACGTTCATCTACCCTGCAAGAGCGGATACAGGAAAACAATGTTGTAAAATCGAGCGATGAATTCGcggaaaaaagtaagaaaagcgATGCATTGCTGGATAATCATTCTGTAACCGAAGATCCTGTacgagagaaggaaaatagTAGTGTTGACGAGATTAAAGATTTGCAGCCAGTTGAAATGGTTGAGGATATGAAAATCGAAGTATCGGAAACGCCGACAATACTTCCTTCTTCGACGACTCCTATTGTGGATAAATATGACAGTCAAATTTCGTTGGAGATAGGTGGATCATCTTCTAACGAAGTTAATCGTTACTCAATAAGaagtaaaacaaaaactgTCGTCGAGGAGCTTGGTGAGAAGGAAGAATtacgaattgaaaaaaatgttgcgAGGAGAGGCAGCGTGGTACAGATATCAAGTAAAGAAACGATTTCTCGCGGTGTACCAGCagtggtaataaaaaaaattgaaaacgaGGTAGAAATCGTACTGGTGgcgtcttcgtcgtcttcgtctttgTCAAACGAAGATGATCGTCTGCGAACTCTCGACTCGCCTGATTTGGATTCGTCCGAGACAGCGACACCAGGCTCACCCGGGGAAGCACTGGAAGCTAGTACCGATATCCAAGAGGCGATCGATACCGAAACAGAAACCGAGACTGGATCAGACAGTTCCGAGTTGCCATCATCAATGTCGACCGTTCGTATTCGCGGTACTAGTTGCGAGAGAGAAGATATCACCGATGCAGCCAATTGTCCAGAAAACGAGAACCTCTGCTGCGACGAGATAGCATCCGAGATAATAACCAGACTTGAACCAGAAAAGCCAGAACCTTTTACCGAGGATTCCGCAGAGAGTTTGGCGTTGACGACTGGTGCAAGGGACGAAGTTAGATCCGATGGGAGCGATTCTGGCCTTGGAAGTGAAATACCTGGAGATCCTGGACCAGCCCCAGCTCCAGAAAGCGATTCGGAGACTTCTTTTCTCGATAGAATACCGGATGATATTCTCTCCGACAAGGAAAAAGCTGTTAACCAACTGGAGGAAAGTTTTGTATCAGACACCAGTGTCCCTGGGGTATCGCAGACGACATTAACGACCTTTCGAAGCCCTTCGAAAAGCAATCTCAAACGTAGACTGACCGACTGTATGGAAGAAAGTGAACCGAGTCCTAAAAGAAGCAATACTACCGAGGAgcctataaaaaagaaacgaaatattcattttgatGCCGTCACCGTTTACTACTTTCCTCGAGCGCAAGGTTTCACTTGTGTTCCTTCACAAGGCGGCAGTACTCTAGGCATGAGTGCAACGCACACGCACGCGGAAAGGTTTTCTCTTTCCGAGCATGCGGCCGAGCAAAGGAGACTGCATCGGGCTAGATTGGCGCAATTACGTTCCGAACGTGCAGCTAATTGTACTACAGAGGCTGCTTCTAGTTCGGAAGATCCGAGCGACGATACCGACGAAGAACCTAGCGACAATGAAGAGCTCGATATCGACagctattattttctacagcCTGTACCAACGTGGCAAAGACGAGCGCTTCTTCGAGCAGCCGGTGTACGTAGGATAGATGCCGTTGAGAAGGATGAATGTCGGGACATCCGTGCGAGCCGAGAACACTGTGGCTGCGGATGCAAGGGATACTGCGATCCGGAAAGTTGCCCTTGCAGCAGAGCGAACGTCAAGTGCCAGGTCGATCGTGCCGGTTTTCCTTGCGGTTGTACCCGGGACGGTTGTGCCAACAGCTCCGGTAGGATAGAATTTAATCCGGTAAGAGTGCGGACACATTTCATACACACATTGATGCGGCTCGAATTAGAGAAGAAGCAACGCGACGAAGAAGGAACAGATCACGAGAGCACCGACAATCAGAATAACAAAAGCGGACCATTGCGAGACATCAATTTGGTTTCTCTAATGGACAATTCAAATACGGAAGCGTGTATAACCGGTGGTGGTTTTACAACGTTACACTATGAAAATCATGATACCGGGAACGGTAGATCAAATTGTCAAACAGAAGTATCTGGTACACGAGAAGATAGTTTAGATCTTTATGCTATAAGAGACGATTGTTATCCTAACGAAGATACGGTTGATGGTACGCAGAGTGGCCAAAGAAAATTGCATCCCGAATTTAATCAAACTTTTCAAACGTTTTCGGGCCAAACAGCAGGTGCAAATATGAATTTTCAACAGACCGCTTATCAAGATTATCAGGCTTATACAAATCTTCCTTCTACGTCTAGGGTGCAATTTCAGCCGCAATTTCAACCGGTGTCAGGAAGCTCAGGTTTTTCGCATTACGCGGTCTATGGGCAAGATGGCACATCTGTGCAGGACAGTTGTCAGGTACATCCTGGACAACATCCTTCCAATTACGAGGGAAACTTCGCGCAAGACGAATCGACCGGATCGcaatatacaaatttgaatTCCGTTCAACCTATGAACGGTGGAGTCCAACAGATAGGTAAGCTAGAACCGTTCTCGGAATTGCTATCCGGTAGGTACTCGTATTATGGCGAAATAGAGCCGCAAGCGCATGGTACTTATCATGGAAATGGAAGTaaggaaggagaaaagagTCAAACGACGAATGAGCAACAATCGCAAAGTACGGAGGAATGTGACGAAAATTTTGGAGAAATCATAAAGAAATCTATGGTGGAGACTGTGTCCGCTTAG
Protein Sequence: MIEKSRDPSDCEMEVAREILGGLVEATDPIMEKQEKETVDGKNKNGTIATSTTAATPLPLQPPQFPPPPPQPSTTTTTTTTNAATTIPSESSFTPSEKIVPECLVEEEPSKQADENVESQAKTPNGVCSASLSPGSLLPSLSSPPSSSSSLSRKRPAGSDFLSIDSDIKRIGVEMSEEETNQLKNDVKKLSPVEISLRECTLGEISLTPDSRSFSEDVNNDLSENSLLSSNVSRSRRRYQPTPLNNLVTEADEDIMWTRSRSRIFKIESTIENEEECCTTSSIENTDNNVQSKLNYIKDKINGDDNEDDKVNKQTSCCLSSSFCKKNIFSNEDIDRVIDDSNAERSNVKNTRVDSLRHLVVMLDRIDKSGFKECQNNVLGLIKPRKILAEEGTTEKDKVHEKTQKSSLLPRKLIVMLNRIDIKEDSTNKEREEIFIRSNTIESIDSTVNCRRKNLNSMDKICTRSSTLQERIQENNVVKSSDEFAEKSKKSDALLDNHSVTEDPVREKENSSVDEIKDLQPVEMVEDMKIEVSETPTILPSSTTPIVDKYDSQISLEIGGSSSNEVNRYSIRSKTKTVVEELGEKEELRIEKNVARRGSVVQISSKETISRGVPAVVIKKIENEVEIVLVASSSSSSLSNEDDRLRTLDSPDLDSSETATPGSPGEALEASTDIQEAIDTETETETGSDSSELPSSMSTVRIRGTSCEREDITDAANCPENENLCCDEIASEIITRLEPEKPEPFTEDSAESLALTTGARDEVRSDGSDSGLGSEIPGDPGPAPAPESDSETSFLDRIPDDILSDKEKAVNQLEESFVSDTSVPGVSQTTLTTFRSPSKSNLKRRLTDCMEESEPSPKRSNTTEEPIKKKRNIHFDAVTVYYFPRAQGFTCVPSQGGSTLGMSATHTHAERFSLSEHAAEQRRLHRARLAQLRSERAANCTTEAASSSEDPSDDTDEEPSDNEELDIDSYYFLQPVPTWQRRALLRAAGVRRIDAVEKDECRDIRASREHCGCGCKGYCDPESCPCSRANVKCQVDRAGFPCGCTRDGCANSSGRIEFNPVRVRTHFIHTLMRLELEKKQRDEEGTDHESTDNQNNKSGPLRDINLVSLMDNSNTEACITGGGFTTLHYENHDTGNGRSNCQTEVSGTREDSLDLYAIRDDCYPNEDTVDGTQSGQRKLHPEFNQTFQTFSGQTAGANMNFQQTAYQDYQAYTNLPSTSRVQFQPQFQPVSGSSGFSHYAVYGQDGTSVQDSCQVHPGQHPSNYEGNFAQDESTGSQYTNLNSVQPMNGGVQQIGKLEPFSELLSGRYSYYGEIEPQAHGTYHGNGSKEGEKSQTTNEQQSQSTEECDENFGEIIKKSMVETVSA

Similar Transcription Factors

Sequence clustering based on sequence similarity using MMseqs2

100% Identity: iTF_01232991;
90% Identity: iTF_01232395;
80% Identity: -