Basic Information

Insect: Chrysops caecutiens
Gene Symbol: CSRNP3_1
Assembly: GCA_963971475.1
Location: OZ020569.1:52977451-52980525[+]

Transcription Factor Domain

TF Family: CSRNP_N
Domain: CSRNP_N domain
PFAM: PF16019
TF Group: Unclassified Structure
Description: This presumed domain is found at the N-terminus of cysteine/serine-rich nuclear proteins. These proteins act as transcriptional activators [1].
Hmmscan Out: # of c-Evalue i-Evalue score bias hmm coord from hmm coord to ali coord from ali coord to env coord from env coord to acc

1 5 0.3 1.4e+04 -3.0 1.7 60 103 94 136 63 153 0.50

2 5 0.2 9.6e+03 -2.4 0.2 96 134 234 273 172 283 0.54

3 5 8e-93 3.9e-88 296.4 7.2 2 217 341 541 340 542 0.91

4 5 0.15 7.1e+03 -1.9 0.2 73 88 680 697 648 734 0.46

5 5 0.17 8e+03 -2.1 0.9 70 138 846 912 822 920 0.51

#	of	c-Evalue	i-Evalue	score	bias	hmm coord from	hmm coord to	ali coord from	ali coord to	env coord from	env coord to	acc
1	5	0.3	1.4e+04	-3.0	1.7	60	103	94	136	63	153	0.50
2	5	0.2	9.6e+03	-2.4	0.2	96	134	234	273	172	283	0.54
3	5	8e-93	3.9e-88	296.4	7.2	2	217	341	541	340	542	0.91
4	5	0.15	7.1e+03	-1.9	0.2	73	88	680	697	648	734	0.46
5	5	0.17	8e+03	-2.1	0.9	70	138	846	912	822	920	0.51

Sequence Information

Coding Sequence: ATGTTAAGAccattaagaaattttatatcatatttACAAAAGAATGCGAGTAGTGCAGTAATTTTCGGCGTAACTCCAGCAATGAGTGAAGAAGCTAAAGAAAGTGGTAAAGAAATGACATTATCAACACCCGTTGATAAGCCGGATGTCAAAGATAAAGATCAAGTATCATCTGGAAATGTAATTGAATTGAGTGATACTTCTGATAAACTTAGTAAAGACCATgaccaaaatgaaaatgtattgTCACCATCTAAAGATTGTACTGTAGAACATGATGACttggaaaaggaaaaagagATAGAAAATAAAGATGGTAAAGTAAAGAAAGACTCAGTAAGTGAGGCAACAGAAGGGGAAAGTTCTAAAAACATTGGCCGTGATACTCCATCGGATATTGACGTTGATGGTCTTGCAGCaaaagaagatgaaagaataaAAGATATTGTAAGCCAGATTGTCGATACCAGCACTGAAGAAATAACAGATGATAACTTAATCGTTGATGAGTTAATAACTGTCAACGATGAAACAACAACAGACGTTTCCGACTCTATTACAGAGGAACAATCGCAAGATCCTCTGGCTATAGAGGAATATCAAGCTGATATCAGTGGAAGTATCAATAATTCAAACTCCCTTCATTCTACAAACCCTGATATGGAAACTTCAACTGAAGGTGAAATTGTATTTGTAATTGATGTACATTCAATAAAACATAGTCAAGAAGAATGTAAGAAAGATGATGTCTTTATTGAACCGATTGTTATCAATAGTGATAATGAAATTTGTCACGCTGCAATAGCAACTCAATTAGATGAAATAAATGAGGAACAAGAGGTAAGAAGTGACGGTTCCGATTCTGGTTTAGGAGCAGAAACAATCGGAAAAATACCTGGTATCACTGATGTTGATggaaatttaagtttaatacctataattaataaacctCCACCTTCACGTGGTAATCTGAAACGTCGAAATGTGGAAATTGTTCCAAGAcaagaaaacaacaaaagaGCGAAAAAATCAATCACTTTTGATGGTGGTGTgactattttctattttcctcGTATGCAAGGCTTCGCCTGTGTTCCTTCGCAAGGTGGATGTACATTAGGAATGGGATCAAGACATGTTGGCCAGAAAAAATTCACGTTAGCTGAACATGCTGCTGAGCAAAGACGGGTTCATAAACAACACATGCAAGAGATCAATCCCAGAGGTTCGTCAAGTGACGAAACAGATAGCGATGAAGAAATAAGTGAAGCTAGTGGTTCAGATTTAGATGCTGATGGAACTGGCTTCTTACTCCCAGTATCCACTAGACAAAGACGAGCTATTCTAAAGGCAGCTGGAGTAAGACGAATTGATACTGCTGAAAAAGATGAGTGCAGAGCCATTAGAGGCTCCAGAGAGTTTTGTGGTTGCAGTTGTAATAGTTTTTGTGATCCAGACACTTGTACGTGCAGTTTAGCTGGTATTAAATGTCAAGTTGATAGACCAAATTTCCCTTGTGGCTGCACACGTGATGGCTGTGCCAATGTTATAGGTCGTGTAGAATTTAATCCAAGTCGCGTACGAACACATTATATACATACAATCATGCGTTTAGGTttagaaaacaaacaaaagcGATCAAATGATATGATTGATGGTGCATCCGTTGCTGTTCCATCACTATCAACTTACGCGATTACTTGTGGTTCCACAAATACTAATTCTTCTGTTACTTCCACTTTAAGTAATTGTGTtagtagtaataatgataatattaataacctTAATAATGTGTGCAATTATAACAATCATTTACGCACCTCACAATACGGGCAATCACTTTTACAACATTTACTTAACACTCCTCCCGTTAATCACACTTCATATTCGAACGGTGTCACTCACTCAAACATGTATCCAGATAATTTGGATTCTGGAGTTTTAAATCAACTGTTGGTTGAAGACTGTGGAACTACTCAGACTCATTTACATCAGACACATTCGGTAATgcatcataatagtaatacatTCATTAACAATAGTCAACATAACCACAATATTTCTAGTTCTAATGATAATTGtaatactaatagtaacaGTACCAGTATCACTCAAAGTCATCCAAACGAGTTGCATTATCCATTCCGTGAGGTAGGAGTCGATTGCACAACCAATGCAACTACAACTCCCTGTAATACAGAAAATAGTAACATTGGAATGTATTTCCCTGCCACAACCAATAATCAATTATATCACGATACCTACAATAGtaacaattatattaacaATTCGTACACTACATCTAATACAAATGTGAGCACTACTTTTTCCAGCTACCAACAAACCTATATAAATTACGCTTCGGCGTGCAATAATCAAATACCAGATGAAATTTATGATTTGAATTCTACTGACGAGGATGGTACAGATTACATTAATCTACATCCACCAGTCGCAAATTCAGAACGTCTTGATGCAATCAATGATCTTTTGCAAACAAATCGCAACACAACTCCAACTGAATCAGCAACCAATGCATCTAATGATGTAGTTCTGACCACCAAAGATTCAAGCATTTTAGAAAAGGAGTGTGAAAATTCCAAAACATCACTTGAAGAAAACTCCACAACAGAACCAAATCCGtcaaatatgaattttgaacaaaaatttgaagacTTCATTGATGTTGTAATTTGTGATTCCTATGATGTCGATTCGGTAAAAtctgaagaaaaaattgtagAGAAAAATCTGGAAAATCCTTGCAAAAGTCTTTTAGAGGAgtcaattattttatcttcatGTTCGTCATCGTCTTCATTTCTAGTATCAGATACAAGTATGTCCTCTACAAAATTAATTCCAACAACTAGCGCCAGCACCGATACTCAACAAAATCCACCTCCGCCTAATTTAGAATCATTGAACCCATTTGAAGATACTGTACCTTGTGAAAATGATGAGAATTTAAGCGAAATCATTAAGAAGAGTATAGTTGAAACCGTTActgcataa
Protein Sequence: MLRPLRNFISYLQKNASSAVIFGVTPAMSEEAKESGKEMTLSTPVDKPDVKDKDQVSSGNVIELSDTSDKLSKDHDQNENVLSPSKDCTVEHDDLEKEKEIENKDGKVKKDSVSEATEGESSKNIGRDTPSDIDVDGLAAKEDERIKDIVSQIVDTSTEEITDDNLIVDELITVNDETTTDVSDSITEEQSQDPLAIEEYQADISGSINNSNSLHSTNPDMETSTEGEIVFVIDVHSIKHSQEECKKDDVFIEPIVINSDNEICHAAIATQLDEINEEQEVRSDGSDSGLGAETIGKIPGITDVDGNLSLIPIINKPPPSRGNLKRRNVEIVPRQENNKRAKKSITFDGGVTIFYFPRMQGFACVPSQGGCTLGMGSRHVGQKKFTLAEHAAEQRRVHKQHMQEINPRGSSSDETDSDEEISEASGSDLDADGTGFLLPVSTRQRRAILKAAGVRRIDTAEKDECRAIRGSREFCGCSCNSFCDPDTCTCSLAGIKCQVDRPNFPCGCTRDGCANVIGRVEFNPSRVRTHYIHTIMRLGLENKQKRSNDMIDGASVAVPSLSTYAITCGSTNTNSSVTSTLSNCVSSNNDNINNLNNVCNYNNHLRTSQYGQSLLQHLLNTPPVNHTSYSNGVTHSNMYPDNLDSGVLNQLLVEDCGTTQTHLHQTHSVMHHNSNTFINNSQHNHNISSSNDNCNTNSNSTSITQSHPNELHYPFREVGVDCTTNATTTPCNTENSNIGMYFPATTNNQLYHDTYNSNNYINNSYTTSNTNVSTTFSSYQQTYINYASACNNQIPDEIYDLNSTDEDGTDYINLHPPVANSERLDAINDLLQTNRNTTPTESATNASNDVVLTTKDSSILEKECENSKTSLEENSTTEPNPSNMNFEQKFEDFIDVVICDSYDVDSVKSEEKIVEKNLENPCKSLLEESIILSSCSSSSSFLVSDTSMSSTKLIPTTSASTDTQQNPPPPNLESLNPFEDTVPCENDENLSEIIKKSIVETVTA

Similar Transcription Factors

Sequence clustering based on sequence similarity using MMseqs2

100% Identity: -
90% Identity: -
80% Identity: -