Basic Information

Insect: Ceratitis capitata
Gene Symbol: CSRNP3_1
Assembly: GCA_000347755.4
Location: NW:2736936-2751106[-]

Transcription Factor Domain

TF Family: CSRNP_N
Domain: CSRNP_N domain
PFAM: PF16019
TF Group: Unclassified Structure
Description: This presumed domain is found at the N-terminus of cysteine/serine-rich nuclear proteins. These proteins act as transcriptional activators [1].
Hmmscan Out: # of c-Evalue i-Evalue score bias hmm coord from hmm coord to ali coord from ali coord to env coord from env coord to acc

1 5 0.22 2.7e+03 -2.5 0.9 53 115 83 145 62 178 0.44

2 5 0.16 2e+03 -2.1 3.2 46 97 321 369 297 399 0.51

3 5 2.9e-95 3.5e-91 304.4 6.4 2 218 496 698 495 698 0.92

4 5 0.21 2.6e+03 -2.4 3.0 54 103 1084 1133 1049 1160 0.50

5 5 0.11 1.3e+03 -1.5 0.1 80 138 1197 1255 1170 1263 0.65

#	of	c-Evalue	i-Evalue	score	bias	hmm coord from	hmm coord to	ali coord from	ali coord to	env coord from	env coord to	acc
1	5	0.22	2.7e+03	-2.5	0.9	53	115	83	145	62	178	0.44
2	5	0.16	2e+03	-2.1	3.2	46	97	321	369	297	399	0.51
3	5	2.9e-95	3.5e-91	304.4	6.4	2	218	496	698	495	698	0.92
4	5	0.21	2.6e+03	-2.4	3.0	54	103	1084	1133	1049	1160	0.50
5	5	0.11	1.3e+03	-1.5	0.1	80	138	1197	1255	1170	1263	0.65

Sequence Information

Coding Sequence: ATGTTTAGACCAATCAAGAACTTAATAAGTTACATACAGAAAAATGCTAGTGGCAGCGCGATTTTTGGCAGCTCAACAGCAGTAGCTGACACAGAGACTGAAACACAAAGCGAGGTTGGCATTGAAGCAACCAAAGATATACAACAAGAAAGTAAGGAAATCGGTAGAACAGAGAAAGAAATTGCAACAGAAGTAAGTCTGCCTCAAGAGAAGACACACTTACCTGAAACTGCTGACGAGCAAATGCAGCAGGAGCATATAAAGCGCGGTGAAAGGAGTAAAATGAATGTTGCCAGCAATGCCAATAAGGCTCAGCCTACAGTGCAAGTGGTTAATGGCAAAGAACCGAATGGCATTGCCACATACGGTGTTGGCGACTGCGATGTAGAAGATGACATCGAGATGCAAATTAAAAGTAGCGTAATGCTACGGCCACCACTAAAACAAACCACTAGTGTGGTGGAAAATCTAACCGATGAAATAGATGACACCGAATCGGAAGATGTTTTATCACAGGATTCACAAAACGAATACAATGACGCAATGGGCGCTGATTCACAAGATGAATACGTAGAGTATCCGCCAATATCTCTGCTCAGTGACGATGGCACGTTCGGTGCGGGTGAAGATACAGTTGAAGAGTTTATCACAGAAGAAGAGGATGCAGATGAGTTGACAAGGGATCGAGCGAAAAGATTTGAGGACAGCGAAATTATCGTGCTTAGCGACGGTGAAATAAACTGCTCCATTGCGTCGGATGCGCTATCCGAAGATCCCTTGGCCATTGATGACTTCACACAACCATCGCTTTCGGGTATTAAAGATACATCGAATCCATTGGATTCCTCAACAAACGATGAGGCTTCCACAAGCGGTGACCTCCTATGGATGAGTATAGACGAAGtaaagacaaacaaaacaaaaccaaatgcaGAAAAAGACTTAAAAAGCGAGGCGGATACACTTTCGTCGCAAAGCACATCACAGCGACAGCTTATCATTACGACAGAGACCAAGGAGAAACGCAATACCAACGTTACCGCCAGCGGCAGCAATAAAAGCGCAGAAAAGCTTAATACGCAACACGATGAACATGCAGAAGAGATACGTAGTGATGGCTCCGATTCGGGTTTGGGCAGCGAAACATCCACACTCCAGACTACACTAGCAGATACCAGCCATTTGACTGCGACCAGCGATACTAGTGTTGCAAATACGCCTACATGCAACAAAACCAAAGCCACAACAATTGCAAATAAGGAGAGCACCACCAGTAATGGCAGCAATGTTACCTTGACGGATGGCGTAACAAAATCATGCAGTGCTGTTGTGCCCGTGACTGTTATAGCGGCTGCGCCAAGTTTTGGAGCCGTTATGAAACCTTTACGTTCGAATTTAAAGCGTCGGCTCGAGGACGACGAAGCCTTGATTGACTCGCCACAGAAAACGCAACTGGCTACCACCAGCAGTAACCAAATTAAAAAGCTTAAGCGCTCGATCAACTTCGAAAATGTGCAGGTATACTATTTTCCACGACAGCAGGGTTTCGGTTGTGTACCTTCGGCGGGCGGTTGTACGCTAGGCATGGGAGCACGACATATTGGCTTCAAAACGCTCACACTCGCCGAACATGCTGCCGAGCTGCGACGTGCGCATCGCTTACAACTGCAAGAAATCAACCCACGTGGCTCCTCAAGCGATGACAGTGAAGAGTCCGAAGAGGATTATCTAAGTGAGGGTAGTGGCTCCGATTTAGACGCCGAATCCAATGGCTTTCTGCAACCAGTATCTCCCAAGCAGCGACGTGCATTGCTCAAGGCGGCGGGTGTGCGTAAAATCGATGCCGCCGAGAAGATTGAATGCCGCGACATACGAAACTCGCGTGAGATTTGCGGCTGTGCGTGTGTAGAATTCTGTGATCCTGAGACTTGTGCCTGCAGTCAAGCGGGCATCAAATGCCAGGTCGATCGCGCCATGTTCCCATGCGGTTGTACACGCGATGCCTGTGGCAACACAGTGGGACGCGTCGAATTCAATCCAACTCGCGTACGCACACACTTCATACACACAATCATGCGTTTGGAGATGGAGAACCGCCAGCGACAGAATCCACCACTTTGTGCTACTATGAGCAGCTACACTTTGTCTGCAGCCTGTGCCACATCTTCTGCCGTTGTGGGCCCACATACCAGCGCCCTACCGCCTACGCCATCATACGCCAACACACTTCCCGGCAGTTATTATGCCATGCAAACACAATCAAATTATAGCTCGGGTTATGCATCACCCGCCTACCCCAGCGAACCAGCAGCCAATTATTATCAGCAACAAAGCAGTACTAGCACTACTACACATTACAGTACTGTCAGCACAAATGATTTGCAAACaattgcacaacaacaacaacaaagctatCAATTAGACACTCTTGACGGTGATCTATTTGCCAGCGCAGCGACCGCCACGCCAGTGGTGTACGGCGAAATGATGCCAGCTTATAGCAGTGGTATTGGCGGCGTTGCGGCGAGCACTGCCACTGTGAGCTCTTATCATCAGAATATTAACTATTCAACGCAGGTCTCCACTTACTCCGCCTATCAGCAAACAACGAACACCAGTGGCTATCTAACACAGCCGAGCGCAAAAGCTACCGCACAGCCAACGCTGACACCGCCTACCACCTACAGTTCATGCGCAGTACCATCGTTGCCACCTTACGGCACAGCGACAACaaccgcagcagcagcacaatACCAAGATACTAGCAGTTATGCGCTCGTCGACACTACAGCGCCCAGCTGTATTACCATGGAAGATAGCGGGGGAAGTGATGCAGAGGAAGCCGATGCTGGGGAAGATAACTGCCCTGATGCTAACAATGGTACAACCAACGCCACCGCAACCAATACTTCCTGCAACACAACTGCTATCGGCGGCAGCAGCTTGCAAACCGGCAATGAAATTGAATGGAAGAAACCCGATAGCTGCGTCAATGTCAACGAAAGCGGTAGTAGTGCAAATGAAAGTGGCAGCAGTTTCATCCAGCTCAGCACACCAATTTCCAGTGTCACCCGACTCTCACAAATCAACGATCTACTAGAACATAATCGCCATACCACCGCTACGCTCGTCTCGGTCTCGCATACAACATGTCTGAGTGCAAATGGTAGCGGCAGCagcaccaccactaccaccaatACGCTCATTAGTAGCCGCAGCGTTACGACCGATTGTGATTACAccgacagcagcagcaatagtaACAGTCAAGATAAATTGGGAAAAGAAGAAACcgaaactgaaactgaaattgaaaataaaaatgaaaatgaaaagaaaatagaaaatgttgGGGAAACACCACTCACTGCAGCTGAAGTAAGCGCAGTTGAAACGAAGAAAATTGTTGAGGAAAAAGAAATATCGAAGCTACAAGTGGAAGTTGCCGAAGTGGAAGTGACGTCTTCGACAAAAGTTGCAGAAGGCAGTGATAATGAAACAGTTACGtctgaaacaattaaaattgtacATGATGTGCTTGATAAAACCGTTATAAACACTACGGGTGCTGTCACAAATATTGCGGAGAGTGAAGGTGATGTGTTGAGCAAGCATGATAGCGTTGATAGTTGCACACCGATGACCGAAAGCAACGCTGCGAACACAACTACTAACAACACTACCACTACAACAATTGATAAGAAGCACAGGcaaagaaaaatggtagaagtctcagctgtttcggagatcaccacatcttctcgtcagacttcttatggcaggatTCGAACTTGA
Protein Sequence: MFRPIKNLISYIQKNASGSAIFGSSTAVADTETETQSEVGIEATKDIQQESKEIGRTEKEIATEVSLPQEKTHLPETADEQMQQEHIKRGERSKMNVASNANKAQPTVQVVNGKEPNGIATYGVGDCDVEDDIEMQIKSSVMLRPPLKQTTSVVENLTDEIDDTESEDVLSQDSQNEYNDAMGADSQDEYVEYPPISLLSDDGTFGAGEDTVEEFITEEEDADELTRDRAKRFEDSEIIVLSDGEINCSIASDALSEDPLAIDDFTQPSLSGIKDTSNPLDSSTNDEASTSGDLLWMSIDEVKTNKTKPNAEKDLKSEADTLSSQSTSQRQLIITTETKEKRNTNVTASGSNKSAEKLNTQHDEHAEEIRSDGSDSGLGSETSTLQTTLADTSHLTATSDTSVANTPTCNKTKATTIANKESTTSNGSNVTLTDGVTKSCSAVVPVTVIAAAPSFGAVMKPLRSNLKRRLEDDEALIDSPQKTQLATTSSNQIKKLKRSINFENVQVYYFPRQQGFGCVPSAGGCTLGMGARHIGFKTLTLAEHAAELRRAHRLQLQEINPRGSSSDDSEESEEDYLSEGSGSDLDAESNGFLQPVSPKQRRALLKAAGVRKIDAAEKIECRDIRNSREICGCACVEFCDPETCACSQAGIKCQVDRAMFPCGCTRDACGNTVGRVEFNPTRVRTHFIHTIMRLEMENRQRQNPPLCATMSSYTLSAACATSSAVVGPHTSALPPTPSYANTLPGSYYAMQTQSNYSSGYASPAYPSEPAANYYQQQSSTSTTTHYSTVSTNDLQTIAQQQQQSYQLDTLDGDLFASAATATPVVYGEMMPAYSSGIGGVAASTATVSSYHQNINYSTQVSTYSAYQQTTNTSGYLTQPSAKATAQPTLTPPTTYSSCAVPSLPPYGTATTTAAAAQYQDTSSYALVDTTAPSCITMEDSGGSDAEEADAGEDNCPDANNGTTNATATNTSCNTTAIGGSSLQTGNEIEWKKPDSCVNVNESGSSANESGSSFIQLSTPISSVTRLSQINDLLEHNRHTTATLVSVSHTTCLSANGSGSSTTTTTNTLISSRSVTTDCDYTDSSSNSNSQDKLGKEETETETEIENKNENEKKIENVGETPLTAAEVSAVETKKIVEEKEISKLQVEVAEVEVTSSTKVAEGSDNETVTSETIKIVHDVLDKTVINTTGAVTNIAESEGDVLSKHDSVDSCTPMTESNAANTTTNNTTTTTIDKKHRQRKMVEVSAVSEITTSSRQTSYGRIRT

Similar Transcription Factors

Sequence clustering based on sequence similarity using MMseqs2

100% Identity: -
90% Identity: -
80% Identity: -