Basic Information

Insect: Bactrocera dorsalis
Gene Symbol: CSRNP3_1
Assembly: GCA_000789215.2
Location: NW:2023609-2032327[-]

Transcription Factor Domain

TF Family: CSRNP_N
Domain: CSRNP_N domain
PFAM: PF16019
TF Group: Unclassified Structure
Description: This presumed domain is found at the N-terminus of cysteine/serine-rich nuclear proteins. These proteins act as transcriptional activators [1].
Hmmscan Out: # of c-Evalue i-Evalue score bias hmm coord from hmm coord to ali coord from ali coord to env coord from env coord to acc

1 5 0.23 2.9e+03 -2.6 0.1 87 92 84 89 34 148 0.51

2 5 9e-95 1.1e-90 302.8 6.5 2 218 504 706 503 706 0.92

3 5 0.78 9.6e+03 -4.3 0.3 93 104 792 806 777 821 0.36

4 5 0.32 3.9e+03 -3.0 0.1 84 113 1008 1035 963 1047 0.47

5 5 0.69 8.5e+03 -4.1 0.2 73 78 1119 1124 1085 1157 0.47

#	of	c-Evalue	i-Evalue	score	bias	hmm coord from	hmm coord to	ali coord from	ali coord to	env coord from	env coord to	acc
1	5	0.23	2.9e+03	-2.6	0.1	87	92	84	89	34	148	0.51
2	5	9e-95	1.1e-90	302.8	6.5	2	218	504	706	503	706	0.92
3	5	0.78	9.6e+03	-4.3	0.3	93	104	792	806	777	821	0.36
4	5	0.32	3.9e+03	-3.0	0.1	84	113	1008	1035	963	1047	0.47
5	5	0.69	8.5e+03	-4.1	0.2	73	78	1119	1124	1085	1157	0.47

Sequence Information

Coding Sequence: ATGTTTAAACCAATCAAGAATTTCATCAATTATATTCAGAAGAATGCAAATGGCAGTGCGATATTTGGCAGCACTACGTCAATAGCCGACAGCAAAACCGAACCAAGTGCCGAAGAGATTGTCACcgaatcaacaaaaaatattcgtgTCGAAAGTGAAGCGACACGAGAGCAAAGTGCGAGTGCGAAAGACGGTCGTGTAGTGGAGACATTAGTGGTTTCTAAACTTTTGAATGAACAAATAGAGAACAAAAACATGAAGCGCATAGAAGTGAATAAATTAAGTgttattaattgtaaaaatgcaACCGTAGAAGTGATTAACGGTAATGAGCCGAAGGGTATTGCAGTTTATGATGGTGACGATTGTGATGCCGACGATGACATTGAAATGCAGATAAAGAGCAGCGTTATGCTGCGGCCACCATTAAAACGTGCCGGTTCTTTGGTGGAAAATCTAACGGATGAAGTAGATGGTGAGTTGGAGGACGTGCAATCGCAAGGTTCCTTACATGAATACAATGATGCCATCGGTATTGATTCACAAGATGAATATGAGGAGTATCAACAAGAAGGTTCAGTGGCAGTTTCACTGCTCAGCGAGGATAGAGCAACCATTGGTGGAGAGGATACAGCTGACGAAGAATTTAACACTGAAGAAGAGGACGCTGGAGACATATTTCTAGAATTACCAAGTGATCAAGAGCAACGTTTCGAAGaTAGCGAAATAATCGTGCTAAACGATGGCGACATAAACTCTTCAACTGTGTCCGATGTGAACTCAGAAGATCCATTAGCCATCGATGACTTCACACAGCCATCGAATTCGGGCATTAAGGATATGTCGAATCCTTTGGATTCCTCCACTAATGATGAGGCCTCCACCAGCGCCGATTTACTATGGATTACTATAGACGACCTAAAGACAGATACTATAACGCCAAATGCAGAAAAAGACTTACCAAGTGATGCACGTATAATTACGCCTACAAGCACACCACAGCGCCTGCTGCCCACTACGACGCTGGACAAAGAGAAATGCAATAGCGCACTCGCTGCCAGTACTGGTACGGCAAAGCTAAACAACCAACGTGATGAAAATGCCGAAGAGTTGCGTAGCGACGGCTCCGACTCTGGGCTGGGCAGTGAAACATCGACGCTGCAGACAACGCTGAACAGTCCGGCCGACACCAGCCAGTTGACGGCGCCCAACGACAGCAGTGCCGTCAATACGCCCACAGTTAACAGATCCAAAGTAATTACGAATAATGCTTGCAACAGTAGCGGCAACAGTGGCATTGATGCTGCCAATGTAACATTCGTAGACGGTGCGAGATCCAACTCCAGCGCTATTGTGCCTGTTGCTGTTAGCGCCGCCATGCCACCACTAGCGTTAGCGAAACCACTGCGTTCGAATTTGAAACGACGACTCGAGGAGGACGATGCACTCATCGACGCAGCGCACGAAACACAGTTGGCCACCACCAGCGTCGGTACACAAGTTAAAAAGCTGAAGCGCtcgattaattttgaaaatgtgcaAGTTTACTACTTTCCACGGCAACAGGGTTTCGGTTGTGTGCCCTCGGCGGGCGGTTGTACGCTGGGTATGGGCGCACGTCACATCGGCTTCAAAACGCTTACATTGGCCGAACATGCCGCCGAATTGCGACGTGCGCATCGCTTGCAGCTGCAAGAGATCAATCCACGCGGTTCATCGAGCGATGACAGCGAAGAGTCCGAAGAGGATTACTTAAGTGAGGGTAGCGGCTCCGATTTGGATGCCGAATCGAATGGTTTTCTGCAACCGGTATCGCCGAAGCAGCGGCGCGCATTACTCAAAGCGGCTGGTGTGCGCAAAATCGATGCTGCCGAGAAAATCGAATGCCGCGACATACGCAACTCGCGTGAAGTGTGCGGCTGCGCTTGTGTGGAATTCTGTGATCCGGAGACTTGTGCCTGCAGTCAAGCGGGCATCAAATGTCAGGTTGATCGCGCCATGTTTCCCTGCGGTTGCACGCGTGACGCTTGCCTCAACACAGTGGGCCGTGTTGAATTCAATCCGACGCGCGTACGCACACACTTCATACACACCATTATGCGTTTGGAAATGGAGAATCGCCAACAACAGAATCCACCACTCTGCAGCACGATGAGCAGTTACAGCTTGTCAGCCGCCTGCGCTACCACCGCCACCGTTGTGGGTCCACACACCAACGCCCTACCGCCGACGCCATCGTACGCCAATACGCTACCGGGCAGCTATTATGCCATGCAAACACAATCAAATTATAGTTCGGGTTACGCATCGCCCGCATATCCAAGTGAACCGGCTGCCAATTACTATCAGCAACAAAGCACCGCCACAGCCACCCATTACAGCGCAGTAAGCTCTAGCGATTTGCAAACGAccgcagaacaacaacaacaacaacaaagttttcaATTGGACACGTTGGATGCGGGTCTATTCGCGGGTAGCGCGTCGACCGCCACAGCGTATGGCGAAATGATGCCAGCTTACAGCAGTGCGGTTGGTGTGTCGGCCAGCACCGCCACAGTGAGCGCTTATCACCAGAATGTGAACTATTCAACACAGGTCTCCACCTACACTGCCTATCAGCAAACTACAAGCGCTGGCGGCTACCTACCGCAGCACAACCAGCAAAGCGCCACCGTGGCAGCCCCAGCGCCAGCACAATCAACGCTAGCGTCACCACCCACGACCTACAGCTCTTGCGCCGTACCATCGTTGCCACCCTACGGCGCCGCTACCACAACCGCAGCAGCAGCGCAGTATCAAGACACGAGCAGCTATGCACTTGTCGATACCACAGCGCCCAGCTGCATTAGCATGGAGGACAGCGGCGGCAGCGAAATGGGTAGCGACGCAGAAGTCGTACCCAGCGCCAACCACATCAGCAACGCCACGAAAGGCAGCACCAGCATCATCAGCACCAACAGCACAATCACAATCGctacaaccaacaacaacaataatacttCCTGCAGCAAAAGCGCCACGAATACGCACATCCCAGGTGCTGAGGATTCCGAAAGCGCCAGCAAAAGCGACATTAGCGCAGACAGCGACAGCAATTTCATACAACTCAGCACACCGATTTCCAGTGCAACACGTCTATCACAAATCAATGATCTATTACAACACAATCGCCATACAACCGCCACACTGGTGTCCGTCTCACACACAAGGTGTTTGAGCGCAAACGGTGGCACCAACACCGTCGTCAGCAGCCGCACCGTCACAACCGATTGTGATTACAGCGACAGCAATAGTCAAGACGCGTTAAAATGCGAGACATTAGTCGAGGTGAAGGCCGAAAAGTTGGAAGTCGCAATACAAACCAAAACAACGCAAGCCACAAACTCAGTCGAGTCGACGAAAAGTGACGCCACAAATGCAACACCCAAACCAAGCGTGGAGCCCGATAAACCGGAAGCGTTGGAAGCACCACAAAACGCAGCAAACGCAAGCCATAATGTCGTAGAAGACACAGACATACCGATAGGTGTTGATGCCGATAGCACTGCTGCAACAAGCCACAACACGGACGAGGTTACTAAAACGCTTAGTCAAGCGGTTGCTTCGAACGGCATTGGTAGCGTAGATAGCGACGCTGAGCAATCAGAGAACGGCACTATTGTGACTGCAACTACAGTCTGA
Protein Sequence: MFKPIKNFINYIQKNANGSAIFGSTTSIADSKTEPSAEEIVTESTKNIRVESEATREQSASAKDGRVVETLVVSKLLNEQIENKNMKRIEVNKLSVINCKNATVEVINGNEPKGIAVYDGDDCDADDDIEMQIKSSVMLRPPLKRAGSLVENLTDEVDGELEDVQSQGSLHEYNDAIGIDSQDEYEEYQQEGSVAVSLLSEDRATIGGEDTADEEFNTEEEDAGDIFLELPSDQEQRFEDSEIIVLNDGDINSSTVSDVNSEDPLAIDDFTQPSNSGIKDMSNPLDSSTNDEASTSADLLWITIDDLKTDTITPNAEKDLPSDARIITPTSTPQRLLPTTTLDKEKCNSALAASTGTAKLNNQRDENAEELRSDGSDSGLGSETSTLQTTLNSPADTSQLTAPNDSSAVNTPTVNRSKVITNNACNSSGNSGIDAANVTFVDGARSNSSAIVPVAVSAAMPPLALAKPLRSNLKRRLEEDDALIDAAHETQLATTSVGTQVKKLKRSINFENVQVYYFPRQQGFGCVPSAGGCTLGMGARHIGFKTLTLAEHAAELRRAHRLQLQEINPRGSSSDDSEESEEDYLSEGSGSDLDAESNGFLQPVSPKQRRALLKAAGVRKIDAAEKIECRDIRNSREVCGCACVEFCDPETCACSQAGIKCQVDRAMFPCGCTRDACLNTVGRVEFNPTRVRTHFIHTIMRLEMENRQQQNPPLCSTMSSYSLSAACATTATVVGPHTNALPPTPSYANTLPGSYYAMQTQSNYSSGYASPAYPSEPAANYYQQQSTATATHYSAVSSSDLQTTAEQQQQQQSFQLDTLDAGLFAGSASTATAYGEMMPAYSSAVGVSASTATVSAYHQNVNYSTQVSTYTAYQQTTSAGGYLPQHNQQSATVAAPAPAQSTLASPPTTYSSCAVPSLPPYGAATTTAAAAQYQDTSSYALVDTTAPSCISMEDSGGSEMGSDAEVVPSANHISNATKGSTSIISTNSTITIATTNNNNNTSCSKSATNTHIPGAEDSESASKSDISADSDSNFIQLSTPISSATRLSQINDLLQHNRHTTATLVSVSHTRCLSANGGTNTVVSSRTVTTDCDYSDSNSQDALKCETLVEVKAEKLEVAIQTKTTQATNSVESTKSDATNATPKPSVEPDKPEALEAPQNAANASHNVVEDTDIPIGVDADSTAATSHNTDEVTKTLSQAVASNGIGSVDSDAEQSENGTIVTATTV

Similar Transcription Factors

Sequence clustering based on sequence similarity using MMseqs2

100% Identity: iTF_00191354;
90% Identity: iTF_00191354;
80% Identity: -