Basic Information

Insect: Pollenia griseotomentosa
Gene Symbol: CSRNP3_1
Assembly: GCA_963931875.1
Location: OZ007561.1:63237331-63242673[-]

Transcription Factor Domain

TF Family: CSRNP_N
Domain: CSRNP_N domain
PFAM: PF16019
TF Group: Unclassified Structure
Description: This presumed domain is found at the N-terminus of cysteine/serine-rich nuclear proteins. These proteins act as transcriptional activators [1].
Hmmscan Out: # of c-Evalue i-Evalue score bias hmm coord from hmm coord to ali coord from ali coord to env coord from env coord to acc

1 4 0.96 6.2e+04 -4.6 6.2 83 103 65 85 27 132 0.47

2 4 0.032 2.1e+03 0.2 3.7 59 114 223 276 201 301 0.53

3 4 0.86 5.5e+04 -4.4 0.5 81 95 337 351 314 370 0.44

4 4 7.8e-95 5e-90 303.0 6.9 2 218 496 698 495 698 0.92

#	of	c-Evalue	i-Evalue	score	bias	hmm coord from	hmm coord to	ali coord from	ali coord to	env coord from	env coord to	acc
1	4	0.96	6.2e+04	-4.6	6.2	83	103	65	85	27	132	0.47
2	4	0.032	2.1e+03	0.2	3.7	59	114	223	276	201	301	0.53
3	4	0.86	5.5e+04	-4.4	0.5	81	95	337	351	314	370	0.44
4	4	7.8e-95	5e-90	303.0	6.9	2	218	496	698	495	698	0.92

Sequence Information

Coding Sequence: ATGTTTACACctatcaaaaactttataacATACATACAAAAGAATGCAAGTGGTAATTCAATATTTGGTGGAAATAGTGGAAACGAAGAATCAGCAAAAATGGAAACAGAAAATATAGAGGCAGTCACAGAAAACGTAGATATGCAAACGGAAAGTAATATTCCGcatgaaatcgaaaaaaatgaTAATACTGTTACAAATAAAGAGGAAACCGAAAAAAACAAATGCGAAGAATCCCATGATTCTAGTACAGATATAAAAGACCCTGAAACAAAAACTACCAAATTAATAACAACGTCAACCATATCCACAGAAAATTCCTGTGAATTTGAAGATGAAGACATAGAGGCACAAATCGAAAGAAGTATTATGTTGAAAAAACCAGTAAAAGTTTCAGCCACAAGTGGTAGTGAAATTCTAGAAgtgaaaaaatctttaaacacTAGTAGTGGTATTGTTATTAGTCATGATTATAATCGTAATCAGGCCTTAAGTCCAATAGATGATGAATTAGATGATTTTAAGAATGATCCAATGGAAGTATTGGGTACCGTTTCATCACCTTGTTCTAATCAACAAGCTGATGAGTTTTGTTCGGTGGGAAGTGCAGAAGAAGCTTTCGAAAGAGATGTGTCAATAATAGATGATATACAAACCAAGGAGGAGGaagaaattgataaaaataaaacgcaAGACGGACAAATAATGGATTCAGATGTAGAATTAGACGAAAACAAAGATGTTGAAACCGAAAACGAACAAAATGATGTCATCGATGTTGATGATGATTATGAAGACGATGAGGATGAAGAAGAGCCATTCTTAGATTTggataattttaaaaGCAGCAATGTAATTGTTTTAGATGAAGTGGATCTCAATGCTTCTACGACTTCTATCGATACAAACAATACTGCAGACGATCCTTTGTCTATAGCCAGTGAAGAGCAAGAAGCTTTTATTGCCGATAAAGCTGCTGCTTTAGAAAAATTGAACTTACTCAATAATTCACAGAACTCACAAGATGATGATACCAGAACAACCACCGAAGATGATTTACTGTGGCTTAAAACTGATTTAGATGATAATCAACCATCTTGCAGTAGTAAAGAGTTGCTCAAGGATAATGCATCGGAAGTTACACCTGAAAAGGAAGAACGTAATGGTGAGGGTTCAGATTCTGGTTTAGGAAGCGAAACCTCCGCATTACACTCCACCACCACAAGTATTACTGATACTAGCCAATTAAACATAACAACAGCGACACCCATTCAGACTCCTAATcagataaaaacaaaagaaaaggaACACACAAATGTGCTAGAGTTAACAGAATCACTACCAAAGGACCTTCTTAAACCATACAGATCAAATTTAAAACGACGTTTGGAAGTTGATGATGTAGTAGAAGGTTTTGGTACTTTATCCTCTACGATTTCTTCAGTTTGTGATCATAGTTCTCTAATTGTCAGTATACAAAAGAAACCAAAGCGTTCAATTAATTTTGATACGGTACAAGTCTATTATTTTCCACGACAACAGGGCTTTAGTTGTATACCTTCTGCGGGTGGTTGTACTTTGGGCATGGGAGCCAGACACGTggctttaaaaactttaacattAGCTGAACATGCAGCCGAGCTGCGAAGAGCTCATCGAATGCAGTTACAGGAAATAAGTCCTAGAGGAAGCTCAAGCGATGACAGCGAAGAATCCGAGGAAGACTATTTGAGTGAGGGTAGTGGCTCTGATTTAGATGGTGAAACCAATGGTTTTCTACAGCCAGTGTCGCCGAAACAGCGGAGAGCTTTGCTGAAGGCTGCTGGTATACGTAAAATAGATCCCAGTGAAAAGGCTGAATGCCGTAATATACGCAATAGTCGAGAGGTTTGTGGTTGTTCTTGTCGTGATTTTTGTGATCCCGAGACATGTGCTTGTTCTCAATCTGGCATCAAATGTCAAGTTGATCGTGATATGTTTCCTTGTGGCTGCTCTCGTGATGCCTGTGGCAATACGATTGGACGTGTGGAATTTAATCCGACTCGTGTTCGCACTCATTACATACACACTCTAATGCGCTTGGAAATGGAGAATCGTCAACAACAAAATCCTTATACTTCAGCCGTTGCCTCACCTATGCAGCCAACTCCTTCCTCGTATTATCAAACCCACTTGCAACCGCAATCGAATTATAGTTCGGGTTATGCATCACCGGCCTACAACACTGCCTCCGAACTACATCCACAAACGGCTGGCAATCCATACTATCACTCGCAAGCACCTTCCACATCCAACGGTCTGTATGGACAACAAAATTCATTGGAAATAACACACAATGGTGGTGCAACTAACACTACATCTACATCCCAGTATGGTGTTGATAGTTTGGATACAGGTCTTTTTAGTGGAACCACTATAGCTACGCCATCTTATGGGGAACTAATGCCGGTGTCAACGTTTCATTATGGAAATGTGCAAACACAAGCATCTCCCTACAATTCTTATCACAATACCCCTTATATTAATGGAAACAGTAACACCACATCCCTTATCATACCTAACACCTATAGCTCATGTGCTGTACCTTCTATACCACCCTATGGCACAGCTACAACAACAGAAGCTTCAGGAGTCTATCATAGTGTAAGTAGTTTAACAAGTTTAGAGACTACAACAGCTCCCTCTTGTATTGTTAACGGTACGACATCATTGGAAAACGATCCTAGTGCAAATTTTATAAGTCTTTCCACACCTTTGGCCAGTTCCTCAAGACTATCGCAAATAAATGATTTACTACAACACAATCGTAATGCAACAACAGCCTTAGTGGCTGTTTCACAAAGCGTAGGAGCAACAGATAACAACGTTACATCAACAGCGTGTACAACACAGGTTAATGTTAGTGTTAGCAATTTGCTAGCAACAAGCTCATCGATTAATACACCACCTATAGATAATGCCCACAAGAATTGCATGGCTTATGAAGAATTAGCGCAACCTTTAAACCCGGCGCATATAGTGGCAGTTATTGAACATGACAATAACAGTAGTGGACCAGTTAAACTAACAGCACCAACACTACCATCAGTAGCAGAAACAGAAAATTTGGCCAACAACGTAAAAGAAACATCAACATCTTCATTATTAAATACAGAGTTTTTACCAACAAGTTCTTCATTGTGTAAAGATGACAAAGATATCACCACAGTGGCAATAAGCGAAACTACAAAACCTACAACAATAGAAGTGACAGCTGGCAACTAA
Protein Sequence: MFTPIKNFITYIQKNASGNSIFGGNSGNEESAKMETENIEAVTENVDMQTESNIPHEIEKNDNTVTNKEETEKNKCEESHDSSTDIKDPETKTTKLITTSTISTENSCEFEDEDIEAQIERSIMLKKPVKVSATSGSEILEVKKSLNTSSGIVISHDYNRNQALSPIDDELDDFKNDPMEVLGTVSSPCSNQQADEFCSVGSAEEAFERDVSIIDDIQTKEEEEIDKNKTQDGQIMDSDVELDENKDVETENEQNDVIDVDDDYEDDEDEEEPFLDLDNFKSSNVIVLDEVDLNASTTSIDTNNTADDPLSIASEEQEAFIADKAAALEKLNLLNNSQNSQDDDTRTTTEDDLLWLKTDLDDNQPSCSSKELLKDNASEVTPEKEERNGEGSDSGLGSETSALHSTTTSITDTSQLNITTATPIQTPNQIKTKEKEHTNVLELTESLPKDLLKPYRSNLKRRLEVDDVVEGFGTLSSTISSVCDHSSLIVSIQKKPKRSINFDTVQVYYFPRQQGFSCIPSAGGCTLGMGARHVALKTLTLAEHAAELRRAHRMQLQEISPRGSSSDDSEESEEDYLSEGSGSDLDGETNGFLQPVSPKQRRALLKAAGIRKIDPSEKAECRNIRNSREVCGCSCRDFCDPETCACSQSGIKCQVDRDMFPCGCSRDACGNTIGRVEFNPTRVRTHYIHTLMRLEMENRQQQNPYTSAVASPMQPTPSSYYQTHLQPQSNYSSGYASPAYNTASELHPQTAGNPYYHSQAPSTSNGLYGQQNSLEITHNGGATNTTSTSQYGVDSLDTGLFSGTTIATPSYGELMPVSTFHYGNVQTQASPYNSYHNTPYINGNSNTTSLIIPNTYSSCAVPSIPPYGTATTTEASGVYHSVSSLTSLETTTAPSCIVNGTTSLENDPSANFISLSTPLASSSRLSQINDLLQHNRNATTALVAVSQSVGATDNNVTSTACTTQVNVSVSNLLATSSSINTPPIDNAHKNCMAYEELAQPLNPAHIVAVIEHDNNSSGPVKLTAPTLPSVAETENLANNVKETSTSSLLNTEFLPTSSSLCKDDKDITTVAISETTKPTTIEVTAGN

Similar Transcription Factors

Sequence clustering based on sequence similarity using MMseqs2

100% Identity: iTF_01237648;
90% Identity: iTF_01235726; iTF_01237648;
80% Identity: -