Basic Information

Insect: Drosophila santomea
Gene Symbol: UBP1_1
Assembly: GCA_016746245.1
Location: NC:18886878-18898550[+]

Transcription Factor Domain

TF Family: CP2
Domain: CP2 domain
PFAM: PF04516
TF Group: Beta-Scaffold Factors
Description: This family represents a conserved region in the CP2 transcription factor family.
Hmmscan Out: # of c-Evalue i-Evalue score bias hmm coord from hmm coord to ali coord from ali coord to env coord from env coord to acc

1 3 1.3 9.1e+03 -4.7 3.1 95 109 50 64 22 110 0.49

2 3 6.5e-53 4.5e-49 166.3 0.1 24 187 386 546 375 554 0.92

3 3 8.8e-14 6e-10 38.4 0.5 186 222 582 618 569 619 0.88

#	of	c-Evalue	i-Evalue	score	bias	hmm coord from	hmm coord to	ali coord from	ali coord to	env coord from	env coord to	acc
1	3	1.3	9.1e+03	-4.7	3.1	95	109	50	64	22	110	0.49
2	3	6.5e-53	4.5e-49	166.3	0.1	24	187	386	546	375	554	0.92
3	3	8.8e-14	6e-10	38.4	0.5	186	222	582	618	569	619	0.88

Sequence Information

Coding Sequence: ATGGCGCTTTCGTTTCTATCCCAAAACTCCGGTCTGTTGGATTTACAAAGCATATTCGATCCACAATATTCTcatcatcaacaacaacatttgAGCCACCACCCTCAACATCACACTCAACAACATCAAAatcaacaactacaactacaagcGGAGCAGatgcaacagcatcagcaacaacgCAACCTTTCAACAAAGTTCGATTTGAATCTGTTCAACGAACTCGACCAAATGGAATTCAACAACTTAAACCGCAGTCAATatcagaataataataataataataacaatatcaGCAATAATCAAaactccaacaacaacagcactaACGGTATTAGTGAAAATCTAAATCAGATCCAAAACCGCCACTTCATCAGCGGCTATCACCACCAGCATATCGGATCGGACTATGAGCAAGTGATCAACTTTGTTGACTCGCCGCCAAACTCAGAGGAATCGTGGACAGAGAGCAGCTCGCTAATCGAACAAATTACGATTGTCGTAGACGGGCAGTCAAAGGACTCGCCGGGACCGCAAATCATCGACGTGCAGACCATTTTCCTGAACAGCGGCTCACGCAAAAGACGAATGGATTGGGACTCTTTGGACATTGGCCAAAGTGAGAACTCACCCACAGCATCGCAGAGCGGCGAGCTGCCCACCAAAGTGGCCCATCAGGAAAAGGACAAGCACAAGCGCGAGAAGCACTCGGGTCGCAGCAGCTGGAGCGATGATATCGGCTTCGATCTAAACGCCGAGTTTAACAGCAACTCGTACTTGAACAATGAGAGCTTCCTGTCGTTCTCCCCTACGCTGACCACCCTGAAGCAGGAGCCACAGACGGAGCAGATCAAGCCGAGCCCCAAGGCATCCCTGGACAATGCCGCAGCATCGCCCTCCATCGCCATTGCCAAGTTGGATGAGGTCCAGAACTCTCCGCCGCAGGCTATTCCTGGCCAGGACTCGGCTAACGGACCTGGATCGGCCGGCAACGGCAAACATGACGTAAACTCCGGACTCGCCTGCGGGTGTGGCTCTCCACAGGGTTCACCAATAGCCAACGCGGAGTATGAGTTGAATGAAAAGGGAAAGCCCCAGCAACTTAGCGTTTTGGATCCAGCAAAAATCGAGATCGGTTCGGCCAACGGAGCTCCCCATGCTGATGATCACAAATTTCAGTACATTCTAGCAGCAGCCACTTCGATTGCAACCAAGAACAATGAGGAGACTTTGACGTACCTCAACCAAGGCCAAAGCTACGAAATAAAGCTGAAGAAGATCGGAGACCTGTCCCTCTATAGGGATAAAATACTGAAGAGCGTGATCAAGATCTGCTTCCACGAACGCCGCCTGCAGTTCATGGAGCGCGAGCAGATGCAGCAATGGCAGCAATCCCGCCCAGGCGAACGCATCATTGAGGTGGACGTACCGCTCTCGTACGGCCTCTGCCACGTGTCGCAGCCACTGAGCTCCGGCTCACTGAACACTGTCGAGATCTTCTGGGACCCACTGAAGGAGGTCGGCGTCTACATCAAGGTCAACTGCATTTCAACCGAATTTACCCCAAAGAAACACGGCGGCGAAAAGGGTGTGCCCTTCCGACTGCAAATTGAAACCTATATAGAAAACACAAACAGTGCCACCACCAGCGGCTcgggcagcaacaacagcgccAGCGGCAGCGGAAGCGGAAACAGTGGCTCCACTGCCTCAGCATCACCGGAACGGACTGCCAGTGGCAGCAATGGCAAACAAGCGGTCCACGCAGCTGCCTGCCAGATCAAGGTTTTCAAGCTAAAGGGAGCTGACCGCAAACATAAACAGGATCGGGAGAAGATCCAGAAGCGGCCTCAATCGGAGCAGGAGAAGTTCCAGCCCAGCTATGAGTGTACCATCATGAACGACATATCCCTGGATCTGGTGATGTCCGCCACCACTACTGGCTGCTACAGCCCCGAATATATGAAACTTTGGCCGAACTCGCCCGTGCATATACCCAAGTACGATGGAATACTTCCGTTTGCGCCAAGTGCAGCTTCGCCGGCTACCAGCAGCAGCCCCATAGCCATCAACTCGGTGACATCGACCAACTCGCCCACCCTCAAGCTGATGGACACCACAAACATGGTCTCACCGCAGCATGTGCCCGCTGACATAGACGATTATAGCCAGAACATAATGCCGGAATCGACGCCCTCACAAGTGACGCAGTGGCTGACCAATCATCGCCTCACGTCCTATCTCTCAACGTTCGCACAGTTCTCGGGAGCGGATATCATGCGCATGTCCAAGGAGGATTTGATTCAAATTTGCGGCCTGGCCGATGGCATTCGCATGTTCAACATTTTGCGCGCCAAGACTATTGCTCCCAGGCTAACGTTGTACGCCAGCTTGGATGGCTGCAGCTACAATGCCATCTACCTGTTGTCGAACACGGCCAaggagctgcagcagaagCTGTTCAAAATGCCTGGCTTCTACGAGTTCATGGCTAAGGCCAGTGCACAGGAGAACGGAGCCGGTGGTgcagccactgcagctgctgcagcccTCTTCAACAATTGGGGGATGCACTCCAAGTACTCGGGCAGCGGCTCCAATATCTTCAACGACGCCAACAAGAGCTGCGTGTACATATCGGGGCCATCTGGCATACTTGTGACCGTCACCGATGAGGTGCTGAACAACGAGATCAAGGATGGCAGCCTCTACGCAATGGAGGTGCAGGCCGGCAAGGTGATCCTTAAGCTGATCAACAAGCAGGACAACAACTAA
Protein Sequence: MALSFLSQNSGLLDLQSIFDPQYSHHQQQHLSHHPQHHTQQHQNQQLQLQAEQMQQHQQQRNLSTKFDLNLFNELDQMEFNNLNRSQYQNNNNNNNNISNNQNSNNNSTNGISENLNQIQNRHFISGYHHQHIGSDYEQVINFVDSPPNSEESWTESSSLIEQITIVVDGQSKDSPGPQIIDVQTIFLNSGSRKRRMDWDSLDIGQSENSPTASQSGELPTKVAHQEKDKHKREKHSGRSSWSDDIGFDLNAEFNSNSYLNNESFLSFSPTLTTLKQEPQTEQIKPSPKASLDNAAASPSIAIAKLDEVQNSPPQAIPGQDSANGPGSAGNGKHDVNSGLACGCGSPQGSPIANAEYELNEKGKPQQLSVLDPAKIEIGSANGAPHADDHKFQYILAAATSIATKNNEETLTYLNQGQSYEIKLKKIGDLSLYRDKILKSVIKICFHERRLQFMEREQMQQWQQSRPGERIIEVDVPLSYGLCHVSQPLSSGSLNTVEIFWDPLKEVGVYIKVNCISTEFTPKKHGGEKGVPFRLQIETYIENTNSATTSGSGSNNSASGSGSGNSGSTASASPERTASGSNGKQAVHAAACQIKVFKLKGADRKHKQDREKIQKRPQSEQEKFQPSYECTIMNDISLDLVMSATTTGCYSPEYMKLWPNSPVHIPKYDGILPFAPSAASPATSSSPIAINSVTSTNSPTLKLMDTTNMVSPQHVPADIDDYSQNIMPESTPSQVTQWLTNHRLTSYLSTFAQFSGADIMRMSKEDLIQICGLADGIRMFNILRAKTIAPRLTLYASLDGCSYNAIYLLSNTAKELQQKLFKMPGFYEFMAKASAQENGAGGAATAAAAALFNNWGMHSKYSGSGSNIFNDANKSCVYISGPSGILVTVTDEVLNNEIKDGSLYAMEVQAGKVILKLINKQDNN

Similar Transcription Factors

Sequence clustering based on sequence similarity using MMseqs2

100% Identity: iTF_00489142;
90% Identity: iTF_00618921;
80% Identity: -