Basic Information

Insect: Drosophila eugracilis
Gene Symbol: UBP1_1
Assembly: GCA_018153835.1
Location: NW:6312166-6322240[+]

Transcription Factor Domain

TF Family: CP2
Domain: CP2 domain
PFAM: PF04516
TF Group: Beta-Scaffold Factors
Description: This family represents a conserved region in the CP2 transcription factor family.
Hmmscan Out: # of c-Evalue i-Evalue score bias hmm coord from hmm coord to ali coord from ali coord to env coord from env coord to acc

1 3 2 1.4e+04 -6.6 4.0 140 140 65 65 24 116 0.55

2 3 5.7e-53 4e-49 166.5 0.1 24 187 382 542 367 549 0.92

3 3 1.2e-13 8.7e-10 37.9 1.2 185 222 587 624 581 625 0.89

#	of	c-Evalue	i-Evalue	score	bias	hmm coord from	hmm coord to	ali coord from	ali coord to	env coord from	env coord to	acc
1	3	2	1.4e+04	-6.6	4.0	140	140	65	65	24	116	0.55
2	3	5.7e-53	4e-49	166.5	0.1	24	187	382	542	367	549	0.92
3	3	1.2e-13	8.7e-10	37.9	1.2	185	222	587	624	581	625	0.89

Sequence Information

Coding Sequence: ATGGCGCTTTCGTTTCTATCCCAAAACTCCGGTCTCTTGGATTTACAAAGCATCTTTGATCCACAATATTCTcatcatcaacaacaacaacaacttttgAGCCAACACCCACAACAAAataatcaacaacaacagcaacaatcgGAACAAATTCAACAACAACATCGCATCTTTTCATCAAAGTTCGATTTGAACCTTTTCAACGAACTCGACCAAATGGAATTCAACAACACTTTAAATCGCAGCCAATAccagaataataataataataataatagtaataataacaatatcaacaacagcagcaacaatcaGAGCAACAACACTAATAACAGTGTAAGTGAAAACCTAAATCAGatCCAAAACCGCCACTTCATCAGCGGCTATCATCACCAGCATATTGGTTCGGATTATGAGCAAGTGATCAACTTTGTTGACTCGCCGCCAAACTCTGAGGAATCGTGGACAGAGAGCAGCTCGCTAATCGAACACATTACCATTGTCGTAGACGCCCAGTCGAAGGACTCGCCGGGACCGCAGATTATCGACGTGCAAACCATTTACCTGAACGGCGGCTCACGCAAAAGACGAATGGATTGGGACTCTTTGGATATTGTCCAAAGTGAGAATTCACCAACAGGATCCCAGAGCAGTGAGCTGCCCACCAAAGTGGCCCATCAAGAGAAGGACAAGCATAAGCGCGAGAAGCCCTCGGGTCGCAGCAGCTGGAGCGATGATATTGGCTTCGATCTGAATGCCGAATTCAACAGCAACTCCTACTTGAACAATGAGAACTTTCTGTCGTTCTCGCCCACTTTGTCCACCCTAAAGCAGGAACCGCAGACGGAGCAGATCAAGCCCGGTCAAAAGATTTCCCTGGACAATGCCGCTGGCTCACCATCCGTGGCAATTGCCAAGTTGGATGACGTTCAGAACTCCCCGGCACAGGCAACTGCTGGCCAGGATTCGGGTTCAGCTAGCAAGCATGATGTTAACTCCGGACTCATCTGCGGATGTGGTTCACCACAGGGTTCACCATTGGCCAACACAGAGTATGAGCTAAACGAGAAGGGCAAACCACAGCAGCAACTTAGCGTTTTGGATCCAACTAAGATCGAGATTGTTTCGCCCAATGGAGCTGCCCATGGCGAGGATCATAAATTTCAGTACATTTTGGCTGCCGCCACTTCTATTGCCACCAAGAACAACGAGGAGACCTTGACGTACCTCAACCAGGGTCAGAGCTATGAAATCAAGCTAAAGAAGATCGGCGACCTGTCCCTCTACAGGGATAAGATACTGAAGAGCGTGATCAAGATCTGTTTCCATGAGCGCCGTCTGCAGTTCATGGAGCGTGAGCAGATGCAGCAATGGCAGCAATCTCGCCCTGGCGAACGCATCATTGAGGTGGACGTACCGCTTTCGTATGGCCTCTGCCACGTGTCACAGCCACTAAGCTCCGGCTCACTGAACACCGTCGAGATCTTTTGGGACCCGCTTAAGGAGGTCGGCGTCTACATCAAAGTCAACTGCATTTCAACCGAATTTACCCCAAAGAAACACGGCGGCGAGAAGGGTGTACCCTTCCGACTGCAGATTGAAACCTATATAGAAAACACAAACAGTACCAATACCAGCGGCTCGAGcggtagcaacaacaacaacagtggtggtggtggagccAGTGGTAATAGCAACGGCAGTTCAAACAGTGTCTCAACTGCTCCAGCATCTCCAGAACGCAACACAAATGGTGGCAACAGTGGCAAACAGGCGGTGCATGCAGCTGCCTGCCAGATCAAGGTCTTCAAGCTAAAGGGCGCTGACCGGAAACATAAGCAAGATCGTGAGAAGATTCAAAAGCGTCCACAATCGGAGCAGGATAAGTTCCAGCCCAGCTACGAGTGCACCATCATGAATGATATATCCCTAGATCTGGTGATGCCTGCCACCACTACAGGCTGCTACAGTCCAGAATGGGGGGCTATGGGAAATTCGAATTGCGAATTCTACGATGGAGTTCAGGGCATTCGTGAACATGCGCTTGCATCTGAAGGATCGTCGCTCCTGCCAACATCAGAAACAGAACGTGATTTATTGGATTTTATGAAACTCTGGCCAAATTCGCCTGTCCACATACCCAAGTACGATGGAATGCTTCCGTTTGCCCCAAGTGCAACATCGCCGGCTACCAGCAGCAGTCCCATAGCCATCAACTCGGTGACTTCTACCAACTCGCCCACCCTCAAGCTGATGGATGCCACCAATATGGTCTCCCCACAGCATGTGCCCGCTGAAATGGATGATTATAACCAAAACATAATGCCGGAATCGACGCCCTCGCAAGTGACGCAGTGGCTGACCAATAATCGCCTCACGACCTATCTATCAACATTTGCGCACTTCTCGGGAGCGGATATTATGCGcatGTCCAAGGAGGATTTGATTCAGATCTGCGGCCTGGCCGATGGCATTCGCATGTTCAACATTTTGCGCGCCAAAACCATTGCACCCAGACTCACCTTGTATGCCAGCTTGGATGGCTGCAGCTACAATGCCATCTACTTGCTGTCGAACACGGCCAAGGAGCTGCAACAGAAGCTGTTCAAGATGCCGGGCTTCTATGAGTTCATGGCCAAGGCCAGTGCCCAGGAGAATGGAGCCGGAGgagtggctgctgctgctgccctgTTTAACAATTGGGGCATGCACTCTAAGTACTCAGGCAGTGGCTCTAATATTTTCAATGATGCCAACAAGAGCTGCGTTTACATCTCGGGACCGTCGGGTATTCTTGTGACCGTCACCGACGAAGTGCTTAACAATGAGATCAAGGACGGCAGTCTCTATGCCCTGGAAGTGCAGGCCGGCAAGGTTATCCTTAAGCTGATCAACAAGCAGGACAACAACTAA
Protein Sequence: MALSFLSQNSGLLDLQSIFDPQYSHHQQQQQLLSQHPQQNNQQQQQQSEQIQQQHRIFSSKFDLNLFNELDQMEFNNTLNRSQYQNNNNNNNSNNNNINNSSNNQSNNTNNSVSENLNQIQNRHFISGYHHQHIGSDYEQVINFVDSPPNSEESWTESSSLIEHITIVVDAQSKDSPGPQIIDVQTIYLNGGSRKRRMDWDSLDIVQSENSPTGSQSSELPTKVAHQEKDKHKREKPSGRSSWSDDIGFDLNAEFNSNSYLNNENFLSFSPTLSTLKQEPQTEQIKPGQKISLDNAAGSPSVAIAKLDDVQNSPAQATAGQDSGSASKHDVNSGLICGCGSPQGSPLANTEYELNEKGKPQQQLSVLDPTKIEIVSPNGAAHGEDHKFQYILAAATSIATKNNEETLTYLNQGQSYEIKLKKIGDLSLYRDKILKSVIKICFHERRLQFMEREQMQQWQQSRPGERIIEVDVPLSYGLCHVSQPLSSGSLNTVEIFWDPLKEVGVYIKVNCISTEFTPKKHGGEKGVPFRLQIETYIENTNSTNTSGSSGSNNNNSGGGGASGNSNGSSNSVSTAPASPERNTNGGNSGKQAVHAAACQIKVFKLKGADRKHKQDREKIQKRPQSEQDKFQPSYECTIMNDISLDLVMPATTTGCYSPEWGAMGNSNCEFYDGVQGIREHALASEGSSLLPTSETERDLLDFMKLWPNSPVHIPKYDGMLPFAPSATSPATSSSPIAINSVTSTNSPTLKLMDATNMVSPQHVPAEMDDYNQNIMPESTPSQVTQWLTNNRLTTYLSTFAHFSGADIMRMSKEDLIQICGLADGIRMFNILRAKTIAPRLTLYASLDGCSYNAIYLLSNTAKELQQKLFKMPGFYEFMAKASAQENGAGGVAAAAALFNNWGMHSKYSGSGSNIFNDANKSCVYISGPSGILVTVTDEVLNNEIKDGSLYALEVQAGKVILKLINKQDNN

Similar Transcription Factors

Sequence clustering based on sequence similarity using MMseqs2

100% Identity: iTF_00489142;
90% Identity: iTF_00602348;
80% Identity: -