Basic Information

Insect: Drosophila hamatofila
Gene Symbol: Ubp1_1
Assembly: GCA_035045345.1
Location: JAWNPA010000012.1:20908847-20925609[+]

Transcription Factor Domain

TF Family: CP2
Domain: CP2 domain
PFAM: PF04516
TF Group: Beta-Scaffold Factors
Description: This family represents a conserved region in the CP2 transcription factor family.
Hmmscan Out: # of c-Evalue i-Evalue score bias hmm coord from hmm coord to ali coord from ali coord to env coord from env coord to acc

1 5 1.5 1e+04 -4.3 3.7 105 140 28 64 22 91 0.57

2 5 0.73 5e+03 -3.3 0.6 5 29 82 106 73 125 0.60

3 5 5.9e-52 4e-48 163.8 0.4 23 187 438 599 418 609 0.91

4 5 3 2e+04 -7.1 4.4 9 25 621 637 612 657 0.44

5 5 4.5e-13 3e-09 36.6 1.0 188 222 686 720 680 721 0.92

#	of	c-Evalue	i-Evalue	score	bias	hmm coord from	hmm coord to	ali coord from	ali coord to	env coord from	env coord to	acc
1	5	1.5	1e+04	-4.3	3.7	105	140	28	64	22	91	0.57
2	5	0.73	5e+03	-3.3	0.6	5	29	82	106	73	125	0.60
3	5	5.9e-52	4e-48	163.8	0.4	23	187	438	599	418	609	0.91
4	5	3	2e+04	-7.1	4.4	9	25	621	637	612	657	0.44
5	5	4.5e-13	3e-09	36.6	1.0	188	222	686	720	680	721	0.92

Sequence Information

Coding Sequence: ATGGCGCTTTCGTTTCTATCGCAAAGTTCCGGCCTGTTGGATTTACAAAGCATATTTGATCCACAATAttcaatacaacaacaacaacaacagcagcagcagcaacaactgcaaattcatttatcatcagaacaacaacaacaacaacaacgcactTCAACGAAATTTGATCTAAGCATTTTCAACGATTTCGACCAAATGgaattcaacaacaacaacaacttgaatCGAAATCATCATAATCAGTatcagaataataataataacagtaatagcaataataataataataataacagcatcaacaacaataataataataataacaaccacaataacaacaacaacaacattcatACGTACCAAACTAACGGAGAAAATCTTAATCAGATCCAAAATAGTCATTTCATTAGCGGCTATCATCATCAGCATATTGGATCGGATTATGAGCCAGTGATTAACTTTGTTGATTCACCACCAAACTCTGAGGAATCTTGGACAGACGGACAGTCCAAGGATTCACCAGGACCGCAAATAATCGACGTGAGGACAATTTACTCAGACAGTGGTTCGCGCAAAAGACGAATGGATTGGTACTCATTGGACATCGGTCAAAGTGAAAATTCACCGACAACTCAATCAGGCGAAATACCCAATAAGGTGGCACATCACGAGAAAGATAAACATAAACGTGAAAAGCATTCaggTCGCAGCAGCTGGAGCGACGATATAGGCTTTGATCTGAACGCTGAGTTTAATAGTAACTCATATTTGAACAATGAAAACTTTTTATCGTTCTCCCCGAGCCTGACGGCACTTAAACAGGAGCCGCAAACGGAGCAGCTCAAACCGAACGCAAAGATATCATTGGAGAGCGGCAGCAACGGCTCCTCAATTGGCAAGAGTGACAAATCGCCATTGGGTGAGGCAAATCATTCACCACAGCGCACGGGTCAGgagatagcagcagcagcagccgcagcagcagcagcagcagcagcagcagcagcagcggcagcagcagcggcagcatcagGAActggaggcggaggcggagcaCTTGCAGCAGCTGGTGGGAAGCATGAGTTGAACCCCGGCAACatttgtggctgtggctcgcCGCAAGGCTCGCCCGCCGCAGCGGATTTTGAATTGAACTGCAGTGCCAATGGAAACGAAGCCACATCGGCCGAGAAAACCCGAGCAGCAACGGGCAATGAGGGCTTTGCACAGGCGCCGCGCTctggactgcagcagcagctgagcgtTGTCGAGGCGGCCAAAATTGAGCCCATCTCGTCGGGCGGTGCATCTCATGCCGAGGATCATAAatttCAGTACATTTTGGCAGCGGCCACCTCAATTGCAACGAAGAACAATGAGGAGACATTGACCTATCTGAATCAGGGTCAAAGCTATGAGAtcaaattgaagaaaattgGAGATTTGTCTTTCTATCGCGATAAGATTTTGAAGagcGTTATCAAAATCTGTTTCCACGAGCGTCGTTTGCAGTTTATGGAACGCGAACAGATGCAGCAATGGCAGGCATCGCGTCCAGGTGATCGAATTATTGAGGTAGATGTACCATTGTCGTATGGCCTGTGCCATGTGTCGCAGCCATTGAGTGCGAACGCATTGAATACTGTCGAGATCTTTTGGGATCCATTGAAGGAGGTCGGTGTTTACATCAAggttaattgcatttcaacCGAATTTACACCAAAGAAGCACGGTGGTGAAAAGGGTGTACCATTTCGGCTACAAATTGAAACCTATATAGAAAACACAACAGCAGCTAAttgtaacaacaataacaacaacaataataacaataacaatatcaacaacaacaacaacaacagcagctcgagcagcagcagctccagcagcagcagcaccagcagcaacaacagctcgggcaacaacaacaacaacaacgccagcAATAcaactagcaacaacaacaacggatCAGGCGTTTCCTCGGCGGGGCAGGGGGATAATCGGAATGCAAATGGTGGCACCATTGCCGGCCTGGCAGCACTCAATGGCAAACAGGCAGTGCATGCAGCTGCCTGTCAGATAAAGGTCTTCAAGCTAAAGGGCGCCGATCGCAAGCATAAACAGGATCGCGAAAAGATCCAGAAGCGTCCGCAGTCCGAGCAGGACAAGTTTCAGCCCAGCTACGAGTGCACCATCATGAATGATATATCATTGGATTTGATAACGCCAGCCACCACAACTGGCTGCTACAGTCCTGAATAtATGAAATTGTGGCCAAATTCGCCGGTTCATATACCAAAATATGATGGAAtgttgccatttgccagcAGCGCATCACCggcggccagcagcagcccaaTTGCTATCAATTCGGTGACATCCACAAATTCGCCAACATTGAAACTAATGGATGCCACAAACATGGTGTCGCCGCAGCATGTGCCAGCGGATATGGATGATTATAATCAGAACATAATGCCCGAATCAACGCCCGCACAAGTCACACAATGGCTGACACATCATCGTCTGACGGCCTACCTCAACACCTTTACCCATTTCTCGGGTGCGGATATTATGCGCATGTCCAAAGAGGATCTAATACAAATCTGTGGACTCGCCGACGGAATACGcatgtttaatatattgcGCGCCAAATCCATTACGCCGCGTCTGACGCTCTATGCCAGCATGGATGGCTGCAGCTACAATGCCATCTACTTGCTCTCTAATACGGCcaaggagctgcagcagaagaTCTATAAGCTGCCCGGCTTCTATGAGTTCATGGCCAAGGGCGGCTCGTCTGGTCTCTTGGAGAATGGCGGCAATGTTccagctgccgcagcagctgctgcagccgccgccgctgctctATACAACAATTGGAGCATGCACTCGAAATATTCTGGCAGCGGCTCGAACATCTTCAATGAGGTGAACAAGAGTTGCGTCTACATATCGGGGCCATCGGGCATACATGTGAGCGTCAGCGATGAGGTGCTCAACAATGAGGTGAAGGACGGCAGTCTCTATGCCCTGGATGTGCAGGGTGGCAAAGTTATATTGAAGCTGATCAATAAGCAGgataacaattaa
Protein Sequence: MALSFLSQSSGLLDLQSIFDPQYSIQQQQQQQQQQQLQIHLSSEQQQQQQRTSTKFDLSIFNDFDQMEFNNNNNLNRNHHNQYQNNNNNSNSNNNNNNNSINNNNNNNNNHNNNNNNIHTYQTNGENLNQIQNSHFISGYHHQHIGSDYEPVINFVDSPPNSEESWTDGQSKDSPGPQIIDVRTIYSDSGSRKRRMDWYSLDIGQSENSPTTQSGEIPNKVAHHEKDKHKREKHSGRSSWSDDIGFDLNAEFNSNSYLNNENFLSFSPSLTALKQEPQTEQLKPNAKISLESGSNGSSIGKSDKSPLGEANHSPQRTGQEIAAAAAAAAAAAAAAAAAAAAAAASGTGGGGGALAAAGGKHELNPGNICGCGSPQGSPAAADFELNCSANGNEATSAEKTRAATGNEGFAQAPRSGLQQQLSVVEAAKIEPISSGGASHAEDHKFQYILAAATSIATKNNEETLTYLNQGQSYEIKLKKIGDLSFYRDKILKSVIKICFHERRLQFMEREQMQQWQASRPGDRIIEVDVPLSYGLCHVSQPLSANALNTVEIFWDPLKEVGVYIKVNCISTEFTPKKHGGEKGVPFRLQIETYIENTTAANCNNNNNNNNNNNNINNNNNNSSSSSSSSSSSSTSSNNSSGNNNNNNASNTTSNNNNGSGVSSAGQGDNRNANGGTIAGLAALNGKQAVHAAACQIKVFKLKGADRKHKQDREKIQKRPQSEQDKFQPSYECTIMNDISLDLITPATTTGCYSPEYMKLWPNSPVHIPKYDGMLPFASSASPAASSSPIAINSVTSTNSPTLKLMDATNMVSPQHVPADMDDYNQNIMPESTPAQVTQWLTHHRLTAYLNTFTHFSGADIMRMSKEDLIQICGLADGIRMFNILRAKSITPRLTLYASMDGCSYNAIYLLSNTAKELQQKIYKLPGFYEFMAKGGSSGLLENGGNVPAAAAAAAAAAAALYNNWSMHSKYSGSGSNIFNEVNKSCVYISGPSGIHVSVSDEVLNNEVKDGSLYALDVQGGKVILKLINKQDNN

Similar Transcription Factors

Sequence clustering based on sequence similarity using MMseqs2

100% Identity: iTF_00803364;
90% Identity: iTF_00544232;
80% Identity: -