Basic Information

Insect: Zaprionus africanus
Gene Symbol: UBP1_1
Assembly: GCA_018151435.1
Location: JAECXB010000118.1:11341966-11351843[-]

Transcription Factor Domain

TF Family: CP2
Domain: CP2 domain
PFAM: PF04516
TF Group: Beta-Scaffold Factors
Description: This family represents a conserved region in the CP2 transcription factor family.
Hmmscan Out: # of c-Evalue i-Evalue score bias hmm coord from hmm coord to ali coord from ali coord to env coord from env coord to acc

1 3 1.5 1.2e+04 -4.9 2.4 19 36 91 108 62 123 0.45

2 3 2.2e-44 1.8e-40 138.4 0.1 23 170 425 569 405 571 0.91

3 3 2.8e-11 2.3e-07 30.2 2.7 192 222 568 598 564 599 0.92

#	of	c-Evalue	i-Evalue	score	bias	hmm coord from	hmm coord to	ali coord from	ali coord to	env coord from	env coord to	acc
1	3	1.5	1.2e+04	-4.9	2.4	19	36	91	108	62	123	0.45
2	3	2.2e-44	1.8e-40	138.4	0.1	23	170	425	569	405	571	0.91
3	3	2.8e-11	2.3e-07	30.2	2.7	192	222	568	598	564	599	0.92

Sequence Information

Coding Sequence: ATGGCGCTTTCGTTTCTATCGCAAAATTCCGGCCTCTTGGATTTACATAGCATATTTGATCCACAATATTCATTGCAACAACATCAACAACAACAACAACAATTACATTTACCATCACAACAACAACAACAACAATTGCAACAAACATCACGCACGTTAACGAAATTCGATTTAAACATTTTCAACGATTTCGACCAAATGGAATTCAACAACAATTTGAGTCGAAACCACAATCAATATCAGAATAATAACAACAATAACACTATCAATAATAATAATAGTAACCACAATACCAACAACAACAACACCACCACCAACAACAACAACAGCAACATACATACGCACCAGAACAACGGTGAAAATCTTAATCAGATCCAAAATCGTCATTTCATCAGCGGCTATCATCATCAGCATATTGGATCGGATTATGAGCAAGTGATTAACTTTGTTGACTCACCACCTAATTCAGAGGAATCTTGGACAGACGCACAATCCAAGGATTCGCCCGGACCTCAGATAATCGACGTACGGACAATTTACTCCAACTCCAGTGGTTCACGCAAAAGACGAATGGATTGGGACTCTTTGGATATTGGTCAAAGTGAAAATTCGCCAACAACACAAACTGGCGACTTACCCAATAAGGTGGCACATCACCAGGAGAAAGATAAACACAAGCGTGAAAAGCATTCAGGTCGCAGCAGCTGGAGCGACGAAATAGGCTTCGATCTGAACGCTGAGTTTAATAGCAACTCATATTTGAACAATGAAAACTTTCTATCGTTCTCCCCGAGCCTGACGGCACTGAAACAGGAGCCGCAGACCGAGCAGCTCAAGCCGAATCCAAAGCTACCGCTGGNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNTGGCGGCAACAGCGGTTCCCTTGCAGTTGTGAACATTGGCAAGATTGACAAATCCCCACTGGGCGAGGCCAATCATTCACCACAGCGTGCTGGGCAGCAGGACACAGGGTCCGGCGGAGCAGGAGGCAATAGTGGCAAACATGAGTTGAACTCCGGCAATATATGCGGCTGTGGTTCGCCACAAGGCTCGCCAGCCGCAACGGACTTTGAACTGAACAACGGCAATGCCAATGGAAATGCTGCAGCAGGCGGCGACAAGAGCAGAGCTGCAGCGGGCAATGAGGCCTTTGCACAGGCGCCGCGCTCTGGACTGCAGCAGCAGCTGAGCGTTGTCGATGCGGCCAAAATAGAGCCCAGCTCCTCGGGCAGTGCAGGCCATGTGGAGGATCACAAATTTCAGTACATTTTGGCAGCAGCCACCTCGATTGCAACGAAGAACAATGAGGAGACTCTGACCTATCTGAATCAGGGTCAAAGTTATGAGATCAAATTGAAGAAAATTGGTGATTTATCTTTCTATCGTGATAAGATTTTGAAGAGCGTTATCAAAATCTGTTTCCATGAGCGTCGATTGCAGTTCATGGAACGCGAACAGATGCAACAATGGCAAGCTTCGCGTCCTGGCGATCGCATCATTGAGGTAGATGTGCCACTCTCCTACGGATTGTGCCATGTGTCGCAGCCATTGAGCTCGAATGCATTGAACACTGTCGAGATATTCTGGGATCCATTGAAGGAGGTCGGTGTTTACATCAAGGTCAATTGCATTTCAACTGAATTTACACCAAAGAAGCACGGCGGCGAGAAGGCTGCCTGTCAGATTAAGGTATTCAAGCTGAAGGGCGCCGATCGCAAGCATAAGCAGGATCGCGAGAAGATACAAAAGCGTCCACAGTCCGAGCAGGAGAAGTTCCAGCCCAGCTACGAATGCACCATCATGAATGATATATCATTGGATCTGATAATGCCGGCCACCACCAGCACCGGCTGCTACAGTCCCGAGTATATGAAACTGTGGCCCAATTCGCCGGTTCATATACCAAAATATGATGGGATGCTACCGTTCGCAAGCAGCGCATCTCCGGCGACAAGCAGCAGCCCCATTGCGATCAATTCAGTGACATCAACAAATTCGCCAACATTGAAACTAATGGATGCCACGAATATGGTATCGCCGCAGCATGTGCCAGCGGATATGGATGATTATAATCAGAACATAATGCCGGAATCAACGCCCGCACAAGTGACACAATGGCTGACCAATCATCGTCTGACGGCCTACCTCACCACGTTTGCCCATTTCTCGGGAGCCGATATTATGCGCATGTCGAAGGAGGATCTTATACAGATCTGTGGTCTTGCCGATGGCATTCGCATGTTTAATATTTTGCGCGCCAAAACTATTGCGCCGCGTTTGACACTCTACGCCAGCATGGACGGCTGCAGCTTTAATGCCATCTACCTGTTGTCCAATACGGCCAAGGAGTTGCAGCAGAAGATCTACAAATTGCCTGGTTTCTATGAGTTCATGGCCAAGGGCGGCGCCTCGGGTGTGCTGGAGAATGGCAGCGTCTCTGCGGCAGCAGCAGCAGCAGCGGCAGCCGCTGCACTCTACAATAATTGGGGCATGCACTCAAAGTACTCGGGCAGCGGTTCGAACATCTTTAACGATGTGAGCAACAAGAGTTGTGTGTACATATCGGGACCCGGTGGTGTGCATGTCAGTGTCTCCGACGAGGTGCTCAACAACGAGATCAAGGACGGCAGCCTCTATGCTCTGGATGTGCAGAGTGGCAAAGTTATATTGAAGCTGATCAATAAGCAGGATAACAATTGA
Protein Sequence: MALSFLSQNSGLLDLHSIFDPQYSLQQHQQQQQQLHLPSQQQQQQLQQTSRTLTKFDLNIFNDFDQMEFNNNLSRNHNQYQNNNNNNTINNNNSNHNTNNNNTTTNNNNSNIHTHQNNGENLNQIQNRHFISGYHHQHIGSDYEQVINFVDSPPNSEESWTDAQSKDSPGPQIIDVRTIYSNSSGSRKRRMDWDSLDIGQSENSPTTQTGDLPNKVAHHQEKDKHKREKHSGRSSWSDEIGFDLNAEFNSNSYLNNENFLSFSPSLTALKQEPQTEQLKPNPKLPLXXXXXXXXXXXXXXGGNSGSLAVVNIGKIDKSPLGEANHSPQRAGQQDTGSGGAGGNSGKHELNSGNICGCGSPQGSPAATDFELNNGNANGNAAAGGDKSRAAAGNEAFAQAPRSGLQQQLSVVDAAKIEPSSSGSAGHVEDHKFQYILAAATSIATKNNEETLTYLNQGQSYEIKLKKIGDLSFYRDKILKSVIKICFHERRLQFMEREQMQQWQASRPGDRIIEVDVPLSYGLCHVSQPLSSNALNTVEIFWDPLKEVGVYIKVNCISTEFTPKKHGGEKAACQIKVFKLKGADRKHKQDREKIQKRPQSEQEKFQPSYECTIMNDISLDLIMPATTSTGCYSPEYMKLWPNSPVHIPKYDGMLPFASSASPATSSSPIAINSVTSTNSPTLKLMDATNMVSPQHVPADMDDYNQNIMPESTPAQVTQWLTNHRLTAYLTTFAHFSGADIMRMSKEDLIQICGLADGIRMFNILRAKTIAPRLTLYASMDGCSFNAIYLLSNTAKELQQKIYKLPGFYEFMAKGGASGVLENGSVSAAAAAAAAAAALYNNWGMHSKYSGSGSNIFNDVSNKSCVYISGPGGVHVSVSDEVLNNEIKDGSLYALDVQSGKVILKLINKQDNN

Similar Transcription Factors

Sequence clustering based on sequence similarity using MMseqs2

100% Identity: iTF_01559521;
90% Identity: iTF_01559521; iTF_01550756; iTF_01558041; iTF_01556590; iTF_01551484;
80% Identity: -