Basic Information

Insect: Zaprionus ghesquierei
Gene Symbol: UBP1_1
Assembly: GCA_018904095.1
Location: JAEIGP010000662.1:3234799-3245964[+]

Transcription Factor Domain

TF Family: CP2
Domain: CP2 domain
PFAM: PF04516
TF Group: Beta-Scaffold Factors
Description: This family represents a conserved region in the CP2 transcription factor family.
Hmmscan Out: # of c-Evalue i-Evalue score bias hmm coord from hmm coord to ali coord from ali coord to env coord from env coord to acc

1 4 0.65 5.2e+03 -3.7 0.5 106 129 28 52 25 66 0.47

2 4 2 1.6e+04 -5.9 2.4 6 25 85 104 67 126 0.50

3 4 5.1e-48 4.1e-44 150.4 0.0 23 175 413 562 393 567 0.91

4 4 2.8e-13 2.2e-09 36.7 1.0 188 222 679 713 673 714 0.91

#	of	c-Evalue	i-Evalue	score	bias	hmm coord from	hmm coord to	ali coord from	ali coord to	env coord from	env coord to	acc
1	4	0.65	5.2e+03	-3.7	0.5	106	129	28	52	25	66	0.47
2	4	2	1.6e+04	-5.9	2.4	6	25	85	104	67	126	0.50
3	4	5.1e-48	4.1e-44	150.4	0.0	23	175	413	562	393	567	0.91
4	4	2.8e-13	2.2e-09	36.7	1.0	188	222	679	713	673	714	0.91

Sequence Information

Coding Sequence: ATGGCGCTTTCGTTTCTATCGCAAAATTCCGGCCTCTTGGATTTACAAAGCATATTTGATCCACAATATTCATTGCAACAACATCAACAACAACAACAACAAAAATTACATTTACCATCACAACAACAACAACTACAACAGCAACAACAAACATCACGCACGTTTACGAAATTCGATTTAAACATTTTCAACGATTTCGACCAAATGGAATTCAACAACAATTTGAGTCGAAACAACAATCAATATCAGAATAATAATAACAACAATAACACTATCAATAATAATAATAGCAACCACAACACCAACAACACCAACAATAACAACATACATACGCACCAAAACAACGGTGAAAATCTTAATCAGATCCAAAATCGTCATTTTATGAGCGGCTATCATCATCAGCATATTGGATCGGATTATGAGCAAGTGATTAACTTTGTTGACTCACCACCAAATTCAGAGGAATCTTGGACAGACGCTCAATCGAAGGATTCGCCCGGACCTCAGATTATCGACGTACGGACAATTTACTCCAACAGTGGTTCACGCAAAAGACGAATGGATTGGGACTCATTGGATATTGGTCAAAGTGAAAATTCGCCGACAACACAGACGGGCGACTTATCCAATAAGGTGGCACATCAGCAGGAGAAAGATAAACACAAGCGTGAAAAGCATTCAGGTCGCAGTAGCTGGAGCGACGATATAGGGTTTGATCTGAACGCTGAGTTCAATAGCAACTCATATTTGAACAATGAAAACTTTCTATCGTTCTCCCCGAGCCTGACGGCACTGAAACAGGAGCCGCAGACAGAGCAGCTCAAACCGAATTCGAAGCTATCGCTGGAGNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNTGGGTGTCGTGAACATTGGCAAGATTGACAAATCGCCTCTGGGCGAGGCCAATCACTCACCACAGCGTGCAGGACAGGAGTCGGGATCGGGCGCAGGATCTGCTGGAGCAGGCGGCAAACATGAGTTGAACTCGGGCAACATCTGCGGTTGTGGCTCGCCACAAGGCTCGCCCGCCGCAGCGGACTTTGAACTGAATGGCAATGCCAATGGAAACGCTGCAGCAGGCGACAAGAACAGAGCTGCAGGGGGCAATGAGGCCTTTGCACAGGCGCCACGCTCTGGACTGCAGCAGCAGCTGAGCGTTGTTGAGGCGGCCAAAATAGACGCGAGCTCTTCGGGCGGTGGAGCCCATGTGGAGGATCACAAATTTCAATACATTTTGGCAGCAGCCACCTCAATTGCAACTAAGAATAATGAGGAGACTCTAACCTATCTGAATCAGGGTCAAAGCTATGAGATCAAATTGAAGAAAATTGGTGATTTATCGCTTTATCGTGATAAGATTTTAAAGAGCGTTATTAAAATCTGTTTCCACGAGCGTCGATTGCAGTTCATGGAACGCGAACAGATGCAACAATGGCAAGCTTCGCGTCCTGGCGATCGCATCATTGAGGTGGATGTGCCACTCTCCTATGGCCTGTGCCATGTGTCGCAGCCATTGAGCTCGAATGCACTGAACACGGTCGAAATATTATGGGATCCATTGAAGGAGGTCGGTGTTTACATCAAGGTCAATTGCATTTCCACTGAGTTTACACCAAAGAAGCACGGCGGCGAAAAGGGTGTACCATTTNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNTGGTTCCATCGCCGGACTTTCCGCACTCAACGGCAAACAGGCGGTGCATGCAGCTGCATGTCAGATTAAGGTATTTAAGCTGAAGGGCGCCGATCGCAAGCATAAACAGGATCGCGAGAAGATACAAAAGCGTCCGCAGTCTGAGCAGGAGAAGTTCCAGCCCAGCTACGAGTGCACCATTATGAATGATATATCGTTGGATCTGGTAATGCCGGCCACCACCACCGGCTGCTACAGTCCCGAGTATATGAAACTTTGGCCCAATTCGCCGGTTCATATACCAAAATATGATGGGATGCTACCGTTCGCAAGCGGCGCATCTCCGGCGACAAGCAGCAGCCCCATTGCGATCAATTCAGTGACATCAACAAATTCGCCAACATTGAAACTAATGGACGCCACGAATATGGTATCGCCGCAACATGTGCCAGCGGATATGGATGATTATAATCAAAACATAATGCCGGAATCAACGCCCTCACAAGTGACACAATGGCTGACCAATCATCGCCTGACGGCCTACCTCACCACGTTTGCCCATTTCTCGGGAGCCGATATTATGCGCATGTCCAAGGAGGATCTTATACAGATCTGTGGTCTTGCCGATGGAATACGCATGTTCAATATATTGCGCGCCAAAACCATTGCGCCGCGTCTAACACTCTACGCCAGCATGGACGGCTGCAGCTTTAATGCCATCTATCTGCTGTCCAACACGGCCAAGGAGCTCCAGCAGAAGATCTACAAGTTACCTGGTTTCTACGAATTCATGGCCAAGGGCGGTGCCTCGGGCGTCTTGGAGAATGGCAGCGTGTCGGCCGCAGTTGCAGCTGCAGCGACAGCCGCTGCACTTTACAACAATTGGGGCATGCACTCAAAGTACTCCGGCAGCGGATCGAACATCTTCAACGATGTGAACAACAAGAGTTGCGTTTACATTTCGGGACCGTCAGGCGTGCATGTCAGTGTCTCCGACGAGGTACTCAACAACGAGATCAAGGACGGCAGCCTCTACGCTCTGGATGTGCAGGGCGGCAAAGTTATTTTGAAATTAATCAATAAGCAGGATAACAATTAA
Protein Sequence: MALSFLSQNSGLLDLQSIFDPQYSLQQHQQQQQQKLHLPSQQQQLQQQQQTSRTFTKFDLNIFNDFDQMEFNNNLSRNNNQYQNNNNNNNTINNNNSNHNTNNTNNNNIHTHQNNGENLNQIQNRHFMSGYHHQHIGSDYEQVINFVDSPPNSEESWTDAQSKDSPGPQIIDVRTIYSNSGSRKRRMDWDSLDIGQSENSPTTQTGDLSNKVAHQQEKDKHKREKHSGRSSWSDDIGFDLNAEFNSNSYLNNENFLSFSPSLTALKQEPQTEQLKPNSKLSLEXXXXXXXXXXXXXXGVVNIGKIDKSPLGEANHSPQRAGQESGSGAGSAGAGGKHELNSGNICGCGSPQGSPAAADFELNGNANGNAAAGDKNRAAGGNEAFAQAPRSGLQQQLSVVEAAKIDASSSGGGAHVEDHKFQYILAAATSIATKNNEETLTYLNQGQSYEIKLKKIGDLSLYRDKILKSVIKICFHERRLQFMEREQMQQWQASRPGDRIIEVDVPLSYGLCHVSQPLSSNALNTVEILWDPLKEVGVYIKVNCISTEFTPKKHGGEKGVPFXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXGSIAGLSALNGKQAVHAAACQIKVFKLKGADRKHKQDREKIQKRPQSEQEKFQPSYECTIMNDISLDLVMPATTTGCYSPEYMKLWPNSPVHIPKYDGMLPFASGASPATSSSPIAINSVTSTNSPTLKLMDATNMVSPQHVPADMDDYNQNIMPESTPSQVTQWLTNHRLTAYLTTFAHFSGADIMRMSKEDLIQICGLADGIRMFNILRAKTIAPRLTLYASMDGCSFNAIYLLSNTAKELQQKIYKLPGFYEFMAKGGASGVLENGSVSAAVAAAATAAALYNNWGMHSKYSGSGSNIFNDVNNKSCVYISGPSGVHVSVSDEVLNNEIKDGSLYALDVQGGKVILKLINKQDNN

Similar Transcription Factors

Sequence clustering based on sequence similarity using MMseqs2

100% Identity: iTF_00478480;
90% Identity: -
80% Identity: -