Basic Information

Insect: Amiota communis
Gene Symbol: Ubp1_1
Assembly: GCA_037043315.1
Location: JBAMAV010001581.1:3565584-3584829[-]

Transcription Factor Domain

TF Family: CP2
Domain: CP2 domain
PFAM: PF04516
TF Group: Beta-Scaffold Factors
Description: This family represents a conserved region in the CP2 transcription factor family.
Hmmscan Out: # of c-Evalue i-Evalue score bias hmm coord from hmm coord to ali coord from ali coord to env coord from env coord to acc

1 4 0.72 1.2e+04 -3.9 1.6 90 113 26 49 21 87 0.52

2 4 0.5 8.3e+03 -3.3 0.6 9 30 80 101 61 113 0.54

3 4 4.6e-54 7.6e-50 170.1 0.4 17 186 375 541 362 555 0.90

4 4 8.1e-14 1.3e-09 38.5 0.7 186 222 619 655 611 656 0.90

#	of	c-Evalue	i-Evalue	score	bias	hmm coord from	hmm coord to	ali coord from	ali coord to	env coord from	env coord to	acc
1	4	0.72	1.2e+04	-3.9	1.6	90	113	26	49	21	87	0.52
2	4	0.5	8.3e+03	-3.3	0.6	9	30	80	101	61	113	0.54
3	4	4.6e-54	7.6e-50	170.1	0.4	17	186	375	541	362	555	0.90
4	4	8.1e-14	1.3e-09	38.5	0.7	186	222	619	655	611	656	0.90

Sequence Information

Coding Sequence: ATGGCTCTTTCGTTTTTATCACAAAATTCCGGCTTATTGGATTTGCAAGCAATATTTGATCCATTACAActtcagcagcaacaacaagaacaacaacatctattacaacaacaacaacaacatcgttCATCAACAAAATTCGATTTCTCCATATTAAACGATTTTGATCAAATGGAATACAATCATAATCcccataacaacaacaataacaacacaaacagcaacaacaacatcaacaacgaTAGTAATAgtagcagtaacaacaacaacaacaacaacaacagtaaccacaataataatattcatacaCATCAATCATCAAATAACAGCAATATTAATCAGattcCAACGCGTCACTACATGAGCGGTTATCATCACCAACATATTGGATCGGATTATGAACAAGTGATTAACTTTGTAGATTCACCACCGAATTCAGAAGAATCTTGGACAGACGCACAATCGAAGGATTCACCTGGACCTCAAATAATTGACGTTCAAACAATTTACACGAACAGCAGTGGTTCACGCAAAAGACGAATGGATTGGGACTCATTGGGTATTGGTCAAAGTGAAAATTCACCAGCAACACAGCCTGGAGAGataccaaataaaatatcacatcaagaaaaagataaacatAAACGCGAGAAGCAATCAGgacgCAGCAGCTGGAGCGATGAAATTGGATTCGATTTGAATGCTGAATTTAACAGTAACTCATATTTGAACAaTGAATCTTTTCTATCGTTCTCGCCTAGCTTGACAGCACTCAAGCAGGAGCCCCAAACTGAACAATTGAAGACGAATAACACCAATTCAAAGAGTCCATTGGTTTTGGCTAAAATTGACAAATCACCATTGAGTGATAGTTCCAATGCCCAAGAGCCAAGTCACAAGCATAAACTAAATGCTGGTGGTGGCAATTATAGAAACTGTAGCTCACCACAAGGTTCACCATTAGCTCCACAGGACTATGAATTGAATACTTCAACAAACTCAGCAGctgcagtagcagcagcatcaggGCCTGAAAAAAGCGAAGCCTATGCACGCAATGGCGCCAATGCTGTCATACAACAATTGAGTATTGTCGATGCGACTAAGATTGAACAATCGCCCAGTGCAAGTGCAACACCAGGGCATTCTGAAGATCACAAatttcaatatattttggCTGCAGCAACTTCCATTGCCACCAAAAATAATGAGGAAACATTGACATATCTTAATCAGGGTCAAAGTTATGAGatcaaattgaagaaaattggTGATTTATCATTCTATCGTGATAAGATCTTGAAGagTGTTATCAAAATTTGCTTTCATGAACGTCGTCTTCAGTTTATGGAACGCgaacaaatgcaacaatggCAGGCTTCACGTCCTGGTGAGCGTATCATTGAAGTCGATGTACCATTGTCCTATGGACTTTGTCATGTCTCGCAGCCATTGAATTCGAATTCATTGAATACTGTCGAAATATTTTGGGATCCATTGAAGGAAGTGGGTGTCTACATAAAGGTTAATTGCATTTCAACCGAATTTACACCAAAGAAGCACGGTGGAGAAAAGGGTGTACCGTTTCGACTACAAATTGAAACTTATATTGAGAATTCTAACAACGGAAATAATACTAACAACAACGCCAGCACAACAAGtggcaataataacaacactaacagcaacaataataataataataataataacaatacaacatcatcatcatcaccaaacGCTTCAGCAGTTACAGCAACATCTGGCGCAACTATCGGTGGCGACACGCCCGGAAATCGTACACCAAACGGTAGCATTGGCAGTACTGGTAGCATTGGTTTCTCAGCCACACTCAACAGCAAACAGGCAGTGCATGCAGCTGCATGTCAGATTAAGGTTTTCAAACTTAAAGGCGCCGATCGTAAACACAAACAGGATCgtgaaaagatacaaaaacgTCCACAATCCGAACAAGATAAATTTCAGCCAAGCTACGAATGTACAATTATGAATGATTTGGCATTGGATTTGATTGGACCAAATGCTGGATGTTATAGTCCTGAATATATGAAAATCTGGCCAAATTCGCCAGTTCATATACCAAAGTATGATGGAATTTCACCGTTTACTAGCACATCGCCAGGAAACAGCAACAGCCCCATAGCAATAAATTCAGTTACATCAACAAATTCGCCAACATTGAAACTTATGGATACAACAAATATGGTTTCGCCACAACATGTTGCGGCAGACATTGATGATTATaatttaaatataatgCCTGAATCGACGCCAACACAAGTGACACAATGGCTAACCAATCATCGCTTGACGGCATATCTGACGACATTCGCACATTTCTCGGGCGCTGATATTATGAGaATGTCTAAGGAAGATCTTATACAAATATGTGGTCTGGCCGATGGTATACgaatgtttaatattttacgCGCCAAAGCCATAACACCACGTTTGACGGTTTATGTAAGCTTGGATGGCAGCAGTTATAATGCCATTTATCTGATCAATAATACAGCCAAGGAGCTAACACAGAAACTATTCAAATTGCCGGGTTTCTATGAGGCAATAGCCAAAAGCGCTAATAATGCTTTGGagaatggtggtggtggcctTTACAATGGATGGGGCATGCATTCGAAATACTCTGGCAGCGGTTCAAATATATTCAATGATGTCAACAAGAGTTTCATCTATGTTGCAGGACCATCTGGTGTCCATGTCACTATTACCGATGAAGTActcaataatgaaatcaaagatGGTAGCTTATATGCTCTCGATGTACAAAATGGAAAAGTcgttttgaaattaattaacaaaacagaaaattaa
Protein Sequence: MALSFLSQNSGLLDLQAIFDPLQLQQQQQEQQHLLQQQQQHRSSTKFDFSILNDFDQMEYNHNPHNNNNNNTNSNNNINNDSNSSSNNNNNNNNSNHNNNIHTHQSSNNSNINQIPTRHYMSGYHHQHIGSDYEQVINFVDSPPNSEESWTDAQSKDSPGPQIIDVQTIYTNSSGSRKRRMDWDSLGIGQSENSPATQPGEIPNKISHQEKDKHKREKQSGRSSWSDEIGFDLNAEFNSNSYLNNESFLSFSPSLTALKQEPQTEQLKTNNTNSKSPLVLAKIDKSPLSDSSNAQEPSHKHKLNAGGGNYRNCSSPQGSPLAPQDYELNTSTNSAAAVAAASGPEKSEAYARNGANAVIQQLSIVDATKIEQSPSASATPGHSEDHKFQYILAAATSIATKNNEETLTYLNQGQSYEIKLKKIGDLSFYRDKILKSVIKICFHERRLQFMEREQMQQWQASRPGERIIEVDVPLSYGLCHVSQPLNSNSLNTVEIFWDPLKEVGVYIKVNCISTEFTPKKHGGEKGVPFRLQIETYIENSNNGNNTNNNASTTSGNNNNTNSNNNNNNNNNNTTSSSSPNASAVTATSGATIGGDTPGNRTPNGSIGSTGSIGFSATLNSKQAVHAAACQIKVFKLKGADRKHKQDREKIQKRPQSEQDKFQPSYECTIMNDLALDLIGPNAGCYSPEYMKIWPNSPVHIPKYDGISPFTSTSPGNSNSPIAINSVTSTNSPTLKLMDTTNMVSPQHVAADIDDYNLNIMPESTPTQVTQWLTNHRLTAYLTTFAHFSGADIMRMSKEDLIQICGLADGIRMFNILRAKAITPRLTVYVSLDGSSYNAIYLINNTAKELTQKLFKLPGFYEAIAKSANNALENGGGGLYNGWGMHSKYSGSGSNIFNDVNKSFIYVAGPSGVHVTITDEVLNNEIKDGSLYALDVQNGKVVLKLINKTEN

Similar Transcription Factors

Sequence clustering based on sequence similarity using MMseqs2

100% Identity: iTF_00062504;
90% Identity: iTF_00062504; iTF_00061686;
80% Identity: -