Basic Information

Insect: Cheilosia urbana
Gene Symbol: Ubp1_1
Assembly: GCA_946477595.1
Location: CAMLCJ010000274.1:128005-170795[-]

Transcription Factor Domain

TF Family: CP2
Domain: CP2 domain
PFAM: PF04516
TF Group: Beta-Scaffold Factors
Description: This family represents a conserved region in the CP2 transcription factor family.
Hmmscan Out: # of c-Evalue i-Evalue score bias hmm coord from hmm coord to ali coord from ali coord to env coord from env coord to acc

1 2 2 4.4e+04 -8.9 10.7 99 133 107 147 90 165 0.49

2 2 2.3e-63 5.1e-59 200.5 3.3 18 222 377 602 362 603 0.90

#	of	c-Evalue	i-Evalue	score	bias	hmm coord from	hmm coord to	ali coord from	ali coord to	env coord from	env coord to	acc
1	2	2	4.4e+04	-8.9	10.7	99	133	107	147	90	165	0.49
2	2	2.3e-63	5.1e-59	200.5	3.3	18	222	377	602	362	603	0.90

Sequence Information

Coding Sequence: ATGGCTCTATCGCTACTTTCGCATCCAAATTTTACGGATTTACAGACATTTCTCGACCCAATACGTTCCACTTTTGACTTTTCGCTCAATACCGATCAAATGGAATACAATAACAACAATTCAACAATCAATCAACATTTGACacacaacaataataataataacagcaacaacaatcgcaattacaacaacttcgCATCAAATCAATCACAAAATGGATACAATAACGACTATGATCAAGTGATCAATTTTGTAGACTCCCCACCGAATTCAGAAGAATCGTGGACAGACgaacaacatcaacatcaacaacaacaacagcagcaacagcagcaacatcaGCAAACTGCAAAGATCCCACCAACAGGGCCGACCATCATTGATGTTCAAACGATTTacggacaacaacaacaacagcaacagcaacaacaacagcagcaacaacaacaacagcaacagcaacaacagcagcagcaacagttaCAAGCAGCCGCAGCAGCGGCGGCAAGTGGACAACGTAAAAGGCGAATGGATTGGAATCCCCTCGAAATTAGCCAAAATCCAAACAATGGCGCTAATGGGCAACAGCCGGCTTCCAAGATTCCAAATCTGACGAACGGAAACACCGCCGCCACCAACAACAACGGCACAGCCAACAATACTACCATCAAggagaaggaaaagaaaaaactctCCAACGGCAGCACTAATGGCCGCGGAAGTTGGGCTGACGACATTGATTTCGATTTAAACGGAGACTTCAACAGCAACGGCTACTTGAACAATGAACCCTTTTTGTCATTTTCTCCGGCACTATCTGTTCTCAAGCAGGAAATACACTCTCCTCAGGCATCAGATCAATTGAAGGGCAACAAGAGCCCTATAAATCCGGTCAACCAAGAGAACTCGCTTAGTTCGGACAATCATGATTCGGATCATCAAATAATTGCAAATAGCGCCGATTTGAATGAATCTAGTGCTCCGATTGGATCTCCGCAACAAGTGAAAAAGCCAACTTACGACAGTTCGAAGGCGATTTCGGTCAATGGACTTGGTGTTGGCAGTCAACCGACTGATAAACCAGCCAACAACGCCCGCAAAAGCCCAATCCTACCAGCTGCGGACTCTTCTAAGAGCGAAACTACCCTAGCGGATGATTACAAATTCCAGTACATATTGGCTGCGGCTACATCGATTGCAACCAAAAACAACGAAGAGACTCTCACTTACCTAAATCAGGGGCAAAGCTATGAGATCAAGTTGAAGAAAACTGGAGATTTATCATTCTACAGGGATAAGATATTGAAGAGCGTCATCAAGATCTGTTTCCATGAGCGTCGTCTTCAGTACATGGAACGTGAGCAAATGCAACAATGGCAAGCATCGCGTCCAGGTGAAAGGATCATTGAAGTCGATGTTCCGTTGTCCTACGGCTTGTGTCATGTGTCACAGCCGTTGAATCCAAATTTTTTGAATACCGTTGAAGTCTTTTGGGATCCCCTCAAGGAGGTGGGTGTCTACATTAAGGTCAACTGCATCTCAACCGAGTTCACACCAAAGAAGCACGGTGGCGAAAAAGGTGTCCCATTTAGGATACAAATTGAAACGTATATAGAAAATGCAAATAGCTCGCCAGTGGGCGATAGTTCAACGAATTGTACTAATTTAAATGGTGCCAATGGAAGTGGCAATGTAAGTGGAAAGCTACCAATACATGCGGCAGCTTGTCAAATTAAGGTTTTCAAATTGAAAGGAGCCGATCGAAAACACAAACAGGATCGCGAGAAAATCCAGAGACGACCACAGTCAGAGCAGGAAAAGTTCCAACCAAGCTATGAGTGCACCATCATGAATGATATACCATTGGAATCAATAACCCCATCGGTTGGTTGCTACAGCCCTGAATACATGAAACTTTGGCCAAACTCGCCAGTTCATATACCAAAATACGATGGAATCATACCTTATGCGAATGTGTCGCCAGCTGCCAATTCTAGCCCGATAGCAATAAACAGTGTGACATCGACgaatacaaataatttgaaaCTAATGGATGCCAACATGGTGTCGCCGCAACAGGTGGAAATGGACGATTatCAATCGCCTAATATTATGGCCGAATCAACACCGGCTCAGGTTACTCAATGGCTAACCTATCATCGATTGACAGCGTATGTGTCCACGTTCGCGCACTTTTCCGGTTCAGATATTTTGCGAATGTCGAAAGAGGACCTCATCCAAATATGCGGACTTGCCGACGGTATTCGTATGTTTAACATTTTGCATACCAAAGCCATAGCCCCACGACTCACCATTTATGTTAGCTTAGATGGGAGTAGCTACAACGCCATTTATCTAACATCAAACTCTTCAAAGGAACTAACTCAGAAACTCTTTAAATTGCCGGGTTTCTACGAGTTGAGCGCCAACAGCTCAACCATGAATGGTGGGGTTGACGGAGGTGTCTACCCCGGTTGGGGCATGCAATCGAAATACTCAGGAAGTGGTTCAAATATATTTAATGACGCATCCAAGACCCCTATCTACATTCATGGCCCATCTGGTGTTCACGTCACCATCACCGATGAAGTTctgaataatgaaattaaagatGGAAGCCTATACGCACTTGAAGTACAAAATGGAAAAGTACTTataaaagcaataaataaaaatgataattaa
Protein Sequence: MALSLLSHPNFTDLQTFLDPIRSTFDFSLNTDQMEYNNNNSTINQHLTHNNNNNNSNNNRNYNNFASNQSQNGYNNDYDQVINFVDSPPNSEESWTDEQHQHQQQQQQQQQQHQQTAKIPPTGPTIIDVQTIYGQQQQQQQQQQQQQQQQQQQQQQQQQQLQAAAAAAASGQRKRRMDWNPLEISQNPNNGANGQQPASKIPNLTNGNTAATNNNGTANNTTIKEKEKKKLSNGSTNGRGSWADDIDFDLNGDFNSNGYLNNEPFLSFSPALSVLKQEIHSPQASDQLKGNKSPINPVNQENSLSSDNHDSDHQIIANSADLNESSAPIGSPQQVKKPTYDSSKAISVNGLGVGSQPTDKPANNARKSPILPAADSSKSETTLADDYKFQYILAAATSIATKNNEETLTYLNQGQSYEIKLKKTGDLSFYRDKILKSVIKICFHERRLQYMEREQMQQWQASRPGERIIEVDVPLSYGLCHVSQPLNPNFLNTVEVFWDPLKEVGVYIKVNCISTEFTPKKHGGEKGVPFRIQIETYIENANSSPVGDSSTNCTNLNGANGSGNVSGKLPIHAAACQIKVFKLKGADRKHKQDREKIQRRPQSEQEKFQPSYECTIMNDIPLESITPSVGCYSPEYMKLWPNSPVHIPKYDGIIPYANVSPAANSSPIAINSVTSTNTNNLKLMDANMVSPQQVEMDDYQSPNIMAESTPAQVTQWLTYHRLTAYVSTFAHFSGSDILRMSKEDLIQICGLADGIRMFNILHTKAIAPRLTIYVSLDGSSYNAIYLTSNSSKELTQKLFKLPGFYELSANSSTMNGGVDGGVYPGWGMQSKYSGSGSNIFNDASKTPIYIHGPSGVHVTITDEVLNNEIKDGSLYALEVQNGKVLIKAINKNDN

Similar Transcription Factors

Sequence clustering based on sequence similarity using MMseqs2

100% Identity: iTF_00309981;
90% Identity: iTF_00310771;
80% Identity: -