Basic Information

Insect: Tuta absoluta
Gene Symbol: Ube2o_1
Assembly: GCA_029230345.1
Location: CM055289.1:13331373-13356461[-]

Transcription Factor Domain

TF Family: Homeobox
Domain: Homeobox
PFAM: PF00046
TF Group: Helix-turn-helix
Description: This entry represents the homeodomain (HD), a protein domain of approximately 60 residues that usually binds DNA. It is encoded by the homeobox sequence [7, 6, 8], which was first identified in a number of Drosophila homeotic and segmentation proteins, but is now known to be well-conserved in many other animals, including vertebrates [1, 2], as well as plants [4], fungi [5] and some species of lower eukaryotes. Many members of this group are transcriptional regulators, some of which operate differential genetic programs along the anterior-posterior axis of animal bodies [3]. This domain folds into a globular structure with three α-helices connected by two short loops that harbour a hydrophobic core. The second and third form a helix-turn-helix (HTH) motif, which make intimate contacts with the DNA: while the first helix of this motif helps to stabilise the structure, the second helix binds to DNA via a number of hydrogen bonds and hydrophobic interactions, which occur between specific side chains and the exposed bases and thymine methyl groups within the major groove of the DNA. One particularity of the HTH motif in some of these proteins arises from the stereo-chemical requirement for glycine in the turn which is needed to avoid steric interference of the β-carbon with the main chain: for cro and repressor proteins the glycine appears to be mandatory, while for many of the homeotic and other DNA-binding proteins the requirement is relaxed.
Hmmscan Out: # of c-Evalue i-Evalue score bias hmm coord from hmm coord to ali coord from ali coord to env coord from env coord to acc

1 10 0.28 97 4.0 0.0 12 31 103 122 100 137 0.81

2 10 0.13 45 5.0 0.1 12 43 147 179 144 182 0.77

3 10 0.28 97 4.0 0.0 12 31 191 210 188 225 0.81

4 10 0.13 45 5.0 0.1 12 43 235 267 232 270 0.77

5 10 0.13 45 5.0 0.1 12 43 279 311 276 314 0.77

6 10 0.13 45 5.0 0.1 12 43 323 355 320 358 0.77

7 10 0.13 45 5.0 0.1 12 43 367 399 364 402 0.77

8 10 0.13 45 5.0 0.1 12 43 411 443 408 446 0.77

9 10 0.13 45 5.0 0.1 12 43 455 487 452 490 0.77

10 10 0.26 90 4.1 0.1 12 31 499 518 496 524 0.89

#	of	c-Evalue	i-Evalue	score	bias	hmm coord from	hmm coord to	ali coord from	ali coord to	env coord from	env coord to	acc
1	10	0.28	97	4.0	0.0	12	31	103	122	100	137	0.81
2	10	0.13	45	5.0	0.1	12	43	147	179	144	182	0.77
3	10	0.28	97	4.0	0.0	12	31	191	210	188	225	0.81
4	10	0.13	45	5.0	0.1	12	43	235	267	232	270	0.77
5	10	0.13	45	5.0	0.1	12	43	279	311	276	314	0.77
6	10	0.13	45	5.0	0.1	12	43	323	355	320	358	0.77
7	10	0.13	45	5.0	0.1	12	43	367	399	364	402	0.77
8	10	0.13	45	5.0	0.1	12	43	411	443	408	446	0.77
9	10	0.13	45	5.0	0.1	12	43	455	487	452	490	0.77
10	10	0.26	90	4.1	0.1	12	31	499	518	496	524	0.89

Sequence Information

Coding Sequence: ATGTGCTGGCCACAGGACCTATACAAGGTGGGCGAATACGACTCGGAAGACGGCGAGCTGTGGGGCTCAGAAGGCTCAGCCTCCGACGATTCGTGGGAGACCCAGAGCTCCGCCCACGACGCTGAGCCGCCCACGCCCACCGACCAGCCGCCTAAACCCACCGCCCAACTGGCGATTGCGACCGCAGAGCACGCCGAAGTGGACGTGGAAATGCCTGAGAACGCTCTAGCCGGCGGGGAGTCTAGTTCGGTGCCGCGACTGCTGGAGCCGCGTGTGGCCGCGCATATAGAGCGCGGGAGGGTCGCCATGCGCCGCCTCGAGGAGATGTTCGCCAAGCATCCCACGCTGCAGAGCCAGGAGGTAAGTAGAGCGCTTGCTGCAGTGCCGCGACTGCTGGAGCCGCGTGTGGCCGCGCATATAGAGCGCGGGAGGGTCGCCATGCGCCGCCTCGAGGAGATGTTCGCCAAGCATCCCACGCTGCAGAGCCAGGAGGTAAGTAGAGCGCTTGCTGCAGAGCCGCGACTGCTGGAGCCGCGTGTGGCCGCGCACATAGAGCGCGGGAGGGTCGCCATGCGCCGCCTCGAGGAGATGTTCGCCAAGCATCCCACGCTGCAGAGCCAGGAGGTAAGTAGAGCGCTTGCTGCAGTGCCGCGACTGCTGGAGCCGCGTGTGGCCGCGCATATAGAGCGCGGGAGGGTCGCCATGCGCCGCCTCGAGGAGATGTTCGCCAAGCATCCCACGCTGCAGAGCCAGGAGGTAAGTAGAGCGCTTGCTGCAGAGCCGCGACTGCTGGAGCCGCGTGTGGCCGCGCATATAGAGCGCGGGAGGGTCGCCATGCGCCGCCTCGAGGAGATGTTCGCCAAGCATCCCACGCTGCAGAGCCAGGAGGTAAGTAGAGCGCTTGCTGCAGAGCCGCGACTGCTGGAGCCGCGTGTGGCCGCGCATATAGAGCGCGGGAGGGTCGCCATGCGCCGCCTCGAGGAGATGTTCGCCAAGCATCCCACGCTGCAGAGCCAGGAGGTAAGTAGAGCGCTTGCTGCAGAGCCGCGACTGCTGGAGCCGCGTGTGGCCGCGCATATAGAGCGCGGGAGGGTCGCCATGCGCCGCCTCGAGGAGATGTTCGCCAAGCATCCCACGCTGCAGAGCCAGGAGGTAAGTAGAGCGCTTGCTGCAGAGCCGCGACTGCTGGAGCCGCGTGTGGCCGCGCATATAGAGCGCGGGAGGGTCGCCATGCGCCGCCTCGAGGAGATGTTCGCCAAGCATCCCACGCTGCAGAGCCAGGAGGTAAGTAGAGCGCTTGCTGCAGAGCCGCGACTGCTGGAGCCGCGTGTGGCCGCGCATATAGAGCGCGGGAGGGTCGCCATGCGCCGCCTCGAGGAGATGTTCGCCAAGCATCCCACGCTGCAGAGCCAGGAGGTAAGTAGAGCGCTTGCTGCAGAGCCGCGACTGCTGGAGCCGCGTGTGGCCGCGCATATAGAGCGCGGGAGGGTCGCCATGCGCCGCCTCGAGGAGATGTTCGCCAAGCATCCCACGCTGCAGAGCCAGGAGATAATGCGAAAATTACTCAACTTATACAAAGATTGCCGGTTCTTAGATCGACTGATGGGCACTTCCTTCTTCCATGAAGATCACTTTTTGGGCTTGCTGGAGCGCGTCCGCGAGCGCGGCGCCAGCACCCCGCGCGCGGGCGAGCGACGCGTGCACGAGCAACTCGCGCGGCTCTTCTCACAGGAGCCAGAATGCGAACTGCCGCCGGCTGACGACCACACCGGCATCGACGACACTAAGCCCATCATCACAGTGGAAATGATGCAGGTGGAACAGATGGTAAAAAATAACAAGCCAGTGTTTGGGTTGAATGTGAACTTTCAACCGGAGCTGCCCTCGATATCCGACACCGGCTTGGCCAAGGAACCTGCTGCTGAGACCACGGACGCTCGGGGTTCATGCGCGAGCGCGGTGTGCGCGGAAGAGCCGGAGGGCGCGAGTCGCAACGTGTGCTACAAGCTGTGCGCGCTCATACACGCGCAGCTCGTCAAGGCGCACGCTGAAGTCAGCCGGCGAAGGCCGCAAGAGCTGGCTGAGTTCCTAAACAGCTTATTGAAAAAAAGCACGGAGGACAAGTTACCATATATTTTTACAGTTCAATACGGCGCGCTTGTGGTGAGCATGGCCGAGGAGGATAAACCGGCCGAGGCGAAGGATGAGGCCGCCAAGTCGGACACCAGTGCAACAACAGTAGAAACGGCACCTCTAGCGACCGGCGAAGGTGAACTCGAGCCGGAAGAGACTCCGGAACCAGTCGTCGGGGGAAGCGAGGCTGTTGAGGGCGGGGAGGGCTTCTGCGTGATCGAATCCGCGCCCGTCGGGCATCGCTTCCGGCTGTCCATGCTGCAGCCCAGCGAGCCGCGCAGCTTCTACTCCGCCGTCAAGCGGGAGATCAAGCTGCTCAAGAGCGACCTGCCGCCCGGGGTATGGGTGCGCGGGTTCGAAGACCGCATCGACCTGCTGTCAGTGATGATCGCGGGCCCGGCCAAGACGCCCTACGAGGACGGGCTGTTCGTGTTCGACGTGCAGCTGGGCGGGGAGTacccgcgcgcgccgccgctctGCCACTACCACTCCTACTGCAGCGACCGCCTCAACCCCAACCTCTACGAGGACGGCAAGGTGTGCGTGTCCCTGCTGGGCACGTGGTCGGGGCGCGGCGTGGAGGTGTGGGGCAAGGACAGCTCGCTGCTGCAGGTGATCGTGTCGCTGCAGGGCCTCATCCTCAACGCGGAGCCCTACTTCAACGAGGCCGGCTACGAGAAGCAGAAGGGCACGCAACAAGGCACGGAGAACTCGCGCATGTACAACGAGATGGTGCTGCTGAAGCTGGTGCAGTCGATGACGCGCATGGCGAGCAACCCGCCCGAGCCCTTCCGCCGCGAGGTCCACGCGCACATGCGCGCGCACGCGCACACGCTCTGCCAGCGCCTCGAAGGTCTGGCGGCCCTGTCCGCCGGCAAGGAGACGGACGTCCCGGCGCCGGAGTACCCGCTGGTGCCGGCGTCGCGCGGGTTCTGCCTCACGCTGCGCTCGTCGCTGGCCGCCTTCCGCGCCGCGCTGCGCCGCAACGACATCGCCGTGCCCGAGCCCAGCGAGCCCACCGCCCCCTCCGCCCCCACCGCCCCCACCGCCGCGTCGCCCGAACCTACACCCGGCGAGTTATAG
Protein Sequence: MCWPQDLYKVGEYDSEDGELWGSEGSASDDSWETQSSAHDAEPPTPTDQPPKPTAQLAIATAEHAEVDVEMPENALAGGESSSVPRLLEPRVAAHIERGRVAMRRLEEMFAKHPTLQSQEVSRALAAVPRLLEPRVAAHIERGRVAMRRLEEMFAKHPTLQSQEVSRALAAEPRLLEPRVAAHIERGRVAMRRLEEMFAKHPTLQSQEVSRALAAVPRLLEPRVAAHIERGRVAMRRLEEMFAKHPTLQSQEVSRALAAEPRLLEPRVAAHIERGRVAMRRLEEMFAKHPTLQSQEVSRALAAEPRLLEPRVAAHIERGRVAMRRLEEMFAKHPTLQSQEVSRALAAEPRLLEPRVAAHIERGRVAMRRLEEMFAKHPTLQSQEVSRALAAEPRLLEPRVAAHIERGRVAMRRLEEMFAKHPTLQSQEVSRALAAEPRLLEPRVAAHIERGRVAMRRLEEMFAKHPTLQSQEVSRALAAEPRLLEPRVAAHIERGRVAMRRLEEMFAKHPTLQSQEIMRKLLNLYKDCRFLDRLMGTSFFHEDHFLGLLERVRERGASTPRAGERRVHEQLARLFSQEPECELPPADDHTGIDDTKPIITVEMMQVEQMVKNNKPVFGLNVNFQPELPSISDTGLAKEPAAETTDARGSCASAVCAEEPEGASRNVCYKLCALIHAQLVKAHAEVSRRRPQELAEFLNSLLKKSTEDKLPYIFTVQYGALVVSMAEEDKPAEAKDEAAKSDTSATTVETAPLATGEGELEPEETPEPVVGGSEAVEGGEGFCVIESAPVGHRFRLSMLQPSEPRSFYSAVKREIKLLKSDLPPGVWVRGFEDRIDLLSVMIAGPAKTPYEDGLFVFDVQLGGEYPRAPPLCHYHSYCSDRLNPNLYEDGKVCVSLLGTWSGRGVEVWGKDSSLLQVIVSLQGLILNAEPYFNEAGYEKQKGTQQGTENSRMYNEMVLLKLVQSMTRMASNPPEPFRREVHAHMRAHAHTLCQRLEGLAALSAGKETDVPAPEYPLVPASRGFCLTLRSSLAAFRAALRRNDIAVPEPSEPTAPSAPTAPTAASPEPTPGEL

Similar Transcription Factors

Sequence clustering based on sequence similarity using MMseqs2

100% Identity: iTF_01501103;
90% Identity: iTF_01501103;
80% Identity: iTF_01501103;