Basic Information

Insect: Apotomis turbidana
Gene Symbol: -
Assembly: GCA_905147355.1
Location: LR990291.1:7177311-7180178[+]

Transcription Factor Domain

TF Family: Homeobox
Domain: Homeobox
PFAM: PF00046
TF Group: Helix-turn-helix
Description: This entry represents the homeodomain (HD), a protein domain of approximately 60 residues that usually binds DNA. It is encoded by the homeobox sequence [7, 6, 8], which was first identified in a number of Drosophila homeotic and segmentation proteins, but is now known to be well-conserved in many other animals, including vertebrates [1, 2], as well as plants [4], fungi [5] and some species of lower eukaryotes. Many members of this group are transcriptional regulators, some of which operate differential genetic programs along the anterior-posterior axis of animal bodies [3]. This domain folds into a globular structure with three α-helices connected by two short loops that harbour a hydrophobic core. The second and third form a helix-turn-helix (HTH) motif, which make intimate contacts with the DNA: while the first helix of this motif helps to stabilise the structure, the second helix binds to DNA via a number of hydrogen bonds and hydrophobic interactions, which occur between specific side chains and the exposed bases and thymine methyl groups within the major groove of the DNA. One particularity of the HTH motif in some of these proteins arises from the stereo-chemical requirement for glycine in the turn which is needed to avoid steric interference of the β-carbon with the main chain: for cro and repressor proteins the glycine appears to be mandatory, while for many of the homeotic and other DNA-binding proteins the requirement is relaxed.
Hmmscan Out: # of c-Evalue i-Evalue score bias hmm coord from hmm coord to ali coord from ali coord to env coord from env coord to acc

1 18 0.77 3.8e+02 2.6 0.0 12 29 50 67 47 69 0.88

2 18 0.77 3.8e+02 2.6 0.0 12 29 102 119 99 121 0.88

3 18 0.77 3.8e+02 2.6 0.0 12 29 154 171 151 173 0.88

4 18 0.77 3.8e+02 2.6 0.0 12 29 206 223 203 225 0.88

5 18 0.77 3.8e+02 2.6 0.0 12 29 258 275 255 277 0.88

6 18 0.77 3.8e+02 2.6 0.0 12 29 310 327 307 329 0.88

7 18 0.77 3.8e+02 2.6 0.0 12 29 362 379 359 381 0.88

8 18 0.77 3.8e+02 2.6 0.0 12 29 414 431 411 433 0.88

9 18 0.77 3.8e+02 2.6 0.0 12 29 466 483 463 485 0.88

10 18 0.77 3.8e+02 2.6 0.0 12 29 518 535 515 537 0.88

11 18 0.77 3.8e+02 2.6 0.0 12 29 570 587 567 589 0.88

12 18 0.77 3.8e+02 2.6 0.0 12 29 622 639 619 641 0.88

13 18 0.77 3.8e+02 2.6 0.0 12 29 674 691 671 693 0.88

14 18 0.77 3.8e+02 2.6 0.0 12 29 726 743 723 745 0.88

15 18 0.77 3.8e+02 2.6 0.0 12 29 778 795 775 797 0.88

16 18 0.77 3.8e+02 2.6 0.0 12 29 830 847 827 849 0.88

17 18 0.77 3.8e+02 2.6 0.0 12 29 882 899 879 901 0.88

18 18 0.77 3.8e+02 2.6 0.0 12 29 934 951 931 953 0.88

#	of	c-Evalue	i-Evalue	score	hmm coord from	hmm coord to	ali coord from	ali coord to	env coord from	env coord to	acc
1	18	0.77	3.8e+02	2.6	12	29	50	67	47	69	0.88
2	18	0.77	3.8e+02	2.6	12	29	102	119	99	121	0.88
3	18	0.77	3.8e+02	2.6	12	29	154	171	151	173	0.88
4	18	0.77	3.8e+02	2.6	12	29	206	223	203	225	0.88
5	18	0.77	3.8e+02	2.6	12	29	258	275	255	277	0.88
6	18	0.77	3.8e+02	2.6	12	29	310	327	307	329	0.88
7	18	0.77	3.8e+02	2.6	12	29	362	379	359	381	0.88
8	18	0.77	3.8e+02	2.6	12	29	414	431	411	433	0.88
9	18	0.77	3.8e+02	2.6	12	29	466	483	463	485	0.88
10	18	0.77	3.8e+02	2.6	12	29	518	535	515	537	0.88
11	18	0.77	3.8e+02	2.6	12	29	570	587	567	589	0.88
12	18	0.77	3.8e+02	2.6	12	29	622	639	619	641	0.88
13	18	0.77	3.8e+02	2.6	12	29	674	691	671	693	0.88
14	18	0.77	3.8e+02	2.6	12	29	726	743	723	745	0.88
15	18	0.77	3.8e+02	2.6	12	29	778	795	775	797	0.88
16	18	0.77	3.8e+02	2.6	12	29	830	847	827	849	0.88
17	18	0.77	3.8e+02	2.6	12	29	882	899	879	901	0.88
18	18	0.77	3.8e+02	2.6	12	29	934	951	931	953	0.88

Sequence Information

Coding Sequence: ATGTACGTTGTAGTGTTCGAGAACATCGCCACTATCGAGTTCCCGCGCACCGCTACGACCGCAGCGGCCGCTGGCACGGGCACGCCGGTGGTGCCGCGGCTGCTGGAGCCGCGCGTGGCGGCGCACATCGAGCGCGGCCGCGTGGCCATGCGCCGGCTGGAGGAGATGTTCGCCAAGCACCCCACGCTGCAGAGCCAGGAGGTAGTGTTCCACACTCTTCTAGAACATTCACTCTGGTCGAGCTTCTATACTATACTGCTGGAGCCGCGCGTGGCGGCGCACATCGAGCGCGGCCGCGTGGCCATGCGCCGGCTGGAGGAGATGTTCGCCAAGCACCCCACGCTGCAGAGCCAGGAGGTAGTGTTCCACACTCTTCTAGAACATTCACTCTGGTCGAGCTTCTATACTATACTGCTGGAGCCGCGCGTGGCGGCGCACATCGAGCGCGGCCGCGTGGCCATGCGCCGGCTGGAGGAGATGTTCGCCAAGCACCCCACGCTGCAGAGCCAGGAGGTAGTGTTCCACACTCTTCTAGAACATTCACTCTGGTCGAGCTTCTATACTATACTGCTGGAGCCGCGCGTGGCGGCGCACATCGAGCGCGGCCGCGTGGCCATGCGCCGGCTGGAGGAGATGTTCGCCAAGCACCCCACGCTGCAGAGCCAGGAGGTAGTGTTCCACACTCTTCTAGAACATTCACTCTGGTCGAGCTTCTATACTATACTGCTGGAGCCGCGCGTGGCGGCGCACATCGAGCGCGGCCGCGTGGCCATGCGCCGGCTGGAGGAGATGTTCGCCAAGCACCCCACGCTGCAGAGCCAGGAGGTAGTGTTCCACACTCTTCTAGAACATTCACTCTGGTCGAGCTTCTATACTATACTGCTGGAGCCGCGCGTGGCGGCGCACATCGAGCGCGGCCGCGTGGCCATGCGCCGGCTGGAGGAGATGTTCGCCAAGCACCCCACGCTGCAGAGCCAGGAGGTAGTGTTCCACACTCTTCTAGAACATTCACTCTGGTCGAGCTTCTATACTATACTGCTGGAGCCGCGCGTGGCGGCGCACATCGAGCGCGGCCGCGTGGCCATGCGCCGGCTGGAGGAGATGTTCGCCAAGCACCCCACGCTGCAGAGCCAGGAGGTAGTGTTCCACACTCTTCTAGAACATTCACTCTGGTCGAGCTTCTATACTATACTGCTGGAGCCGCGCGTGGCGGCGCACATCGAGCGCGGCCGCGTGGCCATGCGCCGGCTGGAGGAGATGTTCGCCAAGCACCCCACGCTGCAGAGCCAGGAGGTAGTGTTCCACACTCTTCTAGAACATTCACTCTGGTCGAGCTTCTATACTATACTGCTGGAGCCGCGCGTGGCGGCGCACATCGAGCGCGGCCGCGTGGCCATGCGCCGGCTGGAGGAGATGTTCGCCAAGCACCCGACGCTGCAGAGCCAGGAGGTAGTGTTCCACACTCTTCTAGAACATTCACTCTGGTCGAGCTTCTATACTATACTGCTGGAGCCGCGCGTGGCGGCGCACATCGAGCGCGGCCGCGTGGCCATGCGCCGGCTGGAGGAGATGTTCGCCAAGCACCCCACGCTGCAGAGCCAGGAGGTAGTGTTCCACACTCTTCTAGAACATTCACTCTGGTCGAGCTTCTATACTATACTGCTGGAGCCGCGCGTGGCGGCGCACATCGAGCGCGGCCGCGTGGCCATGCGCCGGCTGGAGGAGATGTTCGCCAAGCACCCGACGCTGCAGAGCCAGGAGGTAGTGTTCCACACTCTTCTAGAACATTCACTCTGGTCGAGCTTCTATACTATACTGCTGGAGCCGCGCGTGGCGGCGCACATCGAGCGCGGCCGCGTGGCCATGCGCCGGCTGGAGGAGATGTTCGCCAAGCACCCCACGCTGCAGAGCCAGGAGGTAGTGTTCCACACTCTTCTAGAACATTCACTCTGGTCGAGCTTCTATACTATACTGCTGGAGCCGCGCGTGGCGGCGCACATCGAGCGCGGCCGCGTGGCCATGCGCCGGCTGGAGGAGATGTTCGCCAAGCACCCCACGCTGCAGAGCCAGGAGGTAGTGTTCCACACTCTTCTAGAACATTCACTCTGGTCGAGCTTCTATACTATACTGCTGGAGCCGCGCGTGGCGGCGCACATCGAGCGCGGCCGCGTGGCCATGCGCCGGCTGGAGGAGATGTTCGCCAAGCACCCCACGCTGCAGAGCCAGGAGGTAGTGTTCCACACTCTTCTAGAACATTCACTCTGGTCGAGCTTCTATACTATACTGCTGGAGCCGCGCGTGGCGGCGCACATCGAGCGCGGCCGCGTGGCCATGCGCCGGCTGGAGGAGATGTTCGCCAAGCACCCCACGCTGCAGAGCCAGGAGGTAGTGTTCCACACTCTTCTAGAACATTCACTCTGGTCGAGCTTCTATACTATACTGCTGGAGCCGCGCGTGGCGGCGCACATCGAGCGCGGCCGCGTGGCCATGCGCCGGCTGGAGGAGATGTTCGCCAAGCACCCCACGCTGCAGAGCCAGGAGGTAGTGTTCCACACTCTTCTAGAACATTCACTCTGGTCGAGCTTCTATACTATACTGCTGGAGCCGCGCGTGGCGGCGCACATCGAGCGCGGCCGCGTGGCCATGCGCCGGCTGGAGGAGATGTTCGCCAAGCACCCGACGCTGCAGAGCCAGGAGGTAGTGTTCCACACTCTTCTAGAACATTCACTCTGGTCGAGCTTCTATACTATACTGCTGGAGCCGCGCGTGGCGGCGCACATCGAGCGCGGCCGCGTGGCCATGCGCCGGCTGGAGGAGATGTTCGCCAAGCACCCGACGCTGCAGAGCCAGGAGGTAGTGTTCCACTAG
Protein Sequence: MYVVVFENIATIEFPRTATTAAAAGTGTPVVPRLLEPRVAAHIERGRVAMRRLEEMFAKHPTLQSQEVVFHTLLEHSLWSSFYTILLEPRVAAHIERGRVAMRRLEEMFAKHPTLQSQEVVFHTLLEHSLWSSFYTILLEPRVAAHIERGRVAMRRLEEMFAKHPTLQSQEVVFHTLLEHSLWSSFYTILLEPRVAAHIERGRVAMRRLEEMFAKHPTLQSQEVVFHTLLEHSLWSSFYTILLEPRVAAHIERGRVAMRRLEEMFAKHPTLQSQEVVFHTLLEHSLWSSFYTILLEPRVAAHIERGRVAMRRLEEMFAKHPTLQSQEVVFHTLLEHSLWSSFYTILLEPRVAAHIERGRVAMRRLEEMFAKHPTLQSQEVVFHTLLEHSLWSSFYTILLEPRVAAHIERGRVAMRRLEEMFAKHPTLQSQEVVFHTLLEHSLWSSFYTILLEPRVAAHIERGRVAMRRLEEMFAKHPTLQSQEVVFHTLLEHSLWSSFYTILLEPRVAAHIERGRVAMRRLEEMFAKHPTLQSQEVVFHTLLEHSLWSSFYTILLEPRVAAHIERGRVAMRRLEEMFAKHPTLQSQEVVFHTLLEHSLWSSFYTILLEPRVAAHIERGRVAMRRLEEMFAKHPTLQSQEVVFHTLLEHSLWSSFYTILLEPRVAAHIERGRVAMRRLEEMFAKHPTLQSQEVVFHTLLEHSLWSSFYTILLEPRVAAHIERGRVAMRRLEEMFAKHPTLQSQEVVFHTLLEHSLWSSFYTILLEPRVAAHIERGRVAMRRLEEMFAKHPTLQSQEVVFHTLLEHSLWSSFYTILLEPRVAAHIERGRVAMRRLEEMFAKHPTLQSQEVVFHTLLEHSLWSSFYTILLEPRVAAHIERGRVAMRRLEEMFAKHPTLQSQEVVFHTLLEHSLWSSFYTILLEPRVAAHIERGRVAMRRLEEMFAKHPTLQSQEVVFH*

Similar Transcription Factors

Sequence clustering based on sequence similarity using MMseqs2

100% Identity: -
90% Identity: -
80% Identity: -