Basic Information

Insect: Pseudococcus viburni
Gene Symbol: -
Assembly: GCA_033439095.1
Location: JAVBJF010000016.1:1116688-1121200[+]

Transcription Factor Domain

TF Family: Homeobox
Domain: Homeobox
PFAM: PF00046
TF Group: Helix-turn-helix
Description: This entry represents the homeodomain (HD), a protein domain of approximately 60 residues that usually binds DNA. It is encoded by the homeobox sequence [7, 6, 8], which was first identified in a number of Drosophila homeotic and segmentation proteins, but is now known to be well-conserved in many other animals, including vertebrates [1, 2], as well as plants [4], fungi [5] and some species of lower eukaryotes. Many members of this group are transcriptional regulators, some of which operate differential genetic programs along the anterior-posterior axis of animal bodies [3]. This domain folds into a globular structure with three α-helices connected by two short loops that harbour a hydrophobic core. The second and third form a helix-turn-helix (HTH) motif, which make intimate contacts with the DNA: while the first helix of this motif helps to stabilise the structure, the second helix binds to DNA via a number of hydrogen bonds and hydrophobic interactions, which occur between specific side chains and the exposed bases and thymine methyl groups within the major groove of the DNA. One particularity of the HTH motif in some of these proteins arises from the stereo-chemical requirement for glycine in the turn which is needed to avoid steric interference of the β-carbon with the main chain: for cro and repressor proteins the glycine appears to be mandatory, while for many of the homeotic and other DNA-binding proteins the requirement is relaxed.
Hmmscan Out: # of c-Evalue i-Evalue score bias hmm coord from hmm coord to ali coord from ali coord to env coord from env coord to acc

1 14 0.0051 1.3 9.4 0.1 4 47 17 64 14 70 0.89

2 14 0.7 1.8e+02 2.5 0.0 26 47 121 142 109 146 0.86

3 14 0.00046 0.12 12.7 0.0 4 49 154 199 152 202 0.92

4 14 1.6e-07 4e-05 23.8 0.4 2 55 247 301 246 303 0.92

5 14 2e-09 4.9e-07 29.9 0.1 8 53 318 363 314 367 0.95

6 14 1.2 2.9e+02 1.8 0.0 14 47 486 519 480 526 0.86

7 14 5.4e-05 0.014 15.7 0.0 4 50 589 635 586 636 0.88

8 14 5.8e-12 1.5e-09 38.0 0.2 7 53 657 703 655 705 0.95

9 14 3.6e-12 9.2e-10 38.7 0.9 7 53 766 812 764 815 0.95

10 14 2.6e-07 6.6e-05 23.1 0.3 11 48 862 899 858 902 0.95

11 14 4.9e-10 1.2e-07 31.8 0.2 8 53 924 969 918 971 0.94

12 14 9e-06 0.0023 18.2 0.0 7 52 1108 1153 1103 1154 0.92

13 14 7.6e-09 1.9e-06 28.0 0.3 2 52 1265 1315 1264 1321 0.90

14 14 9.9e-06 0.0025 18.0 0.4 9 54 1337 1381 1333 1384 0.86

#	of	c-Evalue	i-Evalue	score	bias	hmm coord from	hmm coord to	ali coord from	ali coord to	env coord from	env coord to	acc
1	14	0.0051	1.3	9.4	0.1	4	47	17	64	14	70	0.89
2	14	0.7	1.8e+02	2.5	0.0	26	47	121	142	109	146	0.86
3	14	0.00046	0.12	12.7	0.0	4	49	154	199	152	202	0.92
4	14	1.6e-07	4e-05	23.8	0.4	2	55	247	301	246	303	0.92
5	14	2e-09	4.9e-07	29.9	0.1	8	53	318	363	314	367	0.95
6	14	1.2	2.9e+02	1.8	0.0	14	47	486	519	480	526	0.86
7	14	5.4e-05	0.014	15.7	0.0	4	50	589	635	586	636	0.88
8	14	5.8e-12	1.5e-09	38.0	0.2	7	53	657	703	655	705	0.95
9	14	3.6e-12	9.2e-10	38.7	0.9	7	53	766	812	764	815	0.95
10	14	2.6e-07	6.6e-05	23.1	0.3	11	48	862	899	858	902	0.95
11	14	4.9e-10	1.2e-07	31.8	0.2	8	53	924	969	918	971	0.94
12	14	9e-06	0.0023	18.2	0.0	7	52	1108	1153	1103	1154	0.92
13	14	7.6e-09	1.9e-06	28.0	0.3	2	52	1265	1315	1264	1321	0.90
14	14	9.9e-06	0.0025	18.0	0.4	9	54	1337	1381	1333	1384	0.86

Sequence Information

Coding Sequence: ATGCTTTTGAATTTGCAGTGTCAGACAAAAATTGTTCATAGCGCAGTTCGTATAACAATAACCAGAGATCAAGCACTCAGATTACAAAAACTCTACCACGAGAAACCCGCCGGCCAGAGAAAATTCACCGACAAAGAAATCCGCAGAAACGCTATTCGCCTGAAAATTCCAGCTGTGAAGATACGCTATTGGCTGGGAAAACGAAATGCCCTGGCCGATGAACCTAATCCGCCGCCATCTACAGCTACATCGTCAGCTCAGCCCATCGACATCGATAAACCGCGTTGTAAGCTATTCGCCGATCTGTCGTTTGAGAAAAAGGTCGCCCTGTTGAGGAAGACTCGTACGGCGACCAAATTTTCGGTTCGTCTGACCCAAGATATCTCGCGAGAATTCCAAATACCCGAAAGTCGGGTGCATAATTGGCTCAGGTATAAAATATATCGTAATTTGCATACGAAAAGATCGCTTACTGTTCAGGAATTGGCAGCTTTGAATGGTAAATTTGTCGAGTTCGATTATTTGGACGACGATACGGCCCTCGTTTTGGCTGATCGATTGAACGTTAGTACGTCTGTGATAAAAAGAGCTTTCCAGCGATGTAAGCCATTGTCGCAGAATGTTACACCGGTCATCGAAGTGAAGAAATTGAATCTGCCGGCCTCTGTGACCATTACGATGGTCCCTAAGGTTACTCCTGATACGGTTACTCCTGATACCTCCGCATCGAACGAGCCGAAAAAGAAGAAGATTTTTAAGGTCGAACAGAAGAATACGTTATTCGAAGCGTTTCGAGAGTCTCCCACTTTGACCAAACCAGATAAGGTAGCTGAGATCGCCGAAGCCACCGGATTGTCCACTATGCAGGTTACCAAATGGTTGAGCGTGTTTCGTGCCAAATGGGCGCAGAGTAACGAATCAGGCTTGAAGAAGGCATTGACTCGAGGCGTGAACTCGGACCAGTTGGTGGCGTTGGAGAAAGCCTACAGAGAAGACAGATTCTTGACCAGCTTCCAGTTGAACGAATTACCTAAAACGGTCAGTATGAGTAAGCAACCCATCCAGGGTTGGTTTTCTAATCGTCGCATTTACGAAATTCGTTCCAACGATAAAGATCTCGTCAACATTGGCCCGAAAACCGTCCCAACGAGCACAGATTTGAATCACATTACGATCCTGAAACCAGTCATAACCATATCTCAGTCAAAGGTACATCAGCAATCTTTAAAAGCTCAACCTGACGTAGAAAGCACcgacgaatttttcgaatcgtTGAGCAAAGAGCAAAAACTGCATTTAAAATCGGCCTGTAAAAATTACAACGTTTCTTATAAGAGATTATCGCGAGCTCTCGGCCTACCCCTCGACAAGGTCCAGCATTTCATCAGAAGTTATCGCCTacaacataatattttcagaacAAGTAATTTAGCGTTACCGGAACGCGTACAAAAAACATTACTCAACCAttacctgaaatttggtaaaatttcgacGAAAACCAGCGTCATATTGGCGAAACGTTTGAAAGTACGCCCGGAACAGATCATGGGTTGGAATAAACATCACACCAAACGACTCCTCCAAGTTGGGGGAATAGTCAAATCGCCACCGACGATTGCTGCCGAACCAGTCGAACCGATCGAAACCCCTGTCGAAGTCGAATCTGTCGAAAATGGCGAACAAGAGTCTGAGCCGTCGGCCGAAATTCCAGCTCCGGTCCGCAaatcgttttctcaaaaagattACGGCAATCGAGGTTCGCGTTATTTCGCCTCTGCGACCGCCAAAGCGGTGTTGttcgaagaatttaaaaaatcgcccACAGCAGCTTCCACCgatatcaaaaaaatcgccaaaatggTGAAATTGACCCCGATGCAGGTCCGCAAATGGCTCTACAATTACGGTAAATCCCTCAGCGAGCAGACCAAATCGAAAGTCGTGGCTTGTCTGAATAATCCGCAGATCAGCGACGAAGCTCGAGCCAGGCTGGAAACGGAATACAGAAAATGTTCGTATATGGAGGAATCGGATATGGAAAATTTGGCCCAGCAATTCGGCTTGACCAGGAGACAGGTAGCTAGCTGGTTTATCAACGCTCGTTATTACGAAGCTCTCGTCGGCCGATCTCCTGGCGACGAAAATTTAACTCGTGCTCAAACGCCGCCGAAGCCTAAACCTTCATTACCTCGTATCGCAGATGATTCCAGTAGCTCTGCTGGTACCAGCCGAACTCGTCGTCGTAGTTTACCGGACGAGTCGAGTCCGACCATCCagctgaattttctcaacttgaccATCAAACAGATGGAAATTTTGGTCACCGAATTCGAATCGAATCCTAATTTGAGCGACGAACGCGCCGCGAATATGGCCAAACGTATCAAAATCACCAAAGATCGTATCAAAGCGTGGTTCGAGAACCGTCGACAAGAGCTACAACTCCAATCTTCCGACGATGCGGAACTAGCGAAACAGAAAATACCTCCTATTAAAATCATCATgccgaaattttccaattccgaCGATCAAATGCCTACGATAGCTTCGCCTGACTCGAGCTCCAAGAAAGTCCCCGTTCAGCAGAACACTCTGTTCGAGGAATTCAAACGAAGCTCAAAATTGACCAGCGAACGATTGATTAAAATCAGCGCAGAAACCAACCTATCTGGCAAACAAATCTCAGCCTGGTTCAACTGGCTAAACTATAAATTGTCGACGATTCCGAAAGAAAGCCTCTCCGAAGAAAATCGTAACAAGTATTTATCTCTGCAGCAGATCGAAGAATTGGAAAGGTATTACGCCGAAAATCGATACGCCCACAGAGCCGCTCGCGAATCTCTCTCCATATCTTTGGACGTTCCTAAAAGCATCGTAAAATCGTGGTTCGCTAGCAGACGTTATTACGAAATATTATCTCAAAACGGAGCCATCGAAGACCGCAACTCGCCCGAATACACAAATTTTGCCGAAGCAGATCCTGGTCAAAGTGAAACCGTCATCGACTACGACTGGGAAGCTGATCCAGCTGCCGTCGATCCCCTCGAACAGAAATTCGACGTTCAGCCTCTCGAGGTCGATCCGTTATTGAATTCTTACTGCAGCGAAGAACCGATCCAAGCTGAAATGGACGTAAACTTTCAGCTCTCCGCGAATACCGCCTTCGACGAAGATTTGACCAGTCTGCCTTACACGCCTCGAGAACGCCTCGTTACGCCGCTGGGTGACAATTTAGAACCGTCGGAAGAAAATGTCGAACGATTGTTCTGGTTCGTCAGCAAAACGCCCAACACAATTAACGAGAAATACAATCAAGAAATCGACGAAGCCAAGACCGCTATTCTAGATAGCGAATTTGGTAAATACCCGTGGCCCGATCTGGACCGAATTTCTCAGCTGTCAGCTCAATTGCTCGTATCGGAACCGAAAATCCATTGGTGGTTTATTAAAAAACGTTGTTTCCTGACTAAAACCATACTGACATTACCGGCGCCTACGGTTTCGAAACCGAAACCAGACCCTAAAAACGTGCTGATCGATTTAACCGACGACGATCATCCGGAGAAACCCGGAGAATTCGAATTCGTTACTTTGGACGAGACGACTCAGATCAAAAGAGAAGAAGAGCCGTTGAACGAAAATGACATTTTACAGAATGGCGACCCTTTCGAAAATAACGTCATCGAGAAATCATTCGACAACGAAGAACCGCCTTACGAGTCGAACGAATCGACTGAAAATGCCAACACTACTCCGAACTCTTCAGCCTCATCGTCggttaaaaagaaaaaagtcaaGATTCCGTTGACGTCTCATCAACGTGCCATTTTAATGCAAGAATATAAACGTAACAAGTTCATATCGAGTTCCCAGGCTCGTATCGTGGCTCAAGATTTAGGCCTGACCGCAActcgaattgaaaattggttCGAGTCTATGAGAAAATCAGCCGCGAAGAAGAAGGCTGGTCTTACGGAGGCCTCCGTTTCTGTCAAAAGTCTCAGTCCCGAGCTCGAATCTAGCCTCGAAGCGGAGTATTTGAAAAGTGCCAACTTGAGCGTCAAAAGAGCCAAAATGATTGCcctgaaattgaaaactaagAAGAAAACTGTCAAGAAGTGGTTCATCGAACGAGCCAAGCGAAAGGACGAGTAG
Protein Sequence: MLLNLQCQTKIVHSAVRITITRDQALRLQKLYHEKPAGQRKFTDKEIRRNAIRLKIPAVKIRYWLGKRNALADEPNPPPSTATSSAQPIDIDKPRCKLFADLSFEKKVALLRKTRTATKFSVRLTQDISREFQIPESRVHNWLRYKIYRNLHTKRSLTVQELAALNGKFVEFDYLDDDTALVLADRLNVSTSVIKRAFQRCKPLSQNVTPVIEVKKLNLPASVTITMVPKVTPDTVTPDTSASNEPKKKKIFKVEQKNTLFEAFRESPTLTKPDKVAEIAEATGLSTMQVTKWLSVFRAKWAQSNESGLKKALTRGVNSDQLVALEKAYREDRFLTSFQLNELPKTVSMSKQPIQGWFSNRRIYEIRSNDKDLVNIGPKTVPTSTDLNHITILKPVITISQSKVHQQSLKAQPDVESTDEFFESLSKEQKLHLKSACKNYNVSYKRLSRALGLPLDKVQHFIRSYRLQHNIFRTSNLALPERVQKTLLNHYLKFGKISTKTSVILAKRLKVRPEQIMGWNKHHTKRLLQVGGIVKSPPTIAAEPVEPIETPVEVESVENGEQESEPSAEIPAPVRKSFSQKDYGNRGSRYFASATAKAVLFEEFKKSPTAASTDIKKIAKMVKLTPMQVRKWLYNYGKSLSEQTKSKVVACLNNPQISDEARARLETEYRKCSYMEESDMENLAQQFGLTRRQVASWFINARYYEALVGRSPGDENLTRAQTPPKPKPSLPRIADDSSSSAGTSRTRRRSLPDESSPTIQLNFLNLTIKQMEILVTEFESNPNLSDERAANMAKRIKITKDRIKAWFENRRQELQLQSSDDAELAKQKIPPIKIIMPKFSNSDDQMPTIASPDSSSKKVPVQQNTLFEEFKRSSKLTSERLIKISAETNLSGKQISAWFNWLNYKLSTIPKESLSEENRNKYLSLQQIEELERYYAENRYAHRAARESLSISLDVPKSIVKSWFASRRYYEILSQNGAIEDRNSPEYTNFAEADPGQSETVIDYDWEADPAAVDPLEQKFDVQPLEVDPLLNSYCSEEPIQAEMDVNFQLSANTAFDEDLTSLPYTPRERLVTPLGDNLEPSEENVERLFWFVSKTPNTINEKYNQEIDEAKTAILDSEFGKYPWPDLDRISQLSAQLLVSEPKIHWWFIKKRCFLTKTILTLPAPTVSKPKPDPKNVLIDLTDDDHPEKPGEFEFVTLDETTQIKREEEPLNENDILQNGDPFENNVIEKSFDNEEPPYESNESTENANTTPNSSASSSVKKKKVKIPLTSHQRAILMQEYKRNKFISSSQARIVAQDLGLTATRIENWFESMRKSAAKKKAGLTEASVSVKSLSPELESSLEAEYLKSANLSVKRAKMIALKLKTKKKTVKKWFIERAKRKDE

Similar Transcription Factors

Sequence clustering based on sequence similarity using MMseqs2

100% Identity: -
90% Identity: -
80% Identity: -