Basic Information

Insect: Aspidiotus destructor
Gene Symbol: -
Assembly: GCA_035079395.1
Location: JAVHKZ010000002.1:57672399-57676355[-]

Transcription Factor Domain

TF Family: Homeobox
Domain: Homeobox
PFAM: PF00046
TF Group: Helix-turn-helix
Description: This entry represents the homeodomain (HD), a protein domain of approximately 60 residues that usually binds DNA. It is encoded by the homeobox sequence [7, 6, 8], which was first identified in a number of Drosophila homeotic and segmentation proteins, but is now known to be well-conserved in many other animals, including vertebrates [1, 2], as well as plants [4], fungi [5] and some species of lower eukaryotes. Many members of this group are transcriptional regulators, some of which operate differential genetic programs along the anterior-posterior axis of animal bodies [3]. This domain folds into a globular structure with three α-helices connected by two short loops that harbour a hydrophobic core. The second and third form a helix-turn-helix (HTH) motif, which make intimate contacts with the DNA: while the first helix of this motif helps to stabilise the structure, the second helix binds to DNA via a number of hydrogen bonds and hydrophobic interactions, which occur between specific side chains and the exposed bases and thymine methyl groups within the major groove of the DNA. One particularity of the HTH motif in some of these proteins arises from the stereo-chemical requirement for glycine in the turn which is needed to avoid steric interference of the β-carbon with the main chain: for cro and repressor proteins the glycine appears to be mandatory, while for many of the homeotic and other DNA-binding proteins the requirement is relaxed.
Hmmscan Out: # of c-Evalue i-Evalue score bias hmm coord from hmm coord to ali coord from ali coord to env coord from env coord to acc

1 14 0.0007 0.21 11.9 0.3 4 49 15 60 13 62 0.95

2 14 0.1 30 5.0 0.1 26 54 138 166 122 168 0.85

3 14 0.016 4.7 7.6 0.1 15 56 186 227 179 228 0.92

4 14 0.0012 0.35 11.2 0.0 8 47 275 314 271 315 0.92

5 14 1.6e-11 4.6e-09 36.4 4.2 1 53 332 384 332 386 0.97

6 14 0.00014 0.042 14.1 0.2 27 55 458 486 454 488 0.90

7 14 3.2e-05 0.0095 16.2 0.0 6 48 544 586 542 588 0.92

8 14 4.2e-08 1.2e-05 25.5 0.1 5 52 607 654 606 657 0.96

9 14 4.6e-07 0.00014 22.1 0.9 11 52 689 730 680 731 0.94

10 14 0.0016 0.46 10.8 0.2 13 54 816 857 808 860 0.92

11 14 4e-15 1.2e-12 47.9 0.2 9 53 877 921 871 923 0.95

12 14 1.8e-08 5.4e-06 26.6 0.0 8 53 1057 1102 1054 1106 0.91

13 14 3.1e-09 9e-07 29.1 0.1 2 53 1177 1228 1176 1230 0.97

14 14 3e-09 8.8e-07 29.1 1.0 7 54 1245 1292 1243 1293 0.96

#	of	c-Evalue	i-Evalue	score	bias	hmm coord from	hmm coord to	ali coord from	ali coord to	env coord from	env coord to	acc
1	14	0.0007	0.21	11.9	0.3	4	49	15	60	13	62	0.95
2	14	0.1	30	5.0	0.1	26	54	138	166	122	168	0.85
3	14	0.016	4.7	7.6	0.1	15	56	186	227	179	228	0.92
4	14	0.0012	0.35	11.2	0.0	8	47	275	314	271	315	0.92
5	14	1.6e-11	4.6e-09	36.4	4.2	1	53	332	384	332	386	0.97
6	14	0.00014	0.042	14.1	0.2	27	55	458	486	454	488	0.90
7	14	3.2e-05	0.0095	16.2	0.0	6	48	544	586	542	588	0.92
8	14	4.2e-08	1.2e-05	25.5	0.1	5	52	607	654	606	657	0.96
9	14	4.6e-07	0.00014	22.1	0.9	11	52	689	730	680	731	0.94
10	14	0.0016	0.46	10.8	0.2	13	54	816	857	808	860	0.92
11	14	4e-15	1.2e-12	47.9	0.2	9	53	877	921	871	923	0.95
12	14	1.8e-08	5.4e-06	26.6	0.0	8	53	1057	1102	1054	1106	0.91
13	14	3.1e-09	9e-07	29.1	0.1	2	53	1177	1228	1176	1230	0.97
14	14	3e-09	8.8e-07	29.1	1.0	7	54	1245	1292	1243	1293	0.96

Sequence Information

Coding Sequence: ATGTACTATGTACATTTCTTCGCAGGTTACCAAGGGAATGCTCGTTTTGTTTTGAACACGAATCAGTTGATGCAGCTTCGACGATTGTCCTCCGATAAGAAGAGTCTCACTGCTGCCGAACTAAATACCATAGCCGAAGTATCGAAACTATCTTACGCAAATTGTCGTTTGTGGTATCAGCAGAACGGCGTTGTTGTTCCCCCCGAAGTAAAATCGGATGCGACTCGTGTGAAAGTTGAGGAAAGAAACGTCAAAGTGGGCTTCGCAATTATTGAAAAACATGGTAATCTAAGCGATTCGCAAAGACGCGCCAAGATGTTTATGTCTTCTCAGAGGCGCTCTTTCTTTTACAACCTTCCCTACGAAGATCAATTGTATCTGTTACGTAAGACTGAACACATGACATCGACGTCACATCAGCTAGCTGAAGAGATGAGCCTCAAATTGAAATTACCCGTAGATAAAATTTCCGCGTGGTTGAAACAACGGCGCAAACgcattttgaaagttgaagctGACTCCGACGTGAAAGTTTCGAATGTGAAATCAATTTTGCTCTGCGCCGAATTCGCTTGCGACAAAGAAATTGACGAAGATAAAGCTCTCATTCTCGCTTTCTGGTTCAACCTTTCGAAAAAAGCCATTTTAGGTTGGTACAAGAAGCAACAAGCGCAGTACAGATTTCGCGAAAAACAGAAAGCAACGAAAGATGTCGTCGTCGAGGACAAACCGAAACCAACAGCCATAAAAGTTGATAGCTCTAAATTACCGGTGGTATCATTTTCTAAAACCGAGGAGGACCTTTACGGTAATCAGAAAAAAACGCCGGCGCAACTTAATGTGCTTTTCGAAGCGTTCAAAAAGTATTCCGGTAAATTATACTCTCACATCGACGAACTCGCGAAACAAACCGGTCTAAGTGAGGGCGCAGTTCGTGATTGGATCGGCAAAACAAACGGCGTCTTGCGAACAAAAACAATGACCACGGTTACGAAAAAACTACGCGAGAATTTTACAACCGCCCAAGTGCGCGCATTGCAAAAAGAATATCGTAAACGAAAATACATTACTCGCAATGAAGCCAATGAAATCGCCTTGTCCACGAACCTGAATTCTAGTAAGGTAATGCAGTGGTTCAACAGTCGCAGAGTGCATGAACTCTTTTCGCACTATCCATCGTCCGcgtcaaaaaatggaaattcggGTCAACATATTACAGAAAGGGAGACGTCGCCGCCGCCGCCCCCGGACTCAGGTATGAGTCGCGTGGTCATTCAGAAGTCGTCGAGCAAACGACGCGGCAATCGAGGCAATGGCATTCCCGCCTTCAAAGTGTTACGTCTGTTGAAGGATCGTCGACGGTGCGGAAATAAAAAAGCTTTCTCTAAATTGGCCAAAGAACTCGGTTTACACGAGAAGCAGATAAGTTCTTGGCTAAGAAATAAGCAGTACCGAGAACAGATGATACATCGTGCTAAACTCGTGTACGGCGAAGCGTTGAAGGATCACGAGGATACCTCAACTGAAAATCGTCCTACTGCAAGTTCCAATCTTCTCGTCCAATTAACGAGTGATGAGGATTTGAAATCATCTTCGAACGAACCTATTCTCGCTTCGCCTGAAGATACAATGACGACGGGTATTCAACACTCCTGCTTATTCAACGCCTACAAAGAATCGAGAAGTTTGAGCGAAGCTCGCATTCAAGAGTTGAGTGATCGCTCAAATATGGacaagttgaaaataaaaaattggtgGAACGCGATAGGTAAGCATATGCGTCGAAAAAATATAGAGGTTCTCGAAACTTTTTTGATGACAAGCTGTAATGACGAACAacgtgaaaaattgattaactTGTATTCCAAAGCAAGGTACTATTCTAAAGCCTATCTAACGCGGATGGCCGAGCAGATCGGTATGAACTCAAAAACCGTTCATAGTTGGTTCATTAATGCGCGTCTTTATGAATTAAAAACTGGCGCAAAATTCAAGAGAACATCGACCTCACATAGTGACGTAGCCTGTGAGGATACAGCCTTCACATCGAATTTGGCGTGGCCTGAAATTCAGAAATTGAAACAAGAATTCCAAAAGGACGCAACAATGACGGACGCACGCGCCAGGTCATTGGCGATTCGTCTGAAAGTTCAATgcgataaaataaaagaatggtTTGAGAACAGACAACAATTCATCACAGAATGCAGCGAGAAAATAACTGACGATCATACAAATGCAGGCAACAGTAGCAGTGTAGATTACGAAGTGACCGTTGAGGAGGAAGTTATTGACGCTGAACCAACGACTGGCAATAACGAGACTTTACCTTCGGTACTCGTTCGACTTCCAAAAATTACTCCTAACTCGTTGAATGCCCCTTCGTGTTCTGAAAATTTCACGAGCGCATCTCAAGAGACGCAAATCAATCATTCCCGTCCAAAAGAACTTCTTTTCAAAGAGTTTCTTAAAGGATCGCGATTAACACCAGCGCGTTTGCAGCAGATTGCCTATGCCTCAAACATGGATCAAAAGCACATTTGTAAGTGGTTCAGTTGGTTGCGCTCAAAAGTGGCCAAACTCTCTGAAGACGTGCTCTCCGACAATTACCGTAATGAGAATTTAATTGACGAGCAAGTAAATGTTCTTGAAAGTGAGTTCCTAGTTACTCCTTATCCTGATCAGGAGACGAAAGAGACATTAAGCCAGCAATTGGGTGTATCTCGCGCTGTAGTGAAAACGTGGTTCGCTAATCGGAGATACTATGAAATATTGACAAATAGCGTTGTACCCGCATTTTCTGTTCCTACTATGTCTAAACTTGGTGTGGACTTCAAACCAGTCATCACATCTATATCGAGTGCCAAACAATTAAGCAATGAAATTCACGTGCATGGTGAAGAAGGGGTGCCATTTGATTCAGAGTCAATAGAGCGTGATGAATTATTAAACTCGTACGAGTTTAGTTCGCTAGACTTTGATAGGATAGATGTTCTGATGACAGAAGAACCTCAATTGGAATGTGCCCCCCTTTCATCATCGAGTCGTTTGCGTTACTTCGAACCATTGAATGAAAATCTCGAGCCGAGTATGTCAGAGAATCTGGATAATCTGTTTTGGTACATGAGTAGCTGTCCGAGCAAAGGCCTCGATAGCTCATCCGATCTATCAGAAGCCGATATTGTCGTCTTGGAGGGCATGTACGAGAAATGTCCGAAACCAACGCTCACCAAGATACATGAATTCGCGAAACGACTTCTGGTGAGTGAACAGGTCGTTTACTGGTGGTTTGTTCAACGTCGCAATCTTACAAAAATGGAGGAAACGCGCGACGGAAGTAAGGTTATTGTGATTTCGAGTCAGGAATTTGTGCCGAgtgatgaaattataaaatctgatttcaaagtttcgtctgaaaaatcagaaaaatactCTTGTAAAAATATCAGCGATTCTGTGGCCAACTCTCGTCAGTCAGATAGTACCAATAAGAATGAACTGTCAACATCCGCACGATTGGCTtcatgtaaaaagaaaaactcccTGTCCAGTCATCAGCGTTTAATTTTGTTAaacgaatttaaaaaattgaattttatatctcaatcaaaagccaaagctattGCCGCCGATATCGGCGTGCCTTTAAGAACTGTGAAGACGTGGTTCCATAAGCGGAGACAGCTTTTAAATATCGCCGAGCCAGCTAATTTAAAACCTATCACAGAAATGCTGAGCCCAAATCAACTCGTGACCTTGGAATTGGAATATCGTTCCGATCAAAAAGTGACAAAATTACGTCTACAAGAATTAGCTGCACGTTtgaatgtttctttgaagtccATAATCTTGTGGTTTAAAGAGCGAAAACAACAGACTGTTCAACTTGAAAAGCCGCAGCAATTGTCGGAAGTTATAAATGAGAATGTGCAGCCACTATCCAAAATGGAAGAATAa
Protein Sequence: MYYVHFFAGYQGNARFVLNTNQLMQLRRLSSDKKSLTAAELNTIAEVSKLSYANCRLWYQQNGVVVPPEVKSDATRVKVEERNVKVGFAIIEKHGNLSDSQRRAKMFMSSQRRSFFYNLPYEDQLYLLRKTEHMTSTSHQLAEEMSLKLKLPVDKISAWLKQRRKRILKVEADSDVKVSNVKSILLCAEFACDKEIDEDKALILAFWFNLSKKAILGWYKKQQAQYRFREKQKATKDVVVEDKPKPTAIKVDSSKLPVVSFSKTEEDLYGNQKKTPAQLNVLFEAFKKYSGKLYSHIDELAKQTGLSEGAVRDWIGKTNGVLRTKTMTTVTKKLRENFTTAQVRALQKEYRKRKYITRNEANEIALSTNLNSSKVMQWFNSRRVHELFSHYPSSASKNGNSGQHITERETSPPPPPDSGMSRVVIQKSSSKRRGNRGNGIPAFKVLRLLKDRRRCGNKKAFSKLAKELGLHEKQISSWLRNKQYREQMIHRAKLVYGEALKDHEDTSTENRPTASSNLLVQLTSDEDLKSSSNEPILASPEDTMTTGIQHSCLFNAYKESRSLSEARIQELSDRSNMDKLKIKNWWNAIGKHMRRKNIEVLETFLMTSCNDEQREKLINLYSKARYYSKAYLTRMAEQIGMNSKTVHSWFINARLYELKTGAKFKRTSTSHSDVACEDTAFTSNLAWPEIQKLKQEFQKDATMTDARARSLAIRLKVQCDKIKEWFENRQQFITECSEKITDDHTNAGNSSSVDYEVTVEEEVIDAEPTTGNNETLPSVLVRLPKITPNSLNAPSCSENFTSASQETQINHSRPKELLFKEFLKGSRLTPARLQQIAYASNMDQKHICKWFSWLRSKVAKLSEDVLSDNYRNENLIDEQVNVLESEFLVTPYPDQETKETLSQQLGVSRAVVKTWFANRRYYEILTNSVVPAFSVPTMSKLGVDFKPVITSISSAKQLSNEIHVHGEEGVPFDSESIERDELLNSYEFSSLDFDRIDVLMTEEPQLECAPLSSSSRLRYFEPLNENLEPSMSENLDNLFWYMSSCPSKGLDSSSDLSEADIVVLEGMYEKCPKPTLTKIHEFAKRLLVSEQVVYWWFVQRRNLTKMEETRDGSKVIVISSQEFVPSDEIIKSDFKVSSEKSEKYSCKNISDSVANSRQSDSTNKNELSTSARLASCKKKNSLSSHQRLILLNEFKKLNFISQSKAKAIAADIGVPLRTVKTWFHKRRQLLNIAEPANLKPITEMLSPNQLVTLELEYRSDQKVTKLRLQELAARLNVSLKSIILWFKERKQQTVQLEKPQQLSEVINENVQPLSKMEE

Similar Transcription Factors

Sequence clustering based on sequence similarity using MMseqs2

100% Identity: -
90% Identity: -
80% Identity: -