Basic Information

Insect: Pseudococcus longispinus
Gene Symbol: -
Assembly: GCA_900064475.1
Location: FIZU01054973.1:21724-26226[-]

Transcription Factor Domain

TF Family: Homeobox
Domain: Homeobox
PFAM: PF00046
TF Group: Helix-turn-helix
Description: This entry represents the homeodomain (HD), a protein domain of approximately 60 residues that usually binds DNA. It is encoded by the homeobox sequence [7, 6, 8], which was first identified in a number of Drosophila homeotic and segmentation proteins, but is now known to be well-conserved in many other animals, including vertebrates [1, 2], as well as plants [4], fungi [5] and some species of lower eukaryotes. Many members of this group are transcriptional regulators, some of which operate differential genetic programs along the anterior-posterior axis of animal bodies [3]. This domain folds into a globular structure with three α-helices connected by two short loops that harbour a hydrophobic core. The second and third form a helix-turn-helix (HTH) motif, which make intimate contacts with the DNA: while the first helix of this motif helps to stabilise the structure, the second helix binds to DNA via a number of hydrogen bonds and hydrophobic interactions, which occur between specific side chains and the exposed bases and thymine methyl groups within the major groove of the DNA. One particularity of the HTH motif in some of these proteins arises from the stereo-chemical requirement for glycine in the turn which is needed to avoid steric interference of the β-carbon with the main chain: for cro and repressor proteins the glycine appears to be mandatory, while for many of the homeotic and other DNA-binding proteins the requirement is relaxed.
Hmmscan Out: # of c-Evalue i-Evalue score bias hmm coord from hmm coord to ali coord from ali coord to env coord from env coord to acc

1 16 0.016 4.5 7.5 0.5 3 47 32 80 30 86 0.81

2 16 0.16 45 4.3 0.1 29 48 135 154 123 161 0.86

3 16 0.00047 0.14 12.4 0.0 3 51 164 212 162 213 0.93

4 16 0.0043 1.2 9.3 0.4 7 55 286 335 280 337 0.87

5 16 2.6e-08 7.4e-06 26.1 0.0 7 53 351 397 348 401 0.95

6 16 7 2e+03 -0.9 0.0 31 46 480 495 477 504 0.82

7 16 0.022 6.4 7.1 0.0 11 47 518 554 508 558 0.89

8 16 0.014 4 7.7 0.0 25 50 661 686 637 692 0.81

9 16 2e-07 5.7e-05 23.2 0.1 8 53 709 754 707 756 0.93

10 16 0.018 5.3 7.3 0.0 26 50 807 831 800 839 0.85

11 16 3.2e-11 9.4e-09 35.3 0.3 7 53 854 900 852 903 0.95

12 16 5.1e-07 0.00015 21.9 0.1 15 49 955 989 950 991 0.94

13 16 2.1e-15 6.1e-13 48.7 0.2 7 54 1012 1059 1010 1061 0.96

14 16 3.3e-06 0.00096 19.3 0.0 7 52 1208 1253 1203 1254 0.91

15 16 2.3e-09 6.7e-07 29.4 0.0 1 51 1375 1425 1375 1429 0.95

16 16 1.1e-05 0.0031 17.6 0.3 12 56 1451 1494 1444 1495 0.87

#	of	c-Evalue	i-Evalue	score	bias	hmm coord from	hmm coord to	ali coord from	ali coord to	env coord from	env coord to	acc
1	16	0.016	4.5	7.5	0.5	3	47	32	80	30	86	0.81
2	16	0.16	45	4.3	0.1	29	48	135	154	123	161	0.86
3	16	0.00047	0.14	12.4	0.0	3	51	164	212	162	213	0.93
4	16	0.0043	1.2	9.3	0.4	7	55	286	335	280	337	0.87
5	16	2.6e-08	7.4e-06	26.1	0.0	7	53	351	397	348	401	0.95
6	16	7	2e+03	-0.9	0.0	31	46	480	495	477	504	0.82
7	16	0.022	6.4	7.1	0.0	11	47	518	554	508	558	0.89
8	16	0.014	4	7.7	0.0	25	50	661	686	637	692	0.81
9	16	2e-07	5.7e-05	23.2	0.1	8	53	709	754	707	756	0.93
10	16	0.018	5.3	7.3	0.0	26	50	807	831	800	839	0.85
11	16	3.2e-11	9.4e-09	35.3	0.3	7	53	854	900	852	903	0.95
12	16	5.1e-07	0.00015	21.9	0.1	15	49	955	989	950	991	0.94
13	16	2.1e-15	6.1e-13	48.7	0.2	7	54	1012	1059	1010	1061	0.96
14	16	3.3e-06	0.00096	19.3	0.0	7	52	1208	1253	1203	1254	0.91
15	16	2.3e-09	6.7e-07	29.4	0.0	1	51	1375	1425	1375	1429	0.95
16	16	1.1e-05	0.0031	17.6	0.3	12	56	1451	1494	1444	1495	0.87

Sequence Information

Coding Sequence: ATGATGGGAGTTGTGAGATTAGTCTATCATTtgcttatattttttcatatacgTTCGATACTAATCGATGTTAATTTCTGTTCAGATAGCGCAACTCGTATCACAATAACCAGAGAGCAGTCCCTCAAACTACAGAAGTTGTTCCGTGAAAAACCGGCCGGAAAGCGTAAATGGACCGATCAAGAAATCCGTAAAAACGCTTCTCGTCTGAAAATTCCGGCAGTAAAAATACGTTATTATTTAAAGCAACGTAACGCTTTGGCCGAGGTACCTAATCGAACCACTTCGTCCATGCCCATCGATGTGGAGAAACCTCGCAGTAAGATATTCAGCGACCTATCGTTCGAGAAAAAGGTCGCCTTGTTGAGAAAGACGCGTACGGCGACCACGACTTCGGTTCGCCTCACTCAAGAATTATCCGAAGAATTGCAAATACCCGAGAGTAAAATTTACAACTGGTTGAAGCACAAAGTACATCGAAACCTGCGCATGAAGAAATCTCTGTCTGTGCAAGAAACTGCGGCGTTAAATCAGAAATTCGCCGAATACGATTATCTGGATGACGACAGCGCTCTCCTGTTGGCTGATCGGTTTAACGTCAATCCTAAAGTGATTAAGAAAGCTTTCCAACATCGTACACCCGTCTCGGTACCGAATGCCAAGCCAGTTACACCTGTTTCGTCGCAGAATGTCAAACCAGTGATCGAAGTTAAGAAATTATTGCAGCTGCCCGCATCTGTGACGATCACGCCGGTTCCAAAAGTTACTACTGCTCCTAAAGTTACTCCTGTTCCGAAAGTTGCTACGGTTGCATTGTCCAAATCGAAAAGCGGCACCAAGAAGAAAGCCAATTTTAAAACGGTCGATCAAAAGAACGCGTTGTTCGAGGCTTTTCGTCAGTCCCCAtctttgaccagaaatgaagCTATGGCCGAGCTCATGGAGAAGACCGGACTGATCGCTCCGCAGATTTGTAAATGGTTGAGCGTGGTTCGAGCCAAATGGGCGCAGAGTACCGAAAGCAGCCTGAAGAAAGCATTAACCCGAGGCTTGACAACGGACCAGTTGGTAGCTTTGGAGAGATCGTACAGAGGCGAGCGATTCTTGACCAGTGCGCAGTTGATCGAGTTACCCAAGACTGTCGGCATGACTATGCGAGCACTCCAGGCTTGGTTTTCTGATCGTCGCATCTACGAAATTCGTTCTAGCGATAAAGATCTCGTCAACATTGGACCTCGAACAGTGGCTGCGAGAAAAGAAACCAGTCAGTCTTCGATGTTGAAACCGAGCACAGCGATATCTGAGTCGACCCAGCAAGAGGAACCCCGAATCGGCCAACCTGCCGAGTACGAGACCGcaaccgaatttttcgaatcgttGAGCAAAGAGCAAAAAGGGCATTTGAAAGCCGCGTGTAATAATTATAACGTTTCGTATAAGAGACTCGCTCAAGCTCTTAGTTTACCCACAGAAAAAGTCGAGCATTATATTAAAAGTTACCGCGTACGTCACGCCATGTTCAGGGTGAGTAAATCCACGTTACCGGAACGCGTGCACAAAGCTTTGCTCAACCATTACatgaaatatggtaaaatatcgTCGAAAACCAGCGTGGTATTGGCCAAACGTTTGAAAGTACGCCCCGAACAGATCGTAAATTGGAATAAAAGTCACACGAAACGTGTCCTCGCGGTGGGAGGGTTCGTTAAACCAACGCCGATCGTTCCCGCTGCCAAGCctatcgtcgtcgtcgaacCTTCTGTACTCGAAGTCGAAGAGCCTATCGCCGATGCCGAGCCCGAGCCCGACCCTTTGGAAACCTACGAAGAAGTTGACTCCACTCCGTCGGCATCGATTCCAGGACCAGTCCGCAGATCGTTTTCCAAAAAGGGTTACGGTAAAGGTGGTAAACGTTACTACGCGGCTGCAGCTGCTAAAGTTGTTCTGTTCGAAGAATACAAAGCATCTCCCGAAGCGgctacgactacgagtaaaattaaacaactCGCGAATATGGTTAAACTGACGCCTCTGCAGGTGCGTAAATGGTTGTACAATTTCGGTAAAAGACTCAAAGGGCAGACTAAATCCAAAGTGGTCGATTGCCTGAATAATCCGGAGATCAGCGACGAACTTCGAGCCAGACTAGAAGAATTATACAGAGATTGTCGATTCATGGAAGAATCCGAAATGGAAGCTTTGGCCCAAGAGTTCGGCTCGAGCAGGAAACATATAACTAACTGGTTTATCAACGCTCGTTACTACGAAGTGCTCGTAGGCCAATGTCCAGGCGAAGCTGATACCGCAGTTCGTACCAAAACTCCGACTAAATCCGCCTCGTCGTCTAAAACCTTTTACGCGGGATTAGATTCGGAAAAACAAGCCCGTCTTGATGAGGAACTCGACTCGTACCCGTTCGACGATGATAAACTGGACGATTTAGCCGAAGAATTAGAAGTACCTTCGAAAGATCTGAAGAAATGGTTCGATAACCCTACTCGTGTCAAAAGAAGTCGACGTAGTTTATCTCAGCCGAGTACGCCGCTCAACTGGCTCAACTTGACCATTAAACAAATGGAAACCCTGGTGAACGAATTCGAAGCCGATCCGATTATGAGCGACGAACGTGCGGCCGCCATGGCTAGACGTATTAAACTTGCCAAAGGTCGAATCAAAGTTTGGTTCGAGAATCGTCGACAAGAATTGCAGATCGAAAATTCCGACGATTCGGATAACGCGAAACCAACAAAACAGAGAATACCTCCGATTAAAATCATCTTGCCGAAATATACGAATTCCAACGACGAAATGCCTACGATAGCTCCATCCGCAGATACCTCCAAAGATGTTTGTAAAATCCGATTATTCGAAGAGTTCAAACGAAGTTCGTCGTTGACCAGCGAAAGATTGGTCAAAATAAGCCAAGAAACTAACCTATCCGGCAGACAAGTCTCAGCTTGGTTCAGCTGGTTGAATGAGAAATTATCCAAGATACCGAGAGACACTCTTTCGGAAGAAAATCTTAACAAGGATTTAACCCCCGAGCAAATCGAAGCGTTAGAGAAGCAATACGCCGAAAACAGGTACGCCAACAGATCATCTCGCGAATCTCTCTCCCTAACATTGGGCTTACCGAAGAACGTAGTTAAATCGTGGTTTGCTAACAGACGCTATCAAGAGATTCTATGTCAAGATGAATCCGTCGCGGAAGATTACAGCTCGCAGTACGAAGATATTAACGACCCTGAAATGGAACATAGTACCGAGGAAAATGCCATCAGCTACAAGTGGGACGAAGAAAATACTGAAACTATCGACGAATCCGCCGATCCGTTGGAACAGAAATTCGACGTTAAACGTCCGCTCGAAATTGATCCGTTGTTAGATGACAGCTATGGCGAAGAACAGAACGAAGATATCAAAATGGATgtatattataattttcaactgtcGCCGAATAACGCGTTCGACCAAGATTTGACTAGTTTACCGTACGAGCCTCGAGATCGTTTCGTTACACCTTTGGGTGATGATTTAGAACCGTTGGAAGAAGATGTGGAGAAACTATTCTGGTTCATGAGCAAGAAGCCGAATACGAACGGCGAGAAATACGACCAAAATATAGACGAGGCCAAGAATCGTATCCTAGAAAGTGAATTCGGTAAATATCCCTGGCCCAATTTAGACAGAATATCTAAGTTATCGGCCCAGTTGCTAGTCTCCGAACCGAAAATACATTGGTGGTTTATTAAAAAACGTTGTTTCCTAACTAAAACCATACTCACATTACCAGCGCATTCGCATTCTAAAATGAATCTTAAACCCGAGCCTGAAAATCTGCTAATCGACTTGACCGACGACGACGCTATGAACGATATGCCGGCGAAATGCGGAGAATTCGAATTTGTTACGTTGGACGAGACGgctcaaattaaaaaagaagaagaaccGATGACCGAAGATGATACGTTAGAGAACGGCGATCCATTCGAAAATAACTCTATCGATGATCAATTGCTAGCGCATGATATCGAAGAAGAACCGCTCGTAGAGTCTAACGAATCGACCAATAATACCGGCTCAACTTCGACAAACTCTGCGACCGCATCAGcgacaaaaaagaaaaagaagaaaataccTTTGACGTCTCATCAACGTGCAGTTCTGATGCAAGAATATAAACGTAACAAGTTCATCTCAGGTCCTCAAGCTCGTATGTTGGCTCGAGATTTAGGCGTGAGCGTCAATCGAGTGGATACTTGGTTtgattccatgagaaaatcaAACGCGCAGAAAAAACCCACTGTCGTCGAGACATCCGTATCTGTGAAAAGTCTCAGCCCTGAGCTTGAATCTGGCCTCGAAGCGGAGTACCTGAAAAGTGTCAACTTGACTGCTAAAAGAGCCAAGATGATCGCCCTCAAgctgaaaacgaaaacgaagacTGTTCAGAAATGGTTCATGGAACGAGCCAAAAGGAAGGATCACTCTTCGCAATCCTAA
Protein Sequence: MMGVVRLVYHLLIFFHIRSILIDVNFCSDSATRITITREQSLKLQKLFREKPAGKRKWTDQEIRKNASRLKIPAVKIRYYLKQRNALAEVPNRTTSSMPIDVEKPRSKIFSDLSFEKKVALLRKTRTATTTSVRLTQELSEELQIPESKIYNWLKHKVHRNLRMKKSLSVQETAALNQKFAEYDYLDDDSALLLADRFNVNPKVIKKAFQHRTPVSVPNAKPVTPVSSQNVKPVIEVKKLLQLPASVTITPVPKVTTAPKVTPVPKVATVALSKSKSGTKKKANFKTVDQKNALFEAFRQSPSLTRNEAMAELMEKTGLIAPQICKWLSVVRAKWAQSTESSLKKALTRGLTTDQLVALERSYRGERFLTSAQLIELPKTVGMTMRALQAWFSDRRIYEIRSSDKDLVNIGPRTVAARKETSQSSMLKPSTAISESTQQEEPRIGQPAEYETATEFFESLSKEQKGHLKAACNNYNVSYKRLAQALSLPTEKVEHYIKSYRVRHAMFRVSKSTLPERVHKALLNHYMKYGKISSKTSVVLAKRLKVRPEQIVNWNKSHTKRVLAVGGFVKPTPIVPAAKPIVVVEPSVLEVEEPIADAEPEPDPLETYEEVDSTPSASIPGPVRRSFSKKGYGKGGKRYYAAAAAKVVLFEEYKASPEAATTTSKIKQLANMVKLTPLQVRKWLYNFGKRLKGQTKSKVVDCLNNPEISDELRARLEELYRDCRFMEESEMEALAQEFGSSRKHITNWFINARYYEVLVGQCPGEADTAVRTKTPTKSASSSKTFYAGLDSEKQARLDEELDSYPFDDDKLDDLAEELEVPSKDLKKWFDNPTRVKRSRRSLSQPSTPLNWLNLTIKQMETLVNEFEADPIMSDERAAAMARRIKLAKGRIKVWFENRRQELQIENSDDSDNAKPTKQRIPPIKIILPKYTNSNDEMPTIAPSADTSKDVCKIRLFEEFKRSSSLTSERLVKISQETNLSGRQVSAWFSWLNEKLSKIPRDTLSEENLNKDLTPEQIEALEKQYAENRYANRSSRESLSLTLGLPKNVVKSWFANRRYQEILCQDESVAEDYSSQYEDINDPEMEHSTEENAISYKWDEENTETIDESADPLEQKFDVKRPLEIDPLLDDSYGEEQNEDIKMDVYYNFQLSPNNAFDQDLTSLPYEPRDRFVTPLGDDLEPLEEDVEKLFWFMSKKPNTNGEKYDQNIDEAKNRILESEFGKYPWPNLDRISKLSAQLLVSEPKIHWWFIKKRCFLTKTILTLPAHSHSKMNLKPEPENLLIDLTDDDAMNDMPAKCGEFEFVTLDETAQIKKEEEPMTEDDTLENGDPFENNSIDDQLLAHDIEEEPLVESNESTNNTGSTSTNSATASATKKKKKKIPLTSHQRAVLMQEYKRNKFISGPQARMLARDLGVSVNRVDTWFDSMRKSNAQKKPTVVETSVSVKSLSPELESGLEAEYLKSVNLTAKRAKMIALKLKTKTKTVQKWFMERAKRKDHSSQS

Similar Transcription Factors

Sequence clustering based on sequence similarity using MMseqs2

100% Identity: -
90% Identity: -
80% Identity: -