Basic Information

Insect: Ferrisia virgata
Gene Symbol: -
Assembly: GCA_900060175.1
Location: FIZR01018191.1:5071-9888[-]

Transcription Factor Domain

TF Family: Homeobox
Domain: Homeobox
PFAM: PF00046
TF Group: Helix-turn-helix
Description: This entry represents the homeodomain (HD), a protein domain of approximately 60 residues that usually binds DNA. It is encoded by the homeobox sequence [7, 6, 8], which was first identified in a number of Drosophila homeotic and segmentation proteins, but is now known to be well-conserved in many other animals, including vertebrates [1, 2], as well as plants [4], fungi [5] and some species of lower eukaryotes. Many members of this group are transcriptional regulators, some of which operate differential genetic programs along the anterior-posterior axis of animal bodies [3]. This domain folds into a globular structure with three α-helices connected by two short loops that harbour a hydrophobic core. The second and third form a helix-turn-helix (HTH) motif, which make intimate contacts with the DNA: while the first helix of this motif helps to stabilise the structure, the second helix binds to DNA via a number of hydrogen bonds and hydrophobic interactions, which occur between specific side chains and the exposed bases and thymine methyl groups within the major groove of the DNA. One particularity of the HTH motif in some of these proteins arises from the stereo-chemical requirement for glycine in the turn which is needed to avoid steric interference of the β-carbon with the main chain: for cro and repressor proteins the glycine appears to be mandatory, while for many of the homeotic and other DNA-binding proteins the requirement is relaxed.
Hmmscan Out: # of c-Evalue i-Evalue score bias hmm coord from hmm coord to ali coord from ali coord to env coord from env coord to acc

1 15 0.3 69 3.5 0.6 4 51 14 65 11 68 0.84

2 15 2.7 6.2e+02 0.5 0.0 30 48 130 148 122 155 0.85

3 15 0.0035 0.81 9.7 0.0 2 49 157 205 156 209 0.88

4 15 0.00093 0.22 11.5 0.5 3 55 265 319 263 321 0.85

5 15 1.6e-10 3.7e-08 33.2 0.6 8 53 336 381 333 385 0.95

6 15 0.0067 1.5 8.8 0.1 13 51 503 541 493 546 0.89

7 15 0.0001 0.024 14.6 0.1 9 48 630 669 622 671 0.86

8 15 5.1e-10 1.2e-07 31.6 0.1 7 53 693 739 691 741 0.93

9 15 0.072 17 5.5 0.0 27 50 797 820 790 823 0.90

10 15 6.1e-10 1.4e-07 31.3 0.1 7 49 852 894 850 899 0.96

11 15 3.1e-07 7.2e-05 22.7 0.4 10 49 953 992 948 997 0.94

12 15 6e-12 1.4e-09 37.8 1.5 6 52 1014 1060 1009 1062 0.94

13 15 6.8e-07 0.00016 21.6 0.1 8 52 1227 1271 1224 1272 0.91

14 15 1.2e-09 2.7e-07 30.4 0.1 1 52 1479 1530 1479 1533 0.94

15 15 2e-06 0.00045 20.1 0.4 8 57 1551 1599 1548 1600 0.86

#	of	c-Evalue	i-Evalue	score	bias	hmm coord from	hmm coord to	ali coord from	ali coord to	env coord from	env coord to	acc
1	15	0.3	69	3.5	0.6	4	51	14	65	11	68	0.84
2	15	2.7	6.2e+02	0.5	0.0	30	48	130	148	122	155	0.85
3	15	0.0035	0.81	9.7	0.0	2	49	157	205	156	209	0.88
4	15	0.00093	0.22	11.5	0.5	3	55	265	319	263	321	0.85
5	15	1.6e-10	3.7e-08	33.2	0.6	8	53	336	381	333	385	0.95
6	15	0.0067	1.5	8.8	0.1	13	51	503	541	493	546	0.89
7	15	0.0001	0.024	14.6	0.1	9	48	630	669	622	671	0.86
8	15	5.1e-10	1.2e-07	31.6	0.1	7	53	693	739	691	741	0.93
9	15	0.072	17	5.5	0.0	27	50	797	820	790	823	0.90
10	15	6.1e-10	1.4e-07	31.3	0.1	7	49	852	894	850	899	0.96
11	15	3.1e-07	7.2e-05	22.7	0.4	10	49	953	992	948	997	0.94
12	15	6e-12	1.4e-09	37.8	1.5	6	52	1014	1060	1009	1062	0.94
13	15	6.8e-07	0.00016	21.6	0.1	8	52	1227	1271	1224	1272	0.91
14	15	1.2e-09	2.7e-07	30.4	0.1	1	52	1479	1530	1479	1533	0.94
15	15	2e-06	0.00045	20.1	0.4	8	57	1551	1599	1548	1600	0.86

Sequence Information

Coding Sequence: ATGCTAATAATTGTTAATTTCTGTTTAGATAGCGAAGTTCGTATCACCATTACTCGAGAACAGTCGCTGAAATTACAGAAGCTGTTACGCGAAAAACCGGCGGGCAAGCGTACATTCACCGATTTGGAAATTCGTCGAAACGCTTCGCGTCTGAAAATTTCCGCAGTGAAGATACGTTATTGGTTGAAACAACGTAACGCTTTGGCGTCGGATGCGTCCAGACCGCCAGCGTCGGTCCGTATTATAACGCCGACCATTACGTCGGCGACGGAGGAGAACGCGTTGCTGAACAGATCACGTTGCAAGCTGTTCAACGATCTGTCGTTCGAGAAGAAGGTTTTGCTGATGCGTAAGACTTACGGTATCACCAAGGTCACCGCCGGCCTTACCCAAGAATTATGTCGAGAACTGCAAATACCTCGCGATCGAATTTACTACTGGCTCAAACACAAGGTTCTTCGTAACTcgcgaatgaaaaaatcgctGACCGCCGGCGAGCTGGCCATTTTGGAGAAGAAATTCGCCACCGAGTATGATTATTTGGACGAAGACAGCGCTCTGCTGTTGGCCGACCGGTTCAACGTTAGTACTGCAGCGATAAAGAAAGCATTTAATCAACGTAAACCGTCGTCCGCGAACCAACGACCGGTTATCGAAGTGAAAAAGCTACAAATGCAGCTTCCGCCTGCGGTAACCTTAACGGCAGTAACGCCGAAACCGACATCAACACCGGCACCGGAACCAGAACCGACACCGGCATCGGCACCGAAGGCCTCCGGTAAACCAGGTAAAACACGTAGTAGATTCAAAACCGTCGGCCAGAAGAACCTGTTATTCGACGCTTTTCGCCAATCGCCTACTTTGACCAAACCCGAAACGGTGACCGAGCTGGTGAAAAAGACTAGACTAACGCCTCTGCAGGTTACCAAATGGCTGAGTGTGTTCCGTACTAAATGGTCGCACAATAACGAAGCCGGATTGAAAACAGCGTTAACACGAGGATTGGAATCGAATCAGTTGGTAACGCTGGAGAAAGCTTACAGAGAAGaacgatttttgaccaatgCTAATTTGCAACAGATATCCAAGCAAATAGGCCTGAACTTGAGATCGGTGCAATCTTGGTTTTCGAGCCGACGCATCTACGAGATACGTTCCGACGATAAAGACTTGATAAATATCGGACCGAAGACGGCGGCCGCTCGTAAAGAATCCGATCAGCAACAGCAACCGACACAGACGGCCAAACCATCGATAAAGATACCTCAGCAACAGCCTTCTCAGCAGTCCGAAGACGAGGACAGCGCTGCGGCGTTTTTCCAGTCGTTGAACACGCAGAAAAGAGCTCGTTTGAAAGCGgcttgcaaaaatttcaacgtttcgtACAAAAAGCTGGCCGCCAGTTTGGGCGCACCGGTCGATAAAGTTACACATTACATTCGAGCGTATCGAGTACGCCATTCGATATTTAGAGTGAGCAAGTTTACGTTACCGGAACGCACTCACAAAGCTCTGCTGAACcattacctaaaatatggtaaaatatCGTCGAAGACCAGCGTAATATTGGCTAAACGTTTGAAAGTACGCCCGGAACAGATtataaattggaataaaaatcactGCAAAAAAATCCAGTCACTCGAACACGTGgttgaatcgaaaaaaacatcatcgtCCGACACCGAGCACACTGCCGCAGCAGCTGTCGAACCTGCACCTGCACCTGCACAACCAACCGAGGCCATCGAAGATCAGTTCGCCACCGACGATGCGGCCGAATCGTACGAAAGAGAAGCCAGTCTAGCGTGTGCGGTACCAGCGCCTAAATGTAAATGGACTTCTAAAAAAGACTACAGTCGAAAGGGTAAACGTTACTACGCGGCGGCGGCCGCTAAATGCGTCTTATtcgaagaatttaaaaaatctccgCAACTCGCCTCCACCATGACTAAACAGCTCGCCAAAACGGTTAAACTGACGCCGTTGCAGGTACGCAAATGGCtttataattttggtaaaaacatCAGCGAACAGAATAAATCCGAAGTGATCGCTTGTCTGCAAACACCGGCCATTAGCACCGAAGCACGAATCGTACTGCAGGACGAATACCGAAGTCGTCGTTTCTTGGAAGACTCCGAAATGGAAACGTTAGCTGCTGAACTAGGTTTGGTCAAGAGACAGGTAGCTAATTGGTTTATTAATGCTCGTTACTACGAAATTCTCGCAGGCGAGTGTCCCGGTGGTAATTCAGGCTCGGCTTCTAGCGCTCAATCTAATACCAGTAAACCAGTTATCGTTTCTACTAAATCGTCGTTTTACCAACGACTAGATTCGGAGAAACAGGCTCGTCTGAACGAAGAACTCGCCGTGTATCCGTTCGATGATGCGAAATTGGACGATTTAGCTAGCGAATTAGAAGTACCGTCGAATGAGCTGAAGAAATGGTTTGATAATGCTACTCGTAGCGGTAAAATCGCTCGTCGTTCTGTTCAAGTAGCTGCAACACCCGATACATCATTAACCGACGCTTTCGAAGCATTACCCGATTTTACGGCCAAACAATTGGAAACGTTAACCAATGAATTCAATGTTGATCCGATTATATCCGACGAACGTGCCGCTACGCTGGctaaacgcattaaaatcaCCAAAGATCGTATTAAAACTTGGTTTCTGCATCAAGCGCAACAGCTGTCGTTGAATCAGTCGTCGTCCGATAAacgcaaacaaaaaaaacataaaataccTCCGATTAAAATTTGCATGCCGAAGGACAGCAACGAAACGCCGACCGTTGTTTCTTCGCCGGCAAACGACTCCAGACCAAAATCCTACGAATTTAAGGTACCCATGCAGCAAAACAAATTATTCGAAGAGTTCAAAGCCAGTTCAACGTTGACCAGCGAACGTTTAATCAAGATCAGCGAGGAGACGAACTTATCAGGTAAACAGATCTCGGCGTGGTTTCATTGGATGAATTCCAAATTATCGTCCATATCTAGAGATAGTCTTCTAGAAGAAAACCGAAACCGATATTTGACTACGCAGCAAATCACAGCCTTGGAAAAACAATACGCTAAGAATCGATACGTGAATAGATCGTCTCGCGAAACGCTTTCGCTTAAATTAGATGCacctaaaaatattattaaatcgTGGTTCGCAAATCGACgctatttcgaaattttatgtCGAGATAAATTCGAAGATGGCAACTACCAGCAATTCTCGTCTTATCCTAATTACTACGATGACAATAATAGCAATAATGACGTTCCCGAACAAGATCCGATTGCAACTGACGAAACAGTAATCGATTACGACTGGGAAGAAAAGGAATCTGAACCGTTAGACATCATCGACACGTTCGATCACGAAGACCAAAAGATCGACATAAAACGTCCTCTCGACATCGATCCTTTATCTATAGATTGCGGTTTCGACGAAGAACCGATGGAAGATATTAAAACCGATATGCCATCGTATAATTTCCAACTTTCGCCTAACAACCCATTCATGGATGATTTAACTAGTCTACCTTATAAATCTCGAGATCGTTTCTTCACACCGCTCGGTAGCGATTTAGAACCGCTAGAAGAAgacatcgaaaaattattttggttCGCAAACAAAACGCCTAACAGAAATAACAccgatttcgctcaaaatatAGACGAAGCGAAGAATCGTATTCTAGAAAcggaatttggtaaaaatccgTGGCCCGAATTGCACCGAATATCCGAGTTATCGGCTCAGCTGCTCGTTTCCGAACCCAAAATACACTGGTGGTTTATTAAGAAACGATGTTTCTTAACCAAAACCATCCTTACCTTACCAGCTCCTCAATctaaaacaaaaccaaaaaatgtgCTGATCGATTTAACCGATGACGATGTCGAATCTCAACCTTTTAAATGCGGcgaatttgaatttgttacGTTAAACGAAGGCGTAGCCCAAATTAAAGTAGAACAGCCGACAAACGATGACGATAATCTAGAGAATGACGATCCTTTCGAGAGTAACGTTACAAACGACGAGCGATCTTCACTTAACAACGAACAACCATCGTCCGAAGGATTTGATAAATCAACCGATATTAATAATTCTGTCGACGGTACCGATCATGGCGAAAAATCTACCGATGTTAATAATTCTGTCGACGATACCGACCATGGCGAAAAATCTAccgaaattaataattctgTCGACGATACCGACCATGGCGAAAAATCTAccgaaattaataattctgTCGACGATACCGACCATGGCGAAAAATCTAccgaaattaataattctgTCGACGATACCGACCATGGCGAAAAATCTAccgaaattaataattctgTCGACAGTACCGACGATTCCAGCCGCACTACTGTGCCTCTTTCCACTTCGACTTCTACATCGACagttagaaagaaaaaacagaaaatttcgtTGACTTCGCATCAGCGTGCCATTTTGATGCAAGAATTTAAACGTAATAAAGTCATTTCAAGTTCTCAAGCTCGTATGCTAGCTACCGACTTAGGATTAAGTGTTGGTCGAGTAGAAGCTTGGTTCAATACGATGAGAAAATCAGCTGTGCAAAAGAAACCAAATCATTCGGAGGTGACTGTATGTGTTAAAAGTTTGAGTCCAGAGTTGGAAGAGGGTCTCGAAAAAGAGTTTGCGAAAAGCGTCAATTTGAGCGCTAAAAGAGCTAAAATGATAGCTCTGAAGTTGAGCACGAAGACGAAGATCGTTACGAATTGGTTCATCGAAAGAgccaagaagaagaagaacgaGCAATCGTCGTCGTAA
Protein Sequence: MLIIVNFCLDSEVRITITREQSLKLQKLLREKPAGKRTFTDLEIRRNASRLKISAVKIRYWLKQRNALASDASRPPASVRIITPTITSATEENALLNRSRCKLFNDLSFEKKVLLMRKTYGITKVTAGLTQELCRELQIPRDRIYYWLKHKVLRNSRMKKSLTAGELAILEKKFATEYDYLDEDSALLLADRFNVSTAAIKKAFNQRKPSSANQRPVIEVKKLQMQLPPAVTLTAVTPKPTSTPAPEPEPTPASAPKASGKPGKTRSRFKTVGQKNLLFDAFRQSPTLTKPETVTELVKKTRLTPLQVTKWLSVFRTKWSHNNEAGLKTALTRGLESNQLVTLEKAYREERFLTNANLQQISKQIGLNLRSVQSWFSSRRIYEIRSDDKDLINIGPKTAAARKESDQQQQPTQTAKPSIKIPQQQPSQQSEDEDSAAAFFQSLNTQKRARLKAACKNFNVSYKKLAASLGAPVDKVTHYIRAYRVRHSIFRVSKFTLPERTHKALLNHYLKYGKISSKTSVILAKRLKVRPEQIINWNKNHCKKIQSLEHVVESKKTSSSDTEHTAAAAVEPAPAPAQPTEAIEDQFATDDAAESYEREASLACAVPAPKCKWTSKKDYSRKGKRYYAAAAAKCVLFEEFKKSPQLASTMTKQLAKTVKLTPLQVRKWLYNFGKNISEQNKSEVIACLQTPAISTEARIVLQDEYRSRRFLEDSEMETLAAELGLVKRQVANWFINARYYEILAGECPGGNSGSASSAQSNTSKPVIVSTKSSFYQRLDSEKQARLNEELAVYPFDDAKLDDLASELEVPSNELKKWFDNATRSGKIARRSVQVAATPDTSLTDAFEALPDFTAKQLETLTNEFNVDPIISDERAATLAKRIKITKDRIKTWFLHQAQQLSLNQSSSDKRKQKKHKIPPIKICMPKDSNETPTVVSSPANDSRPKSYEFKVPMQQNKLFEEFKASSTLTSERLIKISEETNLSGKQISAWFHWMNSKLSSISRDSLLEENRNRYLTTQQITALEKQYAKNRYVNRSSRETLSLKLDAPKNIIKSWFANRRYFEILCRDKFEDGNYQQFSSYPNYYDDNNSNNDVPEQDPIATDETVIDYDWEEKESEPLDIIDTFDHEDQKIDIKRPLDIDPLSIDCGFDEEPMEDIKTDMPSYNFQLSPNNPFMDDLTSLPYKSRDRFFTPLGSDLEPLEEDIEKLFWFANKTPNRNNTDFAQNIDEAKNRILETEFGKNPWPELHRISELSAQLLVSEPKIHWWFIKKRCFLTKTILTLPAPQSKTKPKNVLIDLTDDDVESQPFKCGEFEFVTLNEGVAQIKVEQPTNDDDNLENDDPFESNVTNDERSSLNNEQPSSEGFDKSTDINNSVDGTDHGEKSTDVNNSVDDTDHGEKSTEINNSVDDTDHGEKSTEINNSVDDTDHGEKSTEINNSVDDTDHGEKSTEINNSVDSTDDSSRTTVPLSTSTSTSTVRKKKQKISLTSHQRAILMQEFKRNKVISSSQARMLATDLGLSVGRVEAWFNTMRKSAVQKKPNHSEVTVCVKSLSPELEEGLEKEFAKSVNLSAKRAKMIALKLSTKTKIVTNWFIERAKKKKNEQSSS

Similar Transcription Factors

Sequence clustering based on sequence similarity using MMseqs2

100% Identity: -
90% Identity: -
80% Identity: -