Basic Information

Insect: Hyles vespertilio
Gene Symbol: egg_1
Assembly: None
Location: HLhylVes1:4996650-5028798[-]

Transcription Factor Domain

TF Family: MBD
Domain: MBD domain
PFAM: PF01429
TF Group: Unclassified Structure
Description: The Methyl-CpG binding domain (MBD) binds to DNA that contains one or more symmetrically methylated CpGs [2]. DNA methylation in animals is associated with alterations in chromatin structure and silencing of gene expression. MBD has negligible non-specific affinity for DNA. In vitro foot-printing with MeCP2 showed the MBD can protect a 12 nucleotide region surrounding a methyl CpG pair [2]. MBDs are found in several Methyl-CpG binding proteins and also DNA demethylase [1].
Hmmscan Out: # of c-Evalue i-Evalue score bias hmm coord from hmm coord to ali coord from ali coord to env coord from env coord to acc

1 10 3e-14 1.4e-10 41.0 0.0 5 75 1461 1524 1458 1526 0.91

2 10 0.11 5.1e+02 0.8 0.0 49 75 1539 1563 1536 1565 0.87

3 10 0.11 5.1e+02 0.8 0.0 49 75 1578 1602 1575 1604 0.87

4 10 0.11 5.1e+02 0.8 0.0 49 75 1617 1641 1614 1643 0.87

5 10 0.11 5.1e+02 0.8 0.0 49 75 1656 1680 1653 1682 0.87

6 10 0.11 5.1e+02 0.8 0.0 49 75 1695 1719 1692 1721 0.87

7 10 0.11 5.1e+02 0.8 0.0 49 75 1734 1758 1731 1760 0.87

8 10 0.11 5.1e+02 0.8 0.0 49 75 1773 1797 1770 1799 0.87

9 10 0.11 5.1e+02 0.8 0.0 49 75 1812 1836 1809 1838 0.87

10 10 0.11 5.1e+02 0.8 0.0 49 75 1851 1875 1848 1877 0.87

#	of	c-Evalue	i-Evalue	score	hmm coord from	hmm coord to	ali coord from	ali coord to	env coord from	env coord to	acc
1	10	3e-14	1.4e-10	41.0	5	75	1461	1524	1458	1526	0.91
2	10	0.11	5.1e+02	0.8	49	75	1539	1563	1536	1565	0.87
3	10	0.11	5.1e+02	0.8	49	75	1578	1602	1575	1604	0.87
4	10	0.11	5.1e+02	0.8	49	75	1617	1641	1614	1643	0.87
5	10	0.11	5.1e+02	0.8	49	75	1656	1680	1653	1682	0.87
6	10	0.11	5.1e+02	0.8	49	75	1695	1719	1692	1721	0.87
7	10	0.11	5.1e+02	0.8	49	75	1734	1758	1731	1760	0.87
8	10	0.11	5.1e+02	0.8	49	75	1773	1797	1770	1799	0.87
9	10	0.11	5.1e+02	0.8	49	75	1812	1836	1809	1838	0.87
10	10	0.11	5.1e+02	0.8	49	75	1851	1875	1848	1877	0.87

Sequence Information

Coding Sequence: ATGGCGGACTCGAAACCTAAAGTCGGATTGGAGATATTCAACTTGGATTCTGATGATGAGGACATCGGCAGCTCTAATAAAGAGTTCATCTCGggccccgctgtcggcgctggagctggacgcggcgctgcgcgcgggacgctgcgtgcggcgcggctgcggcgccggcgcccgcccgCTCGCACTCTACTGCCACCACTGCGCCGCGCTGCACCTGCGACGCACGCAGGTACTGCACTGCACCTCACACACATAGTGTTCACTGcggcgcggctgcggcgccggcgcccgcccgCTCGCACTCTACTGCCACCACTGCGCCGCGCTGCACCTGCGACGCACGCAGGTACTGCACTGCACCTCACACACATAGTGTTCACTGcggcgcggctgcggcgccggcgcccgcccgCTCGCACTCTACTGCCACCACTGCGCCGCGCTGCACCTGCGACGCACGCAGGTACTGCACTGCACCTCACACACATAGTGTTCACTGcggcgcggctgcggcgccggcgcccgcccgCTCGCACTCTACTGCCACCACTGCGCCGCGCTGCACCTGCGACGCACGCAGGTACTGCACTGCACCTCACACACATAGTGTTCACTGcggcgcggctgcggcgccggcgcccgcccgCTCGCACTCTACTGCCACCACTGCGCCGCGCTGCACCTGCGACGCACGCAGGTACTGCACTGCACCTCACACACATAGTGTTCACTGcggcgcggctgcggcgccggcgcccgcccgCTCGCACTCTACTGCCACCACTGCGCCGCGCTGCACCTGCGACGCACGCAGGTACTGCACTGCACCTCACACACATAGTGTTCACTGcggcgcggctgcggcgccggcgcccgcccgCTCGCACTCTACTGCCACCACTGCGCCGCGCTGCACCTGCGACGCACGCAGGTACTGCACTGCACCTCACACACATAGTGTTCACTGcggcgcggctgcggcgccggcgcccgcccgCTCGCACTCTACTGCCACCACTGCGCCGCGCTGCACCTGCGACGCACGCAGGTACTGCACTGCACCTCACACACATAGTGTTCACTGcggcgcggctgcggcgccggcgcccgcccgCTCGCACTCTACTGCCACCACTGCGCCGCGCTGCACCTGCGACGCACGCAGGTACTGCACTGCACCTCACACACATAGTGTTCACTGcggcgcggctgcggcgccggcgcccgcccgCTCGCACTCTACTGCCACCACTGCGCCGCGCTGCACCTGCGACGCACGCAGGTACTGCACTGCACCTCACACACATAGTGTTCACTGcggcgcggctgcggcgccggcgcccgcccgCTCGCACTCTACTGCCACCACTGCGCCGCGCTGCACCTGCGACGCACGCAGGTACTGCACTGCACCTCACACACATAGTGTTCACTGcggcgcggctgcggcgccggcgcccgcccgCTCGCACTCTACTGCCACCACTGCGCCGCGCTGCACCTGCGACGCACGCAGGTACTGCACTGCACCTCACACACATAGTGTTCACTGcggcgcggctgcggcgccggcgcccgcccgCTCGCACTCTACTGCCACCACTGCGCCGCGCTGCACCTGCGACGCACGCAGGTACTGCACTGCACCTCACACACATAGTGTTCACTGcggcgcggctgcggcgccggcgcccgcccgCTCGCACTCTACTGCCACCACTGCGCCGCGCTGCACCTGCGACGCACGCAGGTACTGCACTGCACCTCACACACATAGTGTTCACTGcggcgcggctgcggcgccggcgcccgcccgCTCGCACTCTACTGCCACCACTGCGCCGCGCTGCACCTGCGACGCACGCAGGTACTGCACTGCACCTCACACACATAGTGTTCACTGcggcgcggctgcggcgccggcgcccgcccgCTCGCACTCTACTGCCACCACTGCGCCGCGCTGCACCTGCGACGCACGCAGGTACTGCACTGCACCTCACACACATAGTGTTCACTGcggcgcggctgcggcgccggcgcccgcccgCTCGCACTCTACTGCCACCACTGCGCCGCGCTGCACCTGCGACGCACGCAGGTACTGCACTGCACCTCACACACATAGTGTTCACTGcggcgcggctgcggcgccggcgcccgcccgCTCGCACTCTACTGCCACCACTGCGCCGCGCTGCACCTGCGACGCACGCAGGTACTGCACTGCACCTCACACACATAGTGTTCACTGcggcgcggctgcggcgccggcgcccgcccgCTCGCACTCTACTGCCACCACTGCGCCGCGCTGCACCTGCGACGCACGCAGGTACTGCACTGCACCTCACACACATAGTGTTCACTGcggcgcggctgcggcgccggcgcccgcccgCTCGCACTCTACTGCCACCACTGCGCCGCGCTGCACCTGCGACGCACGCAGGTACTGCACTGCACCTCACACACATAGTGTTCACTGcggcgcggctgcggcgccggcgcccgcccgCTCGCACTCTACTGCCACCACTGCGCCGCGCTGCACCTGCGACGCACGCAGGTACTGCACTGCACCTCACACACATAGTGTTCACTGcggcgcggctgcggcgccggcgcccgcccgCTCGCACTCTACTGCCACCACTGCGCCGCGCTGCACCTGCGACGCACGCAGGTACTGCACTGCACCTCACACACAGGGAGTTGGTGGAAGGCATCAAGAACATGACTCCGTTGctggaactgaacatggacaggctggaccaggacctggTGGAGATATCCGACTCGGAGTCAGAAGACGAGCCAAATGAGCCCAAGGATAGGATCGGCGAGGAAGGTGCCAAGATACTTGAAGAGAACTTGGCCGACATAATAAACAGCATGTGGCGCAAATACAAGATGGACGCCAGCCTAATAGACGCTAAAACGTTACTCGACGCCGAGACGGAACGATTGGAGAACGAGAGCAAAGAGATAAACAAGTTGTTGAACGAGTGCCAAGCCGCCACGGACAAGCTGCGCGGTGAACTGTACGCCACGTTCGAGCCGCGTCGCCACCACAGGCCCGCCATACACATCTACGATACTGCCGAGATTATGACAGTGGAGGATGAAAATATGTCGGGCGATCAGAATTCCGTGCCTGAGACGAGGCAGGCGAAACGTCGGCTGTCTGGTCCAAACATACAGCCCGCCAAGAGACCTGCCATACCTCTTGGCTATGCGCCGCTGGACAACGATGCCAACCAGAATGCACAACAGGAATACACAGCTGTTCTGAGAGTTGGAGAAAGCAGCAGGTTGGATGATGATTCGGAGGTGTCGGTGGTGCAGCTGTCGTGTGAGGCGGCGCCGCGCGACCTGCCCGCGCCGGGCGAGGTGTCGCGACCTCCGCTGCGCGCCGCCATGCAGGTGTACGCGATGTCCAACAACGGACACTGGTACAAGGCGAGGGTTGTGGACCAGGTTCGATTCTTAGGGTCCCAGCCGCAGTTTCCTTCGTACCGCGTGCGTTTTGAGAAGCGCGTGAAGAATCCCTGCAGGGTGGTGTCGGCTCGATACCTCGCGTACAGCGAACCGGCTGATGTCAGGCTCACGATAGGTACTAGGGTCATAGCGTTGTTCAAAGAAACGGTGAACACGAATAAGAAGAATACTTATTCATCCGGTATCATAGCTGAGATACCCAATCCAGTTAACAGCTATAGGTATTTGATATTCTTCGACGACGGTTACGCTCAGTACGCGTCTCACGCGCACACGCGCGTTGTGTGCGCGTCCGCCACGCCCGTGTGGGAGGAGGTGCACCCGTTTTCGCGCGAGTTCGTGCGCACTTACCTCTGTGCCTACCCCGAGAGGCCCATGGTGCGGCTGCACGCCGGACAGACGCTCAACACCGAGTGGAACGGCAAATGGTGGGAGTCCCGTGTGATCCAAGTAGATGCGTCCCTCGTGCAAGTGTACTTCGAGGAGGACAAGCGCACGGAGTGGATCTACCGCGGGTCCACCCGGCTGGAGCCGCTGTTCCTGGAGCTGCAGGCCGCCGTGAAGCCCAGGGGACGACACGTGCCAAGGACCAAGGCGATGGGGAGTATCAACAAGCCATACGTGGAGTATACAAGATCATACGAGCAGGAAAAATCTATTGACGCGCAGCAAGAGGAGTTGCGCCGACAACGAGCGGTGGCTAAGAAGTCCACGACAACCGCCACACCAGGCGTTCAGGAACAACAAGATCCCTTCGCTAGCAGAGTTGTCTACTACACTCCGCGCAACGCGGTGCGTCCGTACAAGATGACGACACACATCTGCGGGCCAAAGTGCAAGCGCACTGACGTGTTGACTCTGAAGGAGTTGCGCTCGTACAATCCCCTGGCGAAACCACTGCTAAGCGGGTGGGAGAGACAACTGGTCCGCAACAAGGGCGTGTCGTGCGTGCTGTACCGCGCGCCGTGCGGGCGCCGCCTGCGCCACGCGCGCGAGCTGCACCGCTACCTGCGCGCCACCCGCAGCGACCTGCCCGTCGACCTGTTCGACTTCAACCCCGACACGCACTGCCTGGCCGAGTTCGTGCTCGCCAAGTGCATCGTGGGGAAGAAGCTGCACCGCTACCTGCGCGCCACCCGCAGCGACCTGCCCGTCGACCTGTTCGACTTCAACCCCGACACGCACTGCCTGGCCGAGTTCGTGCTCGCCAAGTGCATCGTGGGGAAGAAGCTGCACCGCTACCTGCGCGCCACCCGCAGCGACCTGCCCGTCGACCTGTTCGACTTCAACCCCGACACGCACTGCCTGGCCGAGTTCGTGCTCGCCAAGTGCATCGTGGGGAAGAAGCTGCACCGCTACCTGCGCGCCACCCGCAGCGACCTGCCCGTCGACCTGTTCGACTTCAACCCCGACACGCACTGCCTGGCCGAGTTCGTGCTCGCCAAGTGCATCGTGGGGAAGAAGCTGCACCGCTACCTGCGCGCCACCCGCAGCGACCTGCCCGTCGACCTGTTCGACTTCAACCCCGACACGCACTGCCTGGCCGAGTTCGTGCTCGCCAAGTGCATCGTGGGGAAGAAGCTGCACCGCTACCTGCGCGCCACCCGCAGCGACCTGCCCGTCGACCTGTTCGACTTCAACCCCGACACGCACTGCCTGGCCGAGTTCGTGCTCGCCAAGTGCATCGTGGGGAAGAAGCTGCACCGCTACCTGCGCGCCACCCGCAGCGACCTGCCCGTCGACCTGTTCGACTTCAACCCCGACACGCACTGCCTGGCCGAGTTCGTGCTCGCCAAGTGCATCGTGGGGAAGAAGCTGCACCGCTACCTGCGCGCCACCCGCAGCGACCTGCCCGTCGACCTGTTCGACTTCAACCCCGACACGCACTGCCTGGCCGAGTTCGTGCTCGCCAAGTGCATCGTGGGGAAGAAGCTGCACCGCTACCTGCGCGCCACCCGCAGCGACCTGCCCGTCGACCTGTTCGACTTCAACCCCGACACGCACTGCCTGGCCGAGTTCGTGCTCGCCAAGTGCATCGTGGGGAAGAAGCTGCACCGCTACCTGCGCGCCACCCGCAGCGACCTGCCCGTCGACCTGTTCGACTTCAACCCCGACACGCACTGCCTGGCCGAGTTCGTGCTCGCCAAGTGCATCGTGGGGAAGAAGGACCTGTCTCACGGCAAGGAGAACGTGCCGGTGCCCTGTGTGAACAGCGTGGACGCGACACTCCCGGAGTTCTGCTCGTACAACACGGAGCGCACGCCCACGGCCGGCGTGCCGCTCAACCTCGACCCGGACTTCCTGTGCGGATGCGACTGCACCGACGACTGCGAGGATAAGACAAAGTGCGCATGTTGGAAGCTGACACTAGAGGGCGCCAAGACCATCGGCATGGAGGGCCCCAACATCGGCTACGACTACAAGAGACTGCCCGAGCCGCTGCCTTCCGGCATCTACGAGTGTAATGTCAGGTGTAAGTGTAAGCACACATGCCTGAACCGGGTCGCGCAACATCCGTTACAGCTCAAGTTGCAGGTGTTCAAGACTCCGAACCGCGGCTGGGGCATCCGCGCGCTCAACGACGTGCCCAAGGGCGCGTTCCTGTGCGTGTACGCGGGGAACCTGCTCACCGACGCCACCGCCAACCTCGACGGTTTGAACGAAGGCGACGAGTACCTCGCGGAATTGGACTACATCGAGGTGGTGGAGCAGATGAAGGAGGGATACGAGGAGGACGTGCCAGACGCTGACAAAATACTAGACCAGAAGGAGACAGAAGTGAAAGAAGAGAAATCGGAGGAGGAGGAATCCTCTTCTTCGGAAGAAGAGGAAGTAGTCTCCAAGAACGAGGAGCAAGACGACGACTTCAGACCAGGGTATATAGGATTAGGAGTTATGGAGTTCAAgaacagtagcaaaaccaaacaccttgaattgcaaagcaatgcttggcattccactccgctcgccatcctgagacataagatgttaagtcccaatttgtccaTAAGAGACTTCGTAAACGCGGAAaaagtaagaaagaagaaaaagaagaaccgaaagaagagcaggaacagaaaggcaaggagtcgaacgcagaagatgaCTGCATCACTATCAGCGACGACGAGGAAGTACGCGAACCGTCCAGATTCACCGCACAAACTGAAATGGGCGCCAACGAACACGTGCCTAAATACAGATCGGTTCGTTCGTATTTCGGCAAGGACGAGGCGTGCTACATCATGGATGCTAAGGTTCAAGGGCAACATTGGACGATATCTTAATCACTCGTGTTCCCCGAACGTGTTCGTGCAGAACGTGTTCGTGGACACGCACGACCCGCGCTTCCCGTGGGTGGCGTTCTTCGCGCTGAGCCACATCCGCGCCGGCACCGAGCTCACCTGGAACTACAACTACGACGTGGGCTCCGTGCCCGGCAAGGTGCTCTACTGCTACTGCGGCGCGCCCAACTGCAGGAGGCGGCTGTTGTAA
Protein Sequence: MADSKPKVGLEIFNLDSDDEDIGSSNKEFISGPAVGAGAGRGAARGTLRAARLRRRRPPARTLLPPLRRAAPATHAGTALHLTHIVFTAARLRRRRPPARTLLPPLRRAAPATHAGTALHLTHIVFTAARLRRRRPPARTLLPPLRRAAPATHAGTALHLTHIVFTAARLRRRRPPARTLLPPLRRAAPATHAGTALHLTHIVFTAARLRRRRPPARTLLPPLRRAAPATHAGTALHLTHIVFTAARLRRRRPPARTLLPPLRRAAPATHAGTALHLTHIVFTAARLRRRRPPARTLLPPLRRAAPATHAGTALHLTHIVFTAARLRRRRPPARTLLPPLRRAAPATHAGTALHLTHIVFTAARLRRRRPPARTLLPPLRRAAPATHAGTALHLTHIVFTAARLRRRRPPARTLLPPLRRAAPATHAGTALHLTHIVFTAARLRRRRPPARTLLPPLRRAAPATHAGTALHLTHIVFTAARLRRRRPPARTLLPPLRRAAPATHAGTALHLTHIVFTAARLRRRRPPARTLLPPLRRAAPATHAGTALHLTHIVFTAARLRRRRPPARTLLPPLRRAAPATHAGTALHLTHIVFTAARLRRRRPPARTLLPPLRRAAPATHAGTALHLTHIVFTAARLRRRRPPARTLLPPLRRAAPATHAGTALHLTHIVFTAARLRRRRPPARTLLPPLRRAAPATHAGTALHLTHIVFTAARLRRRRPPARTLLPPLRRAAPATHAGTALHLTHIVFTAARLRRRRPPARTLLPPLRRAAPATHAGTALHLTHIVFTAARLRRRRPPARTLLPPLRRAAPATHAGTALHLTHIVFTAARLRRRRPPARTLLPPLRRAAPATHAGTALHLTHIVFTAARLRRRRPPARTLLPPLRRAAPATHAGTALHLTHRELVEGIKNMTPLLELNMDRLDQDLVEISDSESEDEPNEPKDRIGEEGAKILEENLADIINSMWRKYKMDASLIDAKTLLDAETERLENESKEINKLLNECQAATDKLRGELYATFEPRRHHRPAIHIYDTAEIMTVEDENMSGDQNSVPETRQAKRRLSGPNIQPAKRPAIPLGYAPLDNDANQNAQQEYTAVLRVGESSRLDDDSEVSVVQLSCEAAPRDLPAPGEVSRPPLRAAMQVYAMSNNGHWYKARVVDQVRFLGSQPQFPSYRVRFEKRVKNPCRVVSARYLAYSEPADVRLTIGTRVIALFKETVNTNKKNTYSSGIIAEIPNPVNSYRYLIFFDDGYAQYASHAHTRVVCASATPVWEEVHPFSREFVRTYLCAYPERPMVRLHAGQTLNTEWNGKWWESRVIQVDASLVQVYFEEDKRTEWIYRGSTRLEPLFLELQAAVKPRGRHVPRTKAMGSINKPYVEYTRSYEQEKSIDAQQEELRRQRAVAKKSTTTATPGVQEQQDPFASRVVYYTPRNAVRPYKMTTHICGPKCKRTDVLTLKELRSYNPLAKPLLSGWERQLVRNKGVSCVLYRAPCGRRLRHARELHRYLRATRSDLPVDLFDFNPDTHCLAEFVLAKCIVGKKLHRYLRATRSDLPVDLFDFNPDTHCLAEFVLAKCIVGKKLHRYLRATRSDLPVDLFDFNPDTHCLAEFVLAKCIVGKKLHRYLRATRSDLPVDLFDFNPDTHCLAEFVLAKCIVGKKLHRYLRATRSDLPVDLFDFNPDTHCLAEFVLAKCIVGKKLHRYLRATRSDLPVDLFDFNPDTHCLAEFVLAKCIVGKKLHRYLRATRSDLPVDLFDFNPDTHCLAEFVLAKCIVGKKLHRYLRATRSDLPVDLFDFNPDTHCLAEFVLAKCIVGKKLHRYLRATRSDLPVDLFDFNPDTHCLAEFVLAKCIVGKKLHRYLRATRSDLPVDLFDFNPDTHCLAEFVLAKCIVGKKDLSHGKENVPVPCVNSVDATLPEFCSYNTERTPTAGVPLNLDPDFLCGCDCTDDCEDKTKCACWKLTLEGAKTIGMEGPNIGYDYKRLPEPLPSGIYECNVRCKCKHTCLNRVAQHPLQLKLQVFKTPNRGWGIRALNDVPKGAFLCVYAGNLLTDATANLDGLNEGDEYLAELDYIEVVEQMKEGYEEDVPDADKILDQKETEVKEEKSEEEESSSSEEEEVVSKNEEQDDDFRPGYIGLGVMEFKNSSKTKHLELQSNAWHSTPLAILRHKMLSPNLSIRDFVNAEKVRKKKKKNRKKSRNRKARSRTQKMTASLSATTRKYANRPDSPHKLKWAPTNTCLNTDRFVRISARTRRATSWMLRFKGNIGRYLNHSCSPNVFVQNVFVDTHDPRFPWVAFFALSHIRAGTELTWNYNYDVGSVPGKVLYCYCGAPNCRRRLL

Similar Transcription Factors

Sequence clustering based on sequence similarity using MMseqs2

100% Identity: -
90% Identity: -
80% Identity: -