Basic Information

Insect: Pyrausta purpuralis
Gene Symbol: -
Assembly: GCA_963924145.1
Location: OZ001666.1:4287147-4301016[-]

Transcription Factor Domain

TF Family: MBD
Domain: MBD domain
PFAM: PF01429
TF Group: Unclassified Structure
Description: The Methyl-CpG binding domain (MBD) binds to DNA that contains one or more symmetrically methylated CpGs [2]. DNA methylation in animals is associated with alterations in chromatin structure and silencing of gene expression. MBD has negligible non-specific affinity for DNA. In vitro foot-printing with MeCP2 showed the MBD can protect a 12 nucleotide region surrounding a methyl CpG pair [2]. MBDs are found in several Methyl-CpG binding proteins and also DNA demethylase [1].
Hmmscan Out: # of c-Evalue i-Evalue score bias hmm coord from hmm coord to ali coord from ali coord to env coord from env coord to acc

1 7 2e-13 2.3e-09 38.6 0.1 7 52 260 307 255 314 0.88

2 7 4.5e-08 0.00052 21.4 0.1 27 52 315 340 308 347 0.89

3 7 4.3e-08 0.00049 21.5 0.1 27 52 348 373 341 381 0.88

4 7 4.3e-08 0.00049 21.5 0.1 27 52 381 406 374 414 0.88

5 7 6.3e-08 0.00072 21.0 0.1 27 52 414 439 407 448 0.88

6 7 6.9e-08 0.0008 20.9 0.1 27 52 447 472 440 479 0.88

7 7 1e-10 1.1e-06 30.0 0.0 27 70 480 519 473 524 0.89

#	of	c-Evalue	i-Evalue	score	bias	hmm coord from	hmm coord to	ali coord from	ali coord to	env coord from	env coord to	acc
1	7	2e-13	2.3e-09	38.6	0.1	7	52	260	307	255	314	0.88
2	7	4.5e-08	0.00052	21.4	0.1	27	52	315	340	308	347	0.89
3	7	4.3e-08	0.00049	21.5	0.1	27	52	348	373	341	381	0.88
4	7	4.3e-08	0.00049	21.5	0.1	27	52	381	406	374	414	0.88
5	7	6.3e-08	0.00072	21.0	0.1	27	52	414	439	407	448	0.88
6	7	6.9e-08	0.0008	20.9	0.1	27	52	447	472	440	479	0.88
7	7	1e-10	1.1e-06	30.0	0.0	27	70	480	519	473	524	0.89

Sequence Information

Coding Sequence: ATGTCGGAAGAAATGGCGTTAGGTGATAACGTTCCGAGCGATGATGCTAAGTTGAACGATGACGAAGTTGCGGCTGCGAGCGCCGTGGAGGGCGATGCGCCTCCTGTGGAGGCTCCGTCTGGCCCAGAGGAGCCCCCGGCGGAGGATGCACCAGCTGAGGATTCGACAAAATGTGCAGTTGATGAAACGGACTCTAAGCACGAACTTGACGTTAAACCAGTTATTGAAGATGATAAAACTGACGTAAAAGATGAAACTTTAGACACCAAAGATGAAATACCTGTTATTAATGATGAGAAATCAGATAACACTAAAGTGGAAGAAGAGTCGGAATCAACTGTGCCAAAAGACAAACTGGCAATGCAAGATGATGCTGCTGGAGATGGCCAAGACATGGAAGTGGATAATGGAACAGATGAGCGTCGAGGGCTGAAGAGAAGAGCATCTGCTGCATTCAGTGATGCCGGGAATGATGATTTTGTTGGCTTTGAAGTAGCAGACACTAGTGACTTGACTGGATACAATCGTGTTCTTGAACGTCTGGAGGCTGAAGTTTCAGCAGCCAGCAAAGACTTTAAGCCTGTGCGAAGTGTGATGGCTTCACCTTTGGCCCCACTTAGGGCTTCAAAGCGGGCTCGGCAGGACACAGATGGATCTAGACCCTCGTCAGCATTATCATCAAGGTCAGATGGAGATGGAGGCATCTCCACAGATGCAGCATCGTCGCCCCTGAACCGCGGCAACCGTCGCGCGACCACCGAGATGTCTTCGCCGCTGCTGCGCGTGCCGCTCGAGCGCGGCTGGAAGCGCGAGCTGGTGCACCGCGCAGCTCTGGACGCGCACTCGCGACGCAACGCGGACATATACTACTACACGCCGCAGGGGAAGAAGCTGCGGTCCACTAGGGAGACCATTGAGTACCGCGCAGCTCTGGACGCGCACTCGCGACGCAACGCGGACATATACTACTACACGCCGCAGGGGAAGAAGCTGCGGTCCACTAGGGAGACCATTGAGTACCGCGCAGCTCTGGACGCGCACTCGCGACGCAACGCGGACATATACTACTACACGCCGCAGGGGAAGAAGCTGCGGTCCACTAGGGAGACCATTGAGTACCGCGCAGCTCTGGACGCGCACTCGCGACGCAATGCGGACATATACTACTACACGCCGCAGGGGAAGAAGCTGCGGTCCACTAGGGAGACCATTGAGTACCGCGCAGCTCTGGACGCGCACTCGCGACGCAACGCGGACATATACTACTACACGCCGCAGGGGAAGAAGCTGCGGTCCACTAGGGAGACCACAGAGTACCGCGCAGCTCTGGACGCGCACTCGCGACGCAACGCGGACATATACTACTACACGCCGCAGGGGAAGAAGCTGCGGTCCACTAGGGAGACCACAGAGTACCGCGCAGCTCTGGACGCGCACTCGCGACGCAACGCGGACATATACTACTACACGCCGCAGGGGAAGAAGCTGCGTTCCACTAGGGAGGTGTCAGAGCATTTATCAGGAACAGGACTGACTTTAGAAAACTTTTCATTCTTCAAAGAGCCATTAGGGGTCGACGACCCTGAGAAGGAAATTATTCGCGACGCGCGCCTGATGTCGGGGCGTCGCGGCGAGTCGCCGGTGGCCGCGGCGGACAAGCGCGCGCCGCGGCCCCGCGCGCCCGCcccggcccccgcccccgcccccgccagCCCCGACCCCGCCGCCGCGTCGCCGCCCGCCAAGATTAGGGTGAAATCAATGGGGTCCCGTCTCAGCAACAGCGGGCCAGCGtccgctcccgctcccgctGCCGCTACTGCCACGCCCACCGCTAAGGCTAAGAAGGCCGCGCCCACAGACAACAACAATAGTGCCGCGTGGAAGAAGCCCAGGCCGCCGTCCGCTGCCGCCGTGACGTCCGTGACGTCCGTGACGGCGACGGCAGCTGTGCCGGCGTCCGTGCCGTCGACGCCTCCGCCGCTGCAGAGCCGGCCCGTGGTACACTCGTCGCCTGAACAGgaGCAATCGCCAAACCGGCAGGTCATCCAGCCCTGTTCTTTGACTTGCGGTCGCGGAGTACCATCTTTAGCGTGCGCGGCCTGTCTCTGCCTGTACCACCCTGCCTGTCTGCAGCACCATGGACCGGTGCCGCAGCCGTTCTACTGCAAGGTAACACTGCATACCATGTCCGGAACTGGACTGAACCTGGAACGAAACGAAACTAGATCCGTTAACATGTGCATAGCTTGTCCTGAACTGGATTGA
Protein Sequence: MSEEMALGDNVPSDDAKLNDDEVAAASAVEGDAPPVEAPSGPEEPPAEDAPAEDSTKCAVDETDSKHELDVKPVIEDDKTDVKDETLDTKDEIPVINDEKSDNTKVEEESESTVPKDKLAMQDDAAGDGQDMEVDNGTDERRGLKRRASAAFSDAGNDDFVGFEVADTSDLTGYNRVLERLEAEVSAASKDFKPVRSVMASPLAPLRASKRARQDTDGSRPSSALSSRSDGDGGISTDAASSPLNRGNRRATTEMSSPLLRVPLERGWKRELVHRAALDAHSRRNADIYYYTPQGKKLRSTRETIEYRAALDAHSRRNADIYYYTPQGKKLRSTRETIEYRAALDAHSRRNADIYYYTPQGKKLRSTRETIEYRAALDAHSRRNADIYYYTPQGKKLRSTRETIEYRAALDAHSRRNADIYYYTPQGKKLRSTRETTEYRAALDAHSRRNADIYYYTPQGKKLRSTRETTEYRAALDAHSRRNADIYYYTPQGKKLRSTREVSEHLSGTGLTLENFSFFKEPLGVDDPEKEIIRDARLMSGRRGESPVAAADKRAPRPRAPAPAPAPAPASPDPAAASPPAKIRVKSMGSRLSNSGPASAPAPAAATATPTAKAKKAAPTDNNNSAAWKKPRPPSAAAVTSVTSVTATAAVPASVPSTPPPLQSRPVVHSSPEQEQSPNRQVIQPCSLTCGRGVPSLACAACLCLYHPACLQHHGPVPQPFYCKVTLHTMSGTGLNLERNETRSVNMCIACPELD

Similar Transcription Factors

Sequence clustering based on sequence similarity using MMseqs2

100% Identity: -
90% Identity: -
80% Identity: -