Basic Information

Insect: Parnassius smintheus
Gene Symbol: -
Assembly: GCA_036936625.1
Location: JAUPFT010000028.1:14091862-14116021[+]

Transcription Factor Domain

TF Family: MBD
Domain: MBD domain
PFAM: PF01429
TF Group: Unclassified Structure
Description: The Methyl-CpG binding domain (MBD) binds to DNA that contains one or more symmetrically methylated CpGs [2]. DNA methylation in animals is associated with alterations in chromatin structure and silencing of gene expression. MBD has negligible non-specific affinity for DNA. In vitro foot-printing with MeCP2 showed the MBD can protect a 12 nucleotide region surrounding a methyl CpG pair [2]. MBDs are found in several Methyl-CpG binding proteins and also DNA demethylase [1].
Hmmscan Out: # of c-Evalue i-Evalue score bias hmm coord from hmm coord to ali coord from ali coord to env coord from env coord to acc

1 21 1.9e-12 3.5e-08 35.2 0.1 7 49 21 65 17 68 0.87

2 21 1.4e-07 0.0026 19.6 0.1 22 49 66 92 63 94 0.84

3 21 1.4e-07 0.0025 19.7 0.1 22 49 93 119 90 121 0.84

4 21 1.4e-07 0.0025 19.7 0.1 22 49 120 146 117 148 0.84

5 21 1.2e-07 0.0021 19.9 0.1 22 49 147 173 143 175 0.83

6 21 1.3e-07 0.0024 19.7 0.1 22 49 174 200 171 203 0.84

7 21 1.1e-07 0.002 20.0 0.1 22 49 201 227 197 230 0.84

8 21 1.1e-07 0.002 20.0 0.1 22 49 228 254 224 257 0.84

9 21 1.3e-07 0.0024 19.7 0.1 22 49 255 281 252 284 0.84

10 21 1.4e-07 0.0025 19.7 0.1 22 49 282 308 279 310 0.84

11 21 1.1e-07 0.002 20.0 0.1 22 50 309 336 306 349 0.85

12 21 9.4e-08 0.0017 20.2 0.1 22 49 361 387 342 390 0.82

13 21 1.2e-07 0.0021 19.9 0.1 22 49 388 414 384 416 0.83

14 21 1.3e-07 0.0024 19.7 0.1 22 49 415 441 412 444 0.84

15 21 1.4e-07 0.0025 19.7 0.1 22 49 442 468 439 470 0.84

16 21 2e-07 0.0037 19.1 0.1 23 49 470 495 468 497 0.84

17 21 1.2e-07 0.0021 19.9 0.1 22 49 496 522 492 524 0.83

18 21 1.2e-07 0.0021 19.9 0.1 22 49 523 549 519 551 0.83

19 21 1.2e-07 0.0021 19.9 0.1 22 49 550 576 546 578 0.83

20 21 1.6e-07 0.003 19.4 0.1 22 49 577 603 575 606 0.85

21 21 5.9e-07 0.011 17.6 0.1 22 48 604 629 601 633 0.83

#	of	c-Evalue	i-Evalue	score	bias	hmm coord from	hmm coord to	ali coord from	ali coord to	env coord from	env coord to	acc
1	21	1.9e-12	3.5e-08	35.2	0.1	7	49	21	65	17	68	0.87
2	21	1.4e-07	0.0026	19.6	0.1	22	49	66	92	63	94	0.84
3	21	1.4e-07	0.0025	19.7	0.1	22	49	93	119	90	121	0.84
4	21	1.4e-07	0.0025	19.7	0.1	22	49	120	146	117	148	0.84
5	21	1.2e-07	0.0021	19.9	0.1	22	49	147	173	143	175	0.83
6	21	1.3e-07	0.0024	19.7	0.1	22	49	174	200	171	203	0.84
7	21	1.1e-07	0.002	20.0	0.1	22	49	201	227	197	230	0.84
8	21	1.1e-07	0.002	20.0	0.1	22	49	228	254	224	257	0.84
9	21	1.3e-07	0.0024	19.7	0.1	22	49	255	281	252	284	0.84
10	21	1.4e-07	0.0025	19.7	0.1	22	49	282	308	279	310	0.84
11	21	1.1e-07	0.002	20.0	0.1	22	50	309	336	306	349	0.85
12	21	9.4e-08	0.0017	20.2	0.1	22	49	361	387	342	390	0.82
13	21	1.2e-07	0.0021	19.9	0.1	22	49	388	414	384	416	0.83
14	21	1.3e-07	0.0024	19.7	0.1	22	49	415	441	412	444	0.84
15	21	1.4e-07	0.0025	19.7	0.1	22	49	442	468	439	470	0.84
16	21	2e-07	0.0037	19.1	0.1	23	49	470	495	468	497	0.84
17	21	1.2e-07	0.0021	19.9	0.1	22	49	496	522	492	524	0.83
18	21	1.2e-07	0.0021	19.9	0.1	22	49	523	549	519	551	0.83
19	21	1.2e-07	0.0021	19.9	0.1	22	49	550	576	546	578	0.83
20	21	1.6e-07	0.003	19.4	0.1	22	49	577	603	575	606	0.85
21	21	5.9e-07	0.011	17.6	0.1	22	48	604	629	601	633	0.83

Sequence Information

Coding Sequence: ATGGGCGCGGCGCCGGGAATTCGCGGACGGCGCTCGACGATGGAGATGTCGTCGCCGCTGCTGCGAGCGCCGCTGGAGCGCGGCTGGCGGCGCGAGCTCGTGTACCGCGCCGCGCTCGACGCGCACTCGCGCCGCAACGCCGACATCTACTACTACACGCCGCAGGGCAAGAAGCTGCGTTCCACCAGGGAGGTACGTAGTGCCGCACCGCGCCGCAACGCCGACATCTACTACTACACGCCGCAGGGCAAGAAGCTGCGCTCCACCAGGGAGGTACGTAGTGCCGCACCGCGCCGCAACGCCGACATCTACTACTACACGCCGCAGGGCAAGAAGCTGCGCTCCACAAGGGAGGTACGTAGTGCCGCACCGCGCCGCAACGCCGACATCTACTACTACACGCCGCAGGGCAAGAAGCTGCGCTCCACCAGGGAGGTACGTAGTGCCGCACCGCGCCGCAACGCCGACATCTACTACTACACGCCGCAGGGCAAGAAGCTGCGCTCCACCAGGGAGGTACGTAGTGCCGCACCGCGCCGCAACGCCGACATCTACTACTACACGCCGCAGGGCAAGAAGCTGCGCTCCACCAGGGAGGTACGTAGTGCCGCACCGCGCCGCAACGCCGACATCTACTACTACACGCCGCAGGGCAAGAAGCTGCGCTCCACCAGGGAGGTACGTAGTGCCGCACCGCGCCGCAACGCCGACATCTACTACTACACGCCGCAGGGCAAGAAGCTGCGCTCCACCAGGGAGGTACGTAGTGCCGCACCGCGCCGCAACGCCGACATCTACTACTACACGCCGCAGGGCAAGAAGCTGCGCTCCACCAGGGAGGTACGTAGTGCCGCACCGCGCCGCAACGCCGACATCTACTACTACACGCCGCAGGGCAAGAAGCTGCGCTCCACCAGGGAGGTACGTAGTGCCGCACCGCGCCGCAACGCCGACATCTACTACTACACGCCGCAGGGCAAGAAGCTGCGTTCCACCAGGGAGGTACGTAGTGCCGCAACGCCGACATCTACTACTACACGCCGCAGGGCAAGAAGCTGCGCTCCACCAGGGAGGGAGGTACGTAGTGCCGCACCGCGCCGCAACGCCGACATCTACTACTACACGCCGCAGGGCAAGAAGCTGCGTTCCACCAGGGAGGTACGTAGTGCCGCACCGCGCCGCAACGCCGACATCTACTACTACACGCCGCAGGGCAAGAAGCTGCGCTCCACCAGGGAGGTACGTAGTGCCGCACCGCGCCGCAACGCCGACATCTACTACTACACGCCGCAGGGCAAGAAGCTGCGCTCCACCAGGGAGGTACGTAGTGCCGCACCGCGCCGCAACGCCGACATCTACTACTACACGCCGCAGGGCAAGAAGCTGCGCTCCACCAGGGAGGTACGTAGTGCCGCACCGCGCCGCAACGCCGACATCTACTACTACACGCCGCAGGGCAAGAAGCTGCGTTCCACCAGGGAGGTACGTAGTGCCGCACCGCGCCGCAACGCCGACATCTACTACTACACGCCGCAGGGCAAGAAGCTGCGTTCCACCAGGGAGGTACGTAGTGCCGCACCGCGACGCAACGCCGACATCTACTACTACACGCCGCAGGGCAAGAAGCTGCGCTCCACCAGGGAGGTACGTAGTGCCGCACCGCGCCGCAATGCCGACATCTACTACTACACGCCGCAGGGCAAGAAGCTGCGCTCCACCAGGGAGGTACGTAGTGCCGCACCGCGCCGCAACGCCGACATCTACTACTACACGCCGCAGGGCAAGAAGCTGCGCTCCACCAGGGAGGTACGTAGTGCCGCACCGCGCCGCAACGCCGACATCTACTACTACACGCCGCAGGGCAAGAAGCTGCGCTCCACCAGGGAGAGTGACATTCTAAGTTCTGAATTATGTGATAATCGTTATGACGTCATGCGTTTAGACCGTAACTTACCCCAAACACAGAAAAAAACTGGTGGTGGTATAATGGCTTGCATAAGGAGCGAATATGGAGCTGGACAAATGCATGGTTTTAGTTCTAACCTTAATACTGAGTTACTCTGTATAACGTTACCTGCAGGTGAATTGGGAACTAAATGTAACCTAAATATTATTTTGGTATATATTCCTCCTGACTCATATAATATACCATCGCAACTAAATGAAGTAAACAGCTTTGTCACATCATTAACTGAGCGGTACCCAGAGGACACATGCCTATTGGTGGGTGACTTTAATCTTCGTTGCTTTAAATGGCAGGATGGTCATCACGAATTACTTCATAACATGAGTATGGAAATTCAGGATGCAGCACTATCGCTTGCGGAGGGTATGACTTTCTTGGGCTTAAAacaatttaatagtattttaaatgGTAACAGACGTACACTGGACTTAGTGTTCTGCAATCTAAACACAGAAGTTCTAAGATGTTCTTCCCCTCTTTTGACAGAGGACAAACATCACCCTTCTTTGTATATTGACATCACTGATCTATTTGTGACCCCTTTCAAAGAAGTCGTCACACCGCGACGTGATTTTTACAAATGTGATTATGTTGCAATTAATAACTTCTTTATACAAACTGATTGGGATGGTACGCTGCAGAATAAATCGATAGACGTGGCTACGACATTATTTTACAGTAAATTAGAAGAATGTCTTGATCAATTtgtacctttaaaaaataaaactagcacTAAAGAATACTATCCCATTTGGTATAACTCTGCTTTAATAAAAGTCATACGTGAAAAGAGCAAGATACATAACAAATGGAAACGCTTTAGGAATCCTCGAGATTACGATGAGTTTGCTTTGCTACGTTCTCGTGAAAAATTACTTCAGCAACAATGTTTTAATAAGTATATCAACTGCATAGAGGATAGGATTCATCTCACTCCCAAGGCTTTTTGGTCATACGTTAAATCGAAGCGTGGTGGTTCTCGATTCCCCAAGCAATTAAGTTACCAGGGTAAGTCCATTACTGATGGCAATGCTATATGTActgaatttaataattactttaagagtaCGTTTTCTGGTTCTTGCCCTCAGAGTGCTAGATCTGTAAATGGTGACGGTGAATGTTGCACCTTTGACACAATATCTGGTCTAACCGTAACAAAGGATGACGTTTTTAATATGCTTAAGACGCTAGATGTTTCTAAAGGCCCTGGGTGTGATGGAGTAGCACCCGTTGCCGAGAATTTAGCAGGAACTGGTCTAACTTTAGAAAATTTTTCCTTCTTCAAAGAACCACTTGGTGTGGATGATCCTGATAAAGAAATTATACGAGATGCTAAATTAATGCGTCGCGTGGAGTCTCCAGTCCCAGTTCCTGTGGCGCCCACGATAGAAGGCAAGCGGACGCCGAAGCCCAAACCTCCCAAAGGTGCCAGCCCAGAGCCAGCTACACCAAAGTCACCACCTGCTAAAATCAAGGTGAAGTCTGTAGGTTCACGTTTGAGTAACAATGGAACCCCTCCAGCTGCCAGTGTGCAAAAACAGCTGCGGCGCACGCAGTCCACAACTGCGACAGCTGCCAGCCCCGCCCCCGCTTCCTCTCCTGCCCCCGCTACCGCTAACGCTGTGGACAACAACAACACTGCTGCCTGGAAGAAACCTAGCTCGCTGTCATCTATGACTGCTTCATCACCATTCGCCAGGCGCAATCGCAGTGAATACCATAAATTTCAAGAACATCTCAATATTAACAAGCACATACACATAACAAGCACAGcatgTTTGTACCTGTGTTGTCGATTTCCGGCGCAGAACCCGCAGCAGGTGGTGCAGCCGTGCTCGATGTCGTGCGGGCGCGGGGCCGTGCCGTCGCTGGCGTGCGTCGCTTGCCTGTGCCTGTACCACCCCGCCTGCGCCGGCCTGCCGCCCGCACTGCTGCAGCACCAACACTTCCTGTGCAAGAACTGCCGTAAAACATCATCACCACCGTTAGAGCCACCTCCCCTGACGCACAAGTCTGGGGCCACAGCCAGTGCGGCGAGCGGAGCGGTAGCGGCAGCGGGGGCGGGGAGCGGGGCGGTTGCAGCGAGGCGACCCGCCCCGGTGTCCATCCCACCAACCATCTCAGCTAAAGTGCGACCTGACAAACGAGTCATGTTGCGGATGAAGGTGGCAGGCGGTGGCGCGGACGGGTCTCGTGTTTGGGCGGTAGCAGCGTCCACTGCTGGCAGCGGAGGGGCCGGGGCCACGAGCGGAGCGGTTGGGGCCACGAGCGGAGCGACAGGGGCCACAAGCGGAGTGGGCGGCGGGGCCACAAGCGGAGCGGGTGGCGGGGCCACAAGCGGAGCGGGCTGTGGACCTCCATCAGGCGTCAGGCCGACACTACCACAATCTCTCGCAGTACTCAACGGCAGGCGCTTCATCGTAGTACCTCGCTCGCTTGTGAACTCCGATCAACACTGA
Protein Sequence: MGAAPGIRGRRSTMEMSSPLLRAPLERGWRRELVYRAALDAHSRRNADIYYYTPQGKKLRSTREVRSAAPRRNADIYYYTPQGKKLRSTREVRSAAPRRNADIYYYTPQGKKLRSTREVRSAAPRRNADIYYYTPQGKKLRSTREVRSAAPRRNADIYYYTPQGKKLRSTREVRSAAPRRNADIYYYTPQGKKLRSTREVRSAAPRRNADIYYYTPQGKKLRSTREVRSAAPRRNADIYYYTPQGKKLRSTREVRSAAPRRNADIYYYTPQGKKLRSTREVRSAAPRRNADIYYYTPQGKKLRSTREVRSAAPRRNADIYYYTPQGKKLRSTREVRSAATPTSTTTRRRARSCAPPGREVRSAAPRRNADIYYYTPQGKKLRSTREVRSAAPRRNADIYYYTPQGKKLRSTREVRSAAPRRNADIYYYTPQGKKLRSTREVRSAAPRRNADIYYYTPQGKKLRSTREVRSAAPRRNADIYYYTPQGKKLRSTREVRSAAPRRNADIYYYTPQGKKLRSTREVRSAAPRRNADIYYYTPQGKKLRSTREVRSAAPRRNADIYYYTPQGKKLRSTREVRSAAPRRNADIYYYTPQGKKLRSTREVRSAAPRRNADIYYYTPQGKKLRSTRESDILSSELCDNRYDVMRLDRNLPQTQKKTGGGIMACIRSEYGAGQMHGFSSNLNTELLCITLPAGELGTKCNLNIILVYIPPDSYNIPSQLNEVNSFVTSLTERYPEDTCLLVGDFNLRCFKWQDGHHELLHNMSMEIQDAALSLAEGMTFLGLKQFNSILNGNRRTLDLVFCNLNTEVLRCSSPLLTEDKHHPSLYIDITDLFVTPFKEVVTPRRDFYKCDYVAINNFFIQTDWDGTLQNKSIDVATTLFYSKLEECLDQFVPLKNKTSTKEYYPIWYNSALIKVIREKSKIHNKWKRFRNPRDYDEFALLRSREKLLQQQCFNKYINCIEDRIHLTPKAFWSYVKSKRGGSRFPKQLSYQGKSITDGNAICTEFNNYFKSTFSGSCPQSARSVNGDGECCTFDTISGLTVTKDDVFNMLKTLDVSKGPGCDGVAPVAENLAGTGLTLENFSFFKEPLGVDDPDKEIIRDAKLMRRVESPVPVPVAPTIEGKRTPKPKPPKGASPEPATPKSPPAKIKVKSVGSRLSNNGTPPAASVQKQLRRTQSTTATAASPAPASSPAPATANAVDNNNTAAWKKPSSLSSMTASSPFARRNRSEYHKFQEHLNINKHIHITSTACLYLCCRFPAQNPQQVVQPCSMSCGRGAVPSLACVACLCLYHPACAGLPPALLQHQHFLCKNCRKTSSPPLEPPPLTHKSGATASAASGAVAAAGAGSGAVAARRPAPVSIPPTISAKVRPDKRVMLRMKVAGGGADGSRVWAVAASTAGSGGAGATSGAVGATSGATGATSGVGGGATSGAGGGATSGAGCGPPSGVRPTLPQSLAVLNGRRFIVVPRSLVNSDQH

Similar Transcription Factors

Sequence clustering based on sequence similarity using MMseqs2

100% Identity: -
90% Identity: -
80% Identity: -