Basic Information

Insect: Parnassius apollo
Gene Symbol: -
Assembly: GCA_907164705.1
Location: CAJQZP010001179.1:241309-308843[+]

Transcription Factor Domain

TF Family: MBD
Domain: MBD domain
PFAM: PF01429
TF Group: Unclassified Structure
Description: The Methyl-CpG binding domain (MBD) binds to DNA that contains one or more symmetrically methylated CpGs [2]. DNA methylation in animals is associated with alterations in chromatin structure and silencing of gene expression. MBD has negligible non-specific affinity for DNA. In vitro foot-printing with MeCP2 showed the MBD can protect a 12 nucleotide region surrounding a methyl CpG pair [2]. MBDs are found in several Methyl-CpG binding proteins and also DNA demethylase [1].
Hmmscan Out: # of c-Evalue i-Evalue score bias hmm coord from hmm coord to ali coord from ali coord to env coord from env coord to acc

1 17 1.4e-12 7.8e-09 35.7 0.1 7 49 220 264 216 267 0.87

2 17 3.7e-06 0.021 15.1 0.2 22 50 265 292 261 298 0.83

3 17 2.3e-05 0.13 12.5 0.1 29 49 298 318 291 320 0.81

4 17 1e-07 0.00056 20.1 0.1 22 49 319 345 316 347 0.84

5 17 7.9e-08 0.00045 20.4 0.1 22 49 346 372 342 375 0.84

6 17 8.4e-06 0.048 13.9 0.1 22 49 373 399 371 401 0.84

7 17 6.5e-06 0.037 14.3 0.1 22 49 400 426 397 429 0.84

8 17 8e-08 0.00045 20.4 0.1 22 49 427 453 423 456 0.84

9 17 9.8e-08 0.00056 20.1 0.1 22 49 454 480 451 482 0.84

10 17 1.8e-07 0.001 19.3 0.1 22 49 481 507 479 510 0.83

11 17 7.7e-08 0.00044 20.5 0.1 22 49 508 534 504 538 0.84

12 17 1.4e-05 0.081 13.2 0.1 25 49 537 561 531 563 0.82

13 17 9.8e-08 0.00056 20.1 0.1 22 49 562 588 559 590 0.84

14 17 9.8e-08 0.00056 20.1 0.1 22 49 589 615 586 617 0.84

15 17 1.6e-07 0.00088 19.5 0.1 22 49 616 642 613 644 0.82

16 17 5.7e-06 0.032 14.5 0.1 22 49 643 669 639 671 0.83

17 17 1.1e-08 6.2e-05 23.2 0.0 22 70 670 713 666 718 0.86

#	of	c-Evalue	i-Evalue	score	bias	hmm coord from	hmm coord to	ali coord from	ali coord to	env coord from	env coord to	acc
1	17	1.4e-12	7.8e-09	35.7	0.1	7	49	220	264	216	267	0.87
2	17	3.7e-06	0.021	15.1	0.2	22	50	265	292	261	298	0.83
3	17	2.3e-05	0.13	12.5	0.1	29	49	298	318	291	320	0.81
4	17	1e-07	0.00056	20.1	0.1	22	49	319	345	316	347	0.84
5	17	7.9e-08	0.00045	20.4	0.1	22	49	346	372	342	375	0.84
6	17	8.4e-06	0.048	13.9	0.1	22	49	373	399	371	401	0.84
7	17	6.5e-06	0.037	14.3	0.1	22	49	400	426	397	429	0.84
8	17	8e-08	0.00045	20.4	0.1	22	49	427	453	423	456	0.84
9	17	9.8e-08	0.00056	20.1	0.1	22	49	454	480	451	482	0.84
10	17	1.8e-07	0.001	19.3	0.1	22	49	481	507	479	510	0.83
11	17	7.7e-08	0.00044	20.5	0.1	22	49	508	534	504	538	0.84
12	17	1.4e-05	0.081	13.2	0.1	25	49	537	561	531	563	0.82
13	17	9.8e-08	0.00056	20.1	0.1	22	49	562	588	559	590	0.84
14	17	9.8e-08	0.00056	20.1	0.1	22	49	589	615	586	617	0.84
15	17	1.6e-07	0.00088	19.5	0.1	22	49	616	642	613	644	0.82
16	17	5.7e-06	0.032	14.5	0.1	22	49	643	669	639	671	0.83
17	17	1.1e-08	6.2e-05	23.2	0.0	22	70	670	713	666	718	0.86

Sequence Information

Coding Sequence: ATGTCAGACGAAATGGCGGTGGGTGATAATTCGACAAGCGATGAGAGTAAAGTAAACAGCAATGATACTGCGGAGGAGAATGTTAAAGGTGCTGGTGAAATCAGTCCGAAGCCATCGAGTGAACCGCCTGAAACAGAGGAAGCACAGGTTCCTGTGGATGATGCACCAGAAACGGAAACAATAGGTGAACAAAAGTCAGATACTGAAAAAAAAGAAGCTGAAGACATACCCTCACAAGAAATCACAGAAGAAAATTCTGATGAAGAGAAGAGGGGTATCAAACGTCGAGCATCTATTGCGTTTAGCGATACTGGAGATGAGGAGTTTAAGggatttgataaaataaatgacgaGAATTTTTGTGGAGTATACTACCGTGTATTAGAACGCTTGGAGGAGGAAGTACAAACAGCTGTTAAAGATCTTAAGCCTGTCAGGAGTTTTCGGGCTTCTCTAACAGCTTCAGTGCAGGCAAGCAAAAGGCCACGACAGGACACAGATGGATCCAGACCATCATCAGCTTTATCATCACGGTCAGATGGTGATAGCACAGagTGCTCCCATTCTTCAACTGTCACTGCTGGAAATGTTGCACGGATGGGCGCGGCGCCGGGAATTCGCGGGCGGCGCTCGACGACGGAGATGTCGTCGCCGCTGCTGCGAGCGCCGCTGGAGCGCGGCTGGCGGCGCGAGCTCGTGTACCGCGCCGCGCTCGACGCGCACTCGCGCCGCAACGCCGACATCTACTACTATACGCCGCAGGGCAAGAAGCTGCGCTCCACCAGGGAGGTACGTAGTGCCGCACCGCGCCGCAACGCCGACATCTACTACTACACGCCGCAGAGCAAGAAGCTGCGCTCCACCAGGGAGGTACGTAGTGTCGTACCGCGCCGCAACGCCGACATCTACTACTACACGCCGCAGAGCAAGAAGCTGCGCTCCACCAGGGAGGTACGTAGTGCCGCACCGCGCCGCAACGCTGACATCTACTACTACACGCCGCAGGGCAAGAAGCTGCGCTCCACCAGGGAGGTACGTAGTGCCGCACCGCGCCGCAACGCTGACATCTACTACTACACGCCGCAGGGCAAGAAGCTGCGCTCCACCAGGGAGGTACGTAGTGCCGCACCGCGCCGCAACGCCGACATCTACTACTACACGCCGCAGAGCAAGAAGCTGCGCTCCACCAGGGAGGTACGTAGTGCCGCACCGCGCCGCAACGCTGACATCTACTACTACACGCCGCAGAGCAAGAAGCTGCGCTCCACCAGGGAGGTACGTAGTGCCGCACCGCGCCGCAACGCTGACATCTACTACTACACGCCGCAGGGCAAGAAGCTGCGCTCCACCAGGGAGGTACGTAGTGCCGCACCGCGCCGCAACGCCGACATCTACTACTACACGCCGCAGGGCAAGAAGCTGCGCTCCACCAGGGAGGTACGTAGTGACGCACCGCGCCGCAACGCCGACATCTACTACTACACGCCGCAGGGCAAGAAGCTGCGCTCCACCAGGGAGGTACGTAGTGCCGCACCGCGCCGCAACGCTGACATCTACTACTACACGCCGCAGGGCAAGAAGCTGCGCTCCACCAGGGAGGTACGTAGTGCCGTACCGCGCCGCAACGCCGACATCTACTACTACACGCCGCAGAGCAAGAAGCTGCGCTCCACCAGGGAGGTACGTAGTGCCGCACCGCGCCGCAACGCTGACATCTACTACTACACGCCGCAGGGCAAGAAGCTGCGCTCCACCAGGGAGGTACGTAGTGCCGCACCGCGCCGCAACGCCGACATCTACTACTACACGCCGCAGGGCAAGAAGCTGCGCTCCACCAGGGAGGTACGTAGTGACGCACCGCGCCGCAACGCCGACATCTACTACTACACGCCGCAGGGCAAGAAGCTGCGCTCCACCAGGGAGGTACGTAGTGCCGCACCGCGCCGCAACGCCGACATCTACTACTACACGCCGCAGAGCAAGAAGCTGCGCTCCACCAGGGAGGTACGTAGTGCCGCACCGCGCCGCAACGCCGACATCTACTACTACACGCCGCAGAGCAAGAAGCTGCGCTCCACCAGGGAGgtTGCCGAGAATTTAGCAGGAACTGGTCTAACTTTAGAAAACTTTTCCTTCTTCAAAGAACCACTTGGTGTGGATGATCCTGAGAAGGAAATTATACGAGATGCTAAATTAATGCGTCGCGTGGAGTCTCCAGTCCCAGTTCCTGCGGCGCCCACGATAGAAGGCAAGCGGACGCCGAAGCCCAAACCTCCCAAAGGTGCCAGCCCGGAGCCAGCTACACCAAAGTCACCACCTGCTAAAATCAAGGTGAAGTCTGTAGGCTCACGTTTAAGTAACAATGGGACCCCTCCAGCTGCCAGTGTGCCCAAACAGCCGCGGCGCCCGCAGTCCACAGCTGCGACAGCTGCCAGCCCCGCCCCCGCTTCCTCTCCTGCCCCCGCTACCGCTAACGCTGTGGACAACAACAACACTGCTGCCTGGAAGAAACCTAGGGCGGCGGCGCTGGCGCTCCCGCAGCCGCCACCGCTGCCGCCGCCGCAACAGCTCCCGCTCCCGCTCCCGCCGCCGCTCACgctgccgccgccgccgccgccgccgcttcAGAGCCGCCCGCTCCAGGTGCCCGCCGATACTGCTGTACAGAACCCGCAGCAGGTGGTGCAGCCGTGCTCGATGTCGTGTGGGCGCGGAGCCGTGCCGTCGCTGGCGTGCGTTGCTTGCCTGTGCCTGTACCACCCCGCCTGCGCCGGCCTGCCGCCCGCACTGCTGCAGCACCAACACTTCCTGTGCAAGAACTGCCGCAAAACATCATCACCACCATTAGAACCACCTCCCCTGACGCACAAGTCTGGGGCCACAGCCAGTGCAGCGAGCGGAGCGGGGGCGGGAAGCGGGGCGGTTGCAGCGAGGCGACCCGCCCCGGTGTCCGTCCCACCAACCGTCTCAGCTAAAGTGCGACCTGACAAACGAGTCATGTTGCGGATGAAGGTGGCAGGCGGTGGCGCGGACGGGTCTCGTGTTTGGGCAGTAGCAGCGCCCACAGCTGGCAGTGGAGCGGGCGGGGCCACGAGCGGAGCGTTAGGGGCCACGAGCGGAGCGGTAGGGGCCACTAGCGGAGCGACAGGGGCCACAAGCGGAGGGGGCGGCGGGGCCACAAGCGGAGCGGGCTGTGGACCTCCATCAGGCGTCAGGCCAACGTTACCACAATCTCTCGCAGTACTCAACGGCAGGCGCTTCATCGTCGTACCTCGCTCGCTTGTGAACTCCGATCAACATTAA
Protein Sequence: MSDEMAVGDNSTSDESKVNSNDTAEENVKGAGEISPKPSSEPPETEEAQVPVDDAPETETIGEQKSDTEKKEAEDIPSQEITEENSDEEKRGIKRRASIAFSDTGDEEFKGFDKINDENFCGVYYRVLERLEEEVQTAVKDLKPVRSFRASLTASVQASKRPRQDTDGSRPSSALSSRSDGDSTECSHSSTVTAGNVARMGAAPGIRGRRSTTEMSSPLLRAPLERGWRRELVYRAALDAHSRRNADIYYYTPQGKKLRSTREVRSAAPRRNADIYYYTPQSKKLRSTREVRSVVPRRNADIYYYTPQSKKLRSTREVRSAAPRRNADIYYYTPQGKKLRSTREVRSAAPRRNADIYYYTPQGKKLRSTREVRSAAPRRNADIYYYTPQSKKLRSTREVRSAAPRRNADIYYYTPQSKKLRSTREVRSAAPRRNADIYYYTPQGKKLRSTREVRSAAPRRNADIYYYTPQGKKLRSTREVRSDAPRRNADIYYYTPQGKKLRSTREVRSAAPRRNADIYYYTPQGKKLRSTREVRSAVPRRNADIYYYTPQSKKLRSTREVRSAAPRRNADIYYYTPQGKKLRSTREVRSAAPRRNADIYYYTPQGKKLRSTREVRSDAPRRNADIYYYTPQGKKLRSTREVRSAAPRRNADIYYYTPQSKKLRSTREVRSAAPRRNADIYYYTPQSKKLRSTREVAENLAGTGLTLENFSFFKEPLGVDDPEKEIIRDAKLMRRVESPVPVPAAPTIEGKRTPKPKPPKGASPEPATPKSPPAKIKVKSVGSRLSNNGTPPAASVPKQPRRPQSTAATAASPAPASSPAPATANAVDNNNTAAWKKPRAAALALPQPPPLPPPQQLPLPLPPPLTLPPPPPPPLQSRPLQVPADTAVQNPQQVVQPCSMSCGRGAVPSLACVACLCLYHPACAGLPPALLQHQHFLCKNCRKTSSPPLEPPPLTHKSGATASAASGAGAGSGAVAARRPAPVSVPPTVSAKVRPDKRVMLRMKVAGGGADGSRVWAVAAPTAGSGAGGATSGALGATSGAVGATSGATGATSGGGGGATSGAGCGPPSGVRPTLPQSLAVLNGRRFIVVPRSLVNSDQH

Similar Transcription Factors

Sequence clustering based on sequence similarity using MMseqs2

100% Identity: -
90% Identity: -
80% Identity: -