Basic Information

Insect: Polylopha cassiicola
Gene Symbol: MYB_1
Assembly: GCA_038024825.1
Location: CP149044.1:23815195-23817657[+]

Transcription Factor Domain

TF Family: MYB
Domain: Myb_DNA-binding domain
PFAM: PF00249
TF Group: Helix-turn-helix
Description: This family contains the DNA binding domains from Myb proteins, as well as the SANT domain family [1].
Hmmscan Out: # of c-Evalue i-Evalue score bias hmm coord from hmm coord to ali coord from ali coord to env coord from env coord to acc

1 5 3 2.8e+03 -1.1 0.0 22 33 239 250 237 260 0.83

2 5 5.1e-11 4.8e-08 33.4 0.1 1 45 270 316 270 317 0.94

3 5 2e-09 1.9e-06 28.3 0.3 2 44 324 370 323 372 0.94

4 5 1.2e-10 1.1e-07 32.2 0.0 1 43 376 418 376 420 0.97

5 5 1.5e-07 0.00014 22.3 0.0 3 45 428 472 426 473 0.95

#	of	c-Evalue	i-Evalue	score	bias	hmm coord from	hmm coord to	ali coord from	ali coord to	env coord from	env coord to	acc
1	5	3	2.8e+03	-1.1	0.0	22	33	239	250	237	260	0.83
2	5	5.1e-11	4.8e-08	33.4	0.1	1	45	270	316	270	317	0.94
3	5	2e-09	1.9e-06	28.3	0.3	2	44	324	370	323	372	0.94
4	5	1.2e-10	1.1e-07	32.2	0.0	1	43	376	418	376	420	0.97
5	5	1.5e-07	0.00014	22.3	0.0	3	45	428	472	426	473	0.95

Sequence Information

Coding Sequence: ATGGAACAAATGGATATAGATAGCGACACGGGCTTATACAGTGACGAGGAGAAACAATTAGAAGATTTACGACAACTGACGGCAGCTTTGGAAGATGACGAAGACGAGGCTTGCATTTCAACATACGCTGCTAGTGCAGCTATATCACAAAGGTCATTGTCAATGGCAAGTACATCAGTTTCCGATGGGATACAAGAGCAAGCGAAAATAGATTCCGCACTTGCACTCAATAAACTTCTCGATGAAAAGCTCAGGCGACTGGAAAAGGTGCTAATTGGTCGTCTACAAGAATGCAGACAACGACTAGGTGACCTGCAATCCTTAGCTGTTCCAGGCgaaaaaacagaaaaacatGAAACATTTCGGTATGTTAACTGTGGAAAACCTTATTTTAAAGACAAGTCAAACTTCCCTGCACCTGATAATGATGACACCATACTCATGGCTAAAACTAATATGTATGACTTTTCCGAAGTTATGTCAGTTCCTGGTTGGACGGTCAAAGACAAATGTAACTTGACAAAGTTACTACACAAGATGTCAATAGATATTAAAAAGAAGGAGTTAACATCAAAAATAGCCCAGTTACGCCGTGAAGCCAAAAAGGTGAAGCCAAAACAACTTTCAAAGGAAATCGATGCTATCAATAAAGAAATCACTGCTCTGAGTAAAAAGCCTCTTAAAGAATTAGCACTTCCAATAGATGAGGAGTATGATTGGGAAATAGTAGCCAACAAGTTGAATAGACGACATAGTGCCCAAGAGTACCGCTCACTGTGGAAACTATTCTTGCATCCCAGCATCAATAAGGAAGTGTGGAGTAAAAACGAACATGCCCGTTTATTAGAAATTGCTGATCAACACAATTTACAAGATTGGGACACAATAGCTAAAGAACTTAATACAGGTAGAACAGGATATCAATGCTTTGTATACTTTAGAACTAACATGAATAACACCCTGACAGGTAATAAGTGGACTAAAGAAGAAGAGGAATATCTCAAAAGACTTATAGAATATTACAAAGAAGAAGATTACATACCATGGGGTAAAGTAGCTGCTGCAATGGAGAACAGAACAAAGatacaaatatacaataaatattttagactTGTTGAAAAGCGAAAGGGTAGATTTCTTCCAGAAGAAGATGCTGTGATCCTTACATGCTATGATAAATTTGgtaagaattttaaaaaaatggctGAATATCTACCAGGTCGCTCCTCCAGCCAGTTAAGGGTTCGTTACTATGTTTTAGCGAAAGAGAGAATCTCTACTGTTTGGACAGTTAATGAGGATAGAGAACTGCTACAGCTTATGGCTAATCAAGATGTTTCAACAAACTATTCAAGTGTTACAAAACATTTCCCTGGAAAAACCCGTGCAAATGTTAGAACAAGATTCATCACTCTAATGAATTGGATGAAAAGAAACCCCAACCTTTCCTTGGAGAAAGCGCCAAGGCGGGGCGCGCGTCGTTTAGGCCATGGTCTCCCTACAGATAATCTTAATAAAGCTGTAGAGAGACTGAAGCACAGGATTGAATCTGAAGTTCATATCAGGAAGAGTAAGAGAATAACAAAAGAATCTCCACGTGAAGCCATTGAAGATGCCATTGTGGTGAACCTCCTAAATGAACAGATAAAAGAGCAGCAATCAAAACCAGATGAATGTGATGATGAGGAATTTGAATTAGATGACAATACATCAGTATCGATGAATACTATGAATGTGACAAATTTacagaaattaattattttattaaagggAAAATTAAAGCAGAATCTCTTTAAGAACAGTTCCTATGCTGAGCAGTACCCTGAACTTCTCAATACAAAGGGTGATGCGAATATTTTTAGAGTCAAGAGTTATtcgaaaaaatctttaaataatgtaatacaAATTAATGGATCGCCTGACATATGGGGAGGGATTACTTTAGGTGATTTGATGTACGTGTTGCCACCTAACTATGCTACAATAACGGGATGTAGAAAGTTAATGGCATATGTAAGCGCCAAATTGAGAAAAGATGCCAAAGAAACGCTCAACTTCAATCTTAATGCATTGATAAAAAAGAATCCTTTGCTGAAACAGCAATTATTTCTCTTGATGGAGAGATTTAATACATTGTTTTTATGGCCAATGCTTCTTTCCAATGAGGGTCCTGAACAAGTAGGAAAGAATATCACTGCACCTAAAAATTATTGCAAGAGAGTTGAACGAAAAACTACAAATACATGTAGTGTAACTTTTGACAAAAACGTAACACCTACATGCTCTGCTGGATTTTTGGTACCTCCGactttaaatatacaaaatatagatGATACTAGCAGCATTGATCTGCAGGAAGATCCaaaggaaaaagaaaaaacgaTCCTCAAAAGAATTATTGTAGATAATGAATTAGTAAGATTTATATCCGAAGAGGATGACaagaaaaaggtgaaaaaataa
Protein Sequence: MEQMDIDSDTGLYSDEEKQLEDLRQLTAALEDDEDEACISTYAASAAISQRSLSMASTSVSDGIQEQAKIDSALALNKLLDEKLRRLEKVLIGRLQECRQRLGDLQSLAVPGEKTEKHETFRYVNCGKPYFKDKSNFPAPDNDDTILMAKTNMYDFSEVMSVPGWTVKDKCNLTKLLHKMSIDIKKKELTSKIAQLRREAKKVKPKQLSKEIDAINKEITALSKKPLKELALPIDEEYDWEIVANKLNRRHSAQEYRSLWKLFLHPSINKEVWSKNEHARLLEIADQHNLQDWDTIAKELNTGRTGYQCFVYFRTNMNNTLTGNKWTKEEEEYLKRLIEYYKEEDYIPWGKVAAAMENRTKIQIYNKYFRLVEKRKGRFLPEEDAVILTCYDKFGKNFKKMAEYLPGRSSSQLRVRYYVLAKERISTVWTVNEDRELLQLMANQDVSTNYSSVTKHFPGKTRANVRTRFITLMNWMKRNPNLSLEKAPRRGARRLGHGLPTDNLNKAVERLKHRIESEVHIRKSKRITKESPREAIEDAIVVNLLNEQIKEQQSKPDECDDEEFELDDNTSVSMNTMNVTNLQKLIILLKGKLKQNLFKNSSYAEQYPELLNTKGDANIFRVKSYSKKSLNNVIQINGSPDIWGGITLGDLMYVLPPNYATITGCRKLMAYVSAKLRKDAKETLNFNLNALIKKNPLLKQQLFLLMERFNTLFLWPMLLSNEGPEQVGKNITAPKNYCKRVERKTTNTCSVTFDKNVTPTCSAGFLVPPTLNIQNIDDTSSIDLQEDPKEKEKTILKRIIVDNELVRFISEEDDKKKVKK

Similar Transcription Factors

Sequence clustering based on sequence similarity using MMseqs2

100% Identity: -
90% Identity: -
80% Identity: -