Basic Information

Insect: Macaria liturata
Gene Symbol: -
Assembly: GCA_964023185.1
Location: OZ026808.1:3090198-3098130[+]

Transcription Factor Domain

TF Family: MYB
Domain: Myb_DNA-binding domain
PFAM: PF00249
TF Group: Helix-turn-helix
Description: This family contains the DNA binding domains from Myb proteins, as well as the SANT domain family [1].
Hmmscan Out: # of c-Evalue i-Evalue score bias hmm coord from hmm coord to ali coord from ali coord to env coord from env coord to acc

1 9 0.63 1.1e+03 0.4 0.1 5 20 5 20 5 23 0.89

2 9 9 1.5e+04 -3.2 0.1 5 14 54 63 54 63 0.89

3 9 7.2 1.2e+04 -2.9 0.0 5 18 121 134 121 136 0.85

4 9 0.18 3e+02 2.2 0.0 5 20 387 402 387 406 0.95

5 9 0.18 3e+02 2.2 0.0 5 20 521 536 521 540 0.95

6 9 0.18 3e+02 2.2 0.0 5 20 658 673 658 677 0.95

7 9 0.18 3e+02 2.2 0.0 5 20 795 810 795 814 0.95

8 9 0.18 3e+02 2.2 0.0 5 20 932 947 932 951 0.95

9 9 0.18 3e+02 2.2 0.0 5 20 1069 1084 1069 1088 0.95

#	of	c-Evalue	i-Evalue	score	bias	hmm coord from	hmm coord to	ali coord from	ali coord to	env coord from	env coord to	acc
1	9	0.63	1.1e+03	0.4	0.1	5	20	5	20	5	23	0.89
2	9	9	1.5e+04	-3.2	0.1	5	14	54	63	54	63	0.89
3	9	7.2	1.2e+04	-2.9	0.0	5	18	121	134	121	136	0.85
4	9	0.18	3e+02	2.2	0.0	5	20	387	402	387	406	0.95
5	9	0.18	3e+02	2.2	0.0	5	20	521	536	521	540	0.95
6	9	0.18	3e+02	2.2	0.0	5	20	658	673	658	677	0.95
7	9	0.18	3e+02	2.2	0.0	5	20	795	810	795	814	0.95
8	9	0.18	3e+02	2.2	0.0	5	20	932	947	932	951	0.95
9	9	0.18	3e+02	2.2	0.0	5	20	1069	1084	1069	1088	0.95

Sequence Information

Coding Sequence: ATGGAAGGGAAAACTcctgaagaaaaagaaaagatttTGAGAGAACTGGCTGAGAAAGGAATTCCATTACCTGAACCGAAAACAGCATCAGAAAAAGcattagtaaaaaaagtaaaaactgaAACAGACGCCGCTTTACTAGATAGTTTAAAAGGAAAATCACCTGAAGAGAAAGAAAAGATTTTGAAAGATAGAGCAGAAAAAGGTTTAACCATGCCCGAAGGTCGTACTGCATCGGAAAAAGCACTTATACAAAAAGTAAGTGCAAAAAAGAAATCAAAGGCTACAATGGCAGTTAGACCATCTGAAAAATTACGACAGGCAAAAGCTGCTGGACTTTTGACCCCCTTAGAAGGAAAAACACCGGCTGAGAAGGAAAAAATTCTCAGAGGTATggcaaaaagtggtattccttTGCCTGAACCCAAAACCGCTTCTGAAAAGAAACTAATTGATAAAGTGAGAACCGAAATGGGTCTTCCTCCAGAACCCAAAACACCATCAGCGAAACAGAGATATGCCAAAGCTCAAGCTGAGGGTCTCGTAACACCTTTAGAAGGAAAAAGCGCTGccgaaaaagaaaaaatactcaAAGCTCAAGCCGCGGCTGGTCTACCTCTTCCAGAAGGCAGGACGCCGTCTGAAAAGGCGTTAATAGCAAAAATTAAATCTGGGGCCCCAACAGCAAAAGCTCTTTCAGAAAAAATGAAAAAAGCCAAAGAAGCGGGGCTGTTGACTCCACTAGAAGGAAAAACACCTGCAGAGAAGGAAAAAATTCTCAAAAGTATGGCAAAAAGTGGCATACCTTTGCCTGAACCCAAGACCGCTTCTGAAAAGAAACTTATTGATAAAGTGAGAACTGAAATGGGTCTTCCTCCAGAACCCAAAACACCATCAGCAAAACAGAGATATGCCAAAGCTCAAGCTGAGGGTCTCGTAACACCTTTAGAAGGAAAAAGCGCTGCcgataaagaaaaaatactaaaagCTCAAGCAGCAGCTGGACTGCCTTTACCAGAGGGTAGAACTCCGTCTGAAAAGGCGTTAATAGCGAAAGTTAAAGCTTCTGCGCCACCTCCAGGAGCACCAGCAGGTGTGCCATCGGAAAAATTGCGAAAGGCCAAAGCAGCGGGACTAATGACGCCACTTGAGGGCAAGACTCCAGAACAAAAGGAGAAGATATTAAGAGGCTTAGCTCAACATGGCATCCCTTTGCCCGAAGGAAAAACCCCTTCAGAAAAGAAACTAATAGACAAAGTACGAGCAGATTTAGGCTTACCACCAGAGCCTAAAACACCATCAGCAAAACAAAGATATGCTAAAGCCCAAGCTGACGGAATAGTTACACCTTTAGAAGGGAAAAGTCCTGCCGAAAAGGAAAAGATACTCAGAGCTCAAGCAGCAGCTGGACTACCATTACCAGAGGGCAGGACTCCGTCCGAAAAGGCgttaatagataaaataaaagcaactgCGCCGCCTCCATGGGCAGCAGGCGTGCCATCAGAAAAATTACGAAAAGCTAAAGCAGCGGGACTCATAACACCACTTGCGGGCAAGACTCCAGAACAAAAGGAGAAGATATTGAGAGGCTTAGCTCAACATGGCATCCCTCTGCCCGAAGGAAAAACCCCTTCAGAAAAGAAACTAATAGACAAAGTACGAGCAGATTTAGGCTTACCACCAGAGCCTAAAACACCATCAGCAAAACAAAGATATGCTAAAGCCCAAGCTGACGGGATAATTACACCTTTAGAAGGAAAAAAGCCCGCAGACAAGGAACGGATACTCAGAGCTCAAGCAGCAGCTGGACTACCGTTACCAGAGGGCAGGACTCCGAGTGAGAAGGCacttatagataaaataaaagcaactgCGCCGCCTCCAGGAGCAGCACCACCAGCAGGTGTGCCATCGGAAAAATTGAGAAAGGCCAAAGCAGCGGGACTAATAACGCCACTTGAGGGCAAGACTCCAGAACAAAAGGAGAAGATATTGAGAGGCTTAGCTCAACATGGCATTCCTTTGCCCGAGGGAAAAACCCCTTCAGAAAAGAAACTAATAGACAAAGTACGAGCAGACTTAGGCTTACCACCAGAGCCTAAAACACCGTCAGCAAAACAAAGATATGCTAAAGCCCAAGCTGACGGAATAATTACACCTTTAGAAGGGAAAAAGCCTGCAGACAAGGAACGGATACTCAGAGCTCAAGCAGCAGCTGGCCTACCGTTACCAGAGGGCAGGACTCCGAGTGAGAAGGCactaatagataaaataaaggctggtgcaccacctccaggagcAGCAGCACCAGCAGGTGTGCCATCAGAAAAATTGCGAAAGGCCAAAGCAGCGGGACTAATAACGCCACTTGAGGGCAAGACTCCAGAACAAAAGGAGAAGATATTGAGAGGCTTAGCTCAACATGGCATCCCTTTGCCCGAGGGAAAAACCCCTTCAGAAAAGAAACTGATAGACAAAGTACGAGCAGACTTAGGCTTACCACCAGAGCCTAAAACACCGTCAGCAAAACAAAGATATGCTAAAGCCCAAGCTGACGGAATAATTACACCTTTGGAAGGGAAAAAGCCTGCAGACAAGGAACGGATCCTCAGAGCTCAAGCAGCAGCTGGCCTACCGTTACCAGAGGGCAGGACTCCGAGTGAGAAGGCactaatagataaaataaagtctggtgcaccacctccaggagcAGCAGCACCAGCAGGTGTGCCATCAGAAAAATTGCGAAAGGCCAAAGCAGCGGGACTAATAACGCCACTTGAGGGCAAGACTCCAGAACAAAAGGAGAAGATATTGAGAGGCTTAGCTCAACATGGCATTCCTTTGCCCGAGGGAAAAACCCCTTCAGAAAAGAAACTGATAGACAAAGTACGAGCAGACTTAGGCTTACCACCAGAGCCTAAAACACCGTCAGCAAAACAAAGATATGCTAAAGCCCAAGCTGACGGAATAATTACACCTTTAGAAGGGAAAAAGCCTGCAGACAAGGAACGGATCCTCAGAGCTCAAGCAGCAGCTGGCCTACCGTTACCAGAGGGCAGGACTCCGAGTGAGAAGGCACTAATAGCTAAAATAAAGTCTggtgcaccacctccaggagcAGCAGCACCAGCAGGTGTGCCATCAGAAAAATTGCGAAAGGCCAAAGCAGCGGGACTAATAACGCCACTTGAGGGCAAGACTCCAGAACAAAAGGAGAAGATATTGAGAGGCTTAGCTCAACATGGTATCCCTTTGCCCGAGGGAAAAACCCCTTCAGAAAAGAAACTAATAGACAAAGTACGAGCAGATTTAGGCTTACCACCAGAGCCTAAAACACCATCAGCAAAACAAAGATATGCTAAAGCCCAAGCTGACGGAATAATTACACCTTTGGAAGGGAAAAAGCCTGCAGACAAGGAACGGATACTCAGAGCTCAAGCAGCAGCTGGCCTACCGTTACCAGAGGGCAGGACTCCGAGTGAGAAGGCactaatagataaaataaaggCTGGTGCACCGCCTCCAGTCGAGTCGGGCAGCTACAACCCGCAGGATGCTGTTAGTGCTGCCTCGGACGCGGCTAAGCATCGAGGTGGCCCGTTTGCGGAATACGGCGTGGAAGCCATCTACTCTTGCATCCGCAAACATCCCCGACGCACTGCAGCGCCACGGCAGCCCCAACAGCACCCTGAACGCGTTGTTGTACTGCACTCGTAG
Protein Sequence: MEGKTPEEKEKILRELAEKGIPLPEPKTASEKALVKKVKTETDAALLDSLKGKSPEEKEKILKDRAEKGLTMPEGRTASEKALIQKVSAKKKSKATMAVRPSEKLRQAKAAGLLTPLEGKTPAEKEKILRGMAKSGIPLPEPKTASEKKLIDKVRTEMGLPPEPKTPSAKQRYAKAQAEGLVTPLEGKSAAEKEKILKAQAAAGLPLPEGRTPSEKALIAKIKSGAPTAKALSEKMKKAKEAGLLTPLEGKTPAEKEKILKSMAKSGIPLPEPKTASEKKLIDKVRTEMGLPPEPKTPSAKQRYAKAQAEGLVTPLEGKSAADKEKILKAQAAAGLPLPEGRTPSEKALIAKVKASAPPPGAPAGVPSEKLRKAKAAGLMTPLEGKTPEQKEKILRGLAQHGIPLPEGKTPSEKKLIDKVRADLGLPPEPKTPSAKQRYAKAQADGIVTPLEGKSPAEKEKILRAQAAAGLPLPEGRTPSEKALIDKIKATAPPPWAAGVPSEKLRKAKAAGLITPLAGKTPEQKEKILRGLAQHGIPLPEGKTPSEKKLIDKVRADLGLPPEPKTPSAKQRYAKAQADGIITPLEGKKPADKERILRAQAAAGLPLPEGRTPSEKALIDKIKATAPPPGAAPPAGVPSEKLRKAKAAGLITPLEGKTPEQKEKILRGLAQHGIPLPEGKTPSEKKLIDKVRADLGLPPEPKTPSAKQRYAKAQADGIITPLEGKKPADKERILRAQAAAGLPLPEGRTPSEKALIDKIKAGAPPPGAAAPAGVPSEKLRKAKAAGLITPLEGKTPEQKEKILRGLAQHGIPLPEGKTPSEKKLIDKVRADLGLPPEPKTPSAKQRYAKAQADGIITPLEGKKPADKERILRAQAAAGLPLPEGRTPSEKALIDKIKSGAPPPGAAAPAGVPSEKLRKAKAAGLITPLEGKTPEQKEKILRGLAQHGIPLPEGKTPSEKKLIDKVRADLGLPPEPKTPSAKQRYAKAQADGIITPLEGKKPADKERILRAQAAAGLPLPEGRTPSEKALIAKIKSGAPPPGAAAPAGVPSEKLRKAKAAGLITPLEGKTPEQKEKILRGLAQHGIPLPEGKTPSEKKLIDKVRADLGLPPEPKTPSAKQRYAKAQADGIITPLEGKKPADKERILRAQAAAGLPLPEGRTPSEKALIDKIKAGAPPPVESGSYNPQDAVSAASDAAKHRGGPFAEYGVEAIYSCIRKHPRRTAAPRQPQQHPERVVVLHS

Similar Transcription Factors

Sequence clustering based on sequence similarity using MMseqs2

100% Identity: -
90% Identity: -
80% Identity: -