Basic Information

Insect: Anopheles dirus
Gene Symbol: mybM_1
Assembly: GCA_000349145.1
Location: KB672979.1:2961120-2964749[+]

Transcription Factor Domain

TF Family: MYB
Domain: Myb_DNA-binding domain
PFAM: PF00249
TF Group: Helix-turn-helix
Description: This family contains the DNA binding domains from Myb proteins, as well as the SANT domain family [1].
Hmmscan Out: # of c-Evalue i-Evalue score bias hmm coord from hmm coord to ali coord from ali coord to env coord from env coord to acc

1 5 0.3 2.6e+02 1.3 0.1 18 46 220 255 219 255 0.80

2 5 2.9e-11 2.5e-08 33.3 0.4 1 45 261 306 261 307 0.95

3 5 4.8e-12 4.2e-09 35.8 0.1 1 44 315 362 315 364 0.92

4 5 4.4e-07 0.00038 20.0 0.0 3 45 372 415 370 416 0.91

5 5 6.2e-07 0.00054 19.5 0.2 4 44 425 472 422 474 0.89

#	of	c-Evalue	i-Evalue	score	bias	hmm coord from	hmm coord to	ali coord from	ali coord to	env coord from	env coord to	acc
1	5	0.3	2.6e+02	1.3	0.1	18	46	220	255	219	255	0.80
2	5	2.9e-11	2.5e-08	33.3	0.4	1	45	261	306	261	307	0.95
3	5	4.8e-12	4.2e-09	35.8	0.1	1	44	315	362	315	364	0.92
4	5	4.4e-07	0.00038	20.0	0.0	3	45	372	415	370	416	0.91
5	5	6.2e-07	0.00054	19.5	0.2	4	44	425	472	422	474	0.89

Sequence Information

Coding Sequence: ATGTCTAGCTACAGTTCAGATTACGAATCCTCCTACTATACGGAATCGGAAGCAGAAAGCGACTTTGCGTTGCAGGAGGATGTGCTGGCGACTCAGTGCAATTACACCCTTGAGGTGGAAGACATTCTCCGGAAGCATGTGGACATCACGACAACGAACGCGATCGGTCTTAACCATCAATATAAGGCGAAGTTAATGGCACTGCGGGCGCAGCTAGAAAGCTTGCTCTCCCGTTGCCAAAGTCGGCTCCGTGACATTGAAAAGAGTATCGATGAAATTAGATCAAATGCAGCACAGAAAGTCCGCTCGGCAAAACCACGCCATCCCGGGTACATATGTGGGCAGCCGTTTTTCAAAGACCACGAACGTTACCCAGGACCGCACAATATGGATTACCTTTACCGGAAGAACGTGAAGAAGGAATTTTTCCCACTGGACTTGTTCGAAGCGATTGAAACATTGTGGACCGGGAAAGATAAGCAGGCTGTAAAGAAAAGTGTACGGATTCAGGCCTACGAATTTCTGCAGAGAGAGAATGAACTGCGGGAGAAGATGTGTGACAATTCGACAGCGCTGGAACAGATTCGAAATGAAAAGCTGGCATTGGAGACCCTTTCTTTGGAAGCCATTTGGACCAAAACACAAGCTTACGACGGGAAATACGGAGGTCAAAGGTTCATTGTGGACTGGTTGAGGATATCAAACACAGCCGTCAACAGTCGTCACACAGCAGCCGCATGCGAAGCCATATGGAATAACTACCTGAGGCCGGGACTTAAGAGATCCGTTTGGACGACAGAAGAGGAATCCAGATTGATGGAGGCAGCGGAGgcacaccagcaccatcgTTGGGATCGTATAGCGCAGTGCGTAACGGAGCGATCGGAGTATCAGTGTTTTGTACACTATCAAACGAATTTTTCCGAAATATCGCAGATAAAAAAGCTTCCCTGGACTCAAGAAGAAGACGATTTGCTACTGCGCTTAGTCGAAGAAAATCGAATCGGGGATAACGTCATCTGGAACAAAGTTGTGGAGCGTATGCCGTACCGGAACAAGGTACAGGTGTACCATCGTTTCAAGTATACCCTGTCACGTGCACTACGGGGAGTTAAGTTTACCGCTGAAGAAGATTGCGTGATTACGGCGTACGTGCAGCAGTTTGgtgatgattttaaatttttcccCGAAGAGCTGCTACCGGGAAGAACGTCGAAGCAAGTGTCGGCGAGATACACGAACACGTTGCGATTTGTCAACACTCACACTGGCTGGAACCTCGAGGAAGACAAACGCCTGATGAGCTACATTGCAGAGAACTTGACCGAAGAAGGCCCACAAAAGATATCCTGGGCCGAATGTGCCAAATTCCTTGGCAACCACTCCAGACTCAGTTGCCGTTCGAGGTACTATACTATAGAAAAATTTCTGGAGCGGCATCCCAATGCGACGTTAGATGATGTTCCgcgaagagagaagaaaaagctcTCGTCCAGTGTGACGGATAAGAACTGGATCAAAACGATTGTTGGCATCAAGAGCGCAGCACCAAACGCAGGTGCCCATAAAACAGGCTCGGGCAACCCGCTCGTATCTAGTAGGGCGCCTGCGGCAGAATGGAGTTTGTATGAGCTaatgaagttttctttccgGTACAAGTTCGGCTACAGGTTAGCCGTCGACGCGAGGCACAGTCACGTGTTTGCGGGCACTCGGATTTTGCTGCACCTTTTGGAAGGATTCCACAACGAAACCATATTCACCACGCCAACCCGTATTTTGAATTCGAGAGATACGTCAGTATTGCATGCTGTCCTGCAGTCTCCATTAGATTGGCCCAATCTTGTTTCCATAATGCGACCCACGATGACCCCTTCGGGAGAAGCGATGCTTTTTTGCCGTATCCCTCCGAGCTACAACACCGTGCTGGGTTTGCGGGGCGTTTGTTTGAGTGCGTGCAGTCCGCAAACCAATGAACCTGTGCCCGAGTCCAAAGTGAGGAAACGGAGTAAACTTAACGAAATCGCTTATCACCATGCTATGGCAGTGTTTGTGGAGCGCTTTCGAAAGATATTCCACTGGACGATGCTTCTGACGATGCTGAACATCGACGATGTAACACTGGAGAACGAAAGATCGATGGGAAACAGTGCAACATCGGGAGATTTCCCTGCGGGAAGTAATGATCCCGGAAATCAGATCACATTGTCCGGCAACCTTATCTTTCCGGTGCATGTGGACAAGCTGATGAATGCAACAACTAGTGCTCCTGGAGTGGAGCAAAACGATACGTGCAGTTATTCGGTTCCGACCGTTGATTTGAGCAGCGAAACCAATGTGGGGCTTATGACGAATATCACCATTATCGATCCAAAAGATCTACCTACAGTTTCGAAGTTTGGTATCGAGAAGGACGGCACATTACATGAACGTCACATTCAGTCAGAACAACAGAATCCACGTAATTATTCCGTCATCACTGAGTATGTCAACCAAGAGCCATCATGCAGTAAAACAATTAACTCTAAACCTGCCAAAACAACCAGGAACCAACGTAAAGTATCCTCCAAAAAGTCAGAACGAAACACAAGTAGACAAAAGCAAACTAAAAGATGCCCATCTACGAGTTGCCGCACTGATGGTGAAAAGAGTCAAATGTTAAACCTTACGGAATTACCTAAAGAGATGGCTTATATCAACGTTCCAGCTGATCACGTCGTAATGGAGCCTGCAGTGGTGCCTGCGTTTGCTAATATTATACATCATACTTCCGGTGTCGAACATGTGACGCAACATTCCACCGATTACTTCAAAATGCACACCATGCAAAACGTAGTTGCACTAGTACAGCAGCATGTGCAAGAAAACACCCACACTGCCACAGGAGAACAGGGCATGTACTATAATTCTTATGCTGGAAATAGCGGTGATCAAAAGACAACGTCCTCAAAGAATATGTCCATTATCAAAAGTTCGGAATCATTTGATCCTTCGGTCAGTGTAACTTGTGCAGGCGTCGATGTACATGCGATTCGTCCAGGCAGTTCTATTACTGACGACATCATTGTGGTGGATATTGAGACCAACTCATCAGATGGAgaagttattttcatttcaaacgctTGCAACGAAAACATCACAACGCTGGAAGAATTTAAGGTTGCAGAACAAAACGATCCATCTGCTACAGTACTGTTGCAGCAACATGACCAAAGACTGGAAACAGATCACTGTGTGGAGGAAGACGAAACGCTCGCACATGAATTGCGTCATGTGGACAATGAAGCTGTAGACATTAGTGCAGGCGCCGTCGAACTGGTCGTGACAGAAACACTACCAAATTCCAACGTGCAACTTTCATCCGACATCAGCGAACCGCTAACCGCAGTCGACATCATCCGAATgttacacacaaaacacgaaaccgaATATGACGAATGCAGCGCCGAATCTGACGTGGAAGAGGTACCATCGAATAGCGGAGAGTAA
Protein Sequence: MSSYSSDYESSYYTESEAESDFALQEDVLATQCNYTLEVEDILRKHVDITTTNAIGLNHQYKAKLMALRAQLESLLSRCQSRLRDIEKSIDEIRSNAAQKVRSAKPRHPGYICGQPFFKDHERYPGPHNMDYLYRKNVKKEFFPLDLFEAIETLWTGKDKQAVKKSVRIQAYEFLQRENELREKMCDNSTALEQIRNEKLALETLSLEAIWTKTQAYDGKYGGQRFIVDWLRISNTAVNSRHTAAACEAIWNNYLRPGLKRSVWTTEEESRLMEAAEAHQHHRWDRIAQCVTERSEYQCFVHYQTNFSEISQIKKLPWTQEEDDLLLRLVEENRIGDNVIWNKVVERMPYRNKVQVYHRFKYTLSRALRGVKFTAEEDCVITAYVQQFGDDFKFFPEELLPGRTSKQVSARYTNTLRFVNTHTGWNLEEDKRLMSYIAENLTEEGPQKISWAECAKFLGNHSRLSCRSRYYTIEKFLERHPNATLDDVPRREKKKLSSSVTDKNWIKTIVGIKSAAPNAGAHKTGSGNPLVSSRAPAAEWSLYELMKFSFRYKFGYRLAVDARHSHVFAGTRILLHLLEGFHNETIFTTPTRILNSRDTSVLHAVLQSPLDWPNLVSIMRPTMTPSGEAMLFCRIPPSYNTVLGLRGVCLSACSPQTNEPVPESKVRKRSKLNEIAYHHAMAVFVERFRKIFHWTMLLTMLNIDDVTLENERSMGNSATSGDFPAGSNDPGNQITLSGNLIFPVHVDKLMNATTSAPGVEQNDTCSYSVPTVDLSSETNVGLMTNITIIDPKDLPTVSKFGIEKDGTLHERHIQSEQQNPRNYSVITEYVNQEPSCSKTINSKPAKTTRNQRKVSSKKSERNTSRQKQTKRCPSTSCRTDGEKSQMLNLTELPKEMAYINVPADHVVMEPAVVPAFANIIHHTSGVEHVTQHSTDYFKMHTMQNVVALVQQHVQENTHTATGEQGMYYNSYAGNSGDQKTTSSKNMSIIKSSESFDPSVSVTCAGVDVHAIRPGSSITDDIIVVDIETNSSDGEVIFISNACNENITTLEEFKVAEQNDPSATVLLQQHDQRLETDHCVEEDETLAHELRHVDNEAVDISAGAVELVVTETLPNSNVQLSSDISEPLTAVDIIRMLHTKHETEYDECSAESDVEEVPSNSGE

Similar Transcription Factors

Sequence clustering based on sequence similarity using MMseqs2

100% Identity: -
90% Identity: -
80% Identity: -