Basic Information

Insect: Anopheles aquasalis
Gene Symbol: Mybl1_1
Assembly: GCA_002846955.1
Location: NJHH01005208.1:33810-37496[+]

Transcription Factor Domain

TF Family: MYB
Domain: Myb_DNA-binding domain
PFAM: PF00249
TF Group: Helix-turn-helix
Description: This family contains the DNA binding domains from Myb proteins, as well as the SANT domain family [1].
Hmmscan Out: # of c-Evalue i-Evalue score bias hmm coord from hmm coord to ali coord from ali coord to env coord from env coord to acc

1 4 1.8e-14 1.9e-11 43.4 0.5 1 46 265 311 265 311 0.96

2 4 8e-12 8.3e-09 34.9 0.0 1 43 319 365 319 368 0.95

3 4 6.5e-07 0.00068 19.2 0.0 3 46 376 420 376 420 0.95

4 4 7.3e-08 7.6e-05 22.2 0.1 3 44 428 476 426 478 0.91

#	of	c-Evalue	i-Evalue	score	bias	hmm coord from	hmm coord to	ali coord from	ali coord to	env coord from	env coord to	acc
1	4	1.8e-14	1.9e-11	43.4	0.5	1	46	265	311	265	311	0.96
2	4	8e-12	8.3e-09	34.9	0.0	1	43	319	365	319	368	0.95
3	4	6.5e-07	0.00068	19.2	0.0	3	46	376	420	376	420	0.95
4	4	7.3e-08	7.6e-05	22.2	0.1	3	44	428	476	426	478	0.91

Sequence Information

Coding Sequence: ATGtcgagtgaaagtgaagatGCAGAAGAGTCCAGTTTGGAGGAATCCGAGTCGGAGACGGAGTGTTACTGGAATGAGgAAAACGCCGACAACCCGTTCAACTATACCACGGAGGTAGAGCAGATCATCCACGAAAATGTGGACATTTCCACGGCCAACGCGATCAAGTTGAACCAGCAGTTCCAGCAAAAGTTGAAGCTGATGAGATCGAAATTGCAAGCGATGGTCTACCAGTGCCAAGAGCGTTTGCGTATCGTCGAGCTGAAGATCGATGACTATAACTACCAGCGGAGTATTGGCGAGGGTAATGCGAGAAAGCGGGGAAGGGCGCGAGTTGGGGGATACATCTGTGGACAGCCATTCTTCAAGGATCACTCGCTGTATCCCGGGCCGCACAATGAGGACTACCTCTATCGGAAGAACGTGATGAAGGAGTTTTTCCCGCTGGATCTGTTTGAAGCCACGGACACGATGTGGACGGTGAACGATAAGCTGTCGGTGAAAAAAGCGGTGGCAGCCCAGGCGAAGGAGTTCCTTGCGCGAGAGCTCAGCCTACAGGCGAAGCAGTGCAACAATCCCAGGAAAAGCCAGCAGATTCAGCAGGACCAGCAATCGCTGGTAGCGCTATCAATCGATGCCCTCTGGGCGAAGGCTTGCACGTTCGATGGTAGCTACGGTGGAGAAACATTTACGGTGGACTGGCTGCAGGTATCGAACGTTGCCGTATCACAACGCCATACGGCAGCCGCTTGCGAAGGGATGTGGAGCAACTATCTCAAGCCTGGAATTCGACGGTGTAACTGGGAATCGCAAGAGGAAACCCTGCTGGAGCAGGCGTGCCAGGAGCATGGCTATCAGGACTGGGAAAAGATAGCTCAGCGCATCGATGGCCGATCACCATATCAGTGTTTGACGCACTTTCAGACGAACCTCTCGGCGATGGCAAAGAACGCCAAGATGCCCTGGACGGCCGAAGAGGACCAACGGTTGATAGATTTGGTGGAGAAAAACCGCATCGGCAAGGTCATCGTGTGGAACAAGGTGGTCGAGAATATGCCTTACCGAAACAAGACGCAAGTGTACACGCGCTACATGTTTACGCTGAAGCAGCCACTACGAAACATAAAGTTCAGCCCGGAGGAGGACTGCGTCATCATTGCATACGTACAACGGTTCGGTGAGAatttccgtttctttccgGACGGCATGCTGCTAGGACGTACGACGCGCCAGATTCAGGCACGGTACCGGAATACGCTGCGCTATGTTAATAAACGGGCCACCTGGTCACTCGAGGAAGACCAACGGTTAATGGACTACATTGACGAGCATCGGGCGGAAGTGGATGCGAAAACCATATCGTGGGCACATTGTGCCAATTCGCTGGGGAATCATTCGCGGTTCAGCTGTCGCACGCGCTACTACACCATTGTGCGCTTTCTGGAGAAAAATCCGGGTGCGAAGCTGGAGGATGTGCCGCGTAGAGATCAGCGTAAGCTGTCCACCACGGTGACTAATGAGAATTGGGCTAAAATCATATGCGGCAAAGCTAGCACCATGGCCAAAGCACAAAAAGGATCGTTCTACGCGAATCTCAACACGGCCAGTGAGCGATCGTTGTACGAAAAGATGAAGTTCAGTTACCATTACAGCTTTGGAAACCATCTGAAAATCACCATGCGCCGGAAGCACGTGTTCACAGGTGTAAAGATCTTGCTGCACATGCTCGAAGGATTTTACGAACAAATCGCTTGTTCGAAAACCGTCGCAACGAACAAGATTCTGGAGCAACCGGAGGTATCTAGAATGTTCACCGTCATACAATCACCGCTCCAGTGGTACGAGCTGGAAGCCAAATTGCGAGCCGAGCTGAGACTCAGTACGCTTCCCTCCGATGCACTGTTCTGTTGGCTTCCACCAAGCTATAACACTGTGATAGGGTTGCGAGGTGTCTGCCTCAATGCTAACTCCAGCTCGATCACCCAACCATCGCAGGAGGCACCGCTGAAAGAACCCAATGAGCAGCAGTATCAGGAGGCTACGAAACGGTTCGTGGACCGGTTCAGAAAGATTTTTCACTGGACCATATTGCTCACCATGCTCAACTATGATCATGCGATCTTTCGCGAAGAGGAGACCGAGGGTCGAGGCTCCGGAACGTatgaaagcgaaacggaatggGAGCTCAGTGATGATGAAGCGACACCGGAACAACAGTCGTTCACTTTAGCACTGGATAACGATAGACGTATTCAGCAGAATCACGAGCAACTGACACTGGAGCGGCAAGATCGTCTCGTACCCATATCCTTTGTGCACCTGCAACAGGAACAAGCGACAGTGTGTGAACCGCCATCCGTCATGGCCGAAATGGATCTGGTACAAAATGTAACAATCGTTAATCCGAACGATCTACCAGAGTCAACACTCGCCAGTCTAGCCGCAGACCATCCGAATCTTTCGCTTTGtcctgtgcagcagcaggcctATACCATGCCACCATTGACGATCAGTTGCATGAATAGCTTGCAACAACCGTGCACTAGCAGTTCTACTGAAGGGAAGGTGAATTCTTCAAAATCAAACCCATcacaaaccaaaacgaaaagacAACCCAAATCCCGCAGTAGAGAAGCTGGGATcaccaaaccagcagcgaAAGCACGGAAAACGAATCGAGGGAAAACTGGACCCTCGAGTATCGTACATCAAGGCCTAGAATCATCAGACAGCAGTGTCGGAGACTTGCAACCAACGTGGGTGGAACATCCCGTTGCTCCATTAGAACCAGATAGTATTAGCATCCTTGCACCAGAAGCACCGACGGTGAATTTTGAATCAGGCCTCTGGAATGCAACGGTGGGCATACATGAGACTGAGCCAACGAAACCCATGGTCGCTATGGAAACTCACCCTGAATGTAGCGGAATAGTTTCACTGCAACCTACTGAACCGGTTAACTCGACCGGGGTACCAGTGCAAACATTGCGTCTAGCGCCGGTGCAAGTGTTGTCCGCAGATAGTCAGAGTCACAGTGGTGACTGGAATTCATCTAATGTGTTCCTAACCGAGATTTCCTATGTAGAACCTGCAGATCATGCAGAATCTACCGTATGCGATAATATGGTACCAGAACAGTCATCGGACCAAGAGGATCTGCTTCACGATTCTAAGCAAGCTAGCAATGCAGTTCTCTCCAATGATACAGAGGTAACGGGAGAAGAAACGACCCCTCAGGAAAGCAAGAGTGAGTCGGAAACACGTGACAAGCAGGATCGTTACGAGGATTTGTTAACGCAAATCGACGACAGCTTTTCGGCGGTCGACATAATACGTCTGCTAAACGATAGGAGAAAGGCCGACGGTAACGAAAGTAGCAACGATTCGGATTTATGA
Protein Sequence: MSSESEDAEESSLEESESETECYWNEENADNPFNYTTEVEQIIHENVDISTANAIKLNQQFQQKLKLMRSKLQAMVYQCQERLRIVELKIDDYNYQRSIGEGNARKRGRARVGGYICGQPFFKDHSLYPGPHNEDYLYRKNVMKEFFPLDLFEATDTMWTVNDKLSVKKAVAAQAKEFLARELSLQAKQCNNPRKSQQIQQDQQSLVALSIDALWAKACTFDGSYGGETFTVDWLQVSNVAVSQRHTAAACEGMWSNYLKPGIRRCNWESQEETLLEQACQEHGYQDWEKIAQRIDGRSPYQCLTHFQTNLSAMAKNAKMPWTAEEDQRLIDLVEKNRIGKVIVWNKVVENMPYRNKTQVYTRYMFTLKQPLRNIKFSPEEDCVIIAYVQRFGENFRFFPDGMLLGRTTRQIQARYRNTLRYVNKRATWSLEEDQRLMDYIDEHRAEVDAKTISWAHCANSLGNHSRFSCRTRYYTIVRFLEKNPGAKLEDVPRRDQRKLSTTVTNENWAKIICGKASTMAKAQKGSFYANLNTASERSLYEKMKFSYHYSFGNHLKITMRRKHVFTGVKILLHMLEGFYEQIACSKTVATNKILEQPEVSRMFTVIQSPLQWYELEAKLRAELRLSTLPSDALFCWLPPSYNTVIGLRGVCLNANSSSITQPSQEAPLKEPNEQQYQEATKRFVDRFRKIFHWTILLTMLNYDHAIFREEETEGRGSGTYESETEWELSDDEATPEQQSFTLALDNDRRIQQNHEQLTLERQDRLVPISFVHLQQEQATVCEPPSVMAEMDLVQNVTIVNPNDLPESTLASLAADHPNLSLCPVQQQAYTMPPLTISCMNSLQQPCTSSSTEGKVNSSKSNPSQTKTKRQPKSRSREAGITKPAAKARKTNRGKTGPSSIVHQGLESSDSSVGDLQPTWVEHPVAPLEPDSISILAPEAPTVNFESGLWNATVGIHETEPTKPMVAMETHPECSGIVSLQPTEPVNSTGVPVQTLRLAPVQVLSADSQSHSGDWNSSNVFLTEISYVEPADHAESTVCDNMVPEQSSDQEDLLHDSKQASNAVLSNDTEVTGEETTPQESKSESETRDKQDRYEDLLTQIDDSFSAVDIIRLLNDRRKADGNESSNDSDL

Similar Transcription Factors

Sequence clustering based on sequence similarity using MMseqs2

100% Identity: iTF_00092099; iTF_00098344;
90% Identity: -
80% Identity: -