Basic Information

Insect: Drosophila cognata
Gene Symbol: -
Assembly: GCA_035041535.1
Location: JAWNLC010000241.1:7120527-7125042[+]

Transcription Factor Domain

TF Family: MYB
Domain: Myb_DNA-binding domain
PFAM: PF00249
TF Group: Helix-turn-helix
Description: This family contains the DNA binding domains from Myb proteins, as well as the SANT domain family [1].
Hmmscan Out: # of c-Evalue i-Evalue score bias hmm coord from hmm coord to ali coord from ali coord to env coord from env coord to acc

1 2 0.0008 0.64 10.2 0.1 21 45 775 797 768 798 0.91

2 2 0.00014 0.11 12.6 0.2 22 44 1062 1087 1055 1089 0.86

#	of	c-Evalue	i-Evalue	score	bias	hmm coord from	hmm coord to	ali coord from	ali coord to	env coord from	env coord to	acc
1	2	0.0008	0.64	10.2	0.1	21	45	775	797	768	798	0.91
2	2	0.00014	0.11	12.6	0.2	22	44	1062	1087	1055	1089	0.86

Sequence Information

Coding Sequence: ATGAGCAGCACCCCCAGCGAAGAGACTACGCTGACGGTCACGTTGCAGGCAACACCAGCGACGCCATCGCCGTCTCTAAAGTcatttgactttgatttttcAGgTACGAATTATGAGATGGACGCAAGCATTTCAGAGGAGGAGCGGCGCTTCTACCTCAAGATGTACCCGACTGTGAATGTGGTTAATCAGCGTAAGGTCCATTGCACCGTTTGCCGCGCACACATTGGCACAGCTGTCAATACAGATGGTAACATCAGAATGCATCCAATACTGCGTGTGACGCACTGCATCAAGTGTCACGAATTTTACAATAGTGGAGAGTTTTCCAAGGGTGAAGACGGCTCGGAGCTGTATTGTCGCTGGTGTGGGCAGGGCGGTGAGGTATATTGCTGCTCCACCTGCCCGTTTGTATTCTGCAAATCGTGCATCATTAAGAACTTGTCGCGCGGAGTAATTGTGGACATTGAGCAGAACGAGAACTGGAACTGCTTCAAGTGCACTTCCAAAATACTGTGGCCACTTCGCGCACAGCACTGGGCCCTCATCAACTACATCGAAACCCAAAAGCACGGCCTGCAATCGATGCAGTTGTCTGAAATGGAATTGCGTAAGCAAACGCACAAGGACCACACCACATGCTGTCGACTCGCTAAGGCGAAGGCCACCAGTCTTTCGGACTCCATGGAGAGCCTTGACTCGAATGCTTCCAAGCGCAGTCATACCAGTTCAGTGCACTCCGTCAAGAAACCAGCGAAACCGCAGGTTCCACCTGCCAAGCGTCCCAAAATGTCCAACGATGAAGTTGTCTGCACACCGGATCTTCTCAGCATGCTGGAGCCAGATTGCCAAATCTCAGTTGCACAAAAGTCAGGCCCCCGCTCTCTAACACCAGCGTCCAACATCACAACAACGCCACGCATCATAACTGTGCAACAGAACTACAGCGGTCCCAGTCCAAGTAATAATGGGAGCTCCTCCTCCGCCAGTCCACTCATAAGCTTGCCACCGCCACTAGTGCTGAGCAGTTCGGGTATGCGCTATCGTCAAGCCGCACCCAGTCCAGCTCCAGTTGTGCGACGCACCGTGGTTCCAAATACTATGCGTACTACGGGTCCCGTTTTCCATACAATAAATGGCTTTCGAGTCGATCTCAATAGCGCCGCACAGCAGGACTCCTATCGCCTGCCCAATGGTCGGCTAATACAGGTGAAACGTCAATTGCCACCTGGCGGTCAACCTTCCACAACAGTGACGCGTACTCCTATTGCGTTGAATCCACAGGTTATCATACGGCAACAGCCGACGCCAGTGGTGCCAGTGCCGCGCGTGGGCCACAATAGCCCCAACTATGGCTCCAATATGGGCATCTTTAATCCGCAAAcgaaccagcagcagcgagctcCGCAAGTGGTGCGCGGCAACAACGGTAGCCAGGTGCATTCGGTGAGCATCGCTCCATTACCGGCACCAGTgcaaccgccgccgccgccgcctgtAAGCAGTAACGGCGGCACCACCGTTATGATGACGCCAACCTCGGTGGCAAAGGGTCCAAGCTTGGTGCGCCATGTGTTTCCGCCCCATGCCATTGGCCGAGCGCGCACCCAATTGCAGGATCAAATCTTCAATGCCATGGAAATCTGCACGCATCTGACAGGGAAAGTGCAGACTCTGACTCATTCCAATGCATACAATCAGGCACGCAGCTATATGGATCTGAAGGAGCTCTACATACATCTGTCCTATCTAATGACCTATGCTATTGGACGCTTTAAACAGCTACAGGATAAATGCCTTGTGGATATGCGCGACATGGGCTTCAAAAACGACGCCAACAGTTTGGAGAACGGTCAATTGGCTGCCGcGGTGGATTATGTGTGTTACGGCCAGTTGGACGATGTGGATCTGTTCAATACCGGCTGCAACAGCTTTCACAATCAAGTCTACGAGTACCGCAAGAGCTTGCAAGCGAATCTCAAAGAGGGTGAAATCAATAAGCCACTTCCACCTCTAATGCCGCTTGGCGTGCGTGCCGAAGGTGATCCCAAAGATGAAGACGATGAGCAAGTAAACGAAGCGGAATATGAAAACGATGAGGAGGATTATAACGATGAACAGGATAACGATGCAGATGATGctgacgatggcgatgatgcCGATGATATAGAGGATGAGTATGATGCCCTCGGAACCGAGGAGAGCATGAATCGCAACGAACAGGCGCACGCCTACGATCGCAAACTGACTCGACTGTTACGCGAATATCCCTCGATTTGGTGTACACGTCATCCGGACTATGGAAAAATGGAGGTGACACGCAAACAGTGGCGCGTCATTGCCAGCCACTTTCCACGCGGCGATGACATTAAGCTGCGATGGAAGAACGTTCGGAAACGTTACGTGCGCATTGAGCGACTGCTGAAGCAGGGAAAACGTTTCAAGGGCTATTTTGACAAGGCCACCAATTATTTAGCCAATAGGGATGTATCACGTAGCGAATGGCAGCCTGTCGACTGTGGCGAAGGCGATGGCGATAGTTTCGAGCGAAAGCAACTGGATGCCATTGAGAATACCATACACAAAGACCAAAAGGGTTTTGTCGATATGCGGCAACATCAGAAAGCTATAGAAGTGAAGGCCAAACCACGATTGCCTGTGCGACCGCTAGACGTGCGTCCGATCGATATtcgtattattaattttgccaAGAGTCATCCGGTGCTCTGGCGAAAGTCTGCCGATCCCGAGTTCAACAGCATCGACGAACAAACTCGTAAGTCACTGTGGCTTAACTTTTGGAAGTCAGCGCCCAATTATCGCTGCGAATACATTGTGGAACGCTGGCAGCAGATGTATGAAATGTACAAGTCATTCCGTCTGAAGACCATCAAGGACAAGCACACATTTGCCAATCTGGAGTTGAAATACTCTAAATATTTagccaatttatattttctctaTAAAATTGACGAGCAAGACTTACGTGATGAATTCGAGCCATTGCAGGATTGTGTTCAAAATGGTGCATCCGGTAGTGGCGCCTACAGTGATTCAGCTGCCAAGTTGAAGGACATGCCCGATGACAAACAGTTTGTGCAGGAGTTGGTGTTGGCCATGCGCGCTTATCCCACACTTTGGAATCCACGGCATGTGGACTACAATGATGTTGGCGCACGCGAACGTCTGTGGGCGGAGCTTGCCAGGCGATTGCCACGCTTCCGGCGAGATGCTCGCGCCTGCAAGCTAcgctggcaaatggcaaaatttgCCTTTGAGTGCTACTCTCACGAAATGGAACGGCAGCCCCGCCCAAATGAGAAAACCTTGCAAAAGCTGCGCATCAATTTTCCACTCGATGAAATGCGGtttcttaatatttaa
Protein Sequence: MSSTPSEETTLTVTLQATPATPSPSLKSFDFDFSGTNYEMDASISEEERRFYLKMYPTVNVVNQRKVHCTVCRAHIGTAVNTDGNIRMHPILRVTHCIKCHEFYNSGEFSKGEDGSELYCRWCGQGGEVYCCSTCPFVFCKSCIIKNLSRGVIVDIEQNENWNCFKCTSKILWPLRAQHWALINYIETQKHGLQSMQLSEMELRKQTHKDHTTCCRLAKAKATSLSDSMESLDSNASKRSHTSSVHSVKKPAKPQVPPAKRPKMSNDEVVCTPDLLSMLEPDCQISVAQKSGPRSLTPASNITTTPRIITVQQNYSGPSPSNNGSSSSASPLISLPPPLVLSSSGMRYRQAAPSPAPVVRRTVVPNTMRTTGPVFHTINGFRVDLNSAAQQDSYRLPNGRLIQVKRQLPPGGQPSTTVTRTPIALNPQVIIRQQPTPVVPVPRVGHNSPNYGSNMGIFNPQTNQQQRAPQVVRGNNGSQVHSVSIAPLPAPVQPPPPPPVSSNGGTTVMMTPTSVAKGPSLVRHVFPPHAIGRARTQLQDQIFNAMEICTHLTGKVQTLTHSNAYNQARSYMDLKELYIHLSYLMTYAIGRFKQLQDKCLVDMRDMGFKNDANSLENGQLAAAVDYVCYGQLDDVDLFNTGCNSFHNQVYEYRKSLQANLKEGEINKPLPPLMPLGVRAEGDPKDEDDEQVNEAEYENDEEDYNDEQDNDADDADDGDDADDIEDEYDALGTEESMNRNEQAHAYDRKLTRLLREYPSIWCTRHPDYGKMEVTRKQWRVIASHFPRGDDIKLRWKNVRKRYVRIERLLKQGKRFKGYFDKATNYLANRDVSRSEWQPVDCGEGDGDSFERKQLDAIENTIHKDQKGFVDMRQHQKAIEVKAKPRLPVRPLDVRPIDIRIINFAKSHPVLWRKSADPEFNSIDEQTRKSLWLNFWKSAPNYRCEYIVERWQQMYEMYKSFRLKTIKDKHTFANLELKYSKYLANLYFLYKIDEQDLRDEFEPLQDCVQNGASGSGAYSDSAAKLKDMPDDKQFVQELVLAMRAYPTLWNPRHVDYNDVGARERLWAELARRLPRFRRDARACKLRWQMAKFAFECYSHEMERQPRPNEKTLQKLRINFPLDEMRFLNI

Similar Transcription Factors

Sequence clustering based on sequence similarity using MMseqs2

100% Identity: iTF_00805123;
90% Identity: iTF_00619779; iTF_00514119; iTF_00548745; iTF_00525068; iTF_00522112; iTF_00598825; iTF_00498091; iTF_00542379; iTF_00564591; iTF_00535250; iTF_00543684; iTF_00500248; iTF_00498814; iTF_00582899; iTF_00499525; iTF_00518381; iTF_00577005; iTF_00595889; iTF_00527988; iTF_00485800; iTF_00616138; iTF_00558603; iTF_00573989; iTF_00497324; iTF_00566731; iTF_00521292; iTF_00593037; iTF_00501743; iTF_00552976; iTF_00513399; iTF_00496539; iTF_00482173; iTF_00609824; iTF_00597301; iTF_00576284; iTF_00607004;
80% Identity: -