Basic Information

Insect: Drosophila rufa
Gene Symbol: ZNF541_1
Assembly: GCA_018153105.1
Location: JAECXS010000001.1:26182465-26193576[+]

Transcription Factor Domain

TF Family: MYB
Domain: Myb_DNA-binding domain
PFAM: PF00249
TF Group: Helix-turn-helix
Description: This family contains the DNA binding domains from Myb proteins, as well as the SANT domain family [1].
Hmmscan Out: # of c-Evalue i-Evalue score bias hmm coord from hmm coord to ali coord from ali coord to env coord from env coord to acc

1 1 3.3e-09 3.3e-06 26.9 0.1 2 45 1475 1518 1474 1519 0.93

#	of	c-Evalue	i-Evalue	score	bias	hmm coord from	hmm coord to	ali coord from	ali coord to	env coord from	env coord to	acc
1	1	3.3e-09	3.3e-06	26.9	0.1	2	45	1475	1518	1474	1519	0.93

Sequence Information

Coding Sequence: ATGAGTCGCTGGTCGGTGGTACCCAAGAGCATACACCTGCCATTGACCACTCTCAGCAGCGCGCCGCGCGTGTTGATGTGCAGCGCCTCCGTGGGCACCGAGGGATCTGTGACTCTGCAACTGAGGGATGCGAACGCCTTGGAGGCGACGACATCAAGCTCTTCGAAGACAGCAACCAGCGGCGGAGCAGCGGCGGCGGCGGCAGGAGCAGGAGCATCGTCCACGAATGGCGCTGCAACTGCGTCAGCGGCGACGCTAGAGAATGCGCTGACCATCGGCTATCCGGATCCGGAAATGTTGGCAGATGTCTTGGGCACCATTCAGACAGCCTCTCTTAAAAACCACAACAGCAACTCAATCACAACAGTAACTTCAAGCAATAGCTCGGCCAAATCGGCCATTGGCAATCATTTGAGGATAGGGATTGGCGGGATCATCAGCGTTGAAGCGCCGCGCAAGAATCGCCCCAAGTTATCCTCACCGACGCGACACGGTCCGCAGCAGTGTCAGACTTGTTGCAAGATCTTTGGAAATGCCTCGGCGCTGGCCAAGCACAAACTGACGCACAGCGACGAGCGGAAATACATCTGTGCGCTCTGCTCGAAGGCATTCAAGCGGCAAGATCACTTAAACGGACACATGATGACTCATCGGAACAAGAAGCCTTACGAGTGTAAGGCGGATGGCTGCGGCAAGTCCTACTGCGACGCCCGCTCCCTGCGGCGTCACTCGGAGAACCACCATGCCGGCGGCGCGACCACGCCCACCACCACCAGCCAGCAATCGCTCTCGCCCACCGCCAGCTCGAGTGGGGCGAGCAGCAGCAGCGTGGGCGTGGCCACCAGCTCGCTGAGTCTCTCGCCGGCCACGGCCAGCGGGGATGCCAGCTCCCCGGACGGCGCCACCTGCATCCGCACCTACATCTCCACGGGCAGCTCGGTGGTGGACGCGGCCACCGGGATAGCACTGTCGGACGAGCAGATCAAGGCCATGAACTTGCCGATCAAGACGGGCGTGACCCTGCTCTCGCCCACCACCTCGACCTCGTCGAATGCCTCCTCCACGGCCTCGTCATCGTCCTCATCCGCCTCTGCCTCGGCCTCCATCTCGTCGCTCTCCTCGGCCTCATCTGGTATTGGCCTAACGGCGGTGTCTTCGCCCTCCAGCGTGGGCACCGTGATAGCCACCAGCTCGCCAGCGCCGACCATCACGCTCAGCGATGGGATGAGCCTCGAGGGCGAGGGCCTGACCCGGGAGCAGCTGGACCTCATCAGCAAGATCATGCAGCAGACGAAGCAGACGAGCGCCCAGGTCACCGTCTCCTCGCCCACCAGCGTCAGCTCCTACAAGATCAACACCAACCAGGCGCCGTCGCAGTCGAGGCCGAGGACCTGGAACATGCAATTGCTCAACAGTGCACAGAATGTGACGGTCACCGTCGAGGACAACACCGAACTGGTGGCTCCCTCTTCCAGCTCCCCCGTGGAGGTGAAGGAGGAGGAGCTGAGTCCGCAGCTAGTGGCCGCCATCAATCCCCACCTGCTCAACATTGTGAAGCTCGACAAGCCCGTCGAGTGCAATCTGTGTCACCGCAAGTTCAAAAACATACCCGCCCTCAACGGGCACATGCGTCTCCACGGAGGCTACTACAAGAAGGATCCGGAGACCAAGCGCAGCGAGAAGAAGGACTCCAGTGGTCCGCCCCTGCAGACGGCCAGCATAGGAGTGCGTGCCCTCATCGAGGAGAAGATCATCAGCAAGCGCAAGGACATGACAAAGGGCTCCTTTGTGGTTCCCGCACCCCCACACAGCAGCGGCACCACCACCACCCTGCGGCGGTCCATCAGCGACCTGGAGAGCTTCCTCAATCCCAAGAGCAGCTCGAGTGGCCACACCCAGACCCTTAACACGGGAACAGGCACCACTACCGCTGTCCTGCCAGCGGCCACCACCATCAAGAGCAGCAACGGGCTGAGCATCCAGCAGATCGGCCTGCCGCAGAGCATCGAGATCTTCAGCGGCGGCCAGAAGCAGGCAAAGACCCTCAACCTGGGCAGTGGCACCAATACCATCACTATAACCACCAACAATGTGCCCACCACCACGACGATGAGTGCTCTGACCGCCCTGAAGGCCGGCGGCACCATTAGCGGCATTTCCACGGCCACCAACACGGATCCCAAGGACTCGACGCTGATAGAGCTCCTGAAGCGGGGCACTCGCATCGCGGTCACCTCGAAAAAGGCGCAGGCTCAGTGCCAAACGACATCCGGTGTCCTGATGACCTCCAGTTCGACGGCCACGCAATCGATGGGCACCCTGACCGAGCTGACCACCATTGGCGGGAGCAGTGTCCAGGCGGTGGGCCGCCAGATCATCACGAACAACAATCGCACCGTGATCATACCCTCCGACGTCCAGGTGGTGTCCACCAAGAGCAAACTGACCAGCCTGAGCAGCCTGAGCAGTCTGGTGAAGAGCACTGTTGCCACAACCACCAGCAGTTCCACCAATACCAGCTGCTCCTCGGGCAATCTCTCGCTGGCAGACGGAACACCGCTCTCGCTGACCATAGCGCCGAGCCAGGATGTATCCGGTGGAGCGGGTGTTCCGAGTGGGACTGGCAGCGTAATCACCAGCGGAGGCGGCGGCGTCTACACGGTGACCTACACCAGCGACGGCACCGATCTCTTCGACGACGCCGAGGTGTACAACGTGTCCGACACGGAGATGCTGCTGCAGACGGTGGACTCGATGGAGCTGCTGCACGACGACGAGGAGGAGCCGCAGATCAAGAGCGAACATTCCGAGGACTTTGCCATGCTGAGCGAGGCCGGCGACAGTGCGCACACCCAGCTGGTGAAGCTGGAGCCGGAGAGCGGGCAGGGCGGCGGCAACTCCTCCGGGGGAGGAGGAGGAACTGGAGCCAACACTACGCCGCTGCCCACCTTCCAGCAATTCCATTCCAAGGAGCTGATCATGCAGAACAGTTCGCAGATCCAGGCGATAGCCAGCATGCGGCCAAGTGGAGCTGGTTCCGGAGCAGGAGCTGGCAATGGCAGTGGCGTCCTGGCCTCGCCGCTCCACTCGCCGCTGGCCTATCCCACGCCGCCGTCGAGCCACGAGAACATGGCCCAGAGCTCGCCGTTCATCGAGGATGCGGCCGCCCAGTTCGTGGACGCCAGCAATACCTTCTTTGGTGATAAGACGGACTTCTCGCACATCTACTTCAAGACGGACGAGGGCCAGGCCACCATCGAGCAGATGAACGAGCACGACAACGAGAAGATTCTCAAGCTCAAGTCCGTGCTGGAGGAGAGCAGCTTCGATCCCTCCATCAAGGTGGAGGACCTGCTCAACGGCACCGACGACGACACCGAGTGCGATCTGCGTGAGTTCGCCGAGACAAATCTCTCCTTTCTGGACGAGGACCAGGAGTTCCTCAACGATTCCCGCAATGCCACCTCCCCGCTCTCGGAGTCCTTCTTCACCAGCGGCATAGGCTCGGCGGAGGATGTGAAGCAGGTCCTGCGGGAGGTCTCCTCCGGCCAGGCCCAGTACGTGGACAATGGCCAGGGCAACATGCAGGGAATACAGCCCCTCAACAGCCTGCTGCAGCCGCTGATCTACCAGGGAGGAGTCACCTCCAATGGCATTGCCGCCGCCGGGCAAGAGGGCCTGTTGTCCACTGATTGCCAAATGAATGCCAATCAGAGCCAGACATCGACTCTGGATGCCGGTCTGTTGTTCGCCTGCGGCAACTCCACCACAACCAGCAATGCAGCCACAACGACATTGGGTGGTAATAAATCCCTGCTGGCCTCGGGGCCCCTGTCCGGCTCCGTGTCCAACCTGCAGCCGCTGTCGAACCAAACCAATTCCATTCTGAAGCGCCGCCTGCGCTCGAGTGCGCCCCAGGAGACGCACAAGTTCTCCAAGTTCCACACGCTCTCGCCGCACCGCTCCAAGCTGCGCAAGCCCTCCCGCACCCACTACACGCCCGCTCCGATCCTGAATCCGGATCGCAAGGGCACCGGCCTCTACTGCGGCGTCCGCAAGCAGCTGGGCCTGAGCCAGGGCCTCTTCGACGCCTTCGACGACGACTTTGGGGATCCGGTGGGCCTGGTCGACTTCTCGGACGAGTCCAAGGTGAATCTGGGCTCCACCTACCAGGCGCAGATACCCAGCTGCCGGCCGCCCGAGGAGGCTGTGCGAGACTCGCCCTGCGCCGAGCTAATGTGGAATCCGGAGGTGCAGGAGGACGAGAAGATCCTGATGCGGTACATTGATCTCAGCAAGTCGTCGGCCGTGCCCATGGGCAGTCATTCCGAGGAGGTGGCGCTCCACACGCTGCTCAAGGCCAGGGGCAACTCGGCGGCAGCGGTGCTCACCCTGCTCCAAACCCAGTCCGGCGCCTTCCAGATGAAGTGGACGGCCTACGAGCTGGAGCAGTTCCTGCGGGGCCTGGAGAAGCATGGCAAGGACTTTGGCAAGATTGCCAGCGAGCTCCTCACCAAGTCCTCCGGCGAGTGCGTGCAGATGTACTACTTCTGGAAGAAGCTCTGCGTGGACTACAAGGTCTCGCACCTGAAGATGGAGCCCGTGGTGGTGATCACGCCCGCCGTGGAGAAGCCCTATGTCTGCGAGATAGCCGACTGCTCAGCGAGCTTCAGTGCCGCCAAGGAGGGCGAGTTTCCCTGCAAGGTGTGCGGCAAGGTCTTCAATAAGGTGAAGAGTCGCAGTGCGCATATGAAAACCCATCGTGTCNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNTCTGGCCACTGTCGCCGCATCAAGCATCACCACTTCGTCGTAG
Protein Sequence: MSRWSVVPKSIHLPLTTLSSAPRVLMCSASVGTEGSVTLQLRDANALEATTSSSSKTATSGGAAAAAAGAGASSTNGAATASAATLENALTIGYPDPEMLADVLGTIQTASLKNHNSNSITTVTSSNSSAKSAIGNHLRIGIGGIISVEAPRKNRPKLSSPTRHGPQQCQTCCKIFGNASALAKHKLTHSDERKYICALCSKAFKRQDHLNGHMMTHRNKKPYECKADGCGKSYCDARSLRRHSENHHAGGATTPTTTSQQSLSPTASSSGASSSSVGVATSSLSLSPATASGDASSPDGATCIRTYISTGSSVVDAATGIALSDEQIKAMNLPIKTGVTLLSPTTSTSSNASSTASSSSSSASASASISSLSSASSGIGLTAVSSPSSVGTVIATSSPAPTITLSDGMSLEGEGLTREQLDLISKIMQQTKQTSAQVTVSSPTSVSSYKINTNQAPSQSRPRTWNMQLLNSAQNVTVTVEDNTELVAPSSSSPVEVKEEELSPQLVAAINPHLLNIVKLDKPVECNLCHRKFKNIPALNGHMRLHGGYYKKDPETKRSEKKDSSGPPLQTASIGVRALIEEKIISKRKDMTKGSFVVPAPPHSSGTTTTLRRSISDLESFLNPKSSSSGHTQTLNTGTGTTTAVLPAATTIKSSNGLSIQQIGLPQSIEIFSGGQKQAKTLNLGSGTNTITITTNNVPTTTTMSALTALKAGGTISGISTATNTDPKDSTLIELLKRGTRIAVTSKKAQAQCQTTSGVLMTSSSTATQSMGTLTELTTIGGSSVQAVGRQIITNNNRTVIIPSDVQVVSTKSKLTSLSSLSSLVKSTVATTTSSSTNTSCSSGNLSLADGTPLSLTIAPSQDVSGGAGVPSGTGSVITSGGGGVYTVTYTSDGTDLFDDAEVYNVSDTEMLLQTVDSMELLHDDEEEPQIKSEHSEDFAMLSEAGDSAHTQLVKLEPESGQGGGNSSGGGGGTGANTTPLPTFQQFHSKELIMQNSSQIQAIASMRPSGAGSGAGAGNGSGVLASPLHSPLAYPTPPSSHENMAQSSPFIEDAAAQFVDASNTFFGDKTDFSHIYFKTDEGQATIEQMNEHDNEKILKLKSVLEESSFDPSIKVEDLLNGTDDDTECDLREFAETNLSFLDEDQEFLNDSRNATSPLSESFFTSGIGSAEDVKQVLREVSSGQAQYVDNGQGNMQGIQPLNSLLQPLIYQGGVTSNGIAAAGQEGLLSTDCQMNANQSQTSTLDAGLLFACGNSTTTSNAATTTLGGNKSLLASGPLSGSVSNLQPLSNQTNSILKRRLRSSAPQETHKFSKFHTLSPHRSKLRKPSRTHYTPAPILNPDRKGTGLYCGVRKQLGLSQGLFDAFDDDFGDPVGLVDFSDESKVNLGSTYQAQIPSCRPPEEAVRDSPCAELMWNPEVQEDEKILMRYIDLSKSSAVPMGSHSEEVALHTLLKARGNSAAAVLTLLQTQSGAFQMKWTAYELEQFLRGLEKHGKDFGKIASELLTKSSGECVQMYYFWKKLCVDYKVSHLKMEPVVVITPAVEKPYVCEIADCSASFSAAKEGEFPCKVCGKVFNKVKSRSAHMKTHRVXXXXXXXXXXXXXXXXXXXXXXXXXXLATVAASSITTSS

Similar Transcription Factors

Sequence clustering based on sequence similarity using MMseqs2

100% Identity: iTF_00590512; iTF_00480106; iTF_00480408; iTF_00531594; iTF_00531925; iTF_00617895; iTF_00617577; iTF_00492522; iTF_00492169; iTF_00483216; iTF_00482918; iTF_00541010; iTF_00541324; iTF_00488601; iTF_00488914; iTF_00609437; iTF_00609108; iTF_00565311; iTF_00565651;
90% Identity: iTF_00590512;
80% Identity: iTF_00590512;