Basic Information

Insect: Drosophila histrio
Gene Symbol: Myrf_1
Assembly: GCA_958299025.2
Location: OY729167.1:20306655-20314656[+]

Transcription Factor Domain

TF Family: NDT80_PhoG
Domain: NDT80_PhoG domain
PFAM: PF05224
TF Group: Unclassified Structure
Description: This family includes the DNA-binding region of NDT80 [2] as well as PhoG and its homologues. The family contains Swiss:Q05534 or VIB-1. VIB-1 is thought to be a regulator of conidiation in Neurospora crassa and shares a region of similarity to PHOG, a possible phosphate nonrepressible acid phosphatase in Aspergillus nidulans. It has been found that vib-1 is not the structural gene for nonrepressible acid phosphatase, but rather may regulate nonrepressible acid phosphatase activity [1].
Hmmscan Out: # of c-Evalue i-Evalue score bias hmm coord from hmm coord to ali coord from ali coord to env coord from env coord to acc

1 3 2 2.2e+04 -13.6 13.8 36 36 174 174 121 239 0.41

2 3 3.6e-38 3.9e-34 118.7 0.7 2 180 457 603 456 603 0.96

3 3 0.62 6.8e+03 -2.6 0.1 49 73 1243 1266 1207 1300 0.65

#	of	c-Evalue	i-Evalue	score	bias	hmm coord from	hmm coord to	ali coord from	ali coord to	env coord from	env coord to	acc
1	3	2	2.2e+04	-13.6	13.8	36	36	174	174	121	239	0.41
2	3	3.6e-38	3.9e-34	118.7	0.7	2	180	457	603	456	603	0.96
3	3	0.62	6.8e+03	-2.6	0.1	49	73	1243	1266	1207	1300	0.65

Sequence Information

Coding Sequence: ATGAATATGGAATTTGAATTTCCGGACTTTTCTCGCCCAGATTTCATGGATGGCATTGACAATGAAGCTTTGGATTTGTTTATGCAGGCAGCCGGCGTTGGCGGACTCGATGATGCGGCACAGCACGGCAACAATGATGGGCTGGCCGTGGACTCCGTTGTTGGCGGAGTCGCCAAACTGGAATCGCCACACACACCGCCAATGAATGTGCTCGATTCACAGCTGACGGGTCGTGTGAGTGGCATGACAATGCCAATGGCACATTTGCCGGAGAGTCCACCCGATTCGGGCTCAGAGCCAGCTTATAGTCCACTGGGTGAATCACAACTCACAGGGCGTGAACTGATCTATTCAGGTCTGGGcaatatgcaacaacaacagcagcaacaacaacagcagcagcaacagcagcaacaacagcagcaacaacagcagcagcaacatcattcGGGTCTGTTGCACACAGAGTTGCAGTTTACAACGCCATCGCAGCCGCAAGGACATCACTTTGTGCCGCCAGCGCAGGATGGGAGATCAAAGCCTGAAACGGGTCTGCTGATGAATGCCAACGGTTTGCTctgccagcaacagcagctgaacgagcaacagttgctgccgctgcatcatcatcagcagcagcaacagcaacagcagcagcagcagcaacatcatgaTCTGCCGCAGGAACAACTGCTCTATCAGCACTATGACAATGGCCACGGCTTGTATTCAGCTGGCAGCTATCAGAATCTGTCCAGCATTTCCACCTGCATGCTGACCTCATCCCTGGGATTGGGAGATCGTGTTCAGGTCATTGGCACCAGTCAATTGTCCCTGAATCGCAGTTCGACGCCCTCAACGCCGGTGCATTCGTTATCGCGTAAGCGGAAAATGTCCACACAATTGGATTGTCCGGACTTTGCGCCCAAGCATGATACGGGTTTGCTGATGAGTCCACTGCGAAATTCACATCATTCGATTGCAGGAACAGGGACAGCAACAGGTAcagcaacaggaacaggaacCACTCTTGCCTCCGCCACAATCAGCAGCAATCACAGTCACAGTGATCTTGATCTAAGCAAGACACCCGCGCATTCACATTGTTCCGCCTCCGTATCACCGGCATTGTCCGGCATTAATTCGCAGGCGGATAATAGCCTGGACGGGCAGACGAGCAATGCAGCCGGTGGTTCCGGCTCTGGCAGCGAGGCTGGCGATCCGGCGTTGACGCAATGCATTCGCTTCAGTCCATTCCAGCCGGAGAACTGGCACAAACTGTGCGATCAGAGCTTACAGGAGCTATCCGTCATTTATTATCGCGTCGATGCGGATAAGGGTTTCAATTTCAGCGTCTCGGATGACGCGTATGTGTGCCAGAAGAAGAATCACTTTCAGGTCACTTGCCATGCCCGACTTCAGGGAGATGCCAAATTTGTGAAGACACCGTCCGGCCTGGAGAAAATCAAATCCTTCCATTTGCATTTCTATGGTGTCAAATTTGAGGCGCCCAATCAAACAATACGCGTGGAGCAGAGCCAATCCGATCGCTCAAAGAAGCCATTCTATCCAGTACCTATCGATCTCCAGAGCCATATTGTCAGCAAAATCACCGTGGGGCGTCTGCACTTCTCGGAGACAACCAACAATAACATGCGTAAGAAGGGACGTCCAAATCCGGAGCAACGTTTCTTTCAACTCGTTGTCGGTTTACATGTGCACACGACATCCGGACACTTTCCCGTGGCCAGCCATGGCAGTGAACGCATTATTGTGCGTGCCTCGAATCCGGGACAATTTGAATCCGATGTGGATCTGTGCTGGCAGCGAGGCATCACACAGGAGTCCATCTTTCATGCTGGCCGTGTGGGCATTAACACAGATCGTCCCGATGAGAGTCTCGTTGTGCATGGCAATCTGAAGGTATCCGGACATATTGTTCAACCCAGTGACAGTCGCGCCAAGCAAGAGATTGCTGAATTGGATACATCTGTGCAATTGCGCAATATGCAAAAGATACGCATTGTAAGATATCGTTATGAACCGGAATTTGCAGTGCATTCGGGACTGAGACGTGAGAGCGACACACGGGAAATTGTTGACACGGGCGTCATAGCGCAGGAAGTGCGGGAAGTTATACCGGACGCAGTCCAAGAGGCTGGCAGCGTCGTACTGCCCAATGGAAATGTTATTGAGAACTTTTTGCTGGTCAATAAGGATCGTATACTAATGGAGAACATTGGGGCTGTTAAGGAGCTGTGCAAAGTCACCGGCTCGCTGGAGACGCGCATTGAGCATCTGGAACGAGCCAACAGTAATCATCATAACCACCAACTGCGTGCCAAGGATTTGCTGGAACCACGCTGTCTGCTCCCGCCGCGTGtctataaatcaaataatcgCAGCGATGGATACGAGATTTGTTCCAGTCGTGTGATGCAAATAATTATCTTCTTGCTGATCATTGTCATGGCAGCCTGCTTGGCTGCCGTGTCCACGCTATATTTTGTAgagcacaacaaacagcaacagccccAGCAGTTGGACGGTTATCAGGTCTTCGGCGACAGTCGTTTCTTCCGACCCGATAATCCCACACGACTGAGCGACGAGGATCGTCTCAATTTCCAGCACAACTTGCAGTCGCTCTTCAAGAACAAAACCCACGTGCCTTGGCCCAGTTTAATTTACGCGGCAAGCACTACACGACCCACGGGCGGCACGGCAATTCATCTGAGCGACGGCGATGAGATTCAGGAGAAGGAGGAACTCACCGCTGTGATGAGTAATCCACAGGTGAATCCACCGTTGCCCCTTCCAATTGCATCGCGCATCACAACGACAGCGCCGAGGAACAGTAATAAAACCATTGTCAGCAAGAACAAATCCAAGTGGCCCGTATCCCAAGAGGTACTACGTCCAGGCGGCAATCAAGGTGTCTCCCAGAAACTATTGCAAGGTGTTCGCGTAGTGGGCAAACCTCTGACAACATTCAATAATGGTACAATTACCTCGTCGGAGAAACCGCAACCCATTCCACTGTCGCAGGACTTTGAGAACAACTCCATAGATGTGGAtgcccagcagcaacagttgcaacagctgcaacagcaattgAAGCAGCCACCGAAACTGGACGAACACTTCGTGGTGGTGGGCACCATTGCCAGCACAGCCGTGGACAATGCTGCCTCGGATGCTGGCCAAGCTATACGCAAATTAAATGCAGGCGATGTGGCCATTTACAATGTATACAAAACAGTTTCGCCACCAACAGCTAACTTGGCTCTGACCACCAACAAGGTCAGCACCGAGCAGACACAATTGCAGAGTACACTAGCCCTGGCACTGGATGTTCCGCCGCCGGCTGCAGTGCGTAACACGAGCGGAGGCAGCAAAGACAATGGAGATGCCTTGGATTTACAGAATCTCAGCACTACAAGTGAATCGGAGTCGGCATATAATCCCATTACAGCTTTGTTTGGTTTTGAGTATCAGGGCGGATTGCGGGACTCCAGTCTGGGCAGAAGATCGGCCAATCAGCGCAGCTTGGATTGGATACGAAATAAGAGCCTGAAAACGCCAATTTTTGGACAACCACCGGAGTGCACCAAGGATAAGGATGAAACCGACAATTGTCAGTCCAGCTGCTTTGAGGAGCTGCAgccggcggcagcggcggcagaCAATGTGGACGCAAATGTGAAACATCAGCATATGGAGGATGTTGAGCTGCAGTCTGCCGAATCGGAAGAGGATTCCGACATACTGATAATACAGCCAGTTGCCAGCAGCAATGATACCAGCAAAGTGCCAGCTTCCCGGGTCTATCATGGCAAGAGTTCTCACAGCACAGACGCCAGATTGAAACAATACTCTGCCGAAACGGATGTAGCGTCCAGCGAGGATGCACTGTACACTGTGCTCAACGATGCACCCGTCGTAGCTGTAGATCATGCGCCCGATCTTGTAAAACGCCTGCCGGCTGCCAATGAAGATGTGCCAGTTGCTCCGGCAGCGACAGtgacagcagcaggagcaacagCTACAGTGGTGCCTGCCCAGTTGGATTGCTGGAGCATTACAAGCTGTGTGCTGGCCGGACTGAATAACTACACCATTGATGTGGAGCATTTCTGTCCCAGCGCTGGCAGCTCTCTGAATGTGAGCTACATTGTGCCCGTGTCGCGTTATCTGCAGGCTATCAGCTTGGAGCTGCACTTCAGCTCCAACAAGCCGCTGCAATGGTCCATTTGCAGCAATGAGGATCAGAGCAAGTCAAATGCGGGCACCGCACAGTTAAATGAGGATGACGAAGCGCCTCCAAGCAGCTGGGTGAAGGTGTTGAAGCAGCTGGGCAACAATAAGCTGATCCTGGCATTGGATATGCCCAGTCGTGGCAATTTTGTACGCGACTTTATGCTACGTGCCAGCACAGACCTGGAACAACAAAAACTATGCGATGACAACGCCCATGTGGCGAACCCTATACTCCAGTACAACTTTAGCATCGTAAGAGATTGTGAttag
Protein Sequence: MNMEFEFPDFSRPDFMDGIDNEALDLFMQAAGVGGLDDAAQHGNNDGLAVDSVVGGVAKLESPHTPPMNVLDSQLTGRVSGMTMPMAHLPESPPDSGSEPAYSPLGESQLTGRELIYSGLGNMQQQQQQQQQQQQQQQQQQQQQQQQHHSGLLHTELQFTTPSQPQGHHFVPPAQDGRSKPETGLLMNANGLLCQQQQLNEQQLLPLHHHQQQQQQQQQQQQHHDLPQEQLLYQHYDNGHGLYSAGSYQNLSSISTCMLTSSLGLGDRVQVIGTSQLSLNRSSTPSTPVHSLSRKRKMSTQLDCPDFAPKHDTGLLMSPLRNSHHSIAGTGTATGTATGTGTTLASATISSNHSHSDLDLSKTPAHSHCSASVSPALSGINSQADNSLDGQTSNAAGGSGSGSEAGDPALTQCIRFSPFQPENWHKLCDQSLQELSVIYYRVDADKGFNFSVSDDAYVCQKKNHFQVTCHARLQGDAKFVKTPSGLEKIKSFHLHFYGVKFEAPNQTIRVEQSQSDRSKKPFYPVPIDLQSHIVSKITVGRLHFSETTNNNMRKKGRPNPEQRFFQLVVGLHVHTTSGHFPVASHGSERIIVRASNPGQFESDVDLCWQRGITQESIFHAGRVGINTDRPDESLVVHGNLKVSGHIVQPSDSRAKQEIAELDTSVQLRNMQKIRIVRYRYEPEFAVHSGLRRESDTREIVDTGVIAQEVREVIPDAVQEAGSVVLPNGNVIENFLLVNKDRILMENIGAVKELCKVTGSLETRIEHLERANSNHHNHQLRAKDLLEPRCLLPPRVYKSNNRSDGYEICSSRVMQIIIFLLIIVMAACLAAVSTLYFVEHNKQQQPQQLDGYQVFGDSRFFRPDNPTRLSDEDRLNFQHNLQSLFKNKTHVPWPSLIYAASTTRPTGGTAIHLSDGDEIQEKEELTAVMSNPQVNPPLPLPIASRITTTAPRNSNKTIVSKNKSKWPVSQEVLRPGGNQGVSQKLLQGVRVVGKPLTTFNNGTITSSEKPQPIPLSQDFENNSIDVDAQQQQLQQLQQQLKQPPKLDEHFVVVGTIASTAVDNAASDAGQAIRKLNAGDVAIYNVYKTVSPPTANLALTTNKVSTEQTQLQSTLALALDVPPPAAVRNTSGGSKDNGDALDLQNLSTTSESESAYNPITALFGFEYQGGLRDSSLGRRSANQRSLDWIRNKSLKTPIFGQPPECTKDKDETDNCQSSCFEELQPAAAAADNVDANVKHQHMEDVELQSAESEEDSDILIIQPVASSNDTSKVPASRVYHGKSSHSTDARLKQYSAETDVASSEDALYTVLNDAPVVAVDHAPDLVKRLPAANEDVPVAPAATVTAAGATATVVPAQLDCWSITSCVLAGLNNYTIDVEHFCPSAGSSLNVSYIVPVSRYLQAISLELHFSSNKPLQWSICSNEDQSKSNAGTAQLNEDDEAPPSSWVKVLKQLGNNKLILALDMPSRGNFVRDFMLRASTDLEQQKLCDDNAHVANPILQYNFSIVRDCD

Similar Transcription Factors

Sequence clustering based on sequence similarity using MMseqs2

100% Identity: iTF_00579282;
90% Identity: -
80% Identity: -