Basic Information

Insect: Drosophila rubida
Gene Symbol: Myrf_1
Assembly: GCA_035046165.1
Location: JAWNOF010000021.1:21696718-21704771[+]

Transcription Factor Domain

TF Family: NDT80_PhoG
Domain: NDT80_PhoG domain
PFAM: PF05224
TF Group: Unclassified Structure
Description: This family includes the DNA-binding region of NDT80 [2] as well as PhoG and its homologues. The family contains Swiss:Q05534 or VIB-1. VIB-1 is thought to be a regulator of conidiation in Neurospora crassa and shares a region of similarity to PHOG, a possible phosphate nonrepressible acid phosphatase in Aspergillus nidulans. It has been found that vib-1 is not the structural gene for nonrepressible acid phosphatase, but rather may regulate nonrepressible acid phosphatase activity [1].
Hmmscan Out: # of c-Evalue i-Evalue score bias hmm coord from hmm coord to ali coord from ali coord to env coord from env coord to acc

1 4 1 1.5e+04 -5.2 3.3 61 61 191 191 126 224 0.49

2 4 1.7e-38 2.6e-34 118.8 0.7 2 180 457 603 456 603 0.96

3 4 0.82 1.3e+04 -4.0 0.5 60 83 1032 1055 1022 1081 0.64

4 4 0.32 4.9e+03 -2.7 0.5 40 86 1244 1289 1213 1318 0.55

#	of	c-Evalue	i-Evalue	score	bias	hmm coord from	hmm coord to	ali coord from	ali coord to	env coord from	env coord to	acc
1	4	1	1.5e+04	-5.2	3.3	61	61	191	191	126	224	0.49
2	4	1.7e-38	2.6e-34	118.8	0.7	2	180	457	603	456	603	0.96
3	4	0.82	1.3e+04	-4.0	0.5	60	83	1032	1055	1022	1081	0.64
4	4	0.32	4.9e+03	-2.7	0.5	40	86	1244	1289	1213	1318	0.55

Sequence Information

Coding Sequence: ATGAATATGGAATTTGAATTTCCGGACTTTTCTCGCCCAGATTTCATGGATGGCATTGACAATGAAGCGCTGGATTTGTTTATGCAGGCTGCCGGCGTTGGCGGCCTCGACGATGCCGCACAGCACAGCCACAACGACGGCTTGGGCGTGGACAGTGTGGGCGGAGTGTCCAAGCTGGAGTCGCCACACACCCCGCCAATGAATGTGCTCGACGCACAGCTGACGGGTCGTGTGAGTGGCCATGGCATGGCGATGCCTCTGGCACATTTGCCCGAGAGCCCGCCCGACTCGGGCTCCGAGCCGGCCTACAGTCCACTGGGTGAAGCACATGGCGTGGCGCTGACTGGGCGTGAACTCATCTATCCTGGTCTGagcaacatgcagcagcaacatcaacagcaacagcagcagcagcaacagtcgagcATGTTGCCAACAGAGCTGCAATTCGCATCGccatcgcagcagcagcagggacaTCACTTTGTGTCGCCGGCGCAGGACGTGCGCATCAAACACGAGGCTGGCCTGGTGATGAATGCCAACAGTCTgctctgccagcagcagcagcagcagcaacaactaaacgagcagcaacagttgctgctgcagcaacaacaacagcaacagcagcagcagcacgagttGCCGCAGGATCAGCTGCTCTATCAGCACTACGACAATGGTCCTGGCTTGTATTCGACTGGCAGCTACCAGAATCTGTCCAGCATTTCCACCTGCATGTTGACTTCATCCCTGGGACTGGGTGATCGTGTTCAGGTCATTGGCACCAGTCAGCTGTCCCTCAATCGCTGCTCCACGCCATCGACGCCAGTGCACTCGTCGTTGTCGCGCAAACGCAAAATGTCCACGCAATTGGATTGTTCGGATTTCGCGCCCAAGCATGACACCGGTTTGTTGATGAGTCCGCTGCGTAGCTCGCATCACTCGATAGCACCGCGTgacatggccagcagcagcagcagcaacagcaacagtgcaagcacaagcgcaacaacaacagccagccacATCCACAGCAGCCAGAATCATGGTCACAGCCAGAGCGATCATGATCTGAGCAAGACACCCGCGCATTCACACTGCTCCGCCTCCGTTTCGCCAGCGCTCTCGGGCATCAATTCCCAGGCCGACAATAGCCTGGACGGGCAGACTAGCAATGCGGCAGCTGGCTCCGGCTCGGGCAGCGAAGCTGGGGATCCGGCGCTGACGCAGTGCATTCGCTTCAGTCCCTTCCAGCCGGAGAATTGGCACAAGCTGTGCGATCAGAGTCTGCAGGAGTTGTCCGTCATCTACTATCGCGTGGATGCCGATAAGGGTTTCAATTTCAGCGTATCGGATGATGCGTACGTGTGCCAGAAGAAGAATCACTTTCAGGTCACTTGCCATGCTCGGCTTCAGGGAGATGCCAAATTTGTGAAGACACCGTCCGGCCTGGAGAAAATCAAATCCTTCCACTTGCATTTCTATGGTGTCAAATTCGAGGCGCCCAACCAGACAATTCGCGTGGAGCAGAGCCAATCCGACCGCTCCAAGAAGCCATTCTATCCCGTACCTATCGATCTCCAGAGCCATATTGTCAGCAAAATCACCGTGGGGCGTCTGCACTTCTCGGagaccaccaacaacaacatgcgcAAGAAGGGACGCCCCAATCCGGAGCAGCGCTTCTTCCAGCTCGTCGTCGGCCTGCATGTGCACACCACCTCTGGCCACTTCCCGGTGGTCAGCCATGGCAGCGAGCGCATCATTGTGCGCGCCTCGAACCCGGGACAATTTGAGTCTGATGTGGATCTGTGCTGGCAACGCGGCATCACTCAGGAGTCCATCTTCCATGCGGGCCGTGTCGGCATCAATACCGATCGCCCCGACGAGAGTCTTGTGGTGCATGGGAATCTGAAGGTATCGGGACACATTGTGCAGCCCAGCGATAGTCGCGCCAAGCAGGAAATTGCCGAACTGGACACCTCGGTGCAGTTGCGCAACATGCAGAAGATTCGCATTGTCCGATATCGCTATGAGCCGGAATTCGCTGTGCACTCCGGGCTGAGGCGTGAGAGCGACACACGCGAGATTGTGGACACGGGCGTCATAGCGCAGGAGGTGCGCGAAGTTATACCGGACGCAGTGCAAGAGGCTGGCAGCGTTGTACTGCCCAATGGAAATGTTATTGAGAACTTTTTGCTGGTCAATAAGGATCGTATACTAATGGAGAACATTGGGGCTGTTAAGGAGCTGTGTAAGGTGACGGGCTCGCTGGAGACGCGCATCGAGCACCTGGAACGCGCCAATAATAGCCACAATAACCACCAACTGCGTGCCAAGGATCTGCTGGAACCGCGTTgcctgttgccgccgccgcgcaACTATAGATTGCACAATCGCAACGATGGCTACGAGATCTGCTCGAGTCGCGCCATGCAAATTATTATCTTTCTGCTAATCATTGTTATGGCAGCCTGTTTGGCGGCGGTGTCAACACTCTACTTTGTGgagcacaacaagcagcagcagccgccgccgcagcagctcgATGGCTTTCAATTGTTTGGCGACTCGCGCATCTTTCGACCGGATGCGTCAGCGTCGCGTCTCAGCGACGAGGAACGCCTCAACTTTCAGCACAACTTGCAGTCGCTCTTCAAGAATAAAACGCACGTGCCGTGGCCAAGTTTGATGTACGGTGCAAGCACCACACGACCCACTGGCGGCACACCTACACAACGTCTGGGCGATGGCGAGGAGATTCAGGAAAAGGAGGAGCTGACCGCTCTAATGAATGATCCGCAAGTAAGCCCATCGCAGCCCGTGCCCCCAACAATAGCCAGGATCACAACGACAGCGccgcgcaacagcagcaaaccaaTTGCCAGCAAGAACAAGTCCAAGTGGCCCGTCTCCCATGAGGTGTTGCGACCGGGCGGCGGCAGCCAAGGCGCCGCCCAGAAGCTGCTCCAAAGTGTCAGAGTTGCTGTGGTGGGCAAAGCGGCAttggcggcaacaactgcgaaTAATGCCACCATCACATCCTCCGAGAAGCCGCAATCGATACCCGTGTCGCAGGACTTTGAGAACAACTCGATTGATGTGGAtcagcagctacaacagcaacagcagcagcagctgaagcagcccCTAAAGCTGGACGAGCACATTGTGGTGGTAGGCACCATAGCCAGCACTGCGGTGGACAATGCTGCCTCCGATCAAACCGTTCAAGCCATACGCAAGCTCAACGCTGGCGACGTTGCCATCTACAATGTGTACAAAACTGTCTCACCTCCAACGGCAAATCTGGCACTGACCACCAACAAGGTCAGCACGGAGCAGACGCATGTGCAGAGCACTCTGTCGCTGCCCCTGGACGTGCCACCTCCGGCTGCGGTGCGCAACACGAGCGGCGCCAGCAAGGATAGCGGGGATGCCTTGGACTTGCAGAATCTGAGCAATACCAACGAATCGGAGCCGGCGGATAATCCCATTACAGCGTTGTTTGGCTTCGAGTACTCGAGTGGTCTGCGCGATTCCAGCGTGGGACGACGCTCGGCCAATCAGCGCAGCTTGGACTGGATTCGCAACAAGAGCCTGAGGACGCCACTCTTCGGGCATCCAGCCGAGTgcaacaaggacaaggacGAGCAAGACAATTGTCAGTCCACTTGCTTTGAGGAGCTGCAgccggctgcagctgctgcggatAATGTGGACGCCAATGTGCAGCATCAGCATGTGGAGGACGAGCTGCAATCTGCTGAGCAGGAAGATGACGCTGACATACTAATCATACAGCCcgtgtccagcagcagcagcaatgacaCCAACGCCAATGTCGCCGGCTCACGCGTCTATCATGGCAAGAGCTCGCACAATACGGCCGCCAGATCCAAGCAATTCTCCAGCGAATCGGATGCATCGACTGGCGAGGATGCGCTCTACACGGTGCTGAACGATGCACCTGTGGCAGCTGTGGAGCATGCCGACTTGTTGCCCAAAGAGAATGCTGCTGTGGCGACGGCCACAGCATTGCCGCTGCCTCCTCAGCTCGATTGCTGGAGCATTAGCAGCTGTGTGCTGGCCGGGCTTCATAACTACACCATTGATGTGGAGCACTTCTGCCCCAGTTCGGGCAGCTCCTTGAACGTCAGCTATGTGGTGCCCGTGTCACGTTATCTGCAGGCTGTCAGCCTTGAGCTGCACTTCAGCTCCAATAAGCCGCTGCAGTGGTCCATTTGCAGCAACGAGGATCAGAGCAAGACGAGCGCGGGCGCACAGCTGAATGAGGACGAGGATGCGccgccaagcagcagctgggtTAAGGTGCTCAAACAGCTGGGCAATAACAAGCTGATCCTGGCCTTGGACATGCCCAGTCGTGGCAACTTTGTGCGCGACTTTATGCTGCGTGCCAGCGCCGATCTAGAACAACAAAAACTATGCGATGACAACGCCCATGTGGCGAACCCTATACTCCAGTACAACTTTAGCATCGTAAGAGATTGTGAttag
Protein Sequence: MNMEFEFPDFSRPDFMDGIDNEALDLFMQAAGVGGLDDAAQHSHNDGLGVDSVGGVSKLESPHTPPMNVLDAQLTGRVSGHGMAMPLAHLPESPPDSGSEPAYSPLGEAHGVALTGRELIYPGLSNMQQQHQQQQQQQQQSSMLPTELQFASPSQQQQGHHFVSPAQDVRIKHEAGLVMNANSLLCQQQQQQQQLNEQQQLLLQQQQQQQQQQHELPQDQLLYQHYDNGPGLYSTGSYQNLSSISTCMLTSSLGLGDRVQVIGTSQLSLNRCSTPSTPVHSSLSRKRKMSTQLDCSDFAPKHDTGLLMSPLRSSHHSIAPRDMASSSSSNSNSASTSATTTASHIHSSQNHGHSQSDHDLSKTPAHSHCSASVSPALSGINSQADNSLDGQTSNAAAGSGSGSEAGDPALTQCIRFSPFQPENWHKLCDQSLQELSVIYYRVDADKGFNFSVSDDAYVCQKKNHFQVTCHARLQGDAKFVKTPSGLEKIKSFHLHFYGVKFEAPNQTIRVEQSQSDRSKKPFYPVPIDLQSHIVSKITVGRLHFSETTNNNMRKKGRPNPEQRFFQLVVGLHVHTTSGHFPVVSHGSERIIVRASNPGQFESDVDLCWQRGITQESIFHAGRVGINTDRPDESLVVHGNLKVSGHIVQPSDSRAKQEIAELDTSVQLRNMQKIRIVRYRYEPEFAVHSGLRRESDTREIVDTGVIAQEVREVIPDAVQEAGSVVLPNGNVIENFLLVNKDRILMENIGAVKELCKVTGSLETRIEHLERANNSHNNHQLRAKDLLEPRCLLPPPRNYRLHNRNDGYEICSSRAMQIIIFLLIIVMAACLAAVSTLYFVEHNKQQQPPPQQLDGFQLFGDSRIFRPDASASRLSDEERLNFQHNLQSLFKNKTHVPWPSLMYGASTTRPTGGTPTQRLGDGEEIQEKEELTALMNDPQVSPSQPVPPTIARITTTAPRNSSKPIASKNKSKWPVSHEVLRPGGGSQGAAQKLLQSVRVAVVGKAALAATTANNATITSSEKPQSIPVSQDFENNSIDVDQQLQQQQQQQLKQPLKLDEHIVVVGTIASTAVDNAASDQTVQAIRKLNAGDVAIYNVYKTVSPPTANLALTTNKVSTEQTHVQSTLSLPLDVPPPAAVRNTSGASKDSGDALDLQNLSNTNESEPADNPITALFGFEYSSGLRDSSVGRRSANQRSLDWIRNKSLRTPLFGHPAECNKDKDEQDNCQSTCFEELQPAAAAADNVDANVQHQHVEDELQSAEQEDDADILIIQPVSSSSSNDTNANVAGSRVYHGKSSHNTAARSKQFSSESDASTGEDALYTVLNDAPVAAVEHADLLPKENAAVATATALPLPPQLDCWSISSCVLAGLHNYTIDVEHFCPSSGSSLNVSYVVPVSRYLQAVSLELHFSSNKPLQWSICSNEDQSKTSAGAQLNEDEDAPPSSSWVKVLKQLGNNKLILALDMPSRGNFVRDFMLRASADLEQQKLCDDNAHVANPILQYNFSIVRDCD

Similar Transcription Factors

Sequence clustering based on sequence similarity using MMseqs2

100% Identity: iTF_00588848;
90% Identity: iTF_00553731;
80% Identity: -