Basic Information

Insect: Bactrocera dorsalis
Gene Symbol: Myrf_1
Assembly: GCA_000789215.2
Location: NW:256305-270265[-]

Transcription Factor Domain

TF Family: NDT80_PhoG
Domain: NDT80_PhoG domain
PFAM: PF05224
TF Group: Unclassified Structure
Description: This family includes the DNA-binding region of NDT80 [2] as well as PhoG and its homologues. The family contains Swiss:Q05534 or VIB-1. VIB-1 is thought to be a regulator of conidiation in Neurospora crassa and shares a region of similarity to PHOG, a possible phosphate nonrepressible acid phosphatase in Aspergillus nidulans. It has been found that vib-1 is not the structural gene for nonrepressible acid phosphatase, but rather may regulate nonrepressible acid phosphatase activity [1].
Hmmscan Out: # of c-Evalue i-Evalue score bias hmm coord from hmm coord to ali coord from ali coord to env coord from env coord to acc

1 3 1 1.2e+04 -7.2 12.6 10 165 57 216 48 218 0.47

2 3 0.38 4.7e+03 -2.9 0.1 90 120 268 299 251 301 0.64

3 3 6.9e-38 8.5e-34 116.8 0.7 2 180 520 666 519 666 0.96

#	of	c-Evalue	i-Evalue	score	bias	hmm coord from	hmm coord to	ali coord from	ali coord to	env coord from	env coord to	acc
1	3	1	1.2e+04	-7.2	12.6	10	165	57	216	48	218	0.47
2	3	0.38	4.7e+03	-2.9	0.1	90	120	268	299	251	301	0.64
3	3	6.9e-38	8.5e-34	116.8	0.7	2	180	520	666	519	666	0.96

Sequence Information

Coding Sequence: ATGGAATATCCAAAGAATATGAGTGATCGATCCGATTTCATTGGAGGCATCGACAATGAGGCAATCGATTTCGGTAATCTGGAACAGTTCATGCAGGTTGAAGCCGCCGTTGGACAGCTGGAAGCACAAAATAGCTGCATAAATGGCAATAACACACGCGAAAACACATTATGTTGCAGCTCGAAGGCCGATGTcaaccaacagcagcaacaacagcagcagcaacagcagaatCCACATCACCAACAAATTAACTCCGTCGATGGAAATTTATCATTAGTGAGCGTGTCGGCGCGTGTAAGTTTAACCTCGACACCTATAGCGACACCCATACCGACAACGGTTAGTCACGGCACACCGCATATGCCTGATAGTCCGCCGGATTCCGGTTCCGAGCCACCCTATAGTCCGCTGCAAGATGCACATGGTCTCACACTCACCTCGCGCGACGTTTACAATGGTCTCTCCGCCATGCAGCCGGACATGCAACTGCAGTCACAATATACACCACCGCATCAAACGCAAGCATCAACGACACATCAccatcatcaacagcaacaacagcagcaacaccaacagctgCAGCACAATAACCaccatagcaacaacaacgccaccCAAATTCATTACAATCACAATCATTCGCCAACAGCGCCACCAAACGACACAATGAGCCGCGTACGTGTGAAGCATGAAGCCGGTCTGATTATAGATCCTgccacactcacgcacacacatgcgaaCGCCATCAGCACACACGCGCATGGCGAACACAATGCCAGCCATGGTCACATGAATTTACCGCCACCGCATCAGTTGATGTTCTCAAATCcaaactccaacaacaacaatcaacataATGCGAATAGCAGCCATTTGCTGTCTTACGAAAATCTACAAGGTGGCAACTTTCCTTCGGTGAATTATCCAAATGTGACTATCGTAAATGGTCTGGATGTCATGCAAACGCATGCCACAACCTGTGCGCTCACCTCACCGTTGAACGAGGTGCCACGCGTGCAGTTGGTTGGCACCAGCCAAGCGCTTCCACCCCAACACAGTCGTTCGTCGTTGCCCACAACACCAGTGCATTTGTCTTTATCCCGCAAACGTAAACTCTCCACACAGCTAGATTGTCCGGACTTTGCTAGCATTAAGCCCGATCCGGGTTTGCGCATGAGTCCCACGCATGGCATGGCTACAGCCGCTGCGGAGCAACAGCAAAAGCTCAGCGCCTCATCACCGGTTACCATCACATTACCTGCACATGGGACTGCGAACGACATGACGAGCACGCCCGCGCACTCAGCTGCCTCACTATCGCCCGCGCTGTCAACTATCAACTCGAATGCCGATAACAGTCTGGACGGCAATAATACCGCTGGCAGCGGCGAAGGTGGCGGCGACAGTAATGCTCTAACGCCGTGCATACGTTTCAGCCCATTTCAACCGCAAAATTGGCATAAACTTTGCGACCAAAGTTTACAGGAGATCGCAGTGGTTTATTATCGTGTCGACGCAGATAAGGGTTTCAATTTTTCGGTCTCCGATGATGCGTTCGTTTGCCAGAAGAAGAATCACTTTCAAATAACTTGCCACGCACGTCTGCAAGGCGATGCGAAGTTTGTAAAAACACCGTCCGGTCTAGAGAAGATCAACTCCTTTCATTTGCACTTTTACGGTGTCAAATTGGAAGCGCCAAATCAGACGATACGTGTGGAGCAAAGCCAATCTGATCGTTCGAAGAAACCGTTCTATCCAGTGCCTATCGATTTGCAGAGTCACATTGTCAGCAAAGTCACAGTTGGTCGTTTGCATTTCTCAgaaactaccaacaacaacatgcgcAAGAAAGGTCGTCCCAATCCAGAGCAGCGTTACTTCCAGTTGGTAGTGGGCCTGCATGTTCATACCATCTCGGGCAACTTTCCAATCATCAGTCAAGGTAGTGAACGTATTATTGTGCGCGCCTCTAATCCTGGTCAATTCGAGTCCGATGTCGATCTTTGCTGGCAACGCGGCATCACACAGGATTCGATTTTCCATGCCGGCCGTGTGGGCATCAATACAGATCGACCGGATGAGAGTTTGGTCGTACATGGCAATTTGAAGGTGTCCGGTCATATAGTGCAGCCCAGTGATAGTCGCGCTAAGCATGAAATCGGCGAGTTGGACACATCGGTGCAATTGCGCAACTTACAGAAAATACGTATTGTACGTTATCGTTACGCGCCCGAGTTCGCCGTACACTCGGGTCTGAAGCGTTCATGTGAAAGCGACAGCGAAGAGATCGTGGATACGGGCGTGATTGCGCAGGAGGTGCGCGAAGTTATACCAGATGCGGTGCAAGAGGCTGGCAGTATCGTGCTGCCGAATGGCAATGTCATCGAGAATTTTCTGCTCGTCAATAAGgatcgtattttaatggaaaatattggtGCGGTAAAAGAACTGTGCAAAGTCACCGGTTCGCTGGAGACGCGCATTGAAGATTTGGAGCGAAATAATCGCCTGAACAGACAGAACGAATTTGAGCAGCGCAGCAAACAGTACCGTTTGACGAAAAGCTGTGGTCCACGCGGCGGCTATGAAATCTGTTCGAACAAGTCGCTGCAGATTGTTATATTCTTATTAGTAATCGTTATGGCAGCCTGTCTGGCAGCCGTCTCCACTCTCTATTTCGTCGAGCACAACAAACAGCGTTACAACTACAAACAACTGGATCGTCTGCAGTTCCACAGCAATGGTCATCTGCTAGGCCATGACTCAGTTTTCATAAATGAACAGGAAGGTTACATCGTACAGGTGCACAACATGCTCAATCGTAATAAAACCGTACAGCATGGGAGCACCTCGCGACCGCCGGGTTATCGAAACTATACACGTCCGCGTGGTGAAATAATCTATGATGAAAGCAGTGATCCATACTCACAAAACGGACGTAACGATGAACTAACGGTTGTTATGGAAAAACCACTTGTAAGCCTACAGCCACTACATCCACGTAAGGATACGTTTAAGGTGACGACAACGGCACCGCTGCTACGCCTCAACAAGACTATCAACAGTAAAAACAAGTCCAAGTGGCCGCAGGCACAAGTTGTGCCCAAAGTAATAGCGTCCTTCCAAAATACACGTGCCACAAGTAGCATACAAACCGAAAATAGCGCAAATCtaacattacaacaaaagcGTACGGGTACGCTGGGTGCTAATGAAACCTCTTCCGAGAAAGTGGCCGCCGATAATGTGTCATTGACACACGATTTCGATAACAATTCCATCGATATCGACGCACAACATTTGACAAAGAAAGCGACGGCTATCAGAGAGTCGGCTGCGCGTCCGATCACTTCACGTGAGGAAACACTCTCGGAAAATAGTGAAGCTATTGCTGACGCCATCGGCGCAATTGTCAGCACATCGAGCAGCAATGTGAATGGCAAAAACGATGTCAACCACAGCGACAACCTAAAGAATACGAATCTGAATGCTAACAACAATGTGCCCGACACCACTGCGCCAGCGTATAGTCATCGTTCGCGCAATGTCTACAAAGCGGTATCGCCGCCATCGGCACTTTTGCCACTTACAACCAACAAGGTGACTATTGAAGGCAACACGGGTAATTACTCGCTAGACGGGCACTACGTCTATTCGAATAAGAGCCAAGCTGTGTTGGAGAATAAAGTGGATAGCACGGATCTATTGGACTTACAGAGCTTGAGCAACAATAGTGAGTCGGTGGATAATCCGATAACCGCATTGTTTGGCTTCGATTTCGGCTTGGGACGCGAATCGGTGCTGGGGCGGCGATCAACTTCGCAGCGTAGTGTCGGTCGCGTACAGTGTAAATTTGTGCAAGTGGAGATGTTCGGTGCGCCACCACAATGCACTCATTTTGCTTCGAGGAGACCAATCAATTGCCGGTAATTCAAGACACCCTAGCAGGCATCACACGTGTGAAAGAGAACCCAGCGGTACCAGAAAAACAACTTAGCAAAGAAAGTTTACCATTATCCGAATCGAATGCAGACAGTGCCGATACCGACACAGATCCAGACACACAACCACGTTCACTGGCCACACCTATACTGTCTGCCAACGCCACTTTTATTGGAACGGACAAGAAAACACAAGTTGTAGAAGTTTCCAGCGAACAACGTTCCGATCTTTCGGACTCCTCAAAAGACACATCCAGTTCCGATGAACGTCTCGATATTGATGTAAAGACCGCAGATGAAGCAATAAGTGCACCAACAGGTAGTGCAACATCCGCTGAACTGCAAagagcagcagtagcagcagccgcggcagcagcggcagcacaAATAGATTGTTGGCAAATCAATAGCTGTTTAATAGCTGAGACAAATAATGAGACATTTGGTATGGAGCATCATTGTCCACATAGTGGCAAATCACTGAATATGACCTACATTATACCGTTATCGCGGTTTTTCAAGGAATCAAGCATACAACTGCAATTGAGCTCCTCCGTGCCACTATTATGGACCATTTGTAGCAACCGTGAGCTGACTAGGCATCAGGGCGCTCATCTATTACAATCATCTGCGCATCAACTTAGCGCAAACATTGTACAACGTCAATCAAATGTATCGGTTATATACTTCAATATACCAAGTCGAGGTTACTTCATCCGAAGTTTGGCGTTACGCGCAACGACGGCGGATTCGAAAAACcaaaatatttgcCAGGAGACAGCACACGAAGCAAACACTTTACTGCAGTACAACTTTAGCATCGTAAGAGATTGTGATTAG
Protein Sequence: MEYPKNMSDRSDFIGGIDNEAIDFGNLEQFMQVEAAVGQLEAQNSCINGNNTRENTLCCSSKADVNQQQQQQQQQQQNPHHQQINSVDGNLSLVSVSARVSLTSTPIATPIPTTVSHGTPHMPDSPPDSGSEPPYSPLQDAHGLTLTSRDVYNGLSAMQPDMQLQSQYTPPHQTQASTTHHHHQQQQQQQHQQLQHNNHHSNNNATQIHYNHNHSPTAPPNDTMSRVRVKHEAGLIIDPATLTHTHANAISTHAHGEHNASHGHMNLPPPHQLMFSNPNSNNNNQHNANSSHLLSYENLQGGNFPSVNYPNVTIVNGLDVMQTHATTCALTSPLNEVPRVQLVGTSQALPPQHSRSSLPTTPVHLSLSRKRKLSTQLDCPDFASIKPDPGLRMSPTHGMATAAAEQQQKLSASSPVTITLPAHGTANDMTSTPAHSAASLSPALSTINSNADNSLDGNNTAGSGEGGGDSNALTPCIRFSPFQPQNWHKLCDQSLQEIAVVYYRVDADKGFNFSVSDDAFVCQKKNHFQITCHARLQGDAKFVKTPSGLEKINSFHLHFYGVKLEAPNQTIRVEQSQSDRSKKPFYPVPIDLQSHIVSKVTVGRLHFSETTNNNMRKKGRPNPEQRYFQLVVGLHVHTISGNFPIISQGSERIIVRASNPGQFESDVDLCWQRGITQDSIFHAGRVGINTDRPDESLVVHGNLKVSGHIVQPSDSRAKHEIGELDTSVQLRNLQKIRIVRYRYAPEFAVHSGLKRSCESDSEEIVDTGVIAQEVREVIPDAVQEAGSIVLPNGNVIENFLLVNKDRILMENIGAVKELCKVTGSLETRIEDLERNNRLNRQNEFEQRSKQYRLTKSCGPRGGYEICSNKSLQIVIFLLVIVMAACLAAVSTLYFVEHNKQRYNYKQLDRLQFHSNGHLLGHDSVFINEQEGYIVQVHNMLNRNKTVQHGSTSRPPGYRNYTRPRGEIIYDESSDPYSQNGRNDELTVVMEKPLVSLQPLHPRKDTFKVTTTAPLLRLNKTINSKNKSKWPQAQVVPKVIASFQNTRATSSIQTENSANLTLQQKRTGTLGANETSSEKVAADNVSLTHDFDNNSIDIDAQHLTKKATAIRESAARPITSREETLSENSEAIADAIGAIVSTSSSNVNGKNDVNHSDNLKNTNLNANNNVPDTTAPAYSHRSRNVYKAVSPPSALLPLTTNKVTIEGNTGNYSLDGHYVYSNKSQAVLENKVDSTDLLDLQSLSNNSESVDNPITALFGFDFGLGRESVLGRRSTSQRSVGRVQCKFVQVEMFGAPPQCTHFASRRPINCR*FKTP*QASHV*KRTQRYQKNNLAKKVYHYPNRMQTVPIPTQIQTHNHVHWPHLYCLPTPLLLERTRKHKL*KFPANNVPIFRTPQKTHPVPMNVSILM*RPQMKQ*VHQQVVQHPLNCKEQQ*QQPRQQRQHK*IVGKSIAV**LRQIMRHLVWSIIVHIVANH*I*PTLYRYRGFSRNQAYNCN*APPCHYYGPFVATVS*LGIRALIYYNHLRINLAQTLYNVNQMYRLYTSIYQVEVTSSEVWRYAQRRRIRKTKIFARRQHTKQTLYCSTTLAS*EIVI

Similar Transcription Factors

Sequence clustering based on sequence similarity using MMseqs2

100% Identity: iTF_00082953;
90% Identity: iTF_00191368;
80% Identity: -