Basic Information

Insect: Zeugodacus tau
Gene Symbol: Myrf_1
Assembly: GCA_031772095.1
Location: CM062652.1:21040164-21051517[+]

Transcription Factor Domain

TF Family: NDT80_PhoG
Domain: NDT80_PhoG domain
PFAM: PF05224
TF Group: Unclassified Structure
Description: This family includes the DNA-binding region of NDT80 [2] as well as PhoG and its homologues. The family contains Swiss:Q05534 or VIB-1. VIB-1 is thought to be a regulator of conidiation in Neurospora crassa and shares a region of similarity to PHOG, a possible phosphate nonrepressible acid phosphatase in Aspergillus nidulans. It has been found that vib-1 is not the structural gene for nonrepressible acid phosphatase, but rather may regulate nonrepressible acid phosphatase activity [1].
Hmmscan Out: # of c-Evalue i-Evalue score bias hmm coord from hmm coord to ali coord from ali coord to env coord from env coord to acc

1 4 1 2.9e+04 -12.3 14.5 108 109 151 175 27 210 0.44

2 4 6.8e-38 2e-33 116.8 0.7 2 180 512 658 511 658 0.96

3 4 0.76 2.2e+04 -3.9 0.0 109 124 891 906 838 929 0.73

4 4 0.41 1.2e+04 -3.0 0.1 36 71 1543 1574 1502 1577 0.60

#	of	c-Evalue	i-Evalue	score	bias	hmm coord from	hmm coord to	ali coord from	ali coord to	env coord from	env coord to	acc
1	4	1	2.9e+04	-12.3	14.5	108	109	151	175	27	210	0.44
2	4	6.8e-38	2e-33	116.8	0.7	2	180	512	658	511	658	0.96
3	4	0.76	2.2e+04	-3.9	0.0	109	124	891	906	838	929	0.73
4	4	0.41	1.2e+04	-3.0	0.1	36	71	1543	1574	1502	1577	0.60

Sequence Information

Coding Sequence: ATGGAATATCCCAAGCATAtaaatgATCGATCCGATTTCATTGGTGGCATCGACAATGAGGCAATCGATTTCGGTAATCTGGAACAGTTCATGCAGGTTGAAGCCGCTGTTGGACAGCTGGAAGCGCAAAATAGTTGCataaatggaaataataatACGCGTGAGAACACAAatcaacaccagcaacaacaccaaacacagcaacagcaacataatCCACATCATCAACAAATTAACTCGGTGGATGGAAACATATCATTAGTGAGCGTATCGGCGCGTGTGAGTTTAGCCTCCACACCTATAGCGACACCCATACCGACCGCGGTTGGTCACGGCACACCGCATATGCCCGATAGTCCGCCAGATTCCGGTTCCGAGCCACCCTATAGTCCGCTACAAGATGCACATGGACTCACACTCACCTCGCGCGACGTCTACAATGGTCTCGCCACCATGCAGCCGGACATGCAACTGCAACCGCAATATACACCACCGCATCAAACACAAGCACAAGCGCCACATcaccatcaacaacaccaacatcagcagcaacagcaacatctgCAGCACAACACCAAtcaccacagcaacaacaatgccaatcAACTACATTATAATCACAATCATTCGCCAACAGCGCCACCAAACGACACAATGGGCGGCATACGAGTGAAACACGAAGCCGGTCTGATCATAGATCCTGCCACGCTCACACATACGCATGCGAACTCCATTAGCACACACGCGCATGGCGAACACAATGCCAATCATGGTCATTTGAATTTACCGCCACCGCATCAGTTATTGTACTCGAATcagcacagcaacagcaataatcaACATAATGCGAACAACAGTCACTTGCTGTCTTATGAGAATCTACATGGTGGCAACTTTCCCTCGGTGAATTATCCAAATGTGACTATCGTCAATGGTCTGGATGTAATGCAAACACATGCCACTTCCTGCGCGCTCACCTCGGCGTTGAGCGAGGTGCCACGCGTTCAGTTGGTCGGTACGAGTCAAGCGATTCCACCGCAACACAGTCGTTCGTCGTTGCCCACAACACCAGTGCATATGTCGTCGTCCCGTAAACGGAAACTCTCCACGCAGCTGGATTGTCCGGACTTCACCAGCATTAAGCCCGATCCGGGACTGCGCATGAGTCCAACGCATGGCGTCGCAGCTGCGGAGTCGCAAACACTCAGCGCCTCCTCACCTGTTACGATCACACTACCTGCACATGCGACTGCGAGTGACATGACGAGCACACCCGCACACTCAGCTGCCTCACTATCTCCCGCGCTGTCAACTATCAACTCGAATGCCGACAACAGTCTGGACGGCAATAACACGGCGGCTAGCGGCGAAGGTGGCGGCGACAGTAATGCGCTAACGCCGTGCATACGTTTCAGTCCATTCCAGCCACAAAATTGGCATAAACTCTGCGATCAGAGCTTACAGGAGATCACGGTTGTTTACTATCGCGTCGACGCAGATAAGGGTTTCAATTTCTCGGTGTCCGACGATGCGTTCGTTTGCCAGAAGAAGAATCACTTTCAAATCACTTGCCACGCACGTCTGCAAGGCGATGCGAAGTTTGTAAAAACACCGTCCGGTCTCGAAAAGATCAACTCCTTTCATTTGCACTTTTATGGTGTGAAATTGGAAGCGCCAAATCAGACGATACGCGTTGAACAAAGCCAATCGGATCGTTCGAAGAAACCGTTCTATCCAGTGCCTATTGATCTGCAGAGTCACATTGTCAGCAAGGTAACAGTCGGTCGCTTGCATTTCTCAGaaactaccaacaacaacatgcgtAAGAAAGGACGCCCCAATCCCGAGCAGCGTTACTTCCAGTTGGTGGTGGGTTTGCATGTCCACACCATCTCCGGTAACTTCCCAATCATCAGTCAAGGTAGTGAACGCATTATTGTACGCGCCTCTAATCCAGGACAATTTGAGTCCGATGTCGATCTTTGCTGGCAACGTGGCATCACACAAGACTCGATTTTCCATGCCGGACGTGTGGGCATCAATACGGATCGGCCGGATGAGAGTTTAGTTGTGCATGGCAACTTGAAGGTATCCGGTCATATAGTGCAACCCAGTGATAGTCGCGCTAAGCATGAGATCGGCGAATTGGATACGTCCGTGCAATTGCGCAACTTACAGAAAATACGTATTGTACGCTACCGTTATGCGCCCGAATTCGCCGTTCACTCAGGTCTGAAGCGTTCGTGTGAGAGCGACAGCGAAGAAATCGTCGATACGGGCGTGATTGCGCAGGAGGTGCGCGAAGTTATACCAGATGCGGTACAAGAGGCTGGCAGTATCGTGCTGCCGAACGGCAATGTCATTGAGAACTTTCTGCTCGTCAATAAGGATCgcattttaatggaaaatattgGTGCGGTGAAGGAACTGTGCAAAGTCACCGGTTCGCTGGAGACGCGCATTGAAGATTTGGAGCGAAATAATCGTCTGATCAGACAACACGAATTTGAGCAGCGCAGCAAACAATACCGTTTCGCGAAAAGTTGTGGTGCACGTGGCGGTTATGAGATCTGTTCTAACAAGTCTCTGCAAGTTGTTATATTTCTATTAGTAATCGTAATGGCAGCCTGTCTGGCAGCCGTCTCCACACTCTATTTCGTCGAGCACAACAAACAGCGTTACAACTACAAGCAGCTGGATCGTCTGCAGTTCCACAGCAATGGTCATCTGCTTGGTCATGACTCGGTTTTCATAAACGAACAGGAAGGTTACATCGTACAGGTGCATAATGTGCTCAATCGTAATAAGACCTCAAATCATAGTGGTACATCACGTCCGACGGGTTATCGAAATTATACACGTCCGCGTCCCGAGATAATATACGATGAAAGCATTGATCCGTACTCACAAAACGGGCGCACGGATGAACTAACGGTCGTTATGGAGAAACCACTCGTAAGTGTGCAGCCACTACATCCACGTAAGGATACGTTTAAAGTGACGACCACGGCACCGCTACTACGCATCAACAAGACCATCAGCAGTAAAAACAAGTCCAAGTGGCCACAGGCACAGGTTGTGCCCAAAATAATAGCGTCTTTCCAAAATACACGCGCCACAAGCAACGCACAAACCGAGAATAGCGCAAATCTAACATTGCAACAGAAACGTAGCGGTACGCTGTGTGCTAATGAGACCACGTCGGAAAAAGTGACCGACACTGCGTCGTTGACACACGATTTCGATAACAATTCCATCGATATCGATGCACAACATTTGACGAAGAAGGCAACGGTTATACGAGATTCAGTGCCACGTGCGATCACCTCACACGAAGAAACACTCTCGGAAAATGCTGAAACTATTGCCGACTCCATCGGCGCCATTGTGAGCACATCCAGTAGCGATGTAAATGGCAAAAACAATGTCAATCACAGCGATAACATCAACAAGAATACCAATTTGAATGCTAACAACAATGTGCCAGATACCACTGCCCCGGCGTATAGTCATCGTTCGCGCATTGTCTACAAAGCGGTTTCGCCACCATCGGCACTACTGCCACTCACAACCAACAAGGTGACAGTGGAAGCCATTCTCAGCAATTACACGTTAGACGCAGTGCCCGCCTATGCCAATAAAAGTGAGGCGGTGCTGCAGAAGAAAGTGGTTAGCACGGATCTCTTGGACTTACAGAGCTTGAGCAACACCAATGAATCGGTGGATAATCCCATAACCGCATTATTTGGTTTCGATTTTGGTTGGGGGCGCGAATCGGTGCTCGGTCGTAGATCAACTTCTCAGCGTAGTGTCGGTCGCATACAGTGCAAATTTGTGCGAGTGGAGATGTTTGGTGCACCACCGCAATGCACACAGAAGCCTACCAATGATGAGGTTTCTAACTGTCAGTCATTTTGCTTCGAGGAAACCAATCAAGCACTTCGATCTAGCCTAACAGGCATCCCACGCGGGAAGGAAGACACAACAGCACCAGAAAAACAACTAAGCAACGAAAATTTACCATCATCCGAATCGAATGCCGACAGCGCTGATGCCGATACAGATCCAGACACACAACCACGCGCACTGGCCACACCCATTCTCTCAACTAACGCCACATTTATTGGAACCGATAAGAAAACACAAGTTGTAGAAGTCTCCAGCGAACAACGTTCGGATCTTTCGGACGCTTCAAAAGACACCTCCGCATCCGATGAGCGACTCGATGTCGATATAAAGACGGCAGATGATACAATTGGCGCACAAGCGGATAGTGCGGCATCCGCTGAACtgcaagcagcagcagccgcagcgGCAGCACAAATCGATTGTTGGCAAATCGACAGCTGTTTAATAGCTGAGACACACAACGAGACATTTGGTATGGAGCATCACTGTCCGCTAAATGGCAAGTCGTTGAATATGACCTATATTATACCGTTATCGCGGTTCTTCAAGGAATCGAGCATACAATTGCAATTGACCTCCTCTGTGCCACTATTATGGACCATTTGTAGTAATCGTGAACTGACTAAACATCAGGGCGCTCACCTATTGCAATCATCGGCGCATCAACTGAGCGCCAATATTGTACAACGTCAGGCGAATGTGTCGGTTATCTACTTTAATATACCCACTCGTGGTTATTTCGTACGAAGTTTGGCTTTACGCGCAACCGCGGCGGATGCGAAAaagcAAAATATTTGCCAGGAGACAGCACACGAAGCAAACACTTTACTGCAGTACAACTTTAGCATTGTAAGAGATTGTGATTAG
Protein Sequence: MEYPKHINDRSDFIGGIDNEAIDFGNLEQFMQVEAAVGQLEAQNSCINGNNNTRENTNQHQQQHQTQQQQHNPHHQQINSVDGNISLVSVSARVSLASTPIATPIPTAVGHGTPHMPDSPPDSGSEPPYSPLQDAHGLTLTSRDVYNGLATMQPDMQLQPQYTPPHQTQAQAPHHHQQHQHQQQQQHLQHNTNHHSNNNANQLHYNHNHSPTAPPNDTMGGIRVKHEAGLIIDPATLTHTHANSISTHAHGEHNANHGHLNLPPPHQLLYSNQHSNSNNQHNANNSHLLSYENLHGGNFPSVNYPNVTIVNGLDVMQTHATSCALTSALSEVPRVQLVGTSQAIPPQHSRSSLPTTPVHMSSSRKRKLSTQLDCPDFTSIKPDPGLRMSPTHGVAAAESQTLSASSPVTITLPAHATASDMTSTPAHSAASLSPALSTINSNADNSLDGNNTAASGEGGGDSNALTPCIRFSPFQPQNWHKLCDQSLQEITVVYYRVDADKGFNFSVSDDAFVCQKKNHFQITCHARLQGDAKFVKTPSGLEKINSFHLHFYGVKLEAPNQTIRVEQSQSDRSKKPFYPVPIDLQSHIVSKVTVGRLHFSETTNNNMRKKGRPNPEQRYFQLVVGLHVHTISGNFPIISQGSERIIVRASNPGQFESDVDLCWQRGITQDSIFHAGRVGINTDRPDESLVVHGNLKVSGHIVQPSDSRAKHEIGELDTSVQLRNLQKIRIVRYRYAPEFAVHSGLKRSCESDSEEIVDTGVIAQEVREVIPDAVQEAGSIVLPNGNVIENFLLVNKDRILMENIGAVKELCKVTGSLETRIEDLERNNRLIRQHEFEQRSKQYRFAKSCGARGGYEICSNKSLQVVIFLLVIVMAACLAAVSTLYFVEHNKQRYNYKQLDRLQFHSNGHLLGHDSVFINEQEGYIVQVHNVLNRNKTSNHSGTSRPTGYRNYTRPRPEIIYDESIDPYSQNGRTDELTVVMEKPLVSVQPLHPRKDTFKVTTTAPLLRINKTISSKNKSKWPQAQVVPKIIASFQNTRATSNAQTENSANLTLQQKRSGTLCANETTSEKVTDTASLTHDFDNNSIDIDAQHLTKKATVIRDSVPRAITSHEETLSENAETIADSIGAIVSTSSSDVNGKNNVNHSDNINKNTNLNANNNVPDTTAPAYSHRSRIVYKAVSPPSALLPLTTNKVTVEAILSNYTLDAVPAYANKSEAVLQKKVVSTDLLDLQSLSNTNESVDNPITALFGFDFGWGRESVLGRRSTSQRSVGRIQCKFVRVEMFGAPPQCTQKPTNDEVSNCQSFCFEETNQALRSSLTGIPRGKEDTTAPEKQLSNENLPSSESNADSADADTDPDTQPRALATPILSTNATFIGTDKKTQVVEVSSEQRSDLSDASKDTSASDERLDVDIKTADDTIGAQADSAASAELQAAAAAAAAQIDCWQIDSCLIAETHNETFGMEHHCPLNGKSLNMTYIIPLSRFFKESSIQLQLTSSVPLLWTICSNRELTKHQGAHLLQSSAHQLSANIVQRQANVSVIYFNIPTRGYFVRSLALRATAADAKKQNICQETAHEANTLLQYNFSIVRDCD

Similar Transcription Factors

Sequence clustering based on sequence similarity using MMseqs2

100% Identity: iTF_00082953;
90% Identity: iTF_01562903;
80% Identity: -