Basic Information

Insect: Anastrepha ludens
Gene Symbol: Myrf_1
Assembly: GCA_028408465.1
Location: JAPVRI010080200.1:6488-15341[-]

Transcription Factor Domain

TF Family: NDT80_PhoG
Domain: NDT80_PhoG domain
PFAM: PF05224
TF Group: Unclassified Structure
Description: This family includes the DNA-binding region of NDT80 [2] as well as PhoG and its homologues. The family contains Swiss:Q05534 or VIB-1. VIB-1 is thought to be a regulator of conidiation in Neurospora crassa and shares a region of similarity to PHOG, a possible phosphate nonrepressible acid phosphatase in Aspergillus nidulans. It has been found that vib-1 is not the structural gene for nonrepressible acid phosphatase, but rather may regulate nonrepressible acid phosphatase activity [1].
Hmmscan Out: # of c-Evalue i-Evalue score bias hmm coord from hmm coord to ali coord from ali coord to env coord from env coord to acc

1 3 0.13 6.4e+03 -1.4 2.5 75 117 186 226 174 234 0.69

2 3 6.9e-38 3.5e-33 116.8 0.7 2 180 533 679 532 679 0.96

3 3 0.12 6.3e+03 -1.3 0.1 34 72 1558 1592 1526 1595 0.65

#	of	c-Evalue	i-Evalue	score	bias	hmm coord from	hmm coord to	ali coord from	ali coord to	env coord from	env coord to	acc
1	3	0.13	6.4e+03	-1.4	2.5	75	117	186	226	174	234	0.69
2	3	6.9e-38	3.5e-33	116.8	0.7	2	180	533	679	532	679	0.96
3	3	0.12	6.3e+03	-1.3	0.1	34	72	1558	1592	1526	1595	0.65

Sequence Information

Coding Sequence: ATGACCACCGTTGAAATCACTGAGAACCCGATTTGCCTGTTTTGTTTAGAGAAGCCGAATAGCACGGagcgttttctctATCGATCCGATTTCATTGGAGGCATCGACAATGAGGCAATCGATTTTGGTAATCTGGAACAGTTCATGCAGGTTGAAGCCGCCGTTGGTCAACTGGATCCACAAAATAGTTGCAATACCAACGCGAACGCGAATAATACACGTGAAAATCCGCTAGGTTGTAGCCCGAAGCTCGATTCTAAccaacaccaacagcaacaccaacatCACCCACATCCTCCACATCAGCAACAAATAAATGCAGCCAATGGCAATATTTCATTAGTCAGTGTATCAGCACGTGTTAGTTTGGCATCCACACCAATAGCGACACCTATTCCGAGCGCGGTTAGCCACAATACACCGCATATGCCCGATAGTCCGCCCGATTCTGGCTCAGAACCACCCTACAGTCCGCTGCAAGACGTTCACGGGCTGACGCTGACCTCTCGCGACGTCTACAATGGGCTTCCGGCGATGCAGTCCGATATGCATTTTCAGTCACAATTTACACCACCGCACCAAACGCAAACACCACATCATCACCATCAGCAACAACATACGCAacataacaacagcaacaattcaaaCAATTCAAACATCTCCACTCAACACCACTACAACCACAATCACTCGCCAACTGTGCCGCCAAACGACGGAACGGGTGGAATACGTGTGAAACACGAGTCAGGCCTCATAATGGATCCAgctacactcacacacacacatacacaacttCGACATGGGAATCCTATTACCGCACATCCGCATGGCAATCCTAACGGCGACCACAGTCATATAGAATTGCCACCACCGCATCAGCTGATGTTCTCAAATCACAACAACAATCAGCACAATACAAGCGATTTGTTGTCGTATGAGAGCCTGCAAAGTGGAAACTTTCCATCAGTGAATTATCCAAATGTTACTATCGTAAATGGCTTGGATGCCTTGCCTCCGCACACCACGTCCTGTGCGCTCCCTTCACCGCTGAACGATGTACCTCGTGTGCATTTGGTTGGCACAAGTCAGGCAATCCCTTCGCAACACAGCCGTTCGTCATTGCCCACTACGCCTGTGCATTTGTCTTCGTCCCGCAAACGGAAACTTTCCACCCAACTGGATTGCCCCGAATTCTCCAGCATTAAGCCAGATCCAGGCTTGCGGATGAGCCCAACGAACGGCGCTACAGCAGTCGCGGAACCACAGAAGCTCGGCCCCTCGTCACCAGTTACCATCGCATTACCCGCACATGCGGCTGATATAACCAGTACGCCCACACACTCAGCTGCCTCGCTATCTCCCGCGCTGTCAACTATCAACTCGAATCAGGACAACAGTCTGGATGGCAATAATACCACTCCAAGTGGCGGTGGTGAGGGTGGTGACAGTAATGCTCTTACACCATGCATTCGTTTCAGCCCGTTCCAGCCACAAAATTGGCACAAACTTTGCGATCAAAGCCTGCAAGAGATCGCGGTTGTTTATTACCGTGTAGACGCGGATAAAGGTTTCAACTTCTCTATCTCCGACGATGCGTTTGTTTGCCAGAAAAAAAACCACTTTCAAATAACTTGCCACGCACGTCTGCAAGGCGATGCGAAGTTCGTTAAAACACCGTCCGGTCTAGAAAAAATCAATTCCTTCCATTTACACTTCTATGGTGTGAAATTAGAAGCGCCAAATCAGACAATACGGGTTGAGCAAAGCCAATCCGATCGCTCAAAGAAACCATTCTATCCTGTGCCCATCGATCTCCAGAGCCACATTGTAAGCAAAGTCACGGTGGGCCGTTTACATTTCTCTGAAACTACGAATAACAATATGCGAAAAAAGGGGCGTCCCAATCCTGAGCAACGTTACTTCCAACTGGTAGTAGGCCTTCATGTGCACACAATTTCTGGCAACTTTCCAATCATAAGTCAAGGTAGTGAGCGCATTATTGTGCGTGCCTCCAATCCAGGTCAATTTGAATCCGACGTCGATCTTTGCTGGCAACGTGGGCTCACGCAAGATTCCATCTTCCACGCCGGAAGAGTTGGCATCAACACTGATCGTCCTGACGAGAGTTTGGTTGTGCATGGCAATTTGAAAGTATCAGGTCACATAGTGCAGCCCAGTGATAGTCGTGCTAAGCACGAGATCGGCGAACTCGATACTTCAGTGCAGCTACGCAACTTACAAAAAATACGCATAGTGCGCTATCGGTACGCTCCCGAATTCGCAGTTCACTCAGGTCTGAAACGTTCGTGCGAGAGCGACAGCGAGGAGATCGTCGATACCGGCGTTATTGCACAAGAGGTACGCGAAGTTATACCAGATGCGGTACAAGAGGCTGGCAGTATCGTGCTGCCGAATGGCAATGTCATCGAAAACTTTCTGCTGGTCAATAAGGATCGCattttaatggaaaatattgGTGCTGTTAAAGAGCTCTGCAAGGTCACTGGGTCACTTGAGACGCGCATCGAAGATTTGGAGCGCAACAATCGACTGATAAAACAGCACGAATTTGAGCAGCGAAGCAAAAAGTATGGGATCGCAAAAGCCTGTGGCGCGCGTGGCGGCTATGAATTATGCTCGAACAAGTCTTTGCAgatagtaatatttttattggtaATCGTTATGGCCGCATGCCTAGCTGCTGTTTCCACTCTGTACTTCgtggagcacaacaaacaaCATTACAACTACAAGCAATTAGACCGGCTCCAATTTCATAGCAATGGCCATCTTCTCGGCCATGACTCGGTTCTCATAAATGAACAAGAAGGTTACATCGTCCAAGTGCACAACCTTCTCAGTCGAAATAAAACTATTCAGCATGGCGCAACATCACGTCCGCCTGGGCATCGGAATTTCACGCGTATACATCCGGAAATCAGCTACGACGAAAGCGGTGATCCATATGCACAAAATGGACGCAATGATGAACTGACGGTGGTTATGGAAAAACCACTTGTCAGCCTTCAGCCACTGCTTCCACGAAAGGATATTTATAAAGTGACGACTACAGCACCACAACTGCGTATCAACAAGACTATAAGCAGCAAAAATAAGTCAAAGTGGCCACAGGCTCAAGTTGTGCCCAAACTAATTGCGAGCTTCCAAAATACACGCGGCACCAGCAGCACACAACCAGATGATAGCTCGAATCTTACACCGAACCATAAGCGTACGGAGCCACTGGGCAATAATGAAACCTCTTCGGAGAAGGTTACCGACACAGCGCCATTAGCACACGATTTCGATAACAATTCTATCGACATTGACGCGCAACACGTTACCAAAAAGGCTTTGGCTGCCAGAGATTCGGCAATACGACCAGCCAGTTCACATGAGGAGACGCTATCGGAGAATGGCGAAACCATTGGCGATTCGATTGGGTCCATTGTAAGCACATCAAGTAGTGACGTGAACGCCAAACACAATGTTAATCATGATGGTAATAGCAGAAATGTCGacatcagcagcaacaacaacgtgcCAGATACCACTGCCCCTGCCTATAGCCACCGTTCGCGCAATGTCTACAAAGCGGTCTCACCACCATCAGCACTCTTACCGCTCACCACTAACAAGGTAACGATTGACGGCATTCCCACAAATTACTCATTGGAAGTGCCCGCGATCTCAAACAAAAGCCAAACGGTGCTGAAAAGTAAAGTGGATAGTACAGATCTGTTGGACTTACAGAGTCTAAGCAACAACAACGAGTCGGTAGATAATCCCATAACAGCTTGGTTTGGATTCGATTTCGGCTTGGGGCATGAATCGGTGCTAGGACGCAGATCGACTTCTCAGCGTAGCGTCGGTCGCATATATTGTAAACTCGTACAGGTGGAGATGTTTGGTGTACCACCTCAATGCACGCAAAAGCCCAACAATGATGAGGTATCCAACTGTCAGTCGTTTTGCTTCGAGGAATCCAATCAACTACCGGCACTTCGAGCCAATTTAGCAGGCATAGCACGCGCCAAAGAGGACTCAGTTACCGCAGAGAAACAGATCAGCAACGAAAATATACAAGTGTCTGACTCGAGCCCCGACAGCGTCGATAGTGATGCGGACTCTGACACACAACCACGTTCTCTGGCTACACCTATACTGTCGACAAATGCTACCTTCATTGGGACGGATAAAAAAACTCAAGTGGTCGAAGTGTCCAGCGAACAGCGATCAGACCTTTCGGATTCGTCAAAAGACACATCTAGCTCCGACGAGCATCTCGATATTGATGTTAAGGCAACAGATGAAAACGTGGGCCCACAAGCAAATAGTGCGTCATTAGAAATACAAGTCGGAGCAGCTACCCAACCGGATTGTTGGCAAATCAATAGCGGTTTGATAGCCGAGGCACAAAATGAGACATTCGGTATGGAGCATTATTGTCCACATGGCAGCAAATCACTGAACATAACCTATATAATACCACTATCAAGATTTTTCAAGGAATCCAGTATTCAGCTGCAGCTGGCCTCCTCTGTGCCACTGTTGTGGAGCATTTGTAGTAATCGCGAGCTGACCAAACATCAGGGAGTGCATTTGCAGCAATCATCTGCCCATCAACTTAGCGCCAACATCATACAGCGTGAACCCAACGTGtcggttatttattttaatataccaAGTCGGGGCTATTTCGTGCGAAGTTTGGCGTTGCGCGCCTCAGCCAATGATTCAAAAAAGCAAAACATTTGCCAGGAGACAGCACACGAAGCGAACACGTTACTACAGTACAACTTTAGTATCGTAAGAGATTGTGAATAG
Protein Sequence: MTTVEITENPICLFCLEKPNSTERFLYRSDFIGGIDNEAIDFGNLEQFMQVEAAVGQLDPQNSCNTNANANNTRENPLGCSPKLDSNQHQQQHQHHPHPPHQQQINAANGNISLVSVSARVSLASTPIATPIPSAVSHNTPHMPDSPPDSGSEPPYSPLQDVHGLTLTSRDVYNGLPAMQSDMHFQSQFTPPHQTQTPHHHHQQQHTQHNNSNNSNNSNISTQHHYNHNHSPTVPPNDGTGGIRVKHESGLIMDPATLTHTHTQLRHGNPITAHPHGNPNGDHSHIELPPPHQLMFSNHNNNQHNTSDLLSYESLQSGNFPSVNYPNVTIVNGLDALPPHTTSCALPSPLNDVPRVHLVGTSQAIPSQHSRSSLPTTPVHLSSSRKRKLSTQLDCPEFSSIKPDPGLRMSPTNGATAVAEPQKLGPSSPVTIALPAHAADITSTPTHSAASLSPALSTINSNQDNSLDGNNTTPSGGGEGGDSNALTPCIRFSPFQPQNWHKLCDQSLQEIAVVYYRVDADKGFNFSISDDAFVCQKKNHFQITCHARLQGDAKFVKTPSGLEKINSFHLHFYGVKLEAPNQTIRVEQSQSDRSKKPFYPVPIDLQSHIVSKVTVGRLHFSETTNNNMRKKGRPNPEQRYFQLVVGLHVHTISGNFPIISQGSERIIVRASNPGQFESDVDLCWQRGLTQDSIFHAGRVGINTDRPDESLVVHGNLKVSGHIVQPSDSRAKHEIGELDTSVQLRNLQKIRIVRYRYAPEFAVHSGLKRSCESDSEEIVDTGVIAQEVREVIPDAVQEAGSIVLPNGNVIENFLLVNKDRILMENIGAVKELCKVTGSLETRIEDLERNNRLIKQHEFEQRSKKYGIAKACGARGGYELCSNKSLQIVIFLLVIVMAACLAAVSTLYFVEHNKQHYNYKQLDRLQFHSNGHLLGHDSVLINEQEGYIVQVHNLLSRNKTIQHGATSRPPGHRNFTRIHPEISYDESGDPYAQNGRNDELTVVMEKPLVSLQPLLPRKDIYKVTTTAPQLRINKTISSKNKSKWPQAQVVPKLIASFQNTRGTSSTQPDDSSNLTPNHKRTEPLGNNETSSEKVTDTAPLAHDFDNNSIDIDAQHVTKKALAARDSAIRPASSHEETLSENGETIGDSIGSIVSTSSSDVNAKHNVNHDGNSRNVDISSNNNVPDTTAPAYSHRSRNVYKAVSPPSALLPLTTNKVTIDGIPTNYSLEVPAISNKSQTVLKSKVDSTDLLDLQSLSNNNESVDNPITAWFGFDFGLGHESVLGRRSTSQRSVGRIYCKLVQVEMFGVPPQCTQKPNNDEVSNCQSFCFEESNQLPALRANLAGIARAKEDSVTAEKQISNENIQVSDSSPDSVDSDADSDTQPRSLATPILSTNATFIGTDKKTQVVEVSSEQRSDLSDSSKDTSSSDEHLDIDVKATDENVGPQANSASLEIQVGAATQPDCWQINSGLIAEAQNETFGMEHYCPHGSKSLNITYIIPLSRFFKESSIQLQLASSVPLLWSICSNRELTKHQGVHLQQSSAHQLSANIIQREPNVSVIYFNIPSRGYFVRSLALRASANDSKKQNICQETAHEANTLLQYNFSIVRDCE

Similar Transcription Factors

Sequence clustering based on sequence similarity using MMseqs2

100% Identity: iTF_00082953;
90% Identity: iTF_00082954;
80% Identity: -