Basic Information

Insect: Chymomyza procnemis
Gene Symbol: Myrf_1
Assembly: GCA_035046065.1
Location: JAWNOJ010000023.1:2149832-2155150[+]

Transcription Factor Domain

TF Family: NDT80_PhoG
Domain: NDT80_PhoG domain
PFAM: PF05224
TF Group: Unclassified Structure
Description: This family includes the DNA-binding region of NDT80 [2] as well as PhoG and its homologues. The family contains Swiss:Q05534 or VIB-1. VIB-1 is thought to be a regulator of conidiation in Neurospora crassa and shares a region of similarity to PHOG, a possible phosphate nonrepressible acid phosphatase in Aspergillus nidulans. It has been found that vib-1 is not the structural gene for nonrepressible acid phosphatase, but rather may regulate nonrepressible acid phosphatase activity [1].
Hmmscan Out: # of c-Evalue i-Evalue score bias hmm coord from hmm coord to ali coord from ali coord to env coord from env coord to acc

1 3 0.66 5.9e+03 -2.7 4.5 7 104 150 250 145 294 0.50

2 3 4.2e-38 3.8e-34 118.5 0.7 2 180 478 624 477 624 0.96

3 3 2 1.8e+04 -4.7 1.2 63 82 991 1010 973 1036 0.45

#	of	c-Evalue	i-Evalue	score	bias	hmm coord from	hmm coord to	ali coord from	ali coord to	env coord from	env coord to	acc
1	3	0.66	5.9e+03	-2.7	4.5	7	104	150	250	145	294	0.50
2	3	4.2e-38	3.8e-34	118.5	0.7	2	180	478	624	477	624	0.96
3	3	2	1.8e+04	-4.7	1.2	63	82	991	1010	973	1036	0.45

Sequence Information

Coding Sequence: ATGGATTATCCGAAGACTTTGAATGCTCGCAATGATTTCATTGGCGGCATTGATAATGATGCACTGGACTTTAATAACTTGGAGCAATTCATGCAGGCAGCCACTGGTGTCGATGTGAGCACATTGCACAACGATACCAATGGGGGGCAACATGGCGGCAGCACAAGCAATGATGTGCTTTGCCTGGATAATACCAATCATACTGCTAATGGCGTAGGTCTGTTAGGTGGCGCCACAAAAATCGAAACGCCACATACGCCACCTATGAACTGTCTGGACGAACAATTGGCTACAGTATCTGGTAGAGTTAGTCTACCGAGCACACCGATAGCAACACCATTGACACATGCACATGCACATTTGCCGGAGAGTCCGCCGGATTCGGGTTCGGAGCCAGCGTACAGTCCATTGGGTGATGTACATGGCCTAAGTCTTAGTATATCCGGACGCAATATATaccagctgcagcaacaattgcATCCAACACATCAGCAGTTAACTGATGAATACCATCAGTCACAATCCGTACACGGACATAATTTTGGCACCACACACATGCATGTAGTACCAACGCATGATGTGAGGATCAAACATGAGGCTGGCTTGATTATGAATCCTAACACTTTGGTagcacagcaacagcagcagcaccagcagcagcagcagcatcatcagccacaacagcaacagcagttgAGTGAATCAAATTTGCAGCACAACGAACAACATCCACTGCAGCAGCATGAAAATCAGCAACATGTCGAGGCGCAGCTGCTGTATCCGCCACATTACGATAATTTGCATGCTGGCGCCAACGGACTATTTGCAGCTACAAGTTATCAGAATCTGTCCAGTATGCAGCCAGTAGCTGATCAGACAGCTACCTGCATGCTGACCTCTTCGCTGGGTGAACGCGTTCAAGTAATTGGTACTAGCCAAGTGTCGCTAAATCGTGTCTCGGCCCCATCCACACCAGTGCACTCGTCGTCGCGTAAACGCAAAATGTCCACTCAATTGGACTGCACAGATTTTGGCAGCAGCGTAAAACACGATTCCGGTTTGGTAATGAGCCCAATGCGCGCATCCCACCATTCACTGGCTCAGTATGATAGTTCGCAGTTCAGTGCCAATGCTCCGCTTAAGATCAGCCTACCGGCCTTAAATAGTAGCAGTAGCCACAGCGATCTAAGCAAAACACCAGCTCATTCACATTCATCCGCATCAGTGTCGCCTGCACTATCCACGGTTAATTCGCAGGCGGATAATAGTCTAGATGGCGGAGATGGTACGCTGACCCAGTGCATACGTTTCAGCGCTTTTCAGCCGGAAAGCTGGCACAAGTTGTGCGATCAGAGCTTGCAGGAGCTTTCGGTAGTCTATTATCGCGTGGATGCGGATAAAGGTTTTAACTTTTCCGTTTCGGACGATGCTTATGTGTGCCAGAAGAAAAACCACTTTCAGGTTACTTGCCATGCGCGCCTGCAGGGCGATgccaaatttgtaaaaacacCGTCCGgccttgaaaaaataaaatccttcCACTTGCATTTCTATGGCGTCAAATTTGAGGCACCAAATCAAACGATACGCGTTGAACAGAGCCAGTCGGATCGCTCCAAAAAGCCATTTTATCCTGTACCTATCGATCTCCAGAGCCACATAGTGAGTAAGATTACAGTCGGGCGGCTACATTTCTCCGAGACAACGCATAATAATATGCGCAAAAAAGGTCGCCCCAATCCCGAGCAGCGTTACTTTCAACTTGTGGTGGGTCTACATGTACATACCACCTCTGGCAACTTTCCAGTGGTCAGTCATGGCAGCGAGCGCATCATTGTGCGTGCATCCAATCCAGGTCAATTTGAATCGGATGTAGATTTATGCTGGCAACGTGGTCTTACTCAAGATTCAGTGTTTCACGCAGGACGCGTAGGCATTAACACAGACAGACCCGACGAAAGTCTTGTGGTGCACGGCAATCTAAAAGTATCGGGTCACATTGTGCAGCCCAGCGATAGCAGAGCCAAACGAGAAATTGGTGAGCTGGATACATCAGTGCAACTGCGAAACCTTCAAAAGATACGCATTGTGCGCTATCGTTATGAGCCGGAGTTTGCTGTACATTCGGGTCTGAGGCGAGCCAGTGACACCGATAGCGATGAAATCGTTGACACTGGAGTCATAGCACAAGAAGTCCGAGAGGTTATACCAGATGCAGTACAAGAGGCTGGCAGCGTTGTGCTGCCCAACGGAAACGTTATTGAGAACTTTCTCTTGGTTAACAAGGATCGCATACTAATGGAGAACATTGGTGCTGTTAAAGAGCTGTGTAAGGTGACAGGCTCGTTAGAAACTCGCATTGTAAATTTGGAGCGAGTCAATAACAACCAAAATCCTCGTGCCAAGGAGCTAGATCATCCACACAATCTCTTCGCAGCACGCATTGGCAAGTGCAGTAGTCGTCACGAAGGCTACGAAATCTGTTCCAGTCGTACTTTGCAGATTGTTGTGTTCCTACTCATCATTGTCATGGCCGCTTGCCTAGCTGCCGTTTCGACACTTTACTTTGTGGAGcacaacaagcagcaacaacaaatggacTATCCCCTATTCAGCAATGGTCACATTTTTCGTTCCGATACGCCACCCCACATGAGCGAAGAGGATCGCCACTATTTGCATacacttttcaaaaacaagaCCCACATGGACTGGCCAAGCTTAATGTATTCGGCAAGCACTTCCCGCCCACCGGCTGCGCGTAAAAGCGATGAACCGAACGAACTGGCAGTTGTCATGTCCAAGCCTCAAGTTGGGCTAATTGCGCTTATAAACGCCAAGCATCAGCCTGTTACCACAACGGCGCCACGTACCAACAAGACCATAAGTAGCAAAAACAAGGCAAAGTGGCCGCTGCCGCAGGAAGTGCTGCGGGCCAGCCAGAGCGCCCAAAAGCTAATGCAGCCAGCTACAAGCATCACTCAACAAACAAACGATGAGGAACTTTTACCTCAAACGCAAAACAATCAAACATCGTCAGAGAAGCCTGAAGGAATTCCGCCCCCGCAGGATTTTGAGAACAACTCCATTGATATTGATGCGCAGCATTTCGGTCGCCAATCACTAAATGCAGCCAAAGCTGCCAGTGCTCGTGCTAGTGCTATTATAGTAAGTGATGAAACTGATGAGCAGAATAGCGGAGCTCTGCAACAGGCCGATGATATTACACTCAAGCTGGATGAGCACATAGTGGTTGTGGGCACTATTGCCAGTACTTCGAGCAGCAATAGCCTAAATGTGCCAGACACCACAGCCAGTGCAGGTCAGGCCATACGTAAAATCAATGCTGGTGATGCGGTTATATACAATGTCTATAAGACAGTGTCGCCACCTACAGCTAATCTGGCCTTAACCACGAACAAGGTCAACACAGAGCAAATTTTACCCGGTCTGGGTCATGTGGTGCTTGATGTGCCACCAACTACAGCACGCAATGGTTCAAGTCATGATAACGCCGACGCACTTGATCTACAAAATCTTAGCAATACAAATGAGTCTGTAGACAATCCCATTACGGCGCTTTTCGGCTTTGAGTACAATCCTGGATTACGTGATTCGAGTTTGGGTAGACGCTCGGCCAATCAGCGCAGTGTGGACTGGGTCAGGCAAAAGAACTATAACATGGAAGTGTTTGGACAAATGGCAGAATGCAATGGTGATGAAGCCGTAAGTGACAATTGTCAGtCCAGCTGTGATGAAGAGGTGCAACAAGATCATGAAGACACTGTTGATGCTAATGCCAAACAGCCGTTGCCGCTGCAGCACCACATTGAAGACGAGCTCCAATCTGCGGAAATACTGCACGAACAGCATGATGCCGACCCAGTAGGCTTGGATATACCCACACTATTGACTAATGATACGCTTGGGCGAAATGAAAAGAGTTCCGCCAGTAGTGTTGTACAGACAAAACCATTGTCCTTTGATGCAGATGTATCGATCAGCGAAGATGGTGGCGAGATCGAAGTTGCACACTCACTAGAACACTTGCCAGATACGCCTAGACAGAACGAACCCATGCCTCAACTAGACTGCTGGGCAATTTCCAGCTGCGTGCTAGCAGCACAGCATAATCGCACAATTGACGTAGAACACTATTGTCCCAATGCTGGCACCTCCTTGAATGTCAGCTATACTGTGCCTGTATCGCGCTATCTGCAAGCCAGCAGCCTTGAACTACACTTTAGTTCCAACAAGCCCTTACAATGGTCTATATGCGGCGATGATGTTGGAAATGCAGATCAAGCCAAGGCAGGCGCACAGTCTGACCAAGACGATGAGGCGCTGCCAAAAAATACCGtcaagattttaaaacaacacGGCAATAAACTTATTCTTGCCCTGGACCTACCACAACATGGACATTTTGTGCATTATTTCATGTTGCGTGCAAGCAATGATTTGGAGCAGcaaaaactCTGCGACGATAACGCTCATATGGCGAACACCATAATCCAGTACAACTTTAGTGTCTTAAGAAATTGTGATTAA
Protein Sequence: MDYPKTLNARNDFIGGIDNDALDFNNLEQFMQAATGVDVSTLHNDTNGGQHGGSTSNDVLCLDNTNHTANGVGLLGGATKIETPHTPPMNCLDEQLATVSGRVSLPSTPIATPLTHAHAHLPESPPDSGSEPAYSPLGDVHGLSLSISGRNIYQLQQQLHPTHQQLTDEYHQSQSVHGHNFGTTHMHVVPTHDVRIKHEAGLIMNPNTLVAQQQQQHQQQQQHHQPQQQQQLSESNLQHNEQHPLQQHENQQHVEAQLLYPPHYDNLHAGANGLFAATSYQNLSSMQPVADQTATCMLTSSLGERVQVIGTSQVSLNRVSAPSTPVHSSSRKRKMSTQLDCTDFGSSVKHDSGLVMSPMRASHHSLAQYDSSQFSANAPLKISLPALNSSSSHSDLSKTPAHSHSSASVSPALSTVNSQADNSLDGGDGTLTQCIRFSAFQPESWHKLCDQSLQELSVVYYRVDADKGFNFSVSDDAYVCQKKNHFQVTCHARLQGDAKFVKTPSGLEKIKSFHLHFYGVKFEAPNQTIRVEQSQSDRSKKPFYPVPIDLQSHIVSKITVGRLHFSETTHNNMRKKGRPNPEQRYFQLVVGLHVHTTSGNFPVVSHGSERIIVRASNPGQFESDVDLCWQRGLTQDSVFHAGRVGINTDRPDESLVVHGNLKVSGHIVQPSDSRAKREIGELDTSVQLRNLQKIRIVRYRYEPEFAVHSGLRRASDTDSDEIVDTGVIAQEVREVIPDAVQEAGSVVLPNGNVIENFLLVNKDRILMENIGAVKELCKVTGSLETRIVNLERVNNNQNPRAKELDHPHNLFAARIGKCSSRHEGYEICSSRTLQIVVFLLIIVMAACLAAVSTLYFVEHNKQQQQMDYPLFSNGHIFRSDTPPHMSEEDRHYLHTLFKNKTHMDWPSLMYSASTSRPPAARKSDEPNELAVVMSKPQVGLIALINAKHQPVTTTAPRTNKTISSKNKAKWPLPQEVLRASQSAQKLMQPATSITQQTNDEELLPQTQNNQTSSEKPEGIPPPQDFENNSIDIDAQHFGRQSLNAAKAASARASAIIVSDETDEQNSGALQQADDITLKLDEHIVVVGTIASTSSSNSLNVPDTTASAGQAIRKINAGDAVIYNVYKTVSPPTANLALTTNKVNTEQILPGLGHVVLDVPPTTARNGSSHDNADALDLQNLSNTNESVDNPITALFGFEYNPGLRDSSLGRRSANQRSVDWVRQKNYNMEVFGQMAECNGDEAVSDNCQSSCDEEVQQDHEDTVDANAKQPLPLQHHIEDELQSAEILHEQHDADPVGLDIPTLLTNDTLGRNEKSSASSVVQTKPLSFDADVSISEDGGEIEVAHSLEHLPDTPRQNEPMPQLDCWAISSCVLAAQHNRTIDVEHYCPNAGTSLNVSYTVPVSRYLQASSLELHFSSNKPLQWSICGDDVGNADQAKAGAQSDQDDEALPKNTVKILKQHGNKLILALDLPQHGHFVHYFMLRASNDLEQQKLCDDNAHMANTIIQYNFSVLRNCD

Similar Transcription Factors

Sequence clustering based on sequence similarity using MMseqs2

100% Identity: iTF_00338340; iTF_00335902; iTF_00336741; iTF_00337527;
90% Identity: iTF_00338340;
80% Identity: -