Basic Information

Insect: Drosophila longiperda
Gene Symbol: Myrf_1
Assembly: GCA_035042125.1
Location: JAWNLV010000107.1:20572508-20581680[+]

Transcription Factor Domain

TF Family: NDT80_PhoG
Domain: NDT80_PhoG domain
PFAM: PF05224
TF Group: Unclassified Structure
Description: This family includes the DNA-binding region of NDT80 [2] as well as PhoG and its homologues. The family contains Swiss:Q05534 or VIB-1. VIB-1 is thought to be a regulator of conidiation in Neurospora crassa and shares a region of similarity to PHOG, a possible phosphate nonrepressible acid phosphatase in Aspergillus nidulans. It has been found that vib-1 is not the structural gene for nonrepressible acid phosphatase, but rather may regulate nonrepressible acid phosphatase activity [1].
Hmmscan Out: # of c-Evalue i-Evalue score bias hmm coord from hmm coord to ali coord from ali coord to env coord from env coord to acc

1 4 1 1.8e+04 -4.5 1.0 66 81 181 196 147 213 0.60

2 4 1.7e-38 2.9e-34 118.8 0.7 2 180 432 578 431 578 0.96

3 4 1 1.8e+04 -6.2 5.5 74 101 977 1004 890 1039 0.51

4 4 0.74 1.3e+04 -3.9 0.1 84 103 1220 1239 1206 1279 0.47

#	of	c-Evalue	i-Evalue	score	bias	hmm coord from	hmm coord to	ali coord from	ali coord to	env coord from	env coord to	acc
1	4	1	1.8e+04	-4.5	1.0	66	81	181	196	147	213	0.60
2	4	1.7e-38	2.9e-34	118.8	0.7	2	180	432	578	431	578	0.96
3	4	1	1.8e+04	-6.2	5.5	74	101	977	1004	890	1039	0.51
4	4	0.74	1.3e+04	-3.9	0.1	84	103	1220	1239	1206	1279	0.47

Sequence Information

Coding Sequence: ATGAATATGGATTTTGATTTTCCGGACTTTTCTCGCCCCGATTTTATGGATGGCATTGACAATGAAGCATTGGATTTGTTTATGCAAGCCGCGGGCGTTGGGAATCTGGATGAGGCGCCGCCACcgcacagtcacagtcacggCCACAACCACAATGAGGAGCTGGCCAATGTTGTGGGCATCTCGAAGCTGGAAACTCCGCACACGCCACCCATGAATCTCCTGGACGCACAGCTGGCCACTGGTCGTGGGAGTGCGATGGTCATGCCTCTAGCACATTTGCCCGAGAGTCCGCCCGATTCGGGATCGGAGCCCGCCTACAGTCCGCTGGGGGAATCGCATGCATTGAACGGACGCGAGCTCATCTATACCGGCTTgggcaacatgcaacaacagcagcaacaacaaatgctgcaagcGGACTTGCAGTTTACTTCCCCACCCCCGCCGctagtgcagcagcagcagcaacatcattttGTTGCCCCCTCGCAAGATGTTAGGGTGAAGCATGAAACGGGTCTGGTTAACAGTTTGCtctgccaacagcagcaacagcaacaacagcaacagcagcagcagcaactcaacTGCGATCAacagttgctgccgttgcagcATCAACAACTTCAGAACTTGCAGCAGGATCCGCTGCCTTTTCCGCACTATGACAATGGACACGTCTTGTATGGCAGTGGCAGCTACCAAAATCTACCCAGCATGTCCACCTGCATGTTGACCTCGTCATTGGGATTGAGTGATCGGGTTCAGGTAATTGGCACCAGTCAGTTATCGCTGAGCAGCTCAACGCCAACGACTCCGGTGCATTCGTTGTCGCGCAAACGGAAGATGTCCACACAGCTGGATTGTCCTGAATTTGGGCCGATGGCCAAGCATGATCCGGGTTTGCAGATGAGTCCGTTGCGCAGTTCACATCATGCCATTTCCATTGCCACCGcaccgagcagcagcagtcccaGTGATCATGATCTGAGGAAGACACCCGCCCACTCACATTGTTCAGCCTCCGTTTCGCCGGCGCTGTCCACCATGAATTCGCAGGCGGAGAATAGCCTCGACGGGCCGGCAAGCAATGCGGCTGCTGGctgtggctctggctctggctccgGCAGCGAGGCTGGCGATTCGGCATTGACGCAGTGCATCCGCTTCAGTCCGTTCCAGCCAGAGAACTGGCACAAGCTGTGCGACCAAAACCTGCACGAACTATCCGTTATCTACTATCGCGTCGATGCGGACAAGGGCTTCAATTTCAGCGTCTCGGATGATGCATACGTGTGCCAGAAGAAGAACCATTTTCAGGTCACTTGCCATGCCCGTCTGCAGGGCGATGCCAAATTTGTGAAGACACCGTCCGGCCTGGAGAAAATCAAATCCTTCCACTTGCATTTCTACGGTGTCAAATTCGAGGCGCCCAACCAAACGATACGCGTGGAGCAAAGTCAATCCGATCGCTCCAAGAAGCCATTCTATCCCGTACCTATCGATCTCCAGAGCCATATTGTCAGCAAAATAACCGTGGGTCGTCTGCACTTCTCGGAGACAACGAACAATAATATGCGCAAGAAGGGACGTCCAAATCCGGAACAGCGTTTCTTTCAGCTTGTCGTCGGTCTCCACGTGCACACAACATCTGGCCACTTTCCCGTCGTTAGCCATGGCAGCGAGCGGATCATTGTGCGCGCCTCGAATCCGGGCCAGTTTGAGTCCGATGTGGATCTGGTCTGGCAGCGTGGCATTACTCAGGAGTCGATCTTCCATGCGGGTCGCGTGGGCATCAACACAGATCGCCCAGACGAGAGTCTTGTTGTACACGGCAATCTGAAGGTGTCCGGCCACATTGTCCAGCCCAGCGATAGTCGAGCCAAACAGGAAATCGCCGAACTAGATACATCTGTGCAGTTGCGCAACATGCAAAAGATACGCATTGTCCGTTATCGCTATGAGCCAGAATACGCCGTGCATTCCGGTCTGAGGAGGGAGAGCGACACCAGGGAAATCGTGGACACCGGCGTCATAGCGCAGGAGGTGCGCGAGATTATACCGGATGCGGTGCAAGAGGCTGGCAGCGTTGTACTGCCCAATGGAAATGTTATTGAGAACTTTTTGCTGGTCAACaagGATCGTATACTAATGGAGAACATTGGGGCCGTTAAGGAGCTGTGCAAGGTCACCGGGTCACTGGAGTCGCGAATTGAGAGTCTCGAACGGGCCAACACCAATCACAATAACCACCAACTGCGTGCCAAGGATCTGCTCGAGCCACGCTGCCTTTTGCCGCCGCGTCCCCAACAGAAGCCCAACAATCGCAGCAACGATGGCTACGAGATCTGCTCCAGTCGCCTGATGCAAATCATTATCTTCATGCTAATCATTGTTATGGCTGCCTGctTGGCCGCCGTTTCCACGCTGTATTTTGTGGagcacaacaagcagcagcagcatttagATGGCTATCAGATGTTTGGAGACAGTCGCCTCTTTCGACCGGATGCGTCGGCGACGCGTCTCAGCGACGAGGATCGCTTAAATTTTCAGCACAGCTGGCAGACGCTCTTCAAGAACAAAACGCACGGATCATGGCCCAGTTTAATCTTTGCGGCGAGCACATCACGACCAACGGTGCGGCACAGCGAGGGGACCGATGAGctgcagcaggaggaggaggaactgACGGCTGTGATGAACAATCCGCAGGTGAATCTGGCGCTACCCAAGCAGCCGCATACACGGATCACAACTACGGCTCCGcggaacaacagcaacaacaagacgATTGTCAGCAAGAACAAGTCCAAGTGGCCAGTTAGCCAGGAGGCACTGCGTCCAGCGGCGGCAGCGCAAAAGCTGCTGCAAAATGTGCGCACTGTGAGTCGAATTCTGGCTGCATCCAGCAACGATACGGACAGCTCCTCCTCGGAGAAGCCAGCGGGAATTGCACCACTCTCGCAGGACTTTGAGAACAACTCCATCGATGTGgatgcacagcaacagcagcaacagcaactccgacagcaacagcagcaacaacaacaaccactgaAACCTTCATCCAAGCTGGATGATCAGATTGTGGTGCTCGGCACGATTCCCAGCACCATTGTGGACAACGCGCCGGTTGTGTCTGCTGGTCAGGCCATACGCAAGCTCAACGCGGGCGATGCAGCCATTTATAATGTGTACAAAACCGTTTCGCCACCCACAGCCAATCTGGCACTAACCACCAATAAGGTCAGTACGGAGCAGAGTCATCCCCAGAGCACACTCTCCCTGGCGCTGGACgtgccgccgccgccggctGTGTTGCGTAACAGCAGCGGTGGCAAAGACAGTATCGATGCTGTGGATCTGCAGAATCTAAGCAATACCAATGAATCTGAGTCGGCCGATAATCCCATAACGGCACTTTTTGGCTTTGAGTATCCGGGTCTGCGAGACTCCAGTGTGGGCAGAAGATCAGCGAATCAGCGCAGTATCGATTGGATCAGGCAGAAGAGTTTGAGAACGCCGCTCTTTGGCCAGCCACCCGAGTGCAATGGCGATGAAGCAGTCAGCGACAATTGTCAGTCCACCTGTTTTGTTGAGCTGCAGCCGGCTACGGTTGCTGTGGATAATATGGATGCCAATGTTAAGCATCAGCATGTAGAGGATGAGCTGCCGTCCGCTGAGCAGGACCAGGATGCTGATATATTGATAATGCAgcccgttgctgctgccagcaatgatagcagcagcagcagcagcaatgcggCCACAGCAACCCGTGTTTACCATGGCAAAAGCTCCCACAACACTGTGGCGCGTACCAAACAATTCTCCACCGAAGCGGATAGCTCGTCCTCGtcagcagcgagcagcgatCAGGATGATGCGCTCTACACGGTGCTCGGCGTGGCACCAGCTGCCACTGCATCAGTGGCGACGGGGCAAGTAGAGCTGCCAGTTGCTGATCCAGTTGTGACACCGTTGCCGCCACAGCAAGATTGCTGGAGTATCTCCAGCTGTGTGCTGGCCGGTCTAAACAATTACACCATCGATGTGGAGCAATTCTGCCCGAGTTCGGGCAGTTCCCTGAATGTCAGCTATGCGATGCCCGTGTCTCGTTATCTGCAAGCCATCACCTTGGAGCTGCACTTCAGctccAGTAAGCCGCTGCAGTGGTCTATTTGCAGCGATGAGGACAAGTCGAAGGCGCAGTTGAACGAGGACTCGGATGAGGCGCCACCAAGCAGCTGGCTTAAGGTGCTCAAGCAGCTGGGCAACAACAAGCTAATCCTCGCCCTGGACATACCTAATCGCGGCAACTTTTTGCGCGACTTTATGCTGCGCGCCAGTTCCAATCTGGAACAACAAAAACTATGCGATGACAACGCCCATGTGGCGAACCCTATACTCCAGTACAACTTTAGCATCGTAAGAGATTGTGAttag
Protein Sequence: MNMDFDFPDFSRPDFMDGIDNEALDLFMQAAGVGNLDEAPPPHSHSHGHNHNEELANVVGISKLETPHTPPMNLLDAQLATGRGSAMVMPLAHLPESPPDSGSEPAYSPLGESHALNGRELIYTGLGNMQQQQQQQMLQADLQFTSPPPPLVQQQQQHHFVAPSQDVRVKHETGLVNSLLCQQQQQQQQQQQQQQLNCDQQLLPLQHQQLQNLQQDPLPFPHYDNGHVLYGSGSYQNLPSMSTCMLTSSLGLSDRVQVIGTSQLSLSSSTPTTPVHSLSRKRKMSTQLDCPEFGPMAKHDPGLQMSPLRSSHHAISIATAPSSSSPSDHDLRKTPAHSHCSASVSPALSTMNSQAENSLDGPASNAAAGCGSGSGSGSEAGDSALTQCIRFSPFQPENWHKLCDQNLHELSVIYYRVDADKGFNFSVSDDAYVCQKKNHFQVTCHARLQGDAKFVKTPSGLEKIKSFHLHFYGVKFEAPNQTIRVEQSQSDRSKKPFYPVPIDLQSHIVSKITVGRLHFSETTNNNMRKKGRPNPEQRFFQLVVGLHVHTTSGHFPVVSHGSERIIVRASNPGQFESDVDLVWQRGITQESIFHAGRVGINTDRPDESLVVHGNLKVSGHIVQPSDSRAKQEIAELDTSVQLRNMQKIRIVRYRYEPEYAVHSGLRRESDTREIVDTGVIAQEVREIIPDAVQEAGSVVLPNGNVIENFLLVNKDRILMENIGAVKELCKVTGSLESRIESLERANTNHNNHQLRAKDLLEPRCLLPPRPQQKPNNRSNDGYEICSSRLMQIIIFMLIIVMAACLAAVSTLYFVEHNKQQQHLDGYQMFGDSRLFRPDASATRLSDEDRLNFQHSWQTLFKNKTHGSWPSLIFAASTSRPTVRHSEGTDELQQEEEELTAVMNNPQVNLALPKQPHTRITTTAPRNNSNNKTIVSKNKSKWPVSQEALRPAAAAQKLLQNVRTVSRILAASSNDTDSSSSEKPAGIAPLSQDFENNSIDVDAQQQQQQQLRQQQQQQQQPLKPSSKLDDQIVVLGTIPSTIVDNAPVVSAGQAIRKLNAGDAAIYNVYKTVSPPTANLALTTNKVSTEQSHPQSTLSLALDVPPPPAVLRNSSGGKDSIDAVDLQNLSNTNESESADNPITALFGFEYPGLRDSSVGRRSANQRSIDWIRQKSLRTPLFGQPPECNGDEAVSDNCQSTCFVELQPATVAVDNMDANVKHQHVEDELPSAEQDQDADILIMQPVAAASNDSSSSSSNAATATRVYHGKSSHNTVARTKQFSTEADSSSSSAASSDQDDALYTVLGVAPAATASVATGQVELPVADPVVTPLPPQQDCWSISSCVLAGLNNYTIDVEQFCPSSGSSLNVSYAMPVSRYLQAITLELHFSSSKPLQWSICSDEDKSKAQLNEDSDEAPPSSWLKVLKQLGNNKLILALDIPNRGNFLRDFMLRASSNLEQQKLCDDNAHVANPILQYNFSIVRDCD

Similar Transcription Factors

Sequence clustering based on sequence similarity using MMseqs2

100% Identity: iTF_00619842;
90% Identity: iTF_00495115;
80% Identity: -