Basic Information

Insect: Scrobipalpa costella
Gene Symbol: Myrf_1
Assembly: GCA_949820665.1
Location: OX463323.1:4587648-4608258[+]

Transcription Factor Domain

TF Family: NDT80_PhoG
Domain: NDT80_PhoG domain
PFAM: PF05224
TF Group: Unclassified Structure
Description: This family includes the DNA-binding region of NDT80 [2] as well as PhoG and its homologues. The family contains Swiss:Q05534 or VIB-1. VIB-1 is thought to be a regulator of conidiation in Neurospora crassa and shares a region of similarity to PHOG, a possible phosphate nonrepressible acid phosphatase in Aspergillus nidulans. It has been found that vib-1 is not the structural gene for nonrepressible acid phosphatase, but rather may regulate nonrepressible acid phosphatase activity [1].
Hmmscan Out: # of c-Evalue i-Evalue score bias hmm coord from hmm coord to ali coord from ali coord to env coord from env coord to acc

1 4 8.1e-36 3.5e-31 110.1 1.8 2 180 267 412 266 412 0.94

2 4 0.016 6.9e+02 1.6 0.9 73 109 803 850 777 890 0.67

3 4 0.21 9.3e+03 -2.1 0.1 78 108 942 972 926 1024 0.72

4 4 0.19 8.1e+03 -1.9 0.7 37 106 1038 1107 1005 1131 0.60

#	of	c-Evalue	i-Evalue	score	bias	hmm coord from	hmm coord to	ali coord from	ali coord to	env coord from	env coord to	acc
1	4	8.1e-36	3.5e-31	110.1	1.8	2	180	267	412	266	412	0.94
2	4	0.016	6.9e+02	1.6	0.9	73	109	803	850	777	890	0.67
3	4	0.21	9.3e+03	-2.1	0.1	78	108	942	972	926	1024	0.72
4	4	0.19	8.1e+03	-1.9	0.7	37	106	1038	1107	1005	1131	0.60

Sequence Information

Coding Sequence: ATGATACGCTTCATCTGTTTAACGTCTGATAGTCCGGGTTTGATCGACGATTTGGAGGCGTACATCGCTCCCCCTGTCGGCGAGTACTATCATAGTCAGCCGATTGATGTACGCCGATTAGGGGGTCACCCACTCCCGGAAAGCCCACCAGATTCCGGCTCGGAGAACCCTTACAGTCCTGCAGAAACTACCCCTCACACCATCGCGGTCTCTCAACTTGGAGGCGACTATATGCTGGTCCATGACCACCTTCCAACCCACGAGATCCTCCAGCAGAATGGGGACTATATCTACGAGGAGTTGAAGTCAGATAACATTGACCATGAGGTGTTGAGGAACAATCTGAACGATGTGATGGTGATACAGCAAGACCACAATATTGTGGAGCTGGGGATTAGGAGACATGATTTGGTGGATCCTATGTATCAGAATAGGTATAACCAGCTCCCAGACCTGGAGCCAGGCATCATCAACCCTCAATTAGTATCCTTGAACCACGAGAGCCTGACTCCGGTCTACACGAGTCTTCAAGAACCTAGTAGCAAGAAGAGGAAGCACTCGCAGGATGTCTCGCAGGTCAAATGTGAACCAGAAAGCATCCCCCACTCGCGTCCCGCGCCCCCCTCGGTAGACGGATCAGAAGCCGGGGACGATGCTCCTCTGCAATGCATCAGGTTTCAGCAGTTCCAGCAGTCGTACTGGCTGCCACTGTATGATGGCAACTTGAAGCCActGCCAACAATCTCATACGTGGTGGGCGCGGACAAAGGCTTCAACTACTCTCAAATCGATGAGGCCTTCGTCTGCCAGAAGAAGAACCACTTCCAGGTCACCTGTCAGATACAGATGCAAGGGGACCCGCACTATGTGAAGACCCCGGATGGCTTTAAGAAGATTAACAACTTCTGTCTCCATTTCTATGGTGTTAAGGCAGAAGACCCAAGTCAAGAAGTAAAAGTAGAACAAAGTCAGTCAGATAGAACAAAGAAACCTTTTCATCCAGTACCTGTGGAAATCCGCCGCGAAGGTGCCAAGGTGACGGTAGGCCGGCTACATTTCGCGGAAACAACCAACAACAACATGAGGAAGAAAGGGCGTCCAAATCCTGATCAACGGCACTTTCAACTGGTGGTGGCCTTAAGGGCTCACACTACTAGTGGTGACTATATGATAGCGACACATGCCAGCGATAAGATCATTGTCAGGGCTTCAAACCCTGGCCAGTTCGAATCAGACTGTTCAGAGAACTGGTGGCAGCGAGGAGTTTCAGATAGCAGCGTGTTCTTCAACGGCAGAGTCGGCATCAACACGGACAGGCCGGATGAGTCCTGCGTCATTAATGGCAACCTGAAAGTGATGGGCCATATAGTGCAGCCATCAGACGCTCGCGCCAAGCACAACATTGAAGAGTTGGATACCGCACAACAGTTGAAGAATGTTCAGAGTATCAGGGTCGTGAAGTTCAACTACGACCCATCATTCGCGGAGCACTCTGGCCTATTAGGCTATGACCCGACGCGAGCCGCACACTCAGATACGGGTGTGATAGCGCAGGAAGTCCGCCGCGTGCTTCCCGAAGCCGTGAAGGAGGCTGGTGACGTCACGCTGCCCAATGGGAACACCATACACAAGTTCCTCGTTGTTAATAAGGACCGCATCTTCATGGAGAACCTGGGGGCAGTCAAGGAGCTGTGCAAGGTGACCGGCCACCTGGAGTCCAGGATCGACCAGCTCGAGAGAATCAACAAGAAACTCTGCAAGATGAGCATCCTTCAAAGAAGAGATAGCTCGCGGTCCAGCGCCAGTAACGATTCCCGATACTCAGCGATATCAGCAAAGTCCATACACAGCGACGGCAACATTTCCATCGAACAGATCCGCGACATCGCCAGAAACATTAGAAAGCACGAGTGTTGCCAGAAGTTGAGCCACCATTCGCCCAAATACACGAGAAAACAGTGCCGGAATTGCCATACACAATCTAAATACGGGAAATACTACAACACGAATAAAACTTCAGCGAAATGCGTTGCTAAAGAGAAAGGAGTATTCCCGACTTATACGGATACTTTAGAATCTAAACCGAAATCGGAAGATTATTCAGattctttgaaaaagaaagaaatagaTACCCCCCAAACAAACTTATGGCTAAGAGATGACTTTGGCTATGAGAGTTCTAGACTCGCGTTTTGCTGTAGAAAGAAAGATAGATATGGAGACGTCAGCAGCGAATTGATATCAAATAAGTTCCTGCAAATTGTTATTacaatattgatatttattatggCTGTGTGCCTGGTGGTGATGTCAGCGCTATACTTCAGAGAACACCAGGAGTTGCTCTCGATGAAGGAGATCAGGCTGCACGAGAAATTCACCAACTACCCTCATTACGGGAAGTTTAATACAGCACAACAGCATAGGCCGCCCGATCACAATCAGATACAGAATCTAAAACCAGCGCAACACTCAACTATAAAGAAAACTACAAAAGagAAAGGTCAACACAAGACTACTCAGGAATACACAACTACCTCCCCTACAGAAAACACGCACACAGCGGCCACTACCCTACATGCTTCCAGAAATTACGTCAAAAACGTACTACATATGGAGCAAACATCTTTACCGCCAAAATTAGACCGACCAATTTCCATTTCCAGAATTGCTGAGgTAATCGGGGGTGGCTGCAATTTCAACGTGAATACTGATAACGAGTTGGATGCTGAATGCcagTCATCGTGCGGTCTCGAACCTCCCCAAACCTACGAAAACCAAGAACCATTAGAGAGAAACCCTGAAAAGGAACTAAACGAAACCTTCTCCAGACCCTTAGAGCCCATTACACGAGACAAACTTCCTAGTATTCCTATTATGCCAGAAAAGAACAATGATACATTGAAGATTGAAAAGAAAGACGTAGAGACATACAAAATTGAAAAGAAAGACGCAgacacatacaaaatacatgatGAAATCATTGCAGAATCAAATCTACTTGATTCCACAAAACAGAACGGAACTGAAATACGACTCAAAAGAGATATCATAGCTAAGAAAGAGCACGAAGATCTGATAAAGCATCAAGATGTAGTCAAATCTATCAATTTGatacacaataaaacaaacttaGACCTAAAAACTGTAACAATTTCAACTTTGAATAGTGTTTCAGACAGAACCTATCAGAAAGACGATTTTATAGGTGTGACAAAGAAGAAAGAGACGAAGAAACCTATGAAAAGCGATGTAAGAGCGAAACGGGAGACCAATGAGGCGTTGTTGAGGAGCAGTTCAGAAGAAATGACGCTCAGCGAGCAATCTGATGAAATTCCTGGAGCAAAAGAATGTGACTCAGTAAGAGTAGGCATCAAGTCCATAACAAACTCATCTCTATTTGAAGAGCGGATCTGCACAAGAGCCGTACACAACTTCACGTACACTGTGCCGCTGTCTAGATGTGTGCAGCATAAACACATTGAGATCGTGTTTAGATCAACAAAACTGAAGGAACTCCGTCTCTGCGACCTCCGTTGCAAGTACGACTCTGTCAAGAGCTGTCAGCTGGTCCGTGAGACAGCCAAACCCATTCCCACTGGCGACGCGTGGACTTCCAAGATGACCCTGGAATGTAACATGGATAGAGTCATCAATATACGAGCACAGTTCAACACTATCAAAgaCCTGTGCTACCTGTCTCCAGAACACAATTCCTTCGTGGAATACAACATACACATCTACAGAGATTGCCATAactga
Protein Sequence: MIRFICLTSDSPGLIDDLEAYIAPPVGEYYHSQPIDVRRLGGHPLPESPPDSGSENPYSPAETTPHTIAVSQLGGDYMLVHDHLPTHEILQQNGDYIYEELKSDNIDHEVLRNNLNDVMVIQQDHNIVELGIRRHDLVDPMYQNRYNQLPDLEPGIINPQLVSLNHESLTPVYTSLQEPSSKKRKHSQDVSQVKCEPESIPHSRPAPPSVDGSEAGDDAPLQCIRFQQFQQSYWLPLYDGNLKPLPTISYVVGADKGFNYSQIDEAFVCQKKNHFQVTCQIQMQGDPHYVKTPDGFKKINNFCLHFYGVKAEDPSQEVKVEQSQSDRTKKPFHPVPVEIRREGAKVTVGRLHFAETTNNNMRKKGRPNPDQRHFQLVVALRAHTTSGDYMIATHASDKIIVRASNPGQFESDCSENWWQRGVSDSSVFFNGRVGINTDRPDESCVINGNLKVMGHIVQPSDARAKHNIEELDTAQQLKNVQSIRVVKFNYDPSFAEHSGLLGYDPTRAAHSDTGVIAQEVRRVLPEAVKEAGDVTLPNGNTIHKFLVVNKDRIFMENLGAVKELCKVTGHLESRIDQLERINKKLCKMSILQRRDSSRSSASNDSRYSAISAKSIHSDGNISIEQIRDIARNIRKHECCQKLSHHSPKYTRKQCRNCHTQSKYGKYYNTNKTSAKCVAKEKGVFPTYTDTLESKPKSEDYSDSLKKKEIDTPQTNLWLRDDFGYESSRLAFCCRKKDRYGDVSSELISNKFLQIVITILIFIMAVCLVVMSALYFREHQELLSMKEIRLHEKFTNYPHYGKFNTAQQHRPPDHNQIQNLKPAQHSTIKKTTKEKGQHKTTQEYTTTSPTENTHTAATTLHASRNYVKNVLHMEQTSLPPKLDRPISISRIAEVIGGGCNFNVNTDNELDAECQSSCGLEPPQTYENQEPLERNPEKELNETFSRPLEPITRDKLPSIPIMPEKNNDTLKIEKKDVETYKIEKKDADTYKIHDEIIAESNLLDSTKQNGTEIRLKRDIIAKKEHEDLIKHQDVVKSINLIHNKTNLDLKTVTISTLNSVSDRTYQKDDFIGVTKKKETKKPMKSDVRAKRETNEALLRSSSEEMTLSEQSDEIPGAKECDSVRVGIKSITNSSLFEERICTRAVHNFTYTVPLSRCVQHKHIEIVFRSTKLKELRLCDLRCKYDSVKSCQLVRETAKPIPTGDAWTSKMTLECNMDRVINIRAQFNTIKDLCYLSPEHNSFVEYNIHIYRDCHN

Similar Transcription Factors

Sequence clustering based on sequence similarity using MMseqs2

100% Identity: iTF_00275299;
90% Identity: iTF_01501150;
80% Identity: -