Basic Information

Insect: Cryptocheilus praepositus
Gene Symbol: Myrf_1
Assembly: GCA_033815515.1
Location: JAWWQZ010000348.1:571263-586090[+]

Transcription Factor Domain

TF Family: NDT80_PhoG
Domain: NDT80_PhoG domain
PFAM: PF05224
TF Group: Unclassified Structure
Description: This family includes the DNA-binding region of NDT80 [2] as well as PhoG and its homologues. The family contains Swiss:Q05534 or VIB-1. VIB-1 is thought to be a regulator of conidiation in Neurospora crassa and shares a region of similarity to PHOG, a possible phosphate nonrepressible acid phosphatase in Aspergillus nidulans. It has been found that vib-1 is not the structural gene for nonrepressible acid phosphatase, but rather may regulate nonrepressible acid phosphatase activity [1].
Hmmscan Out: # of c-Evalue i-Evalue score bias hmm coord from hmm coord to ali coord from ali coord to env coord from env coord to acc

1 4 1 2.5e+04 -5.1 5.3 67 91 104 128 89 133 0.77

2 4 1 2.5e+04 -7.1 12.4 85 139 282 335 258 367 0.50

3 4 2.8e-36 7.1e-32 111.6 1.6 2 179 466 612 465 613 0.91

4 4 0.91 2.3e+04 -4.1 0.2 56 100 1138 1179 1136 1187 0.65

#	of	c-Evalue	i-Evalue	score	bias	hmm coord from	hmm coord to	ali coord from	ali coord to	env coord from	env coord to	acc
1	4	1	2.5e+04	-5.1	5.3	67	91	104	128	89	133	0.77
2	4	1	2.5e+04	-7.1	12.4	85	139	282	335	258	367	0.50
3	4	2.8e-36	7.1e-32	111.6	1.6	2	179	466	612	465	613	0.91
4	4	0.91	2.3e+04	-4.1	0.2	56	100	1138	1179	1136	1187	0.65

Sequence Information

Coding Sequence: ATGGAATTTTCGTGGGCCCTCCAAAATCAGCCCGCTGATTCTATCGAAAATACAGAGAATCATCATGAAGATGCCAGCGTCATTGGACAGGCGACTGCAAGACGAATTTTGGGCGTAACAGgtCGTGACGACTTCGTTGGAGGGATAGATAACGAGGCGTTGGACTTTTCTCAACTGGAGGATTTCATTAACAGTAACAGTGAACAACCGTCAACATATTTTGCGGACACGCTCGCACATAATGAAAGCGGGGGTGGAACAGGAAGTCACAGCAGTCGCATCGACACGAGTGCGAACCATCACCATcatcagcaacagcaacagcagcagcagcaacagcagcagtcgccggcagcagcagcaacaccaCCGacaccaccaccagcaccaccCCCACCGCCTCCgccaccacctccaccaccaccaccaccaccacctccgccaccaccaccgccaccgcgaCTACCGTCGCCAATACCACAAGCACATCCGGTCTCGGCAACCTGTTCCCCTGGTACAGGTGCTATGACTGCCGGCCCTACTTATAAGGATCCGCACTCGTACGTACATCCACATGCATTACCGGAGAGTCCACCGGACAGTGGCAGCGAGCCTCCATATTCACCACCCGGACACCATGACACCCAACATGTGCATTCACCACATCAGAAAGCAGCCCTGCAAGAAATATTAATGCATCACCAAGGCAATGCAGCAAATTATGCACCGAACTTATTGCCATCTTCACCGCGGGGGCTTGCTACTGCGGCGGATCCTTTGTTGTTGACTCATTCTACTCTAACGACACACCTTGCTCCCGGCGCGTCCCCACTACCAACGCAACAGCAACACCAGCACCAGCACCAGCACCAGCACCAACATCAGCATCAGCACCAGCACCAGCACCAACACCAGCACCAGCACCAGCACCAGcatcagcaacagcaacagcaccagcagcagcaccagcaccaacaacagcaacagcgcCAGCAACAACACCAGCAGCAACATATGAGTGCAGCCGTTGCTAATTCAATGGTACCGATGCCGCTGCCGCATGAACACAGTCCCGGAAGTATTAATGCTTTGTACTCTTCTCTTCAATCGGGTCCTAAAAAAAGAAAGCTTAGCCAAGATGGACTTGTTCATGTTAAGCAGGAACCTGAACTTGGAACGATAGAGCACAGCTGTAGCAGCGGCAGCGCGGTTCTCGATGGCGACGAAGTCGCTGATAACAGTTACATCGACACTAGTTATCAGTGCATTCGTTTTCATCCTTTTCAGCAGACATCGTGGCATGCGCTCTGTGATCATAATCTTAAAGAACTTCCAGTACCGCATTACAGGGTCGACGCCGACAAAGGATTCAATTTCAGTAATTCCGACGACGCGTTCGTTTGTCAAAAAAAGAATCACTTTCAGATTACATGTCATGCCCAACTTCAAGGAGACGCCGTTTTCGTGCGGACAGGCGAAGGTCTCAAGAAGATAAGCAGTTTCCAACTACATTTTTACGGAGTGAAAGTTGAATCACCGACTCAAACGATCAGGGTAGAGCAAAGTCAAAGTGATAGGAGTAAAAAACCATTTCATCCGGTGACGGTGGAGTTAGGAAGTGAGCGCGTGACGAAAGTGACAGTCGGACGACTGCATTTTAGTGAAACAACGAGCAACAACatgcgaaaaaagggaaaaccCAATCCGGATCAGAGATATTTTCATTTGGTTGTGGGTTTACACGCGCACACCGCTGATCAAGCGAGTTACCAAGTAGTCGCGCATGCCTCTGAAAGAATAATCGTTAGGGCAAGCAATCCTGGACAGTTTGAGTCAGAAGGGAATGGTGCCGGTGCTGAAGGAGGCTGGCAAAGAGGAGCTGTGCCTGACAGCGTTTATCATGCTGGCAGAGTCGGCGTTAATACCGATAGACCGGATGAAGCTCTCGTTGTACACGGTAACATGAAgGTAACAGGGCACATTGTTCAGCCGAGTGACATGAGAGCAAAGCAGAACGTTCAAGAAGTCGATACACGCGAACAGTTAAGGAATGTACAACAGTTGAGAGTAGTTCGGTACAGATATGCTCCGGAATTTGCTCTACACTCCGGACTAGGTATGAAGCCACAAGAAGACACTGGCGTAATAGCGCAAGAAGTTCAACAAATCTTACCTGAAGCTGTTTTACCTGCGGGCGACATTGTTCTCCCTAATGGGCAAAGGATCGAAAACTTCCTAGTCGTGAATAAGGAGAGAATATTTATGGAGAATGTCGGCGCAGTCAAGGAATTATGCAAGGTGACAAACAGCTTGGAGACTAGGATAGATCAGTTGGAGAGAATAAATAAACGACTAGCAAAATTAAAACGAGGTGATAGTTTGAAGAGTTCTGTCAGTACTGTATCGAGCATATCGAGTAACAGATACTCTATAAACAATAAGGCTGTTCAGCAAGGAAAGACGAAAAGGATGGAACGAGAAGAGGAACTACTATGTAGCAATAAATTCATCCAAATTATTATCGTCATACTTATCCTTATCATGGCGTTCTGTTTGGTTGCAATGGCAACATTATACTTCCTCGAGTATCAAAAACGTAGCAACTTGGAGTGGTCAGCTATGGCCAGCAACGGGATGCTTGCAATCGGTCCGGCTCAACAACCAGcgacgtcgccgtcgtcgtcgccgtcgccgtctctTTCACAATCACTGTCGCCGTTATTGCCATCATCTCCATGGTCGTCGTCGTccttttcctcttcctcctcaccctcgtcgtcgtcgtcgtcgtcgtggtcgtcatcgccgtcatcgtcatcgtcctcgtcgtcgtcattGTCGCCGTTGTCGCCATCGCCGTCGTCATCGCCATCGTTATCGTTGTCACTATTGCCGTCACTTTCACCAtctccgccaccaccaccaccgccaccaccaacACCGCCAACTCCCGATTATGATACTCGTTTCAACTCACTACTGCATAGCACACTGTCATCTTTCTACACTAAACGTGGCTCTTTTACGAGAGGCTCTGATAGTGGGCTATCGGCAAAACCCAATGCACTTTCGACACAACCGCCGCACACGAAACAACAATTGTATTCCCAAGAAATCACCTGGTATCCGATAGGACACCCTGGTCAACAatcaaaaattgagaaaaacagCGAATTCCCTGGAAATTGGCTGAACAGAAATGTCGATGCCATTCCAAGGAACGTTGACGAGAATGACCAGGCGACGGAAGTTGATGCACCGTCTTCAAACAAGATACCTCTTCCGTTAGGAAGACCTGTCAACTGTCCTACGCACTTTACAGAACTTGAAAGTCCTTGCCAGGTATATTGCTGCACAGCCGAAATTCATCATTTAGAGGATCCTCAACCCGATCATCCACCTGAGAAAAAGTCTGTTTcaGATCATTTGGAACAACCTTTGAATGTGCACGAAGAGAAACGAAAGCTAAACAAAGGTTTCCAAAATGGTATTAATCCGTCAGACCCTAACACACAGACATTTGTGAAAGAGAACAATTACAAGTATCTGCATAAAAGGACGAGACGCGAAGCCGGTGGTGGAGATTGGGGTGAAGTTGCAAGCAATGCTGCCGGTTCATTACCGCCAGAGCCTAAACCTCAACTTTTTGTAGTAGCTAAAAGCTTTAATGTGTCGTTAGACCACAGATATTGTTCAGCATTGACATCGAGTACGCCCAACAATATTAGTTGTACCATTCCATTGTCCAAACACATGCCGGACTCACATCTAACGTTACATTTCGTGGGCATGCCGTGGTATTGGCAAGTTGTACAACAATGTTCTTTGTCGTCAACGATTCCGATCGATGAGCCGATGGTATGCGGTTGGGGTTACACAATGCAGCAACAGACTGAACGTATTGAAAGAAACAACCAAGCTGGAGATCAGTCTTTTCCTCTCGACGTCGCTCATTATCTGAGGAAAACGCTAAGGTTTCGTGTACCTACGGTACAACCGCAAGAGAACATTTGCAAAAACAGGCATGGCGTCGATTACCTCGAATTTACACTCCACTTCTATCGGGACTGCGACGAATAG
Protein Sequence: MEFSWALQNQPADSIENTENHHEDASVIGQATARRILGVTGRDDFVGGIDNEALDFSQLEDFINSNSEQPSTYFADTLAHNESGGGTGSHSSRIDTSANHHHHQQQQQQQQQQQQSPAAAATPPTPPPAPPPPPPPPPPPPPPPPPPPPPPPPRLPSPIPQAHPVSATCSPGTGAMTAGPTYKDPHSYVHPHALPESPPDSGSEPPYSPPGHHDTQHVHSPHQKAALQEILMHHQGNAANYAPNLLPSSPRGLATAADPLLLTHSTLTTHLAPGASPLPTQQQHQHQHQHQHQHQHQHQHQHQHQHQHQHQHQQQQQHQQQHQHQQQQQRQQQHQQQHMSAAVANSMVPMPLPHEHSPGSINALYSSLQSGPKKRKLSQDGLVHVKQEPELGTIEHSCSSGSAVLDGDEVADNSYIDTSYQCIRFHPFQQTSWHALCDHNLKELPVPHYRVDADKGFNFSNSDDAFVCQKKNHFQITCHAQLQGDAVFVRTGEGLKKISSFQLHFYGVKVESPTQTIRVEQSQSDRSKKPFHPVTVELGSERVTKVTVGRLHFSETTSNNMRKKGKPNPDQRYFHLVVGLHAHTADQASYQVVAHASERIIVRASNPGQFESEGNGAGAEGGWQRGAVPDSVYHAGRVGVNTDRPDEALVVHGNMKVTGHIVQPSDMRAKQNVQEVDTREQLRNVQQLRVVRYRYAPEFALHSGLGMKPQEDTGVIAQEVQQILPEAVLPAGDIVLPNGQRIENFLVVNKERIFMENVGAVKELCKVTNSLETRIDQLERINKRLAKLKRGDSLKSSVSTVSSISSNRYSINNKAVQQGKTKRMEREEELLCSNKFIQIIIVILILIMAFCLVAMATLYFLEYQKRSNLEWSAMASNGMLAIGPAQQPATSPSSSPSPSLSQSLSPLLPSSPWSSSSFSSSSSPSSSSSSSWSSSPSSSSSSSSSLSPLSPSPSSSPSLSLSLLPSLSPSPPPPPPPPPTPPTPDYDTRFNSLLHSTLSSFYTKRGSFTRGSDSGLSAKPNALSTQPPHTKQQLYSQEITWYPIGHPGQQSKIEKNSEFPGNWLNRNVDAIPRNVDENDQATEVDAPSSNKIPLPLGRPVNCPTHFTELESPCQVYCCTAEIHHLEDPQPDHPPEKKSVSDHLEQPLNVHEEKRKLNKGFQNGINPSDPNTQTFVKENNYKYLHKRTRREAGGGDWGEVASNAAGSLPPEPKPQLFVVAKSFNVSLDHRYCSALTSSTPNNISCTIPLSKHMPDSHLTLHFVGMPWYWQVVQQCSLSSTIPIDEPMVCGWGYTMQQQTERIERNNQAGDQSFPLDVAHYLRKTLRFRVPTVQPQENICKNRHGVDYLEFTLHFYRDCDE

Similar Transcription Factors

Sequence clustering based on sequence similarity using MMseqs2

100% Identity: -
90% Identity: -
80% Identity: -