Basic Information

Insect: Glossina austeni
Gene Symbol: Myrf_1
Assembly: GCA_000688735.1
Location: Scaffold137:543858-572589[-]

Transcription Factor Domain

TF Family: NDT80_PhoG
Domain: NDT80_PhoG domain
PFAM: PF05224
TF Group: Unclassified Structure
Description: This family includes the DNA-binding region of NDT80 [2] as well as PhoG and its homologues. The family contains Swiss:Q05534 or VIB-1. VIB-1 is thought to be a regulator of conidiation in Neurospora crassa and shares a region of similarity to PHOG, a possible phosphate nonrepressible acid phosphatase in Aspergillus nidulans. It has been found that vib-1 is not the structural gene for nonrepressible acid phosphatase, but rather may regulate nonrepressible acid phosphatase activity [1].
Hmmscan Out: # of c-Evalue i-Evalue score bias hmm coord from hmm coord to ali coord from ali coord to env coord from env coord to acc

1 3 0.047 9.1e+02 0.1 0.1 70 101 61 92 40 124 0.85

2 3 4.5e-38 8.7e-34 117.4 0.6 2 180 484 630 483 630 0.96

3 3 0.14 2.7e+03 -1.5 0.0 88 159 1462 1529 1451 1539 0.77

#	of	c-Evalue	i-Evalue	score	bias	hmm coord from	hmm coord to	ali coord from	ali coord to	env coord from	env coord to	acc
1	3	0.047	9.1e+02	0.1	0.1	70	101	61	92	40	124	0.85
2	3	4.5e-38	8.7e-34	117.4	0.6	2	180	484	630	483	630	0.96
3	3	0.14	2.7e+03	-1.5	0.0	88	159	1462	1529	1451	1539	0.77

Sequence Information

Coding Sequence: ATGGACTTCTTTAACGATCACATTTTAACAGACTTAGATCGTTCAGATTATGTTGGCGGTATCGATAACGAGGCCATATTCTTTGAAGATTTACATGTGACAACAAGTGTCGGCAGTCTTCACGCAAATAATGGTCATTCAAGTAGTTTAAACGGTGTTGAGTCCGCAACGTTTGCATGTAATTCGAAAGCTGAAACGCCGGTCACATCCCCCACATCGATTCCGTTGCAGGAAGCCACATTACCACCAATTCCAACCATCTCAGCAAGAGTTAGTCTGACTAGTGTAGCACACATCGGCATACATGCCACAAGTTCCAATAATCATACACACTCACATTTACCGGAAAGCCCGCCCGATTCAAGCTCTGAACCACCTTATAGCCCATCACAGGATGTGCACGGTTTGGCTTTAACGTCACGTGATCTTTACAATGGACCAGGCTCAACAAGCAATGTAGCACCTGCCATACATGAAATGCATACATTGCCAACACAGCAGCAACACCGCTCACAGCACCCATCACAACAATATGCTACGTCACCAACTCAACACCAACAACCGCATACAAACAATTATTTACATGTAGTTCGAAGTTCGCATGGAAACGCGAATGGCCTTGTGCGAGTCAAACACGAATCAGGTTTACTTGTCAACACAGGCGCCTTGCAAAGTACTTTTAATACCCGTTCAACAGACACGCACATCGAAATGCCAACCTCTCACTCTTTTTATTCAACCAACGCCCATTTAAACAGCTTAGCGAATAAAATGTATGCGCCCACCATTACATCCTCTTCACCTTCATATCAATTGGATTTGGGAAATGTTGATCATAATAACTCCACATCAGCATCTTCCGCGTGCATGCTAAACACCGTGACCGATTTACCTCATGTGCAGGCCATAGGAACAAGTCATGCTAGCATACCATCCACACCGCAATTAAGCCGCACATCAACACCTTCTACCCCAAATCATCAAAGCTTGTCTCGAAAGCGAAAAATGACCACAGACATTGAGTGCTCAGAATACACAAACATTAAGCCAGATCCTGGATTTAAAACGAGTCCCACTCGCAGCGCATCATGTGCCACTCCCCTGCAACTAACAAATGAATCAAAAGTTTCGCCCACATCTCCACTAAATATACAATTAAGCTCTCAAAATTCAACAAGCGCTAGTGATTTATGCAGTACAGCTCCTCACTCGACAGCCTCCCTATCACCAGCTTTATCGATTGTCAACACTAATGTGGAGATTGCTTGTGTGGACACGTCTAAAAGTTCAGAAAGTGGTATAGACGCCCTTAGTCCTTGCATAAAGTTTACCCCTTTCCAACCACAAAATTGGCACAAGCTATGCGACCAAAATTTGCAAGAATTATCAATAGTATATTATCGCGTGGATGCTGATAAAGGTTTCAATTTCTCAGTGTCTGACGACGCCTTTGTTTGCCaaaaaaaaaaTCATTTCCAGATCACTTGCCATGCCAGATTACAAGGAGAGGCTACATTTGTCAAAACGCCGTCCGGTCTCGAAAAAATTAAATCCTTCCATTTACATTTTTATGGAGTAAAGCTGGAATCTCCAAACCAAACTATACGCGTTGAGCAAAGCCAATCAGACCGTTCaaaaaaaCCCTTCTACCCCGTACCGATCGATCTCCAGAGTCATATTGTTAGTAAAGTAACTGTGGGCCGTTTGCACTTTTCCGAAACCACCAATAATAACATGCGTAAGAAGGGGCGCCCAAATCCCGAACAACGTTATTTTCAGCTGGTAGTGGCTTTACATGTGCACACAGCTTCCGGCGATTTTCCTATTATTAGTCAGGGAAGTGATAAAATAATCGTACGAGCGTCTAACCCAGGACAGTTTGAATCTGATGTAGATTTGTGTTGGCAGCGAGGTCTTACACAGGACTCCATTTACCATGCGGGCCGAGTCGGCATAAACACCGACCGGCCTGACGAAAGCTTAGTAGTGCATGGTAATCTCAAAATATCAGGCCACATTGTGCAGCCGAGTGATAGTCGAGCTAAGCAAGAAATAGGTGAATTGGATACCTCCGTGCAGCTAAGGAATTTGCAGAAGATACGAATTGTTCGCTATCGTTTAGAACCAGAATTTGCTTTGCACTCCGGTCTGAAATGTAAAAACGGATCTGGGGATATTGTGGATACAGGAGTTATCGCCCAAGAGGTGCGCGAAGTAATCCCAGACGCAGTACAAGAAGCTGGAAGTATAGTGCTGCCAAATGGTAACGTTATTGAGAATTTCTTGTTGGTCAATAAGGATCGAATACTCATGGAAAATATTGGCGCGGTGAAAGAATTGTGTAAAGTGACTGGAACTTTGGAGTCACGTATTGAAAACTTGGAACGCGTAAACCATCGTCTACAACGTATTAAAGACACTGAATTGCAACTCATGCGGAACGAAATTATGGCCAATAAAGACAGCCAAGAAATCTGCTCGAATAGAACCCTGCAAGTAACCATATTCCTACTCGTTATTGTTATGGCGGCCTGCTTGGCTGCCGTTTCCACTTTGTACTTTGTTGAACATAGCCGAAAACAACATATCTTTAAACACTTGGAGAGTATACAAGTTCTCAGCAATGGACACGTTTATAGACCCGATATCTTGTCACTTGCAGAGCAAGAACATATTTATTTGAATAACAGACCTAATAAAACTCGTAATTTCCTTTATCAATCATCCTCTTCTGCTATGACTATGGACAGTAACTACACAAAATATCGTGATGGAATCTTGGGTGGTATAGATGCAATTGAAGAGATTGTACCAACACGCAATGATGAGCTAACGGCTATCATGGAAAAACCCTCCGTAGAAAATGAACTAAAACAGTTTAATAGAGAACGTTTAAGATCGACTACATCCCCCATGGTTCGCACAAATAAGACGATAAATAGTAAAGCGAAAATAAAACCCCAGGTAGGACGTAATACCGTTTTCAGGGTCATTTACAATCGTCCAAATGATGGAGTATCCCTGCAAGCCACTGATGCTTTAGACACATCCTCAGAACGTATAGCAGGCGCTAATGAATTGTTACAGCCAGACCTTGATAATAATTCCATTGATACAGACCACAAGCCAGCAACTTCTAAGACCCGCCTACCACAAACCAAAGATAATTCACGGCATGGCGACATACAGAAACTAAACACGGAAACAATCATAAGTAGCTTGCGCAAAAATCAAGCCGACAACACCCCACCACAGATCCATCATATGCATCGTAGTAATGCACTTGGTGACGAGTCGGGCATTTATAAAACGTCTTCTCCGCTGAATGTACTTGTCACTACAACTATAAGTACTTCGACCGTTTCCATTGGTACTACTAGCAAGAAAATAGGCCAAAAAGTAAATACCGAAGCGCCACAGACCAACTACTCTCTGGACATACAACCCATAAGTAATAAAACATTACGCAACATTATTGATCGAGCAACCGATAATGCTGAAGATTTGCAAAGTCTTACTAATAACAATGAATCGGCCTACAATACTATAAGTGATCCTCTTGATTTGATATTTTACAACAATATACGAGCACCATCTATAAGCAGTACAACTCAAGAAAGACACCACCAAGAGCAAAACACAGACGCCGATTGGCTGATAAGTAGATATTTCTACACAGATTCATTTGGCGAGCCTGAGCAGTGCAACaaaaaaaTAAGACGTGCTGATATATCCAATTGTCAGTCGGTGTGTTTCGAGGAAAATAATCAACTCTTGGTCCCAAATCATCTATCGTTGGGTCTGAAACCTAGTGAAGCAAAAATAACGAAAACTTTGATTACGCAAGAGGCAGTAGGCAAAGGCAAGAGTAGTGAAAGCGCAGATAATGTCGATGATGACAAAGAAACAGTTTTACATGAAAATGAAGATGACTTACAAGTTGCATATGGAGGGTCTTTACATCTTAACTCGAACTCGTCTCGGTTATTAGTCGCAGGTAAATCTTCGCATTCTACACAAGCTATAACAAAACAATTGAGTGCAGAACAACCTTCAGGAGAAGTCGTAGATAATTTAGGAGCTATGTTGGACCATAGTTTCAGCAATGACAATGGAAATCACCACCTAAAAGCCGCAAAACAAGAAAGACATGATTTACCAAATCAAAAACAGACGCAACAAGCCAAATTATTAACGGAACCGAATCAGCCTCCATTACATGCGGACTGTTGGAAAGTGCACAGCTGTATATTAGCAGAAAGAGTGAATAAAACTTTCTCCGTTGATGAATATTGTCCGAAATTGAGAAAATCAATGAATGTAACATTTACCGTACCATTGTCACGCTATTTTAAGGAAAAAAGTATTGAACTGCATTTAACATCAACTTTACCATTACATTGGGTGCTTTGCAATAATCATGAATTAACAAAAAACAACGGTAAACATTTGCCTACTACTCATCAAACACTGCAGCGCCTTCGTAATACCTCGCTGCTGTTACTCAACATACCAAGCCGGGGTTATTTTGTTAAAGACTTGAATTTACGTGCCACCAGTGATACAGAAAAGGAAACCATATGCCAGGAGAAACCATATGAAACAAATCCTATACTTCAGTACAATTTTAGAATTTTAAGAAATTGTGATTAA
Protein Sequence: MDFFNDHILTDLDRSDYVGGIDNEAIFFEDLHVTTSVGSLHANNGHSSSLNGVESATFACNSKAETPVTSPTSIPLQEATLPPIPTISARVSLTSVAHIGIHATSSNNHTHSHLPESPPDSSSEPPYSPSQDVHGLALTSRDLYNGPGSTSNVAPAIHEMHTLPTQQQHRSQHPSQQYATSPTQHQQPHTNNYLHVVRSSHGNANGLVRVKHESGLLVNTGALQSTFNTRSTDTHIEMPTSHSFYSTNAHLNSLANKMYAPTITSSSPSYQLDLGNVDHNNSTSASSACMLNTVTDLPHVQAIGTSHASIPSTPQLSRTSTPSTPNHQSLSRKRKMTTDIECSEYTNIKPDPGFKTSPTRSASCATPLQLTNESKVSPTSPLNIQLSSQNSTSASDLCSTAPHSTASLSPALSIVNTNVEIACVDTSKSSESGIDALSPCIKFTPFQPQNWHKLCDQNLQELSIVYYRVDADKGFNFSVSDDAFVCQKKNHFQITCHARLQGEATFVKTPSGLEKIKSFHLHFYGVKLESPNQTIRVEQSQSDRSKKPFYPVPIDLQSHIVSKVTVGRLHFSETTNNNMRKKGRPNPEQRYFQLVVALHVHTASGDFPIISQGSDKIIVRASNPGQFESDVDLCWQRGLTQDSIYHAGRVGINTDRPDESLVVHGNLKISGHIVQPSDSRAKQEIGELDTSVQLRNLQKIRIVRYRLEPEFALHSGLKCKNGSGDIVDTGVIAQEVREVIPDAVQEAGSIVLPNGNVIENFLLVNKDRILMENIGAVKELCKVTGTLESRIENLERVNHRLQRIKDTELQLMRNEIMANKDSQEICSNRTLQVTIFLLVIVMAACLAAVSTLYFVEHSRKQHIFKHLESIQVLSNGHVYRPDILSLAEQEHIYLNNRPNKTRNFLYQSSSSAMTMDSNYTKYRDGILGGIDAIEEIVPTRNDELTAIMEKPSVENELKQFNRERLRSTTSPMVRTNKTINSKAKIKPQVGRNTVFRVIYNRPNDGVSLQATDALDTSSERIAGANELLQPDLDNNSIDTDHKPATSKTRLPQTKDNSRHGDIQKLNTETIISSLRKNQADNTPPQIHHMHRSNALGDESGIYKTSSPLNVLVTTTISTSTVSIGTTSKKIGQKVNTEAPQTNYSLDIQPISNKTLRNIIDRATDNAEDLQSLTNNNESAYNTISDPLDLIFYNNIRAPSISSTTQERHHQEQNTDADWLISRYFYTDSFGEPEQCNKKIRRADISNCQSVCFEENNQLLVPNHLSLGLKPSEAKITKTLITQEAVGKGKSSESADNVDDDKETVLHENEDDLQVAYGGSLHLNSNSSRLLVAGKSSHSTQAITKQLSAEQPSGEVVDNLGAMLDHSFSNDNGNHHLKAAKQERHDLPNQKQTQQAKLLTEPNQPPLHADCWKVHSCILAERVNKTFSVDEYCPKLRKSMNVTFTVPLSRYFKEKSIELHLTSTLPLHWVLCNNHELTKNNGKHLPTTHQTLQRLRNTSLLLLNIPSRGYFVKDLNLRATSDTEKETICQEKPYETNPILQYNFRILRNCD

Similar Transcription Factors

Sequence clustering based on sequence similarity using MMseqs2

100% Identity: iTF_00748234; iTF_00749708; iTF_00750476; iTF_00750477; iTF_00748976; iTF_00747481;
90% Identity: iTF_00749708; iTF_00750477; iTF_00748976; iTF_00748234; iTF_00750476;
80% Identity: -