Basic Information

Insect: Cacoxenus indagator
Gene Symbol: Myrf_1
Assembly: GCA_035041755.1
Location: JAWNKX010000240.1:5159023-5164867[+]

Transcription Factor Domain

TF Family: NDT80_PhoG
Domain: NDT80_PhoG domain
PFAM: PF05224
TF Group: Unclassified Structure
Description: This family includes the DNA-binding region of NDT80 [2] as well as PhoG and its homologues. The family contains Swiss:Q05534 or VIB-1. VIB-1 is thought to be a regulator of conidiation in Neurospora crassa and shares a region of similarity to PHOG, a possible phosphate nonrepressible acid phosphatase in Aspergillus nidulans. It has been found that vib-1 is not the structural gene for nonrepressible acid phosphatase, but rather may regulate nonrepressible acid phosphatase activity [1].
Hmmscan Out: # of c-Evalue i-Evalue score bias hmm coord from hmm coord to ali coord from ali coord to env coord from env coord to acc

1 4 0.088 1.9e+03 -0.8 5.0 63 99 249 284 177 327 0.63

2 4 2.9e-38 6.1e-34 118.1 0.8 2 180 538 684 537 684 0.95

3 4 0.34 7.1e+03 -2.7 0.3 59 87 1255 1288 1222 1302 0.63

4 4 0.33 6.9e+03 -2.7 0.1 95 108 1395 1408 1357 1485 0.59

#	of	c-Evalue	i-Evalue	score	bias	hmm coord from	hmm coord to	ali coord from	ali coord to	env coord from	env coord to	acc
1	4	0.088	1.9e+03	-0.8	5.0	63	99	249	284	177	327	0.63
2	4	2.9e-38	6.1e-34	118.1	0.8	2	180	538	684	537	684	0.95
3	4	0.34	7.1e+03	-2.7	0.3	59	87	1255	1288	1222	1302	0.63
4	4	0.33	6.9e+03	-2.7	0.1	95	108	1395	1408	1357	1485	0.59

Sequence Information

Coding Sequence: ATGGACTATCCAAAGGGCTTACATGCACGCACTGATTTCATTGGTGGCATCGACAACGATGCACTCGACTTTGGCCACTTAGAGCAGTTCATGCAGGTTGAGGCGAGCGGTGTCCGTCAGCTGGAAGAGGCCAACACACCAGTACACAATGGCGGGGGCGGCGCTGTTGGCAATTCACAGCTGGGTATGTGCAATCCGAAAATTGAATCGCCAACAACGCCGCCCATGCTTCATGCACTGGATGCAAATCTGCCATTGTCGTCGGTGTCTGCACGTGTGAGTCTCATCAGTACGCCAATTGCCACGCCGAGCGCTTCATTGGGCGGCGGGATCGGTGGCGCTGTCACCCAGAGTCATGCACATTTGCCAGAAAGTCCGCCGGATTCAGGCTCGGAACCACCATACAGCCCGCTGCAGGATGTTCATGGATTGGCACTTACAACACGTGAGCTCTACCATGGCATattcccacaacaacaacaacaacaaaatcagttGTCAACAATGCCAGCAGCGCTGCATGAGATGCACCTAAAGTTTACACCATCTTCGCCAATGGTACAACAGAACGCGACCACATCgacacaacaacatcattacACACATCACATGAACATGCCGCAGGATAATGGTTTGCATCAAAGCGTCCGTGTTAAAGAGGAAACCGAATTGATTATGCACCCGGGTGCTTTAATGTCGCAACAACTGCACCAACACCAGCAGCTACAAACAATGGTGGAGCATCAATCActccaacaacatcaacaacatcaacaacatcaacaacatcaccaacagcaacatcaccttcagcaacaacagcagccacaAAAGCAGCTAACACCCGACATCCAATCACAGCATCCAGATCAACACCAGGTTATGCTTCAGCACGCCACCAATGTAATACACTGCGACAATATGGCTATTAATGGTAGTGGTGGCCTTTATACCTCAGCTAGCTACCAAAACATTGCCAGCATGCTAAGTGGCAATGAACTGTCTCCAACGTGTCTGCTGACCTCTTCGTTGGGCGATTCGACGCGCGTTCAAGTCGTAGGCACGAGTCAGGCATCGCTGGATCGCATTTCCGTTCCCTCCACGCCAGTGCATTCGTCCAACCGGAAACGTAAAATGTCCACACAGTTGGATTATCCCGAATTCGGTCATCTCAAACATAATCCCGGCCTGTCCATGAGTCCACTGCGTTCTTCACATCACTCGTTGTCGCACGATCGCTCCCAATTGGGTACGACATCACCGATCAGAATAAATCTACCTGCGCCCAATACACCCAATACAAAGCAAAGTGACGCATCTAAAACATCCGCATCCGCATCCGCATCCGCATCCGTTTCACCAGCTCTGTCCACCGTGAACTCCAATGCGGAAAACAGTCTCGATGGTCACGGCAGTTGTGCCGCGTCGGCCAGTGGCGCCGGCGACAATGAGAACGGCGATAGCAACTCGTTGACGCCATGCATACGGTTTAATACCTTTCAACCGGAAAACTGGCACAAGTTGTGCGATCAGAGTCTGCAGGAAGTATCCGTTGTTTACTACCGCGTCGATGCCGACAAGGGTTTCAACTTTTCCGTTTCCGATGACGCGTTTGTGTGCCAGAAGAAAAACCACTTTCAGGTCACTTGCCATGCACGTCTGCAAGGCGATGCCAAATTTGTGAAGACACCGTCCGGCcttgaaaaaatcaaatcctTCCACTTGCATTTCTACGGCGCCAAACTGGAGGCTCCCAATCAGACTATACGCGTCGAACAGAGCCAATCAGATAGATCAAAAAAGCCGTTCTTTCCCGTACCAATCGATCTCCAGAGCCACATAGTGAGCAAGGTCACCGTTGGTCGCTTACATTTCTCCGAAACGACAAATAACAACATGCGTAAGAAAGGTCGTCCCAACCCGGAGCAGCGCTATTTCCAGCTTGTCGTCGGTCTGCACGTGCACACCACATCGGGCAACTTTCCAGTGATTAGTCATTGTAGTGAACGAATAATTGTGCGCGCTTCCAATCCCGGACAGTTCGAGTCGGACGTCGATCTCTGCTGGCAACGTGGCCTCACACAAGACTCCATATTCCATGCCGGACGCGTGGGCATAAACACTGATCGGCCCGATGAAAGTCTTGTGGTTCACGGCAATTTGAAGGTATCAGGCCACATTGTTCAGCCCAGCGACAGCCGAGCCAAGCAAGAGATTGGAGAGCTGGACACATCCGTGCAGCTGCGCAACCTGCTAAAAATTCGCATTGTACGCTACCGCTACGAGCCCCAGTTTGCCGTGCATTCTGGGCTGAAACGCGCGAGCGAAAGCGACACAGAGGATATTATCGACACCGGCGTGATCGCGCAGGAGGTGCGTGAGGTTATACCAGATGCGGTAAAAGAGGCTGGCAGCATTGTCCTGCCGAATGGAAATGTTATTGagaactttttgttggtgAACAAAGACCGAATACTTATGGAGAATATCGGAGCTGTGAAGGAGCTTTGCAAGGTAACCGGCTCTTTGGAGACGCGCATTGAACACTTGGAGCGTGCCAACACGCATGTGGTACGGGCAAAAGAGCAACGCCTCCTCTTTGCGGATCGTGCTAGAAAGTCCGCAGCAAGTGGTGAAGGCTACGAGATTTGCTCGAGCAGGATATTACAAATAGTCATTTTTCTGCTCATAATTGTCATGGCTGCTTGCCTCACTGCCGTGTCCACTCTTTACTTTGTGGAGCACAGCAAACAGCAACACAACCGAAAGCAATTGGAGAGTTACCAAGTATTTGGGAATGGCCATTCTTTACGCAGCGATGCGTCGTCCATAACTGACCAAGAGCGCTACTACATGCAGCATAACTTCCACACGTTCCTTAATAAGAACAAAACCCATAGTCACTGGCCCAGCCTTATCTATGCGCTGAGCACAACACGACCGCCAGCCAAGAATGGCACTAAGCCACGTGAGGAACTACTACTGACGTACAGCAACAGTGGCGAAAACTACAACACTCACAGGACAAACGAAGAATTGAGCGTTGTCATGGAGAAACCACTACTTAGTCTTCCAGCGGTACCACTGCCGAAGCAGATCAATCGCATAACGACTACCGCACCACTGCTGCGCAACAAGACGataagcaacaagaacaagtcAAAGTGGCCTCTGCCGCAGGAAGTGCTCAGGGCGGTGGCGGCGAACCAAAATTCTCAAAAACTAGCACTGGCCTCGCGAAACATAAACTTACCGAACTTCGCTTCAGCCATAACCGCGCCCACTGTGGCGCCACCTATGGCTGTCGAGCCGCGCAATAACAACGAAACATCGTCTGAGAAGGTGCCCGAGACTGTGCCGGTACCGCAGGACTTCGAAAGTAACTCAATCGACATAGATGCACAGCATATTATAAAGAAGGCGGTCAACCAAGAGAAATTAGCCAATGCGCGAAATGCTATCTCAGCTGGCGTAGAGGCAGTCAGTGAATCCAAGGATGAACCGGCACCGCAGGAGGAGACGCTAGTTAACCCCAACAGTGACACAGACATCACACTTAAACTCTCCGATCCGATGGTCGTCGAAACAATCGCCAGCACctccagcagcaacagcataaGCATACCAGACACAACGGCTTCGGCCGGACAAACGATCCGGAAAATAAACACGGGCGATGCTGTAATCTACAATGTCTATAAAACAGTGTCGCCACCGACAGCGAACCTAGCGCTGACCACAAATAAAGTGAACACCGAAACGACGCAGACGAACGTCAACGTTGAGACAGCCGCAgtcaccacaaacaacaatagtCGTGCGTCGAACACGCACGATAATCCGGACGCGATCGACTTACAAAACctaagcaataacaataacgagTCGGTGGATAACCCAATCACGGCTTTGTTTGGATTTGAATATGCTGGCGTGCGTGAATCGAGCGTGGGTCGCCGCTCAGCGTCTCATCGGAGCGTAGACTGGGTGACCCATAAAACAGTCAAAACGGAGGTATTAGGCGAGCCAACGGAGTGCAAAGCCCCCACTCGGCAAGAGAACTGTCAAAGTGTATGCTTTGAAGATTTTAAGCAGGACAATGGCGAAAGCAGACCACTGCAACAACATAGTAGACATgaagcagcatcagcagcaaaaGATGAGCCTTTAGTCGACATGGAAATCATTTCGAGCGCTCAAAATATCCAAAATCACACTCACGAAACCGAAATTGTACCGGGGGGGAAGGCATCGCATGCAACCGATGCAGCCGCCAAACAGTTCTCCGATGAACAGGTGTCACTCGAAACGGATGATGTTCTGGAGACTATGCTCAGTCAAGTATCGTTTTCCGCGGAGCACCTGGACGGAGCACCTAAGATCGTCGCCGACATCAATGCGCAGATAAGCGCGAGCGAAGCCCACCAAGAGGCGCAGAACCAGCATCTGACCTTGGAATGCTGGGAAATTTCAAGCTACATTTTGATTGACCAGATCAATCGCACTATATGTACCGAACAGTTCTGTCCCAGCTTCGGAAAATCTCTCAACGTGACATATTTAGTACCACTCTCCAGGTTCCTTAAAGCCGATAGTGTTGAAGTGCAATTGAGTTCGAAGAAGCCACTTCAATGGTCCATCTGCAACAGTGAACAAGACAAAAAAGGCTCATCTTCGGCTATTGCCGAGCatgaagacgacgacgatgacgacgaccgTGCATTGGACCTTCCAACCGGGGATTTGGTAACGATTGTGAAACAACGTAACAACAATAGAATAGTTTTGGAGCTTAGCATTCCCAGTAACGGCTATTTCCTGAGGAATTTCATGCTGCGCGCCAGCACGGAGTTGGACCAGaAAAAACTGTGCGATCACGACGCTCACTTAGTAAATACTTTACTCCAGTACAATTTTAGAATAGTAAGAGATTGTGATTAG
Protein Sequence: MDYPKGLHARTDFIGGIDNDALDFGHLEQFMQVEASGVRQLEEANTPVHNGGGGAVGNSQLGMCNPKIESPTTPPMLHALDANLPLSSVSARVSLISTPIATPSASLGGGIGGAVTQSHAHLPESPPDSGSEPPYSPLQDVHGLALTTRELYHGIFPQQQQQQNQLSTMPAALHEMHLKFTPSSPMVQQNATTSTQQHHYTHHMNMPQDNGLHQSVRVKEETELIMHPGALMSQQLHQHQQLQTMVEHQSLQQHQQHQQHQQHHQQQHHLQQQQQPQKQLTPDIQSQHPDQHQVMLQHATNVIHCDNMAINGSGGLYTSASYQNIASMLSGNELSPTCLLTSSLGDSTRVQVVGTSQASLDRISVPSTPVHSSNRKRKMSTQLDYPEFGHLKHNPGLSMSPLRSSHHSLSHDRSQLGTTSPIRINLPAPNTPNTKQSDASKTSASASASASVSPALSTVNSNAENSLDGHGSCAASASGAGDNENGDSNSLTPCIRFNTFQPENWHKLCDQSLQEVSVVYYRVDADKGFNFSVSDDAFVCQKKNHFQVTCHARLQGDAKFVKTPSGLEKIKSFHLHFYGAKLEAPNQTIRVEQSQSDRSKKPFFPVPIDLQSHIVSKVTVGRLHFSETTNNNMRKKGRPNPEQRYFQLVVGLHVHTTSGNFPVISHCSERIIVRASNPGQFESDVDLCWQRGLTQDSIFHAGRVGINTDRPDESLVVHGNLKVSGHIVQPSDSRAKQEIGELDTSVQLRNLLKIRIVRYRYEPQFAVHSGLKRASESDTEDIIDTGVIAQEVREVIPDAVKEAGSIVLPNGNVIENFLLVNKDRILMENIGAVKELCKVTGSLETRIEHLERANTHVVRAKEQRLLFADRARKSAASGEGYEICSSRILQIVIFLLIIVMAACLTAVSTLYFVEHSKQQHNRKQLESYQVFGNGHSLRSDASSITDQERYYMQHNFHTFLNKNKTHSHWPSLIYALSTTRPPAKNGTKPREELLLTYSNSGENYNTHRTNEELSVVMEKPLLSLPAVPLPKQINRITTTAPLLRNKTISNKNKSKWPLPQEVLRAVAANQNSQKLALASRNINLPNFASAITAPTVAPPMAVEPRNNNETSSEKVPETVPVPQDFESNSIDIDAQHIIKKAVNQEKLANARNAISAGVEAVSESKDEPAPQEETLVNPNSDTDITLKLSDPMVVETIASTSSSNSISIPDTTASAGQTIRKINTGDAVIYNVYKTVSPPTANLALTTNKVNTETTQTNVNVETAAVTTNNNSRASNTHDNPDAIDLQNLSNNNNESVDNPITALFGFEYAGVRESSVGRRSASHRSVDWVTHKTVKTEVLGEPTECKAPTRQENCQSVCFEDFKQDNGESRPLQQHSRHEAASAAKDEPLVDMEIISSAQNIQNHTHETEIVPGGKASHATDAAAKQFSDEQVSLETDDVLETMLSQVSFSAEHLDGAPKIVADINAQISASEAHQEAQNQHLTLECWEISSYILIDQINRTICTEQFCPSFGKSLNVTYLVPLSRFLKADSVEVQLSSKKPLQWSICNSEQDKKGSSSAIAEHEDDDDDDDRALDLPTGDLVTIVKQRNNNRIVLELSIPSNGYFLRNFMLRASTELDQKKLCDHDAHLVNTLLQYNFRIVRDCD

Similar Transcription Factors

Sequence clustering based on sequence similarity using MMseqs2

100% Identity: -
90% Identity: -
80% Identity: -