Basic Information

Insect: Ceratitis capitata
Gene Symbol: Myrf_1
Assembly: GCA_000347755.4
Location: NW:2797464-2810884[+]

Transcription Factor Domain

TF Family: NDT80_PhoG
Domain: NDT80_PhoG domain
PFAM: PF05224
TF Group: Unclassified Structure
Description: This family includes the DNA-binding region of NDT80 [2] as well as PhoG and its homologues. The family contains Swiss:Q05534 or VIB-1. VIB-1 is thought to be a regulator of conidiation in Neurospora crassa and shares a region of similarity to PHOG, a possible phosphate nonrepressible acid phosphatase in Aspergillus nidulans. It has been found that vib-1 is not the structural gene for nonrepressible acid phosphatase, but rather may regulate nonrepressible acid phosphatase activity [1].
Hmmscan Out: # of c-Evalue i-Evalue score bias hmm coord from hmm coord to ali coord from ali coord to env coord from env coord to acc

1 5 1 1.2e+04 -4.6 4.8 35 130 78 202 54 213 0.39

2 5 0.26 3.2e+03 -2.4 3.2 73 120 250 301 183 359 0.71

3 5 6.9e-38 8.4e-34 116.8 0.7 2 180 519 665 518 665 0.96

4 5 0.34 4.1e+03 -2.7 0.2 36 84 1121 1169 1090 1180 0.66

5 5 0.24 2.9e+03 -2.2 0.0 36 72 1549 1581 1508 1584 0.65

#	of	c-Evalue	i-Evalue	score	bias	hmm coord from	hmm coord to	ali coord from	ali coord to	env coord from	env coord to	acc
1	5	1	1.2e+04	-4.6	4.8	35	130	78	202	54	213	0.39
2	5	0.26	3.2e+03	-2.4	3.2	73	120	250	301	183	359	0.71
3	5	6.9e-38	8.4e-34	116.8	0.7	2	180	519	665	518	665	0.96
4	5	0.34	4.1e+03	-2.7	0.2	36	84	1121	1169	1090	1180	0.66
5	5	0.24	2.9e+03	-2.2	0.0	36	72	1549	1581	1508	1584	0.65

Sequence Information

Coding Sequence: ATGGAATATCCCAAGAAtataaatgATCGATCCGATTTCATTGGAGGCATCGACAATGAGGCAATCGATTTCGGTAATCTGGAACAGTTCATGCAGGTTGAAGCAGCCGTTGGTCAATTGGACACACATAATGGCTGTGTGAGTGTCAATAGTACACGCGAAAATCCATTAAATTGTGGCAACACTAAGACcgatcagcaacaacaacgacaacttaCTTCTcttcaacaacagcagcagcagctgcatcagcatcagcatcaacaGCAAATTAACTCGGTCGATGGTCAAATATCTTTGGTAAGCGTTTCGGCGCGTGTTAGTTTGGCATCCACACCCATAGCGACGCCGAACCCAGCTGCCGTTAACCACAGCACACCGCATATGCCAGACAGCCCGCCCGACTCCGGTTCGGAACCACCTTACAGTCCACTACAGGACACGCACGGTCTCACACTCACCTCGCGCGACGTCTACAATGGCCTCTCTTCGATACAGACCGATATGCATTTGCAGTCACAATTTACGTCACCGCATCCAGCGCAACAAATGACCACACATCAGCACCAACATTCACAGCATaacaacagccacaacaacaacaccactcaATTACATTACAATCACAATCACACGCCAACGGCGCCTCCGAATGATACGTTGAGTGCCATACGGGTGAAACATGAGGCAGGTCTCATCATGGACCCGACAGCGCTCACGCACACGCAGCATGCCAACTCCATaagcacacatgcacatacacatgatCCCAATGGCGCCCATGGTCATATGAGTTTTCCGCCTACACACCAGTTGATGTTCACGAAtcaaaatgccaacaacaacaacaacagtaatgatCACAACACAAATGCTAGCAGCCTGCTATCGTACGAGAATCTACATAATGGTAATTTTCCTTCAGTGAACTATCCAAATGTTACTGTTGTAAATGGGATCGATGTATTGCCAACTCATCCAACGTCCTGCGCGCTCACTTCCCATATCAACGAGGTGCCACGCGTTCAGTTGATCGGTACAAGCCAAGCGATACCATCGCAGCACACTCGTTCGTCGTTGCCCACTACACCCGTGCATCTGTCCGCGTCACGCAAGCGTAAGCTCTCCACGCAGCTAGATTGTCCCGACTTTGCTAGCATAAAGCCAGATCCGGGTTTGAGAATGAGTCCAGCGGATGGCGGTGCAGTAGTGTCTGAGCCGCAAAAACTTAGCGCATCATCACCAGTTACCATCACACTACCTGCACACGCCGGCGACATATCCAGTACGCCCGCACACTCAGCTGCCTCGCTATCACCTGCGCTGTCGACCATCAACTCGAATCCGGACAATAGTCTGGATGGCAATAATACAACCACAAGTGGCGGTGGCGAAAGTGGTGAGAATAATGCTCTAACGCCGTGTATTCGCTTCAGTCCATTCCAGCCGCAAAACTGGCACAAACTGTGCGATCAAAGCCTGCAAGACATTGCGGTCGTTTACTATCGTGTCGATGCGGACAAGGGCTTCAACTTCTCCGTGTCCGATGATGCGTTCGTTTGTCAGAAGAAAAACCACTTTCAGATAACTTGCCACGCACGTCTACAGGGCGATGCGAAGTTCGTCAAAACGCCGTCCGGCTTAGAGAAGATTAATTCATTTCATCTTCATTTTTATGGTGTTAAATTAGAAGCTCCCAATCAAACGATCCGTGTCGAACAAAGCCAATCGGACCGCTCAAAGAAACCATTCTATCCAGTGCCTATTGATCTGCAGAGCCACATTGTTAGCAAAGTGACTGTCGGTCGTTTGCATTTCtcagaaacaacaaataataacatgCGCAAAAAAGGTCGTCCCAATCCTGAGCAGCGGTACTTCCAACTGGTGGTTGGCTTGCACGTACACACCATATCCGGAAATTTCCCCATCATCAGCCAAGGTAGTGAACGTATCATTGTGCGCGCCTCCAATCCAGGCCAATTCGAGTCCGACGTCGATCTTTGCTGGCAACGTGGCCTTACGCAAGACTCCATCTTTCACGCCGGCCGTGTTGGCATTAACACGGATCGTCCGGACGAGAGTTTGGTTGTGCATGGTAATCTGAAAGTGTCCGGACACATAGTGCAGCCCAGTGATAGTCGCGCAAAGCAAGAGATAGCTGAGTTGGACACTTCGGTGCAACTGCGTAACTTACAGAAAATACGCATCGTGCGTTACCGTTACGCGCCGGAGTTTGCTGTGCACTCGGGCCTTAAGCGTTCGTGTGAGAGCGACAGCGAAGAGATCGTCGACACAGGTGTAATTGCGCAAGAGGTGCGCGAGGTTATACCCGATGCGGTGCAAGAGGCTGGCAGTATTGTGCTGCCTAACGGTAATGTGATCGAAAATTTCCTGCTGGTCAACAAGGATCGCATTTTGATGGAAAACATTGGTGCGGTGAAAGAGCTCTGCAAGGTCACTGGCTCGCTGGAGACGCGCATTGAAGATTTGGAACGAAACAATCGGCTAATAAGACAACAGGAGTTCGAGCAACGCAGCAAAAGCTATCGCTTGGCTAAGAGCTGTGGAGGGCGTGGCGGATACGAGATCTGTTCAAACAAAACCTTGCAGATCGTCATATTTTTATTGGTCATCGTTATGGCAGCTTGCCTTGCAGCCGTATCCACCCTCTATTTCGTGGAACACAACAAGCAACGTTACAACTACAAGCAACTAGATCGACTACAGTTCCACAGTAACGGTCACCTTCTCGGTCATGATTCTGTACTCATAAACGAACAGGAAGGTTATATTGTCCAGGTGCATAATCTACTCAACCGAAATAAAACTATTCAGCAGGTCGGATCATCGCGGCCGACGGGTTATCGGAATTCTACACGACTAAACCCCGAAATTACCTATGATGAAAGTAGTGATCCATACTCGCAGTATGGGCGTAACGATGAACTGGCTGTCGTAATGGAAAAGCCGCTTGTCAGCCTGCAGCCATTGCATCCACGGAAAGATACGTTTAAAGTGACAACAACTGCACCCCAGCTGCGTATTAATAAGACGataagtagtaaaaataaatcaaagtggCCTCAAGCGCAAGTGGTACCCAAGTTGATAGCGTCATTTCAAAACACACGTGGAACCAGTAGCGTGCAACCTGAAAGTAATGCCAATCTGGCACCGAGCCAACGAAGGACAGGAACTCTCGGCACCAATGAGACGTCTTCGGAAAAAGTCACCGATGCAGTGCCATTGGCACACGATTTCGATAACAATTCCATCGATGTGGATGCACAACATTTGACAAAGAAGGTAACAGCCAACAGAGACTCGGTTGCACGCGCTGTGAGTTCTCACGAGGAAACGCTTTCGGAAAACGCTGAAACCATTGCTGACTCAATAATGCCCATTGTCAGCACATCCTCGAGTGGCGATGTTAATAGTAAAAATGTTGTTGATCACAGTGATAACGGTAAAAATACCAATATCAATGATAACAATAATGTGCCGGATACCACTGTGCCGGCTTATGGGCTGCGTTCACGTAACGTATACAAAGCGGTCTCACCACCATCAGCGCTTCTTCCACTCACCACTAATAAGGTCACCATCGAAGGTCTGCCAAGCAACCATTCACAAGAGGTGCCGGCATACTCAAATAAAAGTCAAGCAGTGCTGGAGAGTAAAGTGGATAGCACAGATTTGTTAGATTTACAGAGTCTGAGTAACAACAATGAATCGGCGGATAACCCAATCACTGCGTTGTTCGGTTTCGATTTCGGCTGGGGTCGTGAGTCAATTCTAGGCCGCAGGTCAACCTCGCAACGTAGCGTCGGTCGCATACGTTGTAAATTCGTGCAGGTAGAGATGTTTGGTGCGCCGCCACAATGCACACAGAAGCCGAACAATGACGAGGTGTCAAATTGTCAGTCGTTTTGCTTCGAGGAATCCAATCAATTGCCACCACTTCACCAAAACTTAGCGAACATACCGCAGGTAAAAGAGGGCCCTGTTGCCACAGGAAAGCAGCAAAGCAACGAAAATACACAATCATCAGACTCGAATGTGGACAGCAGCGATGTTGATCCAGATCCCGACACTCAACCGCGTTCTCTGGCCACGCCCATATTGTCGACAAATGCTACTTTCATTGGCACAGACAAAAAAGCACAAGTGGTGGAAGTTTCCAGTGAACAGCGCTCAGATCTATCAGACTCTTCTAGAGATATTTCTGGCTCAGATGAACGGCTCGATGTTGACGCTAAAACGGTACAGGACACAGTTGGCGCACAAGCGCCTGCGAGTGGTTTATCGGCCGAAGCGCAAATTACTGCCGAAGCTCTAACGGATTGTTGGCAAATCAACAGTTGTTTGATAGCCGACACACATAACGAGACATTCGGTATGGAGCATCATTGTCCACATGGCGGCAAGTCGCTGAACATGACCTATATTATACCGTTATCAAGATTTTTCAAGGAATCAAGCATACAACTGCAACTCACCTCCTCTGTGCCACTGTTATGGACTATTTGCAGTAATCGCGAGCTAACCAGACACCAAGGTGCACATCTCTTGCAATCGTCTGCCCATCAACTCAACGCCAACATTGTACAGGGTCAACCAAATGTCTCGGTCATCTATTTCAACATACCGAGTCGTGGCTATTTTGTACGAAGTTTTGCGTTACGCGCAACAACCGCGGATTCCAAGAAGcaaaatatttGTCAGGAGACAGCACACGAAGCAAACAGTTTACTACAGTACAACTTTAGTATCGTAAGAGATTGTGATTAG
Protein Sequence: MEYPKNINDRSDFIGGIDNEAIDFGNLEQFMQVEAAVGQLDTHNGCVSVNSTRENPLNCGNTKTDQQQQRQLTSLQQQQQQLHQHQHQQQINSVDGQISLVSVSARVSLASTPIATPNPAAVNHSTPHMPDSPPDSGSEPPYSPLQDTHGLTLTSRDVYNGLSSIQTDMHLQSQFTSPHPAQQMTTHQHQHSQHNNSHNNNTTQLHYNHNHTPTAPPNDTLSAIRVKHEAGLIMDPTALTHTQHANSISTHAHTHDPNGAHGHMSFPPTHQLMFTNQNANNNNNSNDHNTNASSLLSYENLHNGNFPSVNYPNVTVVNGIDVLPTHPTSCALTSHINEVPRVQLIGTSQAIPSQHTRSSLPTTPVHLSASRKRKLSTQLDCPDFASIKPDPGLRMSPADGGAVVSEPQKLSASSPVTITLPAHAGDISSTPAHSAASLSPALSTINSNPDNSLDGNNTTTSGGGESGENNALTPCIRFSPFQPQNWHKLCDQSLQDIAVVYYRVDADKGFNFSVSDDAFVCQKKNHFQITCHARLQGDAKFVKTPSGLEKINSFHLHFYGVKLEAPNQTIRVEQSQSDRSKKPFYPVPIDLQSHIVSKVTVGRLHFSETTNNNMRKKGRPNPEQRYFQLVVGLHVHTISGNFPIISQGSERIIVRASNPGQFESDVDLCWQRGLTQDSIFHAGRVGINTDRPDESLVVHGNLKVSGHIVQPSDSRAKQEIAELDTSVQLRNLQKIRIVRYRYAPEFAVHSGLKRSCESDSEEIVDTGVIAQEVREVIPDAVQEAGSIVLPNGNVIENFLLVNKDRILMENIGAVKELCKVTGSLETRIEDLERNNRLIRQQEFEQRSKSYRLAKSCGGRGGYEICSNKTLQIVIFLLVIVMAACLAAVSTLYFVEHNKQRYNYKQLDRLQFHSNGHLLGHDSVLINEQEGYIVQVHNLLNRNKTIQQVGSSRPTGYRNSTRLNPEITYDESSDPYSQYGRNDELAVVMEKPLVSLQPLHPRKDTFKVTTTAPQLRINKTISSKNKSKWPQAQVVPKLIASFQNTRGTSSVQPESNANLAPSQRRTGTLGTNETSSEKVTDAVPLAHDFDNNSIDVDAQHLTKKVTANRDSVARAVSSHEETLSENAETIADSIMPIVSTSSSGDVNSKNVVDHSDNGKNTNINDNNNVPDTTVPAYGLRSRNVYKAVSPPSALLPLTTNKVTIEGLPSNHSQEVPAYSNKSQAVLESKVDSTDLLDLQSLSNNNESADNPITALFGFDFGWGRESILGRRSTSQRSVGRIRCKFVQVEMFGAPPQCTQKPNNDEVSNCQSFCFEESNQLPPLHQNLANIPQVKEGPVATGKQQSNENTQSSDSNVDSSDVDPDPDTQPRSLATPILSTNATFIGTDKKAQVVEVSSEQRSDLSDSSRDISGSDERLDVDAKTVQDTVGAQAPASGLSAEAQITAEALTDCWQINSCLIADTHNETFGMEHHCPHGGKSLNMTYIIPLSRFFKESSIQLQLTSSVPLLWTICSNRELTRHQGAHLLQSSAHQLNANIVQGQPNVSVIYFNIPSRGYFVRSFALRATTADSKKQNICQETAHEANSLLQYNFSIVRDCD

Similar Transcription Factors

Sequence clustering based on sequence similarity using MMseqs2

100% Identity: iTF_00082953;
90% Identity: -
80% Identity: -