Basic Information

Insect: Microvelia longipes
Gene Symbol: TY3B-I_1
Assembly: GCA_018340805.1
Location: JACMZG010000022.1:49508298-49539927[+]

Transcription Factor Domain

TF Family: Runt
Domain: Runt domain
PFAM: PF00853
TF Group: Beta-Scaffold Factors
Description: The AML1 gene is rearranged by the t(8;21) translocation in acute myeloid leukemia [1]. The gene is highly similar to the Drosophila melanogaster segmentation gene runt and to the mouse transcription factor PEBP2 alpha subunit gene [1]. The region of shared similarity, known as the Runt domain, is responsible for DNA-binding and protein-protein interaction.In addition to the highly-conserved Runt domain, the AML-1 gene product carries a putative ATP-binding site (GRSGRGKS), and has a C-terminal region rich in proline and serine residues. The protein (known as acute myeloid leukemia 1 protein, oncogene AML-1, core-binding factor (CBF), alpha-B subunit, etc.) binds to the core site, 5'-pygpyggt-3', of a number of enhancers and promoters.
Hmmscan Out: # of c-Evalue i-Evalue score bias hmm coord from hmm coord to ali coord from ali coord to env coord from env coord to acc

1 4 4.9e-17 4.8e-13 49.9 0.1 93 129 10 46 6 46 0.97

2 4 1.5 1.5e+04 -3.4 0.0 7 37 96 126 93 131 0.85

3 4 0.49 4.8e+03 -1.8 0.0 10 35 337 362 331 366 0.83

4 4 1.3 1.3e+04 -3.1 0.0 49 65 1024 1040 1022 1052 0.72

#	of	c-Evalue	i-Evalue	score	bias	hmm coord from	hmm coord to	ali coord from	ali coord to	env coord from	env coord to	acc
1	4	4.9e-17	4.8e-13	49.9	0.1	93	129	10	46	6	46	0.97
2	4	1.5	1.5e+04	-3.4	0.0	7	37	96	126	93	131	0.85
3	4	0.49	4.8e+03	-1.8	0.0	10	35	337	362	331	366	0.83
4	4	1.3	1.3e+04	-3.1	0.0	49	65	1024	1040	1022	1052	0.72

Sequence Information

Coding Sequence: ATGACTAATGTTGCTATGCTTGTTACAGGGAAAAGCTTCACACTTACTATAACGGTTGGTTCATCGCCTCCCCAAGTAGCTACGTACATCAAAGCCATCAAAGTAACCGTAGACGGACCTAGAGAGCCCAGATCTAAAACAAGACAGAGTGGAATCGGGCAAAACCAATCACAAGTTACAATGATGACAAGATCTCATCGATACGGTATCGAATCAACAGGTTATCATCACCATCATCAGGATATGCACGGACATAATGTCAGGGGTGAGGAAGAAGAAGAATTAAACCACGAGGAAGATTATAGGCGGCTTACATCACCTATTCATCCTTGTAAACCTCATTCTCAAGGCTGGGTTTGTAGGAGGACCCTTGGTGTGAAGCCTACACTGATCCAGGCTGCGAAGCCTACTCTAACCCAGCCTGTGAAGCCCAGCCTTATCAAAGACTTTTATAAGGGACGAATAACCCCTGCCATCGATGCTCGAGATCCAGATCAAGATCCAAATCAAATTCAAACACATGGGATAACACAGTATGCTATTACCATAATAAATTTGGCGAAAAAGCAACTAAATGCACCAAACCTTGTTCTTACTCGGAAAACTAAGGAGCCCTTCACTAGCGGCGGTGAACCAAGAGGTCAAATTGAGCCGCCTATGCATCTGTGCACTGGTGCAGACCTGTCGGTTATTCCAGCCAAAAACTATCGGAAACGGAAACCAGATCCACCATTTAGGATATTTGCGGCTAACGGCACAGGTATAAAGACATATGGCGACCAACTAATTACAGTTAATTTAGGCCTTAGAAGAAATTTCAACTGGCATTTTTTAGTTGCTGATGTCAGCTATCCAATATTAGGGGCTGATTTCTTAGCTTACTTCGGACTAATTGTCGatcttaagaataaaaaaatatttgataatttaacgAATATTTCAACAAAAGCTGCATGTTATGACGGAAAACCTATTGGTATTCGAGCCATACAGGAAGAAAGCATATACTACAACCTACTAAAAACAAAGTTTCCGACCATCATGAAGGACTTTCTACCTGCAGAAATTAAACACGATACGACTCATCATATAGAGACAGTTGGTCCACCGGTCGTATCCAAAGCTCGGCGCTTATCtccaaaaaaacttaaagatgCTAAGAAAGAATTTGACTCTATGATAGCACAGAACATATGCCGCCCGTCCAAAAGCAATTGGGCCAGTCCCTTACACatggttttaaagaaaaatggagATTGGCGTCCATGTGGCGATTACAGAATGCTTAACGCCAAGACCATTCCAGACCGCTATCCCTTACCCCATATCCATGACATAACTCATGGATTagctaacaaaaaaattttctCTGCTTTGGACTTAACCAAGGCTTACCATCAAATACCTGTCGAACCAATAGATGTTCCTAAGACAGCGGTTATTACACCTTTTGGGCTATTCGAATTCGTTCGTATGCCATTTGGCCTCCGTAACGCTGGCCAATCGTTCCAAAGGTTTATACACTCCGCACTTCGAGGCCTAGACTTTGTATTCGTTTACATAGACGATGTTCTAGTTGCCTCTGAATCAGAACAAGAACATCTAATTCATCTCCAACAGGTATTTGAGCGTTTGCACCAGTACGGTATAGCTCTTAATGCCTCAAAATGTGTGTTCGGTAAACCAAGCTTATCATTCTTAGGTTACCATTTGTCCTACGCCTCAGATTTAGCTATAGGAGCAGCACTCAACCAAATTGAAGCAGATGGTGCTAGGCCTCTCGGTTTTTTCTCTAGCAAGCTTACTCCTACACAACAGCGATATAGCGCCTATGATAGAGAACTCTTAGCAGTATATTCCGccAAACTTGATAAATGCTCACCCAGACAATTGCGGTACCTAGATTACATTGGACAGTTCTCGACAGATCTACGATTTATCAAAGGCGAGGACAACATAGTAGCAGATGCGCTTTCAAGAATTCAAACGATATCAGTACCCTCAACAATAGACTTTGAAAAAATAGCAACAGACCAACAGGACGAAGATTTAACAGCAATTCTAACCGGGAAAACATCCCttacactagaattaaaacaaattccAGGTATCAAAACACCTTTGTATTGTTCTTTTGAAGGGAGTAGAATACGACCGTACATACCTAAAAGGTACAGGTTTGAAGTATTTTCACAAATTCACAACTTAGCCCATCCCGGACAAAAAACTACTTCTAAAATGGTAAGACAACGATACGTGTGGCCTAGTATAAACAGAGATTGCGCGATGTGGGCTAAAGCCTGTCAACAATGCCAACGATCTAAAATTCAACGGCACACAAAAACCCCAGTCTCCAATTTTCCTACAGACTCAGCAAGATTTGCCTCTGTCCACCTCGACATCGTGGGACCTTTACCATCATGCCAAGGATTTCGATACCTAGTAACTTGCATAGACCGCTTCACTCGATGGCCAGAAGCAATTCCAGTTCCAGATATCTCTGCAGAAACGGTTGCTTATGCCTTCTATGCACAGTGGATATCCAGGTTCGGAGTACCTACCAGAATAGTCACTGATCAAGGAAGACAATTCGAGTCTAACTTGTTCCAGCAACTAAGCCAATTACTCGGAGCACAAAAAACTAGGACAACAGGGTACCATCCGCAAGCTAATGGTATGGTAGAACGTTTCCATCGACAGCTTAAAGCAGCTTTAAAATGTCACGAAAAAAACTGGATGTACGCATTACCAGCAGTACTCCTAGGATTAAGGTCAGCTATCAAAGAGGAATTGAATATTTGCTCCGCAGAAATGGTGTACGGCACTACTCTCAGGTTACCAGGCGAACTGTTTGAAGAACATAAAAGCAAGATAGATGAAAGCGAATTTGTTACAAGGCTCAAAACAGCAATGCAAAAGTTAACGCCACTGCCGGCAGCACATCACAATAAATCAACACCATTTGTCCACAAAGATTTACATACATGCACCCACGTCTTCCTCAGAGACGATAGTGTAAAAAAGCCCTTACAACATCCATATACAGGACCCTACAAGGTAACTAGACGAGATAAAAAAACGTTTACTATCATGATAGGGAACCAAGACAAGGTGGTCTCTGCGGACCGACTAAAACCTGCATACACATCAACAATCAAAGAAACAGAAAACGAGCAGGAAAAAACACTAAAGACAAAGAAAGTTCATTTTCAAGAACTTTCTGAAAAAGGAGGAGGATCCCTGTAG
Protein Sequence: MTNVAMLVTGKSFTLTITVGSSPPQVATYIKAIKVTVDGPREPRSKTRQSGIGQNQSQVTMMTRSHRYGIESTGYHHHHQDMHGHNVRGEEEEELNHEEDYRRLTSPIHPCKPHSQGWVCRRTLGVKPTLIQAAKPTLTQPVKPSLIKDFYKGRITPAIDARDPDQDPNQIQTHGITQYAITIINLAKKQLNAPNLVLTRKTKEPFTSGGEPRGQIEPPMHLCTGADLSVIPAKNYRKRKPDPPFRIFAANGTGIKTYGDQLITVNLGLRRNFNWHFLVADVSYPILGADFLAYFGLIVDLKNKKIFDNLTNISTKAACYDGKPIGIRAIQEESIYYNLLKTKFPTIMKDFLPAEIKHDTTHHIETVGPPVVSKARRLSPKKLKDAKKEFDSMIAQNICRPSKSNWASPLHMVLKKNGDWRPCGDYRMLNAKTIPDRYPLPHIHDITHGLANKKIFSALDLTKAYHQIPVEPIDVPKTAVITPFGLFEFVRMPFGLRNAGQSFQRFIHSALRGLDFVFVYIDDVLVASESEQEHLIHLQQVFERLHQYGIALNASKCVFGKPSLSFLGYHLSYASDLAIGAALNQIEADGARPLGFFSSKLTPTQQRYSAYDRELLAVYSAKLDKCSPRQLRYLDYIGQFSTDLRFIKGEDNIVADALSRIQTISVPSTIDFEKIATDQQDEDLTAILTGKTSLTLELKQIPGIKTPLYCSFEGSRIRPYIPKRYRFEVFSQIHNLAHPGQKTTSKMVRQRYVWPSINRDCAMWAKACQQCQRSKIQRHTKTPVSNFPTDSARFASVHLDIVGPLPSCQGFRYLVTCIDRFTRWPEAIPVPDISAETVAYAFYAQWISRFGVPTRIVTDQGRQFESNLFQQLSQLLGAQKTRTTGYHPQANGMVERFHRQLKAALKCHEKNWMYALPAVLLGLRSAIKEELNICSAEMVYGTTLRLPGELFEEHKSKIDESEFVTRLKTAMQKLTPLPAAHHNKSTPFVHKDLHTCTHVFLRDDSVKKPLQHPYTGPYKVTRRDKKTFTIMIGNQDKVVSADRLKPAYTSTIKETENEQEKTLKTKKVHFQELSEKGGGSL*

Similar Transcription Factors

Sequence clustering based on sequence similarity using MMseqs2

100% Identity: -
90% Identity: -
80% Identity: -