Basic Information

Insect: Ditula angustiorana
Gene Symbol: APOD_1
Assembly: GCA_963691745.1
Location: OY829489.1:10806947-10827181[-]

Transcription Factor Domain

TF Family: CBF
Domain: CBF_beta domain
PFAM: PF02312
TF Group: Beta-Scaffold Factors
Description: Core binding factor (CBF) is a heterodimeric transcription factor essential for genetic regulation of hematopoiesis and osteogenesis. The beta subunit enhances DNA-binding ability of the alpha subunit in vitro, and has been show to have a structure related to the OB fold [1].
Hmmscan Out: # of c-Evalue i-Evalue score bias hmm coord from hmm coord to ali coord from ali coord to env coord from env coord to acc

1 3 0.00021 3 8.2 0.0 57 117 299 359 288 397 0.81

2 3 0.0025 36 4.6 0.0 62 113 668 719 655 758 0.82

3 3 0.00041 6.1 7.2 0.0 62 130 1032 1100 1019 1127 0.76

#	of	c-Evalue	i-Evalue	score	hmm coord from	hmm coord to	ali coord from	ali coord to	env coord from	env coord to	acc
1	3	0.00021	3	8.2	57	117	299	359	288	397	0.81
2	3	0.0025	36	4.6	62	113	668	719	655	758	0.82
3	3	0.00041	6.1	7.2	62	130	1032	1100	1019	1127	0.76

Sequence Information

Coding Sequence: ATGAAGGAGAACGGGTCCGTGACCTCCAACGGTGTTCCTTACTTCTCTTCGATCGGCTACGGCTGCGCCTTGGAAGCAGCAAATTCGTTCGATACCCCTGCAACATTGACAGCAGCCAATAACGCACTCTCAGAAATCGGCATCACAGTCAGTGAATTGACGAGCGTCGATCATTCGACCGACGCGTGCACGGCGCTCCCTGTTATTGGTGCCGGACAGCCTGTGATCCTACCTGGCCAGTGCAGCACTACAGTTCCAGTTATCCAAAACTTCCAAGTTGGCGATTTCGTAGGAACATGGTACGAGATCTCCAGCTACTATTCAGAAAATGCGGTTGGAACCTGCGCCAGGGCAGACTATACCCTCGTGGGCACAACAGTCAATGTTGTGAACAGCCAAGTCCTGAACGGTCGTTTAGATACCATCACTGGGACAGCCACCCTAATAGGAACCGACGGAGCTGGCAGATTAAACGTAGTTTTAAACGTCAATGGTGTGCCAGTGACACAAGAACTCCTGATTCTTGACACCAACTACAATGGATATGCCGTATCGTACACTTGCGTCAATTTAGCAAATAACCAAAGAAGAGTTAACAGCTGGATCCTTAGCAGGACGCAAACAATTTCTGCAGCATCTCAAACAGAAGTCGACAGGGTTATCAACTCGCTCTTGGACCTCAATACTGAATACTACCAAACTACTGACCAAAGTACTGATGGTTGCTTCTACTTCCCTGTACCTGAATTTGGCAGACCTGTTATCTTCCCTGGACAGTGTGATACAACTGTGGCTGCTGTCCCTGCCTTTAACCTGGCTCAGTTCATTGGCACATGGCATGAAGTCCAGACTTATCCTAAAGAGGAACAAACCGGCTCTTGTGTGAACCACGTTTTCACAACTAGCACCACCGCTAACACTCTCAACCTGGAATCAAATCAAGTTATCAACCAACTTGCTACTTCGGCCAGTGGTAACGTTGCCTTTGAGAGCACCGATGGAAGTGGCAGACTAAGACTGACTATGACCGTTAAtggtttaaCTATTAATTTCCCATATTGGATTCTGGCAACTGATTACAACAGTTATGCATTGGTCTACAGCTGCGTGAATAGAGCAGATAATACCAGAGCAGTCTACAGCTGGAAACTCAGCAGGGCCCAGACGCTCCCAGATGCAGCTAACACCCCCATCAATACCGCTATAGCAGCTGTTCAAGTCTTGGATAATCAATACTATGAGGCTGTTGACCAATCAGATGCCGGGTGCTTCTATTACCCAGTGTACACGCCTGGCGTGCCAGTTGTGTTCCCAGGGCAATGTGACCAGAATATTCCTGTTCAAGCTAACTTTGATCCAACAAGAtACACTGCCTTATGGCATGACATTGAGTCCTACCCGTCCACCTTCCAACAAGGAACTTGTAACAATGCCTTCTACACCCTCACGCCGCAAGGCACTGTCGATGTTTTCAACACCCAAGTTGTGAACCAGCGCTTGGACACAATGTCGGGCGTCGCTATCATACCGGATCCTACTCAGCCTGCCAAATTGATCgtcagttttccgatagcaggAACCGATCAAGTAACTTCGACCAACTATTGGGTTTTGGCAACGGATTACGACACATACTCTCTGGTTTACACTTGCGAAAACCTTGCAAACAACCAAAGGGCTGTGTTCAGTTGGAAACTGGGTAGGAGTAAAGCGGCCTTTTCGGCTGCTGCCAACCAAGCCATGAATACCGTGATCAACACCATAGACGTATTGGACAGCCGGTACTTCGCTACCCGTGACCAAACTGCTGCTGGCTGTTTCTACTTCCCAGAACCTGAAGCTGGCAGACCTGTGATCTTCCCTGGTCAGTGTGACGAAACTGTCGCTGCTGTGCCTGCCTTTACTATGGCTCAGTTTGTAGGCACTTGGCATGAAGTCCAAACTTATCCTAAAGAGGAACAAACCGGCTCTTGTGTGAACCACGATTTCACAACTGGCACCACCGCTAACACTCTCAACCTCGTGTCAAATCAAGTTATCAACCAACTTGCTACTTCGGCCAGTGGTAACGTCGCCTTTGAGAGCACCGATGGAAGTGGCAGATTAAGACTCACTATGACAGTAAAtggtttaaATATTAATTTCCCGTATTGGGTTCTGGCAACTGATTACAGCAGTTATGCGTTGGTCTACAGCTGTGTGAATAGAGCGGATGATACCAGAGCAGTCTACAGCTGGAAACTCAGCAGGACCCAGACGCTCCCAGAGGCAGCTAACGCGCCCATCAATACTGCTATAGCAGCTGTTCAAGTCTTGGATAATCAATACTACGAGGCTGTTGACCAATCAGCTGCTGGGTGCTTCTACTACCCAGTGTACACGCCTGGCGTGCCAGTTGTGTTCCCAGGACAATGTGACCAGAATATTCCTGTTCAAGCTAACTTTGATCCAACAAGAtACACTGACTTATGGCATGACATTGAGTCCTACCCGTCCACCTTCCAACAAGGATCTTGTAACAATGCCTTCTACACCCTCACACCGCAAGGCACTGTCGATGTTTTCAACACCCAAGTTGTGAACCAGCGCTTGGACACAATGTCGGGCGTCGCTGTCATACCGGATCCTACTCAGCCTGCCAAATTGATCGTCAGTTTTCCCATAGCAGGAACCGATCAAGTAACTTCGACCAACTATTGGGTTTTGGCAACGGATTACGACACATACTCTCTGGTTTACACTTGCGAAAACATTTCAATCAACCAAAGGGCTGTGTTCAGTTGGAAACTGGGTAGGAGTAAAGCGGCCTTTTCGGCTGCTGCCAACCAAGCCATGAATGCCGTGATCAACACCATAGACGTATTGGACAGCCGGTACTTCGCTACCCGTGACCAAACTGCTGCTGGCTGCTTCTACTTCCCAGAACCTGAAGCTGGCAGACCTGTGATCTTCCCTGGACAGTGTGACGAAACTGTCGCTGCTGTTCCTGCCTTCACTATGGGACAGTTTGTAGGCACATGGCATGAAGTCCAGACATATCCCAAAGAACAGCAAACGGGCACTTGTGTGAACCACGATTTCACTACTGGCACCACCGCTAACACTCTCAATCTCGTGTCTAATCAAGTGATCAACCAAATTGCCAATTCCGCCAGTGGTAACGTAGCTTTTGAGTCCACCGATGGAAGCGGCAGACTGCGCCTCAGTATGACCGTTAATGGTTTAGCTATTAATTTCCCGTATTGGATCCTGGCAACTGATTACAATAGTTATGCCTTAGTCTACAGCTGCATGAATAGAGCGGATGATACCAGAGcagTCTACAGCTGGAAACTCAGCAGAACCCAAACACTCCCGGAGGCCGCTAACACGCCCATCAATAACGCAATAGCAGCTGTTCAAGTCTTGGATAACGAATACTACGAAGCTGTTAATCAGTCCGCGGCTGCCTGCTTGGCATACCCCGACATCCCCGCTGGTGACCCAATCATCCTGCAGGGACAGTGTGGAACCGTTACGCCCGTGACTAACTTCCAATCTACCCAATTCGCCGGTAGTTGGTACGAGGCAGCGCGTTACGCGTCTGCTCGTCAAAGTGGAGACTGTGCTGCTAGCCAGTTCACCCCTAGTGGCCAGAACGGGTTCACACTGAGTCAAACCATCATCTACGAAGAGAGGCTCACTGTCGTTTCTGGTCCTGTGACACTGCCTGCTGACAATTCTGGAATACTTACTGCCACCCTGTCTGATGGAGCCGGTCTTTCATACACTGTTACGATCTACGTTTTGGATGTTGACTACCAAGATTTTGCGTTGTTGTACAGCTGCGAGAACATAGAAGGCACCACTAACAGGCAAATCTTCAGCTGGAAACTCAGCAGATCTCAAGCCGGACTCTCTCAAGCGGCTAACGACAGGATAGCTCAAGTGGTCGCAAACAATGTCGACCTTCTGGAAAACTACTACCAAACTACTGGACAAACCGACAACGACTGCTTCTATTACCCAGAATTTACTGAAACCCCTGAATCTATTGTTCTTCCTGGAGCCTGCCCAGCTATTGCTGCCAAACCTAACTTCTCTCCCGCTGATTACCTTGGCAACTGGTATGACGTAGCTAGCTACCCTATCGCATCGCAGTTCGGTACTTGCTCACGCGCAGAGTACACTCTCGTTGACGGCGTCATCACAATCCGCAACACCATGGTCGTCGATGGAGAGCTCAGAACACAAACAGGAATAGCTCGACTTACCTCGGCCGGCACTGGAATCCTCGCAGTCAcctttgtgttggaaaatggaTTGGAGGTCGTCTCTACATACTACATCCTTGAAACTGACTACACTAGTTTCTCCTTAGTTTACAACTGCCGTAACCTAGCGGATGGAACAAGACAAGTGACCAgttggaaactcagcagaacGCCAACTCTCACACCCGAGGCGAATACCATTATTAACAACATCGTCAGCAACACTCAGGGTCTCCTGGAAGAGTACTACATACCAACCAGCCAATCTGACCAGGATTGCTTCTACGTACCACAACTGGAGTCTGGACAGTCAGTGCTATTCAGAGGAGCTTGCACACCACCCACTACGCAGGCACAATTTAACGTCAACCAGTATCTAGGCTGGTGGCACGAAATGGAAAGGTACCCAAGCGATGACTTCCCCGGCCAGTGTTCCAGCGCCAACATTTTCCAAGCAGCCAACGCAATCCAAGTGGTGGATATCAGTGTGAGCGATGGATTAGTCAATGAGACTGTCAGCACCGCGACCATCAGTGCTGATGGTACCATAACGATCGTGAGGGATGGAGTTACAGTTGtctgGTACGTGCTTTCTACGGACTATACATCTTACTCACTTGTGTACTCCTGCGAAAACGTTGAAACTGGATGGGGCACTTACAGACGAGTATGGAGTGCGAAGCACAGTAAACTCCGAGCGCTGTCGGCAGCGGACAACACCGCCATAAACGCTGTTATGGCAGGAAATATCCTGCTGCACCAACAACTCTTCGAGGAAGTCGACCAGTCAGACTTGGCCTGCTTCCACTACAGAGATGATGCTAGCGAGCAAGTTATCTTACCTGGACAGTGCGACCCTCAAATCCCTGTTCAGTCAGGATTTGACATGGCTCGGTTCGCGAACACATGGTACCAGATTGAACGTTACCCCTACCCACAAGTCAGTAACGAGGGTACGTGCGTCGGTGCCCGATACACTGTCAACGGAGATAGTGTTAGAGTACTTAACTGGGAGGTGTTGGGAGGAACCCTCAACACCATTGAGGGGACAGCGACGGTAGACGCTGCCACTGCTACTTTGCAAGTTACGCTTCCCCAAGAAGGCAGCGAAGCAACCACTACAATGGCACTTCGAGTTTTGCTCACGGATTACGACAACTATGCCCTTTTGTACACCTGCGTCAATATCAATGCATTCCAAAGATCAGTCGGTGCATTCAAGGTCAGCCGTGGCAGGACATTGTCTAACGATGCCCAATACGCGATTGAAAACTACATGAACACAAGACAAGAGTTACACGAACCATACTTCATTTCCATCTCTCAAAATGACCAGTGTCTGGAGCCAAGCTCTGCCCTACTCGTCAAGAGCAGTATTATTGTAATTCTAGTCTGTGTTATACTACAGTTAGTCATGTAA
Protein Sequence: MKENGSVTSNGVPYFSSIGYGCALEAANSFDTPATLTAANNALSEIGITVSELTSVDHSTDACTALPVIGAGQPVILPGQCSTTVPVIQNFQVGDFVGTWYEISSYYSENAVGTCARADYTLVGTTVNVVNSQVLNGRLDTITGTATLIGTDGAGRLNVVLNVNGVPVTQELLILDTNYNGYAVSYTCVNLANNQRRVNSWILSRTQTISAASQTEVDRVINSLLDLNTEYYQTTDQSTDGCFYFPVPEFGRPVIFPGQCDTTVAAVPAFNLAQFIGTWHEVQTYPKEEQTGSCVNHVFTTSTTANTLNLESNQVINQLATSASGNVAFESTDGSGRLRLTMTVNGLTINFPYWILATDYNSYALVYSCVNRADNTRAVYSWKLSRAQTLPDAANTPINTAIAAVQVLDNQYYEAVDQSDAGCFYYPVYTPGVPVVFPGQCDQNIPVQANFDPTRYTALWHDIESYPSTFQQGTCNNAFYTLTPQGTVDVFNTQVVNQRLDTMSGVAIIPDPTQPAKLIVSFPIAGTDQVTSTNYWVLATDYDTYSLVYTCENLANNQRAVFSWKLGRSKAAFSAAANQAMNTVINTIDVLDSRYFATRDQTAAGCFYFPEPEAGRPVIFPGQCDETVAAVPAFTMAQFVGTWHEVQTYPKEEQTGSCVNHDFTTGTTANTLNLVSNQVINQLATSASGNVAFESTDGSGRLRLTMTVNGLNINFPYWVLATDYSSYALVYSCVNRADDTRAVYSWKLSRTQTLPEAANAPINTAIAAVQVLDNQYYEAVDQSAAGCFYYPVYTPGVPVVFPGQCDQNIPVQANFDPTRYTDLWHDIESYPSTFQQGSCNNAFYTLTPQGTVDVFNTQVVNQRLDTMSGVAVIPDPTQPAKLIVSFPIAGTDQVTSTNYWVLATDYDTYSLVYTCENISINQRAVFSWKLGRSKAAFSAAANQAMNAVINTIDVLDSRYFATRDQTAAGCFYFPEPEAGRPVIFPGQCDETVAAVPAFTMGQFVGTWHEVQTYPKEQQTGTCVNHDFTTGTTANTLNLVSNQVINQIANSASGNVAFESTDGSGRLRLSMTVNGLAINFPYWILATDYNSYALVYSCMNRADDTRAVYSWKLSRTQTLPEAANTPINNAIAAVQVLDNEYYEAVNQSAAACLAYPDIPAGDPIILQGQCGTVTPVTNFQSTQFAGSWYEAARYASARQSGDCAASQFTPSGQNGFTLSQTIIYEERLTVVSGPVTLPADNSGILTATLSDGAGLSYTVTIYVLDVDYQDFALLYSCENIEGTTNRQIFSWKLSRSQAGLSQAANDRIAQVVANNVDLLENYYQTTGQTDNDCFYYPEFTETPESIVLPGACPAIAAKPNFSPADYLGNWYDVASYPIASQFGTCSRAEYTLVDGVITIRNTMVVDGELRTQTGIARLTSAGTGILAVTFVLENGLEVVSTYYILETDYTSFSLVYNCRNLADGTRQVTSWKLSRTPTLTPEANTIINNIVSNTQGLLEEYYIPTSQSDQDCFYVPQLESGQSVLFRGACTPPTTQAQFNVNQYLGWWHEMERYPSDDFPGQCSSANIFQAANAIQVVDISVSDGLVNETVSTATISADGTITIVRDGVTVVWYVLSTDYTSYSLVYSCENVETGWGTYRRVWSAKHSKLRALSAADNTAINAVMAGNILLHQQLFEEVDQSDLACFHYRDDASEQVILPGQCDPQIPVQSGFDMARFANTWYQIERYPYPQVSNEGTCVGARYTVNGDSVRVLNWEVLGGTLNTIEGTATVDAATATLQVTLPQEGSEATTTMALRVLLTDYDNYALLYTCVNINAFQRSVGAFKVSRGRTLSNDAQYAIENYMNTRQELHEPYFISISQNDQCLEPSSALLVKSSIIVILVCVILQLVM

Similar Transcription Factors

Sequence clustering based on sequence similarity using MMseqs2

100% Identity: -
90% Identity: -
80% Identity: -