Basic Information

Insect: Drosophila paulistorum
Gene Symbol: crm_1
Assembly: GCA_018152135.1
Location: JAECXG010000821.1:7303971-7307769[+]

Transcription Factor Domain

TF Family: MYB
Domain: Myb_DNA-binding domain
PFAM: PF00249
TF Group: Helix-turn-helix
Description: This family contains the DNA binding domains from Myb proteins, as well as the SANT domain family [1].
Hmmscan Out: # of c-Evalue i-Evalue score bias hmm coord from hmm coord to ali coord from ali coord to env coord from env coord to acc

1 2 4.1e-07 0.00046 20.3 0.1 2 44 153 210 152 212 0.94

2 2 0.25 2.8e+02 1.8 0.0 9 29 334 354 333 356 0.88

#	of	c-Evalue	i-Evalue	score	bias	hmm coord from	hmm coord to	ali coord from	ali coord to	env coord from	env coord to	acc
1	2	4.1e-07	0.00046	20.3	0.1	2	44	153	210	152	212	0.94
2	2	0.25	2.8e+02	1.8	0.0	9	29	334	354	333	356	0.88

Sequence Information

Coding Sequence: ATGGAAGAAATGTGTAAGAATGCAAAATCCCCAAGCCTTGGGGAGTCGGCCGATCCAGCCAATGTTGTTGCTCCAATTCCCCCTCCACCTGCCTCTCCCATGCCCACCGATGCCAACAGCAGTAATTCCAACCAGATAAATGGTAAACAAATGCCAGTACCAACACCACCACCAGCACCAGCCATACCAAATCCACCCGAAGAGGAGCTACTGGGTTCGGTTATAACCATCACTCACAATTGTCCGGGTACCCGTGCCAGTGCACGAGTCATTCAGAAAATGAAACTGGATCAGACACGGCCAATGACACCGCCACCATCGGAACGGGAGCATGGCGGCAAAAAGGATGACAAATCAAATCAAAAGACACCATCACAATTAAAGTCCGGCGGCGGTGCTGGTGGCGCTGGCAATGAAAACTCCCGTGGTGGCTCCGGTGGTCCCGGCAATGGCAAAACCACATGGACAAACATTGAACGTAATTGCTTCTTTGATGCGTTAAATGAATTTGGCAAGGACTTCGAATCGGTGGCCAATTGCATCAATGGCAAACTGAAACGTCGCAGCTCCTATAATAACGATAATTATAGCTTCAAGACCAAGGATCATGTGCGTCAGCATTATTATCAAACGTATCATAAAATCTGCAAATATGTTAGATATTCCGAAGAACTGAAAAAGCCCGCCCAGGAGCTCTATACATTGATCAATTATGGTGAAATGCGTCGCAAATTGCAATTCCTTACGGAGAAGCATTTCATGAAGCTAAAACATTTGGTCTATCATGGACAGATCACAGTGCGCTGCAAGGGCAAGAATATAAGGATTAAGACGCCATCATGCAAGGCTCTGCGACGACTCAATCAGTTAGATGATTCCTTGGAAGACATTCGTCTGCCAAGTAAAGTGGAAGTGCTTGTTACCCCATTGAATATGGAATCATTTGGTCGTGTCCAATCGTTGGCCCAGAATCCGCGAGGGCGTGTCATTGTGCCACTTCATAAGAAGCTAATCAGTTTCATTCAAACATTTGAATACAAATGGCGCAGCGTTAATCAGCGTTTGAANNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNCCGCCTCATCCACAACTGAGCCATCGCTTTGCTTTCAACCCAAGCCGGGAGTAGCCATACATCGGCCATTGTTAAATATTACGGCCTATTTGAACAGTGTTAACATTTGTTTAACCGCCTACGAGGAGCGACTGGGCGTTAAGGTGCGCAGCGAGACTCTGGGTAACATTGTGATGACCACAACGGCGGCCAATAAGCGTGCCCGCACCGAAAGTGGCTCCGATAAACGTTCACCAGATACTAAGAAGCCCAAATTATTGACCAGCCCCACTTTGGAGAAGTCAATCGATGAGGTTAATCCGGCATCAACTTCAACGACGACGGCGACGGCCGAGAATAATAATGTCAAGGTGGAGATTAGCAGCGGCGATGAGCTAAGCGAAGAGATTCATGAGTTTTTAAATGGAAGCATACAAGAAGTTGAGGCATCTGCTCCCGCTCCCGCTCCCACTCCTGCACCTCCTCCACCACCGACAACAACAACAACAACCACAACAACGATTTCTGCATCGCGAGCAAAGAGAAAAGAGGCCAAAGAGGCAGCTGCTGCGGCAGCTGCACGCAATTTTAAGCCTCTCCTCAGTGATGAGATAATAAAGCGCATACGCAAAGGTTGGACTGTCTCGAATGCAGCGGATATAACTGTTGGTGATTTGTATGTGGTTCTGGGTCAGGATTCGAAACTGGAACTTGATTATTATTGGTGTGAGCCTGCGCCGGCGCCGGCAGGAACAGCAACAGCAGCGGCATCATCGACCAATGAACAACAACAACATTCTGGCACATCGGCTACACCATCCTCCTCATCCTCAACTGCATCTGCATCTGCATCAACAACATCTCTCCCTTATAATACCAATGACTGTGATAGCGTGGAACGTGTCAAAGCGGTGACAACATCAACGGTTAGCAATAAGTTGAAACATCTTCTTCTAGTGGCCAATCTCAGCGAGCGTGTGCGCAAGCGTCAATGCAACTGTGGGCACATCTGTGATCGCAAACGGGATCTGATGAACAAAGCCCAGCAATTGGCAGCTGGTGGCATTAATGATGGTCATAATACACTATCATCTGCTGCTTCAACTGGCGATATAATCTTTCGTACTCCCATGTTACCAGTGCGCCGGCCCATAGCCAATATAATGGATCCAGTGCGTCAACTATCATCACTAACTCGTCAAAAGAACAATCGGCAAGTTTTGGTCCAACGACGAATACTGCCCCCAGCCACCATGGGGCGTCCCTACGATCATTTGCATGTGCGTCAGTTGCATAGCAGCCTCTTTGAGCCCATCTCCTCTTCGACTACCACAGCTGCGTCTGTCGGCTCAGCTGCGTCAGTGGCCAGCAAACCAAGCGACGAGGAGTCTACTTATGATGGTGATGGCTCAATTGTAGGTCGAGATATGCCAACTTTGGATTTCTGTGCGCCAACTCCATCATCTTCATCTATATNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNGCAGCCATACAGGATGAAACCACAAGCTCGACTGGCGAACATTTTTTCAATGGCAGCGTCAGTCCGATGCATCTGCTCAGAGACTCAACATCCAATGCCCGCTGGCTGGAGGAGAATATCAATGACTTTTCATTAACCAGTTTATTGGGTCACTTGGATGAAATCGATGCCACTAGAGACATATTGGATCCATCTTCCAGCATGTCGGTGATCAGTGAAAGTAGTGTGGATTTTCGTCACAAGTTCCAGGAGATTGCTGCCTTGTTGCAGCAACAGGAAAAGGAATAG
Protein Sequence: MEEMCKNAKSPSLGESADPANVVAPIPPPPASPMPTDANSSNSNQINGKQMPVPTPPPAPAIPNPPEEELLGSVITITHNCPGTRASARVIQKMKLDQTRPMTPPPSEREHGGKKDDKSNQKTPSQLKSGGGAGGAGNENSRGGSGGPGNGKTTWTNIERNCFFDALNEFGKDFESVANCINGKLKRRSSYNNDNYSFKTKDHVRQHYYQTYHKICKYVRYSEELKKPAQELYTLINYGEMRRKLQFLTEKHFMKLKHLVYHGQITVRCKGKNIRIKTPSCKALRRLNQLDDSLEDIRLPSKVEVLVTPLNMESFGRVQSLAQNPRGRVIVPLHKKLISFIQTFEYKWRSVNQRLXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXASSTTEPSLCFQPKPGVAIHRPLLNITAYLNSVNICLTAYEERLGVKVRSETLGNIVMTTTAANKRARTESGSDKRSPDTKKPKLLTSPTLEKSIDEVNPASTSTTTATAENNNVKVEISSGDELSEEIHEFLNGSIQEVEASAPAPAPTPAPPPPPTTTTTTTTTISASRAKRKEAKEAAAAAAARNFKPLLSDEIIKRIRKGWTVSNAADITVGDLYVVLGQDSKLELDYYWCEPAPAPAGTATAAASSTNEQQQHSGTSATPSSSSSTASASASTTSLPYNTNDCDSVERVKAVTTSTVSNKLKHLLLVANLSERVRKRQCNCGHICDRKRDLMNKAQQLAAGGINDGHNTLSSAASTGDIIFRTPMLPVRRPIANIMDPVRQLSSLTRQKNNRQVLVQRRILPPATMGRPYDHLHVRQLHSSLFEPISSSTTTAASVGSAASVASKPSDEESTYDGDGSIVGRDMPTLDFCAPTPSSSSIXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXAAIQDETTSSTGEHFFNGSVSPMHLLRDSTSNARWLEENINDFSLTSLLGHLDEIDATRDILDPSSSMSVISESSVDFRHKFQEIAALLQQQEKE

Similar Transcription Factors

Sequence clustering based on sequence similarity using MMseqs2

100% Identity: iTF_00612010;
90% Identity: iTF_00618335;
80% Identity: -