Basic Information

Insect: Colias croceus
Gene Symbol: -
Assembly: GCA_905220415.1
Location: HG991984.1:4383490-4388260[-]

Transcription Factor Domain

TF Family: MYB
Domain: Myb_DNA-binding domain
PFAM: PF00249
TF Group: Helix-turn-helix
Description: This family contains the DNA binding domains from Myb proteins, as well as the SANT domain family [1].
Hmmscan Out: # of c-Evalue i-Evalue score bias hmm coord from hmm coord to ali coord from ali coord to env coord from env coord to acc

1 5 1.4 1.8e+03 -0.5 0.0 23 33 227 237 216 244 0.81

2 5 0.022 29 5.3 0.3 22 44 435 456 424 458 0.92

3 5 0.02 27 5.4 0.1 23 45 581 602 558 603 0.86

4 5 3.1e-05 0.041 14.4 0.2 3 44 654 704 652 706 0.80

5 5 0.00048 0.63 10.6 0.0 17 41 826 857 817 862 0.77

#	of	c-Evalue	i-Evalue	score	bias	hmm coord from	hmm coord to	ali coord from	ali coord to	env coord from	env coord to	acc
1	5	1.4	1.8e+03	-0.5	0.0	23	33	227	237	216	244	0.81
2	5	0.022	29	5.3	0.3	22	44	435	456	424	458	0.92
3	5	0.02	27	5.4	0.1	23	45	581	602	558	603	0.86
4	5	3.1e-05	0.041	14.4	0.2	3	44	654	704	652	706	0.80
5	5	0.00048	0.63	10.6	0.0	17	41	826	857	817	862	0.77

Sequence Information

Coding Sequence: ATGGATATGGAACAAATTGTAATTAAAAGTGAAATTCAACCTAATGGAGACATTCTTTTGTTTTATGTGGATGAAAGTAATGATGTGTCCAATGCAGGCATTCTAGAGAGCGACCAGCAAGAAGATATTCAAATGCTTTCAGAAACTAAATATGTAATCGAAGACACAGGTGAGAGTGAATCAGCTGACGAACTTGACTTGGCGCAAGCAAGTGAACAGTTGGCCACAGAGCAGTGGCTAGATGAAGAGATTAGACGTCTAATTGTTTTCTATCTTGATAATAAAGAAACATTCCGCAGTGGTACTACAAAAAAGAAACATCTATGGACTGTCGCCTGTAAAACAATGCTGCTCGGTAAACAACCTCTTTCATGTGAGTATAAACTGCGCTCAATTAGAGATAAATATTATCAAATACATTTAGAAAAGCTAAAGGGAAAGAATATACAGTGGCAGTTTTATAATCTTTGCCACCAGGCCTTTCAGGATGAAAACCCTGTAGACCCTGTAGACTCATACCTAAATGTAACAGAAAGCAAGCCAGAGGTCATTGAAAATACAAATGAAAATAAAACCAATATAAGAAAGTCTTCAGCTGACGCTAATGTGGAAAAAATGTTGAGACTCTATTTGCAATACAAAACTTACCATTTAAGCAATGTTAACCAAAAGTCAGTTTGGGAAAAAATTGCATCTGACATGGGCGAGAAAGACGTGGACTATTGGCACAAACGTTTTTTGAACTTTAAGCAACATTATGTAAAAATGCTGTATAAAAGATTGGAGGTTGGAAGTGCAAGTGTAAGTTGGCCATACATGCACATCTTTGATGAAATATATGAAAATGATGAAGAATTTCAAAAGAAATTTTCTCCCAAACAGTTAACTCTTCAGGTAGATACAGTAGATAAAAATTCATGGAACACAACAGAAATAACATTCCTAGCTAAATATTATTATGACTGCTTTAAAGACTTTCAAGATCCCACAATACCTAATAGCTTTTTGTGGCATGAAGTTGGTCGCTTGCTGGATAAAAAGCCAGATTGTTGTATGGAGAAATTTCTAGAATTAAAAAATGCACATTTTGATAAACTTATTGAAGGTGGATATGACTTAACTGGTCGTGTTCCACTCGAAATAATATTGGACAATATAATTGCTAAAGAAACTCAAATAGAGTTGGATCAACCACGGAAAAGTTATTTCTCTGAAGATTGGCAAATGGAAAGACTCGATGTATTGGTGCAGTATATTTATGATAATATTAATATGGTCAAAGATCATGTATGTTATTATGTTTGTTGGGCAACAGTTGCTAAGAAATTAGGTTGCAGTGTTGTAGAATGTAGAAAGCAATGGGATAATTTGACTTCCTTGTATAAAACAATATTGGATGACAAAAAGGAAGACCCAGAAATGCAAATAGATTGGCGATATATAGATTTGTTTGATAGAATCTTTGATTACGGCATGGATGTTAATTTGTTGGCTGGATATGAGAAATCTAATAAACAACAAGCTGATTCAGGAAAAATTGGAGTTAAAAAAATCCATATTAAGGACTTTGATGATAAAGATAGGGACAATCACTCTGAAGATGAAGTGTCCTACGACGAAAGAGGCTTCACACTACGCTCTAAGCGACGAAGCGGTGATGCAAAGGCCTACAAAATACTAGAATATTACCTAAAAAACAAAGACAAGTTCACGTCAAGCAATTACAAAAAATTAATACTCTGGGAGGCGTTAGCAAAACAGATAGGCATGACAGCCGCAGAATGTGCACACAGGTTTAGGAACTTCAAACAAGTGTACACGAATTATATTCAAAGAGAAATTAATAAACCAGAAATGCCAATTATGTGGCCTTATTACGCTCTGTGCAAGAAAGTATTCGGATACAGAGCTATAAAGGCGAAACTTAAGAGCGGAAAAGCAGATTCTAGTGATAGCGAGGATTGGTCCCCGAAAGATATTAAAAAGTTAATTAATTATTTCGCAAATAATTTTAACAAACTCGATAATGACGTTGAAAACAAATCCAAATGGACCAACTTGGCTAATGAAATTGGCAGGACCGAGAATAGTTGTTCGGAGAAATTTATAGAGTTACGTAAATCGTATAGGAAGCTGAAGACAATGAAGGCTAATAATCCAGATGTAAAGGTATCATGGAAGTATTTTAATATTATGGATGAGATATATAACAATAATCAGAAGACTGAAGTTGAAGGTATGGAGATAGATGAAGAACAATACATGAATATTAAATCTGAAGTACCAGATGATGATGATTTTCAATGTATCATCGTAATACCTGAGGGAGGAGACATGAGTCAAGCACAATTTATATACCAGAAAAAAGACGAAGAGGAGGTTGTAGAAACTGAAGTAATCAAAATGTCAAACCCATCTAAAGTATGGAATAAACGATCAAAAACCCGACTGCTCATACAATACTTGAAGTATTTAAAATCGCACGAAAACCAAGAAATCAACCGAAACGATATGTGGACTGAGATAGCTAATAAAATGGACGACAAAACCCCTGCTGCGTGCAGAAAAATGTATCTTTTACTCAAAAGTCGCCATAAAAATGATCCTTCCGAATCTACTCCATATTACAAATTAATGCAGAAAATTTTAGCTCTAAAGCCGATATTAAAATTGAGGAAAAATAATGATTTAGAAGAAAAAAAGGTTTACAAAGATGTACCATTAGATGACAGCAAAGTGGAGCAAGCTTTGACATACTACTTGCGCAATTTAGAAGACTTCATCAACCCTAAATTTGAGAAGAAATATCTTTGGTCTGAATTGGCCACATATCTATCAGAACCTGTCAATGTGGTGTTTACTAAAATAAATTACTTGAAGCAATCATTCAAAAACGGCTTAGAAACACCAATTAGGGGTATTTTAGAAGAGATATTGATTAAGGAAAATGAACTGAGAGAGAATTTGCAAGATAGCAAGAATATATCTTCTGAAGATAATTTAGAAGAAACATGGACTGATATTGAAACGGAGCGGTTGTTAACGTGGTATTTGGCGCATTTGGATAAATTTAAGAATCCCAAGTTTGTCCGAAGTTATTTATGGATGGAGGCTTCAGATATTTTGAAGAAGAGTCCTTTAGTCTGTTCCAAGAAGATGATGGAAATAAGGTCGCAGTATCGGTCTATGGTGAGGGAGAGACCAGAAGAGTTAGAAGAGTGGAGGTTTTATAATCTGTGCCAGAGGATTTATGGTACAGGAAAGAAGAGTGTCAGTGAATAA
Protein Sequence: MDMEQIVIKSEIQPNGDILLFYVDESNDVSNAGILESDQQEDIQMLSETKYVIEDTGESESADELDLAQASEQLATEQWLDEEIRRLIVFYLDNKETFRSGTTKKKHLWTVACKTMLLGKQPLSCEYKLRSIRDKYYQIHLEKLKGKNIQWQFYNLCHQAFQDENPVDPVDSYLNVTESKPEVIENTNENKTNIRKSSADANVEKMLRLYLQYKTYHLSNVNQKSVWEKIASDMGEKDVDYWHKRFLNFKQHYVKMLYKRLEVGSASVSWPYMHIFDEIYENDEEFQKKFSPKQLTLQVDTVDKNSWNTTEITFLAKYYYDCFKDFQDPTIPNSFLWHEVGRLLDKKPDCCMEKFLELKNAHFDKLIEGGYDLTGRVPLEIILDNIIAKETQIELDQPRKSYFSEDWQMERLDVLVQYIYDNINMVKDHVCYYVCWATVAKKLGCSVVECRKQWDNLTSLYKTILDDKKEDPEMQIDWRYIDLFDRIFDYGMDVNLLAGYEKSNKQQADSGKIGVKKIHIKDFDDKDRDNHSEDEVSYDERGFTLRSKRRSGDAKAYKILEYYLKNKDKFTSSNYKKLILWEALAKQIGMTAAECAHRFRNFKQVYTNYIQREINKPEMPIMWPYYALCKKVFGYRAIKAKLKSGKADSSDSEDWSPKDIKKLINYFANNFNKLDNDVENKSKWTNLANEIGRTENSCSEKFIELRKSYRKLKTMKANNPDVKVSWKYFNIMDEIYNNNQKTEVEGMEIDEEQYMNIKSEVPDDDDFQCIIVIPEGGDMSQAQFIYQKKDEEEVVETEVIKMSNPSKVWNKRSKTRLLIQYLKYLKSHENQEINRNDMWTEIANKMDDKTPAACRKMYLLLKSRHKNDPSESTPYYKLMQKILALKPILKLRKNNDLEEKKVYKDVPLDDSKVEQALTYYLRNLEDFINPKFEKKYLWSELATYLSEPVNVVFTKINYLKQSFKNGLETPIRGILEEILIKENELRENLQDSKNISSEDNLEETWTDIETERLLTWYLAHLDKFKNPKFVRSYLWMEASDILKKSPLVCSKKMMEIRSQYRSMVRERPEELEEWRFYNLCQRIYGTGKKSVSE

Similar Transcription Factors

Sequence clustering based on sequence similarity using MMseqs2

100% Identity: iTF_00357446;
90% Identity: iTF_00357446;
80% Identity: -