Basic Information

Insect: Leucania comma
Gene Symbol: -
Assembly: GCA_958295575.1
Location: OY282488.1:6251409-6257554[+]

Transcription Factor Domain

TF Family: MYB
Domain: Myb_DNA-binding domain
PFAM: PF00249
TF Group: Helix-turn-helix
Description: This family contains the DNA binding domains from Myb proteins, as well as the SANT domain family [1].
Hmmscan Out: # of c-Evalue i-Evalue score bias hmm coord from hmm coord to ali coord from ali coord to env coord from env coord to acc

1 7 0.23 4e+02 2.4 0.5 3 17 74 88 72 129 0.69

2 7 0.0079 14 7.1 0.0 21 43 344 367 336 369 0.87

3 7 0.00067 1.2 10.5 1.0 17 45 436 469 417 470 0.66

4 7 0.0049 8.5 7.7 0.2 22 46 583 617 571 617 0.74

5 7 0.00089 1.5 10.1 0.1 3 43 668 717 666 720 0.83

6 7 7.3e-05 0.13 13.6 0.1 13 42 848 884 833 888 0.81

7 7 0.05 87 4.5 0.1 3 15 1043 1055 1041 1102 0.84

#	of	c-Evalue	i-Evalue	score	bias	hmm coord from	hmm coord to	ali coord from	ali coord to	env coord from	env coord to	acc
1	7	0.23	4e+02	2.4	0.5	3	17	74	88	72	129	0.69
2	7	0.0079	14	7.1	0.0	21	43	344	367	336	369	0.87
3	7	0.00067	1.2	10.5	1.0	17	45	436	469	417	470	0.66
4	7	0.0049	8.5	7.7	0.2	22	46	583	617	571	617	0.74
5	7	0.00089	1.5	10.1	0.1	3	43	668	717	666	720	0.83
6	7	7.3e-05	0.13	13.6	0.1	13	42	848	884	833	888	0.81
7	7	0.05	87	4.5	0.1	3	15	1043	1055	1041	1102	0.84

Sequence Information

Coding Sequence: atgGATGGCTCTATAGTGGTGAAAACTGAGATGGGGACGAATGGGGAAATACTGCTTTTCTATGTTGATGAAAACGGTGGCAATGAAGAAGGAGTCCTAACAACTGTAGAAAGCATAGAAAACCAATCAATACAATTGCAACAAGAAAACTCCTACATCATTCAAGAAGTTGGAGATGACTCCAATGAAATCACTACTGATCAATCAGTGGAAACTGATGACTGGACAGAAGATGAAACTAAAAGACTCCTGGTATTCTACAATGATAATAAAGGGGCTTTTATATCAGgaacaacaaagaaaaaacatctATGGACTGTGGCATGTAAAACCATGCTTGTTGGTAAAAACCCAAACTCGTGTGAAGCAAAACTCAACAGCTTACAAGCAAAGTATAATATAATCTGTGGCCACATACAGAAAGGGGTCTACGTAAAGTGGCCATACTTTGAACTGTGCCATCAAATATTTCACGATGAGACCCCTATGATTACGGTTGAAACCTTGAACACACCGGAACCACAAATAATCAAAGTTCCAGCAGTAAAACAGAATTTTGACAATGTGATGGTGGTTAAAAAGGTGAATAGTCGTTCTACGGCTGATGAGAAGGTTGAAATGATGCTGAAATTGTATTTGAAATACAAGAAGAACTTCCAAGCAGAGTATTGGCGACGTGGTATATGGGAAACTATTGCGTTAGAGATAGGAGAAGATGATGGAGAATACTGGCAGAAACGGTTCTTGAACTACAAGCAACATTACCTAAGATTGATTGATAAAAGACGGGAGAGTGGCTCAGAGGGCATCAACTGGCCTTACTTGGAACTTTTTGACAAAATCTTTGAAGGTGATGAAGAATTCCATAGGAAATATCTAACTGAGGAATACAGACTAATTGAAAACCAGGCGATCGCAGAAATTGAAGAACCTGCTCCTAAAGTTATAGATTGGGACACCACCGAAATGACCGTACTagtgaaatattgttttgattgcttTGACGAATTTGAAGATAAAACTATTCCCAACAATTTCCTTTGGACTGAAATTGGCCGTTTGCTTGACAAGACTGCTGAAGCTTGCAAATTGAAGTATGAAGAATTAGAGAATGAACATTTAGACAAATATATACAAGGTGGTTACGATTTGCGAACAAGGAAACCGATTGAAATATTGtttgataatataatatcaaaGAGAATCGAGAATCAGATAATGAAAAGTGGCAAAATACCTGAACAACTGGAAATGTGGAAGACTGAGGAATTAGATGAACTTGTGCAATACTTCTATGACAACATTGAGATGTATAAAGACCTTGTTTGCCATTTTGTATGCTGGGCAGGGGTTTCCAAGAAGCTGAAGAGAACTCTACAAAGCTGTAGAAGCCAATGGGAGGATCTTTTAATGCTATATAGGACCATATTGAATGATAAAAAAGAGAATCCTTATATGCAGATCGATTGGCGGTATATTGAAGTTTTTGACAGGATATTTGACTATGGCATGGATACCAGCCTGCTTTCTGGGTATGAAACCTTAAAAGGATTTGGACAGAATCAGAAAAATGATACAGGAAAGATTGGTGttaaaaaagtaaacataaAACTAGACGAGGCCATGGAAGAATTTTCCGACGATGATGAGTCGTACGACGAACGAGGCTTCACGAAACGCACCAAACGCCGTTCCGGAGACTCCAAAGCGTTCAAGATCCTTGAGTACTACCAGAAAAACAAGGACAAGTTCTCCACCACAAACAGGAACAAACACTCGCTATGGGACATACTAGCTAAACAAATTGGCATATCGGCTACACAATGTGCCCATCGATTCAGAAACTTAAAACAAGTTTACACTGCCTACGTTCagagagaaataaataaacctgaAATGCCAATCCTCTGGCCTTACTACGCGTTATGCAAAAAAGTTTTCGGTTATAGAGCAATAAAATCTAAACTCAAAAACGGAAAACTGGACTCGGATGACAGCGAGGACTGGTCAGCGAAAGAAATCAAACAATTAATAAACTATTTCTCTCAAAACTTTGATGACATAAACAGTAATATAGAAGACACAGCAAAATGGTCTGATCTGGCTGGTGAAATAGGAAAAGGTGAGAATTCCTGCAAAGAAAAGTTAATTGAACTCCGAAAGTCTTATAGGAAATTGAAAACTATGAGAAGTAGGAACCCTGAAGTTAAGATTTCTTGGAAATATTTCAATATGTTTGAAGATATTTATAATGCTAAGGAAAATGGTGTGGAGATAATGGAAGTGGATGATAGTGAGATGACTTATGTGGAGATACCAGCGAGTTCTGATGACAGGATTGAGCAGGAAGAAGACGATTACCAATGCATCATAGTAATCCCTGAAGGGCAAGATATTTCTCAGATAGAGAACGCTCGAATTATAATACAGGAAAACCCTACGCCTCAAGAGCAAGAAACGGTCCTCATAGAACCTTCCAAGGAGGTCCGACCACTTGTCAAATGGACGAAGAGAACTAAGAAGAGGTTGCTTATATTCTACATAAACTATATCCGAACACATAAAGGAAAGGAAATTAACCCCAAAGATATGTGGGCAGAAATAGCTGCAAAATTACCTGATAAAACACCACTAGCTTGTCGGAAAATGTTCGCCAAATTGAaggtaaatcataaaaaaattgacgaATTAGATCCTAATATGAAGAAGACCCCTTATTTCGCTTTACTCGAGAAAGTAATACGACTCAAACCGAAATTCACTAAAACCGAAAAAAACAAAGCATTAAAAGATGGAAAAATCTATAAAGATGTTGCTTTGCCTGATGAAAAAGTAGCACAAGCTTTGCAGTACTATTTAGAAAACATAGAGGATTTCGTAAGTCCAAGATTTGAAAAGAAATACCTCTGGACTGAACTAGCCAATTACGTTTCCGAACCTGTTACGAAGGTGTTCAAcaaaatcaattatttaaaacaagcaTATAACATGGATACAGATGAAGTAGCCGGCGAAAAGACGCCATTTGCAGAATACTTAAAAGAAATCTTCGCTAAAGAAATCGCCATCAAACTGTTCTTAGAGAATCAACCAAAACCAGTGATTGAAGAACCAGGCGTCGAGGAAACCTGGTCAGATGAAGAGACGGAACAGTTACTAGAATGGTATCTGAGCAATTTAGAAAAATTCAAGAACCCTAAATTTGTTAGAAGCTATCTCTGGATGGAAGTTTCAGGCATGCTAAATAAAAGTGCTATTACTTGTTCGAAGAAAATGTCTGAAATTCGGACGCAGTATAGGAATATGGTAAGAGAAAGACCAGAAGAATTGAATGAGTGGAGGTTCCTGGATTTGTGCCAGAAAATCTATGGGACTGGAAAGAAAGGCACCCCTCATGAATAG
Protein Sequence: MDGSIVVKTEMGTNGEILLFYVDENGGNEEGVLTTVESIENQSIQLQQENSYIIQEVGDDSNEITTDQSVETDDWTEDETKRLLVFYNDNKGAFISGTTKKKHLWTVACKTMLVGKNPNSCEAKLNSLQAKYNIICGHIQKGVYVKWPYFELCHQIFHDETPMITVETLNTPEPQIIKVPAVKQNFDNVMVVKKVNSRSTADEKVEMMLKLYLKYKKNFQAEYWRRGIWETIALEIGEDDGEYWQKRFLNYKQHYLRLIDKRRESGSEGINWPYLELFDKIFEGDEEFHRKYLTEEYRLIENQAIAEIEEPAPKVIDWDTTEMTVLVKYCFDCFDEFEDKTIPNNFLWTEIGRLLDKTAEACKLKYEELENEHLDKYIQGGYDLRTRKPIEILFDNIISKRIENQIMKSGKIPEQLEMWKTEELDELVQYFYDNIEMYKDLVCHFVCWAGVSKKLKRTLQSCRSQWEDLLMLYRTILNDKKENPYMQIDWRYIEVFDRIFDYGMDTSLLSGYETLKGFGQNQKNDTGKIGVKKVNIKLDEAMEEFSDDDESYDERGFTKRTKRRSGDSKAFKILEYYQKNKDKFSTTNRNKHSLWDILAKQIGISATQCAHRFRNLKQVYTAYVQREINKPEMPILWPYYALCKKVFGYRAIKSKLKNGKLDSDDSEDWSAKEIKQLINYFSQNFDDINSNIEDTAKWSDLAGEIGKGENSCKEKLIELRKSYRKLKTMRSRNPEVKISWKYFNMFEDIYNAKENGVEIMEVDDSEMTYVEIPASSDDRIEQEEDDYQCIIVIPEGQDISQIENARIIIQENPTPQEQETVLIEPSKEVRPLVKWTKRTKKRLLIFYINYIRTHKGKEINPKDMWAEIAAKLPDKTPLACRKMFAKLKVNHKKIDELDPNMKKTPYFALLEKVIRLKPKFTKTEKNKALKDGKIYKDVALPDEKVAQALQYYLENIEDFVSPRFEKKYLWTELANYVSEPVTKVFNKINYLKQAYNMDTDEVAGEKTPFAEYLKEIFAKEIAIKLFLENQPKPVIEEPGVEETWSDEETEQLLEWYLSNLEKFKNPKFVRSYLWMEVSGMLNKSAITCSKKMSEIRTQYRNMVRERPEELNEWRFLDLCQKIYGTGKKGTPHE

Similar Transcription Factors

Sequence clustering based on sequence similarity using MMseqs2

100% Identity: iTF_00771874;
90% Identity: iTF_00851758;
80% Identity: -