Basic Information

Insect: Melanchra persicariae
Gene Symbol: -
Assembly: GCA_947386135.1
Location: OX376669.1:9262125-9268097[-]

Transcription Factor Domain

TF Family: MYB
Domain: Myb_DNA-binding domain
PFAM: PF00249
TF Group: Helix-turn-helix
Description: This family contains the DNA binding domains from Myb proteins, as well as the SANT domain family [1].
Hmmscan Out: # of c-Evalue i-Evalue score bias hmm coord from hmm coord to ali coord from ali coord to env coord from env coord to acc

1 7 0.16 1.6e+02 3.0 0.7 3 17 74 88 72 128 0.69

2 7 0.0046 4.6 7.9 0.0 21 44 344 368 334 370 0.87

3 7 0.039 39 4.9 0.2 13 43 432 467 417 470 0.70

4 7 0.0052 5.1 7.7 0.2 22 46 585 619 573 619 0.74

5 7 0.001 1 10.0 0.2 3 44 670 720 668 722 0.79

6 7 0.00047 0.46 11.1 0.2 13 42 851 887 836 891 0.81

7 7 0.039 39 4.9 0.2 3 15 1046 1058 1044 1106 0.69

#	of	c-Evalue	i-Evalue	score	bias	hmm coord from	hmm coord to	ali coord from	ali coord to	env coord from	env coord to	acc
1	7	0.16	1.6e+02	3.0	0.7	3	17	74	88	72	128	0.69
2	7	0.0046	4.6	7.9	0.0	21	44	344	368	334	370	0.87
3	7	0.039	39	4.9	0.2	13	43	432	467	417	470	0.70
4	7	0.0052	5.1	7.7	0.2	22	46	585	619	573	619	0.74
5	7	0.001	1	10.0	0.2	3	44	670	720	668	722	0.79
6	7	0.00047	0.46	11.1	0.2	13	42	851	887	836	891	0.81
7	7	0.039	39	4.9	0.2	3	15	1046	1058	1044	1106	0.69

Sequence Information

Coding Sequence: ATGGACGGCTCTATAGTGGTTAAAACTGAGATGGGGACTAATGGAGAAATACTGCTTTTCTATGTTGATGAAAATGGTGGCAATGAAGAAGGGGTGCTAACAACCGTTGAAAGTATAGAAAACCAATCAATACAACTGCAACAAGATAACTCCTTCATCATTCAAAACGTTGCAGGTGACTCCAATGAAATCAGTTTTGATCAGTCAGCGTTAACAGATCACTGGACCGAGGATGAAACTAAGAAACTCCTGGTCTTCTATAATGATAATAAACAGACTTTCATCAATGGTACAACAAAGAAGCAGCATCTATGGACTGTAGCATGCAAGACCATGATTATCGGTAAAAACCCAAACTCATGTGAAGCTCAACTGAACAGCTTACAAGCAAAGTATAACGAAATCTGTGGCCACATACAGAAGGGAGTCTACGTAAAATGGCCGTACTTCGAACTATGCCATCAAATATTCCATGATGAGACCCCCATGATTACAGTTGAAACCTTGAATACACCAGAGCCACAAATAATCAAAGTTCCCGCTTTAAAACAGAATTATGATAATGTAATGGTGGTTAAAAAGGTGAACAGCCGGGCAGCGGCTGATGAGAAAGTGGAAATGATGCTGAAGTTGTATCTCAAATACAAAAAAAACTTCCAGGCTGAGTATTGGAGACGTGGCATATGGGAGACCATTGCGTTAGAGATAGGTGAAGATGATGGAGAATACTGGCAAAAAAGATTCTTAAACTATAAGCAACATTACCTGAGATTGATAGACAAAAGACGAGAGAGCGGCTCCGAGGGTATCAACTGGCCTTACTTAGAATTATTCGACAAAATCTTTGAAGGTGATGAGGACTTCAATAGAAAATATCTGACCGAAGAGTACAGACAAATCGAAAACCAGGCAATATCTGAAGTTGAAGAGCCTCCATCTAAAGTTGTTGATTGGGACACCACTGAAATGACTGTATTAGTCAAATATTGTTTTGACTGCTTTGATGAATTTGAAGACAGAACCATACCCAACAATTTCCTTTGGACTGAAATTGGCCGTTTGTTAGACAAGACTGCTGAAGCTTGCAAATCAAAGTACGAGGAACTGAAGAACGCACATCTAGACAAATACATAGAAGGTGGTTATGACTTGCGGACAAGGATACCCATCGCAATATTATTCGACAATATAATATCCAAAAATATTGAGAATAAAATAATGAAAAGTGGTAAAATACCTGAGCAACTAGAGATGTGGAAGACTGAGGAGCTAGATGAACTAGTACAATTCTTCTATGACAACATAGAGATGTATAAAGACCTGGTCTGTCATTTTGTATGCTGGGCCGGTGTAACCAAAAAGTTGAAGCGAAATCTGCAAAGTTGCCGAAGCCAATGGGAGGATCTTGTAAGCTTGTATAAGACAATATTGAATGATAAAAAAGAGAATCCTGATATGCAGATAGATTGGAGGTACATTGAAGTGTTTGATAGGATCTTTGACTACGGCATGGATACAAACTTGCTTTCTGGGTATGAAACTCTGAAAGGATTTGGACAGAATCAGAGAAAAGAAAATTCAGGGAAAATTGGTGTAAAAAAGGTCAACATTAAACTGGACGACACCATGGAAGAATTTACCGATGATGATGATGAGTCCTACGATGAACGAGGCTTCACGAAACGCACTAAAAGACGTTCTGGAGACTCCAAAGCTTTCAAAATCCTCGAATACTACCAGAAAAACAAAGACAAGTTCTCTACCACAAATAGGAACAAACATTCCCTGTGGGACATACTGGCCAAACAGATAGGCATATCGGCTACACAATGCGCACACCGATTCAGAAACTTGAAACAAGTCTACACGGCTTACGTTCAAAGAGAAATCATCAAACCTGAAATGCCAATCCTCTGGCCATATTACGCACTTTGCAAGAAAGTTTTTGGTTACAGAGCGATCAAATCTAAACTCAAAAATGGAAAATTGGATTCGGATGACAGCGAAGACTGGTCAGCAAAAGAAATCAAACAATTAATAAACTATTTCTCTCATAACTTTGATGATATAAACATTAATATAGAAGACACTACAAGATGGTCGGACTTAGCTGGTGAAATAGGTAAAGGGGAGAATTCTTGCAAAGAGAAGCTTCTGGAACTCCGGAAGTCTTATAGAAAGTTGAAAACTATGAGGAGTAGGAACCCTGATGTGAAGATTTCTTGGAAGTATTTCAATATGTTTGAAGATATTTACAATGCCAAGGAGAATGGTGTGGAGACAATCGAGGTGGATGATAGTGAGACCACGTATATGGAGATAACTGCGTCAGATGATAGGGTTGAGCAAGAAGAAGACGACTACCAATGCATCATAGTAATACCAGAAGGGCAAGACATATCACAGATCGAGAACGCCCGAATTATAATCAAAGATAACTCAATGCCTCAAGTAGAAGAAATTATCCAAACAGAACCTGAACCTCCCAAGGAAGTCAGACCACTTCCAAAATGGACGAAAAGAACTAAAAAGAGGTTGCTTATATTCTATATAAACTACATCCGATCGCATAAAGGGAAGGAAATTAACTCCAAAGAAATGTGGGCGGAAATTGCATTAAAAATACCCAACAAATCACCACTTGCATGTAGAAAAATGTTCGCCAAACTCAAGGCTAATCATAAACAAATTGATAAGTCTAATCCTGATATGAAGAAAACCCCTTATTTTGCATTAATGGAGAAAGTCATGCGTTTAAAACCAAAATTTACAAAAACGGAACAAAGTAAGGAGTTAAAAGACGGAAAAGTATACAAAGATGTTGTCTTGCCCGAAGAAAAAGTGGTTCAAGCCTTGCAGTACTATTTAGAAAACATTGAGGACTTTGTTAGTCCAAGATTTGAGAAAAAATACCTGTGGACTGAACTTGCAAATTACGTTTGTGAGCCAATAACTAAAGTCTTCAACAAAATCAACTATTTAAAACAGGCTTACAACATGGATACGGACGAAATAGCCGGAGTAAAGACTCCATTTGCTGAATACTTGAAAGAAATTTTCGCAAAAGAGATAGCAATCAAACTCTTTTTAGAAAATCAACCAAAACCTCTCATTGAAGAACCAGGTGTTGAGGAAACATGGTCTGATGAAGAGACGGAACAGTTGCTAGAATGGTATTTAAGTAATTTAGAAAAATTCAAGAACCCTAAATTCGTCAGAAGTTATCTCTGGATGGAAGTTTCTAGCATGTTAAATAAAAGTGCTATCACTTGTTCCAAGAAAATGTCAGAAATTCGGACCCAATACAGGAATATGGTGAGGGAAAGACCTGAAGAATTGAATGAGTGGAGGTTCCTTGATCTGTGTCAGAAGATATATGGAACGGGAAAGAAAGGTACCCCAATGAATTGTAATTAA
Protein Sequence: MDGSIVVKTEMGTNGEILLFYVDENGGNEEGVLTTVESIENQSIQLQQDNSFIIQNVAGDSNEISFDQSALTDHWTEDETKKLLVFYNDNKQTFINGTTKKQHLWTVACKTMIIGKNPNSCEAQLNSLQAKYNEICGHIQKGVYVKWPYFELCHQIFHDETPMITVETLNTPEPQIIKVPALKQNYDNVMVVKKVNSRAAADEKVEMMLKLYLKYKKNFQAEYWRRGIWETIALEIGEDDGEYWQKRFLNYKQHYLRLIDKRRESGSEGINWPYLELFDKIFEGDEDFNRKYLTEEYRQIENQAISEVEEPPSKVVDWDTTEMTVLVKYCFDCFDEFEDRTIPNNFLWTEIGRLLDKTAEACKSKYEELKNAHLDKYIEGGYDLRTRIPIAILFDNIISKNIENKIMKSGKIPEQLEMWKTEELDELVQFFYDNIEMYKDLVCHFVCWAGVTKKLKRNLQSCRSQWEDLVSLYKTILNDKKENPDMQIDWRYIEVFDRIFDYGMDTNLLSGYETLKGFGQNQRKENSGKIGVKKVNIKLDDTMEEFTDDDDESYDERGFTKRTKRRSGDSKAFKILEYYQKNKDKFSTTNRNKHSLWDILAKQIGISATQCAHRFRNLKQVYTAYVQREIIKPEMPILWPYYALCKKVFGYRAIKSKLKNGKLDSDDSEDWSAKEIKQLINYFSHNFDDININIEDTTRWSDLAGEIGKGENSCKEKLLELRKSYRKLKTMRSRNPDVKISWKYFNMFEDIYNAKENGVETIEVDDSETTYMEITASDDRVEQEEDDYQCIIVIPEGQDISQIENARIIIKDNSMPQVEEIIQTEPEPPKEVRPLPKWTKRTKKRLLIFYINYIRSHKGKEINSKEMWAEIALKIPNKSPLACRKMFAKLKANHKQIDKSNPDMKKTPYFALMEKVMRLKPKFTKTEQSKELKDGKVYKDVVLPEEKVVQALQYYLENIEDFVSPRFEKKYLWTELANYVCEPITKVFNKINYLKQAYNMDTDEIAGVKTPFAEYLKEIFAKEIAIKLFLENQPKPLIEEPGVEETWSDEETEQLLEWYLSNLEKFKNPKFVRSYLWMEVSSMLNKSAITCSKKMSEIRTQYRNMVRERPEELNEWRFLDLCQKIYGTGKKGTPMNCN

Similar Transcription Factors

Sequence clustering based on sequence similarity using MMseqs2

100% Identity: iTF_00771874;
90% Identity: iTF_00851758;
80% Identity: -