Basic Information

Insect: Yponomeuta rorrellus
Gene Symbol: -
Assembly: GCA_947308005.1
Location: OX371019.1:8041624-8049474[-]

Transcription Factor Domain

TF Family: MYB
Domain: Myb_DNA-binding domain
PFAM: PF00249
TF Group: Helix-turn-helix
Description: This family contains the DNA binding domains from Myb proteins, as well as the SANT domain family [1].
Hmmscan Out: # of c-Evalue i-Evalue score bias hmm coord from hmm coord to ali coord from ali coord to env coord from env coord to acc

1 7 0.69 1e+03 0.5 0.0 30 44 115 129 75 131 0.78

2 7 2.3 3.4e+03 -1.2 0.0 23 45 361 382 356 383 0.87

3 7 0.021 31 5.3 0.1 2 40 432 479 431 484 0.66

4 7 0.0045 6.7 7.5 0.1 23 46 605 627 584 627 0.88

5 7 8e-06 0.012 16.3 0.1 1 45 676 729 676 730 0.88

6 7 0.00087 1.3 9.8 0.1 22 42 856 878 842 882 0.79

7 7 1.9 2.9e+03 -1.0 0.3 3 13 1028 1038 1026 1046 0.90

#	of	c-Evalue	i-Evalue	score	bias	hmm coord from	hmm coord to	ali coord from	ali coord to	env coord from	env coord to	acc
1	7	0.69	1e+03	0.5	0.0	30	44	115	129	75	131	0.78
2	7	2.3	3.4e+03	-1.2	0.0	23	45	361	382	356	383	0.87
3	7	0.021	31	5.3	0.1	2	40	432	479	431	484	0.66
4	7	0.0045	6.7	7.5	0.1	23	46	605	627	584	627	0.88
5	7	8e-06	0.012	16.3	0.1	1	45	676	729	676	730	0.88
6	7	0.00087	1.3	9.8	0.1	22	42	856	878	842	882	0.79
7	7	1.9	2.9e+03	-1.0	0.3	3	13	1028	1038	1026	1046	0.90

Sequence Information

Coding Sequence: ATGGAGCAAGTTGTGGTTAAATCAGAAATGCAGTCAAATGAAGAGATTTTGCTTTTCTATGTGGACGAAAACGGCTACAATGAGGATGGAGTTATAACAGCAACAGCAAACATAGAACAGTTGACAGAAGACTCCATTCAACAGACTGTCTATATTGAAGAAAACCCTGATGAGTCCGACAATGATGATGACCTGATCCAACCAGATGCCAACGAAGAGGAGGTTGAGTGGACCAAGTACGATTCACAACGGCTCCTAACATTCTATGCTGATAATCGAGAAACCTTTATCTCTGGCTCTACTAAGAGGAAATTCCTATGGTCCGTTGCATGCAAGACAATGTTGATGGGTAAAACGCCTTACTCTTGTGAGGTCCACTTGAATGAACTGATGAGAAAGTATGCACAAGCTCTGATAGATGAGAGGAATGGTGTGACAGGCAGTTGGCAGACCTGGCCGCTGCTAAGTATGGCGCAGCAAGTTTTCCATGACGACAGTACCTTGGAGGGAGTCATAGAACAGTTAAACTCACAGCAAGAGATTATAGTGCCTGAAATGACCACTGCAAATGAAGTTGAAAATATTGTAAATGTTAAAAGGGTCAACGCGTCACGGTCAACTGCTGACCAGAATGTTGTCAATATGCTGACGCTATATCTCAAACATAAGAATTCATTGAAAAACTTGCAAAAGGACTTCTGGCAGCGAGGGCTTTGGGAGACCATTGCTTTGGAACTGGGTAATGAAGAGGATGCAGAGTACTGGCACAAACGGTTCCTAAATTTTAAGCATAACTACATTCGCCTCCTTGAGAAACGCAAGGCGGAGGGCGCTGGGGGCATCAATTGGCCATACATGGATTTGTTTGACCAAATATTTGCCAATGATGAGGAGTTCCAACGCAAATACAAGTCACCCACTGTACAGATTTTGTCCAACCAAATTGTGGAAATTGAACATAACATCTCTATTAACACAGATACAGACATCTGGAATAGTGCCGAATTGACCGTGCTAGTCAAGTACTACTATGACTGCTTTGATGAGTTCCAAGACCCGACAATACCAAAGAAGTTCCTGTGGAATGAAGTAGGCCGTTTGCTGGACAAAAACGCTGAAGTGTGCAAAGCTAAATATGAGAGTCTAAAAAGCGAACACATTGCTAAGTACATCAGTGAAAGCTATGATATTGTCAACCGCATACCCGTGGAAATACTCTTTGATAACATAATTTGCAAGGAGACTGAAATAGAAATGTGTAAATCATACAGTCCGAAGAAAACTGGCCAAACGGGGCAGTGGACTACTGAAGAGCTCGATGCATTGGTTCAGTTTATTTGCAACTGCGTAGAAATGTTTAAAGATCCCATTTGTTACTTTGTATGCTGGGCCGTTGTAGCGTACAAATTGAAAAAAAGTATCCTAGATTGTCGGCAACAGTTGGAGGAACTAGTAACTCTGTATAAGACTATCTTGGCTGATAAAAAGGAGAATCCCGACATGCAAATTGATTGGAGGTACATTGACTTGTTCGACAGAATCTATGATTATGGAATGGATGAGAATTTGCTGGCTGGTTATGACAATTTGAAGCCGAAAGAGTCGAATTTTGAAAATAATGCAACATCAGCCAAATCATCCACCAATGCTGGCAAGTTAAACCAAAACAACGAGTTCGATGACAACGGTCCCGATGACGAAGATTTCGACGAGAGTGGTTTCACGAAGTCTTCACGTAAAGCCTTCAAGATCCTGGAATTCTACCAAAAGAACAAGTTGAAATTCACAACGACCAAGAAGCAGTCGTCGCTGTGGTCCGTACTCGGCAAAGAGTTGTCCCTAACGGCAACTCAGTGTGCCCACCGCTTCAGAAACCTCAAACAAGTCTACGTACAATACGTCCAAAGGGAGATCAACAAACCGGACAAGCCTATAACGTGGCCGTACTACCAACTCTGCAAAAAGGTCTTCGGTTACAGGGAACTGAGAAACAAACTCAAGAGCAGAAACTTCGACCCCAACGATAAAGAAGACTGGTCTTCCACTGACATAAACCAGCTGATAGCGTACTTCGCCAAGCATTACAATGAAATCACAGAGAACTCCCACGAGCTGAACCTATGGGCGGAGTTGTCGAGCGAGATTGGACGATCACCGAACGCCTGTCGTGACAAGTTCCTCGAATTAAGGAAGTCGTACAGGAAACTGAAGACTATGAAGACGAGGAATCCGTCGGTGAAAGTGAACTGGAAGTACTTCACGACTTTCGATGAGTTGTACCAGTACGCATCGGTAGGCGGGTTGGAAGGCTACGAAGCCATGGAGGTAGATGAGGACGTTAGTAAGGGCCTGCAAGAAGATGACGACATCCAGTGCATATTCGTAATCCCAGAGGGTCAAGACGTGAACGACCTTAACAACCTATCCGCAATGAACGAAGAAAAGACAGAAGTAACCTCTGAACCCGCCAAAGTCCCCGTCAAATGGAACAAACAAAGCAAGAAACGTCTTCTATTCCTATATTTGAACTACATCAAGGCACACAGATTCACGGAAATCAGTCGTAATGAGATGTGGAAAGAGATTGCGTCGAAGTTCCAGAATAAATCCACTCTGTCGTGTAGAAAAATGTTCGCGAAACTCAAAAAGATGAGACTCGCAGCGAATGACGACGAAGTTAAAAAACAGACTCCATACTACGCTCTGCTCGAGAAAATCGTAGCTCTCAACCCGAAGTTTAAGAAGAACACTCCGAAAAACGACGACGCCTTGATAGAAGAAACAACGTGTAAAGACGTGCCAATGTCCACTGAAAACGTGCAGAAAGCTTTAGAGTTCTACTTGGAAAACGTCGAAGAGTTCGTCAGTCCGCGTTTCGAGAAGAAATACGCTTGGAATAACCTTTCCAAAGCCATCGGGGAGCCACTAAACAAGGTGTTTAACAAGGTAAACTATTTGAAGAACAACATTGAAGAGAACTCCCCTTTCATTGACATTCTAAGACAAATAGAAGCGAAAGAAAATGCTATTAAAGTCCACACGGGAAATGACGAAAGTAAGGTCTCCGATGAGACGGAAACTGCTTGGTCTGACAGTGAAACTGAGCAACTACTCATCTGGTATCTAGCTAACCTGGACAAGTTTAAAAATCCCAAGTTTGTCCGCAAGTATCTATGGATTGAGTCAGCCAATATACTATCCAAAACACCCCTAGCTTGCTCAAAGAAAATGTCCGAAATAAGAACGGAGTACAGGAATATGGTTCGCGAGAAACCTGACGAATTGAATGGGTGGAAGTTCTACGAATTGTGCCAAAAGATTTACGGTACTGGTAAACAGAAGGCCTCGGAAACAGGCCAAGAGTAA
Protein Sequence: MEQVVVKSEMQSNEEILLFYVDENGYNEDGVITATANIEQLTEDSIQQTVYIEENPDESDNDDDLIQPDANEEEVEWTKYDSQRLLTFYADNRETFISGSTKRKFLWSVACKTMLMGKTPYSCEVHLNELMRKYAQALIDERNGVTGSWQTWPLLSMAQQVFHDDSTLEGVIEQLNSQQEIIVPEMTTANEVENIVNVKRVNASRSTADQNVVNMLTLYLKHKNSLKNLQKDFWQRGLWETIALELGNEEDAEYWHKRFLNFKHNYIRLLEKRKAEGAGGINWPYMDLFDQIFANDEEFQRKYKSPTVQILSNQIVEIEHNISINTDTDIWNSAELTVLVKYYYDCFDEFQDPTIPKKFLWNEVGRLLDKNAEVCKAKYESLKSEHIAKYISESYDIVNRIPVEILFDNIICKETEIEMCKSYSPKKTGQTGQWTTEELDALVQFICNCVEMFKDPICYFVCWAVVAYKLKKSILDCRQQLEELVTLYKTILADKKENPDMQIDWRYIDLFDRIYDYGMDENLLAGYDNLKPKESNFENNATSAKSSTNAGKLNQNNEFDDNGPDDEDFDESGFTKSSRKAFKILEFYQKNKLKFTTTKKQSSLWSVLGKELSLTATQCAHRFRNLKQVYVQYVQREINKPDKPITWPYYQLCKKVFGYRELRNKLKSRNFDPNDKEDWSSTDINQLIAYFAKHYNEITENSHELNLWAELSSEIGRSPNACRDKFLELRKSYRKLKTMKTRNPSVKVNWKYFTTFDELYQYASVGGLEGYEAMEVDEDVSKGLQEDDDIQCIFVIPEGQDVNDLNNLSAMNEEKTEVTSEPAKVPVKWNKQSKKRLLFLYLNYIKAHRFTEISRNEMWKEIASKFQNKSTLSCRKMFAKLKKMRLAANDDEVKKQTPYYALLEKIVALNPKFKKNTPKNDDALIEETTCKDVPMSTENVQKALEFYLENVEEFVSPRFEKKYAWNNLSKAIGEPLNKVFNKVNYLKNNIEENSPFIDILRQIEAKENAIKVHTGNDESKVSDETETAWSDSETEQLLIWYLANLDKFKNPKFVRKYLWIESANILSKTPLACSKKMSEIRTEYRNMVREKPDELNGWKFYELCQKIYGTGKQKASETGQE

Similar Transcription Factors

Sequence clustering based on sequence similarity using MMseqs2

100% Identity: iTF_01545708;
90% Identity: iTF_01544836;
80% Identity: -