Basic Information

Insect: Yponomeuta cagnagella
Gene Symbol: -
Assembly: GCA_947310995.1
Location: OX371292.1:8150148-8157585[-]

Transcription Factor Domain

TF Family: MYB
Domain: Myb_DNA-binding domain
PFAM: PF00249
TF Group: Helix-turn-helix
Description: This family contains the DNA binding domains from Myb proteins, as well as the SANT domain family [1].
Hmmscan Out: # of c-Evalue i-Evalue score bias hmm coord from hmm coord to ali coord from ali coord to env coord from env coord to acc

1 7 0.73 1e+03 0.5 0.0 30 44 115 129 75 131 0.78

2 7 1.5 2.1e+03 -0.5 0.0 23 45 361 382 356 383 0.87

3 7 0.022 31 5.3 0.1 2 40 432 479 431 484 0.66

4 7 0.0048 6.6 7.5 0.1 23 46 605 627 584 627 0.88

5 7 8.4e-06 0.012 16.3 0.1 1 45 676 729 676 730 0.88

6 7 0.00092 1.3 9.8 0.1 22 42 856 878 842 882 0.79

7 7 2 2.8e+03 -1.0 0.3 3 13 1028 1038 1026 1046 0.90

#	of	c-Evalue	i-Evalue	score	bias	hmm coord from	hmm coord to	ali coord from	ali coord to	env coord from	env coord to	acc
1	7	0.73	1e+03	0.5	0.0	30	44	115	129	75	131	0.78
2	7	1.5	2.1e+03	-0.5	0.0	23	45	361	382	356	383	0.87
3	7	0.022	31	5.3	0.1	2	40	432	479	431	484	0.66
4	7	0.0048	6.6	7.5	0.1	23	46	605	627	584	627	0.88
5	7	8.4e-06	0.012	16.3	0.1	1	45	676	729	676	730	0.88
6	7	0.00092	1.3	9.8	0.1	22	42	856	878	842	882	0.79
7	7	2	2.8e+03	-1.0	0.3	3	13	1028	1038	1026	1046	0.90

Sequence Information

Coding Sequence: ATGGAGCAAGTTGTGGTTAAATCAGAAATGCAGTCAAATGAAGAGATTTTGCTTTTCTATGTGGACGAAAACGGCTACAATGAGGATGGAGTTATAACAGCAACAGCAAACATAGAACAGTTGACAGAAGACTCCATTCAACAGACTGTCTATATTGAAGAAAACCCTGATGAGTCCGACAATGATGATGACCTGATCCAACCAGATGCCAACGAAGAGGAGGTTGAGTGGACCAAGTACGATTCACAACGGCTCCTAACATTCTATGCTGATAATCGAGAAACCTTTATCTCAGGCTCTACTAAGAGGAAATTCCTATGGTCCGTTGCATGCAAGACAATGTTGATGGGTAAAACGCCTTACTCTTGTGAGGTCCACTTGAATGAACTGATGAGAAAGTATGCACAAGCTCTGATAGATGAGAGGAATGGTGTGACAGGCAGCTGGCAGACCTGGCCGCTGCTAAGTATGGCGCAGCAAGTTTTCCATGAAGACAGTACCTTGGAGGGAGTCATAGAACAGTTAAACTCACAGCAAGAGATTATAGTGCCTGAAATGACCACTGCAAATGAAGTTGAAAATATTGTAAATGTTAAAAGGGTCAATGCGTCACGGTCAACTGCTGACCAGAATGTTGTCAATATGCTGACGCTATATCTCAAACATAAGAATTCATTGAAAAACTTGCAAAAGGACTTCTGGCAGCGAGGGCTTTGGGAGACCATTGCTTTGGAACTGGGTAATGAAGAGGATGCAGAGTACTGGCACAAACGGTTCCTAAATTTTAAGCATAACTACATTCGCCTCCTTGAGAAACGCAAGGCGGAGGGCGCTGGGGGCATCAATTGGCCATACATGGATTTGTTTGACCAAATATTTGCCAATGATGAGGAGTTCCAACGCAAATACAAGTCACCCACTGTACAGATTTTGTCCAACCAAATTGTGGAAATTGAACATAACATCTCTATTAACACAGATACAGACATCTGGAATAGTGCCGAATTGACCGTGCTAGTCAAGTACTACTATGACTGCTTCGATGAGTTCCAAGACCCGACAATACCAAAGAAGTTCCTGTGGAATGAAGTAGGCCGTTTGCTGGACAAAAACCCTGAAGTGTGCAAAGCTAAATATGAGAGTCTAAAAAGCGAACACATTGCTAAGTACATCAGTGAAAGCTATGATATTGTCAACCGCATACCCGTGGAAATACTCTTTGATAACATAATTTGCAAGGAGACTGAAATAGAAATGTGTAAATCATACAGTCCGAAGAAAACTGGCCAAACGGGGCAGTGGACTACTGAAGAGCTTGATGCATTGGTTCAGTTTATTTGCAACTGCGTAGAAATGTTTAAAGATCCCATTTGTTACTTTGTATGCTGGGCCGTTGTAGCGTACAAATTGAAAAAAAGTATCCTAGATTGTCGGCAACAGTTGGAGGAACTAGTAACTCTGTATAAGACTATCTTGGCTGATAAAAAGGAGAATCCCGACATGCAAATTGATTGGAGGTACATTGACTTGTTCGACAGAATCTATGATTATGGAATGGATGAGAATTTGCTGGCTGGTTATGACAATTTGAAGCCGAAAGAGTCGAATTTTGAAAATAATGCAACATCAGCCAAATCATCCACCAATGCTGGCAAGTTAAACCAAAACAACGAGTTCGATGACAACGGTCCCGATGACGAAGATTTCGACGAGAGTGGTTTCACGAAGTCTTCACGTAAAGCCTTCAAGATCCTGGAATTCTACCAAAAGAACAAGTTGAAATTCACAACGACCAAGAAGCAGTCGTCGCTGTGGTCCGTACTCGGCAAAGAGTTGTCCCTAACGGCAACTCAGTGTGCCCACCGCTTCAGAAACCTCAAACAAGTCTACGTACAATACGTCCAAAGGGAGATCAACAAACCGGACAAGCCTATAACGTGGCCGTACTACCAACTCTGCAAAAAGGTCTTCGGTTACAGGGAACTGAGAAACAAACTCAAGAGCAGAAACTTCGACCCCAACGATAAAGAAGACTGGTCTTCCACTGACATAAATCAGCTGATAGCGTACTTCGCCAAGCATTACAATGAAATCACAGAGAACTCCCACGAGCTGAACCTATGGGCGGAGTTGTCGAGCGAGATTGGACGATCACCGAACGCCTGTCGTGACAAGTTCCTCGAATTAAGGAAGTCGTACAGGAAACTGAAGACTATGAAGACGAGGAATCCGTCGGTGAAAGTGAACTGGAAGTACTTCACGACTTTCGATGAGTTGTACCAGTACGCATCGGTAGGCGGGTTGGAAGGCTACGAAGCCATGGAGGTAGATGAGGACGTTAGTAAGGGCCTGCAAGAAGATGACGACATCCAGTGCATATTCGTAATCCCAGAGGGTCAAGACGTGAACGACCTTAACAACCTATCCGCAATGAACGAAGAAAAGACAGAAGTAACCTCTGAACCCGCCAAAGTCCCCGTCAAATGGAACAAACAAAGCAAGAAACGTCTTCTATTCCTATATTTGAACTACATCAAGGCACACAGATTCACGGAAATCAGTCGTAATGAGATGTGGAAAGAGATTGCGTCGAAGTTCCAGAATAAATCCACTCTGTCGTGTAGAAAAATGTTCGCGAAACTCAAAAAGATGAGACTCGCAGCGAATGACGACGAAGTTATAAAACAGACTCCATACTACGCTCTGCTCGAGAAAATCGTAGCTCTCAACCCGAAGTTTAAGAAGAACACTCCGAAAAACGACGACGCCTTGATAGAAGAAACAACGTGTAAAGACGTGCCAATGTCCACTGAAAACGTGCAGAAAGCTTTAGAGTTCTACTTGGAAAACGTCGAAGAGTTCGTCAGTCCGCGTTTCGAGAAGAAATACGCTTGGAATAACCTTTCCAAAGCCATCGGGGAGCCACTAAACAAGGTGTTTAACAAGGTAAACTATTTGAAGAACAACATTGAAGAGAACTCCCCTTTCATTGACATTTTAAGACAAATAGAAGCGAAAGAAAATGCTATTAAAGTCCACACGGGAAATGACGAAAGTAAGGTCTCCGATGAGACGGAAACTGCTTGGTCTGACAGTGAAACTGAGCAACTACTCATCTGGTATCTAGCTAACCTGGACAAGTTTAAAAATCCCAAGTTTGTCCGCAAGTATCTATGGATTGAGTCAGCCAATATACTATCCAAAACACCCCTAGCTTGCTCAAAGAAAATGTCCGAAATAAGAACGGAGTACAGGAATATGGTTCGCGAGAAACCTGACGAATTGAATGGGTGGAAGTTCTACGAATTGTGCCAAAAGATTTACGGTACTGGTAAACAGAAGGCCTCGGAAACAGGCCAAGAGTAA
Protein Sequence: MEQVVVKSEMQSNEEILLFYVDENGYNEDGVITATANIEQLTEDSIQQTVYIEENPDESDNDDDLIQPDANEEEVEWTKYDSQRLLTFYADNRETFISGSTKRKFLWSVACKTMLMGKTPYSCEVHLNELMRKYAQALIDERNGVTGSWQTWPLLSMAQQVFHEDSTLEGVIEQLNSQQEIIVPEMTTANEVENIVNVKRVNASRSTADQNVVNMLTLYLKHKNSLKNLQKDFWQRGLWETIALELGNEEDAEYWHKRFLNFKHNYIRLLEKRKAEGAGGINWPYMDLFDQIFANDEEFQRKYKSPTVQILSNQIVEIEHNISINTDTDIWNSAELTVLVKYYYDCFDEFQDPTIPKKFLWNEVGRLLDKNPEVCKAKYESLKSEHIAKYISESYDIVNRIPVEILFDNIICKETEIEMCKSYSPKKTGQTGQWTTEELDALVQFICNCVEMFKDPICYFVCWAVVAYKLKKSILDCRQQLEELVTLYKTILADKKENPDMQIDWRYIDLFDRIYDYGMDENLLAGYDNLKPKESNFENNATSAKSSTNAGKLNQNNEFDDNGPDDEDFDESGFTKSSRKAFKILEFYQKNKLKFTTTKKQSSLWSVLGKELSLTATQCAHRFRNLKQVYVQYVQREINKPDKPITWPYYQLCKKVFGYRELRNKLKSRNFDPNDKEDWSSTDINQLIAYFAKHYNEITENSHELNLWAELSSEIGRSPNACRDKFLELRKSYRKLKTMKTRNPSVKVNWKYFTTFDELYQYASVGGLEGYEAMEVDEDVSKGLQEDDDIQCIFVIPEGQDVNDLNNLSAMNEEKTEVTSEPAKVPVKWNKQSKKRLLFLYLNYIKAHRFTEISRNEMWKEIASKFQNKSTLSCRKMFAKLKKMRLAANDDEVIKQTPYYALLEKIVALNPKFKKNTPKNDDALIEETTCKDVPMSTENVQKALEFYLENVEEFVSPRFEKKYAWNNLSKAIGEPLNKVFNKVNYLKNNIEENSPFIDILRQIEAKENAIKVHTGNDESKVSDETETAWSDSETEQLLIWYLANLDKFKNPKFVRKYLWIESANILSKTPLACSKKMSEIRTEYRNMVREKPDELNGWKFYELCQKIYGTGKQKASETGQE

Similar Transcription Factors

Sequence clustering based on sequence similarity using MMseqs2

100% Identity: iTF_01545708;
90% Identity: iTF_01544836;
80% Identity: -