Basic Information

Insect: Thalpophila matura
Gene Symbol: -
Assembly: GCA_948465475.1
Location: OX419201.1:4612497-4618568[+]

Transcription Factor Domain

TF Family: MYB
Domain: Myb_DNA-binding domain
PFAM: PF00249
TF Group: Helix-turn-helix
Description: This family contains the DNA binding domains from Myb proteins, as well as the SANT domain family [1].
Hmmscan Out: # of c-Evalue i-Evalue score bias hmm coord from hmm coord to ali coord from ali coord to env coord from env coord to acc

1 7 0.17 1.9e+02 2.6 0.4 2 14 71 83 70 126 0.85

2 7 0.042 46 4.6 0.0 21 44 345 369 335 371 0.86

3 7 0.0012 1.4 9.5 0.3 12 43 432 468 419 471 0.70

4 7 0.0026 2.8 8.5 0.2 22 46 592 618 573 618 0.81

5 7 7.1e-05 0.078 13.4 0.1 3 45 669 720 667 721 0.80

6 7 0.00067 0.73 10.3 0.1 4 42 916 965 914 969 0.75

7 7 0.042 46 4.6 0.1 3 15 1124 1136 1122 1183 0.78

#	of	c-Evalue	i-Evalue	score	bias	hmm coord from	hmm coord to	ali coord from	ali coord to	env coord from	env coord to	acc
1	7	0.17	1.9e+02	2.6	0.4	2	14	71	83	70	126	0.85
2	7	0.042	46	4.6	0.0	21	44	345	369	335	371	0.86
3	7	0.0012	1.4	9.5	0.3	12	43	432	468	419	471	0.70
4	7	0.0026	2.8	8.5	0.2	22	46	592	618	573	618	0.81
5	7	7.1e-05	0.078	13.4	0.1	3	45	669	720	667	721	0.80
6	7	0.00067	0.73	10.3	0.1	4	42	916	965	914	969	0.75
7	7	0.042	46	4.6	0.1	3	15	1124	1136	1122	1183	0.78

Sequence Information

Coding Sequence: ATGGATTCAATAGTAGTGAAAACTGAAATGCAAAGCAATGGAGAAATCTTGCTTTTCTATGTGGATGAAAATGGTGGCAATGAAGAAGGGGTACTAACAACAGTTGAAAGCATAGAAAACCAAGCAATACAACTTCAGCAGGATAACTCTTACATCATTCCAGATGTTGGAGATGACTGCGAAATGAGCGTTGACCACTCAGTGCTAACAGAGAACTGGACTGAGGATGAAACCAAAAGACTTCTCGTATTCTACAATGATAATAAACAGACTTTTATATCTGGAACAACTAAGAAGAAACACCTCTGGACTGTAGCATGTAAAACCATGCTTGTTGGTAGAAACCCAACCTCATGTGAAGCTAAACTGAACAGTTTGCAAGCAAAGTACACTGAAATTTGTGGACACATACAGAAAGGTGTCTACGTAAAGTGGCCATACTTTGAACTATGCCATCAAATATTCCACGATGACCATGATTCGACACCCGTGGTTACTGTTGAAACATTGAACACACCAGAACCTCAAATTGTCAAAGTTCCAGCTTTAAAACAGAATTTTGATAGTGTAATGGTGGTGAAGAAGGTGAATAGTCGGTCAACGGCCGATGAGAAAGTTGAAATGATGCTGAGGTTGTATCTGAAGTACAAGAAGAACTTCCAAGAAGAGTACTGGAGACGAGGAATATGGGAAACCATTGCTTTAGAGATAGGAGATAGTGATAATGGAGAATACTGGCAGAAACGGTTCCTGAACTACAAACAACATTATCTAAGGTTGATAGACAAAAGAAGACACAGCGGCTCAGAGGGCATCAACTGGCCATACATGGATTTATTTGATAAAATATTCGAAGGTGATGAAGATTTTCATAGAAAATATCTGAATGACGAATACAAACTAATTGAAAATCAGGCAATTGCCGAGGTTGAAGAGTCACCTAAAGTTGAAGATTGGGACAGCACTGAAATGACTGTATTAGTAAAATACTGCTTTGACTGTTTTGACGAATTTGAAGATCGGACAATACCCAACAATTTCCTATGGACTGAGATTGGCCGTTTACTGGACAAGACTGCTGATGCCTGCAAAGCGAAATATGAAGAACTAAAGAATGCACACTTAGACAAATACATCGAGGGTGGTTACGACTTACGTAACAGAAAACCTATAGCAATATTATTCGACAACATAATATCCAAAGAAATTGAAAATCATATTATTAAAGCTGGCAGAAAACCTGAGCAATTAGAGTTATGGAAGACAGAGGAATTGGATGAACTGGTGCAATTCTTCTATGAAAACATAGAGATGTATAAAGACCTGATATGTCACTTTGTGTGCTGGGCTGCTGTTGTTAAGAAGCTAAAAAGAAGCATGCAAAGTTGCAGGAGCCAGTGGGAAGATCTCGTAGGCCTTTATAGGACTATATTGGATGATAAAAAAGAAAATCCAGATATGCAGATCGACTGGCGGTATATAGAGTTGTTTGATAGGATATTTGACTACGGTATGGATACGAGCTTGCTATCTGGGTATGAAACTTTAAAAGGATTTGGACAAAGTCAGAAAACAGATACTGGGAAAATCGGTGTTAAAAAAGTGAACATCAAAACAGATGACGATATCGAAGAGTTCAGTGACGATGACGAGTCATATGACGAGCGAGGCTTCACAAAACGCACAAAACGACGCTCAGGAGACTCCAAAGCGTTTAAAATCCTGGAATTCTACCAGAAAAACAAAGACAAATTCTCCACAACAAATAGAAACAAGCACTCTTTATGGGAGTTACTTGCTAAACAGCTTAACATATCAGCTACACAGTGTGCACACCGATTCAGAAACTTGAAACAAGTTTACACAGCTTATGTCCAAAGAGAGATCAATAAACCAGAGATGCCTATCCTCTGGCCATACTACGCACTGTGCAAAAAAGTATTTGGCTACAGAGCAATCAAATCTAAGCTAAAAAACGGAAAACTAGATTCGGATGACAGCGAAGAATGGTCAGCAAAAGAAATAAAACAACTTATCAACTATTTCTCACGAAACTTTGACGATATCAACAATAGTTTGGATGACATAAGCAAATGGTCGGACTTATCTGGAGACATAGGGAAAAGTGAGAATTCTTGTAAAGAGAAGTTTCTAGAACTAAGGAAGTCTTATAGGAAACTTAATACTATGAGGAGTAGGAATCCTGATGTGAAGATTTCTTGGAAGTATTTTAATATGTTCGAAGATATCTATAATGCTAAAGAGAATGGTGTTCAGGAGACGATGGAGGTCGAAGATAATGAGAGGAGTTACATAGGCTCTGATGACAGGATGGAGGAACAAGAAGAAGACGACTACCAATGTATCATAGTCATACCAGAGGGACAAGATATATCACAAATCGAAAACGCTCAAATAATAATACAAGAACACCCGATACCCCAAGAAGACTTAACACCCCAAGAACACCCAATACCCCAAGAACACCTAATACCCCAAGAACACTTAATACCCCAAGAACACACAATACCCCAAGAACACACGATACTCCAAGTGCACCCTATACCCCAAGAACACCCAATACCCCAAGAACACCTAATACCCCAAGAACACTTAATACCCCAAGAACACACAATACCCCAAGAACACACAATACTCCAAGTGCACCCTATACCCCAAGAGCACCCAACACTCCAAGAAACTGTCAACCAAGATGCTCCAAAAGAGGTCAAACCTCTTGTTAAATGGACGAAACAAACTAAAAAGAGGCTACTTATCTTCTACATAAACTACATGAGGACACATAAAGGAAAGGAGATCAATGCCAAAGAGATGTGGGTAGACATAGCCTCCAAACTACCTAACAAAATGCCGCTGTCATGCAGAAAAATGTTTGCTAAACTCAAGGCAAATCACAAACAAATAGACGAATTGGATCCTAACATGAAGAAAACTCCTTATTTCACCCTGATGGAGAAAGTTATATGTCTAAAGCCCAAATTCACCAAAACTGAACAAAATAAGGCATTAAAAGACGGGAAAGTATATAAAGATGTAGCATTACCTGATTATAAAGTTGAACAAGCATTGCAGTACTATTTGGAGAACATAGAGGACTTTGCAAGCCCCAGATTTGAGAAAAAATACCTATGGACTGAGCTCGCCAATTTTATTTGTGAGCCTATAACAAAAGTTTTTAACAAAATCAACTTTTTAAAGCAATCTTATAACATTGAAACGGACGAGGTAGCAGGAGAAAAGACACCATTTGCAGATCTCCTTAAAGAAATTCTGGCTAAAGAGATAGCCATCAAACTTATCCTAGATCTACATCCAAAACCTGTGATTGAGGAACCAGGTGTTGAAGAGACCTGGTCAGATGAAGAGACGGAACAACTATTAGAGTGGTATCTAAGCAATTTGGATAAATTCAAGAACCCCAAATTCGTGAGAAGCTATTTATGGATGGAAATTTCTGGAATGTTAAACAAAAGTGCTATAACATGTTCGAAGAAGATGTCTGAAATACGGACGCAGTACAGGAATATGGTGAGGGAAAGACCTGAAGAACTGAATGAGTGGAGGTTCCTTGATCTGTGTCAGAAAATCTATGGGACTGGAAAGAAAGGGACTCCGACTCCAACGAGTAGCAACTAA
Protein Sequence: MDSIVVKTEMQSNGEILLFYVDENGGNEEGVLTTVESIENQAIQLQQDNSYIIPDVGDDCEMSVDHSVLTENWTEDETKRLLVFYNDNKQTFISGTTKKKHLWTVACKTMLVGRNPTSCEAKLNSLQAKYTEICGHIQKGVYVKWPYFELCHQIFHDDHDSTPVVTVETLNTPEPQIVKVPALKQNFDSVMVVKKVNSRSTADEKVEMMLRLYLKYKKNFQEEYWRRGIWETIALEIGDSDNGEYWQKRFLNYKQHYLRLIDKRRHSGSEGINWPYMDLFDKIFEGDEDFHRKYLNDEYKLIENQAIAEVEESPKVEDWDSTEMTVLVKYCFDCFDEFEDRTIPNNFLWTEIGRLLDKTADACKAKYEELKNAHLDKYIEGGYDLRNRKPIAILFDNIISKEIENHIIKAGRKPEQLELWKTEELDELVQFFYENIEMYKDLICHFVCWAAVVKKLKRSMQSCRSQWEDLVGLYRTILDDKKENPDMQIDWRYIELFDRIFDYGMDTSLLSGYETLKGFGQSQKTDTGKIGVKKVNIKTDDDIEEFSDDDESYDERGFTKRTKRRSGDSKAFKILEFYQKNKDKFSTTNRNKHSLWELLAKQLNISATQCAHRFRNLKQVYTAYVQREINKPEMPILWPYYALCKKVFGYRAIKSKLKNGKLDSDDSEEWSAKEIKQLINYFSRNFDDINNSLDDISKWSDLSGDIGKSENSCKEKFLELRKSYRKLNTMRSRNPDVKISWKYFNMFEDIYNAKENGVQETMEVEDNERSYIGSDDRMEEQEEDDYQCIIVIPEGQDISQIENAQIIIQEHPIPQEDLTPQEHPIPQEHLIPQEHLIPQEHTIPQEHTILQVHPIPQEHPIPQEHLIPQEHLIPQEHTIPQEHTILQVHPIPQEHPTLQETVNQDAPKEVKPLVKWTKQTKKRLLIFYINYMRTHKGKEINAKEMWVDIASKLPNKMPLSCRKMFAKLKANHKQIDELDPNMKKTPYFTLMEKVICLKPKFTKTEQNKALKDGKVYKDVALPDYKVEQALQYYLENIEDFASPRFEKKYLWTELANFICEPITKVFNKINFLKQSYNIETDEVAGEKTPFADLLKEILAKEIAIKLILDLHPKPVIEEPGVEETWSDEETEQLLEWYLSNLDKFKNPKFVRSYLWMEISGMLNKSAITCSKKMSEIRTQYRNMVRERPEELNEWRFLDLCQKIYGTGKKGTPTPTSSN

Similar Transcription Factors

Sequence clustering based on sequence similarity using MMseqs2

100% Identity: iTF_00771874;
90% Identity: -
80% Identity: -