Basic Information

Insect: Cinara cedri
Gene Symbol: -
Assembly: GCA_902439185.1
Location: CABPRJ010002370.1:474302-485051[-]

Transcription Factor Domain

TF Family: MYB
Domain: Myb_DNA-binding domain
PFAM: PF00249
TF Group: Helix-turn-helix
Description: This family contains the DNA binding domains from Myb proteins, as well as the SANT domain family [1].
Hmmscan Out: # of c-Evalue i-Evalue score bias hmm coord from hmm coord to ali coord from ali coord to env coord from env coord to acc

1 8 3.8 4.1e+03 -1.9 0.0 23 43 139 160 135 163 0.84

2 8 0.097 1.1e+02 3.2 0.0 23 44 238 260 220 262 0.86

3 8 2.8 3.1e+03 -1.5 0.0 17 30 328 342 327 356 0.77

4 8 0.0076 8.3 6.7 0.0 23 41 591 609 585 613 0.89

5 8 0.051 55 4.1 0.0 22 43 658 681 650 682 0.79

6 8 5.4 5.9e+03 -2.4 0.0 23 30 736 743 721 744 0.73

7 8 0.8 8.7e+02 0.3 0.0 23 31 847 855 820 863 0.80

8 8 0.057 62 3.9 0.0 8 31 1018 1055 1016 1059 0.91

#	of	c-Evalue	i-Evalue	score	hmm coord from	hmm coord to	ali coord from	ali coord to	env coord from	env coord to	acc
1	8	3.8	4.1e+03	-1.9	23	43	139	160	135	163	0.84
2	8	0.097	1.1e+02	3.2	23	44	238	260	220	262	0.86
3	8	2.8	3.1e+03	-1.5	17	30	328	342	327	356	0.77
4	8	0.0076	8.3	6.7	23	41	591	609	585	613	0.89
5	8	0.051	55	4.1	22	43	658	681	650	682	0.79
6	8	5.4	5.9e+03	-2.4	23	30	736	743	721	744	0.73
7	8	0.8	8.7e+02	0.3	23	31	847	855	820	863	0.80
8	8	0.057	62	3.9	8	31	1018	1055	1016	1059	0.91

Sequence Information

Coding Sequence: ATGTCTACCAGAAGCATTTTTAAAACTGTGGAAGAAATGAATACATATAATAATCAATCAACCACTAAACATATTCATTCATCTACTTTAACAAAGCTTTCTGAGAAAACTACATTAGTGCCATCTACTTCATCCGTCCAGTCCAATCAAATATTCCTAATTAATAATGTTGAAGGTCAATCAATGTCCGGTATATTATTACCTTCTAATCATTTCATGGTGAAATTGAATCAAAATCAGTCACAAATTGAATCAGATACAGATGATTATATTGAGCGTGAAACAACTTCAAAATATTTTTCAATGAATAAGATTGAAAAGAAAATGTTTCGAGAAACATTTTTTTGTACGCTTCTCGATTTTATGCATCAAATTGTAAAGGATGGTCGTATTGTAAGTTCTTCTGACCCTATTTGGGATCGTGTTGCTTTAAAACTGGATAATATACTTAAGCCAAAAAGTATCTACAACCGTTTTGTTCTAAATAAACATTCTTGTAGAACTAGATTAATTGAAGCATATCTGAAAGATCCTAAAAGTCAAACAACAGATAAATCTGTATTAAACCATATGATGAAAACAGATATGCATCATGAAGTTGTTGAAAAAAGACCAGGTCATGTTGACAATGACACATTCTATGATGCTTTGTTTGTGTTTAGGGATAAAGTTTTGAAAAATGGAGAAGTAGCGCCAAGTGTCGACTCTGTTTGGAACCATATCTCAGCATACTTGAACTATGCTTTAAAGCCCAATAGTATTTATTTGAGATTCAAACGCAATACTCATAATTGCCATAAAAAGTTGCTAACACATTGCAAACTGGATCCCTCTAAAGCTAAGACATATGATGTACCTAATCGAAAATTTATTACACCAATAAACAAAATAAAAAAGAAAAGTTTAAAATTTGAAGACTCTTCAAAATTTTTTAAAGCTTTATATACTCATAGACATAATATTATACAAAATGGTTCTATAGCAAAATATAATAATTCTGTTTGGACTGAAGTTGCGAAAATGTTAGATCATGTTTTACAACCATCAGATGTTCACTCTAAATTTATTCGTAATCATGATTTATGCCAGACCAAACTCATTGAAGCATGTAAAGAAGATGAAAATTTTACTCCATTAGTTGTACCCAAGGTTAATAAGCCAAATTGTGTGTCTGACGAAACGTTTTTCAATGTTTTATGTAAATATCGCGAAGATATTTTACTGAATGGAAGTGAAATAGCCAAATTTTCTCATCCTGTTTGGACTCAAATTTCAAGAGATCTTAATGATACTTTAAAACCTGCAACTGTATATTTTAGGGTGACAAGAAATTCCCAGTTGTGTTTAAACAGACTTCTCAAGCAAACTGCTTTATCAGAAGATACTATCAATAAAGACAAGTTTTTTGAAATAATTTCTTTGTATAAATACTCAATTATGAATGGTGATCAAGTTGTAGATTTAAATGATCCAGTTTGGAATGAAATGTCTCTAAGGTTTAACTCTTCATTAACTCCTGAAGCCATCTATGAAGCAATTTCTCAAGATAAAGACTCGTGTAAGACAAAAATGATTCAAGCTCTTAAAACAGAACGTAGTGTATTTTCCGGTGAAAGTCCTGAAATATCTGATAATATGACTGAATTAACACCAATTGTTGAATGTAAAGTTTTTAATGAACCTTTTGAAAATTTTAATGAAGTGTTAAATGAATTTAAGGACTCTATTTTACAACCCAATGGACAAATTGCTGTAGAAGACGATCCTGTTTGGAAACTAATATCTAGTCGTTTAAAAAATCTAACCTCAAACGAAGTTTATTCACGGATCATTAATAATTACAACAATTGTCAAACTATACTATTTGGTGTTGATAGTGTGGATACAGTTTATGAGAATAAGTTATTTGAAGCAATATTTTCTTATCGACATTTAGTTATTAACAATAATGCTATTGCACATGTTAATAATGAAGTTTGGACAAAAATTAGTGAAAAATTAAACCATTCATTAACACCAATGGAAATTTATATACGATTCATTAAAGACATTGATGGCTGCCGTACAGAATTGTTGAAATCTTCAAAAAAAAATGACTTGACTCGATATCGAGGTATTGATAAAGACAAATTTTTAGATGTTTTAATAAGTCACAAAAATTCCATATTAAAAAATGGGTCTCATGCTAAACCTAGTGATCCGATTTGGAGAGAAATTGCATCTAAACTTAATTTTTTAGTAAAACCTTTAACTCTGTATAATAACTTTATGTACAATAGACATAATTGTCAACAGAAACTTTTAGAAGCTTGTGAACAAGATAAAAAAGAGGTAGTTACATCTCCAATTTCATCAAATATAACTTTTCAGATGGACCATGACTATTCAAAAGGTGAAGTAGATACTAGTTTTGAAGATTTAGTATCTATGAGACAAAAAGTTGGTTATGTACAAGAAAATGACTTCATTGAAGCATGTTTTATGTTTAAAGATAGATTGCTAAAAAATAATTGTATAGTGCCTTCAACTGATAAAGTTTGGAATGATATATCAAAACATCTTAATTATGCAATCAAAGCAAAAACAGCTTATTTGAGGTTTAAACGCAACACTCACAATTGGCAAGAAAAATTGTTTCCAAATTTTCAAGTTAATCAATTTTCTTTTGAAGAAGATGATAAACCAAGTTCTATTGAAGACCAAAACATTGAGAATGAAATGTTTTTTGATGCAATTTCAATTTTCAAACATTCTATTATTAATAATGGTATTTTTGCTATGGAATCCAATCCGGTTTGGTTAGACGTTTCAAATCTAATGAACAATTTACTTGCTCCCAGTGAAGCATTTTGGAAATTTCGTCAAAACATTGATTTATGTCGGACAAAACTTATTAAGAAATGTATAACTGATTGGAGCCATGAACCTACCTCAGTTATTAAAAATCGGATTCATGTAATTAATTCTAATGAATCAATATGGAAAGAATCGTTAAAAACTGAACTAATTGCTAGAAGAAATGAAAATAATTGCCAAAAGTCAGAAGTAAATGATGATAATTTATTCTATGACGCTGTTTATAAACATAAAAATGATGTATTTCGTAATGACTTGATTGCAAACTGCAGAAGTCCTGTATGGACTGCAATAGCTAATGAATTAAATAATGAAATGGAACCGTCAAAAATTTACTTCAAGTTTACCAATAATATGACTAGAAGCAATCTAAAGTTTTCTGAAGCAGCTCAGAGACATAATTTTTATAAGATAAAACAAAATCAAAACCAAATTGAAACACAATTAACAATTGAGATTTCTGATTCTTCTGATCAGGATAATACGGTTGATTATGAAAATGAAGAAATTATAGTACTTGATTAG
Protein Sequence: MSTRSIFKTVEEMNTYNNQSTTKHIHSSTLTKLSEKTTLVPSTSSVQSNQIFLINNVEGQSMSGILLPSNHFMVKLNQNQSQIESDTDDYIERETTSKYFSMNKIEKKMFRETFFCTLLDFMHQIVKDGRIVSSSDPIWDRVALKLDNILKPKSIYNRFVLNKHSCRTRLIEAYLKDPKSQTTDKSVLNHMMKTDMHHEVVEKRPGHVDNDTFYDALFVFRDKVLKNGEVAPSVDSVWNHISAYLNYALKPNSIYLRFKRNTHNCHKKLLTHCKLDPSKAKTYDVPNRKFITPINKIKKKSLKFEDSSKFFKALYTHRHNIIQNGSIAKYNNSVWTEVAKMLDHVLQPSDVHSKFIRNHDLCQTKLIEACKEDENFTPLVVPKVNKPNCVSDETFFNVLCKYREDILLNGSEIAKFSHPVWTQISRDLNDTLKPATVYFRVTRNSQLCLNRLLKQTALSEDTINKDKFFEIISLYKYSIMNGDQVVDLNDPVWNEMSLRFNSSLTPEAIYEAISQDKDSCKTKMIQALKTERSVFSGESPEISDNMTELTPIVECKVFNEPFENFNEVLNEFKDSILQPNGQIAVEDDPVWKLISSRLKNLTSNEVYSRIINNYNNCQTILFGVDSVDTVYENKLFEAIFSYRHLVINNNAIAHVNNEVWTKISEKLNHSLTPMEIYIRFIKDIDGCRTELLKSSKKNDLTRYRGIDKDKFLDVLISHKNSILKNGSHAKPSDPIWREIASKLNFLVKPLTLYNNFMYNRHNCQQKLLEACEQDKKEVVTSPISSNITFQMDHDYSKGEVDTSFEDLVSMRQKVGYVQENDFIEACFMFKDRLLKNNCIVPSTDKVWNDISKHLNYAIKAKTAYLRFKRNTHNWQEKLFPNFQVNQFSFEEDDKPSSIEDQNIENEMFFDAISIFKHSIINNGIFAMESNPVWLDVSNLMNNLLAPSEAFWKFRQNIDLCRTKLIKKCITDWSHEPTSVIKNRIHVINSNESIWKESLKTELIARRNENNCQKSEVNDDNLFYDAVYKHKNDVFRNDLIANCRSPVWTAIANELNNEMEPSKIYFKFTNNMTRSNLKFSEAAQRHNFYKIKQNQNQIETQLTIEISDSSDQDNTVDYENEEIIVLD

Similar Transcription Factors

Sequence clustering based on sequence similarity using MMseqs2

100% Identity: iTF_01499584;
90% Identity: -
80% Identity: -