Basic Information

Insect: Electrophaes corylata
Gene Symbol: -
Assembly: GCA_947095575.1
Location: OX352698.1:15603971-15609122[-]

Transcription Factor Domain

TF Family: MYB
Domain: Myb_DNA-binding domain
PFAM: PF00249
TF Group: Helix-turn-helix
Description: This family contains the DNA binding domains from Myb proteins, as well as the SANT domain family [1].
Hmmscan Out: # of c-Evalue i-Evalue score bias hmm coord from hmm coord to ali coord from ali coord to env coord from env coord to acc

1 5 0.68 5.6e+02 0.9 0.0 22 33 352 363 337 367 0.88

2 5 5.9e-11 4.8e-08 33.1 0.1 2 45 384 429 383 430 0.95

3 5 1.7e-07 0.00014 22.0 0.1 3 43 438 482 436 485 0.95

4 5 1.3e-07 0.0001 22.5 0.0 1 44 489 532 489 534 0.95

5 5 1.1e-06 0.00087 19.5 0.0 3 45 541 585 539 586 0.93

#	of	c-Evalue	i-Evalue	score	bias	hmm coord from	hmm coord to	ali coord from	ali coord to	env coord from	env coord to	acc
1	5	0.68	5.6e+02	0.9	0.0	22	33	352	363	337	367	0.88
2	5	5.9e-11	4.8e-08	33.1	0.1	2	45	384	429	383	430	0.95
3	5	1.7e-07	0.00014	22.0	0.1	3	43	438	482	436	485	0.95
4	5	1.3e-07	0.0001	22.5	0.0	1	44	489	532	489	534	0.95
5	5	1.1e-06	0.00087	19.5	0.0	3	45	541	585	539	586	0.93

Sequence Information

Coding Sequence: ATGTCAGTGTTCTTGTTAAACGGTGAAGGAAAGCATCGCGAGGAATTCAGTCGGTCGTCGTTGCGACCTGTCGGGGCTCGCATCGCACGCAGCCGCACCGGCTTGCTTTCGGCTGTAGACAATGAAACTGCAGACATAGAACTAAACACGGCTGTAGACAACGCAGCTGCAGACATGGAATCAAACACGGCTGTAGACATCGAAGCTGCAGGCATGGAATCAAACATGACTGTAGACAACGAAGCTGCAGACATGGAATCAAACACGTTTGAAGACAATGAAGCTCTAGCCATACAATCAACTACAGCTGTAAACAATGAAGCTGCAGACATAGAATCAAACACGGCTGTAGACAACGACGCTGCAGACATGGAATCAAACATGGCTGTATGCAGTGAAGCTGCAGACATGGAATCAAACATGGCTGTATGCAGTGAAGCTGCAGACATGGAATCAAACACAGCTGTAGACAATGAAGCTGCAGGTATAGAAGCAAACCAGGCTGTAGATTATGACGAAAAAAAAGCGTCACTGGCTAGAACAAAAGACTTAGTGGAAAAATGCGATGCAGTCATAGCTGCCAACAAAAGCTTGGAGCAAAAGTATGCAAAGGAAGAGGCAATCTTGGCAAAAAAGCTGCATCAAATTCGAACTGAGCTACGAGTTATAAGAGAGCTGGGCACTAGCAAACCAAAACAAGAGCCCTTCCGCTACTGCAGCATAGGCATGCCCTATTTCAAAGATAAGGACCTCAATGTCCCCTCGGACAATGAGGACACCCTGGAAATAAAACGGCGCCAGATGTATGACTTCTCAAATGTCATGGCAGTGTCAGGATGGACATTTGGAGAAAAAACCAGTCTCCTGTCAGTTCTGCTTGACCTATCAAAAGATATTGTTAAAAACAAAATTTATTCGGAGATTACTAATGTTCAGAAAGTGAAATTGAAAACTATAGAGATTACAGCTAAAATTAAGGAGTTGAAAAGTGAGCTCCTTGCAGTAAAACATAAAAAATTAGAAGACTTAGATCTGAAAATAGACCAAGAGTTTGACTGGGAAGAAATTGCTCTAAAATTGAACAACCGTCACTCGTCTGAAGAGTACAAAGCTATCTGGGACCTATTCTTTCATCCCCGAGTCAATAAGAGTGTATGGACCCCAAAAGAACATCGTGAGCTTCAGAGAATTGCAGCAGAAAAAGGCATGCAGGATTGGGAGTCCATCGCCAAAACTCTAAACACAGGTCGAACGGCCTATCAATGCTTCGTTTACTTCCGCACTCACATGAACAATGTGGCCGTTGGTCGTAAGTGGACACTAAAAGAGATGAATTACCTACAAGAAGTCATTAGCTTGTGTAAAGAGGAGAACTATATCCCGTGGGGTAAAGTGGCCACCTCTATGCAAAACAGAACAAAGGTTCAATGCTACAATAAATACATGGGGATGATTAGAGAGAGAAAGGGAAGATTTTTACCTGAAGAAGATGCTGTTATTCTCAACTTTGTAAATGTGTATGGCCAGAGCTTTAGGAAGATGTCCAGTTTCCTCACGGGCCGTTCAGCCATTCAACTGCGGGCCAGGTACAAGCTGCTCCTCAAGATCCGTGTCTCCACCACCTGGACTGTGGACGAAGACCGTAAGCTGATGCAGATCATGGCTAACCAGGACTGCCGCTCTCACTTCTCCACCGCCTCTAAACACTTTCCAGGGAAAGATAGACAGCACATACGAACCAGATACAACACCCTGATAAGGTGGACGAAGAGGTATCCTCACAAAGATTTATGCCAAGCTCCTCGACGTGGTGCTCGCAGACTTTACCATGGGGAGCCAACGTCAAGCCTCGTGAAGGCCATCGAAAACCTTCGCGAAAAAATGAAAGCAGAACTCCAACAGAACCATGATAAACCTAAGAAGAGGGTAAAGAAACTGACTAGAGATTCAAGCGAAAGCGCTATCCATGACGCGATTTTGACCACAATCTCTACTCTAGAGGCAAAGAACATGCAATCCACTTCGGTAGTGCCCAAAACTCAGGAAGATAAAGTAGAAGGGGCTTACCAGATGCTGAATGTTCAAGACATATCATCAGCCCCAGATGAACAAGCAAACATTTTCAACGTACAAAACTTTCTGTTCCTTTTGAACGCTAAGATAGCTGACAAAACGAAGTTCTACAATAGCTCGATAGGCGAGGCTATTAAAAAAATTGAAAACCAGAAAGTTAACCTGACGCAGCCCACAGTGAGGACTTACTCTAAGATTGCGGTGAAGGAGCAAGTTATTCAGCCTTCTCTCTTTGGTACCACCACAGCTGGTCGTAGACGGTTCATGATCCCACCAAACTTCGCCACCATCACTGGAAGTAGAGTTATATTGCAACATTCAAGCAAGATGTCTATGAAAGGAAAAAGCGATATGAATATTAAACAGCTCGCTCGAAAGGATCTCATCCTGGACTCTCATTTAACTCGGCTGAAAGAGAGGTTCGTTGATCTCTTCTGCTGGCCTCTTCTTCTTTCAAACGAGCCTCCCGAGCATTACAAGCTATATGCTAAGGATATGATAGAAAAGAGAGTTGGATCTAGGTCTATATTTGATCATAAGCCATTCCCCGAAGTACGCCCGGTGACCGCCCCCCACCCGAAGGCGGTAAATGCCGGCATAGACACTGAGGCGATGGAAGTTGATGAAAATTAG
Protein Sequence: MSVFLLNGEGKHREEFSRSSLRPVGARIARSRTGLLSAVDNETADIELNTAVDNAAADMESNTAVDIEAAGMESNMTVDNEAADMESNTFEDNEALAIQSTTAVNNEAADIESNTAVDNDAADMESNMAVCSEAADMESNMAVCSEAADMESNTAVDNEAAGIEANQAVDYDEKKASLARTKDLVEKCDAVIAANKSLEQKYAKEEAILAKKLHQIRTELRVIRELGTSKPKQEPFRYCSIGMPYFKDKDLNVPSDNEDTLEIKRRQMYDFSNVMAVSGWTFGEKTSLLSVLLDLSKDIVKNKIYSEITNVQKVKLKTIEITAKIKELKSELLAVKHKKLEDLDLKIDQEFDWEEIALKLNNRHSSEEYKAIWDLFFHPRVNKSVWTPKEHRELQRIAAEKGMQDWESIAKTLNTGRTAYQCFVYFRTHMNNVAVGRKWTLKEMNYLQEVISLCKEENYIPWGKVATSMQNRTKVQCYNKYMGMIRERKGRFLPEEDAVILNFVNVYGQSFRKMSSFLTGRSAIQLRARYKLLLKIRVSTTWTVDEDRKLMQIMANQDCRSHFSTASKHFPGKDRQHIRTRYNTLIRWTKRYPHKDLCQAPRRGARRLYHGEPTSSLVKAIENLREKMKAELQQNHDKPKKRVKKLTRDSSESAIHDAILTTISTLEAKNMQSTSVVPKTQEDKVEGAYQMLNVQDISSAPDEQANIFNVQNFLFLLNAKIADKTKFYNSSIGEAIKKIENQKVNLTQPTVRTYSKIAVKEQVIQPSLFGTTTAGRRRFMIPPNFATITGSRVILQHSSKMSMKGKSDMNIKQLARKDLILDSHLTRLKERFVDLFCWPLLLSNEPPEHYKLYAKDMIEKRVGSRSIFDHKPFPEVRPVTAPHPKAVNAGIDTEAMEVDEN

Similar Transcription Factors

Sequence clustering based on sequence similarity using MMseqs2

100% Identity: -
90% Identity: -
80% Identity: -