Basic Information

Insect: Boloria euphrosyne
Gene Symbol: -
Assembly: GCA_951802675.2
Location: OX637896.1:3531605-3537938[+]

Transcription Factor Domain

TF Family: MYB
Domain: Myb_DNA-binding domain
PFAM: PF00249
TF Group: Helix-turn-helix
Description: This family contains the DNA binding domains from Myb proteins, as well as the SANT domain family [1].
Hmmscan Out: # of c-Evalue i-Evalue score bias hmm coord from hmm coord to ali coord from ali coord to env coord from env coord to acc

1 6 3.5 4.7e+03 -1.4 0.1 12 31 221 240 218 247 0.67

2 6 0.23 3e+02 2.4 0.0 23 44 342 362 334 364 0.85

3 6 0.00072 0.97 10.4 0.1 22 44 439 460 417 462 0.77

4 6 0.058 77 4.3 0.1 23 45 586 607 563 608 0.85

5 6 3.4e-05 0.045 14.7 0.2 3 44 659 709 657 711 0.79

6 6 0.00081 1.1 10.3 0.1 14 45 831 869 823 870 0.77

#	of	c-Evalue	i-Evalue	score	bias	hmm coord from	hmm coord to	ali coord from	ali coord to	env coord from	env coord to	acc
1	6	3.5	4.7e+03	-1.4	0.1	12	31	221	240	218	247	0.67
2	6	0.23	3e+02	2.4	0.0	23	44	342	362	334	364	0.85
3	6	0.00072	0.97	10.4	0.1	22	44	439	460	417	462	0.77
4	6	0.058	77	4.3	0.1	23	45	586	607	563	608	0.85
5	6	3.4e-05	0.045	14.7	0.2	3	44	659	709	657	711	0.79
6	6	0.00081	1.1	10.3	0.1	14	45	831	869	823	870	0.77

Sequence Information

Coding Sequence: ATGGAGAAACAGATTGTGGTTAAAACAGAAGTTCAGCCAAACGGAGATATACTGTTATTTTATGTTGATGAACATGAAGATTTGAGTGCGGGTGTATTAGATAACACTGATGAGAATAGTGTACAAGGTTTGTCAGATAAGTATATTGTTGAGGAAGATCTTGGTGAAGGAGATTCTGCTGAAGAACTTGATATTGCCCAAGCTTCGGAGGAAGTTGCTAATGAAGTGTGGGAAGATGAAGAAATAAGACGACTTGTCATTTTTTATCTTGATAATAAAGAAACATTTCTCAGTGGAACAACAAAAAAAGTACATTTGTGGTCAGTTGCATGTAAGACTATGTTGGGTGGAAAAAAACCTTTGTCATGTGAGGTTAAACTACGAAATTTAAAGAGAAAGTATGCTCAATTACGGGTTGACAACCAGACTGGTACTTTTATTAACTGGCCACTGTACGACTTGTGTCACCAAGCATTTCATGATGATACATTTGTTCAAATGTGTCTAAATGAGCCCACTCAGGAATCTGTTACGATGAGTTTGCCTGTACAGAATGTTGTCAATAAGGATGGAGTATTAGTTGTAAAAAAGGTTAATACAAATCAAAACAAAGATGAAAAGGTTGAGGCTAtgttaaatttgtatataaaacataaaaatttctTTCAAAAACACAACACACAAAAGGGGCTTTGGGAAGCCATTGCTATGGATTTGGGAGAGGAAGACGTTGACTATTGGCATAAGCGTTTCTTGAATTTTAAACAGCACTATATTAGAATGGtctataaaagaaaagaaagtgGGGCTGACAATGTCAATTGGCCATACATGAAAtactttgataaaatttttggtGAAGATGAAGAATTTCAACgtaaatttattcaaaacaaTCCTGATTCTGCGCCATCTGAAAATGACGAAAATTTCTGGAACGATACAGAAAAAACCTTTTTGGCTAAATACTGTTTTGATTGTTTTCACGAATTTCAAGATCCAACCATTCCAAATAAGTTTTTGTGGCAAGAAGTTGGTAGATTATTAGACAAAAAACCAGAAAGTTGTAAGAAAAAGTATGAAGAACTTAAAGAGGCCCACTTTGAGCAACTTATGAAAGGCGGTTACAACTTAGTTGACAGAGTTCCGTTAGCTATCATATTTGACAATATAATAGCCAGAGAAGTTGAAAATGAAGTTGAGAATCCATCTAGACGTGACTCAGACATATGGAAAACTGAACAAATAGATGAATTAGtacaatttttgtatgaaaatattgaCATGCTAAAAGACTCAGTATGCTATTATGTTTGTTGGGCGACATTAGCTAAGAAATTACACAGAAGTGTAGACTCATGTAAGAAGCAGTGGAATGACTTAACTGCTCTGTACAAAACTATTCTAGATGATAAAAAAGAAGATCCTGAAATGCAAATAGATTGGCGATACATTGATCTCTTTGATAGAATATTTGATTATGGGATGGACACTAATTTGTTGGACGGTTATGAAAAGCTTAAAGGTCTAAGTCAAGTTAACAAGTCTAGTAAAATTGGAGTCAAGAAAATAACCATAAAAGATAGCGACGATAAACTAATTGAGGGTACAGATGATGAAGAGTCTTACGACGAGAGAGGATTTACAAAGCGATCCAAAAAACGTAATGGCGATACtaaagcatttaaaatattggaatactatttaaagaataaagataaGTTTGCTTCGTCACAGCATAAGAAGTTAGCACTCTGGGAAGTACTGGCGAGGCAAATAGGAATATCAGCGACTGAATGTGCCCACAGGTTTCGAAACTTCAAACAAGTTTACACTGGATACCTTCAAAGGGAAATAAATAAGCCAGAGATGCCAATACTTTCGCCATATTACAGTTTGTGCAAGAAAGTCTTTGGTTATCGAGCAATAAAATCTAAACTCAAGAATGGTAAGTTTGATTCAGACGACTCAGAAGATTGGTCTGCAAAGGAAATtaagcaattaattaattattttggcaAAAATTATCACAATTTAATGGATAATGTGGAGGAAAAGAGCAAATGGACGAAAATAGCTAGCGACTTGGGGAGATCGGAGACCAGCTGTTGTGACAAGTTCTTAGAATTGAGAAAGTCGTAtaggaaattaaaaactatGAAGACTCGCAATCCCGATGTTAAAGTGTCttggaaatattttaagatgATCGATGATATATATAAGAACGGAGAAAAGAATGAAGAAATTGAAATGTTAGAAGATATGGAAGTTGTTGAACATAGTGACTATAATGATGTTATTAAGACAGAAACTCAAGAAgatgacgattttcagtgTATCATAGTCATACCTGAAGGAGAGGATATAAACAATGCGCAAATTATAATGCAAAGACCCGACGAAAATGTAGAAATAGTTACAGAAAAAAAGCCTATTATAACTAAATGGAACCGACGAAGtaagaaacaacttttaatacaaTACCTAAAATATCTAAAAGCTCATAAAGGTAAAGACACTAATTTAAGAGAAATGTGGACAGATATAGCATCTAAATTAGATGAAAAAACTCCTTTGTCGTGCAAGAAAATGTACCTCAAACTAAAGAATCAGCATAAGCAGTTGATtaacgaaaataataaaaatagaacgCCATATTCCAATTTGAttgaaaaaatacttaaaatcaaaCCTAAAATCGTTAAAGCAATTAAAAGTAATACGAATTTGGATGATATCTACGAAGATGTGCCAATGTCTGATGATAAAGTGGATatagctttaaaatattatttacaaaacgtAGAAGATTTTGTGAGTCCAAAATTTGAGCAGAAGTACCTTTGGAGTGAATTGGCAAAATTCATTTGTGAACCAGTGAACAAAATATATAGCAAAATAAATTACTTGAAGCAAACATTCAACTCGGATCCAGACAGTCCTTACAAGGACATATTAGCAGAAATTACATTGaaagaaaaaacattaaaagaTTCTATGGAAAATGATCACAATCCTTTACCGGAAGATGAAAATGAACAGAATTGGTCCGATATTGAAATAGAAAGGCTATTAACATGGTATTTAGCTCATTTAGACAAGTTTAAAAACCCAAAATTTGTTCGAAGTTACTTATGGATGGAGGCTTCAGATATTTTGAAGAAGAGTGCCTTGGTGTGTTCTAAGAAAATGCTAGAAATACGATCGCAATATAGGACTATGGTGAAAGAGAATCCAGAAGAATTAAACAATTGGAAGTTTTATAATCTGTGTCAAAGAATCTATGAGCAAAGAGCTCGACAGTGCCTTCAAATGGACTCAGTCAAGTTAACCCTCAACGTAATACCTTTCAATGATAAACAAAGAGCCCAAGGTCTCGGCTTGCTAATCCTATTATAA
Protein Sequence: MEKQIVVKTEVQPNGDILLFYVDEHEDLSAGVLDNTDENSVQGLSDKYIVEEDLGEGDSAEELDIAQASEEVANEVWEDEEIRRLVIFYLDNKETFLSGTTKKVHLWSVACKTMLGGKKPLSCEVKLRNLKRKYAQLRVDNQTGTFINWPLYDLCHQAFHDDTFVQMCLNEPTQESVTMSLPVQNVVNKDGVLVVKKVNTNQNKDEKVEAMLNLYIKHKNFFQKHNTQKGLWEAIAMDLGEEDVDYWHKRFLNFKQHYIRMVYKRKESGADNVNWPYMKYFDKIFGEDEEFQRKFIQNNPDSAPSENDENFWNDTEKTFLAKYCFDCFHEFQDPTIPNKFLWQEVGRLLDKKPESCKKKYEELKEAHFEQLMKGGYNLVDRVPLAIIFDNIIAREVENEVENPSRRDSDIWKTEQIDELVQFLYENIDMLKDSVCYYVCWATLAKKLHRSVDSCKKQWNDLTALYKTILDDKKEDPEMQIDWRYIDLFDRIFDYGMDTNLLDGYEKLKGLSQVNKSSKIGVKKITIKDSDDKLIEGTDDEESYDERGFTKRSKKRNGDTKAFKILEYYLKNKDKFASSQHKKLALWEVLARQIGISATECAHRFRNFKQVYTGYLQREINKPEMPILSPYYSLCKKVFGYRAIKSKLKNGKFDSDDSEDWSAKEIKQLINYFGKNYHNLMDNVEEKSKWTKIASDLGRSETSCCDKFLELRKSYRKLKTMKTRNPDVKVSWKYFKMIDDIYKNGEKNEEIEMLEDMEVVEHSDYNDVIKTETQEDDDFQCIIVIPEGEDINNAQIIMQRPDENVEIVTEKKPIITKWNRRSKKQLLIQYLKYLKAHKGKDTNLREMWTDIASKLDEKTPLSCKKMYLKLKNQHKQLINENNKNRTPYSNLIEKILKIKPKIVKAIKSNTNLDDIYEDVPMSDDKVDIALKYYLQNVEDFVSPKFEQKYLWSELAKFICEPVNKIYSKINYLKQTFNSDPDSPYKDILAEITLKEKTLKDSMENDHNPLPEDENEQNWSDIEIERLLTWYLAHLDKFKNPKFVRSYLWMEASDILKKSALVCSKKMLEIRSQYRTMVKENPEELNNWKFYNLCQRIYEQRARQCLQMDSVKLTLNVIPFNDKQRAQGLGLLILL

Similar Transcription Factors

Sequence clustering based on sequence similarity using MMseqs2

100% Identity: iTF_01181847;
90% Identity: iTF_00248035;
80% Identity: -