Basic Information

Insect: Eupithecia centaureata
Gene Symbol: -
Assembly: GCA_944548335.1
Location: CALYMU010000881.1:719965-741112[+]

Transcription Factor Domain

TF Family: MYB
Domain: Myb_DNA-binding domain
PFAM: PF00249
TF Group: Helix-turn-helix
Description: This family contains the DNA binding domains from Myb proteins, as well as the SANT domain family [1].
Hmmscan Out: # of c-Evalue i-Evalue score bias hmm coord from hmm coord to ali coord from ali coord to env coord from env coord to acc

1 5 2.8 3.7e+03 -1.1 0.0 2 18 246 262 245 265 0.89

2 5 0.046 61 4.6 0.2 30 44 328 341 314 343 0.81

3 5 0.00018 0.23 12.4 1.9 2 44 431 489 430 491 0.74

4 5 5.7e-06 0.0075 17.1 0.5 3 44 568 625 567 627 0.86

5 5 1.1e-06 0.0015 19.4 0.2 4 44 734 787 733 789 0.84

#	of	c-Evalue	i-Evalue	score	bias	hmm coord from	hmm coord to	ali coord from	ali coord to	env coord from	env coord to	acc
1	5	2.8	3.7e+03	-1.1	0.0	2	18	246	262	245	265	0.89
2	5	0.046	61	4.6	0.2	30	44	328	341	314	343	0.81
3	5	0.00018	0.23	12.4	1.9	2	44	431	489	430	491	0.74
4	5	5.7e-06	0.0075	17.1	0.5	3	44	568	625	567	627	0.86
5	5	1.1e-06	0.0015	19.4	0.2	4	44	734	787	733	789	0.84

Sequence Information

Coding Sequence: aTGGAAACCGTCGCTGACGATGAAGAAACAATGCCTGGATTAGACCCTCTGAAACCTCTCTGTAGGGTCTGCCTTTCTACAGATAAACCAATCAAAAGTGTTCTCGAGGTATTACTAAATGATGGGATGCCACAGTGGGTGTGCATTGAATGTGCAGCGCGGATGAAAAATGCCTCGGAGATCAAGTCAAAGATGGTGGAATCTGATGGCTTACTGCGGGCCCTGCTTATGGACCCTTGTGTGGGGCGGATAGATCCCACAGACCCTCAAGTGACTAAGCACAAAGCTCCACTCCTTGGCTCCACAGAGACTCTTGTCTTTGACTCATTGGAAGAATGTTTAGGATACCACTGTGTGTTacagCAACGCCAGCAGAGCCCTAAGTGGAACGCACCGCAGCCCCGGTTCGAGAGTCAGACCGCCTTCGAGAGTGTCGAGGCAGCTTTCTCTGACTGCGGCGACGACCCACTTGAGAACTACAAATACTCAAACAACGACAATGAAGACGCAAAAGAAGAGTACAATTCTGAAGAAGAGGAAGACGTAGAAGATGAGGAAGATTTAGAAGAGGAAGaggaaactgaagaggaaagcTCAGAAGACTCTGATGCGAAGAGTGAACCAGTGAAGAGCGAGCCAGTGAAGAGGAAACAAGTGAAGAGGGAAAGTGTAAAGAGTGTTAAAGTACCGACCGTTACAAAGATTGAAAAATGCAGTTCCCTGGAACCGATAGATGTCCCGTGGACGAGCAACAACGACTTCACGTTAATAGAGTTCGTGCGACGACAGCCCGCGCTGTACAACCCTCGGCACGAGCTGTACAAGGTGGCTGTGCTCAAGCAGAAGCTGTGGAGAGACGCCGGAGGTCTTCTCAACAAGACAGAGTTCGTGCGACGACAGCCCGCGCTGTACAACCCTCGGCACGAGCTGTACAAGGTGGCTGTGCTCAAGCAGAAGCTGTGGAGAGACGCCGGAGGTCTTCTCAACAAGACAGACTCAGAATGCTACAAGCGTTGGTGCTACGTTCGTGACTACTACATCCGTCGGCGGGGCAAGGCGCGCGGCGGGGAGGCGGCTAAGAAGAGAGCTCAGCTCCTGTCGTTCCTAGACCACGTGCCTTCGCCACAGAGATCCTGGGTCGCACCCCCTTCTGAACAGGACCCCTCGCAAGAGGGGGAGGAACAGGAAACGGAAGACAGAGAGGAAGTCAAAATGGAGACTGTAACTACAGGAAATGCTGAGTTTGATCCTTGGGAAGGAATACGTATCGGAGACCAATACTCCAAGAACGGTCCGTGGGACTGCGAAGCGGACGACGCTCTGATAGAGCTGGTCCGACGTCGGCCAGTGCTCTACAACACACGCTGTAAAGACTACAGgAAAGTGCGTCTCAAGCAAGCTCTATGGCAGGAAATAGCTGAGAAACTTAATAAGACAGAGTCAGCTTGCTACAAGCGCTGGTGCTACGTCAGAGACTACTACGTACGTCGCAAGTCCAACCCGGGCGCGCTCTCGAGCGGGCCGCGCGCCAAGCGACGCGCGCGCAGGCTGGCCTTCCTAGACCAACCGCAGGGGGACATTCCTAAGCCTACGAAGGAAACCCCTCCGAGCTCGACAGATGGCACCACTAGTGCGAGCCTGCCCGGCTTCACAGCGCTCAGATACCGCCTAGGTGGCTACAGCAAGCGCTCGTCAGTCGCGTCCTGGACGCCGGAGCACGACGACGTGCTCATACAGTTCGTGTCCGCACACGCCGCGCTCTACAACCCGCGCAGCAAACACTTTCGTAGCGCGAGATTCAAGCAGGCGCTGTGGGCGCGCGTCGCCGACCAGCTTGGCAGAACTGACACGGACTGCTGCCGGCGCTGGTGCTACATCCGAGACTACTACGTGCGTCGGCGCGGCAAGCCGGGCGTGCTGTCGACCGGCAAGGCGGCGCGCCGGCGCGCGGAGCGACTGGCCTTCTTGGACAAACTGGGGTCTAGCTACATCCGAGACTACTACGTGCGTCGGCGCGGCAAGCCGGGCGTGCTGTCGACCGGCAAGGCGGCGCGCCGGCGCGCGGAGCGACTGGCCTTCTTGGACAAACTAGGGACAGAGAAGCAAGATGTGAAATCGGATGACGAGAGCGAGCAAGCAGATTTCACGGAGTGCAATTCTCGCGTATCTAGaTCGTCAGAGCAGCGCAATGAAATATGTTGGACGAGTGAGAGCGACGCACTGTTGATAAACTTCGTAAGGCATAACGAGCCGCTCTACAACCCTAAGAACAGGAACGCGCAGTTGAAGATTAAACTGTGGAGCGACATCGCCTCTATGTTGGATAAGACAGACTCAGATTGCTACAAGCGGTGGTGCTACGTGCGAGACTACTACACGCGGCGCCGCGGCAAGGGGCGCGGGGGGGAGGCCGCTAAGAGGAGGGCTCAGCTACTGTCCTTCCTGGACGGCCTCGCTCAGCGAGGGAGTTAG
Protein Sequence: METVADDEETMPGLDPLKPLCRVCLSTDKPIKSVLEVLLNDGMPQWVCIECAARMKNASEIKSKMVESDGLLRALLMDPCVGRIDPTDPQVTKHKAPLLGSTETLVFDSLEECLGYHCVLQQRQQSPKWNAPQPRFESQTAFESVEAAFSDCGDDPLENYKYSNNDNEDAKEEYNSEEEEDVEDEEDLEEEEETEEESSEDSDAKSEPVKSEPVKRKQVKRESVKSVKVPTVTKIEKCSSLEPIDVPWTSNNDFTLIEFVRRQPALYNPRHELYKVAVLKQKLWRDAGGLLNKTEFVRRQPALYNPRHELYKVAVLKQKLWRDAGGLLNKTDSECYKRWCYVRDYYIRRRGKARGGEAAKKRAQLLSFLDHVPSPQRSWVAPPSEQDPSQEGEEQETEDREEVKMETVTTGNAEFDPWEGIRIGDQYSKNGPWDCEADDALIELVRRRPVLYNTRCKDYRKVRLKQALWQEIAEKLNKTESACYKRWCYVRDYYVRRKSNPGALSSGPRAKRRARRLAFLDQPQGDIPKPTKETPPSSTDGTTSASLPGFTALRYRLGGYSKRSSVASWTPEHDDVLIQFVSAHAALYNPRSKHFRSARFKQALWARVADQLGRTDTDCCRRWCYIRDYYVRRRGKPGVLSTGKAARRRAERLAFLDKLGSSYIRDYYVRRRGKPGVLSTGKAARRRAERLAFLDKLGTEKQDVKSDDESEQADFTECNSRVSRSSEQRNEICWTSESDALLINFVRHNEPLYNPKNRNAQLKIKLWSDIASMLDKTDSDCYKRWCYVRDYYTRRRGKGRGGEAAKRRAQLLSFLDGLAQRGS

Similar Transcription Factors

Sequence clustering based on sequence similarity using MMseqs2

100% Identity: -
90% Identity: -
80% Identity: -