Basic Information

Insect: Clepsis dumicolana
Gene Symbol: -
Assembly: GCA_963691665.1
Location: OY829528.1:4262717-4268476[+]

Transcription Factor Domain

TF Family: MYB
Domain: Myb_DNA-binding domain
PFAM: PF00249
TF Group: Helix-turn-helix
Description: This family contains the DNA binding domains from Myb proteins, as well as the SANT domain family [1].
Hmmscan Out: # of c-Evalue i-Evalue score bias hmm coord from hmm coord to ali coord from ali coord to env coord from env coord to acc

1 7 9.8 1.6e+04 -3.2 0.1 1 13 77 89 77 90 0.87

2 7 0.31 5.1e+02 1.6 0.0 23 43 358 377 350 380 0.86

3 7 0.0011 1.8 9.5 0.1 22 43 458 478 429 480 0.83

4 7 0.022 37 5.2 0.1 23 46 603 625 580 625 0.81

5 7 0.0078 13 6.7 0.2 2 33 675 715 674 728 0.72

6 7 8.2e-05 0.14 13.0 0.3 22 42 854 883 832 887 0.72

7 7 1.1 1.9e+03 -0.2 0.9 3 14 1045 1056 1043 1059 0.86

#	of	c-Evalue	i-Evalue	score	bias	hmm coord from	hmm coord to	ali coord from	ali coord to	env coord from	env coord to	acc
1	7	9.8	1.6e+04	-3.2	0.1	1	13	77	89	77	90	0.87
2	7	0.31	5.1e+02	1.6	0.0	23	43	358	377	350	380	0.86
3	7	0.0011	1.8	9.5	0.1	22	43	458	478	429	480	0.83
4	7	0.022	37	5.2	0.1	23	46	603	625	580	625	0.81
5	7	0.0078	13	6.7	0.2	2	33	675	715	674	728	0.72
6	7	8.2e-05	0.14	13.0	0.3	22	42	854	883	832	887	0.72
7	7	1.1	1.9e+03	-0.2	0.9	3	14	1045	1056	1043	1059	0.86

Sequence Information

Coding Sequence: ATGGATCACATTGTGGTCAAGACCGAAATGCAGCCTAATGAAGAAATACTCCTATTCTATGTGGATGAAGATGGAGGCAACGAACAAGGAGTGGTGACGACAATTGAGAATATAGAACAGACACATGAAGCACAACTGCAACAGGATGGTTCATACATTGTAGAACAATCTAGTGCTGAACCTGAACCTGAAGATGACAACGTTATGGAAGAGGAACATGCTTGGTCCAAGGACAAATGGGCAGACGATGAAACCAAAAGGCTTCTAGTATTCTACGTCGACAACAAAGCGGCGTTTCACGCTGGATCGACAAGAAAAAGGCATTTATGGACAGTGGCTTGCAAGACCATGCTATCGACTAAGAACCACAACTCATGTGAGATGAAACTTCGCAATTTGAAAAGGAAGTACATACAATTGCGGGTGGAACAAGAAAAGGGGTTTCATGTCATGTGGCCGTATTACCAACTCTGCCATCAGGCTTTTCACGATGACAAATTTGTTAATGATGCACTTGAGAATTTAAAGGCAAAATCGCAGATGAAAGCTGTAGTGTCCGTACCCGTGAGTAAAGCTAATGACGACGCAGGCATTGTTGTTGTTAAGAAAGTCAACAAGACGTCTGGTGATGGTAACGTGGAAGCTATGCTAACTTTGTACCTCAAAAACAAAGGGTTGAATTACAAGGCGAAGCAAAAAACCTTATGGCAAAGTATAGCTTTGCAACTGGGAGTGGAAGATGGCGATTACTGGCACAAACGCTTCTTGAATTTCAAGAATAATTACATCAGGCTCTTGGAGAAGAGGAATTTGGAGGGTCCAGACAGTATCAGTTGGCCGTACATGCATCTGTTTGACCAAATTTATGAGGGTGATGAGGACTTTCAGAAGAAACATGAACCGCAACACTTGCGAGTCGCCCCAGTAACGCGTCCATACCAGCCGCTTCAACAAGTACCGCCAGAAACATTCGACCACATATGGAACTCCACGGAACTGATGGTGCTCGTTAAATACTACTTTGATTGCTACCAAGAATTCCTCGATAAAACCATCCCTAATAGTTTTCTGTGGAGCGAGGTTGGACGTTTGATTGACAAGAACCCGGAGTCCTGCAAGGCGAAATTCGAAGAGCTGCGACATGAACATTTAAAGCTATACATAGACGGTGGATACGAACTGCGTACGCGGACCCCGTTGGCTATTTTATTTGACAACATAATTTCGAAAGACGTTCAGCACGAGATACTGACGAAGACCCTTAAAGTGGCCGAGCTTGATTTGCAGTGGAAGACTGAAGAAATAGACGAAGTGGTGCAGTTTTTCTATGAGAACGCCGAGGTTTTTAAGGATTCTATTTGCTATTTTGTGTGCTGGGCGGCCATTTCGAAGAAACTGGGAAGGAGTGTAGTGGCTGTTAGAAGGCAATGGACCGAGCTGACGGGGCTTTATAAGTCTATATTGGAAGATAAGAGAGATAACCCAGACTTGCAGATAGATTGGCGCTACATTGAATTATTTGACTGCATTTTCGTGTATGGGATGGACACGCATCTCCTGGAGGGCTATGAGAAGTTGCAAGAGCAAGATAAAGGCGGTGATAGAGGCAAAAAAGACGACCCGCGATCAGAGGACGACCATGAGTTCGATGAAAACATCTCAGAAGATGAAGAATCTTACGACGAGAGAGGCTTCATGAAACGCTCGAAACGCCGAACCGGGGATTCCAAATCCTTCAAAATACTAGAGTTCTACCAGAAAAACAAGGAAAAATTCGCATCGCCTAACCGCAAGAAACTAGCCCTGTGGGAGATACTAGCTAAAGATATAGGCATATCAGCCGCCCAGTGCGCCCACAGATTCagaaatttaaaacaagtgtaCACAAAATATGTGCAAAGAGAGATAAACAAACCAGAAAAACCTATACTTTGGCCGTACTACGCTCACTGCAAAAAGGTTTTCGGTTACAGAGCTATTAAATCGAAATTACGCAACGGTAAGAAAGATACTGACGATGAAGAGGAATGGTCTGCTAAAGAGATCAAACAGTTAATAAATTACTTCGCTCAAAACTTTGATGATATCAATTGTAATCTGGAAGACAAGAGTAAATGGTCTGCTTTAGCCGCGGAGATAGGTAAAGTGGAAGACGCGTGTAGTGACAAACTACTGGAACTGCGGAAGTCCTACAGGAAACTTAAGACTATGAAAACCAGGAATCCTGAAGTGAAGATCAGCTGGAAGTATTTCCACTTGTTCGATGATATTTACACGTCGCAAGATGTTGAAACTGTTCAGGAGATTGAGATTAATGGATATGAAGAATTAGACCTCGGCAATGTTAAGATGGAAGCGCAAGatgATGACTTCCAATGCATTATAGTGATACCAGAGGGCCAAGAAATAGGAGATTTGAGCAacgcaaaaataattatgtctgaAAACGGTGAAATGCAGCCATATTTACAAGTTCAGACCGAAAAACCGGTCAATAAATGGACCAAAAAGACGAAGAAAACCTTACTGATACACTATATTAACTACTTAAGAATGAATAGACGTAAAGAAATAAATTCAACTGAAATGTGGAAagaaatcgcatcgaaattgggTGACAAAACGCCGTTGTCTTGTAGAAAGATGTTTGCAAAATTAAAGAGTAATCACATGCAACTAGCCAGCGATGAAGACCCTAATAAAAAGAAGACTCCATACTACACACTCGTTGAGAAAATAATGGTGTTGAAACCTAAGTTTGCTAAAATGGGACAGAAGAAAACACTGAAAGAAGATAAAATCTATAAAGATGTTCAAATACCTGATTTGAAGGTCCAACAAGCGTTACAGTACTACTTGGAACATATTGATGAATTCGTCAGTCCGAAATTCGAGAAGAAATATTTATGGACTGAACTAGCCAAgttcatttctgaaacactgaCCAAGATTTTTAACAAGATCAGTTTTCTGAAGCAAAATTTCGACGTTGAGACTGGAAAAGTGGCTGGCGAAGATACTGCTTTCACAgatattttaaaagaaataatggcTAAGGAATCAGCACTGAAAAGTGATATACAAAATCAGCCCAAACCTGTTATTGTCGAACCCGATCAAGACCAAGAAGATACTTGGACAGATGCAGAAACTGAACAACTCCTGAGTTGGTATTTAGCGAATCTGGAGAAATTCAAGAACCCTAAATTCGTAAGAACCTATCTTTGGATGGAGGCGTCAGATATTTTGAAGAAGAGTGCCTTGAATTGCTCCAAGAAGATGACAGAAGTACGGACCCAGTACAAGAAGTTGATAAAGGAGAGTCCAGATGAATTGAATAATTGGATATTTTATGATTTGTGCCAGAAGATATATGGAACGGGAAAGAGGAATAACCCTGAGAGTATACTGATGTTGGAGACTACTCAGAATGTTTAG
Protein Sequence: MDHIVVKTEMQPNEEILLFYVDEDGGNEQGVVTTIENIEQTHEAQLQQDGSYIVEQSSAEPEPEDDNVMEEEHAWSKDKWADDETKRLLVFYVDNKAAFHAGSTRKRHLWTVACKTMLSTKNHNSCEMKLRNLKRKYIQLRVEQEKGFHVMWPYYQLCHQAFHDDKFVNDALENLKAKSQMKAVVSVPVSKANDDAGIVVVKKVNKTSGDGNVEAMLTLYLKNKGLNYKAKQKTLWQSIALQLGVEDGDYWHKRFLNFKNNYIRLLEKRNLEGPDSISWPYMHLFDQIYEGDEDFQKKHEPQHLRVAPVTRPYQPLQQVPPETFDHIWNSTELMVLVKYYFDCYQEFLDKTIPNSFLWSEVGRLIDKNPESCKAKFEELRHEHLKLYIDGGYELRTRTPLAILFDNIISKDVQHEILTKTLKVAELDLQWKTEEIDEVVQFFYENAEVFKDSICYFVCWAAISKKLGRSVVAVRRQWTELTGLYKSILEDKRDNPDLQIDWRYIELFDCIFVYGMDTHLLEGYEKLQEQDKGGDRGKKDDPRSEDDHEFDENISEDEESYDERGFMKRSKRRTGDSKSFKILEFYQKNKEKFASPNRKKLALWEILAKDIGISAAQCAHRFRNLKQVYTKYVQREINKPEKPILWPYYAHCKKVFGYRAIKSKLRNGKKDTDDEEEWSAKEIKQLINYFAQNFDDINCNLEDKSKWSALAAEIGKVEDACSDKLLELRKSYRKLKTMKTRNPEVKISWKYFHLFDDIYTSQDVETVQEIEINGYEELDLGNVKMEAQDDDFQCIIVIPEGQEIGDLSNAKIIMSENGEMQPYLQVQTEKPVNKWTKKTKKTLLIHYINYLRMNRRKEINSTEMWKEIASKLGDKTPLSCRKMFAKLKSNHMQLASDEDPNKKKTPYYTLVEKIMVLKPKFAKMGQKKTLKEDKIYKDVQIPDLKVQQALQYYLEHIDEFVSPKFEKKYLWTELAKFISETLTKIFNKISFLKQNFDVETGKVAGEDTAFTDILKEIMAKESALKSDIQNQPKPVIVEPDQDQEDTWTDAETEQLLSWYLANLEKFKNPKFVRTYLWMEASDILKKSALNCSKKMTEVRTQYKKLIKESPDELNNWIFYDLCQKIYGTGKRNNPESILMLETTQNV

Similar Transcription Factors

Sequence clustering based on sequence similarity using MMseqs2

100% Identity: iTF_01134747; iTF_01135710; iTF_01463212; iTF_00462353; iTF_00155257; iTF_00156205;
90% Identity: -
80% Identity: -