Basic Information

Insect: Ditula angustiorana
Gene Symbol: -
Assembly: GCA_963691745.1
Location: OY829497.1:3957824-3962918[+]

Transcription Factor Domain

TF Family: MYB
Domain: Myb_DNA-binding domain
PFAM: PF00249
TF Group: Helix-turn-helix
Description: This family contains the DNA binding domains from Myb proteins, as well as the SANT domain family [1].
Hmmscan Out: # of c-Evalue i-Evalue score bias hmm coord from hmm coord to ali coord from ali coord to env coord from env coord to acc

1 7 0.079 93 3.9 0.1 1 13 76 88 76 91 0.89

2 7 2.3 2.7e+03 -0.8 0.0 23 43 359 378 352 381 0.86

3 7 0.00068 0.8 10.6 1.7 22 44 458 479 427 481 0.76

4 7 0.051 60 4.5 0.1 23 46 605 627 582 627 0.81

5 7 0.016 19 6.1 0.3 2 30 677 715 676 730 0.70

6 7 0.0003 0.36 11.7 0.2 22 44 859 890 837 892 0.72

7 7 0.44 5.1e+02 1.6 0.2 1 14 1048 1061 1048 1065 0.88

#	of	c-Evalue	i-Evalue	score	bias	hmm coord from	hmm coord to	ali coord from	ali coord to	env coord from	env coord to	acc
1	7	0.079	93	3.9	0.1	1	13	76	88	76	91	0.89
2	7	2.3	2.7e+03	-0.8	0.0	23	43	359	378	352	381	0.86
3	7	0.00068	0.8	10.6	1.7	22	44	458	479	427	481	0.76
4	7	0.051	60	4.5	0.1	23	46	605	627	582	627	0.81
5	7	0.016	19	6.1	0.3	2	30	677	715	676	730	0.70
6	7	0.0003	0.36	11.7	0.2	22	44	859	890	837	892	0.72
7	7	0.44	5.1e+02	1.6	0.2	1	14	1048	1061	1048	1065	0.88

Sequence Information

Coding Sequence: ATGGAGCACATTGTGGTCAAGACTGAAATGCAGCCAAATGAAGAGATACTCTTATTCTATGTGGATGaAGATGGATCCAACGAGCATGGGGTAGTAACGACGATCGAAAATATGGAACAGGCACATGAAGCTCAACTGCAGGCGGATGGTTCTTATCTCGTAGAGAAAAGTTCCGGCGCCGACTTCGATGGAGACAACGTTATGACGGAAGAGCACGCTTGGGTCAAAGACAAATGGACAGACGAAGAGACCAAAAGGCTTCTAGTATTCTACATTGACAACAAAGCAGCTTTTCAGGGTGGATCAACTAGAAAAAGACATCTATGGACAGTTGCTTGCAAGACTATGCTATCAAGCAAGCATTACCACTCTTGTGAAATGAAACTACGCAATTTAAAACGAAAGTACCTTCAGCTACGGGTAGAACAGGACAAAGGGTTCAACGTTATCTGGCCGAATTATCTACTGTGCCATCAGGCGTTTCACGACGACACATTTGTTAAGAATGCCTTAGAAACAGTACAGGCAAAATCGCACCCGAAATCTGTTGTATCCTTACCCGTTAGTACACCTAATGACGATGCAGGCATTGTTGTCGTCAAAAAGGTTAACAGCAAAACGACTGGCGACAGTAATGTGGAAGCTATGTTGACCTTATACCTCAAAAATAAAGGTTCAAGTCATAAGGCAAAGCAGAAAACCTTATGGCAAAGTATAGCATTACAACTAGGCGTGGAAGACGGCGATTATTGGCACAAACGTTTCTTGAATTTCAAGAATAATTACATTAGGTTGTTGGAGAAGAGAAACGTCGAAGGACCGGAGAGTATTAGCTGGCCGTATATGCATCTTTTTGACCAGATTTATGCAGCTGATGAAGAGTTCCAAAAGAAGCATAGACAAGAGCAATTTACGCAACCCATCCAGCACCCGAGTCAGCCACTTCAACAAGTCTCAACAATAACAGAATCATTCGAGCATATATGGAACGATACAGAACTGACTGTGCTGGTCAAATACTACTTTGACTGTTACCAAGAATTCCTGGATAAAACGATTCCGAACAGTTTTCTATGGAATGAGGTGGGGCGTTTGATAGACAAGAGCGCTGATACATGCAAGGCGAAGTTCGAGGAGTTGCGGAAGGAGCATTTAGATAAGTACATCCAAGGCGGATACGAGTTGCGTACTCGCGCGCCGCTAGCAATACTGTTCGATAACATCATATCAAAAGACGTACAACAAGAAATATCTACTAAAACTCTCAAATCAACAGAACATGATGTATGGAAGACTGAAGAAATTGATGAGTTAGTACAGTTTTTCTATATCAATGCAGAGATTTTTAAGGACTCTATCTGTTATTTTGTATGCTGGTCGGCTATTTCTAAGATGCTAAAGAGAAGTGTGGTCGCGTGCAGGAAGCAATGGAAGGAACTAACTGGGCTTTATAAGTCTATTTTGGAAGATAAGAAAGATAATCCAGACATGCAGATAGACTGGCGTTATATTGAATTGTTTGACTGCATATTTGTGTATGGGATGGACGCACATCTCCTAGAGGGCTATGAAAAGTTGCAGGAGCATGATAAAGACGCTGAAAGAGGTGGAGATAAAAGAACCGACTCCAGATCAGATGATGAGAACGAATTTGATGAAAATATCTCTGAAGACGAAGAATCCTACGACGAAAGGGGCTTCATGAAACGTTCTAAACGCCGCCCAGGTGATTCAAAATCCTTCAAAATACTAGAATTTTACCAGAAAAACAAGGAGAAGTTCGCATCCCCTAACCGTAAGAAACTGGCTTTATGGGAGATCCTAGCCAGAGACATAGGCATATCAGCTGCCCAATGTGCCCACAGATTTAGAAACCTCAAACAAGTGTACACAAAATATGTCCAAAGGGAAATTAACAAACCAGAAAAGCCCATACTTTGGCCTTATTACGCGCACTGCAAAAAAGTCTTCGGTTATAGAGCTATCAAATCTAAATTGCGAAACGGCAAGAAAGATACTGACGACGAAGAAGAATGGTCGGCCAAAGAGATAAAACAGTTGATTAATTATTTCTCTCAAAACTTCGATGATATCAATTCAAACCTTGAAGATAAAAGTAAATGGTCCGCCCTAGCTGCTGAGATAGGTAAAGTAGAAGAGACGTGTAGCGAAAAGCTACTGGAACTGCGAAAGTCTTATAGGAAACTTAAGACCATGAAAACTAGGAATCCTGATGTCAAGATCAGTTGGAAATATTTCAACATGTTCGATGAGATATACACGTCGAAAGAGGTTGTTGAGACTGTGCAAGAAATTGAGATGAATGGGGATGGGTATGAAGAATTAAACCTTGCTGATGTTAAGATGGAGGTGCAAGATGATGACTTCCAATGCATAATAGTGATACCAGAGGGCCAAGAGATCGGCGATATGAGCAATGCACAAATAATAATGCCAGAAAGCGCTGAAGCTCAGCCATATTTACAGGTCCAAGTTGAAAAACCGGTAAATAAATGGAccaagaaaacaaagaaaacctTATTGATACATTATATCAACTACTTGAGATTAAACAGAGGTAAAGAAATAAGTTCAGCAGAAATGTGGAAGGAAATAGCAGCAAAATTAGGAGATAAATCGCCTCTGTCATGTAGAAAGATGTTTGTTAAACTTAAGAGTAATCACATGCAGTCAGCAAACGAAGAAGACCccaataaaaagaaaactccaTATTACACACTGGTTGAAAAAATCTTGGCATTGAAACCCAAATTCGCTAAAACGGGAcgaaagaaaactttaaaagagGATAAAGTCTACAAAGATGTGCAAATACCGGATTTAAAGGTCCAACAAGCTCTACAGTACTATCTGGAACATATTGATGAATTCGTCAGTCCGAAATTCGAGAAGAAATATTTATGGACTGAGCTATCCAGTTTCATATCAGAACCGCTtactaaaatattcaataaGATAAGTTTCATGAAGCAAAATTTCAACATGGAAAGTGGAGAGGTGGCTGGTGAACAGACTTCTTTTACAGATATTTTAAAGGAAATCATGACTAAAGAAACAGAGCTGAAAAATGACATTCAAAATGAGCCCATACCTGTTATTGTTGAACCCGATCAGGATGTAAAAGATGCTTGGACGGATGTGGAAACTGAACAACTCCTCAGTTGGTACTTAGCCAATCTGGAGAAATTCAAGAACCCTAAATTTGTACGGAGTTACCTTTGGATGGAAGCGTCAGATATTCTGAAGAAGAGCGCTTTAAATTGTTCCAAGAAGATGACAGAAGTACGCACCCAGTACAAGAAGTTGATAAAAGAGAGCCCCGAAGAGTTGGATGATTGGAAATTCTACGATTTGTGTCAAAAGATTTATGGAACAGGAAAGAAGAATAACTCGGAAAGTATTATGATATTGGAAACTTCACAGACCGTGTAA
Protein Sequence: MEHIVVKTEMQPNEEILLFYVDEDGSNEHGVVTTIENMEQAHEAQLQADGSYLVEKSSGADFDGDNVMTEEHAWVKDKWTDEETKRLLVFYIDNKAAFQGGSTRKRHLWTVACKTMLSSKHYHSCEMKLRNLKRKYLQLRVEQDKGFNVIWPNYLLCHQAFHDDTFVKNALETVQAKSHPKSVVSLPVSTPNDDAGIVVVKKVNSKTTGDSNVEAMLTLYLKNKGSSHKAKQKTLWQSIALQLGVEDGDYWHKRFLNFKNNYIRLLEKRNVEGPESISWPYMHLFDQIYAADEEFQKKHRQEQFTQPIQHPSQPLQQVSTITESFEHIWNDTELTVLVKYYFDCYQEFLDKTIPNSFLWNEVGRLIDKSADTCKAKFEELRKEHLDKYIQGGYELRTRAPLAILFDNIISKDVQQEISTKTLKSTEHDVWKTEEIDELVQFFYINAEIFKDSICYFVCWSAISKMLKRSVVACRKQWKELTGLYKSILEDKKDNPDMQIDWRYIELFDCIFVYGMDAHLLEGYEKLQEHDKDAERGGDKRTDSRSDDENEFDENISEDEESYDERGFMKRSKRRPGDSKSFKILEFYQKNKEKFASPNRKKLALWEILARDIGISAAQCAHRFRNLKQVYTKYVQREINKPEKPILWPYYAHCKKVFGYRAIKSKLRNGKKDTDDEEEWSAKEIKQLINYFSQNFDDINSNLEDKSKWSALAAEIGKVEETCSEKLLELRKSYRKLKTMKTRNPDVKISWKYFNMFDEIYTSKEVVETVQEIEMNGDGYEELNLADVKMEVQDDDFQCIIVIPEGQEIGDMSNAQIIMPESAEAQPYLQVQVEKPVNKWTKKTKKTLLIHYINYLRLNRGKEISSAEMWKEIAAKLGDKSPLSCRKMFVKLKSNHMQSANEEDPNKKKTPYYTLVEKILALKPKFAKTGRKKTLKEDKVYKDVQIPDLKVQQALQYYLEHIDEFVSPKFEKKYLWTELSSFISEPLTKIFNKISFMKQNFNMESGEVAGEQTSFTDILKEIMTKETELKNDIQNEPIPVIVEPDQDVKDAWTDVETEQLLSWYLANLEKFKNPKFVRSYLWMEASDILKKSALNCSKKMTEVRTQYKKLIKESPEELDDWKFYDLCQKIYGTGKKNNSESIMILETSQTV

Similar Transcription Factors

Sequence clustering based on sequence similarity using MMseqs2

100% Identity: iTF_00342158;
90% Identity: -
80% Identity: -