Basic Information

Insect: Coronaproctus castanopsis
Gene Symbol: -
Assembly: GCA_032883995.1
Location: CM065052.1:260973444-260975867[-]

Transcription Factor Domain

TF Family: MYB
Domain: Myb_DNA-binding domain
PFAM: PF00249
TF Group: Helix-turn-helix
Description: This family contains the DNA binding domains from Myb proteins, as well as the SANT domain family [1].
Hmmscan Out: # of c-Evalue i-Evalue score bias hmm coord from hmm coord to ali coord from ali coord to env coord from env coord to acc

1 7 1.2e-07 0.00042 21.9 0.0 2 43 333 376 332 379 0.89

2 7 7.9e-11 2.8e-07 32.0 0.0 2 42 384 429 383 433 0.92

3 7 1.2e-06 0.0042 18.7 0.0 1 44 439 481 439 482 0.82

4 7 1.7e-13 6.1e-10 40.6 0.3 2 42 489 530 488 534 0.96

5 7 3.6e-15 1.3e-11 45.9 0.3 1 45 570 615 570 616 0.97

6 7 4e-13 1.4e-09 39.4 0.1 4 45 659 701 657 702 0.97

7 7 8.7e-12 3.1e-08 35.1 0.1 2 43 742 784 741 787 0.96

#	of	c-Evalue	i-Evalue	score	bias	hmm coord from	hmm coord to	ali coord from	ali coord to	env coord from	env coord to	acc
1	7	1.2e-07	0.00042	21.9	0.0	2	43	333	376	332	379	0.89
2	7	7.9e-11	2.8e-07	32.0	0.0	2	42	384	429	383	433	0.92
3	7	1.2e-06	0.0042	18.7	0.0	1	44	439	481	439	482	0.82
4	7	1.7e-13	6.1e-10	40.6	0.3	2	42	489	530	488	534	0.96
5	7	3.6e-15	1.3e-11	45.9	0.3	1	45	570	615	570	616	0.97
6	7	4e-13	1.4e-09	39.4	0.1	4	45	659	701	657	702	0.97
7	7	8.7e-12	3.1e-08	35.1	0.1	2	43	742	784	741	787	0.96

Sequence Information

Coding Sequence: ATGTCCTCCGAAATAGGTCAATTTTTGCGCGACATTTATACTAAATGTGCTGACGTAGTCGAAGACGCATTATTTGATGACGTAAATGACGAGCATATCGATAATGATGATTTCGAGGAAATTAAAATCGGAACGAATTTCGACCGGAGCTGCAACGATAAAGCTGACGACAACGAATGTGTATCAGAAGTCGCGAAGTTATTGTCGCGAACTTCGGCAATTTGTTCCGTCATAGTTAACGAAGCGTTAGACTATGAGATTAACGACGACTATCAACCGGGCGACAACGATAATTCGCACAATGACGATTTGATCGTTCGCGACACGTTGGTTACGCcgtacgaaaaattaaattcgttgGTAAACGACGACTTATCCGACCGTTTAGGCGTATTAGAACGTAAACAACGTCAATTGGACGAACatttgaaacgtttaaaaacTAAGCGTCAACGTATAGACGTTTTAATACGGAAAACGGAACGGACGTTAAAGGTTCATAACTTATCTAAAGAAATACGTACGGAAAAGAGAGAGACGAATGTCGAAacggaaaaagaagaaaaagataaaacgaAAGACGTCTACTATAAATTCggtataaattactttaaagataataaaggatataattGTCCGTACGAAAATAACGATACTAAAGCCATGCGTCGAACCGGtcatattatgttattagaCATGAATGCGCATCACTTTTTCAAGGAaaaacatttagaaaatttaaaaaatttactagtTAAATATTGGCTCGATCGCGTACCGTCCTTTAATAAacgaactaataataataataataataataataataaaaataataataagcggTTCCTTAGAgatttcgaacgattattagaGGAAAATGCGGATAAACCGATCGACTGGCTAGCGTTAGCGGCGAAAAGTAAGTGGAAATTATGGTCGAATCCGAGAGTTTGTCAGGACGCTTTTAATACGCGTTTAAATCCGAAATACACGAAAACCACCTTCACCCAGGAAGAACAATATAAATTGGCCGATTTAGCGAAAGAGTTTAATTATCGTAATTGGGATGAAATCGCCGCGCGATTGGGCGGCGATAAAGACGCTTTTCAATGTTTCGTCTACTATATGTGTTGGTTAGATAACGAACGGCAAATCTGGACGCCGGAAGATGATGATTTATTGAAACGATGCGTTCGGAAATATCGTAATAACGACGGTAGCGTAAGCTGGGCCCAAGTATCGACTGAATTCCCGCGCAGAAGTAGTTTCCAGTGTTATATTCGATATACGCATCGTCTGAAAGAAGGACTTAAAAAAGGTCATTTTACGACCGAAGAAGCGAATCTGGTTAGGAAATATCGAACGGACGGATGTAGTTTCGGCGAAATCGCCCAAATAATGGGAGATCGTTCAACGTCGCAAATTAGAgactattttcaaaataaaacgaaaacgaCCAATCAAGGTAGATGGTCGGTTCGTGAAACGTTAGCCTTGATACGAGCTATCAAACAATACGGTATAGGAAAATGGTCGGAAATTTCGAAACGATTGATCGGTCGCGATCGAACGCAGTGCCGTTTGAAATTCGAACATTTACGTCAGTTAGGTTACGACGATTTAGATCGCGCTTTGAAAGATTTCGCCGAATTAAACGACGATTTCGATGAAGTTcgtaaaatttcgaataaacgaaaaaaccCTCTCCGAAATAGATGGTCGGCGAAGGAAACGTTACAGTTAATACGAGCTATCAAAGAATGCGGTATCGGAAAATGGTCggaaatttccgaaaaattgGTCGGTCGCGATCCGATTCAGTGCCGTTCGAAATTCCAAAATTTACGTCGGATGGGTTACGACGACGATTTGGATCGCGCATTGAACGATTTCGCCGAAGCCAGCGACGTTGACGACGATCTCGCGCAAGTTCGGACAGTTTTGACAAAAAGGAAAAGACTTGGTCCGAGTATTTGGTCTGCGCAGGAAACGTCGGACTTAATACGAGCTATCAAGGAATGCGGTATCGGAAAATGGTCggaaatttccgaaaaattgGTCGGTCGCGATCCGATTCAGTGCCGTTCGAAATTCCACAATTTACGTCGGATGGGTTACGACGATTTGGATCGCGCATTGAACGATTTCGCCGAAGCCAGTGACGTTGACGACGATCTCGCGCAAGTTCGGACAGTtttgaaaaaaaggaaaacactTGGTCCGGGTGTTTGGTCTGCGCAGGAAACGTCCGACTTAATACGAGCTATCAAGGAATGCGGTATTGGAGAATGGTCGGAAATTTCTAAAAGATTGGTAGGCCATGATCCGACTCAGTGTCGTTTAAAATTCCAATGTTTACGTCGAATGGGTTACGACTTTTTAACCGAATTCGGGGACGTTTTCGGAGAACCCGGTCCGAGTTAA
Protein Sequence: MSSEIGQFLRDIYTKCADVVEDALFDDVNDEHIDNDDFEEIKIGTNFDRSCNDKADDNECVSEVAKLLSRTSAICSVIVNEALDYEINDDYQPGDNDNSHNDDLIVRDTLVTPYEKLNSLVNDDLSDRLGVLERKQRQLDEHLKRLKTKRQRIDVLIRKTERTLKVHNLSKEIRTEKRETNVETEKEEKDKTKDVYYKFGINYFKDNKGYNCPYENNDTKAMRRTGHIMLLDMNAHHFFKEKHLENLKNLLVKYWLDRVPSFNKRTNNNNNNNNNKNNNKRFLRDFERLLEENADKPIDWLALAAKSKWKLWSNPRVCQDAFNTRLNPKYTKTTFTQEEQYKLADLAKEFNYRNWDEIAARLGGDKDAFQCFVYYMCWLDNERQIWTPEDDDLLKRCVRKYRNNDGSVSWAQVSTEFPRRSSFQCYIRYTHRLKEGLKKGHFTTEEANLVRKYRTDGCSFGEIAQIMGDRSTSQIRDYFQNKTKTTNQGRWSVRETLALIRAIKQYGIGKWSEISKRLIGRDRTQCRLKFEHLRQLGYDDLDRALKDFAELNDDFDEVRKISNKRKNPLRNRWSAKETLQLIRAIKECGIGKWSEISEKLVGRDPIQCRSKFQNLRRMGYDDDLDRALNDFAEASDVDDDLAQVRTVLTKRKRLGPSIWSAQETSDLIRAIKECGIGKWSEISEKLVGRDPIQCRSKFHNLRRMGYDDLDRALNDFAEASDVDDDLAQVRTVLKKRKTLGPGVWSAQETSDLIRAIKECGIGEWSEISKRLVGHDPTQCRLKFQCLRRMGYDFLTEFGDVFGEPGPS

Similar Transcription Factors

Sequence clustering based on sequence similarity using MMseqs2

100% Identity: -
90% Identity: -
80% Identity: -