Basic Information

Insect: Coenonympha arcania
Gene Symbol: -
Assembly: GCA_036785405.1
Location: CM072065.1:13730906-13745019[-]

Transcription Factor Domain

TF Family: MYB
Domain: Myb_DNA-binding domain
PFAM: PF00249
TF Group: Helix-turn-helix
Description: This family contains the DNA binding domains from Myb proteins, as well as the SANT domain family [1].
Hmmscan Out: # of c-Evalue i-Evalue score bias hmm coord from hmm coord to ali coord from ali coord to env coord from env coord to acc

1 17 3.7e-08 5.1e-05 24.1 0.0 3 41 80 118 78 121 0.95

2 17 3.6e-08 5e-05 24.2 0.0 3 41 127 165 125 168 0.95

3 17 3.4e-08 4.6e-05 24.3 0.0 3 41 174 212 172 215 0.95

4 17 4.6e-06 0.0063 17.4 0.0 3 40 221 258 219 259 0.95

5 17 0.00016 0.21 12.5 0.0 4 41 303 340 300 342 0.89

6 17 1.5 2.1e+03 -0.2 0.0 27 41 375 389 366 392 0.85

7 17 5.1e-07 0.0007 20.5 0.0 3 41 398 436 396 439 0.95

8 17 5e-08 6.8e-05 23.7 0.0 3 41 445 483 443 486 0.95

9 17 3.4e-08 4.6e-05 24.3 0.0 3 41 492 530 490 533 0.95

10 17 3.4e-08 4.6e-05 24.3 0.0 3 41 539 577 537 580 0.95

11 17 3.4e-08 4.6e-05 24.3 0.0 3 41 586 624 584 627 0.95

12 17 6.1e-05 0.083 13.9 0.0 3 41 633 671 631 674 0.94

13 17 3.4e-08 4.6e-05 24.3 0.0 3 41 680 718 678 721 0.95

14 17 2.5e-07 0.00035 21.5 0.0 3 37 727 761 725 766 0.93

15 17 3.3e-08 4.5e-05 24.3 0.0 3 41 774 812 772 816 0.95

16 17 3.3e-07 0.00045 21.1 0.0 3 41 821 859 819 864 0.93

17 17 8.5e-08 0.00012 23.0 0.0 3 41 868 906 866 909 0.95

#	of	c-Evalue	i-Evalue	score	hmm coord from	hmm coord to	ali coord from	ali coord to	env coord from	env coord to	acc
1	17	3.7e-08	5.1e-05	24.1	3	41	80	118	78	121	0.95
2	17	3.6e-08	5e-05	24.2	3	41	127	165	125	168	0.95
3	17	3.4e-08	4.6e-05	24.3	3	41	174	212	172	215	0.95
4	17	4.6e-06	0.0063	17.4	3	40	221	258	219	259	0.95
5	17	0.00016	0.21	12.5	4	41	303	340	300	342	0.89
6	17	1.5	2.1e+03	-0.2	27	41	375	389	366	392	0.85
7	17	5.1e-07	0.0007	20.5	3	41	398	436	396	439	0.95
8	17	5e-08	6.8e-05	23.7	3	41	445	483	443	486	0.95
9	17	3.4e-08	4.6e-05	24.3	3	41	492	530	490	533	0.95
10	17	3.4e-08	4.6e-05	24.3	3	41	539	577	537	580	0.95
11	17	3.4e-08	4.6e-05	24.3	3	41	586	624	584	627	0.95
12	17	6.1e-05	0.083	13.9	3	41	633	671	631	674	0.94
13	17	3.4e-08	4.6e-05	24.3	3	41	680	718	678	721	0.95
14	17	2.5e-07	0.00035	21.5	3	37	727	761	725	766	0.93
15	17	3.3e-08	4.5e-05	24.3	3	41	774	812	772	816	0.95
16	17	3.3e-07	0.00045	21.1	3	41	821	859	819	864	0.93
17	17	8.5e-08	0.00012	23.0	3	41	868	906	866	909	0.95

Sequence Information

Coding Sequence: ATGCAGCTAGTGTTGGACACTGTAATAGTGTCCAACACTAGCTGCATTTCCTCGTTTAACAGCATCAAGGAAAGCCCCGGAGCCACCGAAAAAACCAGAATCAGCTCCCGTGCCACAAGTCAAGCTGGGGCCGTCATAAAGCCAACTGAAAGCGGTCGCAAAGTGACCTCAGTAGTGCACGAAGCCGCCTGCGTTCCCGGCGAAGAGAACAAGAAACGCAGCCGGAAGCGCTGCCCGAACTGGACCCACGACGAGACCGTGCGCTTctaccgcgcgctcgccgcgctgggcactgacttcaccctcatgacggagctgttccccggccgctccaggaagaatctcaaactgaagCGACGCAGCCGCAAGCGCTGCCCGAGCTGGACCGACGACGAGACCGTGCGCTTctaccgcgcgctcgccgcgctgggcACTGACTTCACCCTCATGACGGAGCTGTTCCCCGGCCGCTCCAAGAAGAATCTCAAACTGAAGCGACGCAGCCGCAAGCGCTGCCCGAGCTGGACCGACGACGAGACCGTGCGCTTctaccgcgcgctcgccgcgctgggcACTGACTTCACCCTCATGACGGAGCTGTTCCCCGGCCGCTCCAGGAAGAATCTCAAACTGAAGCGACGCAGCCGCAAGCGCTGCCCGAGCTGGACCGACGACGAGACCGTGCGCTTCTACCGCACGCTCGTTGCGCTGGGCACTGACTTCACCCTCATGACGGAGCTGTTCCCCGGCCGCTCCAGGAAGAATCTCAAACTGAAGGAGCTGTCGAAACCCCTGAAACATCCTCGCTCGTTCAATGAGAAGGTTGCGGATTGGCAGTCTTCATATGGAGTTACAGACGCGAAGTTATGCAGTGCTGCGCGACGCAGCCGCAAGCGCTGCCCGAGCTGGACCGACAACGTGACCGTGCGCTTctaccgcgcgctcgccgcgctgggcACTGACTTCACCCTCATGACGGAGCTGTTCCCCGGCCGCTCCAGGAAGAATCTCAAACTGAAGGTATGTAGCGACGCAGCCGCAAGCGCTGTCCGAGCTGGACCGACGACGAGACCGTGCGCTTCTACCGCGCGCTCCGCGCTCGGCACTGACGTCACCCTCATGACGGAGCTGTTCCCCGGCCGCTCCAGGAAGAATCTCAAACTGAAGCGACGCAGCCGCAAGCGCTGCCCGAGCTGGACCGACGACGAGACCGTGCGCTTctaccgcgcgctcgccgcgctgggcACTGACTTCACCCTCATGACGGAGCTGTTCGCCGGCCGCTCCAGGAAGAATCTCAAACTGAAGCGACGCAGCCGCAAGCGCTGCCTGAGCTGGACCGACGACGAGATCGTGCGCTTttaccgcgcgctcgccgcgctgggcactgacttcaccctcatgacggagctgttccccggccgctccaggaagaatctcaaactgaagCGACGCAGCCGAAAGCGCTGCCCGAGCTGGACCGACGACGAGACCGTGCGCTTctaccgcgcgctcgccgcgctgggcACTGACTTCACCCTCATGACGGAGCTGTTCCCCGGCCGCTCCAGGAAGAATCTCAAACTGAAGCGACGCAGCCGCAAGCGCTGCCCGAGCTGGACCGACGACGAGACCGTGCGCTTctaccgcgcgctcgccgcgctgggcACTGACTTCACCCTCATGACGGAGCTGTTCCCCGGCCGCTCCAGGAAGAATCTCAAACTGAAGCGACGCAGCCGCAAGCGCTGCCCGAGCTGGACCGACGACGAGACCGTGCGCTTctaccgcgcgctcgccgcgctgggcACTGACTTCACCCTCATGACGGAGCTGTTCCCCGGCCGCTCCAGGAAGAATCTCAAACTGAAGCGACGCAGCCGAAAGCGCTGCCCGAGCTGGATCGACGACGAGACCGTGCGCTTctaccgcgcgctcgccgcgctgggcACTGACTTCACCCTCATGACGGAGCTGTTCCCCGGCCACTCCAGGAAGAATCTAAAACTGAAGCGACGCAGCCGAAAGCGCTGCCCGAGCTGGACCGACGACGAGACCGTGCGCTTctaccgcgcgctcgccgcgctgggcACTGACTTCACCCTCATGACGGAGCTGTTCCCCGGCCGCTCCAGGAAGAATCTCAAACTGAAGCGACGCAGCCGCAAGCGCTGCCCGAGCTGGACCGACGACGAGACCGTGCGCTTctaccgcgcgctcgccgcgctgggcACTGACTTCACCCTCATGACGGAGCTGTTCCCCGGCCGCTCCAGGAAGAATTTCAAACTGAAGcgacgcagccgcaagcgctgcccgagctggaccgacgacgagaccgtgcgcttctaccgcgcgctcgccgcgctgggcACTGACTTCACCCTCATGACGGAGCTGTTCCCCGGCCGCTCCAGGAAGAATCTCAAACTGAAGCGACGCAGCCGCAAGCGCTGCCGGAGCTGGACCGACGACGAGACCGTGCGCTTctaccgcgcgctcgccgcgctgggcACTGACTTCACCCTCATGACGGAGCTGTTCCCCGGCCACTCCAGGAAGAATCTAAAACTGAAGCGACGCAGCCACAAGCGCTGCCCGAGCTGGACCGACGACGAGACCGTGCGCTTctgccgcgcgctcgccgcgctgggcACTGACTTCACCCTCATGACGGAGCTGTTCCCCGGCCGCTCCAGGAAGAATCTCAAACTGAAGGTATGTAGCGAACTTAATTTTATAACGTAG
Protein Sequence: MQLVLDTVIVSNTSCISSFNSIKESPGATEKTRISSRATSQAGAVIKPTESGRKVTSVVHEAACVPGEENKKRSRKRCPNWTHDETVRFYRALAALGTDFTLMTELFPGRSRKNLKLKRRSRKRCPSWTDDETVRFYRALAALGTDFTLMTELFPGRSKKNLKLKRRSRKRCPSWTDDETVRFYRALAALGTDFTLMTELFPGRSRKNLKLKRRSRKRCPSWTDDETVRFYRTLVALGTDFTLMTELFPGRSRKNLKLKELSKPLKHPRSFNEKVADWQSSYGVTDAKLCSAARRSRKRCPSWTDNVTVRFYRALAALGTDFTLMTELFPGRSRKNLKLKVCSDAAASAVRAGPTTRPCASTARSALGTDVTLMTELFPGRSRKNLKLKRRSRKRCPSWTDDETVRFYRALAALGTDFTLMTELFAGRSRKNLKLKRRSRKRCLSWTDDEIVRFYRALAALGTDFTLMTELFPGRSRKNLKLKRRSRKRCPSWTDDETVRFYRALAALGTDFTLMTELFPGRSRKNLKLKRRSRKRCPSWTDDETVRFYRALAALGTDFTLMTELFPGRSRKNLKLKRRSRKRCPSWTDDETVRFYRALAALGTDFTLMTELFPGRSRKNLKLKRRSRKRCPSWIDDETVRFYRALAALGTDFTLMTELFPGHSRKNLKLKRRSRKRCPSWTDDETVRFYRALAALGTDFTLMTELFPGRSRKNLKLKRRSRKRCPSWTDDETVRFYRALAALGTDFTLMTELFPGRSRKNFKLKRRSRKRCPSWTDDETVRFYRALAALGTDFTLMTELFPGRSRKNLKLKRRSRKRCRSWTDDETVRFYRALAALGTDFTLMTELFPGHSRKNLKLKRRSHKRCPSWTDDETVRFCRALAALGTDFTLMTELFPGRSRKNLKLKVCSELNFIT

Similar Transcription Factors

Sequence clustering based on sequence similarity using MMseqs2

100% Identity: -
90% Identity: -
80% Identity: -