Basic Information

Insect: Drosophila lacertosa
Gene Symbol: -
Assembly: GCA_004143845.1
Location: SCDZ01000078.1:65478-79167[+]

Transcription Factor Domain

TF Family: THAP
Domain: THAP domain
PFAM: PF05485
TF Group: Zinc-Coordinating Group
Description: The THAP domain is a putative DNA-binding domain (DBD) and probably also binds a zinc ion. It features the conserved C2CH architecture (consensus sequence: Cys - 2-4 residues - Cys - 35-50 residues - Cys - 2 residues - His). Other universal features include the location of the domain at the N-termini of proteins, its size of about 90 residues, a C-terminal AVPTIF box and several other conserved residues. Orthologues of the human THAP domain have been identified in other vertebrates and probably worms and flies, but not in other eukaryotes or any prokaryotes [1].
Hmmscan Out: # of c-Evalue i-Evalue score bias hmm coord from hmm coord to ali coord from ali coord to env coord from env coord to acc

1 29 4 9.2e+03 -2.3 3.0 49 63 130 151 114 166 0.56

2 29 4.2e-15 9.7e-12 45.7 4.3 1 86 372 444 372 445 0.85

3 29 2.6e-15 6e-12 46.4 4.6 1 87 472 541 472 541 0.83

4 29 8.4e-13 1.9e-09 38.3 0.3 1 82 563 630 563 633 0.79

5 29 7e-16 1.6e-12 48.2 5.7 1 87 655 725 655 725 0.82

6 29 6e-15 1.4e-11 45.2 3.1 1 86 749 820 749 821 0.82

7 29 8.4e-13 2e-09 38.3 0.6 1 87 856 924 856 924 0.80

8 29 5.9e-11 1.4e-07 32.4 1.8 1 86 970 1039 970 1040 0.77

9 29 1.4e-16 3.2e-13 50.4 0.2 1 86 1067 1136 1067 1137 0.83

10 29 5.7e-13 1.3e-09 38.9 0.9 1 86 1158 1227 1158 1228 0.81

11 29 1.2e-16 2.8e-13 50.6 1.3 1 86 1255 1326 1255 1327 0.85

12 29 6.4e-14 1.5e-10 41.9 2.6 1 85 1386 1454 1386 1456 0.81

13 29 3.9e-12 9e-09 36.2 0.1 1 86 1479 1547 1479 1548 0.81

14 29 7.1e-15 1.6e-11 45.0 1.6 1 87 1742 1811 1742 1811 0.81

15 29 2.7e-11 6.3e-08 33.5 0.1 1 62 1879 1941 1879 1958 0.77

16 29 0.00032 0.74 10.8 0.0 1 58 1961 2013 1961 2031 0.79

17 29 9.6e-13 2.2e-09 38.1 1.0 1 87 2052 2122 2052 2122 0.86

18 29 3.8e-13 8.8e-10 39.4 0.3 1 86 2177 2246 2177 2247 0.83

19 29 3.9e-13 9e-10 39.4 0.9 1 86 2282 2353 2282 2354 0.81

20 29 4.4e-11 1e-07 32.8 0.8 1 87 2364 2431 2364 2431 0.85

21 29 3.9e-14 9.1e-11 42.6 0.0 1 86 2455 2526 2455 2527 0.83

22 29 0.00014 0.31 12.0 0.0 1 58 2560 2610 2560 2631 0.80

23 29 1.2e-15 2.8e-12 47.4 0.3 1 86 2649 2722 2649 2723 0.81

24 29 2.7e-14 6.3e-11 43.1 0.6 1 86 2838 2910 2838 2911 0.82

25 29 3.4e-14 7.8e-11 42.8 1.9 1 86 2974 3044 2974 3045 0.83

26 29 6.1e-15 1.4e-11 45.2 4.2 1 86 3158 3228 3158 3229 0.85

27 29 4.2e-13 9.8e-10 39.3 0.0 1 87 3318 3388 3318 3388 0.83

28 29 4e-09 9.3e-06 26.5 0.2 1 58 3406 3454 3406 3462 0.87

29 29 7.1e-07 0.0017 19.3 2.3 18 87 3471 3529 3460 3529 0.75

#	of	c-Evalue	i-Evalue	score	bias	hmm coord from	hmm coord to	ali coord from	ali coord to	env coord from	env coord to	acc
1	29	4	9.2e+03	-2.3	3.0	49	63	130	151	114	166	0.56
2	29	4.2e-15	9.7e-12	45.7	4.3	1	86	372	444	372	445	0.85
3	29	2.6e-15	6e-12	46.4	4.6	1	87	472	541	472	541	0.83
4	29	8.4e-13	1.9e-09	38.3	0.3	1	82	563	630	563	633	0.79
5	29	7e-16	1.6e-12	48.2	5.7	1	87	655	725	655	725	0.82
6	29	6e-15	1.4e-11	45.2	3.1	1	86	749	820	749	821	0.82
7	29	8.4e-13	2e-09	38.3	0.6	1	87	856	924	856	924	0.80
8	29	5.9e-11	1.4e-07	32.4	1.8	1	86	970	1039	970	1040	0.77
9	29	1.4e-16	3.2e-13	50.4	0.2	1	86	1067	1136	1067	1137	0.83
10	29	5.7e-13	1.3e-09	38.9	0.9	1	86	1158	1227	1158	1228	0.81
11	29	1.2e-16	2.8e-13	50.6	1.3	1	86	1255	1326	1255	1327	0.85
12	29	6.4e-14	1.5e-10	41.9	2.6	1	85	1386	1454	1386	1456	0.81
13	29	3.9e-12	9e-09	36.2	0.1	1	86	1479	1547	1479	1548	0.81
14	29	7.1e-15	1.6e-11	45.0	1.6	1	87	1742	1811	1742	1811	0.81
15	29	2.7e-11	6.3e-08	33.5	0.1	1	62	1879	1941	1879	1958	0.77
16	29	0.00032	0.74	10.8	0.0	1	58	1961	2013	1961	2031	0.79
17	29	9.6e-13	2.2e-09	38.1	1.0	1	87	2052	2122	2052	2122	0.86
18	29	3.8e-13	8.8e-10	39.4	0.3	1	86	2177	2246	2177	2247	0.83
19	29	3.9e-13	9e-10	39.4	0.9	1	86	2282	2353	2282	2354	0.81
20	29	4.4e-11	1e-07	32.8	0.8	1	87	2364	2431	2364	2431	0.85
21	29	3.9e-14	9.1e-11	42.6	0.0	1	86	2455	2526	2455	2527	0.83
22	29	0.00014	0.31	12.0	0.0	1	58	2560	2610	2560	2631	0.80
23	29	1.2e-15	2.8e-12	47.4	0.3	1	86	2649	2722	2649	2723	0.81
24	29	2.7e-14	6.3e-11	43.1	0.6	1	86	2838	2910	2838	2911	0.82
25	29	3.4e-14	7.8e-11	42.8	1.9	1	86	2974	3044	2974	3045	0.83
26	29	6.1e-15	1.4e-11	45.2	4.2	1	86	3158	3228	3158	3229	0.85
27	29	4.2e-13	9.8e-10	39.3	0.0	1	87	3318	3388	3318	3388	0.83
28	29	4e-09	9.3e-06	26.5	0.2	1	58	3406	3454	3406	3462	0.87
29	29	7.1e-07	0.0017	19.3	2.3	18	87	3471	3529	3460	3529	0.75

Sequence Information

Coding Sequence: ATGAAAAAGACGGAGcctgAACCTATAGACGAACATGGTTTCAAGTCCAACTATATCGATGATAATACGCCCTTCGCCGACTTCAGTAAATTTCCCGAATTCGGCGACGACATGCTGAGTCCCAAGGTGGAGCTAACGGTCAAGGATGAGGCCTATGGCAACCAAAAGAACCCCCTCAACTATCCGCGGCGCAAGCTGCAATCGGATCGCTCTGCGGAAAGCCTGCCCATCTGCCAGCGCTGCAAGGAGGTGTTCTTCAAGAAGCAGATCTACCTGCGCCATGTGGccgacagcagctgcagcatccaCGAGTACGAGTTCAAGTGCAATCTCTGCCCCATGTCCTTCATGGGCCCCGAGGAACTGCACaagcacaagcagcagcatcgcGCCGACAAGTTCTTCTGCCACAAATACTGCGGCAAGCACTTCGACACCATTGCCGACTGCGAGTCGCATGAGTACATGCAGCACGAGTACGACAGCTTTGTGTGCAACATGTGCTCCGTGACGTTTGCCACGCGGGAGCAGCTCTACGCTCACCTGCCGCAGCACAAGTTTCAGCAGCGCTACGATTGTCCCGTCTGCCGCTTGTGGTACCAGACGGCGCTCGAGCTGCACGAGCATCGGCTGGCGGCGCCCTACTTCTGCGGCAAGTATTATCCAGCTgcccatcagcagcagcagcagccacactcacaacagcagcaacatgcgcaacagcagcagcagcaacagggcAATTATAAGCTGCAGGATTGCCATATGGGCACCATTGAAATGACACCGACGCATCACAAGCCAAACGATCTGCCGGCAACGGCAGCGCTCAGTTCCTTGCTGCATCAGCGGCAGGCGAACGCGGACGGTGCCGCTTTGTACGCCTCGGCGCTGAAGAGCGAGACGAATGCCAACGTTAATGTGAAGCTGGAACGCAGCTACAGCAACTCCACCAGCGAGTCCGGCTACAGCCTGCACGagagcagcagctacaacaatgCCTACGGCAGCGATAATTCCCTGCatggcggcgccggcgccggtgCGGGCGCTGGAGCAATTGGTGGACCACAGGCGCACTCTTCGACGCTGGACGAATCGGAGGATGCGCTGTGCTGTGTGCCGCTGTGCGGTGTGCGCAAGAGCACCAGCCCCACGCTGCAGTTCTTCACGTTCCCCAAGGACGAGAAGTATCTGCACCAGTGGCTGCACAATCTCAAGATGTTCCACATTCCGGCCTCAAGCTATGCCAGCTTTCGCATCTGCAGCATGCACTTTCCCAAGCGCTGCATCAATCGCTACTCGCTATGCTACTGGGCGGTGCCCACGTTCAATCTGGGCCACGACGACGTGGCCAATCTGTACCAGAACCGCGAGCTGACCAACACCTTCACCACCGGCGAGGTGGCGCGCTGCAGCATGCCCAACTGCACCAGCCAGCGCGGCGAGAGCAATCTCAAGTTCTACAACTTTCCCAAGGATATCAAGAGCCTGATCAAATGGTGCCAGAACGCTCGCCTGCCCGTCCAGGCCAAGGAGCCGCGACACTTTTGCAGCCGCCACTTCGAGGAGCGCTGCATCGGCAAGTTCCGGCTGAAGCCCTGGGCGGTGCCCACACTTCATCTGGGCGCTCAGTACGGCAAGATTCACGACAATCCCAAGAATCTGTATGTGGAGGAGAAGCGCTGTTGCCTCAACTTCTGTCGGCGCAGTCGCTCCTCGGACTTCAACATGTCGCTCTATCGCTTTCCTCGCGACGAGGTCCTGCTGCGTCGTTGGTGCTACAATCTGCGCCTCGATCCGACCGTCTATCGCGGCAAGAATCACAAAATCTGCAGCGCCCACTTTATCAAGGAGGCGCTGGGACTGCGCAAACTGTCGCCGGGTGCTCTGAGTGCGTCCTATATGGGCATGGGTTCAACAACAAGCGGCGGCCTGAACGTCAGCGACAGCATGGACGTGTGCTGTGTGCCCAGCTGCGAGAGCAAGCGgcacaacaacgagaacatcACGTTCCACACGATACCCAGGCGGCCGGAGCAGATGCGCAAGTGGTGCCACAATCTGAAGATAGCCGAGGAGAAGATGCACAAGGGCATGCGCATATGCAGCCTGCACTTCGAGCCCTACTGCATCGGCGGCTGCATGCGTCCGTTTGCGGTGCCCACGCTGCATCTGGGCCACGACGATGACGACATTCATCGCAATCCGGACGTCATCAAAAAGCTGAACATACGCGAAACGTGCTGCGTGGCGGTCTGCAAGCGGAATCGTGACCGCGATCACGCCAATCTACATCGCTTCCCCAGCAACGTCGCCCTGCTGACCAAGTGGTGCGCCAATCTGCAGCGAGCCGTGCCAGACGGCAGCAAGCTCTTCAACGACGCCATCTGCGAGGTGCACTTCGAGGAGCGCTGCCTGCGCAACAAGCGGCTGGAGAAGTGGGCGGTGCCCACGCTAATCCTTGGCCACGAGAACATTGCCTATCCGCTGCCCAGCGCCGAACAGGTGGCCGAGTTCTATGCGCGTCCCAGTGCGCCCAACAACGGCGAGGAGCAGGGCGAGTGCTGTGTGGAGACCTGCAAGCGCAATCCCAGCGTCGACGACATCAAGCTGTATCGTCCGCCCGAGGAGTCGCAGGTGCTCACCAAGTGGGCACACAATCTGCAGCTGGACATCGCCCAGCTGGGCAGCATGCGCATCTGCAATCTGCACTTCGAGTCGCACTGCATCGGCAAGCGCATGCGTCCCTGGGCCATACCCACGCTCAATCTGGCCACCAACATTGAGAATCTCTTCGAGAATCCCGACCACCAAATGCTCTACAAGCGGCGCACGCATCTCAATGCGGATCGTGCAGCGGCCGGCGGCAATTCCAGCTCCATCAAGCCCACGTGGGTGCCACGCTGCTGTCTGCCGCATTGCCGGAAAGTGCGTGCTCTGCACAACGTCCAGCTGTATCGCTTCCCCAAGCTGAATCGGGCCACGCTGGCCAAATGGTCGCACAATCTGCAGGTGCCGCAGGTGGGCAGTGCCCAGCGGCGTTTGTGTAGCGCCCACTTTGAGCCGCATGTGCTGAGCAAGAAGTGCCCGGTGCCGCTGGCGGTGCCCACGCTGGATCTGAACACGCCGCCCGGCTACAAGATCTACCAGAATCCCGCCAAGCTGAAGGCCAACAAGCTGTGTCTGCAGCGCGTCTGCATTGTGGagagctgccgccgccagcggGCGCAGGGCGTCCAGCTCTTCCGGCTGCCGCATAGCCCCACCCAGCTGCGCAAGTGGATGCACAACATCCGGATGCGGCCGCGTGGCGCCATGCGTCAACAATATCGCATCTGTTCGCTGCACTTCGAGACGCACTCGTTCAACGGCAAGCGGCTGAGCAATGGCGCCATTCCGACGCTGGCGCTGGGTCACCAGGACGACGACATCTATCCGAACGAGGCGCAGTCGTTTGTCGAGGAGCACTGCACCGTCGAGGGCTGCGACGCCGCCAAGGAACAGCCGGAGGTGCGCCTCTTCCGCTTCCCCACCGACGACGAGGATCTGCTCTGGAAGTGGTGCAACAATCTCAAAATGAATCCCGTCGACTGCATCGGTGTCCGCATCTGCAATCGTCACTTCGAGCCGGAATGCATCGGGGCCAAGCATCTGTACAAGTGGGCCATTCCCACGATGGCGCTGGGCCACGACGACTCACAGATCGAGCTGATACCCAACCCGAAGCCGGAGCTGCGCTACGTCGATCCGGTGTTCAAGTGCTGCGTGCCGACCTGCGGCAAGACGCGCAAGTTCGACGAGGTCCAGATGAACAGCTTTCCCAAGGATCCGGCGCTGTTCCAGCGCTGGCGCCACAATCTTCGGCTCGAGCATCTCAACTTCAAGGAACGCGAGCGCTACAAGATCTGCAGCGCCCACTTCGAAGACATCTGCATCGGCAAGACGCGGCTCAATATCGGCGCTATACCCACGCTGGAGCTGGGCCACGACGAGACCGACGATCTCTACCAGGTCAATCCCGAGGAGCTGCAGAGCAATCTGTTTGGACGGCAGCGTCGCCTGGGCCTAACCATCAAGCAGGAACTGGACGAGGACACCAAGCCGCTAATTACGCGACAGattaaaCTCAAGAAACCCGCTGGGGAACCAATCTGCTGCGTGGCCAGCTGCCAGCGGAATCGTGTGGAGCACGGCGTGAGGTTCTTTCCCTTTCCCAGCGGCAAGCAGCAGGCGAGCAAGTGGCGCCGCAATCTGCGTCTCAGCGCCGGCGACGTCGACCACACGACGCGCATCTGCAGCGCCCACTTCAATCGGCGGTGCATTGATGGAAGGCAGCTGCGCAGCTGGGCGATGCCCACACAGCAGCTGGGCCACCAGGAGCAGCCCATCCACGAGAATCCCAAGAACATACCGGGCTTCTTTACGCCCACCTGTGCCCTGGCACACTGTCGCCAGCGACGGAGCATCGACAACGATCTGCGCACCTATCGCTATCCGCGCAGCGAGGAGCTGCTCGAGAAGTGGCGGGTCAATCTGCGCCTGGCGCCGGATCAGTGTCGTGGGCGCATCTGCGCCGATCACTTTGAGGCGATGGTGCGCGGCAAGTTGAAGCTGAGGACGGGCGCGGTGCCCACGCTGAAGCTGGGCCACGACGAGGGCGTTGTCTTCGACAACGAGGCCATCAAGGCGGGTCTtcagcaggagctggagcaggacGATATCGATGATATGGAGGAGGAACGCGTCAGTCTCGAATCGCTTGTGAAGGTAAAGAGTGAACGACTCGAGGAGGAGGAAgcggaggaggagcaggaggaggaacAGCCAGAACTAGATGATGAGCAAGAAAATGCTGCTGAGCAGGCACATGGTATGCttgaggaggaggaagagcagcagcagcagccgaatgaagatgaagatgaggATCAGGACTTTTTCGATCCCCTGGAGCTCGTCGAAACATTTGCCGAACAGCACAGCGACGAAGAACAACTATTTAATGATAACGAAGATGACGcctatgatgatgatgatgaggatgatgatgatgctgttgAAGATGCTGAAGGCGATCCCGAAGATGAGGACATACCCGGCAACGAtgatgagctgctgctgccggacACGTTGCCCCTGCGTAGCATGAGAGTTCCATCGGCAGCTCCTCCTGCGCCAGCGCCACGTCGCGAGAAGGCCGTCAACAATGTGACGCCGATTTGCTGTCTGAAGCATTGCCGCAAGGAGCGCACGGCCAGCCACCAGCTGAGCACGTTCGGCTTCCCCaaggatcagcagcagctgcgcaagtGGAGCGCCAatctgcagctgccgctgcccgaCTGCGTCGGCCGCGTCTGCATCGAGCACTTCGAGCCGGAGATGCTCGGCACCCGCAAGCTCAAGCAGAACGCGGTGCCCACCGTCAATCTGGGCCACAACACGCCCCTTGCCTACAGCTGCAACGGATTGGCCAGCGATGCCCAGCAGCCGGAGCATTCGGTTTTTCGGCTTTGGAGCCTGAAACACTGCCGCAAACGGAAGATCGACACGCCGCTGAATCGTCATCGGACTGAGCCTGAGGAGGAggtggagttggagttggagccTGAGCCAAAGTCCAAGCGTCGCTGCTGCCTGCCCAGCTGCGGCAAGCAGGCGCTGCGAGACGGCGTCCAACTGCAGCGTCTGCCGCGAGATCGTCTCCTGCTGCGCAAATGGCTGCACAACCTCAAGCTGTCCGCCCAGCTGGACACCAGCCAGCTGTTTCTCTGCGCAGAGCACTTTGAGCCGCAGGCTCAGCTGCCCACCTTGAAGCTGGGCCACACCGACACCATTTACCGCTGCAGCAACAGGAATGGCCGCGGCAGTGGCAGCTGCCTCGTGCCGAGCTGTCCTTGCGCCAGGCTCAATCTCTATCGCTGCTACGACCTGCCGGAGCATCCGCTGGTGCAGCGCGCCTGGCTGGATTGGCTGCGTCtgtcgccgccgtcgtcgcagCTCGCTAGCCACGCCCAGCTGTGCGTGATGCACTTTATGCAGCTGTTCGAGGAGGTGCCGCTGCCCGAGGAGCTGCCCGCGCTGACGCTGCGTCGCCTGCAGGAGACCTACGATCTGATCGCCAGCTCCAGCATGGCCATGAAGCTGCGCTGCGCCGTGCCCGGCTGCTATTCCAAGTACACGGACAATGTGCGGCTGACCAAGCTACCCGTCTGCCCGGACATGTGCGCCAAGTGGCTCCACAACACCAAGATCCAGTACGATAATGGACGCCACTACATGTACCGCCTGTGCATGCTGCACTTCGAGCCCCACTGCCTCGGCCCGGTGCGTCCCAAGCAGTGGGCGGTGCCCACACTCCACTTAAACCACAGCGACGCCGACATCTATCGCAATCCCCAGCAATCCGACGAGCCCGAGTCCACGCCTCTCGCGGTGCCGCTGCGCATCAGAACCGACCTGCCGCCCGCCGGACCCAGCAGCAGTCCCAGCGCCAGCCCGAGTCCGCGCGGCAAGCAGCGCATCTGCTGCCTGCCCAGCTGCGGCCAGCAGGCGAACGCCCAGACGCGTCTCTATCGGTTCCCCAGTGCCGAGACGGCGCTGCTCAAGTGGCTGGTtaacacgcagcagcagccgcgccTTGTGGACGCCCAGCAGCTGTTCGTCTGCCAGGCGCACTTTGAGCCCGAGGCCATTTGCGCCAAGCAGCTGCGCGGCTGGGCGCTGCCCACGCTCCAGCTGGGCCACGACGATCACGTGATACCCAATGCCCGGCACAACGGCAACATTGTCAACGGCCAGGAGGACAGGCAGGCTCTGCAATACATCTGGGCCAACTACTGCTCGGTGCTCAGCTGCTTCCAGCGGCGCAGCGAGCAAGTGCGTCTCTATGCCTATCCCGCAGATCGGCCCATTGTGCGCCGCTGGGCGAACAATTGCAAGCATCGCTCCATGCAGGCCAGCAGCGATGGCTTCCAGGTCTGTCAGTCGCACTTTGCGCCCGACTGCTTTGAGCCGTCGACGGGCGAACTGAAGCCGGAGGCGGTGCCCACGCTGGAGCTGAGTCGACCCGTGCTGGAGTCGCGCTGCGTGGTCAGCGGCTGCCTCGCGCGGCGTCGCCTGCTACGCATGCCGAAGCGCACCACGCAGCTGGAGGACTGGTGTCACAATCTGCGCCTGGATCCGGCCACGTTGAGCGGCCAGGAGCCGCACGTCTGCGAGCGTCACTTTGAGCCGCACTGCTTCAACATCTATCGGCAGCTGCGCGTGGGCGCCCGACCCACGCTGCATCTGGGCCACGACAGCTCGACCGTGGACGTGCTGCCCAATCCGGCCAACTGGGAGGAAAACGCGCTCGTCTGCTGCGTGCCACGCTGCGGTCGCTCCCAGGCCACGGACAACGTCCAACTCTTCGTTCTGCCCTATCTGCGCGTGCTCTACGAGAAGTGGCTGCAGAACGTTCGCCTGGAGCCGAGCAGTCGGGATCAGCTGCACGGACTGCGCGTCTGCAGCGTGCACTTCGAGCCCGGCTGCCTGGAGAACGGGCGGCTGCATCTGGGCGCCATGCCCACACTGCAGCTGGGCCACGACGCGCCACTGGAGGAGCTGCACCAAACCGCCGAGCCGCCGACCACGCAGCTGAAGACGCCCAAGCGACCCGCCAGCAGCCATGACTGCTGCTATCCGCAGTGCGTGGAATTGCAGAAGAGCTACCAGCGGATCACGTACGAGCTGCCGCAGCGGGAGAAGCTCCGTGCGTTGTGGCTGTCGTATCTGGGCTTGGAGCAGCTGGGCGCGCAGGCGCTCAAGCTGTGTCCGCTGCACCTGATCGAGCTGTACGAGCACAGCGGCGAGCACTTCGAGCAGCTGGCCGGCGAGGAGCCCCAACTGGACGCCAGCTACGAAGCGTCGCGCAGCTGCGTCCGCATTCGCATCGTCAGCTGCGCAGTGCGTGGCTGCAAGACGCTCAAGCCGCGCGACGCCGCCCAACGGCTGCACGCGCTGCCCGCGCGCCACGACCTGTTGGCCATGTGGCTGCATAatctgcagctggagctgggccagcagcagcgctacACGTACAAGATCTGCAGTCGCCACTTCGAGCCCAGCTGCCACGTGGAGACGACGCGTCGACTGAAGCCCTGGAGCGTGCCCACGTTGGCGTTGCCCGAACGCCCGCCCGACGCGGCGCCGCCACATCCCAATCTCAGCGAGGCCGAGTGGCAGCGCATGGCGGAGGAGCAGCTGCCCAAGCTGGAGGAGCTGCAACCAAAGCTGGAGGAGTTGCAACCTAAGCTGGAGGTGCTGGAGGAGTTGCAACCTAAGCTGGAGGTGCTGCCCAAGCTGGAGCAGCCGCTGGAAATGGGCGCGCTGGAGGTGCTGCTGGAGGTGGGACACGTCGAGGACTGCGCCACGTACGAGCAGATGGACACCAAGGCACTCAGCTATGCCGAGCAGCTGCCGTCGCCGAGTCGCCTGTCGCCGGCATCCGGCAGCGGTCGCAAGTGCAGCGTGCGCGGCTGTCCGGTGACGTCCAACGATGTGGATGGCAGCCTGCGGCTGCACAAGTTTCCCACCGCGCAGGAGGCGCTGCACAAGTGGATGCACAACACCCAGGTGCAGGTGGACAACAACTTTAGCTGGCGCTTTCGCATCTGCAGCTATCACTTTGCGGGCAAGTGCTTCGCTGGCTCGCGCATCCGACGCGGCTCGATGCCCACGCTGCGGCTCGGAGCGCGTCGTCCTGCGCACATCTACGACAACGAGTTCCAGGGCGACACGCTGGCCATCGCTGCGGTCCAATCGCTGTCcaaccaagaagaagcagagcaGCCAGAGTCGGTGCTAACGCCGGAGTCGGAGATCCGCTTGTGTTTGCCCAGCGCTGGGCGGCCGCGCAAGTCGAGCAAGTTCTGCCAGATAGACGGCTGCTCGAATCATCTGACCAGCGAGAATCTTACCCTGCACAAGTTCCCACACTCGACGGACATGTGCGCCAAGTGGCAGCACAACACGCAGGTGCCCTTCGATCCGGAGTTCCGTTGGCGCTATCGCATCTGCAGCGCCCACTTCGAGCCCATCTGCCTGGGCAACATGCGTCTCATGCACGGCAGCGTGCCCACCTTGCGGCTGGGTCCGCGCGCGCCTCGTCAGCTGTTCGACAACGACTTTGCGGCCATTCAGCTGCGCCTCGACAAGGACAAGCGCagccagtcgcagtcgcacCTGGAGCTCGACGACTCCTTCGAGGGCGAACACGAGCAGCAGGACTTGAGTCTGCTGGTGcccgagctgcagctgcacgaGGAACTGGACGAGGATCGCGACTCGGACAATCCAAtcgactacaacaacagctggcaggacgaacagcagcaggacgATCAACTGGAGCAGCTGCCTTTGCAGCGCTTCAAACGCGAGAAGGGCGCCAGCTACAACCCAGTCAAGTCCGGCTACGACAAGTGCTCGCTGGTTCACTGCCAACGGCAGCGTTCGCAGCACGGCGTCCACATCTACAAGTTCCCGCGCTCGCGACATCTGCAGCAGCGCTGGATGCACAATCTGCGCATTCGCTACGACGAGCGGCGGCCCTGGAAGACGATGATCTGCAGCGCCCACTTCGAGCCGCAGTGCATTCGACTGCGCAAGCTGCGTCCGTGGGCGGTGCCCACGCTCCAGCTGGGCAGCAATGTGCCCCGCCAGCTGTACACGAACGCGCAGAGCCAGCGGCAGGCGCAGGTTGAAGCGGGCAGCGAGGGCGACGACTGCGCGGGCCTGGAGCTGGAGACGGACAACAtgctggaggaggaggagtatGACGATGAGTACGATGAGGATGTGGATGCGGAGCTATTGGCGCCCGAGCCGTACATTAAGCGGGAGCGTCGACCGCGAGGCGAGCCGCTGCCGCCGGGCCAGCTGCCGCCCTGGAAGATCAAGCAGTGCTGCCTGCCCTATTGCCGCAGTCCGCGCGGCGACGGCATCAAGCTGTTCCGGCTGCCAAACAACGTCAGCTCCATTCGCAAGTGGGAACAGGCTACAGGCATGCGCTTCTACGAGTCGCAGCGAAATACGAAGCTCATCTGCAGCCGACACTTTGATCCGCTGCTGATCGGCGTGCGCCGGCTGGTGTCGAATGCGGTGCCCACGCTCAATCTGGGACCGCTTGACGCTGAGCGGGCACAGCCTGAGGCGGCCAGTGCGCAGTGCTGCATCGACGATTGCCGCCAGCAGGACACCGACAAGCTGCACAGGTTTCCCAGCGATCCAATGCTGCTGGATCAGTGGTGTCGAACTCTGAATCTGCCGGATGTGGAACGATATGCGGACAGGTACATCTGTGCCGCACACCTGCCCGCCCAGGCGCTGACCTGTCTCGTCTGCGGCGTGGACGATGTCCAGCTGCCCATGGTGGAGCTGCCCGAGAATCGCAATCAGCGCGTCAAATGGTGCTACAATCTGAAAATCGATCCGATACCCAAGTGGGACAACTGGAAACATCTCTGCTGCAAGCACTTCGAGAGCTATTGCTTCGTCAAGCCGGGCTGTCCGCTGCCCGATGCGATGCCCACGCTCCATCTCGGCCACAACGATAGCAATATATTCCTGAACGACTATGCCATAGAGAATCGCAGGATGTTGAGCGTCAAGGATGAGCCTGTCGAGTGCGAGGATCTGACCCTCTAA
Protein Sequence: MKKTEPEPIDEHGFKSNYIDDNTPFADFSKFPEFGDDMLSPKVELTVKDEAYGNQKNPLNYPRRKLQSDRSAESLPICQRCKEVFFKKQIYLRHVADSSCSIHEYEFKCNLCPMSFMGPEELHKHKQQHRADKFFCHKYCGKHFDTIADCESHEYMQHEYDSFVCNMCSVTFATREQLYAHLPQHKFQQRYDCPVCRLWYQTALELHEHRLAAPYFCGKYYPAAHQQQQQPHSQQQQHAQQQQQQQGNYKLQDCHMGTIEMTPTHHKPNDLPATAALSSLLHQRQANADGAALYASALKSETNANVNVKLERSYSNSTSESGYSLHESSSYNNAYGSDNSLHGGAGAGAGAGAIGGPQAHSSTLDESEDALCCVPLCGVRKSTSPTLQFFTFPKDEKYLHQWLHNLKMFHIPASSYASFRICSMHFPKRCINRYSLCYWAVPTFNLGHDDVANLYQNRELTNTFTTGEVARCSMPNCTSQRGESNLKFYNFPKDIKSLIKWCQNARLPVQAKEPRHFCSRHFEERCIGKFRLKPWAVPTLHLGAQYGKIHDNPKNLYVEEKRCCLNFCRRSRSSDFNMSLYRFPRDEVLLRRWCYNLRLDPTVYRGKNHKICSAHFIKEALGLRKLSPGALSASYMGMGSTTSGGLNVSDSMDVCCVPSCESKRHNNENITFHTIPRRPEQMRKWCHNLKIAEEKMHKGMRICSLHFEPYCIGGCMRPFAVPTLHLGHDDDDIHRNPDVIKKLNIRETCCVAVCKRNRDRDHANLHRFPSNVALLTKWCANLQRAVPDGSKLFNDAICEVHFEERCLRNKRLEKWAVPTLILGHENIAYPLPSAEQVAEFYARPSAPNNGEEQGECCVETCKRNPSVDDIKLYRPPEESQVLTKWAHNLQLDIAQLGSMRICNLHFESHCIGKRMRPWAIPTLNLATNIENLFENPDHQMLYKRRTHLNADRAAAGGNSSSIKPTWVPRCCLPHCRKVRALHNVQLYRFPKLNRATLAKWSHNLQVPQVGSAQRRLCSAHFEPHVLSKKCPVPLAVPTLDLNTPPGYKIYQNPAKLKANKLCLQRVCIVESCRRQRAQGVQLFRLPHSPTQLRKWMHNIRMRPRGAMRQQYRICSLHFETHSFNGKRLSNGAIPTLALGHQDDDIYPNEAQSFVEEHCTVEGCDAAKEQPEVRLFRFPTDDEDLLWKWCNNLKMNPVDCIGVRICNRHFEPECIGAKHLYKWAIPTMALGHDDSQIELIPNPKPELRYVDPVFKCCVPTCGKTRKFDEVQMNSFPKDPALFQRWRHNLRLEHLNFKERERYKICSAHFEDICIGKTRLNIGAIPTLELGHDETDDLYQVNPEELQSNLFGRQRRLGLTIKQELDEDTKPLITRQIKLKKPAGEPICCVASCQRNRVEHGVRFFPFPSGKQQASKWRRNLRLSAGDVDHTTRICSAHFNRRCIDGRQLRSWAMPTQQLGHQEQPIHENPKNIPGFFTPTCALAHCRQRRSIDNDLRTYRYPRSEELLEKWRVNLRLAPDQCRGRICADHFEAMVRGKLKLRTGAVPTLKLGHDEGVVFDNEAIKAGLQQELEQDDIDDMEEERVSLESLVKVKSERLEEEEAEEEQEEEQPELDDEQENAAEQAHGMLEEEEEQQQQPNEDEDEDQDFFDPLELVETFAEQHSDEEQLFNDNEDDAYDDDDEDDDDAVEDAEGDPEDEDIPGNDDELLLPDTLPLRSMRVPSAAPPAPAPRREKAVNNVTPICCLKHCRKERTASHQLSTFGFPKDQQQLRKWSANLQLPLPDCVGRVCIEHFEPEMLGTRKLKQNAVPTVNLGHNTPLAYSCNGLASDAQQPEHSVFRLWSLKHCRKRKIDTPLNRHRTEPEEEVELELEPEPKSKRRCCLPSCGKQALRDGVQLQRLPRDRLLLRKWLHNLKLSAQLDTSQLFLCAEHFEPQAQLPTLKLGHTDTIYRCSNRNGRGSGSCLVPSCPCARLNLYRCYDLPEHPLVQRAWLDWLRLSPPSSQLASHAQLCVMHFMQLFEEVPLPEELPALTLRRLQETYDLIASSSMAMKLRCAVPGCYSKYTDNVRLTKLPVCPDMCAKWLHNTKIQYDNGRHYMYRLCMLHFEPHCLGPVRPKQWAVPTLHLNHSDADIYRNPQQSDEPESTPLAVPLRIRTDLPPAGPSSSPSASPSPRGKQRICCLPSCGQQANAQTRLYRFPSAETALLKWLVNTQQQPRLVDAQQLFVCQAHFEPEAICAKQLRGWALPTLQLGHDDHVIPNARHNGNIVNGQEDRQALQYIWANYCSVLSCFQRRSEQVRLYAYPADRPIVRRWANNCKHRSMQASSDGFQVCQSHFAPDCFEPSTGELKPEAVPTLELSRPVLESRCVVSGCLARRRLLRMPKRTTQLEDWCHNLRLDPATLSGQEPHVCERHFEPHCFNIYRQLRVGARPTLHLGHDSSTVDVLPNPANWEENALVCCVPRCGRSQATDNVQLFVLPYLRVLYEKWLQNVRLEPSSRDQLHGLRVCSVHFEPGCLENGRLHLGAMPTLQLGHDAPLEELHQTAEPPTTQLKTPKRPASSHDCCYPQCVELQKSYQRITYELPQREKLRALWLSYLGLEQLGAQALKLCPLHLIELYEHSGEHFEQLAGEEPQLDASYEASRSCVRIRIVSCAVRGCKTLKPRDAAQRLHALPARHDLLAMWLHNLQLELGQQQRYTYKICSRHFEPSCHVETTRRLKPWSVPTLALPERPPDAAPPHPNLSEAEWQRMAEEQLPKLEELQPKLEELQPKLEVLEELQPKLEVLPKLEQPLEMGALEVLLEVGHVEDCATYEQMDTKALSYAEQLPSPSRLSPASGSGRKCSVRGCPVTSNDVDGSLRLHKFPTAQEALHKWMHNTQVQVDNNFSWRFRICSYHFAGKCFAGSRIRRGSMPTLRLGARRPAHIYDNEFQGDTLAIAAVQSLSNQEEAEQPESVLTPESEIRLCLPSAGRPRKSSKFCQIDGCSNHLTSENLTLHKFPHSTDMCAKWQHNTQVPFDPEFRWRYRICSAHFEPICLGNMRLMHGSVPTLRLGPRAPRQLFDNDFAAIQLRLDKDKRSQSQSHLELDDSFEGEHEQQDLSLLVPELQLHEELDEDRDSDNPIDYNNSWQDEQQQDDQLEQLPLQRFKREKGASYNPVKSGYDKCSLVHCQRQRSQHGVHIYKFPRSRHLQQRWMHNLRIRYDERRPWKTMICSAHFEPQCIRLRKLRPWAVPTLQLGSNVPRQLYTNAQSQRQAQVEAGSEGDDCAGLELETDNMLEEEEYDDEYDEDVDAELLAPEPYIKRERRPRGEPLPPGQLPPWKIKQCCLPYCRSPRGDGIKLFRLPNNVSSIRKWEQATGMRFYESQRNTKLICSRHFDPLLIGVRRLVSNAVPTLNLGPLDAERAQPEAASAQCCIDDCRQQDTDKLHRFPSDPMLLDQWCRTLNLPDVERYADRYICAAHLPAQALTCLVCGVDDVQLPMVELPENRNQRVKWCYNLKIDPIPKWDNWKHLCCKHFESYCFVKPGCPLPDAMPTLHLGHNDSNIFLNDYAIENRRMLSVKDEPVECEDLTL

Similar Transcription Factors

Sequence clustering based on sequence similarity using MMseqs2

100% Identity: -
90% Identity: -
80% Identity: -