Basic Information

Insect: Drosophila kikkawai
Gene Symbol: -
Assembly: GCA_018152535.1
Location: NW:17522128-17536499[-]

Transcription Factor Domain

TF Family: THAP
Domain: THAP domain
PFAM: PF05485
TF Group: Zinc-Coordinating Group
Description: The THAP domain is a putative DNA-binding domain (DBD) and probably also binds a zinc ion. It features the conserved C2CH architecture (consensus sequence: Cys - 2-4 residues - Cys - 35-50 residues - Cys - 2 residues - His). Other universal features include the location of the domain at the N-termini of proteins, its size of about 90 residues, a C-terminal AVPTIF box and several other conserved residues. Orthologues of the human THAP domain have been identified in other vertebrates and probably worms and flies, but not in other eukaryotes or any prokaryotes [1].
Hmmscan Out: # of c-Evalue i-Evalue score bias hmm coord from hmm coord to ali coord from ali coord to env coord from env coord to acc

1 29 3 5.4e+03 -2.1 1.2 47 62 323 341 308 355 0.56

2 29 2.7e-15 4.9e-12 46.1 4.0 1 86 553 625 553 626 0.85

3 29 1e-14 1.9e-11 44.3 5.0 1 87 653 722 653 722 0.83

4 29 9.4e-16 1.7e-12 47.6 0.2 1 87 744 816 744 816 0.85

5 29 6.5e-16 1.2e-12 48.1 5.3 1 87 914 984 914 984 0.82

6 29 1.1e-15 2e-12 47.4 3.5 1 86 1008 1079 1008 1080 0.82

7 29 7.6e-13 1.4e-09 38.3 1.2 1 87 1115 1183 1115 1183 0.81

8 29 8.3e-11 1.5e-07 31.8 1.4 1 86 1225 1294 1225 1295 0.76

9 29 4e-17 7.2e-14 52.0 0.4 1 86 1322 1391 1322 1392 0.82

10 29 1.3e-12 2.4e-09 37.5 1.4 1 85 1413 1481 1413 1483 0.79

11 29 8.7e-15 1.6e-11 44.5 0.5 1 86 1510 1581 1510 1582 0.85

12 29 1.8e-12 3.3e-09 37.1 3.7 1 85 1656 1724 1656 1726 0.82

13 29 1.2e-12 2.2e-09 37.6 0.1 1 86 1749 1817 1749 1818 0.83

14 29 1.4e-13 2.5e-10 40.7 2.4 1 87 1963 2032 1963 2032 0.80

15 29 5.2e-13 9.5e-10 38.8 0.1 1 87 2125 2199 2125 2199 0.81

16 29 0.00022 0.41 11.2 0.7 1 60 2214 2265 2214 2280 0.75

17 29 2.2e-11 4e-08 33.6 0.1 1 87 2293 2364 2293 2364 0.78

18 29 7e-13 1.3e-09 38.4 0.4 1 87 2416 2486 2416 2486 0.82

19 29 3.3e-12 6.1e-09 36.2 0.0 1 86 2521 2596 2521 2597 0.82

20 29 3.6e-12 6.6e-09 36.1 0.0 1 86 2607 2680 2607 2681 0.79

21 29 6.2e-12 1.1e-08 35.4 0.0 1 86 2706 2778 2706 2779 0.72

22 29 0.00035 0.64 10.5 0.0 1 58 2808 2858 2808 2881 0.83

23 29 2e-11 3.6e-08 33.7 1.1 1 86 2898 2969 2898 2970 0.81

24 29 6.4e-16 1.2e-12 48.2 0.3 1 86 3095 3167 3095 3168 0.81

25 29 4.6e-12 8.4e-09 35.8 3.4 1 86 3231 3301 3231 3302 0.80

26 29 2.2e-14 3.9e-11 43.2 4.6 1 86 3393 3463 3393 3464 0.84

27 29 4.3e-12 7.9e-09 35.9 0.2 1 86 3546 3615 3546 3616 0.85

28 29 3e-10 5.5e-07 30.0 0.5 1 58 3641 3689 3641 3698 0.83

29 29 3.6e-10 6.6e-07 29.7 1.5 18 87 3707 3765 3696 3765 0.77

#	of	c-Evalue	i-Evalue	score	bias	hmm coord from	hmm coord to	ali coord from	ali coord to	env coord from	env coord to	acc
1	29	3	5.4e+03	-2.1	1.2	47	62	323	341	308	355	0.56
2	29	2.7e-15	4.9e-12	46.1	4.0	1	86	553	625	553	626	0.85
3	29	1e-14	1.9e-11	44.3	5.0	1	87	653	722	653	722	0.83
4	29	9.4e-16	1.7e-12	47.6	0.2	1	87	744	816	744	816	0.85
5	29	6.5e-16	1.2e-12	48.1	5.3	1	87	914	984	914	984	0.82
6	29	1.1e-15	2e-12	47.4	3.5	1	86	1008	1079	1008	1080	0.82
7	29	7.6e-13	1.4e-09	38.3	1.2	1	87	1115	1183	1115	1183	0.81
8	29	8.3e-11	1.5e-07	31.8	1.4	1	86	1225	1294	1225	1295	0.76
9	29	4e-17	7.2e-14	52.0	0.4	1	86	1322	1391	1322	1392	0.82
10	29	1.3e-12	2.4e-09	37.5	1.4	1	85	1413	1481	1413	1483	0.79
11	29	8.7e-15	1.6e-11	44.5	0.5	1	86	1510	1581	1510	1582	0.85
12	29	1.8e-12	3.3e-09	37.1	3.7	1	85	1656	1724	1656	1726	0.82
13	29	1.2e-12	2.2e-09	37.6	0.1	1	86	1749	1817	1749	1818	0.83
14	29	1.4e-13	2.5e-10	40.7	2.4	1	87	1963	2032	1963	2032	0.80
15	29	5.2e-13	9.5e-10	38.8	0.1	1	87	2125	2199	2125	2199	0.81
16	29	0.00022	0.41	11.2	0.7	1	60	2214	2265	2214	2280	0.75
17	29	2.2e-11	4e-08	33.6	0.1	1	87	2293	2364	2293	2364	0.78
18	29	7e-13	1.3e-09	38.4	0.4	1	87	2416	2486	2416	2486	0.82
19	29	3.3e-12	6.1e-09	36.2	0.0	1	86	2521	2596	2521	2597	0.82
20	29	3.6e-12	6.6e-09	36.1	0.0	1	86	2607	2680	2607	2681	0.79
21	29	6.2e-12	1.1e-08	35.4	0.0	1	86	2706	2778	2706	2779	0.72
22	29	0.00035	0.64	10.5	0.0	1	58	2808	2858	2808	2881	0.83
23	29	2e-11	3.6e-08	33.7	1.1	1	86	2898	2969	2898	2970	0.81
24	29	6.4e-16	1.2e-12	48.2	0.3	1	86	3095	3167	3095	3168	0.81
25	29	4.6e-12	8.4e-09	35.8	3.4	1	86	3231	3301	3231	3302	0.80
26	29	2.2e-14	3.9e-11	43.2	4.6	1	86	3393	3463	3393	3464	0.84
27	29	4.3e-12	7.9e-09	35.9	0.2	1	86	3546	3615	3546	3616	0.85
28	29	3e-10	5.5e-07	30.0	0.5	1	58	3641	3689	3641	3698	0.83
29	29	3.6e-10	6.6e-07	29.7	1.5	18	87	3707	3765	3696	3765	0.77

Sequence Information

Coding Sequence: ATGTCACAACACAACCCCAATCACGCCCACCCACACTACCACTACCCGTCCCATACGACGCCGATGgctctgcagcagcagcagcagcagcatcaacagccccAGCAGCACGGCAGTAGTTGGTACTCACATGTTGCTTCCTACCCAGCAGCCTCCCACTCCCACCCCCTCTCCCACTCGGCCTTCGCCCCTGCGCCCCCTTGCAAGGCCAGCataggcaacaacaacaccaacaccattATGGACGCCTACGGAGGTGGAGTGGGAGGGGGTGGAGGCTCGCATGGATATTTCGGCGCCGCTGGCGGTGGCCTCAATGTCAGCGGGGCGGGGGGTGGTGCTGGTTCGTCCTACGGCCTTGGAGCCAACACGGTGGCATATGCTCACAACCAACTGCTGCAGTaccagcatcatcatcagcagcaccagcagcaacagcagccgcagcatcTGGGCCTGGGCCAGCGATCCTATATGGGCCACGATGTCATGGCCGGGAGCTATCCCTATATCAAGAGCGAACCCCTGGAGGGATTCCAGCAGCCGCCCAATCCAATGGCCCCACCCCCGGCCCCAGAAATGATAATAAAATCGGAACCCATTGACGAGCTGGCCTACAAGTCAAACTACATAGACGACAATACGCCATTTGCGGACTTTAGCAAGTTTAGCGATTTCAGCGAGGACATGCTGAGTCCCAAAGTCGAGCTGACAGTCAAGGATGAGTCCTTCGTCAGGAACCCCAATAGCTTTTTACGCCGCAAGCAACAATCGGATCTGACGCCGGCAGAGAGCCTGCCCGTTTGCCAGCGATGCAAGGAGGTGTTCTTCAAGAAGCAGACTTACCTGCGCCACGTCGCCGAGAGCAACTGCGGTATTCAGGAGTACGACTTTAAGTGCATCATATGCCCCATGTCCTTCATGACCGCCgaggagctgcagctgcacAAGCAACAGCATCGAGCGGACAGGTTCTTCTGCCACAAGTACTGCGGGAAACACTTTGCCACGATCGCAGAATGCGAGGCACACGAGTACATGCAGCACGAATACGAAAACATTGTTTGCAACATGTGTTCGGGATCGTTTGCCACGCGGGAGCAACTGTATGCCCATTTGCCGCAGCACAAGTTCCAGCAGCGCTTCGACTGTCCCGTATGCCGCCTGTGGTATCAAACGGCTGTGGAGCTGCACGAACACCGCCTGGCTGCCCCCTATTTTTGCGGTAAATACTACGCGGGCGGACAGTCCCCGTCCGCATCctcccaacaacaacagcaacaacaccagcagAGCCAGACGAACTACAAGCTGCAGGACTGTCATATGGCCACCATGGAAATGCCAAGCGCACCGCTCCATAAGGCGAACCCAACCAACTCGCCTTCCTTGCCCGCCACAGCAGCGCTCAATTCATTGCTGCAGCAGCGTCAGGCCAATGCCGATGGAGCGGCTATTTTTGCCGCATCTTCGCTGAAGAACGAAGTCCCTGTGAAGCTGGAGCGCAGCTACAGTAACTCGACCAACGAATCGTCTTATAGCGTTCAGGAGAGCGGCTACAATAATGTATATGGCAGCAGCGACAGCTCAGTCCACGGCGCCATCGCCGGACCACAGGCACACTCTTCCACGCTGGACGACTCCGAAGATGCCCTGTGCTGTGTGCCGCTGTGCGGGGTTCGGAAGAGCACCAGTCCCACTCTGCAGTTTTTCACGTTCCCGAAGGACGAAAAGTACCTCAACCAGTGGCTGCACAACCTCAAGATGTTCCACATACCCGCTTCCAGCTACGTTAGCTTCCGCATTTGCAGCATGCACTTTCCGAAGCGCTGCATCAACCGCTACTCTTTGTGCTACTGGGCTGTGCCGACGTTCAACCTCGGCCACGACGACGTAGCCAATCTGTACCAGAACCGGGAGCTGACCAACACCTTCACCACTGGCGAAGTGGCGCGCTGCAGCATGCCCCACTGCACCAGCCAGCGGGGTGAGAGCAATCTCAAGTTCTACAACTTCCCAAAGGACATCAAGAGCCTGATTAAGTGGTGCCAAAACGCCCGACTTCCCGTGCAGGCGAAGGAGCCGCGACATTTCTGCAGCCGCCACTTTGAGGAGCGGTGCATTGGCAAGTTCCGTCTAAAGCCGTGGGCAGTGCCCACCCTGCACCTGGGCGCCCAGTACGGCAAGATCCACGACAATCCGAAGAATCTGTACGTGGAAGAGAAGCGCTGTTGCCTCAACTTCTGCCGCCGGAGCCGCTCCTCAGACTTCAATATGTCGCTATATCGATTTCCCAGAGACGAAGTTCTGTTACGTCGCTGGTGCTACAATCTTCGCCTGGATCCGGGAGTCTACCGCGGCAAGAATCACAAAATATGCAGCGCCCACTTTATAAAGGAAGCCCTGGGTCTGCGTAAACTGTCGCCTGGAGCCGTGCCCACGCTTCACCTGGGCCACAATGACACCTTTAACATCTACGAGAACGAATTGTGGCCACCGCCAACACCGACACCTTCCTCTTGCCAtctccaacagcagcagcagtcatcCCTGCATTCGTTGCAACAGCAGATGCACAGCAAATCCTACCAGCGTCGTTCGGTGGCATCCACCTCGTCGTCAGCGAGCTCGGCAGCCTCGCACTACGTGGACCCGGAGATAAGCGCCTCTTACCATCTGGCCATGTCCGCCGCTGCCGGTGGCTCTGCGGCCATAAACGCCAGCGATAGCATGGACGTCTGTTGCGTGCCCAGTTGCGAGAGCAAGCGGCACAATAGCGAGAACATTACATTCCACACGATTCCGCGACGGCCTGAACAGATGCGCAAGTGGTGCCACAATCTGAAGATTGCCGAGGACAAGATGCACAAGGGAATGCGAATCTGTAGCCTTCACTTCGAGCCCTACTGCATCGGCGGCTGCATGCGACCGTTTGCTGTGCCCACTCTTCACTTGGGCCACGACGATGACGACATCCACCGCAATCCCGACGTGATCAAGAAGCTGAACATTCGGGAGACATGCTGTGTGGCTGTGTGCAAGCGGAACAGAGACAGGGACCATGCCAACCTGCATCGTTTCCCCAGCAACATGGCGTTACTAAAGAAATGGTGTGCTAACCTGCAGCGCAGCGTGCCCGATGGCAGTAAGCTCTTCAACGATGCGATCTGTGAGGTCCACTTCGAGGATCGCTGCCTGCGCAACAAGAGGCTGGAGAAGTGGGCAGTGCCCACTCTGATCCTGGGGCACGAGGATATCGCTTATCCGCTTCCTACGCCGGAGCAAGTAACCGAGTTCTATGCACGTCCCACGGCTCCCAACAATGGCGAGGAGCAGGGCGAGTGCTGTGTGGAGACCTGCAAGAGGAATCCCAGCGTGGACGACATCAAGCTATACCGCCCGCCGGAGGAGGCCGCCGTGCTGGCCAAGTGGGCGCACAACCTGCAAACGGAGGCCAACCAACTGACAAGCATGAGGATCTGCAATCTTCACTTCGAGGCGCATTGCATCGGCAAGAGGATGCGGCAGTGGGCCATTCCGACGTTGAATCTAGCCGGCAACATCGAGAATCTGTACGAGAATCCAGAGCAATCGATGCTGTACAGGCGACGTACGACTCACTTGAAGGCGAAGCTGTCGCCAGCCTCTGCAAAGCCCACCTGGGTGCCCAGATGCTGTCTTCCACACTGTCGCAAAGTCCGAGCCCTGCACAATGTCCAGCTGTATCGCTTCCCCAAGCTCAATCGCTCCACATTGGCCAAGTGGGCGCATAATCTCCAGGTTCCGATGGTAGGCAGTGCCCAGCGCAGGCTGTGCTCGGCCCACTTCGAGCCGCATGTGCTGAGCAAAAAGTGCCCGGTGCCGCTGGCGGTGCCTACGCTCGACCTGAACTCACCGCCCGGCTTGAAGATCTACCAGAACCCGGCCAAGCTAAAGGCCAGCAAACTGTGCCTGCAGCGGGTTTGCATCGTCGAGAGCTGCCGCAAGACGCGGGCGCAGGGCGTGCAGCTTTTCCGGCTGCCGCACAGTCCCACCCAGCTACGGAAGTGGATGCACAACATAAGGACGCGGCCACGTGCAGCTATGCGCTCTCAGTACCGGGTCTGTTCCCGCCACTTTGAGACGCACTCGTTCAATGGTCGAAGACTGAGCGCGGGTGCCATTCCGACTCTGGAACTGGGCCACGATGACGACGATATCTTTCCCAATGAGGCACAGGCCTTTGCGGACGAGCATTGTGCTGTGGAAGGCTGCGAGGCATCCAAGGAGCAGCCGGAGGTGCGGCTGTTCCGCTTCCccaccgacgacgacgatatGTTGTGGAAGTGGTGCAACAACCTCAAAATGAATCCCGTGGACTGCATTGGGGTACGCATCTGCAACAAGCACTTTGAGGCCGATTGCATCGGACCCAAGCACCTGTACAAGTGGGCCATTCCCACTCAGGAGCTGGGCCACGACGACGCGCAGATCGAACTGATCCCGAATCCTAAGCCAGAGGATAGGTATGTGGATCCAGTGTTCAAATGCATCGTGCCAACCTGCGGCAAGACACGACGCTTTGACGAGGTGCAAATGAACAGCTTCCCCAAGGACCCGGATCTGTTTCAGCGTTGGCGGCACAACCTGCGCCTGGAACACCTCAGTTTCCAGGAGCGTGAGCGCTACAAGATCTGTAACGCTCACTTTGAGGATATCTGTATTGGGAAGACGCGGCTAAACATAGGATCGGTGCCTACCTTGGAGCTTGGTCATGACGATGAGGATGATATTTTCCAGGTGAATCCAGCGGAGCTGCAGAGCAATTTATTCGGGCGACAGCGTCGACTGCTGCACGAGGGATCCGGTGAACTGAGTGTCAAGCAGGAGCTGTCCGAGACAGAGGACAACCCCAAAGCGGATGTGACTGCCACAAGCTCCAATTCCAAGCAGACCAAGATCAAGAGAAATGCTTCCGATCTAAAGTGCTGCGTGCACAGCTGTGGAAGAAGTCGCTTGGAGCACGGGGCCCGGCTGTTTCCCTTTCCCACCGgcaagcagcagcatctaAAGTGGCGTCACAACCTGCACCTGGAACCCGAGGAGGTGGACCGGTCGACGCGCGTCTGCAGCGCCCACTTCAATCGACGTTGCATCGAGGGCAAACAACTGAGAAGCTGGGCGATGCCCACCCAACAGTTGGGACACAATGACCAACCGATCTACGAGAACCCAAAGAATATACCGGGATTCTTCACCCCCACCTGTGCCCTGGGACACTGCCGCAAGCGGAGGAGTATTGACAACGACCTGCGTACCTACCGGTATCCTAGGAGCGAGGATCTTCTGGAGAAATGGCGAGCCAATCTACGGCTGTCTCCGGATCAGTGTCGCGGTCGGATCTGTGCCAATCACTTCGAACCGCAGGTGCGGGGTAAGCTAAAGTTGAAAACTGGAGCCGTGCCTACACTGCAACTGGGACACGATGAGGGATTAATCTATGACAATGAAGCTATTAAGGCGGGCATGACCGAAGAAGAGGAGGGCATAACCCCAGAGTTCCCGCGGCTGAAACCAAAGAAAGAGGTGTTCGAAGAGGaggagggggaggaggaggaggacgaaggGAATGATGGCGAGCAGCAGAACCCAGATGACCTGGAGGATCATCCAGACGAGGACAAAGATGATCACTATTTTGATCCTCTTGAACTGGTAGAGACTTTTGCTGAACATCGCAGCGACGACGAGGCCCAAGACTATGAGGATGCAGAAGAAGAGGACTCCCCCTCCAGATACGATGTCAAGGAGGAAATAGAACAGCTTCCAAGCCTCCCACCTTCCCCTTTACCGCGACGGCACCAAGCTCCGCGACGAGACAAGCCGGCTAACAATGTGACGCCCATTTGCTGCCTAAAGCACTGCAGGAAGGAACGCACTGCCTTCCACCTGCTGAGCACTTTTGGCTTTCCAAAAGATCGCCAATTGCTGCTGAAGTGGTGTGCCAATCTGCATCTAAACCCGGACGACTGTGTGGGTAGGGTTTGCATCGAGCACTTCCAGCCGGAGGTACTCGGCACGCGTAAGCTCAAGCAAAATGCGGTGCCCACTATCAATGTGGGACATGAGGAGCCGCTTAGGTACTCCTGCCATGGCGTGGAGCAGAATCTCGTTGAGCAGGATCCCCAGCCGCAGCATTCGGTTTTTCGGCTTTGGAGCCTGAAACACTGCCGCAAAAGGAAGCTAACGGAGCCGCCGGATATTCCCCTGGCCAAGAGGAAAGCGCTGGAGATGCCGATGATGAAGCGGGAGtgggagatggagatggagatgcaAATGGAGCGACAGAAGGAAGCAAAGAAGATGACTCAAATTGAAAGTGAATCACCAATATGCTGCATCAGCAGTTGCGGAAACCAAGAAGTTAGCCAATTGCTGCATTTTCCCGAGGAAAGGACCCTGCTGAGAAAGTGGAGCCACAATTTAAGGCTGGCCACTGAGGCTGACACCACATCTCTGAGCCTGAAAAGAGTTTGTTTGGCGCACTTTGAACCGCAGCTTTTGGAGAATGGTAATCTCTCTAAAgaagcagaggcagaggctgTGCCCACCTTGAACCTGGGCCACAGCAGCTGGAATCTATACAGAAGCAATGGGATCTGTCTAGTGCCTGACTGCACCCATAATACCTTTGGACGCTTAACCTTTATCGATCTGCCGGATAACAGTATTATCAGAGAAGCCTGCTTCTCCTGCTTGAACCTATCTGAACCCAGCGAGGAGCAGGCCAGACTATGTGCTAACCACTTTATAGAGGCTTTCAAAAAGTTCCATCTTCCTTATGTTCTACACCCCCAAGTCTTAGTGGCGCTACAAAAGGCTGTGGACGAACTGCAATGCACAGTGCCCGGTTGCTGTTTCGAAGAAGCTGATCCGGACGTTTACTTAATCCAGCTTCCCGATAACAAGGAGACGTTGTTGAAGTGGTTACACAACACCAAGATCTCCTACGATTCTGAGAGGCACCAAAGCTATCGGATTTGCACACTCCACTTCGAATCCGAGTACTTGGATACGAATGGCCCGTTAAAAGAAGCTATACCCACTCTCCATCTGAACCATAAAGATGAGATTCACTTAAATACTAGGCCACTGCCAGAGGAGCAGATCTCCATGTTGACTCCCCTGCGTATTAAGACGGACCTCGCCTTCTTGGGCAGTCCCTGTGCAAGTGCAAGCCCCAGTCCCCGGGGCAGGATCCGGATATGCTGCATTCCCTCTTGTGGACAGTTTGGAAGCAGTCAAGTGAGGCTCTTTCGCTTTCCCACCGAGGAGCAGGCGCTGCTTCGGTGGCTGGTGAACACCCAACAGCAGCCACGACTGGTTGATCCCATGGACTTGTACGTGTGCCAGTCGCATTTTGAGCCCGAGGCTATTTGTATGAAGCAACTTCGAAGCTGGGCTGAGCCCACCTTGAACCTGGGACACGAGGGTCATGTAATTCCGAATGCCAAGCACAATGGCAATATTTCCGACAGCCAGGAAACAGAGCAAGCAATGCGATTTATCCGCGAACGCTTCTGCTCTGTCATTTCTTGCTTTCAGGAAGGAggacaggaggaggaggggggaGTGAGGCTATTTGATTATCCCGAGGACATGGCGACCACTCGAAAGTGGGCAGCCGCATGCAGACATCGTTCCATGCAGGCCAGGAGCCATGGGTTCAAGGTGTGCCAGTTCCACTTTGCCAAGGAGTGCTTTGACCCCGATACTGGAGAATTGATGGAGGGCGCGGTGCCTACTCTCGAATTGAGCAGAGATGAAATGGAGAGGCAGTGTCTTGTGACGGGATGTGTAAAGAACGAAGCCAACGGAAGCCGTCTCCGCTACTTTAAGATACCAAAAATTGCTGCTCAACTGGAGGCGTGGAGCAATAACCTTAAAGTCTATCCAACGGATCTCATGCAGGGGGAGCAGCAGTACATCTGCGAGAAACACTTTGAGGCGTTTTGCTTTGGGGCTAACAAGGGACTGCGTTCTGGTGCACTTCCCACCCTCCTGCTGGGCCATGACGACGAGGTGGATATGCTTCCAAATCCGGAAAGTCTCTTGTGCCACAATAAGACGGATAAGTGCTGCGTGCCAGGCTGCGGAAATGTCTGGCAAACTGGGGACCGTAAGTTTCGTGGATTTCCGAAATTGTTGGCCATGGCCAACAAATGGAGGCATAACCTTCGTCTGGAAACTCCCGTGGATCAGCTCGGCAAGCTGAGGGTCTGCAATGCTCACTTTGAGACCACCTCCAACCTGGGTACAAATGGAATGAGCTCAAGTACCTCGATACCAACCTTGGAATTGGGCCACTCTTCTCCGGATATTTACCCAGCGGACTCGAGCTTAAAGTTACAAAAGCGTTCCGGAATGACGCCgaaaatttattgttgttatcCAAAGTGCGAGGAAACCTGTTTGCCCAAGAATCTTTCTTACGGGCTGCCCATGGAGGAGCATCTGCGGAATGCCTGGCTAAGCCATATGGACATAGAAGACCCGAAAGAGGAAGGAGTCGCACTGCTGTGCCCGCTGCACTATGTCATCCTCTACCAGTATAGTGCCACACACTATCCGGAGCTTCATGCTTCAAGCCGAATGCTTGTTGAGGACAATTACAAGGATGCGCGGAGCAACAGACGCGTGAAGATTGTGAGTTGTACGATCAAGGGGTGCGACACGGTTAAGCCCCGGGACGGGGTGCCGTTGCACGGGATGCCGCAAAGCAAAGACATTCTGCAGATGTGGATAGCCAATGGCCAGTTTGAGTTCTTGGAGCAGCAGCGGTACATGTTCAAGGTGTGTCACAATCACTTTGAGCCATGCTGCTTCTTCGACGACAGGCGCCTGCACTCATGGAGCGTGCCTACCCTGCGCCTGCCTGGCGAGGCAATTTACCAAAATCCAACCGTCGAGCAGTGGCAGGACATGATCAAcaagcaagcagcagcagcaaaagcagacGCAGAGGAGAACGAGGAGTCGGACTCATATGGGGATGTGGTTAAGTCCGAGGAGTCGGACTCATATGGGGATGTGGTTAAGACCGAACCCATTTTAAAGATGGAGCGGATGGAATCAGACTATGAAGATGAAAACCCGGAGATGCAGGCCCTAGAAGTACTCCTAGAAGTAGGCCATGTCGAGCGAATGGAGAGCTATGAGAAAGTGGATAAATCACCGGTGATCTATGCCGACAATGCACCCTTCCGATCTTCACCCATACGTTGCCAATACAATGCTAATCACTGTGCTGTGGAGGGATGCCAGGTGACTGTCGAGGATGTGGATGGCACGATTAAGCTGCACAAATTCCCAGCATCGCAGGACGCCGCCCAAAAGTGGATGCACAACACTCAAGTTGACATGGACGAAAAGTTCTGGTGGCGCTACCGCATATGCAGTTACCACTTCGATCAAGAGTGCTTTCAGAGTGCTAGGATCCGAAAAGGCGCGATGCCCACGCTTTTGTTAGGACCTCGGCGACCGGACAAGGTGTACGACAATGAGTTTGCCCTACCAGATGGGGATGATCCATTTCCAGACCCACCGGAGGTTCAGTTGGAGGAAAATACGACTGCGGCATCCAGACTTCAAAAAGAGGTGTCCCATTTATGTTTACCCCCACGGGCGCCACCTCGGAAGTCAAGCAAGTTTTGCCAGATTGATTCTTGCCCGAACCACCTGACCACCGAGAACATGACCCTGCACAAGTTTCCCCATTCGGAGGACATGTGCCTCAAGTGGCAGCACAACACACAAGTGCCGTTCGACCCCTACTACCGCTGGCGTTACCGCATCTGCAGTGCGCATTTCCATCCGGTGTGCTTGGTCAATATGCGTCTAGTCCACGGAAGCGTGCCCACCTTAAAGTTGGGCCCCAAGGCTCCCTCTGAGCTGTTTGACAACGACTTCGAAGCCATTAACCTAAGGCTGGATAAAAGGTTGACCGAGTCAAATGCCAACGTGTATATCAAGCATGAGAGGagggaggaggatgaggattCTGTGTTCCTGGAGCCCGAGCTCCAGTTACACGAGGATCAAGACGATAAGATATCAAGCTGGAACAGCAAATTGCAATTAGCACCTGTGAAGCAGGAGAAAATTGTCTACAGCCAGATCAAGTCTGGCTACGATAAGTGCTCGCTGGCTCACTGCCAGCGCCAAAGGTCCCAGCATGGCGTCCACATTTACAAGTTTCCCAAATCGAGGCGGCAACAGGAACGTTGGATGCACAACCTCCGCATCCGCTATGATGAGCGGACACCGTGGAAATTCATGATATGCAGCGTTCATTTCGAGCCGCATTGCGTAAGTCTAAGGAAGCTGCGGCCCTGGGCGGTGCCCACACTGGAACTTGGCGACAACGTGCCAGAAACAATATTTACGAACGAACAGtgcgaggaggagcaggtgacCGATCGCAGTGAGCTGGATAGCGACGCGGAGGAAGAAGATGGCTTacaggaggacgacgacgatgatgaggaAGCCGAAGACGATGTAAAACCCGATGTAATTGGCATCAAAAGGAGGCGACGTTTTAAGACAGATGGCGCCTGCCCTCCTAACCAGATTCCGCCCTGGAAAGTCAAGCAATGCTGCCTCCCCTATTGTCGTGCCTTTCGAGGCGATGGCATCAAGCTGTTTCGGCTTCCGAACAACAGAAACTCTATTAGCAACTGGGAGCGGGCCACCGGAATGGTGTTTAAAGAGTCGCAGCGAAACACTCGTCTGATCTGCAGCCGTCACTTCGAGCCAGAGCTGATTGGAGTCAGGCGTCTAATGCGCAACGCCATTCCCACAAAGCATTTGAACCCTCAAGCAGCTGGCCAGATACGTactaaaaaggaaaaaaatccTCCTGTCAAAATTACACCTATCTGCTGCATGGCAGACTGCCACTACAACGGAAATGTGAAGCTGCACAAGTTTCCAAGTGATCCCACTCTTCTCAGACAGTGGTGCCAGGCTCTCCGGCTCACTGACACACAGCGGTATTTGGGCAAGCACATTTGCTCCATGCACCTGCCCATGAACAAGACGCTGAGCTGTGTCATCTGCGGTGGCGACAACGTAGAGTTGCCGATGCTTGGGTTCCCGGAGAATCGCAACCAGCGCGCCAAATGGTGTTACAATCTCAAAATAGAGACAATACCGAAGTGGGACCACTCAAAGCACATTTGCTGCCGACACTTTGAGCCCCACTGCTTTGCCAAGCCGGGTGAGCTACGTCCAGGAGCGGCTCCCACGCTCCATCTCAATCACGATGACGCAAACATATTCTTCAGCGACTATGCCACTGGTCTTCCGTCCTCGCCACTAGGCAATCGAATCAAAGACGAGCCCCTGGAATCGGAGTCCGACGAGACGCTGCTGGTGTAG
Protein Sequence: MSQHNPNHAHPHYHYPSHTTPMALQQQQQQHQQPQQHGSSWYSHVASYPAASHSHPLSHSAFAPAPPCKASIGNNNTNTIMDAYGGGVGGGGGSHGYFGAAGGGLNVSGAGGGAGSSYGLGANTVAYAHNQLLQYQHHHQQHQQQQQPQHLGLGQRSYMGHDVMAGSYPYIKSEPLEGFQQPPNPMAPPPAPEMIIKSEPIDELAYKSNYIDDNTPFADFSKFSDFSEDMLSPKVELTVKDESFVRNPNSFLRRKQQSDLTPAESLPVCQRCKEVFFKKQTYLRHVAESNCGIQEYDFKCIICPMSFMTAEELQLHKQQHRADRFFCHKYCGKHFATIAECEAHEYMQHEYENIVCNMCSGSFATREQLYAHLPQHKFQQRFDCPVCRLWYQTAVELHEHRLAAPYFCGKYYAGGQSPSASSQQQQQQHQQSQTNYKLQDCHMATMEMPSAPLHKANPTNSPSLPATAALNSLLQQRQANADGAAIFAASSLKNEVPVKLERSYSNSTNESSYSVQESGYNNVYGSSDSSVHGAIAGPQAHSSTLDDSEDALCCVPLCGVRKSTSPTLQFFTFPKDEKYLNQWLHNLKMFHIPASSYVSFRICSMHFPKRCINRYSLCYWAVPTFNLGHDDVANLYQNRELTNTFTTGEVARCSMPHCTSQRGESNLKFYNFPKDIKSLIKWCQNARLPVQAKEPRHFCSRHFEERCIGKFRLKPWAVPTLHLGAQYGKIHDNPKNLYVEEKRCCLNFCRRSRSSDFNMSLYRFPRDEVLLRRWCYNLRLDPGVYRGKNHKICSAHFIKEALGLRKLSPGAVPTLHLGHNDTFNIYENELWPPPTPTPSSCHLQQQQQSSLHSLQQQMHSKSYQRRSVASTSSSASSAASHYVDPEISASYHLAMSAAAGGSAAINASDSMDVCCVPSCESKRHNSENITFHTIPRRPEQMRKWCHNLKIAEDKMHKGMRICSLHFEPYCIGGCMRPFAVPTLHLGHDDDDIHRNPDVIKKLNIRETCCVAVCKRNRDRDHANLHRFPSNMALLKKWCANLQRSVPDGSKLFNDAICEVHFEDRCLRNKRLEKWAVPTLILGHEDIAYPLPTPEQVTEFYARPTAPNNGEEQGECCVETCKRNPSVDDIKLYRPPEEAAVLAKWAHNLQTEANQLTSMRICNLHFEAHCIGKRMRQWAIPTLNLAGNIENLYENPEQSMLYRRRTTHLKAKLSPASAKPTWVPRCCLPHCRKVRALHNVQLYRFPKLNRSTLAKWAHNLQVPMVGSAQRRLCSAHFEPHVLSKKCPVPLAVPTLDLNSPPGLKIYQNPAKLKASKLCLQRVCIVESCRKTRAQGVQLFRLPHSPTQLRKWMHNIRTRPRAAMRSQYRVCSRHFETHSFNGRRLSAGAIPTLELGHDDDDIFPNEAQAFADEHCAVEGCEASKEQPEVRLFRFPTDDDDMLWKWCNNLKMNPVDCIGVRICNKHFEADCIGPKHLYKWAIPTQELGHDDAQIELIPNPKPEDRYVDPVFKCIVPTCGKTRRFDEVQMNSFPKDPDLFQRWRHNLRLEHLSFQERERYKICNAHFEDICIGKTRLNIGSVPTLELGHDDEDDIFQVNPAELQSNLFGRQRRLLHEGSGELSVKQELSETEDNPKADVTATSSNSKQTKIKRNASDLKCCVHSCGRSRLEHGARLFPFPTGKQQHLKWRHNLHLEPEEVDRSTRVCSAHFNRRCIEGKQLRSWAMPTQQLGHNDQPIYENPKNIPGFFTPTCALGHCRKRRSIDNDLRTYRYPRSEDLLEKWRANLRLSPDQCRGRICANHFEPQVRGKLKLKTGAVPTLQLGHDEGLIYDNEAIKAGMTEEEEGITPEFPRLKPKKEVFEEEEGEEEEDEGNDGEQQNPDDLEDHPDEDKDDHYFDPLELVETFAEHRSDDEAQDYEDAEEEDSPSRYDVKEEIEQLPSLPPSPLPRRHQAPRRDKPANNVTPICCLKHCRKERTAFHLLSTFGFPKDRQLLLKWCANLHLNPDDCVGRVCIEHFQPEVLGTRKLKQNAVPTINVGHEEPLRYSCHGVEQNLVEQDPQPQHSVFRLWSLKHCRKRKLTEPPDIPLAKRKALEMPMMKREWEMEMEMQMERQKEAKKMTQIESESPICCISSCGNQEVSQLLHFPEERTLLRKWSHNLRLATEADTTSLSLKRVCLAHFEPQLLENGNLSKEAEAEAVPTLNLGHSSWNLYRSNGICLVPDCTHNTFGRLTFIDLPDNSIIREACFSCLNLSEPSEEQARLCANHFIEAFKKFHLPYVLHPQVLVALQKAVDELQCTVPGCCFEEADPDVYLIQLPDNKETLLKWLHNTKISYDSERHQSYRICTLHFESEYLDTNGPLKEAIPTLHLNHKDEIHLNTRPLPEEQISMLTPLRIKTDLAFLGSPCASASPSPRGRIRICCIPSCGQFGSSQVRLFRFPTEEQALLRWLVNTQQQPRLVDPMDLYVCQSHFEPEAICMKQLRSWAEPTLNLGHEGHVIPNAKHNGNISDSQETEQAMRFIRERFCSVISCFQEGGQEEEGGVRLFDYPEDMATTRKWAAACRHRSMQARSHGFKVCQFHFAKECFDPDTGELMEGAVPTLELSRDEMERQCLVTGCVKNEANGSRLRYFKIPKIAAQLEAWSNNLKVYPTDLMQGEQQYICEKHFEAFCFGANKGLRSGALPTLLLGHDDEVDMLPNPESLLCHNKTDKCCVPGCGNVWQTGDRKFRGFPKLLAMANKWRHNLRLETPVDQLGKLRVCNAHFETTSNLGTNGMSSSTSIPTLELGHSSPDIYPADSSLKLQKRSGMTPKIYCCYPKCEETCLPKNLSYGLPMEEHLRNAWLSHMDIEDPKEEGVALLCPLHYVILYQYSATHYPELHASSRMLVEDNYKDARSNRRVKIVSCTIKGCDTVKPRDGVPLHGMPQSKDILQMWIANGQFEFLEQQRYMFKVCHNHFEPCCFFDDRRLHSWSVPTLRLPGEAIYQNPTVEQWQDMINKQAAAAKADAEENEESDSYGDVVKSEESDSYGDVVKTEPILKMERMESDYEDENPEMQALEVLLEVGHVERMESYEKVDKSPVIYADNAPFRSSPIRCQYNANHCAVEGCQVTVEDVDGTIKLHKFPASQDAAQKWMHNTQVDMDEKFWWRYRICSYHFDQECFQSARIRKGAMPTLLLGPRRPDKVYDNEFALPDGDDPFPDPPEVQLEENTTAASRLQKEVSHLCLPPRAPPRKSSKFCQIDSCPNHLTTENMTLHKFPHSEDMCLKWQHNTQVPFDPYYRWRYRICSAHFHPVCLVNMRLVHGSVPTLKLGPKAPSELFDNDFEAINLRLDKRLTESNANVYIKHERREEDEDSVFLEPELQLHEDQDDKISSWNSKLQLAPVKQEKIVYSQIKSGYDKCSLAHCQRQRSQHGVHIYKFPKSRRQQERWMHNLRIRYDERTPWKFMICSVHFEPHCVSLRKLRPWAVPTLELGDNVPETIFTNEQCEEEQVTDRSELDSDAEEEDGLQEDDDDDEEAEDDVKPDVIGIKRRRRFKTDGACPPNQIPPWKVKQCCLPYCRAFRGDGIKLFRLPNNRNSISNWERATGMVFKESQRNTRLICSRHFEPELIGVRRLMRNAIPTKHLNPQAAGQIRTKKEKNPPVKITPICCMADCHYNGNVKLHKFPSDPTLLRQWCQALRLTDTQRYLGKHICSMHLPMNKTLSCVICGGDNVELPMLGFPENRNQRAKWCYNLKIETIPKWDHSKHICCRHFEPHCFAKPGELRPGAAPTLHLNHDDANIFFSDYATGLPSSPLGNRIKDEPLESESDETLLV

Similar Transcription Factors

Sequence clustering based on sequence similarity using MMseqs2

100% Identity: iTF_00525910;
90% Identity: iTF_00594581;
80% Identity: -