Basic Information

Insect: Drosophila kokeensis
Gene Symbol: -
Assembly: GCA_035042145.1
Location: JAWNLT010000262.1:2784966-2798873[+]

Transcription Factor Domain

TF Family: THAP
Domain: THAP domain
PFAM: PF05485
TF Group: Zinc-Coordinating Group
Description: The THAP domain is a putative DNA-binding domain (DBD) and probably also binds a zinc ion. It features the conserved C2CH architecture (consensus sequence: Cys - 2-4 residues - Cys - 35-50 residues - Cys - 2 residues - His). Other universal features include the location of the domain at the N-termini of proteins, its size of about 90 residues, a C-terminal AVPTIF box and several other conserved residues. Orthologues of the human THAP domain have been identified in other vertebrates and probably worms and flies, but not in other eukaryotes or any prokaryotes [1].
Hmmscan Out: # of c-Evalue i-Evalue score bias hmm coord from hmm coord to ali coord from ali coord to env coord from env coord to acc

1 28 7.2e-15 1.4e-11 44.9 4.1 1 86 568 640 568 641 0.85

2 28 2.8e-15 5.4e-12 46.3 4.6 1 87 668 737 668 737 0.83

3 28 6.8e-16 1.3e-12 48.2 0.4 1 87 759 831 759 831 0.85

4 28 5.1e-16 9.9e-13 48.6 5.3 1 87 926 996 926 996 0.83

5 28 8.4e-15 1.6e-11 44.7 3.4 1 86 1020 1091 1020 1092 0.81

6 28 4.2e-13 8.2e-10 39.3 1.3 1 87 1127 1195 1127 1195 0.80

7 28 2.4e-11 4.7e-08 33.7 2.4 1 86 1241 1310 1241 1311 0.77

8 28 1e-16 2e-13 50.9 0.2 1 86 1338 1407 1338 1408 0.82

9 28 5.1e-12 9.9e-09 35.8 0.7 1 86 1429 1498 1429 1499 0.80

10 28 7e-15 1.4e-11 45.0 1.5 1 86 1525 1596 1525 1597 0.85

11 28 2e-13 3.8e-10 40.3 1.9 1 85 1673 1741 1673 1743 0.82

12 28 3e-12 5.8e-09 36.6 0.1 1 86 1766 1834 1766 1835 0.82

13 28 4.9e-14 9.5e-11 42.3 0.9 1 86 1990 2058 1990 2059 0.82

14 28 1.1e-10 2.1e-07 31.5 0.3 1 61 2112 2166 2112 2189 0.80

15 28 8.1e-05 0.16 12.7 0.1 1 59 2195 2247 2195 2270 0.77

16 28 2.2e-11 4.3e-08 33.8 0.4 1 86 2285 2354 2285 2355 0.83

17 28 1.9e-14 3.7e-11 43.6 1.3 1 87 2413 2483 2413 2483 0.81

18 28 1e-12 2e-09 38.0 0.6 1 86 2518 2589 2518 2590 0.82

19 28 1.1e-13 2.2e-10 41.1 1.4 1 87 2600 2672 2600 2672 0.81

20 28 2.8e-14 5.4e-11 43.1 0.2 1 87 2695 2766 2695 2766 0.78

21 28 4.3e-06 0.0084 16.8 0.1 1 58 2799 2852 2799 2868 0.84

22 28 2.8e-14 5.4e-11 43.1 0.2 1 86 2890 2962 2890 2963 0.80

23 28 4.5e-14 8.7e-11 42.4 1.4 1 86 3097 3169 3097 3170 0.81

24 28 2.1e-14 4.1e-11 43.4 2.2 1 87 3233 3304 3233 3304 0.84

25 28 1.7e-14 3.3e-11 43.8 4.6 1 86 3417 3487 3417 3488 0.85

26 28 7.1e-14 1.4e-10 41.8 0.1 1 87 3580 3650 3580 3650 0.85

27 28 4.2e-10 8.2e-07 29.7 0.6 1 58 3667 3715 3667 3725 0.88

28 28 3.3e-09 6.4e-06 26.8 1.2 18 87 3732 3790 3721 3790 0.76

#	of	c-Evalue	i-Evalue	score	bias	hmm coord from	hmm coord to	ali coord from	ali coord to	env coord from	env coord to	acc
1	28	7.2e-15	1.4e-11	44.9	4.1	1	86	568	640	568	641	0.85
2	28	2.8e-15	5.4e-12	46.3	4.6	1	87	668	737	668	737	0.83
3	28	6.8e-16	1.3e-12	48.2	0.4	1	87	759	831	759	831	0.85
4	28	5.1e-16	9.9e-13	48.6	5.3	1	87	926	996	926	996	0.83
5	28	8.4e-15	1.6e-11	44.7	3.4	1	86	1020	1091	1020	1092	0.81
6	28	4.2e-13	8.2e-10	39.3	1.3	1	87	1127	1195	1127	1195	0.80
7	28	2.4e-11	4.7e-08	33.7	2.4	1	86	1241	1310	1241	1311	0.77
8	28	1e-16	2e-13	50.9	0.2	1	86	1338	1407	1338	1408	0.82
9	28	5.1e-12	9.9e-09	35.8	0.7	1	86	1429	1498	1429	1499	0.80
10	28	7e-15	1.4e-11	45.0	1.5	1	86	1525	1596	1525	1597	0.85
11	28	2e-13	3.8e-10	40.3	1.9	1	85	1673	1741	1673	1743	0.82
12	28	3e-12	5.8e-09	36.6	0.1	1	86	1766	1834	1766	1835	0.82
13	28	4.9e-14	9.5e-11	42.3	0.9	1	86	1990	2058	1990	2059	0.82
14	28	1.1e-10	2.1e-07	31.5	0.3	1	61	2112	2166	2112	2189	0.80
15	28	8.1e-05	0.16	12.7	0.1	1	59	2195	2247	2195	2270	0.77
16	28	2.2e-11	4.3e-08	33.8	0.4	1	86	2285	2354	2285	2355	0.83
17	28	1.9e-14	3.7e-11	43.6	1.3	1	87	2413	2483	2413	2483	0.81
18	28	1e-12	2e-09	38.0	0.6	1	86	2518	2589	2518	2590	0.82
19	28	1.1e-13	2.2e-10	41.1	1.4	1	87	2600	2672	2600	2672	0.81
20	28	2.8e-14	5.4e-11	43.1	0.2	1	87	2695	2766	2695	2766	0.78
21	28	4.3e-06	0.0084	16.8	0.1	1	58	2799	2852	2799	2868	0.84
22	28	2.8e-14	5.4e-11	43.1	0.2	1	86	2890	2962	2890	2963	0.80
23	28	4.5e-14	8.7e-11	42.4	1.4	1	86	3097	3169	3097	3170	0.81
24	28	2.1e-14	4.1e-11	43.4	2.2	1	87	3233	3304	3233	3304	0.84
25	28	1.7e-14	3.3e-11	43.8	4.6	1	86	3417	3487	3417	3488	0.85
26	28	7.1e-14	1.4e-10	41.8	0.1	1	87	3580	3650	3580	3650	0.85
27	28	4.2e-10	8.2e-07	29.7	0.6	1	58	3667	3715	3667	3725	0.88
28	28	3.3e-09	6.4e-06	26.8	1.2	18	87	3732	3790	3721	3790	0.76

Sequence Information

Coding Sequence: atgtcacaacaacaacacaatccCCCTCCACAtcaccaacatcaacatcactactatcagcaacagcagcaacagcaacaacaacaacatcaacatcatctgcagcagcagcagcatttgcagcataaacaaatacaacaacagcacagtTGGTACTCACATGTTGCTTCCTATCCGCCCCCGCATGCCGCTGCCTTTGCGTCGCCctgcaaaagcagcagcagcaacaacaataacaacaacaaccacattaTGAATGCATACGGCACGGGTACAGGAGCGTATTATGGCTCAACGGGAGCGGGTGGCGTTGGGGTTGGCTATAACCTTGAGGCCAATACTGTGGCCTATGCGCAcaaccagctgctgcagtaccaacaacaacaacagcagcaacaacagcagcagcatcagcaacaacagcaccagcagcagctcaaccaGCGCTCGTATATGCCACCACATATAATGCACAGCTCGTATCCGTACATTAAGAGCGAACCATTGGAGCCACTGCCCGAacgccatcagcagcagcagcaacaactcttTCAGAATCCTATGGCACCGCCGCCAGCACCCGCCATTGCAAATCGTCATTCGCTCGATGCTAGTGGCGAaatgataattaaatCGGAACCCATTGACGAACATGCTTTCAAGTCCAACTATATCGATGATAATACTCCCTTTGCCGATTTTAGTAAATATCCCGAATTCGGCGACGATATGCTAAGTCCCAAGCTTGAGCTGAATGTCAAGGATGAGGCCTATGGAAACCAAAAAAACCCGCTAAACTACCCGCGCCGGAAGCTGCAAACGGATCGCTCCGCGGAGAGTATGCCCATTTGTCAGCGCTGCAAAGAGGTGTTCTTCAAGAAGCACATTTACTTGCGGCATGTGGCCGAGAGCAGTTGCAGCATACACGAGTATGAGTTCAAGTGCAACATCTGTCCCATGTCTTTCATGGGCGCCGAGGAGCTGCAGAAGCACAAGCTTCTGCATCGAACTGACAAGTTCTTCTGCCACAAATACTGTGGAAAACACTACGACTCGATTGGAGAGTGCGAATCGCACGAGTACATGGAGCACGAGTACGATAGCTTTGTGTGCAATATGTGCTCTGTTACGTTCCCCACACGGGAACAGCTGTATGCCCATTTGCCGCAACACAAGTTCCAACAGCGTTACGATTGCCCCATTTGCCGGTTGTGGTACCAAACGGCATTAGAGCTGCACGAGCATCGACTGGCGGCGCCCTACTTTTGTGGCAAGTATTACGCTGCagcacaccaacaacagcagcaacaacaacaacaacaacagcagcagcatacacaacaacatcagcaacagggCAACTATAAACTGCAGGATTGTCACATGGGTACCATTGAAAtgaCTCCACCGCAGCACAAGGCGAATTCGGCATTACCGGCAACAGCGGCGCTCAATTCGCTGTTGCAGCAACGCCAAGCGAACGCTGATGGCGCCGCTTTATATGCCTCGGCGCTGAAGAGCGAGGCGTCCGTGAAACTGGAGCGCAGCTATAGCAACTCCACCAGCGAGTCTGGCTATAGTATGCACGAGAGCAACTATAACAATGCCTACGCCAGCGACAATTCTCTGCACGGCGGGGGCGGGGCAATTGGTGGTCCGCAGGCGCATTCCTCGACGCTGGACGATTCGGAGGATGCGCTGTGCTGTGTTCCACTGTGCGGGGTGCGCAAGAGCACCAGCCCGACGCTGCAATTCTTTACATTTCCCAAAGATGACAAGTACTTGCATCAGTGGCTGCACAACCTCAAGATGTTCCACATTCCGGCGTCAAGCTATGCCACCTTTCGCATTTGCAGCATGCACTTCCCTAAGCGTTGCATTAATCGTTACTCTCTGTGCTATTGGGCGGTGCCCACATTTAATCTGGGCCATGACGATGTGGCAAATCTCTATCAGAATCGTGAGCTGACCAACACATTCACCACCGGCGAGGTTGCCCGCTGCAGTATGCCAAACTGCACTAGTCAGCGTGGCGAGAGTAATCTGAAGTTCTACAACTTTCCCAAGGACATCAAGAGTTTGATTAAGTGGTGCCAAAACGCTCGTCTGCCCGTCCAGGCCAAGGAGCCGCGTCACTTCTGCAGTCGCCACTTCGAGGAGCGCTGCATCGGCAAGTTCCGGCTGAAGCCCTGGGCAGTGCCCACGTTACACCTGGGCGCCCAGTATGGCAAAATTCATGACAATCCCAAAAACCTGTATGTCGAAGAGAAGCGCTGCTGCCTCAACTTTTGTCGTCGCAGTCGCTCCTCCGACTTCAACATGTCGCTGTATCGCTTCCCCAGGGATGAGGTGCTGCTGCGTCGTTGGTGCTACAACCTACGCCTTGATCCGGCTGTCTATCGTGGCAAGAATCACAAAATTTGCAGCGCTCACTTTATTAAAGAAGCTTTGGGATTACGCAAACTATCTCCGGGTGCTGTGCCCACGCTACATCTGGGTCATAATGACACCTTTAACATATACGAGAATGAACTGTGGCCACCGCCAACGCCCTCTACGCCCACCCacaatcatcagcagcagctgcagcaacaccagttacagcagcagccgcaacaagtGCATCATAAATATCAGCGGCATTCGGCTGCATCCACATCCTCGTCGGCCTCATCGACATCGCATTATGTGGATCCGGAGTTAAGTGCATCCTACATGAGCATGGGCGCTGGAGGCTCATCCTCTGGCCTTAATGTCAGCGACAGCATGGACGTCTGCTGTGTGCCCAGCTGCGAGAGCAAGCGTCACAACAATGATAGCATCACATTCCACACAATACCCAGGCGGCCAGAGCAAATGCGCAAGTGGTGTCACAATCTTAAGATTCCCGAGGACAAGATGCACAAGGGCATGCGGATATGTAGCTTGCACTTTGAGCCCTACTGCATTGGCGGCTGTATGCGTCCGTTTGCGGTGCCCACATTGCATCTGGGCCACGACGACGAGGACATTCACCGCAATCCGGATGTGATCAAGAAGCTCAACATACGCGAAACTTGCTGCGTGGCTGTTTGCAAGCGGAATCGTGACCGGGACCATGCCAATCTGCATCGCTTTCCCAGCAATGTGCCGCTGCTGACCAAGTGGTGCGCAAATCTGCAGCGTCCTGTTCCGGATGGCAGTAAACTCTTTAATGATGCCATCTGTGAGGTGCACTTTGAGGATCGATGCCTGCGCAACAAACGGCTCGAGAAGTGGGCAGTGCCCACACTGATCCTTGGGCATGAGAATATACCCTATCCGCTGCCCACGGCGGAGCAAGTTGCCGAGTTCTATGCGCGTCCTAGTGCGCCTAATAATGGCGAGGAGCAGGGCGAGTGCTGTGTGGAGACGTGTAAGCGTAATCCCAGCGTGGATGACATCAAACTATATCGCCCGCCCGAGGAGTCGCAGGTGCTGTCTAAGTGGGCACACAATCTCCAACTGGAGATAGCCCAGCTGCCCAATATGAGAATATGCAATCTGCATTTCGAATCCCACTGCATTGGCAAGCGGATGCGCCCCTGGGCAATACCCACGCTCAATCTTGCAACCAACATAGAGAATATCTACGAGAATCCCGAACACCAGATGCTCTACAAGCGGCGCACGCATCTCAAGCCGGGCAGAGCAGCCCGAGGCTCTGAAGCAAGTGGTGTGAAGCCCACCTGGGTGCCacgctgctgcttgccgcaTTGCCGCAAGGTGCGTGCCACACACAATGTCCAGCTGTATCGCTTCCCCAAACTCAATCGCTCCACGCTGGCCAAGTGGGCGCATAATCTACAGGTGCCACCTGTGGGCAGCGCCCAGCGTCGGCTCTGCTCCGCTCACTTTGAGTCGCATGTGCTCAGCAAGAAATGCCCGGTGCCCATGGCGGTGCCCACACTGGACCTCAATACACCATCCGGCTACAAGATCTATCAGAATCCGGCCAAGCTAAAGGCCAACAAGCTCTGCTTGCAGCGCGTCTGCATTGTGGAGAGCTGCCGGCGTCAGCGGGCGCAGGGGGTGCAGCTCTTTCGTCTGCCTCACAGCCCCACCCAGCTGCGTAAGTGGATGCACAACATCCGGATGCGTCCCCGAGGCGCTATGCGACAACAGTATCGTATCTGCTCGCAGCACTTTGAGACGCACTCGTTCAATGGGAAGAGACTCAGTGCCGGAGCAATTCCAACGCTTGAGTTGGGCCATGAAGATGAAGACATATTTCCGAATGAGGCGCAGTCTTTCGTGGAGGAGCACTGCACCGTCGAAGGCTGCGGTGCCATCAAGGAGCAACCGGATGTGCGTCTCTTCCGCTTCCCCAACGACGATGAGGATCTGCTGTGGAAGTGGTGCAACAATCTGAAAATAAGTCCAGTCGACTGTATCGGCGTTCGCATCTGCAACAGACATTTCGAGGCGGATTGCATTGGACCGAAGCATCTGTTCAAGTGGGCCATTCCCACTCTATCCCTTGGCCACGATGATGATATCGAGCTAATGCTAAATCCCAAGCCGGAGGAGCGCTATATTGATCCGGTCTTTAAGTGCTGTTTGCCCTCTTGCGGAAAGACTCGTAAATTCGATGAAGTGCAGATGAACAGTTTTCCCAAAGATCCGGAGCTCTTTCAGCGCTGGCGCCACAATCTCCGCCTCGAGCATCTCAACTTTAAGGAGCGCGAACGCTATAAGATCTGCAACGCCCATTTCGAGGACATTTGCATCGGTAAGACGCGCCTAAACATTGGGTCCATTCCAACACTGGAGCTTGGCCATGACGAGACTGATGACTTGTTCCAAGTCAATCCCGAGGAGCTGCAGAGCAATCTCTTTGGACGTCAGCGGCGCGTCCAAGATTCCATGAGGATCAACATTAAGCAGGAGGCGCACTCCGACCTGGATGAAGACATCAAACCGGACATTAACCTGTCGGCGGCCACAGATTCACGTACAACACAGGTTAAAATCAAGAAATCTTTGACTAATTTCAAGTGCTGTGTGCCGAGCTGTGGTCGCAGCCGCCTGGAGCATGCTGCCCGTCTCTTTCCGTTTCCGAAtggaaaacagcagcagagcaagTGGCGCCACAATCTGCGGCTGCCTGCTGCCGACGTGGACAAAACGACGCGCATCTGCAGCGCCCACTTCAATCGCCGTTGCATCGATGGCAATCAGCTGAGGGGCTGGGCAATGCCCACACAGCAGCTGGGCCATCAGGAGTTGCCGATCTATGAGAATCCAAAGAATATACCGGGCTTCTTTACGCCCACCTGTGCGCTGGCGCACTGCCGGAAGCGGCGCAGCATTGACAACGATTTACGTACCTATCGGTATCCACGCAGCGAAGAGCTGCTCGAGAAGTGGCGCGTTAATCTACGCTTGTCGCCGGATCAATGCCGCGGACGAATCTGTGCGGATCATTTTGAGCCACTGGTGCGTGgcaagctgaagctgaagacGGGCGCAGTGCCAACGCTCAAATTGGGACACGACGAGGGCGTGGTCTTTGATAACGAAGGCATTAAGGCGGGTCTGCAGCAGGAGGACGAAGCGGAGGAAGAAGAGGGCAATGCCAGCTTAAAGTCGTTGGTCAAAGTAAAGACTGAACAGGAGGATGAACAGGAGATAGAGAATGAAGATGaagagcagcaagagcagGAGCAAGATATGGAGCATGAGCACGGTCAAAATAtggacgaggatgaggaagGTCATCGGGACTCTGAGGAACATGGCTATTTTGATCCTTTAGAACTTGTGGAAACCTACGCTGAGCACCACAGCGATGATACCTCTGCCGGACATGATAAtctcgatgatgatgaggatgatgatgaagacATTCCCGGCAATGACGATGAGCTGCTTCTGCCAGATACGCGGCCACTTCGAATGACAATGGCTCCGCGGCGCGAGAAGGCTGTGAATAATGTGACGCCCATTTGCTGTCTGAAGCACTGTCGGAAGGAGCGCACCGCCATCCATCATCTGAGCACCTTTGGCTTTCCCAAGGAtccacagctgctgctcaagtgGAGCGCCAATCTGCAGCTGCCGTTGGAGTCCTGCATGGGTCGTGTATGCGTCGAGCACTTTGAGCCCTCGATGCTGGGCACGCGCAAGCTGAAGCAGAATGCTGTGCCCACCTTGAAACTGGGCCATGCCACACCGCTCACCTACAGCTGCAATGGCCGGATGCTTTCGGGCATCTATGATGAACAGCCGCAGCATTCGGTTTTTCGGCTTTGGAGCCTGAAACACTGCCGAAAACGGAAACCGGATCTGGCGGAGATTAAGCCCGGTCGTCGCTGTTGCCTGCCAAGTTGCGGTAAGCTGTCGGAGTTGCATGGGGTTCAGCTGCAGCGTCTGCCCAAGGATCGTCTGATGCTGCGCAAATGGTTGCACAACCTGAAGCTGCCTCCAGCGCTGGACTGCACTCAAATGTTCCTCTGCAGCGATCACTTTGAGCTGAATGCGTCGTGTCCCACTTTGAAACTGGGCCACTCGGATACCAATATTTATCGCCACAATGTGGCTAGCATCAGAGGCAACAGTGGCTGTCTGGTACCCAAATGTACTTGCGCTCGTCTCAATCTCTATCGCGGCTATGATCTGCCCGCACATCTGCAGGTGCAACAGGCTTGGCTACACTGGTTGCAGCTACCCCATCCTCAGCCGTCGCCCCGGCACGCCCAGCTGTGTGTGATGCACTTTATGCAGCTCTACGAACTAGTGCAGCTACCCGAGTCGGTGCCAGATATTGTGCGTCGCCAGCTGCGTGAGACTTACGAACTGATATCCAGCTCCAGCATGGCAATGAAGCTACGTTGCGCTGTGCCCGGCTGCTACTCGAAGTATACGGACAATGTGCGTCTGACCAAGCTGCCCGTTTGCCCCGACACCTGCGCCAAGTGGGTGCACAACACCAAGATTGAATACGATCCGGCCCGACATTATGTCTATCGCATCTGCATGTTGCACTTTGAGCCAGGCTGCTTGGGCCCAGTGCGCCCCAAAGTGTGGGCAATGCCAACGCTGCAGTTGCACCACGAGGAtgccaacatttatttaaatcccAAGCTGGATGGCAGCCAAACACAACCCGCCGTGCCGTTGGAGCTGCCCTTGCGCATTAAAACTGAGCTGCCTATGTGCAACAGTCCCAACTttagtgcgagtgcgagtccCAGTCCGCGTGGCAAGCTGCGCACCTGCTGTATTCCTAGCTGCGGTCAGCAGGATTCCGCCCTGACGCGCCTCTTTCGCTTTCCCAGCGCGGAGACGTCGATGCTGAAGTGGCTGGTGAatacacagcagcagccgcgctTTGTCGATGCACAACGGCTGTTCGTCTGCCAGGATCACTTCGAGGCGGAGGCCATTTGCAAGAATCAGCTGCGTAGCTGGGCGGTGCCCACACTGAATCTAGGACACGATGGACACATCATCCCGAATGCCAAGCACAATGGCAACATTGCCGACAGCCAGGAGAACAAGCAGACACTGCAGTTCATCTGGGCCAACTACTGCTCGGTGCTGACCTGCTTCCAGCAGAGTAGCGAGCAGCTGCGTCTCTACCAATATCCCACGGATCGGCCAACCATTCGCAAGTGGGCCGCTAATTGTAAGCATCGCTCCATGCAGGCCAGCAGCGATGGATTTCAGGTGTGCCAGTCGCATTTTGCGCCGGATTGCTTTGATCCTGATACCGGAGAGTTGAATGAGGACGCTGTGCCCACACTGGCGCTGAGCCGGGCTGTAACTGAGGTGCGCTGTGTGGTCAATGGTTGCGTTAAGGACGAAGATGCAACGCGTCGCCGTCTGTTCAAGATGCCCAAGCGTACCCCACAGATATTGGATTGGTGCCATAATTTGCGCCTGGATCAGGCGGCCACGAGTGGCTCGGAACAGCACGTTTGTGAACGCCACTTCGAGTCAAACTGCTTTAATGCGTCTCGAGTGCTGCGTCCTGGAGCACGACCCACGCTTCATTTAGGTCACGAGGACCTAGACGATGTGATACCCAATCCGGCGAACTGGGAAGAGGATGTGATCGTGTGCTGTGTGCCGCACTGTGAGAGCTCCAAGGATGCGGATGAGGTTCAACTATTTGGGCTGCCAAAGGTGCGCCAGTTGGCGGACAAGTGGCTGCAAAATGTGCGCCTTGATCCGAGCAAAGAACAACTGGCTAGCCTGAAGATCTGCAGTGTGCATTTTGAGGCTAGCTGCTTGGAGAATGGACGACCCACCTATGGTGCAATGCCCACACTCCATCTGGGTCATAATGAGTTCGACAATATACACCCAAGCGTAGAGTCGGTGCCGACGCAGCAGAAGCGCTACTGCAATAGAGACGGCGCCAGTCACGACTGCTGCTATCCGCAATGCGTGGAGCTGCAGAAGAGCTATCTGCGGGTCACCTACGAGCTGCCCCAGGAGCAAGAGCTCCGCCAGCAGTGGCTCTCTTATATGGGCCTGGAGGCGTCGCAGTTCgataagcagcagctgctcaagctCTGTCCACTCCACCTAATCTTGCTCTACGATCATAGTGCGGATCACTTTTCAGCACACGTCGCTGAGGATCTGCTGGATTCCAATTATGAGGCAGCGCGTAGCAGCGTTCGCATACGCGTTGTCAGCTGTGCGGTGCGTGGCTGCAGAACACTGAAGCCACGCGACGGCGGACGGCTGCATGGTTTGCCCACTCGTCGAGATGTGCTGGAGATGTGGCTGCACAATATGCAGCTGGTGTTTTACGAGCAACAGCGTTATATGTACAAGATATGCAGCAAGCACTTTGAGCCCAGATGCTTCACGGTGACAACCAAGCGCTTGAAGCCGTGGAGCATGCCTACGCTGGAGTTGCCGGAGCTTCAACCGGGCGATATGCCAGTCTATCAGAATCCCACCGAGTTGGAGTGGCAACACATGAATGAGCTGCAGGTCAGCGAGAAAGTTGTTGAGGCTCAGCCAGAGCCATTGCTCAAGCTGGAGCCATTGCCCAAGAAGGAGCCACCAGCACCGCAGGCTATGGAATATGAAGAGGATTGCGACAATAACTCACAGCAGCCTATGGAAATGCAGGCGCTGGAGGTGCTGCTCGAGGTGGGTCATGTCGAGAAGTGCACAACCTACGAACAAATGGATACCGAGGCAAATCTCAGCTATGCTGAGCAGTTCTCGCACAATCCCCTCAGTCCAGGTCCACCCCAATGCCGTATCCCTGTTGTCCAGAATGGACTCCACTACAGCGCACGCCACTGCAGCGTGCATGGCTGCAATGTCACCTCGAATAAtctgagcagcagcatcaagcTGCACAAGTTTCCCGTCTCGCTGGATGCCATGCAAAAGTGGATGCACAACACCCAGGTGCTCGTGGACGTCAAATTCGCTTGGCGCTTTCGCATCTGCAGTCATCATTTCATCGAGGATTGCTTTCACGGCTCGCGCATCAGACGTGGAGCGATGCCCACGTTGCGACTGGGCTCACGTCGACCGAAGCATATCTATGATAATGAGTTCAACgcccaactgcaactggaacaGACTAAAGAAGAGACCAGACAGTCGCTCGCTGCTCCGCTGGAGTctcagcaacagttgctctCTGCGAATGTAGGTCTTCGCTTACCACGGCCTGCACCGCCTTGCAAATCCAGCAAATACTGTCAGATCGAGGGCTGCTCCAATCATTTGACCAGCGAGAATTTGACGCTGCACAAGTTCCCCCATTCGTCGGACATGTGCGCCAAGTGGCAGCACAACACTCAGGTACCCTTCGATCCCGAGTTCCGCTGGCGCTATCGCATCTGCAGCGCACACTTTGAGCCCATCTGTCTAGGCAATGTGCGACTGATGCACGGCAGTGTGCCCACCCTGAATCTGGGACCGCTTGCGCCCAAGAAACTGTTTGATAACGAATTCTTGCGCCTGGACAAGCCAATGAGCAGCTCGGAGGTGGGCATGACAGTCAAACAGGATCGAATGGAGCAATTTGATCAATTGGAGATGGAAGATGGCAACCAGGAGCAGGATGATTTCAGTCTGCTGGAGCCCGAACTGGAGTTGCACGAGGGTAGCGAGGATGAGCAACAATATGACAATCATTTCAGCCAAAACGATTCCTATAACTGGTCCGATCAGCAACTGCGTCTGTCAAGCAGTAATCAGGAGAAGTGCACCATCAGCTACAATCCGGTCAAGTCCGGCTATGATAAGTGCTCACTGGTCCACTGCCAACGACAGCGTTCCCAGCACGGCGTGCACATCTACAAGTTTCCGCGCTCGCGTCAGATGCAGCAACGATGGATGCATAATTTGCGCATCCATTACGATGAGCGACGGCCGTGGAAGACAATGATATGTAGTGTCCATTTCGAACCGCACTGCATCCGTCTGCGCAAGTTGCGTCCCTGGGCGGTGCCCACGCTGGAACTGGGGGGCAATGTGCCGCTGGAGATCTTTACGAATGAGCAGAGTCAGCAGCTATTTACTCAGTCCGAAACAGGCAGCGAATGTGATGAGGTTGAAGTGGATGTTGAGGACACCATATTGGAGGACTTGGATGATGACTATGATGACAATGATGTTGATGTGAATGTAGATGCTGATGATCAAATGCGGACGGCTCCATATGTGAAAAGGGAGCGTCGCTCTCGATTTGATCCTCTGCCGCCGGGTCAGCTGCCACCGTGGAAGATCAAATGCTGCTGTTTACCCTATTGCCGCAATCCCCGCGGTGATGGTATCAAGCTCTTTCGACTGCCCAACAACATCAGCTCCATACGCAAATGGGAGAAGGCCACAGGCATGCGCTTCTATGAGTCGCAGCGCAACACAAAGCTCATCTGCAGTCGGCACTTTGATCCGCAGCTGATAGGCGTTCGTCGTCTCATGTCCAATGCGGTGCCCAGCCTCCATTTGGGCCCAGACAGCGCAGAGCCCGAGCAGACTCCAGTGGGACCACGTTGCTGCATCCCCGATTGCTCTGAAAATATCAATGTCCAGCTGCACAAGTTTCCCAGAGATCCGATGCTAATGCATCAATGGTGTCAGGCGCTCAATCTACCGGATGTTCAAAGTTACTCTGGCAAATTCATTTGTGCCGCACATCTGCCCGCCAACGCGATGAGCTGTCTAATTTGTGGCGTCGACGATGTCCAGCTCCCAATGCTGGACTTTCCCCAGAATCGCAATCAGCGCACAAAGTGGTGCTACAATCTGAAAATCGAGCCTCTGCCTAAGTGGGACAACTCTAagaaaatttgctgcaaacattttgagaGCTACTGCTTTATCCAGCCGGGGCAACTTCTGGCGGAGGCAATGCCCACGCTACACTTAGAGCATGAGGATAGCAACATATTCCTAAACGATGATGCCATGGATAATAGCAACTTGTTGCGCATCAAGGACGAGCCCATGGAAAGCGAGGATCTGATGCTGTAA
Protein Sequence: MSQQQHNPPPHHQHQHHYYQQQQQQQQQQHQHHLQQQQHLQHKQIQQQHSWYSHVASYPPPHAAAFASPCKSSSSNNNNNNNHIMNAYGTGTGAYYGSTGAGGVGVGYNLEANTVAYAHNQLLQYQQQQQQQQQQQHQQQQHQQQLNQRSYMPPHIMHSSYPYIKSEPLEPLPERHQQQQQQLFQNPMAPPPAPAIANRHSLDASGEMIIKSEPIDEHAFKSNYIDDNTPFADFSKYPEFGDDMLSPKLELNVKDEAYGNQKNPLNYPRRKLQTDRSAESMPICQRCKEVFFKKHIYLRHVAESSCSIHEYEFKCNICPMSFMGAEELQKHKLLHRTDKFFCHKYCGKHYDSIGECESHEYMEHEYDSFVCNMCSVTFPTREQLYAHLPQHKFQQRYDCPICRLWYQTALELHEHRLAAPYFCGKYYAAAHQQQQQQQQQQQQQHTQQHQQQGNYKLQDCHMGTIEMTPPQHKANSALPATAALNSLLQQRQANADGAALYASALKSEASVKLERSYSNSTSESGYSMHESNYNNAYASDNSLHGGGGAIGGPQAHSSTLDDSEDALCCVPLCGVRKSTSPTLQFFTFPKDDKYLHQWLHNLKMFHIPASSYATFRICSMHFPKRCINRYSLCYWAVPTFNLGHDDVANLYQNRELTNTFTTGEVARCSMPNCTSQRGESNLKFYNFPKDIKSLIKWCQNARLPVQAKEPRHFCSRHFEERCIGKFRLKPWAVPTLHLGAQYGKIHDNPKNLYVEEKRCCLNFCRRSRSSDFNMSLYRFPRDEVLLRRWCYNLRLDPAVYRGKNHKICSAHFIKEALGLRKLSPGAVPTLHLGHNDTFNIYENELWPPPTPSTPTHNHQQQLQQHQLQQQPQQVHHKYQRHSAASTSSSASSTSHYVDPELSASYMSMGAGGSSSGLNVSDSMDVCCVPSCESKRHNNDSITFHTIPRRPEQMRKWCHNLKIPEDKMHKGMRICSLHFEPYCIGGCMRPFAVPTLHLGHDDEDIHRNPDVIKKLNIRETCCVAVCKRNRDRDHANLHRFPSNVPLLTKWCANLQRPVPDGSKLFNDAICEVHFEDRCLRNKRLEKWAVPTLILGHENIPYPLPTAEQVAEFYARPSAPNNGEEQGECCVETCKRNPSVDDIKLYRPPEESQVLSKWAHNLQLEIAQLPNMRICNLHFESHCIGKRMRPWAIPTLNLATNIENIYENPEHQMLYKRRTHLKPGRAARGSEASGVKPTWVPRCCLPHCRKVRATHNVQLYRFPKLNRSTLAKWAHNLQVPPVGSAQRRLCSAHFESHVLSKKCPVPMAVPTLDLNTPSGYKIYQNPAKLKANKLCLQRVCIVESCRRQRAQGVQLFRLPHSPTQLRKWMHNIRMRPRGAMRQQYRICSQHFETHSFNGKRLSAGAIPTLELGHEDEDIFPNEAQSFVEEHCTVEGCGAIKEQPDVRLFRFPNDDEDLLWKWCNNLKISPVDCIGVRICNRHFEADCIGPKHLFKWAIPTLSLGHDDDIELMLNPKPEERYIDPVFKCCLPSCGKTRKFDEVQMNSFPKDPELFQRWRHNLRLEHLNFKERERYKICNAHFEDICIGKTRLNIGSIPTLELGHDETDDLFQVNPEELQSNLFGRQRRVQDSMRINIKQEAHSDLDEDIKPDINLSAATDSRTTQVKIKKSLTNFKCCVPSCGRSRLEHAARLFPFPNGKQQQSKWRHNLRLPAADVDKTTRICSAHFNRRCIDGNQLRGWAMPTQQLGHQELPIYENPKNIPGFFTPTCALAHCRKRRSIDNDLRTYRYPRSEELLEKWRVNLRLSPDQCRGRICADHFEPLVRGKLKLKTGAVPTLKLGHDEGVVFDNEGIKAGLQQEDEAEEEEGNASLKSLVKVKTEQEDEQEIENEDEEQQEQEQDMEHEHGQNMDEDEEGHRDSEEHGYFDPLELVETYAEHHSDDTSAGHDNLDDDEDDDEDIPGNDDELLLPDTRPLRMTMAPRREKAVNNVTPICCLKHCRKERTAIHHLSTFGFPKDPQLLLKWSANLQLPLESCMGRVCVEHFEPSMLGTRKLKQNAVPTLKLGHATPLTYSCNGRMLSGIYDEQPQHSVFRLWSLKHCRKRKPDLAEIKPGRRCCLPSCGKLSELHGVQLQRLPKDRLMLRKWLHNLKLPPALDCTQMFLCSDHFELNASCPTLKLGHSDTNIYRHNVASIRGNSGCLVPKCTCARLNLYRGYDLPAHLQVQQAWLHWLQLPHPQPSPRHAQLCVMHFMQLYELVQLPESVPDIVRRQLRETYELISSSSMAMKLRCAVPGCYSKYTDNVRLTKLPVCPDTCAKWVHNTKIEYDPARHYVYRICMLHFEPGCLGPVRPKVWAMPTLQLHHEDANIYLNPKLDGSQTQPAVPLELPLRIKTELPMCNSPNFSASASPSPRGKLRTCCIPSCGQQDSALTRLFRFPSAETSMLKWLVNTQQQPRFVDAQRLFVCQDHFEAEAICKNQLRSWAVPTLNLGHDGHIIPNAKHNGNIADSQENKQTLQFIWANYCSVLTCFQQSSEQLRLYQYPTDRPTIRKWAANCKHRSMQASSDGFQVCQSHFAPDCFDPDTGELNEDAVPTLALSRAVTEVRCVVNGCVKDEDATRRRLFKMPKRTPQILDWCHNLRLDQAATSGSEQHVCERHFESNCFNASRVLRPGARPTLHLGHEDLDDVIPNPANWEEDVIVCCVPHCESSKDADEVQLFGLPKVRQLADKWLQNVRLDPSKEQLASLKICSVHFEASCLENGRPTYGAMPTLHLGHNEFDNIHPSVESVPTQQKRYCNRDGASHDCCYPQCVELQKSYLRVTYELPQEQELRQQWLSYMGLEASQFDKQQLLKLCPLHLILLYDHSADHFSAHVAEDLLDSNYEAARSSVRIRVVSCAVRGCRTLKPRDGGRLHGLPTRRDVLEMWLHNMQLVFYEQQRYMYKICSKHFEPRCFTVTTKRLKPWSMPTLELPELQPGDMPVYQNPTELEWQHMNELQVSEKVVEAQPEPLLKLEPLPKKEPPAPQAMEYEEDCDNNSQQPMEMQALEVLLEVGHVEKCTTYEQMDTEANLSYAEQFSHNPLSPGPPQCRIPVVQNGLHYSARHCSVHGCNVTSNNLSSSIKLHKFPVSLDAMQKWMHNTQVLVDVKFAWRFRICSHHFIEDCFHGSRIRRGAMPTLRLGSRRPKHIYDNEFNAQLQLEQTKEETRQSLAAPLESQQQLLSANVGLRLPRPAPPCKSSKYCQIEGCSNHLTSENLTLHKFPHSSDMCAKWQHNTQVPFDPEFRWRYRICSAHFEPICLGNVRLMHGSVPTLNLGPLAPKKLFDNEFLRLDKPMSSSEVGMTVKQDRMEQFDQLEMEDGNQEQDDFSLLEPELELHEGSEDEQQYDNHFSQNDSYNWSDQQLRLSSSNQEKCTISYNPVKSGYDKCSLVHCQRQRSQHGVHIYKFPRSRQMQQRWMHNLRIHYDERRPWKTMICSVHFEPHCIRLRKLRPWAVPTLELGGNVPLEIFTNEQSQQLFTQSETGSECDEVEVDVEDTILEDLDDDYDDNDVDVNVDADDQMRTAPYVKRERRSRFDPLPPGQLPPWKIKCCCLPYCRNPRGDGIKLFRLPNNISSIRKWEKATGMRFYESQRNTKLICSRHFDPQLIGVRRLMSNAVPSLHLGPDSAEPEQTPVGPRCCIPDCSENINVQLHKFPRDPMLMHQWCQALNLPDVQSYSGKFICAAHLPANAMSCLICGVDDVQLPMLDFPQNRNQRTKWCYNLKIEPLPKWDNSKKICCKHFESYCFIQPGQLLAEAMPTLHLEHEDSNIFLNDDAMDNSNLLRIKDEPMESEDLML

Similar Transcription Factors

Sequence clustering based on sequence similarity using MMseqs2

100% Identity: iTF_00595971;
90% Identity: iTF_00500343;
80% Identity: -