Basic Information

Insect: Drosophila lutescens
Gene Symbol: -
Assembly: GCA_037075285.1
Location: JBAMCF010000250.1:975959-989364[-]

Transcription Factor Domain

TF Family: THAP
Domain: THAP domain
PFAM: PF05485
TF Group: Zinc-Coordinating Group
Description: The THAP domain is a putative DNA-binding domain (DBD) and probably also binds a zinc ion. It features the conserved C2CH architecture (consensus sequence: Cys - 2-4 residues - Cys - 35-50 residues - Cys - 2 residues - His). Other universal features include the location of the domain at the N-termini of proteins, its size of about 90 residues, a C-terminal AVPTIF box and several other conserved residues. Orthologues of the human THAP domain have been identified in other vertebrates and probably worms and flies, but not in other eukaryotes or any prokaryotes [1].
Hmmscan Out: # of c-Evalue i-Evalue score bias hmm coord from hmm coord to ali coord from ali coord to env coord from env coord to acc

1 29 2.9 4.9e+03 -1.4 2.0 38 62 307 334 298 348 0.59

2 29 4e-15 6.7e-12 46.3 3.9 1 86 540 612 540 613 0.85

3 29 1.6e-14 2.8e-11 44.3 5.0 1 87 640 709 640 709 0.83

4 29 1.5e-15 2.5e-12 47.6 0.2 1 87 731 803 731 803 0.85

5 29 8.7e-16 1.5e-12 48.4 5.6 1 87 902 972 902 972 0.81

6 29 2.3e-14 3.8e-11 43.9 3.0 1 86 996 1067 996 1068 0.82

7 29 9.6e-13 1.6e-09 38.7 0.7 1 87 1103 1171 1103 1171 0.81

8 29 1.3e-10 2.2e-07 31.8 1.4 1 86 1211 1280 1211 1281 0.76

9 29 7.3e-17 1.2e-13 51.9 0.4 1 86 1308 1377 1308 1378 0.83

10 29 7.1e-13 1.2e-09 39.1 1.7 1 85 1399 1467 1399 1469 0.82

11 29 4.6e-14 7.8e-11 42.9 0.4 1 86 1496 1567 1496 1568 0.85

12 29 1.1e-12 1.9e-09 38.4 3.0 1 85 1644 1712 1644 1714 0.82

13 29 1.7e-12 2.9e-09 37.8 0.1 1 86 1737 1805 1737 1806 0.81

14 29 9.4e-13 1.6e-09 38.7 1.1 1 87 1939 2008 1939 2008 0.80

15 29 3e-10 5.1e-07 30.6 0.3 1 86 2110 2176 2110 2177 0.79

16 29 0.00079 1.3 10.1 0.0 1 58 2192 2236 2192 2247 0.83

17 29 3e-12 5e-09 37.1 0.5 1 87 2266 2336 2266 2336 0.83

18 29 1.5e-12 2.5e-09 38.1 0.5 1 87 2395 2465 2395 2465 0.82

19 29 6.6e-11 1.1e-07 32.8 0.1 1 86 2500 2571 2500 2572 0.81

20 29 3.2e-12 5.3e-09 37.0 0.0 1 86 2582 2653 2582 2654 0.79

21 29 3.4e-09 5.7e-06 27.3 0.0 1 86 2678 2748 2678 2749 0.77

22 29 0.00016 0.28 12.3 0.1 1 58 2782 2829 2782 2849 0.80

23 29 7.4e-13 1.3e-09 39.0 0.2 1 86 2867 2939 2867 2940 0.82

24 29 8e-16 1.3e-12 48.5 0.4 1 86 3052 3124 3052 3125 0.81

25 29 2.9e-12 4.9e-09 37.1 3.7 1 86 3186 3256 3186 3257 0.81

26 29 4.4e-14 7.3e-11 42.9 4.7 1 86 3357 3427 3357 3428 0.85

27 29 3.1e-11 5.2e-08 33.8 0.1 1 86 3507 3576 3507 3577 0.83

28 29 1.5e-10 2.5e-07 31.6 1.5 1 58 3600 3648 3600 3661 0.84

29 29 1.6e-09 2.7e-06 28.3 1.7 18 87 3666 3724 3655 3724 0.75

#	of	c-Evalue	i-Evalue	score	bias	hmm coord from	hmm coord to	ali coord from	ali coord to	env coord from	env coord to	acc
1	29	2.9	4.9e+03	-1.4	2.0	38	62	307	334	298	348	0.59
2	29	4e-15	6.7e-12	46.3	3.9	1	86	540	612	540	613	0.85
3	29	1.6e-14	2.8e-11	44.3	5.0	1	87	640	709	640	709	0.83
4	29	1.5e-15	2.5e-12	47.6	0.2	1	87	731	803	731	803	0.85
5	29	8.7e-16	1.5e-12	48.4	5.6	1	87	902	972	902	972	0.81
6	29	2.3e-14	3.8e-11	43.9	3.0	1	86	996	1067	996	1068	0.82
7	29	9.6e-13	1.6e-09	38.7	0.7	1	87	1103	1171	1103	1171	0.81
8	29	1.3e-10	2.2e-07	31.8	1.4	1	86	1211	1280	1211	1281	0.76
9	29	7.3e-17	1.2e-13	51.9	0.4	1	86	1308	1377	1308	1378	0.83
10	29	7.1e-13	1.2e-09	39.1	1.7	1	85	1399	1467	1399	1469	0.82
11	29	4.6e-14	7.8e-11	42.9	0.4	1	86	1496	1567	1496	1568	0.85
12	29	1.1e-12	1.9e-09	38.4	3.0	1	85	1644	1712	1644	1714	0.82
13	29	1.7e-12	2.9e-09	37.8	0.1	1	86	1737	1805	1737	1806	0.81
14	29	9.4e-13	1.6e-09	38.7	1.1	1	87	1939	2008	1939	2008	0.80
15	29	3e-10	5.1e-07	30.6	0.3	1	86	2110	2176	2110	2177	0.79
16	29	0.00079	1.3	10.1	0.0	1	58	2192	2236	2192	2247	0.83
17	29	3e-12	5e-09	37.1	0.5	1	87	2266	2336	2266	2336	0.83
18	29	1.5e-12	2.5e-09	38.1	0.5	1	87	2395	2465	2395	2465	0.82
19	29	6.6e-11	1.1e-07	32.8	0.1	1	86	2500	2571	2500	2572	0.81
20	29	3.2e-12	5.3e-09	37.0	0.0	1	86	2582	2653	2582	2654	0.79
21	29	3.4e-09	5.7e-06	27.3	0.0	1	86	2678	2748	2678	2749	0.77
22	29	0.00016	0.28	12.3	0.1	1	58	2782	2829	2782	2849	0.80
23	29	7.4e-13	1.3e-09	39.0	0.2	1	86	2867	2939	2867	2940	0.82
24	29	8e-16	1.3e-12	48.5	0.4	1	86	3052	3124	3052	3125	0.81
25	29	2.9e-12	4.9e-09	37.1	3.7	1	86	3186	3256	3186	3257	0.81
26	29	4.4e-14	7.3e-11	42.9	4.7	1	86	3357	3427	3357	3428	0.85
27	29	3.1e-11	5.2e-08	33.8	0.1	1	86	3507	3576	3507	3577	0.83
28	29	1.5e-10	2.5e-07	31.6	1.5	1	58	3600	3648	3600	3661	0.84
29	29	1.6e-09	2.7e-06	28.3	1.7	18	87	3666	3724	3655	3724	0.75

Sequence Information

Coding Sequence: ATGTCACAACAACACCCCCATCACGCCCACCCCCACCACTACGCCCACCACTATCCGCCCCCTGCGACGCCCATGTCCCTGCAGCAACAAACGCAGCAGCCgtcgcaacagcagcagcagcacgccAATTGGTACTCACATGTTGCTTCCTACCCCACACCCCACTCGGCCTTCGGccccgcccccgccccctCCTGCAAGGCCaccagcagcggcaacaacaacatcataGGAGGCGGAGGCTATGGGCCGGGGGGTGGCAACGCGCAGGGTTATTATGGCGCCGCTGGCGGTGGCCTCAATGTCAGTGGGGcggcagtgggtggtgggccgAGCTACGGCCTTGGGGCCAATACAGTGGCATATGCCCACAACCAACTGCTGCagtaccagcagcagcaacaacagcagctacATCAGCAACTTCCACAGCATCTAAGCCAACAAAGGTCCTATATGGGCCACGATATCATGACCGGCAGCTATCCCTATATCAAAAGCGAACCCATGGAGGCCTTCCAGCAGCCCCCCAATCCCATGGCCCCGCCCCCGGCTCCAGaagtattaataaaatcgGAACCCATTGACGAACATTCCTACAAGTCCAACTATATAGACGACAACACTCCATTTGCGGACTTCAGCAAGTTCAGCGAATTCAGCGAGGACATGTTGAGTCCCAAAGTGGAACTGACCGTCAAGGATGAGTCCTACGGAAGGAATACCAACAGTTTTCTGCGCCGCAAACAGCAATCGGACCGGAGTGCCGAAAGCCTGCCCATCTGCCAGCGCTGCAAGGAGGTCTTCTTCAAGAAGCAGGCCTATCTGCGGCACGTGGCCGAGAGCAATTGCGGGATGCAGGAGTACGACTTCAAGTGCAACACCTGCCCCATGTCCTTTATGACCACCGAGGAGCTGCAGCGGCACAAGCAACAGCACCGAGCAGACAGGTTCTTCTGCCACAAGTACTGCGGAAAGCACTTCGACACGATCGCCGAGTGCGAGGCGCACGAGTACATGCAGCACGAATACGATAGCTTTGTCTGCAATATATGTTCTGGGACCTTCGCTACCCGTGAGCAGCTATACGCCCACCTGCCGCAACACAAGTTCCAGCAGCGCTTCGACTGTCCCATCTGCCGCTTGTGGTATCAGACGGCTCTCGAGCTCCACGAACACCGTTTGGCCGCACCCTACTTCTGCGGCAAGTATTACACGGGGGGACAGACATCCACGGCCTCGCactcgcagcagcagcaccagacGAACTACAAGCTACAGGATTGCCATATGGCGACCATTGAAATGCCCACCGCCCCGCACCACAAACCGAACCCATCCAGCTCGTCCTTGCCGGCCACGGCTGCCCTAAATTCACTCCTGCAGCAGCGTCAGGCAAACGCCGATGGAGCAGCCATGTTTGCGGCTTCTGCACTTAAGAACGAGGTAAATGTGAAGCTGGAGCGAAGCTTTAGCAACTCGACCAGCGAGTCATCCTACAGCGTTCAGGAGAGTAGCTACAATAATGCCTATGGAAGTGATAGCTCAATCCACGGAGGTGCGATCGCTGGACCACAGGCACACTCATCGACACTGGACGACTCCGAGGACGCTTTGTGCTGTGTGCCACTGTGCGGAGTGCGGAAAAGCACCAGCCCCACGCTGCAGTTCTTCACGTTCCCCAAGGACGAGAAGTACCTCAACCAGTGGCTACACAATCTCAAGATGTTTCACATACCCGCCGCCAGCTACGCCAATTTCCGCATCTGCAGCATGCACTTCCCGAAGCGCTGTATTAACCGCTATTCGTTGTGCTATTGGGCAGTGCCCACCTTCAACCTGGGTCACGACGACGTGGCGAATCTCTATCAAAACCGGGAGCTGACCAACACCTTCACAACCGGCGAGGTAGCCCGTTGCAGCATGCCGCACTGCACCAGTCAACGGGGCGAGAGCAACTTAAAGTTCTATAATTTTCCCAAGGACATCAAGAGCCTCATCAAGTGGTGCCAGAACGCACGACTTCCCGTTCAGGCGAAGGAGCCGCGTCACTTCTGCAGCCGCCACTTTGAGGAGCGTTGCATCGGCAAGTTCCGGCTGAAGCCTTGGGCGGTACCCACTTTACATCTGGGTGCCCAATATGGCAAGATCCACGACAACCCGAAGAATCTGTACGTGGAGGAGAAGCGCTGCTGCCTCAACTTCTGCCGCCGGAGCCGATCCTCTGACTTCAATATGTCGCTATATCGTTTTCCTAGAGATGAGGTACTTTTGAGACGCTGGTGCTACAATCTGCGCCTGGATCCGGGGGTGTATCGCGGGAAGAATCACAAAATATGTAGCGCGCACTTTATTAAAGAGGCCTTGGGTCTGCGGAAGCTATCACCGGGTGCTGTCCCCACGCTTCACCTAGGTCACACTGACACCTTCAACATCTATGAGAACGAATTGTGGCCGCCGCCAACGCCCTCCACCTCTCACAGCGGTGGCCTCCAGCAGCATCAGGCGCAGCATCACCACTCGCAACACActttgcagcagcagctgcacaGCAAATCGTATCAGCGCCACTCGGCGGCATCTACATCGTCCTCGGCCAGTTCGGCGACCTCTCACTACGTTGATCCGGAGCTGAGCTCCTCTTACCTGGCTATGGGTGCAGGTGGACCCTCGGCCATGAACGTCAGCGACAGCATGGACATCTGCTGTGTGCCCAGTTGCGAGAGCAAGCGACACAACAACGAGAACATCACATTCCACACCATACCGCGCCGACCGGAGCAGATGCGCAAGTGGTGCCACAACCTGAAAATACCAGAGGAAAAGATGCACAAGGGCATGCGGATCTGCAGTCTGCACTTCGAGTCTTACTGCATCGGCGGTTGTATGCGTCCGTTTGCAGTGCCCACGCTTAATTTGGGCCACGATGAGGACGATATTCATCGGAATCCGGACGTGATTAAGAAGCTTAATATCCGGGAAACTTGCTGCGTTTCCGTATGCAAACGGAATCGAGACAGGGACCATGCCAACCTGCATCGCTTCCCAAGTAATGTGTCGCTGCTGACCAAGTGGTGCGGCAATCTCCAGCGGCCTGTTCCGGATGGCAGTAAACTATTTAACGACGCTATCTGTGAAGTGCACTTTGAGGATCGATGCCTGCGCAACAAAAGGCTGGAGAAGTGGGCGGTGCCCACACTGTTACTGGGCCATGAAAACATCGCCTATCCGCTTCCCACACCGGAACAGGTCACCGAGTTCTATGCGCGACCCACTGCGCCCAACAATGGCGAGGAACAGGGCGAGTGCTGCGTGGAGACCTGCAAGAGAAATCCCAGTGTGGACGACATCAAGCTTTATCGGCCGCCGGAGGAGGCTTCCGTGTTGGCCAAGTGGGCGCACAACCTGCAAACAGAGGCTGGTAAGCTGACGAGCATGAGGATTTGTAATCTTCACTTCGAGGCACACTGCATCGGCAAACGGATGCGACCATGGGCGATACCCACACTTAATCTGGCCGGAAACATTGAGAATCTCTATGAGAATCCAGAGCATTCGATGCTGTACAAGCGTCGAACCCACACGAAAACCAAGCTGCCGGCTTCCGTCAAGCCCACTTGGGTGCCCAGGTGCTGTCTTCCACATTGCCGCAAGGTTCGAGCTCTGCACAACGTTCAGCTTTATCGCTTCCCCAAGCTCAATCGCTCCACTCTGGCCAAGTGGGCGCATAATCTGCAGGTTCCCATGGTCGGCAGTGCCCAACGCCGGCTGTGCTCGGCTCATTTTGAACCACATGTGCTGAGCAAGAAGTGTCCGGTGCCGCTGGCGGTACCCACGCTAGACTTGAACTCTCCGGCCGGCTTAAAGATCTACCAAAATCCGGCCAAGCTAAAGGCCAGCAAGCTATGCCTGCAGCGCGTGTGCATAGTCGAAAGTTGCCGTAAGACGCGGGCGCAGGGCGTCCAGCTCTTCCGGCTGCCACATAGTCCCACGCAGCTGCGCAAGTGGATGCACAACATCAAGACGCGTCCGAGGGCGGCGATGAGGGCTCAATACCGGGTATGTTCCCGCCACTTTGAGACACACTCGTTCAATGGCAGGAGACTAAGCGCTGGCGCCATTCCCACCCTGGAATTGGGTCACGACGACGAGGACATCTATCCCAACGAAGCGCAGGCATTTGCGGACGAGCACTGCGTGGTGGAGGGCTGCGAGGCATCTAAGGAACAGGCGGAGGTGCGACTTTTCCGCTTTCCCACAGAAGACGACGATATGCTGTGGAAATGGTGCAACAACCTTAAGATGAACCCCGTGGATTGCACCGGAGTACGCATATGCAACAAACACTTCGAGGCGGACTGCATCGGACCCAAGCACCTGTACAAGTGGGCTATACCCACGCAGGAACTGGGCCACGACGACGCCCAGATCGAGCTGATTCCGAATCCCAAGCCAGAGGACCGGTATGTGGATCCGGTGTTCAAGTGCATCGTCCCCACTTGTGGAAAGACGCGCCGTTTCGACGAGGTGCAGATGAACAGCTTCCCGAAGGACCCGAATCTCTTTCAGCGTTGGCAGCATAACCTGCGGCTGGAACACCTCAACTTCCTGGAACGCGAACGTTACAAGATCTGCAATGCCCACTTCGAGGACATCTGTATTGGCAAGACACGCTTGAACATAGGCTCGATCCCTACTCTTGAGCTGGGTCACGACGAGACGGAGGATCTGTTCCAGGTGAATCCGGCGGAACTGCAGAGCAACCTTTTCGGACGGCAGCGGCGAGTACACGAGGAGTCTGGCGGGATAAGCATCAAGCAAGAGGTCTCCGAGTCGGAAGACGTCAAGCCGGATTTGACAACCATGCACGAAGCCACAGAATCGAGGACTAGACAGGTCAAATTCAAGAAAACGGTATCCGATCTAAAGTGTTGTGTGCACAGTTGTGGACGCAGTCGTCTGGAGCACGGAGCACGACTCTTTCCGTTTCCAACCGGCAAGCAGCAACACCTCAAGTGGCGTCACAACCTGCGCCTGGAACCCGACGAGGTGGACCGGTCGACACGGGTCTGCAGTGCCCACTTTAACCGGCGCTGCATTGACGGCAAGCAACTAAGGAGTTGGGCAATGCCCACGCAACAACTGGGCCACCAGGAGCAGCCGATCTACGAGAATCCAAAGAACATACCGGGATTCTTCACGCCCACCTGCGCTCTGGGTCATTGCCGCAAACGTCGGAGCATAGACAACGATCTGCGAACCTACCGATATCCAAGAAGTGAGGATCTACTGGAGAAATGGCGGGCGAATCTTCGGCTGACTCCGGATCAGTGTCGCGGCAGGATTTGTGCGGATCACTTTGAAGCCCAGGTTCGGGGCAAACTAAAGCTGAAGACTGGAGCGGTGCCCACTTTAAAACTGGGCCACGATGAGGGCTTAGTCTTCGACAATGAGGCTATTAAGGTTGGAGTGACCGAGGATGAGGAAGGCAGCTCGGAGTTGCCGCGACTGAAACCCAAAAGGGAGCTAATCGACGAGGAGGAAGAAGACGTGGAGGCTGAGGAGGAGCACAATGACCAGGATAATGAGGATGAAGATGAGAAGGGCGACCACTATTTTGATCCACTTGAATTGGTCGAGACCTTTGCCGAACATCCGAGCGATGACGAAGCCGAATATTGTGGGGATGAAGAGGATGATCTAGACGAAGAAGAGAACATGGTGGAAATGGATCACTTCCTGCCGGACGCGCCACCCATTCCTCCAACTGTCCCTATGCGTCGCGAAAAGCCCGCCAACAATGTGACTCCCATTTGTTGCCTAAAGCACTGCAGAAAGGAGCGCACTGCCTTTCACCTCCTCAGCACTTTTGGTTTTCCCAAGGACCGCCAGTTGCTGCTCAAGTGGTGCGCCAATCTCCTCCTGGATCCGGATGACTGCATCGGCCGGGTTTGCATTGAACACTTCCAGCCGGAGGTTCTCGGTACCCGAAAGCTCAAGCAGAATGCGGTACCCACTCTCAATGTGGGCCACAATGAGCCACTCAGATACTCGTGTAACGGAATGGATCGGGACCAGGAGCAATCACAGCCACAGCATTCGGTTTTTCGGCTTTGGAGCCTAAAACACTGCCGCAAGAGGAAGCTAACAGAGCCGCCGGATATTCGACCAAGCAAGTGGAGTGCGGCGGAAGTGCAGATGATGCAGAGGTTGAAGATGGAGATTCAGATAGAGAGGGAGATCAAAGTGGAGATGCAGATGGAGAGGGAATTAAAGACGTCGGCGAAGACTCTAACGAGGAATCCGAGGGAGAGTAAGCCGGAAAGATGTTGCATCAGCACCTGCTCAAATGAGGATGTTAAGCAATTACTTCCAATGCCTGATGAGCGAAATCTCTTAAGAAAATGGCAGCATAACCTGAAGCTTTCTATGGACACGGTTTTCAGGGATATTCGGGTATGTGTGGAGCATTTTGAGGCGGAAGTTGTGGAAAACGGAAAGCCATCAGAGCAAGCAGTTCCCACCTTAAAACTGGAACAAAACAGTTATAACATCTACAGAAACAACGGTGCGTGTCTGGTTATCGACTGCGGAAACTCTTCGTCGAGCTTGGTGGACTTGCCTCAAAATATGGTTATAAGAGACTCCTGGATGTCCCACCTAAATCTGCCTCTCAGCATTGATGGTCTCCTATGTAATCTACACTTTATGGGCCTTTATGACGAGGTGGGGTTGCCCAAGGTTCTGGCCGCACAAGACTTGGAGGACTTGCAGTGGTGTGCCGACGAAATGAAATGCGCTGTGCCTGGATGCTCCTCCAAAAATGCCAAAGATCTTAAGCTTACCCAGCTTCCAGAGCAGGAGGTGACGCTTTTCAAATGGCTACATAACTCTAAGATGGCCTACGAGCATTCTAGGCATAAAAGCTATCGCATCTGTCTGCTCCACTTTGAGCCAACGGTCCTAGAGTCGGATTTCCCGAAACCTTGGGCTATACCCACCTTGCATCTGAACCATGAGGACAAGATTCATTTGAATCCCAGTCAGCAAGGTCAAGAGTCACGCAGTATAACTCCCAATAGCAATTGTAGGCTAACTCCTCTAAGAATTAAGACCGATCTCGCCTCCTTGAGCAGTCCCTGCGGGAGTGCAAGTCCCAGTCCTCGAGGCAGGATTAGGATATGTTGCATTCCCACATGCGGACAGTTTGGAAATAGCCAAATACGGCTCTATCGCTTCCCCTCCGAAGAGCAAGCCTTGCTCCGGTGGCTGGTAAACACCAATCAGCAACCTCGCCTTGTGGATCCCGCGGAGCTTTATGTGTGCCAGTCCCACTTCGAGCCCGATGCCATATGTAAGAAGCAACTTCGCAGCTGGGCAGAGCCCACCTTGAACTTGGGCCACGACGGCTATGTCATCCCCAATGCCAGGCACAATGGGAACATCGCCGACGGCCAGGACACTGAGCAGGCGATGACGTTTATCCGAGAACGCTATTGCTCAGTGCTGTCCTGCTTCCAAGCTGAAGGCAATGGAATACGGCTCTATGAGTATCCCAAGGATATGGCAACGATACGGAAGTGGGCAGCCGCCTGCAGACATCGCTCCATGCAGGCCAGCAGCCATGGATTCAAGGTGTGCCAGTCTCATTTTGCGCCGGAATGCTTCGATCCGGACACTTTGGATTTGATTGAAGGTTCGATTCCCACTCTGGAGTTGACAAGAGATGACATGGAAAAGCACTGCCTGGTGCCTGGATGTGTTAAGGATGCGACTGGAGACCGTCTGCGTTACTACAAGGTGCCAAAGAACGCTGCTCAACTGGATGCTTGGAGCAACAATCTGAAAATCAATTCCATTGAGCTTGTTCAGGGAGAACAGTTCATCTGCGAGCGCCACTTCGAGTCCTTTTGCTTCGGTGCCTACAAGGGCTTGCGTCCGGGTGCGCTTCCAACTCTTTTGCTTGGTAATGACAAGGAGGTTGAGATGTTGCCCAATCCCGCAAATCTCTGTCAGAGCAAAACGGAGGTTTGCTGTGCGCCCGGATGCGGACGTATTTGGCAGCTTGGAGACCTTCCGTTCAGTGGATTTCCCAAAGTATTCGTGTTGGCCGATAAATGGATGTTTAACCTACGCCTGAGAGTTGCCAAGGAGCAGCTATGCAGGCTGAAAGTCTGCAGTGCGCACTTTGAGCCCTCTCTCTTCGACAAAAGTGGACTAATCTCGGGATCGATACCCACCCTGGAACTGGGGCATTCCTCGCCGGACATTTTCCAGACAGACCCGCAAAATCTGGGAAAAAGCTTAAAGCTTTTTAAGCGAGACCTAACGCCGGAGGTTAATTGCTGTTATCCTGAGTGCAAGGAACTGTCCAAGAACCTGTCTTACAAGCTGCCCCATGAGGAGCCCCTCAGACGGGCTTGGCTTCGCCATTTGGACATCGAAGAGCCGTCGAATGGTGTCGGCCAGCTTTGCCCGTTGCATTACGTTATTCTTTATCAGCTGAGTGTGAAAAGTTTTCCCGAGCACGTTCCAAATCGATTCCTCGAGGATAATTACCATTCTGCTCGGAGCAACCGGCGCGTGAGAATCGTTAGTTGCGCAGTCAAAGGTTGTGAAATGATCAGGCCCCGGGACAAGGTTCTTTTGCACGGGTTGCCGCAAAGAAGAGACATCCTGAAGATGTGGGTGGAAAATGGCCAACTGGAGATtacggagcagcagcagcaatacaTGCTCAAGGTGTGTCGCAATCACTTTGAGTCACGCTGTACGTTTGACGACCGGAGGCTGCATCCATGGAGCGTTCCCACTCTCCTCTTACCAGCAAGCCCCGTGCATCAGATTCCCACCAAAGAGGAGTGGCAGGAGATGACGCTTAAACTTACCCAGGAAGCCGGGACAATCAAACGGGAGATCGAGGAGGAGTTGCAAGAGGAGGAAATGTGTGATAACTCCATGTTGGAACCCATTGTACGAATGGAGCATTTGGAGTCCGAGGAGGAAGACTCAGAGATGCAGGCCCTGGAGGTGCTCCTTGAGGTCGGCCACGTTGAACGGATGGACAGCTACGAGAAGGTGGACAAATCCTATACTACCGACCACGCCATCTACCAACCTACTGGGATTCGTAATCAGTACAATGCCAATCACTGCGCCGTCGAGGGATGCCAGGTGACCGTTGAGGACGTGGACGGGACCATCAAGCTGCACAGGTTCCCCGCATCCTCGGAGTCCGCTAGAAAGTGGATGCACAACACCCAAGTTGACATGGACGAGAAGTTCTGGTGGCGCTATCGCATTTGCAGTTACCATTTCGACCAGGAGTGCTTCCAAAGCGCCAGGATAAAGAAGGGGGCGATGCCGACGCTTCTCTTGGGACCAAAGAGACCGGACCAACTGTTCGAGAATGAATTCGCCCTACAGGAGTCAGAAGATCTACCTTTGCTCTTACCAGCAGATGCACTTCCAAGGGAGCAAAAGGAGGCGTCAGTTCGAGAGGTAACCAAATTATGCCTACCGCAGCCGGCTCCGCCTCAAAAGTCCAGCAAGTTTTGTCAGATTGAGGGATGTATGAATCACCTGACCACTGAAAACATGACGCTGCACAAGTTTCCTCATTCCGAGGACATGTGCCTCAAGTGGCAACACAACACGCAGGTGCCATTCGACCCCTTCCACCGATGGCGCTATCGCATCTGCAGTGCCCACTTTCACCCGGTGTGCCTGCTGAACATGCGACTAGTCCACGGCAGTGTACCGACCTTGAAACTGGGAAGCAAGGCTCCCGCCGAGCTCTTTGACAACGACTTCGAGGCCATTAACCTAAGACTTGACAAGAGGTCGAGCTTAGAGTCAAGCACCGTGCAGATCAAGGAGGAAAGGGAGGAAGATGAGGATGCTATGTGGTTCCTGGAGCCGGAGTTGCAGCTGCACGAGGACCAAGAGGAGGAGGACACGGCAGCGGTGCCAGTGTCCTTTAGCCAGTCAAACTGGAAAAGCCAGCTGCGTCTGCCCGTAAAGCAAGAGAAGGTTACCTACAACCAAGTGAAGTCCGGATACGATAAGTGCTCGCTGGCCCATTGTCAGCGGCAGAGATCTCAGCACGGCGTTCACATCTACAAGTTTCCAAAATCAAGGCGCCAACAGGAGCGTTGGGTGCACAACCTCCGCATCCGTTACGATGAGCGGCGGCCCTGGAAGTTTATGATCTGCAGCGTGCATTTCGAGCCGCACTGCATTAGCCTAAGGAAGCTACGCCCCTGGGCAGTACCCACGCTGGAACTGGGCGACAATGTGCCGGAGAAGATCTTTACAAACGAACAGTGCCAGGAGCTCAACACTGATCGCAGCGAGGCTGAGAGCGACGGCGACGAGGAGGATGGCCTacaggaggacgaggaggaggaggatgagtgCGACGAGGACGTGGAGCCGGAGGTTCGCATCAAGCGAGAGCGACGATCCAAGCTCGATCCCTGGCCGCCTGGCATCGTTCCGCCTTGGAAGGTCAAGCAGTGCTGCCTCCCATACTGCCGCGCCTTTCGTGGCGAGGGCATCAAGCTGTTCCGGCTGCCAAACAACCGCACCTCGATCCGCAACTGGGAGCTGGCGACGGGCATGCTGTTTAAGGAGTCACAGCGGAATACACGTCTGATCTGCAGCCGTCACTTCGAGCCCGAGTTGATTGGGGTTAGGCGCCTCATGCGCAACGCAATCCCTACGAGGCACTTGAATCCCCAAGGAGTCTTGCAAGAAGCTAAGAAAAAGCCGGAGCCACCCGTCCCCATCGCAACCTGTTGCATGGCTGACTGCCATCACAATGGAAATGTCAAGCTGCACAAGTTTCCCAGTGATCCCACACTGCTAAGACAGTGGTGCCAAGCACTCAGGCTTACGGATACACAGAGATACCGGGGAAAACATATCTGCTCGGTCCACCTTCCCACCGACAAGACGATAAGCTGCGTTATCTGCGGAGTGGACAACGTCCAGCTGCCGATGCTGGACTTTCCGGAGCAGCGCAATCAGCGCGCCAAGTGGTGCTACAATCTCAAGATCGAGGCCATACCAAAGTGGGACCATTCCAAGCACATCTGCTGTCGTCACTTCGAGACGCATTGCTTTTTGCAGCCGGGTGAGCTGCGCTCAGGTGCGATTCCCACGCTGCATCTGAACCACGACGACACGAACATCTTCCTAAGCGACTACGCCACTGGTCCGACCAGCAATCGGATCAAAGACGAGCCGCTGGACAACGACAACGAGATGCTGCTGGTTTAG
Protein Sequence: MSQQHPHHAHPHHYAHHYPPPATPMSLQQQTQQPSQQQQQHANWYSHVASYPTPHSAFGPAPAPSCKATSSGNNNIIGGGGYGPGGGNAQGYYGAAGGGLNVSGAAVGGGPSYGLGANTVAYAHNQLLQYQQQQQQQLHQQLPQHLSQQRSYMGHDIMTGSYPYIKSEPMEAFQQPPNPMAPPPAPEVLIKSEPIDEHSYKSNYIDDNTPFADFSKFSEFSEDMLSPKVELTVKDESYGRNTNSFLRRKQQSDRSAESLPICQRCKEVFFKKQAYLRHVAESNCGMQEYDFKCNTCPMSFMTTEELQRHKQQHRADRFFCHKYCGKHFDTIAECEAHEYMQHEYDSFVCNICSGTFATREQLYAHLPQHKFQQRFDCPICRLWYQTALELHEHRLAAPYFCGKYYTGGQTSTASHSQQQHQTNYKLQDCHMATIEMPTAPHHKPNPSSSSLPATAALNSLLQQRQANADGAAMFAASALKNEVNVKLERSFSNSTSESSYSVQESSYNNAYGSDSSIHGGAIAGPQAHSSTLDDSEDALCCVPLCGVRKSTSPTLQFFTFPKDEKYLNQWLHNLKMFHIPAASYANFRICSMHFPKRCINRYSLCYWAVPTFNLGHDDVANLYQNRELTNTFTTGEVARCSMPHCTSQRGESNLKFYNFPKDIKSLIKWCQNARLPVQAKEPRHFCSRHFEERCIGKFRLKPWAVPTLHLGAQYGKIHDNPKNLYVEEKRCCLNFCRRSRSSDFNMSLYRFPRDEVLLRRWCYNLRLDPGVYRGKNHKICSAHFIKEALGLRKLSPGAVPTLHLGHTDTFNIYENELWPPPTPSTSHSGGLQQHQAQHHHSQHTLQQQLHSKSYQRHSAASTSSSASSATSHYVDPELSSSYLAMGAGGPSAMNVSDSMDICCVPSCESKRHNNENITFHTIPRRPEQMRKWCHNLKIPEEKMHKGMRICSLHFESYCIGGCMRPFAVPTLNLGHDEDDIHRNPDVIKKLNIRETCCVSVCKRNRDRDHANLHRFPSNVSLLTKWCGNLQRPVPDGSKLFNDAICEVHFEDRCLRNKRLEKWAVPTLLLGHENIAYPLPTPEQVTEFYARPTAPNNGEEQGECCVETCKRNPSVDDIKLYRPPEEASVLAKWAHNLQTEAGKLTSMRICNLHFEAHCIGKRMRPWAIPTLNLAGNIENLYENPEHSMLYKRRTHTKTKLPASVKPTWVPRCCLPHCRKVRALHNVQLYRFPKLNRSTLAKWAHNLQVPMVGSAQRRLCSAHFEPHVLSKKCPVPLAVPTLDLNSPAGLKIYQNPAKLKASKLCLQRVCIVESCRKTRAQGVQLFRLPHSPTQLRKWMHNIKTRPRAAMRAQYRVCSRHFETHSFNGRRLSAGAIPTLELGHDDEDIYPNEAQAFADEHCVVEGCEASKEQAEVRLFRFPTEDDDMLWKWCNNLKMNPVDCTGVRICNKHFEADCIGPKHLYKWAIPTQELGHDDAQIELIPNPKPEDRYVDPVFKCIVPTCGKTRRFDEVQMNSFPKDPNLFQRWQHNLRLEHLNFLERERYKICNAHFEDICIGKTRLNIGSIPTLELGHDETEDLFQVNPAELQSNLFGRQRRVHEESGGISIKQEVSESEDVKPDLTTMHEATESRTRQVKFKKTVSDLKCCVHSCGRSRLEHGARLFPFPTGKQQHLKWRHNLRLEPDEVDRSTRVCSAHFNRRCIDGKQLRSWAMPTQQLGHQEQPIYENPKNIPGFFTPTCALGHCRKRRSIDNDLRTYRYPRSEDLLEKWRANLRLTPDQCRGRICADHFEAQVRGKLKLKTGAVPTLKLGHDEGLVFDNEAIKVGVTEDEEGSSELPRLKPKRELIDEEEEDVEAEEEHNDQDNEDEDEKGDHYFDPLELVETFAEHPSDDEAEYCGDEEDDLDEEENMVEMDHFLPDAPPIPPTVPMRREKPANNVTPICCLKHCRKERTAFHLLSTFGFPKDRQLLLKWCANLLLDPDDCIGRVCIEHFQPEVLGTRKLKQNAVPTLNVGHNEPLRYSCNGMDRDQEQSQPQHSVFRLWSLKHCRKRKLTEPPDIRPSKWSAAEVQMMQRLKMEIQIEREIKVEMQMERELKTSAKTLTRNPRESKPERCCISTCSNEDVKQLLPMPDERNLLRKWQHNLKLSMDTVFRDIRVCVEHFEAEVVENGKPSEQAVPTLKLEQNSYNIYRNNGACLVIDCGNSSSSLVDLPQNMVIRDSWMSHLNLPLSIDGLLCNLHFMGLYDEVGLPKVLAAQDLEDLQWCADEMKCAVPGCSSKNAKDLKLTQLPEQEVTLFKWLHNSKMAYEHSRHKSYRICLLHFEPTVLESDFPKPWAIPTLHLNHEDKIHLNPSQQGQESRSITPNSNCRLTPLRIKTDLASLSSPCGSASPSPRGRIRICCIPTCGQFGNSQIRLYRFPSEEQALLRWLVNTNQQPRLVDPAELYVCQSHFEPDAICKKQLRSWAEPTLNLGHDGYVIPNARHNGNIADGQDTEQAMTFIRERYCSVLSCFQAEGNGIRLYEYPKDMATIRKWAAACRHRSMQASSHGFKVCQSHFAPECFDPDTLDLIEGSIPTLELTRDDMEKHCLVPGCVKDATGDRLRYYKVPKNAAQLDAWSNNLKINSIELVQGEQFICERHFESFCFGAYKGLRPGALPTLLLGNDKEVEMLPNPANLCQSKTEVCCAPGCGRIWQLGDLPFSGFPKVFVLADKWMFNLRLRVAKEQLCRLKVCSAHFEPSLFDKSGLISGSIPTLELGHSSPDIFQTDPQNLGKSLKLFKRDLTPEVNCCYPECKELSKNLSYKLPHEEPLRRAWLRHLDIEEPSNGVGQLCPLHYVILYQLSVKSFPEHVPNRFLEDNYHSARSNRRVRIVSCAVKGCEMIRPRDKVLLHGLPQRRDILKMWVENGQLEITEQQQQYMLKVCRNHFESRCTFDDRRLHPWSVPTLLLPASPVHQIPTKEEWQEMTLKLTQEAGTIKREIEEELQEEEMCDNSMLEPIVRMEHLESEEEDSEMQALEVLLEVGHVERMDSYEKVDKSYTTDHAIYQPTGIRNQYNANHCAVEGCQVTVEDVDGTIKLHRFPASSESARKWMHNTQVDMDEKFWWRYRICSYHFDQECFQSARIKKGAMPTLLLGPKRPDQLFENEFALQESEDLPLLLPADALPREQKEASVREVTKLCLPQPAPPQKSSKFCQIEGCMNHLTTENMTLHKFPHSEDMCLKWQHNTQVPFDPFHRWRYRICSAHFHPVCLLNMRLVHGSVPTLKLGSKAPAELFDNDFEAINLRLDKRSSLESSTVQIKEEREEDEDAMWFLEPELQLHEDQEEEDTAAVPVSFSQSNWKSQLRLPVKQEKVTYNQVKSGYDKCSLAHCQRQRSQHGVHIYKFPKSRRQQERWVHNLRIRYDERRPWKFMICSVHFEPHCISLRKLRPWAVPTLELGDNVPEKIFTNEQCQELNTDRSEAESDGDEEDGLQEDEEEEDECDEDVEPEVRIKRERRSKLDPWPPGIVPPWKVKQCCLPYCRAFRGEGIKLFRLPNNRTSIRNWELATGMLFKESQRNTRLICSRHFEPELIGVRRLMRNAIPTRHLNPQGVLQEAKKKPEPPVPIATCCMADCHHNGNVKLHKFPSDPTLLRQWCQALRLTDTQRYRGKHICSVHLPTDKTISCVICGVDNVQLPMLDFPEQRNQRAKWCYNLKIEAIPKWDHSKHICCRHFETHCFLQPGELRSGAIPTLHLNHDDTNIFLSDYATGPTSNRIKDEPLDNDNEMLLV

Similar Transcription Factors

Sequence clustering based on sequence similarity using MMseqs2

100% Identity: iTF_00605601;
90% Identity: iTF_00605601;
80% Identity: -