Basic Information

Insect: Drosophila pseudoobscura
Gene Symbol: -
Assembly: GCA_009870125.2
Location: CM020870.1:14076078-14090828[-]

Transcription Factor Domain

TF Family: THAP
Domain: THAP domain
PFAM: PF05485
TF Group: Zinc-Coordinating Group
Description: The THAP domain is a putative DNA-binding domain (DBD) and probably also binds a zinc ion. It features the conserved C2CH architecture (consensus sequence: Cys - 2-4 residues - Cys - 35-50 residues - Cys - 2 residues - His). Other universal features include the location of the domain at the N-termini of proteins, its size of about 90 residues, a C-terminal AVPTIF box and several other conserved residues. Orthologues of the human THAP domain have been identified in other vertebrates and probably worms and flies, but not in other eukaryotes or any prokaryotes [1].
Hmmscan Out: # of c-Evalue i-Evalue score bias hmm coord from hmm coord to ali coord from ali coord to env coord from env coord to acc

1 29 4.6 7.8e+03 -2.1 2.9 42 69 304 333 291 343 0.55

2 29 5.2e-15 8.7e-12 45.8 3.6 1 86 536 608 536 609 0.85

3 29 1.7e-14 2.8e-11 44.2 4.8 1 87 636 705 636 705 0.82

4 29 1.4e-15 2.4e-12 47.6 0.2 1 87 727 799 727 799 0.85

5 29 8.5e-16 1.4e-12 48.3 5.5 1 87 906 976 906 976 0.82

6 29 5.9e-15 9.8e-12 45.6 3.2 1 86 1000 1071 1000 1072 0.82

7 29 5.2e-13 8.7e-10 39.4 0.9 1 87 1107 1175 1107 1175 0.81

8 29 2.7e-11 4.5e-08 33.9 2.0 1 86 1214 1283 1214 1284 0.77

9 29 6.1e-17 1e-13 52.0 0.4 1 86 1311 1380 1311 1381 0.82

10 29 4.7e-13 7.9e-10 39.5 1.2 1 86 1402 1471 1402 1472 0.79

11 29 7.3e-14 1.2e-10 42.1 1.1 1 86 1499 1570 1499 1571 0.85

12 29 2.7e-12 4.6e-09 37.1 2.7 1 85 1642 1710 1642 1712 0.82

13 29 3.2e-12 5.3e-09 36.9 0.1 1 86 1735 1803 1735 1804 0.82

14 29 3.8e-14 6.3e-11 43.0 0.9 1 87 1978 2047 1978 2047 0.78

15 29 2.2e-10 3.6e-07 31.0 0.0 1 86 2126 2199 2126 2200 0.80

16 29 0.00052 0.87 10.6 0.0 1 58 2219 2263 2219 2277 0.80

17 29 1.9e-12 3.1e-09 37.6 0.2 1 86 2299 2368 2299 2369 0.81

18 29 3.6e-13 6e-10 39.9 0.1 1 86 2457 2525 2457 2526 0.81

19 29 2.7e-10 4.5e-07 30.7 0.0 1 85 2561 2631 2561 2633 0.79

20 29 3.4e-11 5.7e-08 33.6 0.5 1 87 2647 2717 2647 2717 0.80

21 29 4.1e-16 6.9e-13 49.3 0.8 1 86 2742 2814 2742 2815 0.80

22 29 8.7e-05 0.15 13.0 0.1 1 58 2842 2897 2842 2916 0.78

23 29 2e-11 3.4e-08 34.3 0.4 1 87 2935 3007 2935 3007 0.79

24 29 6.9e-12 1.1e-08 35.8 0.0 1 86 3141 3211 3141 3212 0.78

25 29 3.2e-12 5.4e-09 36.9 4.3 1 86 3267 3337 3267 3338 0.80

26 29 2.4e-14 4e-11 43.7 5.5 1 86 3461 3531 3461 3532 0.84

27 29 7e-12 1.2e-08 35.8 0.2 1 86 3624 3693 3624 3694 0.84

28 29 1.1e-09 1.8e-06 28.8 0.6 1 58 3714 3763 3714 3772 0.86

29 29 1.4e-09 2.4e-06 28.4 0.8 18 87 3782 3840 3768 3840 0.74

#	of	c-Evalue	i-Evalue	score	bias	hmm coord from	hmm coord to	ali coord from	ali coord to	env coord from	env coord to	acc
1	29	4.6	7.8e+03	-2.1	2.9	42	69	304	333	291	343	0.55
2	29	5.2e-15	8.7e-12	45.8	3.6	1	86	536	608	536	609	0.85
3	29	1.7e-14	2.8e-11	44.2	4.8	1	87	636	705	636	705	0.82
4	29	1.4e-15	2.4e-12	47.6	0.2	1	87	727	799	727	799	0.85
5	29	8.5e-16	1.4e-12	48.3	5.5	1	87	906	976	906	976	0.82
6	29	5.9e-15	9.8e-12	45.6	3.2	1	86	1000	1071	1000	1072	0.82
7	29	5.2e-13	8.7e-10	39.4	0.9	1	87	1107	1175	1107	1175	0.81
8	29	2.7e-11	4.5e-08	33.9	2.0	1	86	1214	1283	1214	1284	0.77
9	29	6.1e-17	1e-13	52.0	0.4	1	86	1311	1380	1311	1381	0.82
10	29	4.7e-13	7.9e-10	39.5	1.2	1	86	1402	1471	1402	1472	0.79
11	29	7.3e-14	1.2e-10	42.1	1.1	1	86	1499	1570	1499	1571	0.85
12	29	2.7e-12	4.6e-09	37.1	2.7	1	85	1642	1710	1642	1712	0.82
13	29	3.2e-12	5.3e-09	36.9	0.1	1	86	1735	1803	1735	1804	0.82
14	29	3.8e-14	6.3e-11	43.0	0.9	1	87	1978	2047	1978	2047	0.78
15	29	2.2e-10	3.6e-07	31.0	0.0	1	86	2126	2199	2126	2200	0.80
16	29	0.00052	0.87	10.6	0.0	1	58	2219	2263	2219	2277	0.80
17	29	1.9e-12	3.1e-09	37.6	0.2	1	86	2299	2368	2299	2369	0.81
18	29	3.6e-13	6e-10	39.9	0.1	1	86	2457	2525	2457	2526	0.81
19	29	2.7e-10	4.5e-07	30.7	0.0	1	85	2561	2631	2561	2633	0.79
20	29	3.4e-11	5.7e-08	33.6	0.5	1	87	2647	2717	2647	2717	0.80
21	29	4.1e-16	6.9e-13	49.3	0.8	1	86	2742	2814	2742	2815	0.80
22	29	8.7e-05	0.15	13.0	0.1	1	58	2842	2897	2842	2916	0.78
23	29	2e-11	3.4e-08	34.3	0.4	1	87	2935	3007	2935	3007	0.79
24	29	6.9e-12	1.1e-08	35.8	0.0	1	86	3141	3211	3141	3212	0.78
25	29	3.2e-12	5.4e-09	36.9	4.3	1	86	3267	3337	3267	3338	0.80
26	29	2.4e-14	4e-11	43.7	5.5	1	86	3461	3531	3461	3532	0.84
27	29	7e-12	1.2e-08	35.8	0.2	1	86	3624	3693	3624	3694	0.84
28	29	1.1e-09	1.8e-06	28.8	0.6	1	58	3714	3763	3714	3772	0.86
29	29	1.4e-09	2.4e-06	28.4	0.8	18	87	3782	3840	3768	3840	0.74

Sequence Information

Coding Sequence: ATGTCACAGCATAATCCACATTCCCATCCGCACTACCATCAGACACAACACCACAACCatcagcagttgcagcagcagcaacaacaacaacagccacacaGCAATTGGTACTCACATGTTGCTTCCTaccccccaccgccaccccaGTACCATGCGTCGGCTACCTCCGCATTTGCCGCTACCTCCACACCGTTATCGAACGATATATATAGGAACTTTGGTCGTACCGACAACAATGATTCCCCCAGCTTTGGCCACCGGAATTCGTCAAACACCAACTTCGGCGACAACAATGGGCGTTACTTCAATGATGCTCCACAAGATTATTATGTGGCCAACTTTATTGACAATTATCGCGGTGGCCCGAGGTCGCAAAACTTTGGGGATCAGCGTTCCTCCTATATGGGACATGATATAATGTCCGGAACTTATTATCCGTACATAAAGAGCGAACCCATGGAGTCAGCGTATCAGCAGCCACAGAATCCGATGGCCCCGCCCCCAGCGCCAGATATGATAATAAAATCGGAACCCATGGATGAACATCCCTACAAGTCCAACTATATTGATGACAATACGCCCTTTGCTGATTTTAACAAGTTCAACGAATTCAGCGGCGATATGCTAAGCCCCAAAGTCGAGCTAACCGTCAAGGATGAGACTTACGGAAAGACTTccagcagcaatagcagcagcagctttgcACGTCGAAaagcccagcaacagcaaacgaCAGATCGTTCGGCGGAGAGTCTGCCCATCTGCCAGCGCTGCAAGGAGGTCTTCTTCAAGAAGCAATCCTATCTGAGGCATGTGGCCGAGAGCAGTTGTGGCATTCAGGAGTATGATTTCAAGTGCAACATATGCCCCATGTCCTTCATGACCACTGAAGAGCTGCAGCGCCACAAGCAACTGCATCGTGCAGACAAGTTCTTTTGCCACAAATACTGCGGCAAGCATTTCGATACGATAGCCGAGTGCGAATCGCACGAGTACATGCAGCACGAGTATGAGAGATTTGTTTGTAATATGTGCTCTGGAACCTTTGCCACGCGGGAACAGCTGTATGCCCACTTGCCGCAACACAAGTTTCAGCAGCGTTACGACTGTCCCATCTGCCGTTTGTGGTATCAAACAGCCGTCGAATTGCATGAGCATCGACTGTCGGCTCCATACTTTTGCGGCAAGTACTATACcagtcaacagcagcagcttgctACGAGCCAGGGGAATTACAAGCTGCAGGACTGCCATATGGCCACCATGGAAATACCCACTGCACCACTGCACAAGGCAACGCCTTCCAATCCCTCAGCCTTGCCAGCCACAGCTGCCTTGAGCTCTCTGTTGCAACAGCGCCAGGCAAATGCCGATGGGACTGCGGCCATGTTTGCTGCGGCCTCCTCTTCCTCCGCCTCGCTGAAGAGCGAGGTGAGCGTGAAGCTAGAGCGTAGCTACAGCAACTCCACCAGCGAGTCCTCTTACAGCCATCAGGACAACAGCAGCTACAACAATGCCTATGGCAGCGACAGCTCCATCCATGGCGGAGCACTGGCCGGACCACAGGCTCACTCCTCAACGCTGGACGACTCCGAGGATGCCCTGTGTTGTGTGCCCCTGTGCGGCGTCAGAAAAAGCACCAGTCCAACGCTACAGTTCTTTACGTTTCCAAAGGATGAAAAGTATCTGAATCAGTGGCTGCACAACCTCAAGATGTTCCACATACCAGCGGCGAGCTATGCGACATTTCGCATCTGTAGCATGCACTTCCCGAAGCGTTGTATCAATCGGTATTCGCTGTGCTATTGGGCGGTGCCCACCTTCAATCTGGGGCACGACGATGTGGCCAATCTGTACCAGAACCGTGAGTTAACCAACACTTTTACCACTGGAGAGGTGGCACGCTGCAGCATGCCGCACTGCACCAGCCAGCGGGGGGAGAGCAATCTGAAATTCTACAATTTCCCCAAGGACATCAAGAGCCTGATCAAGTGGTGCCAGAACGCCCGCTTGCCAGTGCAGGCCAAGGAGCCTCGTCACTTTTGCAGCCGACACTTTGAGGATCGCTGCATTGGCAAGTTCCGACTGAAGCCGTGGGCCGTGCCCACCCTCCATCTGGGAGCGCAGTACGGCAAGATCCATGACAATCCCAAGAATTTGTATGTGGAGGAGAAACGCTGCTGCCTGAACTTTTGTCGCCGCAGCCGCTCCTCGGACTTTAACATGTCGCTGTATCGTTTCCCCAGAGACGAGGTGCTCCTGCGACGTTGGTGCTATAATTTAAGGCTGGATCCGGGCGTGTATCGTGGCAAGAATCACAAAATATGCAGTGCGCATTTTATCAAGGAAGCTTTGGGTCTAAGAAAGCTGTCGCCAGGTGCCGTTCCCACATTGCATTTGGGTCACAATGACACCTTTAATATCTATGAGAACGAACTGTGGCCACCGCCATCTCCCACTGGACAACATGGCGGCAGTCACCAgcttctccagcagcagcagacgtcGCAGCAGCTGTCGCATCATCATTCgtccctgcagcagcagcatcagccccTGCATAGCAAGTCCTATCAACGCCATTCGGCGGCCTCCACATCCTCCTCCGCCAGTTCGGCCTCTCATTATGTGGACCCCGAGATGAGTGCCTCGTATTTGAACCTGTCTGCGGGTGGCTCCTCCGGCGGGATGAATGCCAGCGACTGCATGGATGTGTGCTGCGTGCCAAGCTGCGAGAGCAAGCGGCACAACAGCGAGAACATCACATTCCACACGATACCGCGCAGGCCAGAGCAGATGCGCAAGTGGTGCCACAATCTGAAGATACCCGAGGACAAGATGCACAAGGGCATGAGGATTTGTAGCCTGCACTTTGAACCATACTGCATTGGCGGCTGCATGCGTCCTTTCGCCGTGCCCACACTCCATTTGGGGCACGAGGATGAAGACATTCACCGCAATCCGGATGTGATCAAGAAGCTGAACATCCGAGAGACCTGCTGTGTGGCCGTGTGCAAGCGGAATCGCGACAGAGACCATGCCAACCTCCATCGTTTCCCCAGCAATGTGGCGCTGCTCACCAAGTGGTGTGCGAATCTGCAGCGGACAGTACCCGATGGCAGCAAACTCTTCAACGATGCCATCTGCGAGGTGCATTTTGAGGATCGTTGCCTGCGCAACAAGAGACTGGAGAAGTGGGCTGTGCCCACTCTGATTCTCGGCCACGACGACATTGCCTATAAGCTGCCGACGCCCGAGCAGGTGGCCGAGTTCTATGCCCGTCCCACGGCCCCCAACAATGGCGAGGAGCAGGGCGAGTGCTGTGTGGAGACGTGCAAACGGAACCCGAGTGTGGATGACATCAAATTGTATCGTCCGCCGGAGGATACTTCGGTGCTGGCCAAATGGGCGCACAATCTGCAAACGGAGGCCGCTGTCCTCACGAACATGCGGATATGCAATCTGCACTTTGAGGCCCACTGCATTGGCAAGCGGATGCGTCCGTGGGCCATACCCACGCTCAATCTGGCTGGAAACATTGAGAATCTGTACGAGAATCCCGAGCATTCGATGCTGTACAAGCGAAGGACGCACATCAAACAGAAGGTTCCGGTGACAAAGCCCACGTGGGTGCCTCGCTGCTGTCTGCCGCACTGCCGCAAGGTGCGTGCCCTTCACAATGTCCAGCTGTATCGCTTCCCCAAGCTGAATCGCTCGACGCTGGCCAAGTGGGCACACAATCTGCAGGTGCCGCAGGTGGGAAGTGCCCAGCGGCGGGTATGTTCCGCCCACTTTGAGCCGCATGTTTTGAGTAAAAAGTGCCCGGTGCCGCTGGCGGTGCCCACATTGGACTTGAACTCACCCGCTGGCCACAAGATCTACCAGAATCCGGCTAAGCTGAAGGCCAACAAGCTGTGCCTGCAGCGGGTATGCATTGTAGAGAGCTGCAGGAAGACCAGAGCCCAGGGCGTGCAGCTCTTCCGTCTGCCTCACAGCCCCACGCAACTGAGGAAATGGATGCACAATATACGGACACGCCCAAGGGCGGCCATGAGGAGCCAGTATCGCGTCTGCTCGCGGCACTTTGAGACGCACTCCTTCAACGGTCGAAGGCTGAGCGCCGGGGCCATTCCCACTTTGGAGTTGGGACATGACGATGATGATATCTTCCCGAATGAAGCGCAGGCCTTTGCCGATGAGCACTGCGCTGTGGAGGGCTGTGAATCGTCGAAGGAACAGCCCGAAGTGCGGCTCTTCCGCTTCCCCacggacgacgacgacatgcTGTGGAAGTGGTGCAACAACCTCAAGATGAATCCCGTGGACTGCCTCGGTGTGCGGATCTGCAACAAGCATTTCGATGCCGATTGCATTGGACCCAAACATCTGTATAAGTGGGCCATACCCACGATGCAGCTCGGCCACGATGATTCCCAGATCGAGCTCATACTCAACCCCAAGCCGGAGGAACGCTACGTGGATCCCGTGTTCAAGTGCATTGTCCCAACCTGCGGGAAGACTCGCCGCTTCGATGAGGTGCAAATGAACAGCTTCCCCAAGGATGCGGATCTGTTTCAGCGCTGGCGCCACAACCTCCGCCTGGAGCATCTGTGCTTCAAGGAGCGCGAGAAATATAAGATCTGCAATGCGCATTTCGAGGACATGTGCATTGGCAAGACGCGTCTGAACATTGGTTCCATACCCACTCTGGAGCTGGGCCACGAGGAAACGGAGGATCTGTTCAAGGTGAATCCGGAAGATCTGCAGAGCAATCTGTTTGGGCGTCCTCGTCGGCTGCTAAGAGGATTGAACAATGTGACCATCAAACAGGAGTTACCAGAGACGGAGGAGCAGGACATAAAGCCCGACATAAGGACCAATTTTACACAGGTAAAGATTAAGAAATCTCTGGGGGATATTAAGTGCTGTGTGCACACGTGTGGACGCAGTCGTTTGGAGCATGGGGCACGTCTCTTTCCCTTCCCCACGGGCAAGCAACAGCACCTCAAGTGGCGCCACAATCTGCGCCTGGAGCCCGACGAAGTGGACAAAACCACACGCGTCTGCAGCGCACACTTCAACAGGCGCTGCATCGATGGAAAGCATCTTAGGGGATGGGCCATGCCCACACAGCAGTTGGGCCACCAAGAACAGCCTATATACGAGAATCCCAAGAATATACCCGGCTTCTTTACGCCCACCTGTGCGCTGGGCCACTGCCGCAAGCGGCGGAGCATTGACAATGATTTGCGCACGTATCGTTATCCGCGAAGCGAGGATCTCCTCGAGAAGTGGCGCGCAAATCTCAGACTATCGCTGGATCAGTGTCGCGGCAGGATCTGTGCGGATCACTTTGAGCCGCAGGTGAGGGGCAAACTGAAGTTGAAGACGGGAGCAGTACCCACGCTAAAACTGGGCCATGAGGAGGCTTTGATGTACGACAATGAGGCTATAAAGGCTGGAGTGGCCGAAGGGGAGGCTGGCAGTCCGCCGGCATCGCCTCTGGTGACACCCAAAACGGAAGTTCTGGATGAAGAGGAGCGCGAggatgatgaggaggaggaggagaaccCCGAAGAAGAGCAGCAGGAAAACCATGATGATGAGAAGGATGAACACGAGGATGACACGCCCGAGGGAGCAGAGCAGCTGGGCgatgaggatgacgatgaggatCCAGGCAACTATTTTGATCCGTTGGAGCTGGTGGAGACGTATGCAGAGCATCCCAGCGACGATGACAACAGCCACGAGGAAGCAGACGATGCCAgagaggaggatgaggaggacgaggaggaggcagaAACTCTCTTGCCTGATACACCACCCAacatagcagcagcagcaatcatTCGCGTGCCGAAACCATGGGAAAGACCTCTCGCAGTAGTGCCTCGCCGAGAGAAGCGTCCGAATAACGTGGATCCCATCTGCTGTCTCAAGCACTGCCGCAAGGAACGTTCCGCCATGTATCTGCTGAGCACATTTGGCTTTCCCAAGGACCAGCAGCTGCTTCTCAAGTGGTGCGCCAACCTCCAAATGGATCCCTCGAGCTGCATTGGTCGCGTCTGCATCGAACACTTCCAGTCCGAGGTTCTGGGCACGCGAAAGCTCAAACAGAATGCGGTGCCCACCCTCAATGTGGGTCACGATGTGCCACTGCGCTACAGCTGCAACGGCCAAGAGAGGCCtcaggcagcagcggcggccgccaCCAGCAGCTTCCCCGACGAAATGCCACAGCATTCGGTTTTTCGGCTTTGGAGCCTGAAACACTGCCGCAAGAGGAAAGTGTCGGAGAGTCCAGTTCCAGCAGCGATCAAGACGGAGgagcagatgcagatggagatggaggtggaGACTAAGCCAAAGATATGCTGCCTCTCCAGTTGTGGCAATGTGGAGGGCTACGGCCCGGGCGGGCACTTTCAGCCGCTGCCCCAGGACCAAAGGATGCTGAAAAAATGGCAGCACAACCTGAAGCTACCATCTGTCAATCCCGATTCGGATCTTCGTGACTTTCGCCTGTGCATGGAGCACTTTGAGCCGCATCAAATCGAGAACGGAGCCCCAGTGAAGATGGCAGTTCCGACCCTCAAGCTTGGGCACTCCAGTCCGAATATCTTTAAGAACAGCGAGAGCACGCTGCCGGGATGCCTGTGGCCCTCGTGTCCGCCCAATCGCAAGATCTGCTACGATCTGCCCGACAATGAGGCCGTTCGAGCGGCCTGGCTGTCGTATGTGCGGCTGCCGCCTGAGAGCCAGGGGCGTCTGTGTGGCCTACACTTTCTGCAGCTGTACGAGGAGGTGGATCTGCCAGGAGATGTACCCGAAGCGGTGCTCGAGCGACTGCAGAGTATCTATGATCAGGCCTCCATCTCGCTGAAGTTTCAGTGCTCGGTGCAGGGATGTGGCTCCAAGTACAAGCAGGATACGCATTTGACAAAGCTGCCACGGGACGCGGAACTGCTGGCCAAGTGGCTGCACAACACCAGGATCTCGTACGATCGCTCCTTGCATTTTAGCTACCGCATTTGTCTGTTGCACTTTGAGGCGTTCTGCTTGAATGGCGTGCGCCCGCAGACCTGGGCCATACCTACGCTCCAGCTAAATCATGACGGAGAGATCTACCAAAATACCGCCAAGCAGGAGATCCCAGAGATGCCCCTGAAGCAGGAGATCCTCGAGAATCCCGTGAAGCAGGAGAAATCGCACTGTGGGAGAATCTCCAGCCTGAGTCTCTCCATCCCCCTGCACATCAAGACGGAACAGGGTCCTGTCCTGCGACCTCGAGGCACTTGGGGCACATCTTCTCAGAGCAGTCCCTGCCTGAGCGCCAGCTCCAGTCCCCGCCTGAAAAACAGAATCTGCTGCGTCTCCGATTGCGGAGAGTACGCCAGATCCCAGCGGCTGTACCGCTTTCCCACCGCCGAACCGGCACTGCTCAAGTGGCTGGTTAATACCCAGCAAAAACCGGGACTCGTGGACATCCAGAACCTGTTTGTGTGCCAGCTTCATTTCGAGGCGGACGCCATTAACCAAACGCAGCTCAGGAGCTGGGCCGTGCCCACACTGAGGCTGGGCCACGATGGGCATGTCATACCAAATGCCAGACACAATGGGAACATAGCCAACAGCCAGGAAACGGAGCAGGCCATGGAGTTCATTCGGGCCAACTACTGCGCCGTGTTGAGCTGCTTCCAGCCGAAAGGAGATGGTGTGCGCTTCTACAAGTATCCCAGCGACATTGCCATGGCGCGCAGGTGGGCCACGAATCTCAAGCATCGCTCCATGCAGGCCAGCAGTCATGGCTTCCTGGTTTGCCAGTCCCACTTTGCAGCCGACTGTTTTGATCCGGAGACGGGAGACCTGCGCGAGGACGCCGTACCCGTGGCCACACTCGCAGAGAACGTGAAAACAGAGGGCCTTCTGCTCCGTTGTCTGGTAAGGGGTTGCTCTACGGATAACTCTGAAAAAGGACTGCTGTTCaaggtgccaaaaaagaatCGTGTACGGGATGTGTGGGCCCACAATCTGTGGATGCATCCGATAGAGCTGATGGGCGAGCACTACATCTGCGATCGACATTTTGAGGCGCATTGCGTGAATGAACACAAATTACTGCACGCGGGCTCAGTGCCAACCCTCCACCTGGGACACAACGAACCGCTGGAACTACTGCCCAATCCCCAGACCTTCCAGGACTTCCCTGAGGAGTGCGAGTGCTGTGTGCCCGGCTGTGGACGCACCAATCGGAAGGAGGAGGATCTGCAGTTTAGCAAATTTCCCAAGTGGCGAGTCCTGTATGAAAAGTGGCTGCACAACTTCCGCCTCGAAGTGCCCAAGGAGCAGCGCATCGGGACGCTGAGAGTGTGTCACATGCACTTTGAGGAGAGCTGCTACGATGGCCAGAACGTGCGCAGGGGAGCTATGCCCACTCTAGAGCTGGGACACTCGCATCCAGACATTTATCGCTCCGACAAGGGATCGCTGTGGAAGAAGGTTCACAAGAGACTCACCGATTGTTGCTATCCCGATTGCTACGAGGAGTGTCACAAGGCCAACACGAATCGCACGACCTACGATCTGCCCAGCGATGGGCCACTGCGCGAGTCCTGGCAGCAGCACATGGCCATCCCTGCCAGCGGTGAGGATGGCTCCTCAGTGCTAAAGCTCTGTGCCCTACACTACATCATTATGTACGAGCACAGCGAACAGAGCTTCCCAGAACACGGACCGAATCTACTGCTGGACAAGAACTACGAGCACGCCCGTCAGTTGGCGTATCTGCGGCGCTTCTTGTGTGCGGTACAGGGCTGTCGTCATTTGCAGCCGCGGGATGGGGGTCCGATGCACGGCATACCCCGGCGGAGGGAGATCCTTCGGATGTGGGTGGAGAATGCCCAGCTGCGGCTGAACGAGCACGAAATTTACATGACGAAGCTGTGTAGCAAACATTTTGAGGCCAACTGCCTGTTCGAGGGCAAAAAATGCTATCCCTGGAGCGTGCCAACGCTCCATCTGCCAGAGGCGCAGCCCGGGCAGGTGCTCCACCAGAATCCCACCAAGGAGGAGTGGCAGGAAATGAAACAGAGAATGAAATTGGAAGAGCAGACGCCGAAGACGGAAGAGCAGGCAGATGGACTACTAATGGAACCCTATGTGAAGATGGAACCCCACGACGACGAGTCACAAACGGAGTCGGAATTGCTGATAAATGAGAGCACACTGGACTCTCAAGAACTCTCTCAAGACTTTCCAACACAAGATCCAATCGAAATGCCCGCCCTGGAGGTGCTCCTAGAGGTGAGCCATGTCGAGAAGCTGGATAGCTACGAGAGGAATGAATACCCTGCGGATACCTCTGCCAACACATATTCTCCGAACAAACGTTTCCGCCATCAGTACAGTGCCCACAAGTGTAGTGTCGAGGGATGTCGCGTGTCGCTCGAGGACCTTGACGGTAATCTGAAGCTGCACAAGCTACCCAGCTCCACGGAGGCGGCCGGGAAGTGGCTGTACAACATTCACGTGGAGATAGAGGATAAATGGCGGATACGCGTCTGCAGCCATCACTTCGACAGGCAGTGCCTCAATGGTTCAAGGCTCAGGAGGGGATCGATGCCCACTCTGCTGCTGGGGCCGCGTGTTCCAGAGACTATCCATCAGAATGAGTTTGCGCAGCTACAATTGGACGATGCGCCAGCCCATAATGGCAATACATTGGAGCGATCCATTGGAAAGGTTGCGCAGATATGCGTTCCACGTCCGTCGCCGCCGCGTAAGTCGAGCAAATTCTGCCAGATCGAGGGATGTTCGAACCATCTGACCAGCGAGAATATGACGCTACACAAGTTCCCGCACTCGTCGTGGATCTGCACCAAATGGCAGCACAACACACAGGTGCCGTTCGATCCGGAGTACCGCTGGCGCTATCGCATCTGCAGCGCCCACTTCCATCCCGTGTGTATGGTCAATATGCGGCTGCTGCATGGCAGTGTGCCCACGCTGAAGCTTGGTCCTCGGGCACCCGGCGAACTCTTTGACAGCGACTTTGAGGCCATAAACATAAAGATTGAAAAAATGGAGAAGATGGAGAGGAAATCTGAGGCTCTGAGAAGCACCACTGGAGATAGATATCCCACCATGCAGGCCATGGGGGAGAAGAAGTTCAAGACTGAGGAGCTGGAAGAtggaatggaggaggaggatgacatGCTCTGCCTGGAGCCAGAGATGCAGCTATACGAAGATCAGGaagaacagcaacagaagccaaAGATAAATCTTGGAGTCCCCAATGGCGGCTGGAAAACGGAACTTCGTTTGCCATCGAAGGGTAGGGTCGCGTTTAATCCGGTGAGATCTGGCTACGACAAGTGCTCGCTGATGCATTGCCAGCGCCAGAGATCGAAGCACGGCGTCCACATCTACAAGTTCCCCCGATCGCAGGAGCACCAACAGCGATGGATGCACAATCTGCGCATACGCTACGATGAGAAGCGACCCTGGAAGTTTATGGTCTGCAGCGTGCACTTTGAACCGCATTGCATACGGCTGCGGAAGCTGCGGCCCTGGGCAGTTCCGACGCTAGAGCTGGGAGACAATGTGCCCGAGGACATCTATACGAACGAGCAGTGCCAGATGTTTGCCAGTGGACAGGGAGGAGAGATCAATGGCATCGATAGCGAtgaggtggaggcggagccGGAGGCAGAAGGGGAGAGCGATGGGAATGATGAGGATGGCCTGcaggaggacgaggatgaggagacAGACGACCAGGAGCCCATCGCCAAGAAGCGTCGTCGCTCGCGGCTGGATGCCGTCTGGCCTCCCGGCCAGGCGCCACCATGGAAGGTGAAACAATGCTGTCTTCCCTACTGTCGCAGTCCACGCGGCGAGGGCATCAAGCTGTTTCGACTGCCCAACAAAGTCAACTCCATCCGCAACTGGGAGCTGGCCACGGGCATGAAGTTCAAGGAGTCGCAGCGCAACACGAGACTCATCTGCAGCCGCCACTTTGATCCGGAGCTGATCGGAGTGCGTCGTCTGATGCGCAATGCCATTCCCACCAGGCATCTGGGACCCACGGGCGATGTAAAGCCAGTGATGGCTCCACCGACAGCTGGTCCCAAATGCTGTATGGCAGATTGTACCTATGATGTGGCGGATGTGAAGCTGCACAAGTTTCCCAGCAATCCCAAACTCCTGAAGGAGTGGTGCCAGGCATTAAGGGTCACGGATATGCAAAGGTATCGCGGCAAGCACATTTGCTCCGCCCATCTACCTGTCCACGAGGCCGTACAGTGCATTGTTTGTGGCGCGGAGAAAGCACCCCTGCTGCCGATGCTTAATTTTCCCGCTAACCGGAATCAGCGCGCCAAATGGTGCTACAATCTGAAGATCGAAACGATACCCAAGTGGGACATATCCAAGCACATTTGCTGTAAACACTTTGAGCCATATTGTTTTGCAGAGGCGGGCCTCCTAAAGCCAGAGGCGGCTCCCACGCTGCATTTGAATCACAATGATACAAATATATTCCTTAACGATTGTGCCATAAATCCTACCTACAGTGTATGCGTGAAGGATGAACCCATGGACAATCAGGTCCTGTCATTGGTgtag
Protein Sequence: MSQHNPHSHPHYHQTQHHNHQQLQQQQQQQQPHSNWYSHVASYPPPPPQYHASATSAFAATSTPLSNDIYRNFGRTDNNDSPSFGHRNSSNTNFGDNNGRYFNDAPQDYYVANFIDNYRGGPRSQNFGDQRSSYMGHDIMSGTYYPYIKSEPMESAYQQPQNPMAPPPAPDMIIKSEPMDEHPYKSNYIDDNTPFADFNKFNEFSGDMLSPKVELTVKDETYGKTSSSNSSSSFARRKAQQQQTTDRSAESLPICQRCKEVFFKKQSYLRHVAESSCGIQEYDFKCNICPMSFMTTEELQRHKQLHRADKFFCHKYCGKHFDTIAECESHEYMQHEYERFVCNMCSGTFATREQLYAHLPQHKFQQRYDCPICRLWYQTAVELHEHRLSAPYFCGKYYTSQQQQLATSQGNYKLQDCHMATMEIPTAPLHKATPSNPSALPATAALSSLLQQRQANADGTAAMFAAASSSSASLKSEVSVKLERSYSNSTSESSYSHQDNSSYNNAYGSDSSIHGGALAGPQAHSSTLDDSEDALCCVPLCGVRKSTSPTLQFFTFPKDEKYLNQWLHNLKMFHIPAASYATFRICSMHFPKRCINRYSLCYWAVPTFNLGHDDVANLYQNRELTNTFTTGEVARCSMPHCTSQRGESNLKFYNFPKDIKSLIKWCQNARLPVQAKEPRHFCSRHFEDRCIGKFRLKPWAVPTLHLGAQYGKIHDNPKNLYVEEKRCCLNFCRRSRSSDFNMSLYRFPRDEVLLRRWCYNLRLDPGVYRGKNHKICSAHFIKEALGLRKLSPGAVPTLHLGHNDTFNIYENELWPPPSPTGQHGGSHQLLQQQQTSQQLSHHHSSLQQQHQPLHSKSYQRHSAASTSSSASSASHYVDPEMSASYLNLSAGGSSGGMNASDCMDVCCVPSCESKRHNSENITFHTIPRRPEQMRKWCHNLKIPEDKMHKGMRICSLHFEPYCIGGCMRPFAVPTLHLGHEDEDIHRNPDVIKKLNIRETCCVAVCKRNRDRDHANLHRFPSNVALLTKWCANLQRTVPDGSKLFNDAICEVHFEDRCLRNKRLEKWAVPTLILGHDDIAYKLPTPEQVAEFYARPTAPNNGEEQGECCVETCKRNPSVDDIKLYRPPEDTSVLAKWAHNLQTEAAVLTNMRICNLHFEAHCIGKRMRPWAIPTLNLAGNIENLYENPEHSMLYKRRTHIKQKVPVTKPTWVPRCCLPHCRKVRALHNVQLYRFPKLNRSTLAKWAHNLQVPQVGSAQRRVCSAHFEPHVLSKKCPVPLAVPTLDLNSPAGHKIYQNPAKLKANKLCLQRVCIVESCRKTRAQGVQLFRLPHSPTQLRKWMHNIRTRPRAAMRSQYRVCSRHFETHSFNGRRLSAGAIPTLELGHDDDDIFPNEAQAFADEHCAVEGCESSKEQPEVRLFRFPTDDDDMLWKWCNNLKMNPVDCLGVRICNKHFDADCIGPKHLYKWAIPTMQLGHDDSQIELILNPKPEERYVDPVFKCIVPTCGKTRRFDEVQMNSFPKDADLFQRWRHNLRLEHLCFKEREKYKICNAHFEDMCIGKTRLNIGSIPTLELGHEETEDLFKVNPEDLQSNLFGRPRRLLRGLNNVTIKQELPETEEQDIKPDIRTNFTQVKIKKSLGDIKCCVHTCGRSRLEHGARLFPFPTGKQQHLKWRHNLRLEPDEVDKTTRVCSAHFNRRCIDGKHLRGWAMPTQQLGHQEQPIYENPKNIPGFFTPTCALGHCRKRRSIDNDLRTYRYPRSEDLLEKWRANLRLSLDQCRGRICADHFEPQVRGKLKLKTGAVPTLKLGHEEALMYDNEAIKAGVAEGEAGSPPASPLVTPKTEVLDEEEREDDEEEEENPEEEQQENHDDEKDEHEDDTPEGAEQLGDEDDDEDPGNYFDPLELVETYAEHPSDDDNSHEEADDAREEDEEDEEEAETLLPDTPPNIAAAAIIRVPKPWERPLAVVPRREKRPNNVDPICCLKHCRKERSAMYLLSTFGFPKDQQLLLKWCANLQMDPSSCIGRVCIEHFQSEVLGTRKLKQNAVPTLNVGHDVPLRYSCNGQERPQAAAAAATSSFPDEMPQHSVFRLWSLKHCRKRKVSESPVPAAIKTEEQMQMEMEVETKPKICCLSSCGNVEGYGPGGHFQPLPQDQRMLKKWQHNLKLPSVNPDSDLRDFRLCMEHFEPHQIENGAPVKMAVPTLKLGHSSPNIFKNSESTLPGCLWPSCPPNRKICYDLPDNEAVRAAWLSYVRLPPESQGRLCGLHFLQLYEEVDLPGDVPEAVLERLQSIYDQASISLKFQCSVQGCGSKYKQDTHLTKLPRDAELLAKWLHNTRISYDRSLHFSYRICLLHFEAFCLNGVRPQTWAIPTLQLNHDGEIYQNTAKQEIPEMPLKQEILENPVKQEKSHCGRISSLSLSIPLHIKTEQGPVLRPRGTWGTSSQSSPCLSASSSPRLKNRICCVSDCGEYARSQRLYRFPTAEPALLKWLVNTQQKPGLVDIQNLFVCQLHFEADAINQTQLRSWAVPTLRLGHDGHVIPNARHNGNIANSQETEQAMEFIRANYCAVLSCFQPKGDGVRFYKYPSDIAMARRWATNLKHRSMQASSHGFLVCQSHFAADCFDPETGDLREDAVPVATLAENVKTEGLLLRCLVRGCSTDNSEKGLLFKVPKKNRVRDVWAHNLWMHPIELMGEHYICDRHFEAHCVNEHKLLHAGSVPTLHLGHNEPLELLPNPQTFQDFPEECECCVPGCGRTNRKEEDLQFSKFPKWRVLYEKWLHNFRLEVPKEQRIGTLRVCHMHFEESCYDGQNVRRGAMPTLELGHSHPDIYRSDKGSLWKKVHKRLTDCCYPDCYEECHKANTNRTTYDLPSDGPLRESWQQHMAIPASGEDGSSVLKLCALHYIIMYEHSEQSFPEHGPNLLLDKNYEHARQLAYLRRFLCAVQGCRHLQPRDGGPMHGIPRRREILRMWVENAQLRLNEHEIYMTKLCSKHFEANCLFEGKKCYPWSVPTLHLPEAQPGQVLHQNPTKEEWQEMKQRMKLEEQTPKTEEQADGLLMEPYVKMEPHDDESQTESELLINESTLDSQELSQDFPTQDPIEMPALEVLLEVSHVEKLDSYERNEYPADTSANTYSPNKRFRHQYSAHKCSVEGCRVSLEDLDGNLKLHKLPSSTEAAGKWLYNIHVEIEDKWRIRVCSHHFDRQCLNGSRLRRGSMPTLLLGPRVPETIHQNEFAQLQLDDAPAHNGNTLERSIGKVAQICVPRPSPPRKSSKFCQIEGCSNHLTSENMTLHKFPHSSWICTKWQHNTQVPFDPEYRWRYRICSAHFHPVCMVNMRLLHGSVPTLKLGPRAPGELFDSDFEAINIKIEKMEKMERKSEALRSTTGDRYPTMQAMGEKKFKTEELEDGMEEEDDMLCLEPEMQLYEDQEEQQQKPKINLGVPNGGWKTELRLPSKGRVAFNPVRSGYDKCSLMHCQRQRSKHGVHIYKFPRSQEHQQRWMHNLRIRYDEKRPWKFMVCSVHFEPHCIRLRKLRPWAVPTLELGDNVPEDIYTNEQCQMFASGQGGEINGIDSDEVEAEPEAEGESDGNDEDGLQEDEDEETDDQEPIAKKRRRSRLDAVWPPGQAPPWKVKQCCLPYCRSPRGEGIKLFRLPNKVNSIRNWELATGMKFKESQRNTRLICSRHFDPELIGVRRLMRNAIPTRHLGPTGDVKPVMAPPTAGPKCCMADCTYDVADVKLHKFPSNPKLLKEWCQALRVTDMQRYRGKHICSAHLPVHEAVQCIVCGAEKAPLLPMLNFPANRNQRAKWCYNLKIETIPKWDISKHICCKHFEPYCFAEAGLLKPEAAPTLHLNHNDTNIFLNDCAINPTYSVCVKDEPMDNQVLSLV*

Similar Transcription Factors

Sequence clustering based on sequence similarity using MMseqs2

100% Identity: iTF_00536072;
90% Identity: iTF_00484466;
80% Identity: -