Basic Information

Insect: Drosophila subobscura
Gene Symbol: -
Assembly: GCA_008121235.1
Location: NC:5354134-5368534[+]

Transcription Factor Domain

TF Family: THAP
Domain: THAP domain
PFAM: PF05485
TF Group: Zinc-Coordinating Group
Description: The THAP domain is a putative DNA-binding domain (DBD) and probably also binds a zinc ion. It features the conserved C2CH architecture (consensus sequence: Cys - 2-4 residues - Cys - 35-50 residues - Cys - 2 residues - His). Other universal features include the location of the domain at the N-termini of proteins, its size of about 90 residues, a C-terminal AVPTIF box and several other conserved residues. Orthologues of the human THAP domain have been identified in other vertebrates and probably worms and flies, but not in other eukaryotes or any prokaryotes [1].
Hmmscan Out: # of c-Evalue i-Evalue score bias hmm coord from hmm coord to ali coord from ali coord to env coord from env coord to acc

1 30 10 1e+04 -3.1 0.1 20 72 421 469 402 477 0.56

2 30 5.8e-15 5.9e-12 45.7 3.7 1 86 607 679 607 680 0.85

3 30 1.9e-14 1.9e-11 44.1 4.8 1 87 707 776 707 776 0.82

4 30 1.6e-15 1.6e-12 47.5 0.2 1 87 798 870 798 870 0.85

5 30 9.8e-16 9.8e-13 48.2 5.0 1 86 977 1046 977 1047 0.82

6 30 6.6e-15 6.6e-12 45.6 3.2 1 86 1071 1142 1071 1143 0.82

7 30 1e-12 1e-09 38.6 0.5 1 87 1178 1247 1178 1247 0.82

8 30 3e-11 3.1e-08 33.8 2.0 1 86 1286 1355 1286 1356 0.77

9 30 6.8e-17 6.8e-14 51.9 0.4 1 86 1383 1452 1383 1453 0.82

10 30 3.8e-13 3.8e-10 39.9 1.0 1 86 1474 1543 1474 1544 0.80

11 30 2e-14 2e-11 44.1 0.5 1 86 1571 1642 1571 1643 0.85

12 30 7.8e-13 7.8e-10 38.9 2.0 1 85 1722 1790 1722 1792 0.82

13 30 5.9e-12 5.9e-09 36.1 0.0 1 86 1815 1883 1815 1884 0.82

14 30 7.6e-14 7.6e-11 42.2 0.5 1 87 2059 2128 2059 2128 0.78

15 30 4 4e+03 -1.8 0.1 6 45 2139 2183 2137 2189 0.68

16 30 2.3e-08 2.3e-05 24.6 0.0 1 63 2213 2270 2213 2288 0.74

17 30 0.0048 4.8 7.6 0.0 1 58 2298 2342 2298 2356 0.79

18 30 5.3e-13 5.4e-10 39.5 0.1 1 86 2378 2447 2378 2448 0.82

19 30 1.8e-13 1.8e-10 41.0 0.1 1 86 2568 2636 2568 2637 0.83

20 30 1.8e-10 1.8e-07 31.3 0.1 1 84 2672 2741 2672 2743 0.80

21 30 1.2e-11 1.2e-08 35.1 0.2 1 87 2755 2827 2755 2827 0.81

22 30 1.1e-14 1.1e-11 44.8 1.1 1 86 2849 2922 2849 2923 0.81

23 30 0.00015 0.15 12.4 0.1 1 58 2951 3006 2951 3023 0.76

24 30 2e-12 2e-09 37.6 0.3 1 87 3041 3113 3041 3113 0.80

25 30 1.1e-12 1.1e-09 38.4 0.4 1 85 3246 3315 3246 3317 0.77

26 30 8.3e-12 8.3e-09 35.6 4.0 1 86 3374 3444 3374 3445 0.80

27 30 1.9e-14 1.9e-11 44.1 5.2 1 86 3577 3647 3577 3648 0.84

28 30 4.6e-12 4.6e-09 36.5 0.2 1 86 3743 3812 3743 3813 0.84

29 30 2.3e-09 2.3e-06 27.8 0.4 1 58 3834 3883 3834 3890 0.87

30 30 1.9e-09 1.9e-06 28.1 0.7 6 87 3894 3960 3890 3960 0.72

#	of	c-Evalue	i-Evalue	score	bias	hmm coord from	hmm coord to	ali coord from	ali coord to	env coord from	env coord to	acc
1	30	10	1e+04	-3.1	0.1	20	72	421	469	402	477	0.56
2	30	5.8e-15	5.9e-12	45.7	3.7	1	86	607	679	607	680	0.85
3	30	1.9e-14	1.9e-11	44.1	4.8	1	87	707	776	707	776	0.82
4	30	1.6e-15	1.6e-12	47.5	0.2	1	87	798	870	798	870	0.85
5	30	9.8e-16	9.8e-13	48.2	5.0	1	86	977	1046	977	1047	0.82
6	30	6.6e-15	6.6e-12	45.6	3.2	1	86	1071	1142	1071	1143	0.82
7	30	1e-12	1e-09	38.6	0.5	1	87	1178	1247	1178	1247	0.82
8	30	3e-11	3.1e-08	33.8	2.0	1	86	1286	1355	1286	1356	0.77
9	30	6.8e-17	6.8e-14	51.9	0.4	1	86	1383	1452	1383	1453	0.82
10	30	3.8e-13	3.8e-10	39.9	1.0	1	86	1474	1543	1474	1544	0.80
11	30	2e-14	2e-11	44.1	0.5	1	86	1571	1642	1571	1643	0.85
12	30	7.8e-13	7.8e-10	38.9	2.0	1	85	1722	1790	1722	1792	0.82
13	30	5.9e-12	5.9e-09	36.1	0.0	1	86	1815	1883	1815	1884	0.82
14	30	7.6e-14	7.6e-11	42.2	0.5	1	87	2059	2128	2059	2128	0.78
15	30	4	4e+03	-1.8	0.1	6	45	2139	2183	2137	2189	0.68
16	30	2.3e-08	2.3e-05	24.6	0.0	1	63	2213	2270	2213	2288	0.74
17	30	0.0048	4.8	7.6	0.0	1	58	2298	2342	2298	2356	0.79
18	30	5.3e-13	5.4e-10	39.5	0.1	1	86	2378	2447	2378	2448	0.82
19	30	1.8e-13	1.8e-10	41.0	0.1	1	86	2568	2636	2568	2637	0.83
20	30	1.8e-10	1.8e-07	31.3	0.1	1	84	2672	2741	2672	2743	0.80
21	30	1.2e-11	1.2e-08	35.1	0.2	1	87	2755	2827	2755	2827	0.81
22	30	1.1e-14	1.1e-11	44.8	1.1	1	86	2849	2922	2849	2923	0.81
23	30	0.00015	0.15	12.4	0.1	1	58	2951	3006	2951	3023	0.76
24	30	2e-12	2e-09	37.6	0.3	1	87	3041	3113	3041	3113	0.80
25	30	1.1e-12	1.1e-09	38.4	0.4	1	85	3246	3315	3246	3317	0.77
26	30	8.3e-12	8.3e-09	35.6	4.0	1	86	3374	3444	3374	3445	0.80
27	30	1.9e-14	1.9e-11	44.1	5.2	1	86	3577	3647	3577	3648	0.84
28	30	4.6e-12	4.6e-09	36.5	0.2	1	86	3743	3812	3743	3813	0.84
29	30	2.3e-09	2.3e-06	27.8	0.4	1	58	3834	3883	3834	3890	0.87
30	30	1.9e-09	1.9e-06	28.1	0.7	6	87	3894	3960	3890	3960	0.72

Sequence Information

Coding Sequence: ATGTCACAGCATAATCCACATGCCCATCCGCACTACCATCACCACCCACTGCACCAGCATCAGAcacaacaccaccaccaccatcatcagttgcagttgcagcagcagcaacagcaacaacaacaacagcagcagcagcaacaacaacaacagcaacagcagcattcGCAAATGCCACACAGTACACACAATTGGTACTCACATGTTGCTTCCTACCCGCAACCGCCACCCCACCACCATGCGACGGCTACCTCGGCATTTGCCGCCACCTCCACACCTTGcaagggcagtggcagtggcagtgccaacaacaacaacatgagtGCCTATGGAGCAGGCAGCACGCATGGAtattatgctgctgctgccgccgccgccgccgctggcgGTGGGCTCAATGTCAATGCTGTGGGTGGCGTTGGGGGTGGGTCAGCAGCCTATAACCTTGAGGCCAACACAGTGGCATATGCCCAcaaccagctgctgcagtaccaacagcaccatcagcagcagcagcaacatcagcaacaccatcatcaacagcagcatctcAGTCAGCGTTCCTATATGGGGCATGATATAATGTCTGGGACATATCCGTACATCAAAAGCGAACCAATGGATGTATCAGCGGCGTATCAGCAGCCACCTAATCCGATGGCACCACCCCCAGCGCCAGAAATGATAATAAAATCGGAACCCATGGATGAACATCCGTACAAGTCCAACTACATAGATGACAATACGCCCTTTGCTGATTTTAATAAGTTCAACGAATTCAGCGGCGATATGCTCAGCCCCAAAGTTGAGCTAACCATCAAAGATGAGACCTATGGCAAGAcctccagtggcagcagctttgCACGCcgcaaagtgcagcagcagcagccacaacagcagcaacagccaacgaCAGATCGTTCGGCGGAGAGTCTGCCGATTTGTCAGCGCTGCAAGGAAGTGTTCTTCAAGAAGCAATCCTACCTTAGGCATGTGGCCGAGAGCAGTTGTGGCATACAGGAGTACGATTTCAAGTGCAACATTTGCCCCATGTCCTTCATGAGCACCGAAGAGCTGCAGCGGCACAAGCACTTGCATCGCGCGGACAAGTTCTTTTGCCACAAATACTGCGGCAAGCATTTCGATACGATAGCCGAGTGCGAAACGCATGAGTACATGCAGCACGAGTATGagagttttgtgtgtaatATGTGCTCGGGCACGTTTGCCTCACGCGAGCAGCTGTACGCCCACTTGCCGCAGCACAAGTTTCAGCAGCGCTACGACTGTCCCATCTGTCGTTTGTGGTATCAAACGGCCGTCGAATTGCACGAGCATCGGCTGGCGGCTCCATACTTTTGCGGCAAGTACTACAccaatcaacagcaacagcaacagcagcagcagcagggcaactATAAGCTGCAGGACTGCCATATGGCCACCATGGAAATGCCCACAGCACCACTGCTCAAGGTACCAACAACGCCTGCGAATGCTTCGGCGCTGCCAGCCACAGCGGCGTTAAGctctctgctgcagcagcgacaagcGAATGCCGATGGGGCAGCGGccatgtttgctgctgcttcctcctcctccaccgctgcCGTCGCCTCCACCGCCGCGACACTGAAGAGCGAGGTAAGCGTCAAGCTGGAGCGCAGCTACAGCAACTCCACCAGCGAGTCCTCGTACAGCCATCaggacaacagcagctacaacaatACCTATGGCAGTGATAGCTCCATTCATGGCGGCGCTCTAGCCGGACCCCAAGCGCACTCCTCAACGCTGGACGACTCCGAGGATGCTTTGTGCTGTGTGCCGCTGTGCGGCGTGCGCAAGAGCACCAGTCCCACGCTGCAGTTCTTTACGTTCCCCAAGGACGAAAAGTATCTGAATCAGTGGCTGCACAACCTCAAGATGTTCCACATACCAGCGGCCAGCTATGCGACATTTCGCATCTGCAGCATGCACTTCCCAAAGCGCTGCATTAATCGCTATTCGCTGTGTTACTGGGCGGTGCCCACGTTCAATCTGGGCCACGACGATGTCGCCAATTTGTACCAGAATCGCGAGCTAACCAACACATTTACCACCGGCGAGGTGGCACGCTGCAGCATGCCACACTGCACCAGCCAGCGGGGCGAGAGCAATCTGAAGTTTTACAATTTCCCCAAGGACATCAAGAGCCTGATTAAGTGGTGCCAGAATGCCCGCCTGCCGGTGCAAGCCAAGGAGCCGCGACACTTTTGCAGCCGCCACTTTGAGGATCGTTGCATTGGCAAGTTCCGACTGAAGCCCTGGGCCGTACCCACTTTGCATTTGGGCGCGCAGTACGGCAAGATCCATGACAATCCCAAGAACCTGTATGTGGAAGAGAAGCGCTGCTGCCTGAACTTTTGCCGTCGCAGCCGCTCCTCGGACTTTAATATGTCGCTGTATCGTTTCCCACGCGATGAGGTGCTGCTGCGACGCTGGTGCTACAACTTGAGGCTGGATCCGGGCGTCTATCGTGGCAAGAATCATAAAATCTGCAGTGCACATTTCATCAAGGAAGCGCTGGGCCTGAGGAAACTGTCGCCAGGTGCCGTGCCCACGCTGCACTTGGGACACAATGACACGTTTAATATCTACGAGAATGAGTTGTGGCCACCGCCATCGCCCACTGGACAGCATGGACAGCAGCTTATGCCGCAGCAATCGACGTCGCAGCATCATCACtcgtcgctgcagcagcagcagcagcagcagcaacatccggCAATGGTCAGCAAATCCTATCAACGCCATTCGGCAGCCTCCACATCATCCTCCGCCAGTTCGGCCTCGCATTATGTGGATCCCGAGATGAGTGGCTCGTACTTGAGCCTCTCTGCGGGTAGCTCCGCGGGCGGCATGAATGCCAGCGACTGCATGGACGTGTGCTGCGTGCCCAGCTGCGAGAGCAAGCGGCACAACAGCGAGAACATCACATTCCACACGATACCGCGGAGGCCCGAGCAGATGCGCAAGTGGTGCCACAATCTAAAGATACCCGAGGACAAGATGCACAAGGGCATGCGGATATGCAGCCTGCACTTTGAGCCATACTGCATTGGCGGCTGCATGCGTCCGTTCGCAGTGCCCACGCTGCAGCTGGGgcacgaggacgaggacaTACACCGCAATCCGGATGTGATCAAGAAGCTGAACATACGCGAGACCTGCTGCGTGGCCGTGTGCAAGCGAAATCGGGACAGAGACCACGCCAACCTCCATCGCTTCCCCAGCAATGTGGCGCTGCTGACCAAGTGGTGTGCGAACCTCCAGCGCACAGTGCCCGATGGCAGCAAACTCTTCAACGATGCCATCTGTGAGGTGCATTTCGAGGATCGCTGTCTGCGCAACAAGCGGCTGGAGAAGTGGGCTGTGCCCACGCTAATACTCGGCCACGAGGACATTGCCTATCAGCTGCCCACGCCCGAGCAGGTGGCCGAGTTCTATGCACGGCCTACCGCTCCCAACAATGGCGAGGAGCAGGGCGAGTGCTGTGTGGAGACATGCAAGCGGAATCCCAGTGTGGATGACATCAAGCTGTATCGCCCGCCAGAGGACACCTCGGTGCTGGCCAAATGGGCGCACAATCTGCAAACGGAGGCCGCGGTGCTCACCAATGGATTGCGGATATGCAATCTGCACTTTGAGGCTCACTGCATTGGCAAGCGCATGCGTCCGTGGGCCATACCCACGCTCAATCTGGCCGGCAACATTGAGAATCTGTACGAGAACCCCGAGCACTCGATGCTGTACAAGCGGCGGACGCATCTCAAGCAGAAGGTGCCCGTGGCGAAGCCCACGTGGGTGCCGCGTTGCTGTCTGCCGCACTGCCGCAAGGTGCGTGCCCTGCACAATGTCCAGCTCTATCGCTTCCCCAAACTGAATCGCTCCACGCTGGCCAAGTGGGCGCACAATCTGCAGGTGCCGCAGGTGGGCAGTGCCCAGCGGCGTGTGTGCTCCGCACACTTTGAGCCGCATGTTCTCAGCAAAAAGTGCCCGGTGCCGCTGGCGGTGCCCACACTGGACCTGAACTCGCCACCCGGCCACAAGATCTACCAGAATCCGGCCAAGCTGAAGGCCAACAAGCTGTGCCTGCAGCGCGTGTGCATCGTGGAGAGCTGCCGCAAGACCAGGGCCCAGGGCGTGCAGCTCTTCCGGCTGCCGCACAGCCCCACGCAGCTGCGGAAGTGGATGCACAACATCAGGACACGCCCGAGGGCGGCCATGAGGAGTCAGTATCGCGTGTGCTCGCGCCACTTTGAGACGCACTCTTTCAACGGGCGTAGACTGAGCGCCGGCGCCATACCCACCCTCGAGTTGGgccacgacgacgatgacATCTTCCCGAACGAGGCGCAGGCCTTTGCCGACGAGCACTGCGCCGTCGAGGGCTGTGAATCGTCCAAGGAGCAGCCCGAGGTGCGTCTCTTCCGCTTCCCCacggacgacgacgacatgcTGTGGAAGTGGTGCAACAATCTCAAGATGAATCCCGTCGATTGCATCGGTGTGCGGATCTGCAACAAGCATTTCGAAGCGGATTGCATCGGACCCAAGCATCTGTACAAGTGGGCCATACCCACGATGCTGCTCGGCCACGACGACTCGCAGATAGAGCTGATACTCAATCCCAAGCCGGAGGAGCGCTACGTGGATCCGGTGTTCAAGTGCATTGTGCCCACCTGCGGCAAGACGCGTCGCTTCGACGAGGTGCAAATGAACAGCTTCCCCAAGGATGCGGAACTCTTTCAGCGCTGGCGGCACAACCTGCGCCTGGAGCATCTCAGCTTCAATGAGCGCGAAAAGTACAAGATTTGCAATGCCCACTTCGAGGACATGTGCATTGGCAAGACGCGCCTGAACATTGGTTCGATACCCACGCTGGAGCTGGGCCACGACGAAACGGAGGATCTGTTCAAGGTGAATCCCGCAGAGCTGCAGAGCAACCTGTTTGGGCGTCCGCGACGGCTGCTGCGAGGATTCAACAATGTGACCATCAAACAGGAGCTGCCAGACACGGAGGCGGAGAcggagccagagtcagagttcCGGGATGTAAAGCCCGATGTAAGCACGGATTTTACACAGGTTAAAATCAAGAAATCTCTGGGCGATGTCAAGTGCTGTGTGCGCACCTGTGGCCGCAGTCGTCTGGAGCATGGAGCACgtctctttccctttcccacCGGCAAGCAGCAACACCTCAAGTGGCGCCACAATTTGCGCCTCGAACCGGACGAGGTGGACAAGTCTACGCGAGTTTGCAGCGCACACTTCAACAGGCGATGCATCGATGGCAAGCAGCTCAGGGGCTGGGCCATGCCCACGCAGCAGTTGGGGCACCAGGAGCAGCCCATCTACGAGAATCCCAAGAACATTCCGGGCTTCTTTACGCCCACCTGTGCGCTGGGCCACTGCCGCAAGCGGCGGAGCATTGACAATGATTTGCGCACGTATCGGTATCCGCGCGCCGAGGATCTGCTGGAGAAGTGGCGTGCAAATCTCGGCCTATCGCTGGATCAGTGCCGTGGCAGGATCTGTGCGGATCACTTCGAGCCGCAGGTGCGGGGCAAACTGAAGCTCAAGACGGGCGCTGTGCCCACGCTAAAGCTGGGCCATGAGGAGCCGCTGGTCTACGACAATGAGGCTATCAAGGCGGGcgtggccgaggaggaggcagcctcGCCGCTGGTCACACCCAAAACGGAAGTGCTGGACGAAGAGGAGCGCGAGgaagatgaggaggaggaggagaatcCCGAAGAGGAGCCGCAGGAGACGCACGAGGAAGAGAAGGACGAGCATGAGGATGACACGCCCgagggagcagagcagctgaGGGATGCGGATGACGCGGAAGAAGACGATGAGGATCCAGGCAACTATTTTGATCCGTTGGAGCTGGTGGAGACGTACGCGGAGCATCCCagcgacgatgacgacaaccACAGCCATGAGGCACGCGAAGATGATGCCCGAGGggtggatgaggaggagccAGAAACCCTTCTGCCTGACACACCACATAAACCGGAACCAGCGACAGTCCTTGGCATGCCCAAACCCTGGGACAGACCTGCCGCCGTTGTGCCTGTGCGCCGTGAGAAGCGTCCGAATAACGTGGACCCCATCTGCTGCCTCAAGCACTGCCGCAAGGAACGCTCCGCCATGTATCTGCTGAGCACCTTTGGCTTCCCCAAggaccagcagctgctgctcaagtgGTGCGCCAATCTGCAAATGGATCCCTCGGGCTGCATTGGTCGCGTGTGCATCGAGCATTTCCAGTCGGAGGTGCTGGGCACGCGCAAGCTCAAACAGAATGCGGTGCCCACGCTCAATGTGGGTCACGATGTGCCACTGCGTTACAGCTGCAATGGCCAGGAGTTGCCTCagtccagcaccagcagcatgaACATGAGCAGTTTTCCCGATGAAATGCCACAGCATTCGGTTTTTCGGCTTTGGAGCCTGAAACACTGCCGCAAGAGGAAGCTGTCGGAgagtccagctccagctccagcagcgatcaagaaggaggagcagcagcagcagcatcagatgGCGATGCCGTTGGAGACTAAACCAAAGATTTGCTGCCTACCCAGCTGCGGCAATGTGGAGGGTTACGGACCAGGCGGACAATTCCAGCCCCTGCCCATGGACCAAAGACTGCTCAAAAAGTGGCAGCACAATCTGCGGCTGCCAGTCGTTAATCCTGCTGCGGATCTGCACCTGTGCCTGGAGCACTTTGAGGCGTGTCAGATCGAGAATGGAACAGCCATGCGCATGAAAGTGCCGACCCTCAAGCTGGACCACACCAGTCCGAATGTGATCAGGAACAGGAAGTGCCTGTGGCCCACGTGTCCGCCCAATCGCAAGCTGTGCTATGATCTGCCGGAGCACGAGTCGGTGCGTGTGGCCTGGCTGTCGTTTATGCGACTGCCGCTGGACAGCCAGGGTCGCCTGTGTGGCGTGCACTTTCTGCAGCTGTACGAGGAGCTGGATCTCCCAGGCGATGTGCCCGAAGAGGTGCTCGAGCGGCTGCAGGTGACCTACGATCAGGCCTCCATCTCGCTGAAGTTTCAGTGCTCCGTTGTGGGCTGTGGCTCCAAGTACAAGCAGGACACGCACCTGGCGAAGCTGCCACGCGACCCGCAACTGCTCGCCAAGTGGCTGCACAACACGAGGATATCGTATGACCGCTCGCTGCATTTTAGTTATCGCATTTGTCTGCTGCACTTTGAGGCATACTGCCTGAACGGCGTGCGTCCACAGCCCTGGGCCATACCCACACTGCAGCTGAATCACGATGGAGAGATCCACCAGAACACCGTCAAGCAGGATGCGCTCGAGAGTCCACTCGTGAAGCAGGAGTTGCCCGAGAGTCCCCCCGTGAAGCAGGAGTTGCCCGAGAGTCCGCCCGTGAAGCAGGAGTTGCACGAGACTTCCCCTGTCAAGCAGGATGCGCTCGAGAGTCCACCCGTGAAGCAGGAGTCGCAGGAGAAAGCTCccttgagcagcagcttgagTCTCTCCATTCCGCTGCACATCAAGACTGAGCAGCAGGGACCTGTACTGCGCTCTCGAGGCACATCTTCGCTGAGCAGTCCCTGcctcagtggcagcagtgcaAGTCCTCGCCTCAAGAACAGAATTTGCTGCATCGCCAACTGCGGCGAGGGTGCCAGATCGCAGCGGCTCCATCCCTTTCCAAGCGACGAACCAACGCTGCTCAAGTGGCTGGTGAACACGCAGCAAAAGCCCGGACTGGTGGACATCCAGAATATGTTTGTGTGCCAGCTGCACTTCGAGGCGGATGCCATCAACAAGACGCAGCTAAGGAGCTGGGCCTTGCCCACACTGCGGCTGGGCCACGACGGGCATGTCATACCGAATGCCCGGCACAATGGGAACATTGCCAACAGCCAGGAGACGGAGCAGGCCATGGAGTTTATTCGGGCCAACTACTGCTCCGTGCTGAGCTGCTTCCAGCCAAAGTCTGACGGTGTGCGCTTCCACAAGTATCCCAGCGACATTGGCATGGTGCGCAGGTGGGCCACCAATCTCAAGCATCGCTCAATGCAGGCCAGCAGTCATGGCTTCCTCGTCTGCCAGTCGCACTTCCAGCCCGAATGCTACGATCCGCAGACGGGCGACCTGCTCGAGGACGCCGTACCGCTCGCGTTGGGTGTAAAAGCCGAAAGCCAGCTGCTCCGTTGCCTCGTCAGGGGATGCCCTGTGACGAGTAACTCTAGCAGGGGATTGCTCCTCTTCAGGGTGCCAAAGAGGACGCGTGTGAGGGAAGTTTGGGGTCACAATCTGTGGATGTATCCGATGCAGCTGGTGGGCGAGCATTACATCTGCGAGCGGCACTTTGAGCCGCACTGCGTGAatgagcagaagcagctgcacgCGGGCTCGGTGCCAACGCTCCACCTGGGCCACAACGAGCAgccggagctgctgcccaaTCCAGCGTCCTTCCAAGAGGAGTGCGAATGCTGTGTGCCCGGCTGTGGGCGCAGCAATAGCAAGGAGCCGGATCTGCTGTTTAGCAAATTTCCCAAGTGGCGCGTGCTGTCCGACAAGTGGCTGCACAACTTCCGCTTGGAAAAGCCCCGCTTGGATCAGCGCATTAAAGCGCTGCGAGTGTGCCACACGCACTTCGAGGAGAGCTGCTTCGATGAGCAGGGCGTGCGGCGGGGTGCCATGCCCACGCTGGAGCTGGGCCACTCGCGTTCGGACATTTATCACACCGACATGGGTTCAGCTATGTGGAAGCCGTTGCACAAGAGATCCAGCGACTGCTGCTATCCCGACTGCCATGAGGACTGCCACAAGGCCAGCATCCATCGCATGGCCTACGACTTGCCCTGCGATGGGCCGGTGCGTGAGGCCTGGCTGCAGCACATGGGCATACCCAGCAGCGGCGACGATGGCCCCTCAGTGCTCAGGCTGTGTCCGGTCCACTACATCATGCTGTATGAGCGTAGCTTCCCCGATCGAGCCGACAACCTCGTGCTGGACCGCAGCTACGAGCACGCGCGTCAGTTGCCACAGCTGCGGCGCTTCATGTGCGTCGTTCAGGGATGCCGCCACCTGCACCAGCGGGATGGCGGAACGATGCATGGAATGCCTAGGAGTGAGCAGATCCTGCGCATGTGGGTGGAGAACGCACAGCTGCGGCTGAACGAGCATGAGATTTACATGACGAAGATGTGCAGCAAACACTTTGAGGCCAGCTGCCTGTACGAGGGCAGGAGGTGTTACCCGTGGAGTGTGCCAACGCTGCATCTGCCGACGCTGCTGCCGGGACAGGTGCTGCACCAGAATCCCACCACTGAGGAGTGGCAGCAAATGAAGCAGCAAATGAAActggaggagcaggcacaGAAAGCCGAACAGCAGATGGCAGAGGGGGGACTGCCAATGGAGCCGTACGTGAAGATGGAACCccacgatgacgacgacgaagacgcGTCGCACACGGAATCGGAGCTGCTGATAAATGAGAGCACCATGGACTCGCAGGAGACGGACTTTCAGCCGAATGAGCCGCTGGAGGTGCTGCTCGAGGTGGGCCATGTCGAGCGGCTGGAGAGCTACGAGAAGAAGGATTACTCGAAGGACCTCCGCGACAGCCGCTATGGGCCTGGCAGGCGTTTCCGCCATCCGTACAGCGCGCACAAGTGCTGTGTCGAGGGCTGTGGCGTGTCGGTGGAGGATTTGGGCTGGAATCTGAAGCTGCACAAGCTGCCCAGCTCCACGGAGGTGGCCAGGAAGTGGCTCTACAACATACAGGTGGACACAGAGGACACGTGGCGCATACGCGTCTGCAGCCATCACTTTGACCGTCAGTGTCTTAATGGTTCGCGACTCAGGCGAGGATCGATGCCTACGCAGCAGCTGGGGCCACGTGTGCCCGAGACTATCCACCAGAATGAGTTctcacagctgcagctggacgaTGCGCCAGCACAGAATGACCCACGCGTGGAGCCGGTGCGAACCATTGGCAAGGTGGTGAATCCGTGCGTGCCGCGACCCTCACCGCCGCGCAAGTCCAGCAAATTCTGCCAGATCGAGGGCTGTTCGAATCATCTGACCAGCGAGAACATGACACTCCACAAGTTCCCGCACTCGTCGTGGATCTGCGTCAAGTGGCAGCACAACACACAGGTTCCCTTCGATCCAGAGTATCGCTGGCGCTATCGCATCTGCAGCGCCCACTTCCATCCCGTGTGTATGGTGAacatgcggctgctgcacggCAGCGTGCCCACCCTCAAGCTGGGCCCCCGCGCACCCGCCGAGCTCTTTGACAGCGACTTTGAGGCCATCAACATCAAGATTGAAAAGCTGGAGAAGTTGGAGAGGAAAGCAGAGGCGCGCAGAGCTACCACGGGAGATGGCGTTGGCTATCCCGCCATGCTGGACATGGGGGAGAAGAGTGTTAAGactgagctggagctggacgatGGAGGAgcactggaggaggaggcggaggaggaggaggatgccaTGCTCTACCTGGAGCCCGAGATGCAGCTGTACGAGGATcaagaggaacagcagcaaatgcgGGCACTAAAGGCAAATCCAAATGGTGGCTGGAAAACGGAACTCCGTTTGCCTTCCAAGAGCCGCGTGACCCTCAATCCGGTGAGATCGGGCTACGACAAGTGCTCGCTGATGCATTGCCAGCGCCAGAGATCCAAGCACGGCGTCCACATCTACAAGTTCCCACGCTCggaggagcaccagcagcgctGGATGCACAATCTGCGCATCCGCTACGATGAGAAGCGCCCGTGGAAGTTTATGGTGTGCAGCGTGCACTTTGAGCCGCACTGCATACGGCTAAGGAAGCTGCGGCCCTGGGCAGTGCCCACTCTGGAGCTGGGCGATAATGTGCCCGAGGACATCTACACGAATGAGCAGtgccaaatgtttgccagTGGACAGGCGGCAGGAGAGACAAATGGCAACGATAGCGATGCAGAGGcgcaggcagaggctgaggcggATAGCGATGggaatgatgatgaggatggcCTGCAAGAGGACGAGGATGAAGAGACCGATGAGCAGGAAGCGAGCACCGCCAAGAAGCGTCGTCGTTCGCGTCTGGCGGATGCCGCCTGGCCACCGGGCCAAGTGCCACCGTGGAAGGTGAAGCAATGCTGCCTGCCCTACTGCCGCAGTCCACGCGGCGATGGCATCAAGTTGTTCCGACTGCCCAACAAAGTGAACTCCATTCGCAATTGGGAGCTGGCCACCGGCATGAAGTTCAAGGAGTCGCAGCGCAACACGCGACTCATCTGCAGCCGCCACTTTGAACCAGAACTGATTGGAGTGCGGCGTCTCATGCGCAATGCCATTCCCACGCGGCACCTGGAACCCACAGGCGATGTGAAGCCAGTGCTGCCACCACCGACAACTGCTGGCCCTAGATGCTGCATGGCCGACTGTGCCTACGATGTGGCGGATGTAAAGCTGCACAAATTTCCCAGCAATCCCAAGTTGCTGAGGGAGTGGTGCCAGGCATTGAGGGTTACCGACCTGCAAAGGTATCGCGGCAAGCACATTTGCTCCGCCCATCTGCCTGTCCACAAGGCCGTGCACTGCATTGTTTGTGGCGCGGATAGGGCGCCGCAGCTGCCGATGCTTAACTTTCCTGCTAACCGAAATCAGCGAGCCAAATGGTGCTACAACCTGAAGATCGACACGATACCCAAGTGGGACATATCCAAGCACATTTGCTGCAAACACTTTGAGCCGTATTGCTTTGCGGCGGCAGGCCTGCTCAAGCCAGAGGCGGCACCCACATTGCATTTGAATCACAATGATACAAACATATTCCTTAACGATTGTGCCATAAATCCCGCCTACACGGGAGTGCGGGTAAAGGATGAGCCCATGGACAATCAGGTCCTGTCGTTGTAG
Protein Sequence: MSQHNPHAHPHYHHHPLHQHQTQHHHHHHQLQLQQQQQQQQQQQQQQQQQQQQQHSQMPHSTHNWYSHVASYPQPPPHHHATATSAFAATSTPCKGSGSGSANNNNMSAYGAGSTHGYYAAAAAAAAAGGGLNVNAVGGVGGGSAAYNLEANTVAYAHNQLLQYQQHHQQQQQHQQHHHQQQHLSQRSYMGHDIMSGTYPYIKSEPMDVSAAYQQPPNPMAPPPAPEMIIKSEPMDEHPYKSNYIDDNTPFADFNKFNEFSGDMLSPKVELTIKDETYGKTSSGSSFARRKVQQQQPQQQQQPTTDRSAESLPICQRCKEVFFKKQSYLRHVAESSCGIQEYDFKCNICPMSFMSTEELQRHKHLHRADKFFCHKYCGKHFDTIAECETHEYMQHEYESFVCNMCSGTFASREQLYAHLPQHKFQQRYDCPICRLWYQTAVELHEHRLAAPYFCGKYYTNQQQQQQQQQQGNYKLQDCHMATMEMPTAPLLKVPTTPANASALPATAALSSLLQQRQANADGAAAMFAAASSSSTAAVASTAATLKSEVSVKLERSYSNSTSESSYSHQDNSSYNNTYGSDSSIHGGALAGPQAHSSTLDDSEDALCCVPLCGVRKSTSPTLQFFTFPKDEKYLNQWLHNLKMFHIPAASYATFRICSMHFPKRCINRYSLCYWAVPTFNLGHDDVANLYQNRELTNTFTTGEVARCSMPHCTSQRGESNLKFYNFPKDIKSLIKWCQNARLPVQAKEPRHFCSRHFEDRCIGKFRLKPWAVPTLHLGAQYGKIHDNPKNLYVEEKRCCLNFCRRSRSSDFNMSLYRFPRDEVLLRRWCYNLRLDPGVYRGKNHKICSAHFIKEALGLRKLSPGAVPTLHLGHNDTFNIYENELWPPPSPTGQHGQQLMPQQSTSQHHHSSLQQQQQQQQHPAMVSKSYQRHSAASTSSSASSASHYVDPEMSGSYLSLSAGSSAGGMNASDCMDVCCVPSCESKRHNSENITFHTIPRRPEQMRKWCHNLKIPEDKMHKGMRICSLHFEPYCIGGCMRPFAVPTLQLGHEDEDIHRNPDVIKKLNIRETCCVAVCKRNRDRDHANLHRFPSNVALLTKWCANLQRTVPDGSKLFNDAICEVHFEDRCLRNKRLEKWAVPTLILGHEDIAYQLPTPEQVAEFYARPTAPNNGEEQGECCVETCKRNPSVDDIKLYRPPEDTSVLAKWAHNLQTEAAVLTNGLRICNLHFEAHCIGKRMRPWAIPTLNLAGNIENLYENPEHSMLYKRRTHLKQKVPVAKPTWVPRCCLPHCRKVRALHNVQLYRFPKLNRSTLAKWAHNLQVPQVGSAQRRVCSAHFEPHVLSKKCPVPLAVPTLDLNSPPGHKIYQNPAKLKANKLCLQRVCIVESCRKTRAQGVQLFRLPHSPTQLRKWMHNIRTRPRAAMRSQYRVCSRHFETHSFNGRRLSAGAIPTLELGHDDDDIFPNEAQAFADEHCAVEGCESSKEQPEVRLFRFPTDDDDMLWKWCNNLKMNPVDCIGVRICNKHFEADCIGPKHLYKWAIPTMLLGHDDSQIELILNPKPEERYVDPVFKCIVPTCGKTRRFDEVQMNSFPKDAELFQRWRHNLRLEHLSFNEREKYKICNAHFEDMCIGKTRLNIGSIPTLELGHDETEDLFKVNPAELQSNLFGRPRRLLRGFNNVTIKQELPDTEAETEPESEFRDVKPDVSTDFTQVKIKKSLGDVKCCVRTCGRSRLEHGARLFPFPTGKQQHLKWRHNLRLEPDEVDKSTRVCSAHFNRRCIDGKQLRGWAMPTQQLGHQEQPIYENPKNIPGFFTPTCALGHCRKRRSIDNDLRTYRYPRAEDLLEKWRANLGLSLDQCRGRICADHFEPQVRGKLKLKTGAVPTLKLGHEEPLVYDNEAIKAGVAEEEAASPLVTPKTEVLDEEEREEDEEEEENPEEEPQETHEEEKDEHEDDTPEGAEQLRDADDAEEDDEDPGNYFDPLELVETYAEHPSDDDDNHSHEAREDDARGVDEEEPETLLPDTPHKPEPATVLGMPKPWDRPAAVVPVRREKRPNNVDPICCLKHCRKERSAMYLLSTFGFPKDQQLLLKWCANLQMDPSGCIGRVCIEHFQSEVLGTRKLKQNAVPTLNVGHDVPLRYSCNGQELPQSSTSSMNMSSFPDEMPQHSVFRLWSLKHCRKRKLSESPAPAPAAIKKEEQQQQHQMAMPLETKPKICCLPSCGNVEGYGPGGQFQPLPMDQRLLKKWQHNLRLPVVNPAADLHLCLEHFEACQIENGTAMRMKVPTLKLDHTSPNVIRNRKCLWPTCPPNRKLCYDLPEHESVRVAWLSFMRLPLDSQGRLCGVHFLQLYEELDLPGDVPEEVLERLQVTYDQASISLKFQCSVVGCGSKYKQDTHLAKLPRDPQLLAKWLHNTRISYDRSLHFSYRICLLHFEAYCLNGVRPQPWAIPTLQLNHDGEIHQNTVKQDALESPLVKQELPESPPVKQELPESPPVKQELHETSPVKQDALESPPVKQESQEKAPLSSSLSLSIPLHIKTEQQGPVLRSRGTSSLSSPCLSGSSASPRLKNRICCIANCGEGARSQRLHPFPSDEPTLLKWLVNTQQKPGLVDIQNMFVCQLHFEADAINKTQLRSWALPTLRLGHDGHVIPNARHNGNIANSQETEQAMEFIRANYCSVLSCFQPKSDGVRFHKYPSDIGMVRRWATNLKHRSMQASSHGFLVCQSHFQPECYDPQTGDLLEDAVPLALGVKAESQLLRCLVRGCPVTSNSSRGLLLFRVPKRTRVREVWGHNLWMYPMQLVGEHYICERHFEPHCVNEQKQLHAGSVPTLHLGHNEQPELLPNPASFQEECECCVPGCGRSNSKEPDLLFSKFPKWRVLSDKWLHNFRLEKPRLDQRIKALRVCHTHFEESCFDEQGVRRGAMPTLELGHSRSDIYHTDMGSAMWKPLHKRSSDCCYPDCHEDCHKASIHRMAYDLPCDGPVREAWLQHMGIPSSGDDGPSVLRLCPVHYIMLYERSFPDRADNLVLDRSYEHARQLPQLRRFMCVVQGCRHLHQRDGGTMHGMPRSEQILRMWVENAQLRLNEHEIYMTKMCSKHFEASCLYEGRRCYPWSVPTLHLPTLLPGQVLHQNPTTEEWQQMKQQMKLEEQAQKAEQQMAEGGLPMEPYVKMEPHDDDDEDASHTESELLINESTMDSQETDFQPNEPLEVLLEVGHVERLESYEKKDYSKDLRDSRYGPGRRFRHPYSAHKCCVEGCGVSVEDLGWNLKLHKLPSSTEVARKWLYNIQVDTEDTWRIRVCSHHFDRQCLNGSRLRRGSMPTQQLGPRVPETIHQNEFSQLQLDDAPAQNDPRVEPVRTIGKVVNPCVPRPSPPRKSSKFCQIEGCSNHLTSENMTLHKFPHSSWICVKWQHNTQVPFDPEYRWRYRICSAHFHPVCMVNMRLLHGSVPTLKLGPRAPAELFDSDFEAINIKIEKLEKLERKAEARRATTGDGVGYPAMLDMGEKSVKTELELDDGGALEEEAEEEEDAMLYLEPEMQLYEDQEEQQQMRALKANPNGGWKTELRLPSKSRVTLNPVRSGYDKCSLMHCQRQRSKHGVHIYKFPRSEEHQQRWMHNLRIRYDEKRPWKFMVCSVHFEPHCIRLRKLRPWAVPTLELGDNVPEDIYTNEQCQMFASGQAAGETNGNDSDAEAQAEAEADSDGNDDEDGLQEDEDEETDEQEASTAKKRRRSRLADAAWPPGQVPPWKVKQCCLPYCRSPRGDGIKLFRLPNKVNSIRNWELATGMKFKESQRNTRLICSRHFEPELIGVRRLMRNAIPTRHLEPTGDVKPVLPPPTTAGPRCCMADCAYDVADVKLHKFPSNPKLLREWCQALRVTDLQRYRGKHICSAHLPVHKAVHCIVCGADRAPQLPMLNFPANRNQRAKWCYNLKIDTIPKWDISKHICCKHFEPYCFAAAGLLKPEAAPTLHLNHNDTNIFLNDCAINPAYTGVRVKDEPMDNQVLSL

Similar Transcription Factors

Sequence clustering based on sequence similarity using MMseqs2

100% Identity: iTF_00536072;
90% Identity: iTF_00514916;
80% Identity: -