Basic Information

Insect: Drosophila erecta
Gene Symbol: -
Assembly: GCA_000005135.1
Location: CH954179.1:4568454-4581663[+]

Transcription Factor Domain

TF Family: THAP
Domain: THAP domain
PFAM: PF05485
TF Group: Zinc-Coordinating Group
Description: The THAP domain is a putative DNA-binding domain (DBD) and probably also binds a zinc ion. It features the conserved C2CH architecture (consensus sequence: Cys - 2-4 residues - Cys - 35-50 residues - Cys - 2 residues - His). Other universal features include the location of the domain at the N-termini of proteins, its size of about 90 residues, a C-terminal AVPTIF box and several other conserved residues. Orthologues of the human THAP domain have been identified in other vertebrates and probably worms and flies, but not in other eukaryotes or any prokaryotes [1].
Hmmscan Out: # of c-Evalue i-Evalue score bias hmm coord from hmm coord to ali coord from ali coord to env coord from env coord to acc

1 28 5.1 9.4e+03 -2.5 2.3 38 62 323 350 316 363 0.58

2 28 4e-15 7.3e-12 45.9 3.6 1 86 559 631 559 632 0.85

3 28 1.2e-14 2.2e-11 44.4 5.0 1 87 659 728 659 728 0.83

4 28 1.1e-15 2e-12 47.7 0.2 1 87 750 822 750 822 0.85

5 28 5.9e-16 1.1e-12 48.6 5.3 1 87 920 990 920 990 0.82

6 28 1.6e-14 2.8e-11 44.0 3.4 1 86 1014 1085 1014 1086 0.82

7 28 3.9e-13 7e-10 39.6 1.3 1 87 1121 1189 1121 1189 0.80

8 28 3.5e-10 6.4e-07 30.1 1.5 1 86 1229 1298 1229 1299 0.76

9 28 5.3e-17 9.7e-14 51.9 0.4 1 86 1326 1395 1326 1396 0.83

10 28 3e-13 5.5e-10 39.9 1.7 1 85 1417 1485 1417 1487 0.81

11 28 1.9e-13 3.5e-10 40.5 0.5 1 86 1514 1585 1514 1586 0.84

12 28 4.1e-13 7.4e-10 39.5 2.4 1 85 1662 1730 1662 1732 0.82

13 28 7.1e-13 1.3e-09 38.7 0.1 1 87 1755 1824 1755 1824 0.82

14 28 3.2e-13 5.8e-10 39.8 2.4 1 87 1957 2026 1957 2026 0.80

15 28 7.2e-11 1.3e-07 32.3 0.1 1 86 2124 2190 2124 2191 0.78

16 28 1.2e-06 0.0021 18.8 0.0 1 59 2206 2254 2206 2266 0.80

17 28 9.7e-10 1.8e-06 28.6 0.2 16 87 2268 2327 2258 2327 0.82

18 28 7.9e-11 1.4e-07 32.1 0.2 1 86 2362 2433 2362 2434 0.81

19 28 2.3e-11 4.2e-08 33.9 0.0 1 86 2444 2515 2444 2516 0.78

20 28 1.5e-11 2.7e-08 34.5 0.0 1 86 2540 2610 2540 2611 0.77

21 28 0.00013 0.24 12.2 0.2 1 58 2644 2691 2644 2715 0.80

22 28 4.4e-13 8e-10 39.4 0.2 1 87 2729 2802 2729 2802 0.83

23 28 4.7e-16 8.5e-13 48.9 0.4 1 86 2918 2990 2918 2991 0.82

24 28 2.7e-07 0.0005 20.8 1.9 24 86 3037 3093 3021 3094 0.73

25 28 8.8e-14 1.6e-10 41.6 3.5 1 86 3191 3261 3191 3262 0.84

26 28 1.6e-11 2.9e-08 34.4 0.1 1 86 3345 3414 3345 3415 0.84

27 28 1.5e-10 2.8e-07 31.2 1.7 1 58 3438 3486 3438 3497 0.85

28 28 5.7e-10 1e-06 29.4 1.2 18 86 3504 3561 3493 3562 0.75

#	of	c-Evalue	i-Evalue	score	bias	hmm coord from	hmm coord to	ali coord from	ali coord to	env coord from	env coord to	acc
1	28	5.1	9.4e+03	-2.5	2.3	38	62	323	350	316	363	0.58
2	28	4e-15	7.3e-12	45.9	3.6	1	86	559	631	559	632	0.85
3	28	1.2e-14	2.2e-11	44.4	5.0	1	87	659	728	659	728	0.83
4	28	1.1e-15	2e-12	47.7	0.2	1	87	750	822	750	822	0.85
5	28	5.9e-16	1.1e-12	48.6	5.3	1	87	920	990	920	990	0.82
6	28	1.6e-14	2.8e-11	44.0	3.4	1	86	1014	1085	1014	1086	0.82
7	28	3.9e-13	7e-10	39.6	1.3	1	87	1121	1189	1121	1189	0.80
8	28	3.5e-10	6.4e-07	30.1	1.5	1	86	1229	1298	1229	1299	0.76
9	28	5.3e-17	9.7e-14	51.9	0.4	1	86	1326	1395	1326	1396	0.83
10	28	3e-13	5.5e-10	39.9	1.7	1	85	1417	1485	1417	1487	0.81
11	28	1.9e-13	3.5e-10	40.5	0.5	1	86	1514	1585	1514	1586	0.84
12	28	4.1e-13	7.4e-10	39.5	2.4	1	85	1662	1730	1662	1732	0.82
13	28	7.1e-13	1.3e-09	38.7	0.1	1	87	1755	1824	1755	1824	0.82
14	28	3.2e-13	5.8e-10	39.8	2.4	1	87	1957	2026	1957	2026	0.80
15	28	7.2e-11	1.3e-07	32.3	0.1	1	86	2124	2190	2124	2191	0.78
16	28	1.2e-06	0.0021	18.8	0.0	1	59	2206	2254	2206	2266	0.80
17	28	9.7e-10	1.8e-06	28.6	0.2	16	87	2268	2327	2258	2327	0.82
18	28	7.9e-11	1.4e-07	32.1	0.2	1	86	2362	2433	2362	2434	0.81
19	28	2.3e-11	4.2e-08	33.9	0.0	1	86	2444	2515	2444	2516	0.78
20	28	1.5e-11	2.7e-08	34.5	0.0	1	86	2540	2610	2540	2611	0.77
21	28	0.00013	0.24	12.2	0.2	1	58	2644	2691	2644	2715	0.80
22	28	4.4e-13	8e-10	39.4	0.2	1	87	2729	2802	2729	2802	0.83
23	28	4.7e-16	8.5e-13	48.9	0.4	1	86	2918	2990	2918	2991	0.82
24	28	2.7e-07	0.0005	20.8	1.9	24	86	3037	3093	3021	3094	0.73
25	28	8.8e-14	1.6e-10	41.6	3.5	1	86	3191	3261	3191	3262	0.84
26	28	1.6e-11	2.9e-08	34.4	0.1	1	86	3345	3414	3345	3415	0.84
27	28	1.5e-10	2.8e-07	31.2	1.7	1	58	3438	3486	3438	3497	0.85
28	28	5.7e-10	1e-06	29.4	1.2	18	86	3504	3561	3493	3562	0.75

Sequence Information

Coding Sequence: ATGTCACAACAACACCCCCATCACGCCCACCCCCACCACTACGCCCACCACTACCCGCCCCCTGCGACGCCCATGTccctgcagcaacagcagcagcagcaagcgcaGCTGCCgcctcagcagcagcacgccAATTGGTACTCACATGTTGCTTCCTACCCCACACCCCACTCGGCCTTCGGCCCCGCCCCCTCTTGCAAGGCCACCAACAACAgtagcagcggcaacaacaacaacatcatgGGCGGCGGGGGATACGGGCCAGGGGGTGGTGGCACGCAGGGCTATTATGGCGCCGCTGGCGGTGGCCTCAATGTCAGTGGggcggtggtgggtggtggtgggccgAACTACGGCCTTGGGGCCAATACAGTGGCATATGCCCACAACCAACTGCTGCAgtatcaacaacaacaacaacaacagcagcagcagcagcaacaccagcagcaacaacagcagcaccagcatcTTCCACAGCATATAAACCAACAAAGGCCCTATATGGGCCACAATATCATGACCGGCAGCTATCCTTATATCAAGAGCGAACCCATGGAGGCCTACCAGCAGCCCCCGAATCCCATGGCCCCGCCCCCGGCACCAGAAgtattaataaaatCGGAACCCATTGACGAGCATTCCTATAAGTCTAACTATATAGATGACAATACGCCATTTGCTGACTTTAGCAAGTTCAGCGAATTCGGCGACGACATGCTGAGCCCCAAAGTGGAGCTAACCGTGAAGGATGAGTCCTACGGAAAGAGCACTAGCAGTTTCCTGCGCCGCAAACAACAATCGGATCGGGGCACCGAAAGCCTGCCAATCTGCCAGCGCTGCAAGGAGGTCTTTTTTAAGAAGCAGGTCTATCTTCGCCATGTGGCCGAGAGCAACTGCGGCATCCAGGAGTACGACTTTAAGTGCAGCACCTGTCCCATGTCCTTCATGACGACCGAGGAGTTGCAGCGGCATAAGCTCCACCACCGGGCAGACAGGTTCTTCTGCCACAAGTACTGCGGCAAGCACTTTGACACGATAGCGGAGTGCGAGGCGCACGAGTACATGCAGCACGAATATGATGCTTTTGTCTGCAACATGTGCTCCGGAACCTTCGCAACGAGGGAGCAACTGTACGCCCACCTTCCGCAGCACAAGTTCCAGCAGCGCTTCGACTGTCCCATCTGCCGTCTGTGGTATCAGACGGCTCTGGAGCTACACGAACATCGTCTGGCTGCGCCCTATTTCTGCGGCAAGTACTACACGGGCGGACAGTCATCCTCTGCCtcccagtcgcagtcgcaggcgcagcagcaccAGACCAACTACAAGCTGCAGGACTGTCATATGGCGACCATGGAaaTGACCACAACCCCGCACCACAAAACAACTTCATCCGGCTCGTCTTTGCCGGCAACGGCTGCACTGAATTCTCTACTGCAGCAGCGTCAGGCAAATGCCGATGGAGCTGCCATGTTCGCAGCATCTGCAATGAAGAACGAAGTGAATGTTAAGATGGAGCGGAGCTACAGCAACTCTACCAGCGAGTCATCCTACAGCGTTCAGGACAGTGGCTACAATAATACCTATGGAAGCGACAGCTCAATGCACGCAGGAGCGATCGCCGGACCACAGGCGCATTCCTCAACGCTAGACGACTCCGAGGACGCCTTGTGCTGTGTTCCTCTGTGTGGAGTGCGCAAGAGCACGAGCCCTACGCTTCAGTTTTTCACGTTCCCCAAGGACGAGAAGTACCTCAATCAGTGGCTGCACAACCTCAAGATGTTCCACATACCCGCCGCCAGCTACGCCACTTTCCGCATCTGTAGCATGCATTTTCCGAAGCGCTGCATTAACCGCTACTCCCTGTGCTATTGGGCCGTTCCCACGTTTAACCTGGGCCACGACGACGTGGCCAATCTATACCAGAACAGGGAACTCACCAACACCTTCACCACCGGCGAGGTAGCGCGCTGCAGCATGCCTCACTGTACAAGTCAGCGGGGTGAGAGTAACTTAAAGTTCTACAACTTTCCCAAGGACATCAAAAGCTTGATCAAGTGGTGCCAGAATGCACGACTGCCCGTTCAGGCAAAAGAGCCGCGTCATTTTTGCAGCCGCCACTTCGAAGAGCGCTGCATTGGCAAGTTCCGACTGAAGCCTTGGGCGGTGCCTACTTTACATCTAGGTGCCCAGTATGGCAAGATCCATGACAACCCAAAGAATTTGTACGTCGAGGAGAAACGCTGCTGCCTCAACTTCTGCCGCCGGAGCCGATCCTCTGATTTCAATATGTCGCTATATCGTTTTCCCAGAGATGAAGTTCTTCTGCGACGCTGGTGCTACAATCTTCGCTTGGATCCTGGAGTATATCGTGGGAAGAATCACAAAATATGCAGCGCACACTTCATCAAGGAGGCGTTGGGTCTGCGGAAACTATCCCCAGGGGCCGTACCCACACTTCATCTGGGTCACACTGACACCTTTAACATCTATGAGAACGAACTGTGGCCACCGCCAACAACACCCAATAGTCACAGCAGTGGCCTCCAGCACCAGGCGCAACATCATTCTTCGCAACActcactgcagcagcagttgcataGCAAATCGTACCATCGCCAATCAGCGGCTTCCACGTCTTCCTCCGCCAGCTCGGCAAACTCTCACTACGTGGATCCTGATCTAAGCGCTTCTTACCTGGCCTTAGGTGCCAGTGGATCTTCTGCAATGAATGCCAGCGACAGCATGGACATATGTTGTGTGCCCAGTTGCGAGAGCAAGCGTCACAATAATGAGAACATTACATTCCACACCATACCACGCCGACCGGAGCAGATGCGCAAGTGGTGCCATAATCTGAAAATAGCCGAAGAAAAGATGCACAAGGGTATGAGGATTTGCAGTTTGCACTTCGAGCCCTACTGCATTGGCGGTTGCATGCGTCCATTTGCGGTGCCTACGCTTAATTTGGGTCACGATGACGACGATATTCATAGAAATCCGGATGTGATTAAAAAATTGAACATCCGGGAAACGTGCTGCGTCGCCGTATGTAAGCGAAATCGGGACAGAGACCATGCCAATTTGCACCGTTTCCCAAGCAATGTGTCACTATTGACCAAGTGGTGTGGCAATCTTCAGCGTCCTGTTCCGGATGGAAGTAAACTTTTCAACGACGCCATATGTGAAGTGCACTTCGAGGAACGGTGTCTGCGCAACAAAAGGCTCGAGAAGTGGGCGGTGCCCACATTATCGCTAGGTCACGAAAACATCCCATACCCGCTGCCAACGCCGGAACAGGTTACAGAGTTCTACGCTCGACCCACTGCACCCAATAATGGCGAGGAACAGGGAGAGTGCTGTGTGGAGACGTGCAAGAGAAATCCCAGCGTGGACGACATTAAGCTTTATCGGCCGCCGGAAGAAGCTTCCGTGTTGGCAAAGTGGGCGCACAACCTGCAGACGGAGAGTAGTCAACTGACGAGCATGAGGATCTGCAATCTTCATTTTGAGGCACACTGCATCGGCAAGCGAATGAGACCTTGGGCTATTCCAACACTAAATCTTGCAGGTAACATAGAAAATCTCTACGAGAATCCGGAGCATTCGATGCTGTACAAGCGGCGGACTCACATAAAAACCAAGCAGTCGGCTTCCGTGAAGCCCACTTGGGTGCCCAGGTGTTGTCTTTCGCATTGCCGCAAAGTTCGGGCTCTCCACAACGTTCAGCTTTATCGCTTCCCCAAGCTCAATCGCTCCACTCTGGCTAAGTGGGCGCACAATCTGCAGGTTCCTATGGTTGGCAGTGCCCAACGCCGCCTATGCTCGGCTCATTTTGAGCCGCACGTGCTGAGCAAGAAGTGTCCGGTGCCGCTGGCGGTACCTACATTGGACTTAAACGCGCCACCCGGCTTGAAGATTTACCAGAACCCAGCCAAGCTCAAGGCAAGCAAGCTGTGTCTACAGCGCGTGTGTATTGTCGAGAGCTGCCGCAAGACGCGGGCGCAGGGCGTCCAGCTCTTCCGGCTGCCACATAGTCCAACGCAGCTGCGCAAGTGGATGCATAACATCAAAACGCGTCCCAGAGCGGCGATGAGGGCCCAATACCGGGTGTGTTCCCGCCACTTCGAGACACACTCTTTCAATGGCAGGAGACTAAGCGCTGGCGCCATTCCCACCCTGGAATTGGGTCATGACGACGAGGACATCTATCCCAACGAAGCGCAGGCCTTTGCGGATGAACACTGCGTGGTGGAGGGCTGCGAGTCATCCAAGGAACAGCCGGACGTACGCCTATTCCGTTTTCCCACAGAGGATGACGATATGCTATGGAAGTGGTGCAACAATCTCAAAATGAACCCGGTGGATTGCACCGGCGTGCGCATATGCAATAAACACTTCGAGGCTGATTGCATCGGGCCGAAGCACCTATACAAGTGGGCTATTCCCACCGAGGAACTAGGCCACGACGACGCCGAGATCGAGCTAATACTAAATCCCAATCCGGAGGACAGGTATGTGGATCCGGTGTTCAAGTGCATCGTACCGACCTGCGGAAAGACGCGTCGCTTCGACGAAGTGCAGATGAACAGCTTTCCCAAGGATGCGAATCTCTTCGAGCGGTGGAAACACAACTTGCGGCTGGAACACCTCAGCTTCCAGGAACGCGATCGCTACAAGATATGCAACTCTCACTTTGAGGATATATGTATTGGAAAGACTCGGCTAAACATAGGTTCGATCCCGACTCTAGAACTTGGTCACGACGAGACAGACGATCTGTTCCAGGTAAATCCAGCAGAGCTGCAAAGCAACCTTTTCGGTCGACAGCGGCGAATACACGACGAGTCGGGCGGAATAATCATCAAGCAGGAGTTTTCCGAGTCTGAAGACGTCAAAACGGATGTGGCAACCATGTCTGATGCCAAAGATTTCAATACGAGACAGGTTAAGCTCAAGAAAACTATGTCCGATCTGAAGTGTTGTGTGCGCAGTTGTGGGCGCAGTCGATTGGAGCACGGAGCACGcctctttccatttcccacTGGTAAGCAGCAGCACCTAAAGTGGCGTCATAACCTGCGTCTAGAACCCGACGAGGTGGACCGATCGACAAGGATTTGCAGTGCGCACTTCAACCGGCGCTGCATTGATGGCAAGCAGCTGAGAAGCTGGGCAATGCCCACCCAACAACTGGGCCACCAGGAGCAGCCGATCTACGAGAATCCGAAAAACATACCAGGATTCTTTACGCCCACATGTGCTCTGAGTCATTGCCGCAAGCGTAGGAGCATTGACAACGATCTCCGCACTTATCGATATCCACGGAGTGAGGATCTTCTGGAGAAATGGCGGGCGAATCTGCGTCTGGCACCGGATCAGTGTCGCGGCAGGATATGTGCGGACCATTTTGAGGCACAGGTGCGTGGAAAGTTGAAGCTGAAAACGGGAGCAGTGCCTACTTTAAATCTTGGCCATGATGAGGGCTTGATATACGATAATGAGGCTATAAAGGTGGGTAtgaccgaagaagaggaaggcGGCTCTGAGCTGCCACGACTGAAAACCAAAAGAGAGCTGATTGATGAGGAGGAAGAAGAGCTAGAGGCTGAGGAGGAGCAACACGACCACGATATTTTCGATGATGATGAGAAAGACGGCCACTATTTCGATCCCCTCGAACTGGTCGAAACCTTTGCCGAACATGCAAGTGATGATGAAGGCGAGTATTGCGGAGATGGGGAGGATGAACgcgacgaagaagaagacttGGAGGAGGCGGAGCACTTTCATCCGGACGCCCCACCCACTCCTCCAACCATCCCTCTGCGTCGCGAAAAGCCCGCTAATAATGTGACGCCCATATGCTGCCTAAAGCACTGCAGAAAGGAACGCACTGCTTTTCACCTGCTTAGCACCTTTGGATTTCCCAAGGATCGCCAGCTGCTGCTCAAGTGGTGCTCCAATCTGCACCTGAATCCAGATGACTGCATCGGCCGCGTTTGCATAGAGCACTTTCAGCCGGAGGTACTGGGAACCCGTAAGCTTAAGCAAAATGCGGTACCCACTCTCAATGTGGGCCACGATGAGCCACTTAGATACTCCTGTAATGGAGTGGATCTTGACCAAGAGCAATTACAGCCACAGCACTCGGTTTTTCGGCTTTGGAGCCTAAAACACTGCCGCAAGAGGAAGCTGACAGAGCCGCCGGACATTCACCAAAACAAGTGGCGTACGGTGGAGGTGCGGAAGATGCAGAGGTTGAGGATGGAGATGAAGATCAAGCAGGAGGTGCAGACGGAGAGGGAAATGAAGACGAAGGAGAAGACTCCCATGAAGAATCACAGAGAGAGTAAGCTGGAAAGATGTTGCATCAGCTCCTGTGGGAATGAGGACGTTAACCAACTACTTCCGCTGCCGGAGgagcaaaatatattaaaaaagtgGCAGCATAACCTAAAGCTTTCCCTAGACACGGACTTCACGGAAATTCGTGTGTGTCTTAAGCACTTTGAGGAGCAAgtggtggaaaatggaaagccCTTGGAGCAGGCAGTTCCGACCTTAATGCTAGATCAAAATAGTTGGAACATCTACAGAAACATCGGCAGTTGTATCTTTCCGGAGTGCAGAAGTTCTTCATCGGATCACATAAGCTTTGTTAATTTACCCGCAAATGTGGTCATAAGAGATGCCTGGATAAGTCACCTTAATTTGCCACCTAGCAGTGAGGGTCTTCTTTGTGGCGACCACTTTATGCAACTGTTTAAAAGGGTGGAGTTTCCCAAGATTGGAAGTAGTCAAATTCGACTCTACCGCTTCCCCACCGAAGAGCAGGCCTTGCTCCGGTGGCTGGTGAACACGCAGCAGCAACCTCGCCTTGTTGACCCTGCGGAGCTTTACGTGTGCCAAACTCACTTTGAACCAGACGCCATATGTAAAAAACAACTTCGTTGCTGGGCGGAACCCACCTTAAACCTGGGCCACGACGGCTTTGTTATCCCCAATGCCAAGCACAATGGGAACATTGCTGGGGGCCAGGATACTGAGGAGGCGATGAGGCTTATCCGGGAGCGCTTTTGTTCCATACTAACTTGTTTTCAGGCTGAAGCTAGCGGTATAAGGCTCTATGAGTATCCCAAGGATATGCCAACTATACGAAAGTGGGCAGCCGCGTGTAGACATCGCTCCATGCAGGCCAGCAGCCATGGTTTCAAGGTATGCCAGTCTCACTTTGCACCCGAATGCTTTGAGCCGGACACTTTAAATTTGATTGACGGATCCGTCCCAACTCTTGAGTTAAGTAGAGGCGACATCGAAAGACACTGCCTAGTGTCTGGGTGTGAAAAGGACGCCTCTGGAGGACGTCTCCGCTATTATAAGGTGCCAAAGGCCGCTGCTCAACTGAATGCGtggagcaacaacctaaaGATTAGTTCCGTGGACCTCGGGTTGGGAGAGCAGCTCATCTGTGAACGACACTTTGAGCCCTTTTGTTTCGGTGCCCACAAAGGATTACGTCCTGGCGCACTACCGACTCTAATGCTAGGGCACGACGAGGAGGTGGAGATGTTACCAAACCCAGAAAGTCTCTGGCAGAAAAAAGCGGAGGTTTGCTGTGCCACTCAATGTGGTCGAATATGGCAGCCCGGAGACACTAAGTTCAGTGGATTTCCGAAAACGTTGACGTTGGCTAAGAAATGGATTCATAATCTCCAACTTACAGTAGCAAATGACCAACTGGGTGGTCTGAAAGTCTGCAGTGCGCATTTCGAAGCCTCTCTCTTCAATAAAAGTGGATTAATATCGGGTTCCATACCCACACTGGAGCTGGGCCATTCCTCTCAGGCTATATTTCAGCCGGACACCCAAATCCTGGGTAAAAGCCAAAAGTTGGAAAGGAGAGCCATAATATCGGAGGTTGATTGCATTTACCCTGAGTGCAAGGAACTGTGCAAAACCGTGTCATTCAATCTGCCCCAAGAGGAGAACTTACGGAGAGCGTGGCTGCGTCATTTGAATATCGAAGAGCCGTCGAGTAATGACGGTCAGCTATGCCCACTACACTACGTTATTCTTTACGAACTAAGTATCAAAAGCTTTCCAGAGCACGTTTCAAACCGATTCCTCGAAGAAAACTACTATTCTGCTCGAAACAACAGACGCGTCAAGATCGTTAGCTGTGCGGTTAAAGGTTGCGAAATGATCAGGCCCCGGGATAAGGTGCTCCTGCACGGGTTGCCGCAAAGAAAAGACATGCTGAGAATGTGGGTTGAGAATGGCCAACTGGAGATTACggagccgcagcagcaatATATGCTTAGAGTATGCCGCAATCACTTTGAGTCCCGATGCTCGTTTGACGACAGGCGGCTGCATACCTGGAGTGTTCCCACTCTGAACTTACCTGGAAATCCGGTGCACCAAATTCCCACTAAGGAGGAGTGGCAGGAAATGACAGTAAAATTGTCCCAGGAAGCCGATACAATCAAATTGGAGatagaggaggagctggaagAGGAAGAGCTGCACGAGGAGGAAGAGGCTGACAGTTCCCTTCTAGAGCCCATCGTAAGAATGGAGCACATCGAGTCCGACGAGGAAGACTCTGAGATGCAAGCCTTGGAGGTCCTTCTGGAAGTTGGTCACGTTGAGCGAATGGACAGCTACGAAAGAGTGGACAAGACCTATATCGAACATGCCGTCTACCAATCTAATAGTATTCGAAACCAGTACAATGCCAACCACTGCGCCGTTGAAGGATGCGAAGTGACAGTTGAGGACGTGGACGGGACCATCAAGCTGCATAAGTTCCCCGCGTCTTCGGAGGCCGCTAGGAAGTGGATGCACAACACCCAAGTTGACATGGATGAGAAGTTCTGGTGGCGGTATCGAATATGCAGTTACCATTTCGAGCAGGAGTGCTTCCAGAGCGCTAGAATAAAGAAGGGAGCGATGCCCACTCTTCTCCTAGGACCTAGGAGACCAGAAAAGGTATACGAAAATGAATTCGCATTGCAGGAGACTGAAGAGCTTATTTTGCCCGAAGAACTTCAGTTTGAGGAGCACAAAAAGGCCAAAAGTGAGGTAATAAAACTCTGCCTGCCTACGCCGGCTCCGCCTCGAAAGTCCAAGGACATGTGCCTCAAGTGGCAGCACAACACACAGGTGCCTTTCGATCCCTTCCACCGGTGGCGATACCGGATCTGTAGTGCGCACTTTCATCCGGTGTGCCTGCTTAACATGAGACTAGTCCATGGTAGTGTGCCCACCTTAAAACTAGGTTCCAAGGCTCCCACCGAACTATTTGACAACGACTTCGAAGCCATTAACCTCAGGCTGGACAAGAAGCTGGGAGCTGACCCAAGCACCGTGCAGATAAAGGAGGAGGATGAAGATTCTATGCCGACCCTGGAACCAGAACTTCAGCTTCACGAGGACCAAGAGGCAGAGGACTCAGCAGCTACGCAAATACCCCTTGACCAGACAAACTGGAAGGGCCAACTGCGCTTGCCTGTGAAGCAGGAAAAGGTGACCTACAACCAGGTGAAATCCGGTTACGATAAGTGCTCATTGGGTCATTGCCAGCGGCAAAGATCTAAGCACGGCGTTCACATCTACAAATTTCCCAAATCGAGGCTCCAACAGGAGCGCTGGATGCACAACCTCCGCATCCGCTACGATGAGCGAAGGCCATGGAAGTTTATGATCTGCAGCGTTCATTTCGAGCCACACTGCATCAGTCTGAGGAAGCTGCGCCCCTGGGCTGTTCCCACCCTGGAGCTGGGCGACAATGTGCCCGAGAAGATCTTTACGAACGAACAGTGCCATGAACTGTTCACCGATCGCAGCGAGGTGGAGAGCGATGCCGATGAGGAGGATGGACTgcaggaggacgaggacgaggaggaggaggatgagggtGAGTGCGAGGAGAATATAGGGACGGAGGTGCGCATCAAGCGGGAGCGGCGTTCCAAGCTGGATCCTTGGCCGCCGGGGCAGGTTCCGCCGTGGAAAGTTAAGCAGTGTTGTCTTCCTTACTGCCGGGCCTTCCGTGGCGATGGCATCAAATTATTTCGGCTGCCCAACAACCGCACCTCCATACGCAACTGGGAGCTGGCGACGGGCATGGTGTTCAAGGAGTCTCAACGAAACACTCGCCTGATTTGCAGCCGGCACTTTGAGCCCGAGTTGATTGGGGTAAGACGTCTCATGCGGAACGCCATTCCCACGAGGCACTTAAATCCTCAGGCATCCTCCGAGGAAGGGAAGAGAAAGCAGGATCCTCCCCTCCCAATTGCAACCTGTTGCATGGCTGACTGTCATCATAACGGAAATGTTAAACTGCACAAGTTTCCCAGTGACCCGGCGCTGCTTAGACAGTGGTGCCAAGCACTCAGGCTCACGGATACTCAAAGATACCGGGGCAAACATATCTGCTCGGTCCACCTGCCCACCGACAGGACGGTTAGCTGTGTCATCTGCGGAGTGGACAATGTCCAGTTGCCGATGCTGGACTTTCCAGAGCAGCGCAATCAGCGCGCCAAGTGGTGCTACAATCTCAAGATCGAGGCCATATCCAAGTGGGACCACTCCAACCACATTTGCTGTCGTCACTTCGAGTCGCATTGCTTCCTCCAGCCGGGTGAACTGCGTCCTGGTGCGATTCCCACGCTGCAGCTGAACCACGACGACACGAATATATTCCTCAGCGACTTCGCCACTGGTCCGACCGGCAATCGGATCAAGGACGAGCCGCTGGACAATGACGACATGCTGCTGGTTTAG
Protein Sequence: MSQQHPHHAHPHHYAHHYPPPATPMSLQQQQQQQAQLPPQQQHANWYSHVASYPTPHSAFGPAPSCKATNNSSSGNNNNIMGGGGYGPGGGGTQGYYGAAGGGLNVSGAVVGGGGPNYGLGANTVAYAHNQLLQYQQQQQQQQQQQQHQQQQQQHQHLPQHINQQRPYMGHNIMTGSYPYIKSEPMEAYQQPPNPMAPPPAPEVLIKSEPIDEHSYKSNYIDDNTPFADFSKFSEFGDDMLSPKVELTVKDESYGKSTSSFLRRKQQSDRGTESLPICQRCKEVFFKKQVYLRHVAESNCGIQEYDFKCSTCPMSFMTTEELQRHKLHHRADRFFCHKYCGKHFDTIAECEAHEYMQHEYDAFVCNMCSGTFATREQLYAHLPQHKFQQRFDCPICRLWYQTALELHEHRLAAPYFCGKYYTGGQSSSASQSQSQAQQHQTNYKLQDCHMATMEMTTTPHHKTTSSGSSLPATAALNSLLQQRQANADGAAMFAASAMKNEVNVKMERSYSNSTSESSYSVQDSGYNNTYGSDSSMHAGAIAGPQAHSSTLDDSEDALCCVPLCGVRKSTSPTLQFFTFPKDEKYLNQWLHNLKMFHIPAASYATFRICSMHFPKRCINRYSLCYWAVPTFNLGHDDVANLYQNRELTNTFTTGEVARCSMPHCTSQRGESNLKFYNFPKDIKSLIKWCQNARLPVQAKEPRHFCSRHFEERCIGKFRLKPWAVPTLHLGAQYGKIHDNPKNLYVEEKRCCLNFCRRSRSSDFNMSLYRFPRDEVLLRRWCYNLRLDPGVYRGKNHKICSAHFIKEALGLRKLSPGAVPTLHLGHTDTFNIYENELWPPPTTPNSHSSGLQHQAQHHSSQHSLQQQLHSKSYHRQSAASTSSSASSANSHYVDPDLSASYLALGASGSSAMNASDSMDICCVPSCESKRHNNENITFHTIPRRPEQMRKWCHNLKIAEEKMHKGMRICSLHFEPYCIGGCMRPFAVPTLNLGHDDDDIHRNPDVIKKLNIRETCCVAVCKRNRDRDHANLHRFPSNVSLLTKWCGNLQRPVPDGSKLFNDAICEVHFEERCLRNKRLEKWAVPTLSLGHENIPYPLPTPEQVTEFYARPTAPNNGEEQGECCVETCKRNPSVDDIKLYRPPEEASVLAKWAHNLQTESSQLTSMRICNLHFEAHCIGKRMRPWAIPTLNLAGNIENLYENPEHSMLYKRRTHIKTKQSASVKPTWVPRCCLSHCRKVRALHNVQLYRFPKLNRSTLAKWAHNLQVPMVGSAQRRLCSAHFEPHVLSKKCPVPLAVPTLDLNAPPGLKIYQNPAKLKASKLCLQRVCIVESCRKTRAQGVQLFRLPHSPTQLRKWMHNIKTRPRAAMRAQYRVCSRHFETHSFNGRRLSAGAIPTLELGHDDEDIYPNEAQAFADEHCVVEGCESSKEQPDVRLFRFPTEDDDMLWKWCNNLKMNPVDCTGVRICNKHFEADCIGPKHLYKWAIPTEELGHDDAEIELILNPNPEDRYVDPVFKCIVPTCGKTRRFDEVQMNSFPKDANLFERWKHNLRLEHLSFQERDRYKICNSHFEDICIGKTRLNIGSIPTLELGHDETDDLFQVNPAELQSNLFGRQRRIHDESGGIIIKQEFSESEDVKTDVATMSDAKDFNTRQVKLKKTMSDLKCCVRSCGRSRLEHGARLFPFPTGKQQHLKWRHNLRLEPDEVDRSTRICSAHFNRRCIDGKQLRSWAMPTQQLGHQEQPIYENPKNIPGFFTPTCALSHCRKRRSIDNDLRTYRYPRSEDLLEKWRANLRLAPDQCRGRICADHFEAQVRGKLKLKTGAVPTLNLGHDEGLIYDNEAIKVGMTEEEEGGSELPRLKTKRELIDEEEEELEAEEEQHDHDIFDDDEKDGHYFDPLELVETFAEHASDDEGEYCGDGEDERDEEEDLEEAEHFHPDAPPTPPTIPLRREKPANNVTPICCLKHCRKERTAFHLLSTFGFPKDRQLLLKWCSNLHLNPDDCIGRVCIEHFQPEVLGTRKLKQNAVPTLNVGHDEPLRYSCNGVDLDQEQLQPQHSVFRLWSLKHCRKRKLTEPPDIHQNKWRTVEVRKMQRLRMEMKIKQEVQTEREMKTKEKTPMKNHRESKLERCCISSCGNEDVNQLLPLPEEQNILKKWQHNLKLSLDTDFTEIRVCLKHFEEQVVENGKPLEQAVPTLMLDQNSWNIYRNIGSCIFPECRSSSSDHISFVNLPANVVIRDAWISHLNLPPSSEGLLCGDHFMQLFKRVEFPKIGSSQIRLYRFPTEEQALLRWLVNTQQQPRLVDPAELYVCQTHFEPDAICKKQLRCWAEPTLNLGHDGFVIPNAKHNGNIAGGQDTEEAMRLIRERFCSILTCFQAEASGIRLYEYPKDMPTIRKWAAACRHRSMQASSHGFKVCQSHFAPECFEPDTLNLIDGSVPTLELSRGDIERHCLVSGCEKDASGGRLRYYKVPKAAAQLNAWSNNLKISSVDLGLGEQLICERHFEPFCFGAHKGLRPGALPTLMLGHDEEVEMLPNPESLWQKKAEVCCATQCGRIWQPGDTKFSGFPKTLTLAKKWIHNLQLTVANDQLGGLKVCSAHFEASLFNKSGLISGSIPTLELGHSSQAIFQPDTQILGKSQKLERRAIISEVDCIYPECKELCKTVSFNLPQEENLRRAWLRHLNIEEPSSNDGQLCPLHYVILYELSIKSFPEHVSNRFLEENYYSARNNRRVKIVSCAVKGCEMIRPRDKVLLHGLPQRKDMLRMWVENGQLEITEPQQQYMLRVCRNHFESRCSFDDRRLHTWSVPTLNLPGNPVHQIPTKEEWQEMTVKLSQEADTIKLEIEEELEEEELHEEEEADSSLLEPIVRMEHIESDEEDSEMQALEVLLEVGHVERMDSYERVDKTYIEHAVYQSNSIRNQYNANHCAVEGCEVTVEDVDGTIKLHKFPASSEAARKWMHNTQVDMDEKFWWRYRICSYHFEQECFQSARIKKGAMPTLLLGPRRPEKVYENEFALQETEELILPEELQFEEHKKAKSEVIKLCLPTPAPPRKSKDMCLKWQHNTQVPFDPFHRWRYRICSAHFHPVCLLNMRLVHGSVPTLKLGSKAPTELFDNDFEAINLRLDKKLGADPSTVQIKEEDEDSMPTLEPELQLHEDQEAEDSAATQIPLDQTNWKGQLRLPVKQEKVTYNQVKSGYDKCSLGHCQRQRSKHGVHIYKFPKSRLQQERWMHNLRIRYDERRPWKFMICSVHFEPHCISLRKLRPWAVPTLELGDNVPEKIFTNEQCHELFTDRSEVESDADEEDGLQEDEDEEEEDEGECEENIGTEVRIKRERRSKLDPWPPGQVPPWKVKQCCLPYCRAFRGDGIKLFRLPNNRTSIRNWELATGMVFKESQRNTRLICSRHFEPELIGVRRLMRNAIPTRHLNPQASSEEGKRKQDPPLPIATCCMADCHHNGNVKLHKFPSDPALLRQWCQALRLTDTQRYRGKHICSVHLPTDRTVSCVICGVDNVQLPMLDFPEQRNQRAKWCYNLKIEAISKWDHSNHICCRHFESHCFLQPGELRPGAIPTLQLNHDDTNIFLSDFATGPTGNRIKDEPLDNDDMLLV*

Similar Transcription Factors

Sequence clustering based on sequence similarity using MMseqs2

100% Identity: iTF_00605601;
90% Identity: -
80% Identity: -