Basic Information

Insect: Drosophila bakoue
Gene Symbol: -
Assembly: GCA_008044335.1
Location: VNJL01015329.1:2709-16199[+]

Transcription Factor Domain

TF Family: THAP
Domain: THAP domain
PFAM: PF05485
TF Group: Zinc-Coordinating Group
Description: The THAP domain is a putative DNA-binding domain (DBD) and probably also binds a zinc ion. It features the conserved C2CH architecture (consensus sequence: Cys - 2-4 residues - Cys - 35-50 residues - Cys - 2 residues - His). Other universal features include the location of the domain at the N-termini of proteins, its size of about 90 residues, a C-terminal AVPTIF box and several other conserved residues. Orthologues of the human THAP domain have been identified in other vertebrates and probably worms and flies, but not in other eukaryotes or any prokaryotes [1].
Hmmscan Out: # of c-Evalue i-Evalue score bias hmm coord from hmm coord to ali coord from ali coord to env coord from env coord to acc

1 29 8 2.8e+04 -4.1 2.3 49 60 320 333 306 349 0.57

2 29 2.7e-15 9.5e-12 46.1 4.0 1 86 546 618 546 619 0.85

3 29 1e-14 3.6e-11 44.3 5.0 1 87 646 715 646 715 0.83

4 29 9.3e-16 3.3e-12 47.6 0.2 1 87 737 809 737 809 0.85

5 29 6.5e-16 2.3e-12 48.1 5.3 1 87 910 980 910 980 0.82

6 29 2.2e-15 7.7e-12 46.4 3.6 1 86 1004 1075 1004 1076 0.82

7 29 2.5e-13 8.8e-10 39.8 1.1 1 87 1111 1179 1111 1179 0.81

8 29 7.3e-11 2.5e-07 32.0 1.6 1 86 1221 1290 1221 1291 0.77

9 29 5.1e-17 1.8e-13 51.7 0.4 1 86 1318 1387 1318 1388 0.82

10 29 8e-13 2.8e-09 38.2 1.3 1 85 1409 1477 1409 1479 0.79

11 29 7.7e-15 2.7e-11 44.7 0.5 1 86 1506 1577 1506 1578 0.85

12 29 1.8e-12 6.3e-09 37.1 3.7 1 85 1655 1723 1655 1725 0.82

13 29 1.8e-12 6.2e-09 37.1 0.1 1 86 1748 1816 1748 1817 0.83

14 29 4.5e-13 1.6e-09 39.0 2.2 1 87 1965 2034 1965 2034 0.80

15 29 1.4e-12 5e-09 37.4 0.0 1 87 2129 2203 2129 2203 0.83

16 29 0.0067 24 6.4 0.1 1 61 2218 2270 2218 2285 0.71

17 29 1.9e-12 6.7e-09 37.0 0.2 1 87 2297 2368 2297 2368 0.79

18 29 1.6e-12 5.7e-09 37.2 0.3 1 87 2420 2490 2420 2490 0.81

19 29 6.8e-12 2.4e-08 35.2 0.1 1 86 2525 2599 2525 2600 0.80

20 29 1.2e-12 4.3e-09 37.6 0.0 1 86 2610 2683 2610 2684 0.81

21 29 3.2e-11 1.1e-07 33.1 0.0 1 86 2709 2782 2709 2783 0.69

22 29 4.3e-05 0.15 13.4 0.3 1 58 2812 2862 2812 2888 0.83

23 29 3.7e-11 1.3e-07 32.9 0.8 1 86 2902 2973 2902 2974 0.81

24 29 3.6e-16 1.3e-12 49.0 0.4 1 86 3086 3158 3086 3159 0.82

25 29 3.3e-12 1.2e-08 36.3 3.5 1 86 3222 3292 3222 3293 0.80

26 29 3e-14 1e-10 42.8 5.0 1 86 3385 3455 3385 3456 0.84

27 29 4.3e-12 1.5e-08 35.9 0.2 1 86 3535 3604 3535 3605 0.85

28 29 2.6e-10 9.1e-07 30.2 0.5 1 58 3630 3678 3630 3693 0.83

29 29 3.9e-10 1.4e-06 29.6 1.2 18 87 3696 3754 3685 3754 0.77

#	of	c-Evalue	i-Evalue	score	bias	hmm coord from	hmm coord to	ali coord from	ali coord to	env coord from	env coord to	acc
1	29	8	2.8e+04	-4.1	2.3	49	60	320	333	306	349	0.57
2	29	2.7e-15	9.5e-12	46.1	4.0	1	86	546	618	546	619	0.85
3	29	1e-14	3.6e-11	44.3	5.0	1	87	646	715	646	715	0.83
4	29	9.3e-16	3.3e-12	47.6	0.2	1	87	737	809	737	809	0.85
5	29	6.5e-16	2.3e-12	48.1	5.3	1	87	910	980	910	980	0.82
6	29	2.2e-15	7.7e-12	46.4	3.6	1	86	1004	1075	1004	1076	0.82
7	29	2.5e-13	8.8e-10	39.8	1.1	1	87	1111	1179	1111	1179	0.81
8	29	7.3e-11	2.5e-07	32.0	1.6	1	86	1221	1290	1221	1291	0.77
9	29	5.1e-17	1.8e-13	51.7	0.4	1	86	1318	1387	1318	1388	0.82
10	29	8e-13	2.8e-09	38.2	1.3	1	85	1409	1477	1409	1479	0.79
11	29	7.7e-15	2.7e-11	44.7	0.5	1	86	1506	1577	1506	1578	0.85
12	29	1.8e-12	6.3e-09	37.1	3.7	1	85	1655	1723	1655	1725	0.82
13	29	1.8e-12	6.2e-09	37.1	0.1	1	86	1748	1816	1748	1817	0.83
14	29	4.5e-13	1.6e-09	39.0	2.2	1	87	1965	2034	1965	2034	0.80
15	29	1.4e-12	5e-09	37.4	0.0	1	87	2129	2203	2129	2203	0.83
16	29	0.0067	24	6.4	0.1	1	61	2218	2270	2218	2285	0.71
17	29	1.9e-12	6.7e-09	37.0	0.2	1	87	2297	2368	2297	2368	0.79
18	29	1.6e-12	5.7e-09	37.2	0.3	1	87	2420	2490	2420	2490	0.81
19	29	6.8e-12	2.4e-08	35.2	0.1	1	86	2525	2599	2525	2600	0.80
20	29	1.2e-12	4.3e-09	37.6	0.0	1	86	2610	2683	2610	2684	0.81
21	29	3.2e-11	1.1e-07	33.1	0.0	1	86	2709	2782	2709	2783	0.69
22	29	4.3e-05	0.15	13.4	0.3	1	58	2812	2862	2812	2888	0.83
23	29	3.7e-11	1.3e-07	32.9	0.8	1	86	2902	2973	2902	2974	0.81
24	29	3.6e-16	1.3e-12	49.0	0.4	1	86	3086	3158	3086	3159	0.82
25	29	3.3e-12	1.2e-08	36.3	3.5	1	86	3222	3292	3222	3293	0.80
26	29	3e-14	1e-10	42.8	5.0	1	86	3385	3455	3385	3456	0.84
27	29	4.3e-12	1.5e-08	35.9	0.2	1	86	3535	3604	3535	3605	0.85
28	29	2.6e-10	9.1e-07	30.2	0.5	1	58	3630	3678	3630	3693	0.83
29	29	3.9e-10	1.4e-06	29.6	1.2	18	87	3696	3754	3685	3754	0.77

Sequence Information

Coding Sequence: ATGTCACAACACAACCCCAATCACGCCCACCCACACTACCACTACCCGTCCCATACGACGCCGCTggctctgcagcagcagcagcatcaggagcagcagcagcacggcaGTAGTTGGTACTCACATGTTGCTTCCTACCCAACAGCCTCCCACTCCCACCCCCTCTCTCACTCGGCCTTTGGCCCTGCGCCCCCTTGCAAGGCCAGCgtaagcaacaacaactcaaACAACATTATGGGTGGCTACGGAGCAGTGGGAGGGGGTGGAGGCTCGCATGGATATTTCGGCGCCGCTGGCGGTGGCCTCAATGTCAGCGGGGCGGGGGGTGGTGCTGGGTCGTCCTACGGCCTTGGGGCCAACACGGTGGCATATGCTCACAACCAACTGCTGCAATaccagcatcatcatcagcaaaacccgcagcagcagcagcagcacctgggCCTGGGCCAGCGATCCTATATGGGCCACGATGTCATGGCCGGGAGCTATCCCTATATCAAGAGCGAACCCCTGGAGGGGTTCCAGCAGCCGGCCAATCCAATGGCCCCACCCCCGGCCCCagaaatgataataaaatcGGAACCCATTGACGACATGGCCTACAAGTCAAACTACATAGACGACAATACGCCCTTCGCGGACTTCAGTAAGTTTAGCGAGTTCAGCGAAGACATGCTTAGTCCCAAAGTCGAGCTGACAGTCAAGGATGAATCCTTTGTCAGGAACCCCAATAACTTTTTATGCCGCAAGCAGCAATCGGATCTGACGACAGCGGAGAGCCTGCCCGTCTGCCAGCGCTGCAAGGAGGTGTTCTTCAAAAAGCAGACTTATCTGCGGCACGTCGCCGAGAGCAACTGCGGCATCCAGGAGTACGACTTTAAGTGCACCATATGCCCCATGTCCTTCATGACCGCCGAGGAACTACACCTGCATAAGCAGCAGCATCGAGCGGACAGGTTTTTTTGCCACAAGTACTGCGGAAAGCACTTCGGCACGATCACAGAGTGCGAGGCACACGAGTACATGCAGCACGAATACGAAAGCATTGTTTGCAACATGTGCTCGGGATCTTTCTCCACGCGGGAACAGCTGTATGCCCACTTGCCGCAGCACAAGTTCCAGCAGCGCTTCGACTGTCCCGTATGCCGCTTGTGGTATCAAACAGCTCTGGAGCTGCACGAGCACCGCCTGGCTGCACCCTACTTCTGCGGTAAATACTACGCGGGCGGACAGTCTCCGTCCCCGTCCgcccaacagcaacagcatcaaaACCAGACGAACTACAAGCTGCAGGACTGTCATATGGCCACCATGGAAATGCCAAGCGTACCGCTTCTTAAGGCGAACCCATCCAACTCGCCTGCCTTGCCCGCGACTGCAGCGCTCAATTCACTGCTGCAACAGCGTCAGGCCAATGCCGATGGAGCGGCCATTTTTGCCGCATCTTCGCTGAAGAACGAGGTCTCCGTGAAGCTGGAGCGCAGCTACAGTAACTCGACGAATGAGTCCTCCTATAGCGTCCAGGAGAGCAGCTACAATAATGTGTAtggcagcagcgacagctcTTCACACGTTGCCATCGCCGGACCACAGGCTCACTCTTCGACGCTGGACGACTCCGAAGATGCGCTGTGCTGCGTGCCACTGTGTGGGGTGCGGAAGAGCACGAGTCCCACCTTGCAGTTTTTCACGTTCCCGAAGGACGAGAAGTATCTCAACCAGTGGCTGCATAACCTCAAGATGTTCCACATACCCGCGTCCAGCTACGTTAGTTTCCGTATCTGCAGCATGCACTTCCCCAAGCGGTGCATCAACCGCTACTCGCTGTGCTACTGGGCGGTGCCGACGTTCAACCTCGGACACGACGACGTAGCCAATCTCTACCAAAACCGAGAGCTGACCAACACATTTACCACCGGCGAAGTGGCGCGGTGTAGCATGCCGCACTGCACCAGCCAGCGGGGTGAGAGCAACCTCAAGTTTTACAACTTTCCCAAGGACATCAAAAGCCTGATTAAGTGGTGCCAAAACGCCCGCCTCCCAGTGCAGGCGAAGGAGCCGCGACATTTCTGCAGCCGCCACTTTGAGGAACGCTGCATTGGCAAGTTCCGACTGAAGCCTTGGGCGGTGCCCACCCTGCACCTGGGCGCCCAGTACGGCAAGATCCACGACAATCCGAAGAATCTGTATGTGGAAGAGAAGCGCTGCTGCCTCAACTTTTGCCGTCGGAGCCGCTCCTCTGATTTCAATATGTCGCTATATCGATTTCCCAGAGACGAAGTCCTGCTTCGTCGATGGTGCTACAACCTTCGCCTCGATCCGGGAGTGTACCGCGGAAAGAATCACAAAATATGCAGCGCCCACTTCATAAAGGAGGCGTTGGGTCTCCGTAAACTATCTCCGGGTGCCGTGCCCACACTTCATCTGGGCCACAATGATACCTTCAACATCTACGAGAACGAACTGTGGCCACCGCCAACACCGACACCCTCCTCTTGTCAccttcaacagcagcagcagcagcagcagccatcgcTGCATTCGCTGCAACAGCAGATGCACAGCAAGTCCTACCAGCGCCGTTCGGTGGCATCCACTTCATCGTCGGCGAGCTCGGCAGCCTCGCATTACGTAGACCCGGAGATGAGCGCCTCTTAccatctagccatgtccgcctCCGCCGGTGGCTCGGCGACGATCAACGCCAGCGACAGCATGGACGTCTGTTGCGTGCCAAGTTGCGAGAGCAAGCGACACAATAGCGAGAACATTACATTCCACACGATTCCGCGACGGCCCGAGCAGATGCGCAAGTGGTGTCACAACCTTAAGATTGCCGAGGACAAGATGCACAAGGGCATGCGAATCTGTAGCCTGCACTTCGAGCCCTACTGCATCGGCGGCTGTATGCGACCGTTTGCAGTGCCCACCCTTCACTTGggccacgacgacgacgatatTCACCGCAATCCGGACGTGATCAAAAAACTGAACATCCGGGAAACGTGCTGCGTGGCTGTGTGCAAGCGGAATAGGGACAGGGACCACGCCAACCTGCATCGTTTCCCCAGCAACGTGGCGTTACTGAAAAAGTGGTGCGCCAATTTACAGCGCAGCGTTCCCGATGGCAGCAAACTCTTCAATGATGCCATCTGTGAGGTGCACTTTGAGGATCGCTGCCTGCGCAACAAGAGACTGGAGAAGTGGGCAGTGCCCACTTTGATCCTGGGGCACGAGGACATTCCCTATCCGCTGCCCACGCCGGAGCAAGTGACCGAGTTCTATGCCCGCCCCTCGGCTCCCAACAATGGAGAGGAACAGGGCGAGTGCTGTGTGGAGACCTGCAAGAGGAATCCCAGCGTCGACGATATAAAGCTGTACCGCCCTCCGGAGGACGCTGCTGTGCTGGCCAAGTGGGCGCACAACCTGCAAACGGAGGCCAACCAACTGACAAGCATGAGGATCTGCAACCTTCACTTCGAGGCGCATTGCATCGGCAAGAGGATGCGGCAGTGGGCCATACCGACTTTGAATCTAGCCGGCAACATCGAAAATCTTTACGAGAATCCAGAGCAATCGTTGCTCTACAGGCGACGCACGACCCACTTGAAGATGAAGCTGCCGCCAACCTCCGTGAAACCCACCTGGGTGCCCAGGTGCTGTCTTCCACATTGTCGCAAGGTCAGAGCCCTGCACAATGTCCAGCTATATCGCTTCCCCAAGCTCAATCGGTCCACATTGGCCAAGTGGGCTCATAATCTCCAGGTTCCAATGGTGGGCAGTGCCCAGCGCAGGCTTTGCTCGGCCCATTTCGAGCCTCATGTACTCAGTAAAAAGTGTCCGGTGCCGCTGGCGGTGCCTACGATCGACCTAAATTCACCGCCCGGCTTGAAAATCTACCAGAATCCGGCCAAGCTGAAGGCCAGCAAACTATGCCTGCAGCGGGTTTGCATCGTCGAGAGCTGCCGCAAGACGCGGGCGCAAGGCGTGCAGCTTTTCCGGCTGCCGCACAGCCCCACGCAGCTACGGAAGTGGATGCATAACATAAGGACGCGGCCACGAGCAGCTATGCGGGCTCAGTACCGGGTCTGTTCCCGCCACTTTGAGACGCATTCATTCAATGGCCGAAGACTAAGTGCAGGTGCCATTCCGACGCTAGAACTGGGCCACGATGGCGACGATATCTATCCGAATGAAGCGCAGGCATTTGTGGACGAGCATTGTGCTGTCGAGGGCTGCGAGGCATCCAAGGAGCAGCCGGAGGTGCGGCTGTTCCGCTTCCCCACCGACGACGATGATATGTTGTGGAAGTGGTGCAATAACCTGAAAATGAATCCTGTGGACTGCATTGGGGTACGCATCTGCAACAAGCACTTTGAGGACGATTGCATCGGTCCCAAGCACCTGTACAAGTGGGCCATTCCCACAGAGGAGCTGGGCCACGACGACGCGCAGATCGAGCTGATCCCGAACCCTAAGCCAGAGGAGAGGTATGTGGATCCCGTCTTCAAGTGCATCGTTCCCACTTGCGGCAAGACTCGACGGTTCGACGAGGTGCAAATGAACAGCTTTCCCAAGGACCCGGATCTTTTTCAGCGATGGCGGCACAACCTGCGCCTGGAACACCTCAGTTTCCAGGAGCGTGAGCGCTACAAGATCTGCAATGCTCACTTCGAGGAGATCTGTATTGGGAAGACACGGCTAAACATCGGCTCCGTTCCAACCTTGGAACTTGGTCATGACGATGAGAATGATATCTTCCAAGTAAATCCAGCGGAGCTGCAGAGCAATTTATTCGGGCGACAGCGTCGACTGCTGCTCGAGAAGTCCGGCGAGCTGAGTGTGAAGCAAGAGCTGTCAGAGACGGAGGACAACAACCAAGCGGATGATGCGGGTGTGACGGCCACAGGCTCCAATTCCAAGCAGGTCAAGTTCAAGAGATCTACTTCGGATCTAAAGTGTTGTGTGCACAGTTGTGGAAGAAGTCGCTTGGAGCACGGGGCACGGCTGTTCCCCTTCCCTACCggcaagcagcagcacctaAAGTGGCGTCACAACCTGCACCTGGAACCAGAGGAGGTGGACCGGTCGACCCGCGTTTGCAGCGCCCACTTTAATCGCCGTTGCATCGAGGGCAAACAACTAAGGAGCTGGGCGATGCCCACCCAACAGTTGGGTCACAACGATCAACCGATCTACGAGAACCCAAAGAACATACCGGGATTCTTCACACCCACCTGTGCCCTAGGACATTGCCGCAAGCGAAGGAGTATTGACAACGATCTGCGCACTTATCGGTATCCCAGGAGCGAGGACCTTTTGGAAAAATGGCGAGCTAATCTACGGTTGGCTCCGGATCAGTGTCGTGGTCGGATCTGTGCCAATCACTTCGAACCGCAGGTGCGAGGAAAGCTAAAGTTGAAGACGGGAGCGGTTCCCACACTACAACTGGGACACGATGAGGGATTAATCTATGACAATGAAGCTATTAAGGCTGGCATGGCCGAAGAAGAGGAGGGCATAACCACAGAGTTCCCgagactgaaactgaaaaaagaGGTGTTCAATgaagaggatgaggaggagcgCGAAGGTAATGATAACGAGCATCAGAACCCCGATGACCTGGATGATAATGCAGATGAAGAAGACAAAGATGATGAGTATTTCGATCCCCTTGAGCTGGTCGAGACTTTTGCTGAACATCGCAGCGATGACGAAGCTCAAGACTATGAGGCTGAAGAAGACGAGGCTCGTATTGAGGACGCTCCCTCCGGGTACGATGTTAATGAGGAGATAGCAAAGCTTCGAAGCTCCCCACCTTCCCCTCTTCCTCGACGGCACCAAGCTCCGCGTCGTGACAAGCCGGCCAACAATGTAACGCCCATTTGCTGCCTCAAGCACTGCCGAAAAGAACGCACTGCCTTCCACCTGCTGAGCACTTTCGGCTTCCCAAAGGATCGCCAGTTGCTGCTAAAATGGTGTGTCAATTTGCACCTAAACCCGGACGACTGTATCGGTAGGGTTTGCATCGAGCACTTCCAGCCGGAGGTACTCGGCACCCGTAAGCTCAAGCAGAATGCGGTGCCCACTCTTAATGTGGGACATGAGGAACCGCTTAGGTACTCGTGCCATGGTATGGACCTGAATCTCGAGGAGCGGGACCCCCAGCCACAGCATTCGGTTTTTCGGCTTTGGAGCCTGAAACACTGTCGGAAAAGGAAGCTAACGGAGCCACCGGATATTCCCCTAGCCAAGAGGAGATCAATGGAGATGCCGATAATGAAGCGAGagtgggagatggagatggagatgcaAACGCAGATGGAGAGGAAGAAAGAGGCAAAGAGAATGACTCAAACTGAAAGTGAACCTCATATATGCTGTATAAGCAGTTGCGGAAGCAAGGAAGTTGGTCAATTGCTGCCTTTTCCCGAGGAGAAGACCCTGCTAAGAAAGTGGAGCCATAATTTAAGGCTGCCGCCTGAGACTGACAGCACTGCTCTAAGCCTGAAACGAGTTTGCTTGGCTCACTTCGAATCACAGCTGTTAGAGAATGGCAAGCTCTCGAGGcaagcagaggcagaggctgTGCCCACCTTGAACCTGGGTCACAGCAGCTGGAACCTATACAGGACCAATGGGATCTGCCTAGTGCCTGACTGCAACTACAATACCTTCGGACGCATGAGCTTCATCGATCTACCGGATAATAGTATAATTAGGGACGCTTGCTTTTCCTGCCTCAACCTACCTGAACCCGGCGAGGAGCAGGCAAGCCTATGTCGTATCCACTTTATGGAGGCATACAAGAAGTTTGACCTTCCTAACGTTCTGCACCCTCAAGTCATAATGGCGGTACAAAGTGCTGTGGACGAACTACAATGCGCGGTGCCCGGCTGCTGTTTCGAAGATGCTGATAAGGATTTTCACCTAATCCAGCTTCCCAATAACAAGGAGGTGCTGTCGAAGTGGCTGCGCAACACCAAGGTTTCATATGATCCTTCAAGGCACCAAAGCTATCGCATTTGCACGCTCCACTTTGAATCAAAGTACTTGGATTCGAATGGCCCGCTAAAAGGGGCTATACCGACGCTCCATCTAAACCATGAAGATGAGATTCTCTTGAATACTAGATCTTTGCCAGAGGAGCAGGACTCTATGTTGAGTCCACTGCGGATAAAGACGGACCCAGCGTTCCTGGGCAGTCCCTGTGCAAGTGCAAGCCCCAGTCCCCGGGGCAGGATTCGAATATGCTGCATTCCCACATGTGGACAGTTTGGAAGCAGTCAAGTGAGGCTGTTTCGTTTTCCCACCGAGGAGCAGGCTTTGCTTCGGTGGCTGGTGAATACACAACAGCAGCCAAGACTGGTAGATCCCATGGACTTGTATGTGTGCCAGTTGCATTTTGAGCCCGAGGCTATTTGCCTGAAGCAACTTCGAAGCTGGGCTGAGCCCACCTTAAACCTGGGACACGACGGATATGTAATCCCAAATGCCAAACACAATGGAAATATTTCCGACAGCCAAGATACAGAGCAAGCCATGAGGTTTATTCGCGAACGCTTCTGCTCCGTCATTTCCTGCTTTCAAGCAGGAggacaggaggaggagggagtgAGACTATTTGATTATCCCGAGGACATGGCGACCACTCGTAAGTGGGCAGCGGCATGCAGACATCGGTCCATGCAGGCCAGGAGCCATGGGTTCAAGGTGTGCCAGTTTCACTTCGCTAAGGAATGCTTTGACCCCAACACTGGAGAATTGATTGAGGGTGCTGTCCCCACCCTGGAGTTGAGCAGAGATGAAATGGAGAGGCAATGTCTTGTGGCTGGATGTGTAAAAAATGATGCCAATGGAGCCCGTCTCCGCTACTTTAAGATACCAAAAGTTGCTGCTCAATTGGAAGCGTGGAGCAACAACCTTAAAGTCCATCCAACGGATCTCATGCAGGGTGAGCAGCAGTACATCTGCGAGAAACACTTTGAACCTTTCTGCTTTGGGGCCAACAAGGGCCTGCGTTCTGGTGCTCTTCCAACCCTCCTGCTGGGTCATGATGAGGGGGTGGATATGCTTCCGAATCCGGAAAGCCTCTTCTGCCAAAATAAGACGGATAAGTGCTGCGTACCAGGCTGCGGGCGTGTTTGGCAGAATGGGGACCGTAAGTTTCGTGGATTTCCCAAATTGTTGGCCATGGCCAAAAAATGGCAGCATAACCTTCGTTTGGAACCGCCCGTGGAGCAACTCGGCAAGCTGAAGGTCTGCAATGCTCATTTTGATACCACATCACCCAACATGGGTACAAATGGACTAAGCTCTAGTGCCTCGATACCAACATTGGAATTGGGTCATTCTTCTCCGGATATTTACCCAGCGGACTTGAACTTAAAGTTCCAAAAGCGGTCAGGAATACCGgcaaaaatttattgttgttatccCAAGTGCGAGGAAACCTGTTTGCCCAAAAACCATTCCTACGGGCTTCCCCAGGAGGAGCATCTGAGGAATGCCTGGCTAAACCATATGGATATAGAAAATCCGAAAGACGAAGGAGTCGTACTGCTTTGCCCGCTGCACTATGTCATCCTCTACCAGTACAGTGCCACACACTACCCGGAGCATCATGCTTTAAGTCGTATTCGTCTTGATGACAATTACAAGGAAGCGCGGAACAACAGGCGCGTGAAGATTGTTAGTTGCACGATAAAGGGCTGCGACATGGTTAAACCCCGGGATGGAGTACCACTGCACGGCATGCCGCAAAGCAAAGAAATCCTGCAGATGTGGATAGACAATGGCCAGTTTGATTTCTTAGAGCAACAGCGGTATATGTTCAAGGTGTGTCACAATCATTTTGAGCCATGCTGCTTCTTTGACGACAGACGTTTGCATTCATGGAGCGTGCCCACTTTGAGTCTACCTGGCGAAGTAGTTCACCAAAATCCAACCGCCGAACAATGGCAGAACATGATCAACaagcaagcagcagcaaaaacatgCGCAGAAGATCAGGAGGAGCCCGATCTATATGGGGATGTGGTTAAAAACGAACCAATTTTAAAGATGGAGCATATCGAATCCGAATATGAGGATGAAACCCCAGAGATGCAGGCCCTTGAGGTCCTCCTAGAAGTTGGCCATGTCGAGCGAATGGAGAGCTATGAGAAAGTGGATAAATCGCCGCTGATCTATACCGATAATGCACCCTTCCGATCATCACCCATACGTTGCCAATACAATGCTAATCACTGTGCCGTAGATGGATGTCAGGTGACTGCCGAGGATGTGGACGGCACGATCAAGCTGCACAAATTCCCTGCGTCACAAGAAGCCACACAAAAGTGGATGCACAACACCCAAGTTGATATGGACGAAAAGTTCTGGTGGCGTTACCGCATATGCAGTTACCACTTCGATCAAGAGTGCTTTCAGAGTGCTAGGATTCGAAAGGGAGCGATGCCCACGCTTTTATTAGGACCTCGGCGACCGGACAAGGTGTACGATAATGAGTTTTCACTACCAGAGGGGGAAGAGCCTTTTCTAGAGTCACCGGACACTCAGCTGGAGGAAGATACGACTGTAGTATCAAGAGTTCGAAAGGAGGTGTCCAATTTATGCCTGCCCCCAAAGGCGCCGCCTCGAAAGTCAAGCAAGTTTTGCCAGATTGATTCCTGCACGAACCACTTAACCACTGAGAATATGACACTTCACAAGTTTCCCCACTCAGAGGACATGTGCCTCAAATGGCAGCACAACACGCAAGTGCCATTTGACCCCTACTACCGTTGGCGTTACCGCATCTGCAGTGCGCATTTCCATCCGGTGTGTTTGGTCAACATGCGTCTAGTCCACGGAAGCGTTCCCACTTTAAAGCTGGGTCCCAAGGCTCCTTCAGAGCTGTTTGACAACGATTTCGAAGCCATTAACCTAAGGTTGGATAAAAGGTTGACAGAGTCCAATGCTAATGTGTATATCAAGCATGAAAGAagggaggaggatgaggactCGATGACGTTCCCCGAGACCGAGCTTCAGGTACACGAGGATCAAGACGATAAAATATCAAGCTGGAACAGCAAACTGCAATTACCACCTGTGAAGCAagagaaaattatatacaGCCAAATCAAGTCTGGCTATGATAAGTGTTCGCTGGCTCACTGCCAGCGGCAAAGGTCCCAGCATGGCGTCCACATTTATAAGTTTCCTAGATCGAAGCATCAACAGGAGCGTTGGATGCACAACCTACGTATCCGTtatgatgagcggacaccgTGGAAATTCATGATCTGCAGCGTGCATTTCGAACCACACTGCGTCAGCCTAAGGAAACTGCGACCTTGGGCGGTTCCCACACTGGAACTGGGCGACAATGTGCCAGAGACAATCTTTACCAACGAACAGTgcgaggaggagctggtgaCCGATCGCAGTGAGCTTGATAGCGACGCGAACGAAGAGGACGGTTTACaggaggacgacgatgatgacgacgaaGACGATGTTAAGCCGGATGTTATTGGCATAAAAAGGAGGAGGCGTTTCAAGATAGATTCCGGCTGTCCTAACCAGATTCCACCTTGGAAAGTCAAACAATGCTGCCTCCCCTATTGTCGTGCCTTCCGAGGCGATGGCATCAAGCTATTTCGGCTTCCGAACAACCGAAACTCCATTAGCAACTGGGAAAGGGCCACCGGAATGGTATTTAAGGAGTCTCAACGGAACACTCGTCTGATATGCAGCCGTCACTTCGAGCCAGAGCTAATTGGAGTCAGGCGTCTAATGCGTAACGCTATTCCCACGAAGCACTTGAACCCTCAATCAGTTGACCAGATCCGTACTAAGAAGGAAAAGAATCCTCCTGCCACTATTCTACCCATATGCTGCATGGCTGACTGCCACTACAACGGAAATGTGAAGCTGCACAAGTTTCCAAGTGATCCCACTCTTCTTAGACAGTGGTGCCAGGCTCTCCGGCTCACTGATACACAGCGGTATTTGGGCAAACACATTTGCTCCATGCACCTGCCAATGAACAAGACGCTGAGCTGTGTCATTTGCGGTGGGGACAACGTAGAGTTGCCGATGCTAGGGTTTCCGGAAAACCGCAACCAGCGCGCCAAATGGTGTTACAATCTCAAAATTGAGACAATACCAAAGTGGGACCACTCAAAGCACATTTGCTGCAGGCACTTTGAGCCCCATTGCTTTGACACCCCGGGTGAGCTGCGTCCAGGAGCGGCTCCCACGCTCCATCTTAATCACGACGACACAAACATATTCTTCAGCGACTATGCCACTGGTCTTCCGTCCTCGCCACTAGGCAATCAAATTAAAGACGAGCCCCTGGAATCGGAGTCCGACGAGACGCTGCTGGTGTAG
Protein Sequence: MSQHNPNHAHPHYHYPSHTTPLALQQQQHQEQQQHGSSWYSHVASYPTASHSHPLSHSAFGPAPPCKASVSNNNSNNIMGGYGAVGGGGGSHGYFGAAGGGLNVSGAGGGAGSSYGLGANTVAYAHNQLLQYQHHHQQNPQQQQQHLGLGQRSYMGHDVMAGSYPYIKSEPLEGFQQPANPMAPPPAPEMIIKSEPIDDMAYKSNYIDDNTPFADFSKFSEFSEDMLSPKVELTVKDESFVRNPNNFLCRKQQSDLTTAESLPVCQRCKEVFFKKQTYLRHVAESNCGIQEYDFKCTICPMSFMTAEELHLHKQQHRADRFFCHKYCGKHFGTITECEAHEYMQHEYESIVCNMCSGSFSTREQLYAHLPQHKFQQRFDCPVCRLWYQTALELHEHRLAAPYFCGKYYAGGQSPSPSAQQQQHQNQTNYKLQDCHMATMEMPSVPLLKANPSNSPALPATAALNSLLQQRQANADGAAIFAASSLKNEVSVKLERSYSNSTNESSYSVQESSYNNVYGSSDSSSHVAIAGPQAHSSTLDDSEDALCCVPLCGVRKSTSPTLQFFTFPKDEKYLNQWLHNLKMFHIPASSYVSFRICSMHFPKRCINRYSLCYWAVPTFNLGHDDVANLYQNRELTNTFTTGEVARCSMPHCTSQRGESNLKFYNFPKDIKSLIKWCQNARLPVQAKEPRHFCSRHFEERCIGKFRLKPWAVPTLHLGAQYGKIHDNPKNLYVEEKRCCLNFCRRSRSSDFNMSLYRFPRDEVLLRRWCYNLRLDPGVYRGKNHKICSAHFIKEALGLRKLSPGAVPTLHLGHNDTFNIYENELWPPPTPTPSSCHLQQQQQQQQPSLHSLQQQMHSKSYQRRSVASTSSSASSAASHYVDPEMSASYHLAMSASAGGSATINASDSMDVCCVPSCESKRHNSENITFHTIPRRPEQMRKWCHNLKIAEDKMHKGMRICSLHFEPYCIGGCMRPFAVPTLHLGHDDDDIHRNPDVIKKLNIRETCCVAVCKRNRDRDHANLHRFPSNVALLKKWCANLQRSVPDGSKLFNDAICEVHFEDRCLRNKRLEKWAVPTLILGHEDIPYPLPTPEQVTEFYARPSAPNNGEEQGECCVETCKRNPSVDDIKLYRPPEDAAVLAKWAHNLQTEANQLTSMRICNLHFEAHCIGKRMRQWAIPTLNLAGNIENLYENPEQSLLYRRRTTHLKMKLPPTSVKPTWVPRCCLPHCRKVRALHNVQLYRFPKLNRSTLAKWAHNLQVPMVGSAQRRLCSAHFEPHVLSKKCPVPLAVPTIDLNSPPGLKIYQNPAKLKASKLCLQRVCIVESCRKTRAQGVQLFRLPHSPTQLRKWMHNIRTRPRAAMRAQYRVCSRHFETHSFNGRRLSAGAIPTLELGHDGDDIYPNEAQAFVDEHCAVEGCEASKEQPEVRLFRFPTDDDDMLWKWCNNLKMNPVDCIGVRICNKHFEDDCIGPKHLYKWAIPTEELGHDDAQIELIPNPKPEERYVDPVFKCIVPTCGKTRRFDEVQMNSFPKDPDLFQRWRHNLRLEHLSFQERERYKICNAHFEEICIGKTRLNIGSVPTLELGHDDENDIFQVNPAELQSNLFGRQRRLLLEKSGELSVKQELSETEDNNQADDAGVTATGSNSKQVKFKRSTSDLKCCVHSCGRSRLEHGARLFPFPTGKQQHLKWRHNLHLEPEEVDRSTRVCSAHFNRRCIEGKQLRSWAMPTQQLGHNDQPIYENPKNIPGFFTPTCALGHCRKRRSIDNDLRTYRYPRSEDLLEKWRANLRLAPDQCRGRICANHFEPQVRGKLKLKTGAVPTLQLGHDEGLIYDNEAIKAGMAEEEEGITTEFPRLKLKKEVFNEEDEEEREGNDNEHQNPDDLDDNADEEDKDDEYFDPLELVETFAEHRSDDEAQDYEAEEDEARIEDAPSGYDVNEEIAKLRSSPPSPLPRRHQAPRRDKPANNVTPICCLKHCRKERTAFHLLSTFGFPKDRQLLLKWCVNLHLNPDDCIGRVCIEHFQPEVLGTRKLKQNAVPTLNVGHEEPLRYSCHGMDLNLEERDPQPQHSVFRLWSLKHCRKRKLTEPPDIPLAKRRSMEMPIMKREWEMEMEMQTQMERKKEAKRMTQTESEPHICCISSCGSKEVGQLLPFPEEKTLLRKWSHNLRLPPETDSTALSLKRVCLAHFESQLLENGKLSRQAEAEAVPTLNLGHSSWNLYRTNGICLVPDCNYNTFGRMSFIDLPDNSIIRDACFSCLNLPEPGEEQASLCRIHFMEAYKKFDLPNVLHPQVIMAVQSAVDELQCAVPGCCFEDADKDFHLIQLPNNKEVLSKWLRNTKVSYDPSRHQSYRICTLHFESKYLDSNGPLKGAIPTLHLNHEDEILLNTRSLPEEQDSMLSPLRIKTDPAFLGSPCASASPSPRGRIRICCIPTCGQFGSSQVRLFRFPTEEQALLRWLVNTQQQPRLVDPMDLYVCQLHFEPEAICLKQLRSWAEPTLNLGHDGYVIPNAKHNGNISDSQDTEQAMRFIRERFCSVISCFQAGGQEEEGVRLFDYPEDMATTRKWAAACRHRSMQARSHGFKVCQFHFAKECFDPNTGELIEGAVPTLELSRDEMERQCLVAGCVKNDANGARLRYFKIPKVAAQLEAWSNNLKVHPTDLMQGEQQYICEKHFEPFCFGANKGLRSGALPTLLLGHDEGVDMLPNPESLFCQNKTDKCCVPGCGRVWQNGDRKFRGFPKLLAMAKKWQHNLRLEPPVEQLGKLKVCNAHFDTTSPNMGTNGLSSSASIPTLELGHSSPDIYPADLNLKFQKRSGIPAKIYCCYPKCEETCLPKNHSYGLPQEEHLRNAWLNHMDIENPKDEGVVLLCPLHYVILYQYSATHYPEHHALSRIRLDDNYKEARNNRRVKIVSCTIKGCDMVKPRDGVPLHGMPQSKEILQMWIDNGQFDFLEQQRYMFKVCHNHFEPCCFFDDRRLHSWSVPTLSLPGEVVHQNPTAEQWQNMINKQAAAKTCAEDQEEPDLYGDVVKNEPILKMEHIESEYEDETPEMQALEVLLEVGHVERMESYEKVDKSPLIYTDNAPFRSSPIRCQYNANHCAVDGCQVTAEDVDGTIKLHKFPASQEATQKWMHNTQVDMDEKFWWRYRICSYHFDQECFQSARIRKGAMPTLLLGPRRPDKVYDNEFSLPEGEEPFLESPDTQLEEDTTVVSRVRKEVSNLCLPPKAPPRKSSKFCQIDSCTNHLTTENMTLHKFPHSEDMCLKWQHNTQVPFDPYYRWRYRICSAHFHPVCLVNMRLVHGSVPTLKLGPKAPSELFDNDFEAINLRLDKRLTESNANVYIKHERREEDEDSMTFPETELQVHEDQDDKISSWNSKLQLPPVKQEKIIYSQIKSGYDKCSLAHCQRQRSQHGVHIYKFPRSKHQQERWMHNLRIRYDERTPWKFMICSVHFEPHCVSLRKLRPWAVPTLELGDNVPETIFTNEQCEEELVTDRSELDSDANEEDGLQEDDDDDDEDDVKPDVIGIKRRRRFKIDSGCPNQIPPWKVKQCCLPYCRAFRGDGIKLFRLPNNRNSISNWERATGMVFKESQRNTRLICSRHFEPELIGVRRLMRNAIPTKHLNPQSVDQIRTKKEKNPPATILPICCMADCHYNGNVKLHKFPSDPTLLRQWCQALRLTDTQRYLGKHICSMHLPMNKTLSCVICGGDNVELPMLGFPENRNQRAKWCYNLKIETIPKWDHSKHICCRHFEPHCFDTPGELRPGAAPTLHLNHDDTNIFFSDYATGLPSSPLGNQIKDEPLESESDETLLV

Similar Transcription Factors

Sequence clustering based on sequence similarity using MMseqs2

100% Identity: iTF_00525910;
90% Identity: iTF_00490113;
80% Identity: -