Basic Information

Insect: Drosophila vallismaia
Gene Symbol: -
Assembly: GCA_035047325.1
Location: JAWNPU010000090.1:9180423-9193350[-]

Transcription Factor Domain

TF Family: THAP
Domain: THAP domain
PFAM: PF05485
TF Group: Zinc-Coordinating Group
Description: The THAP domain is a putative DNA-binding domain (DBD) and probably also binds a zinc ion. It features the conserved C2CH architecture (consensus sequence: Cys - 2-4 residues - Cys - 35-50 residues - Cys - 2 residues - His). Other universal features include the location of the domain at the N-termini of proteins, its size of about 90 residues, a C-terminal AVPTIF box and several other conserved residues. Orthologues of the human THAP domain have been identified in other vertebrates and probably worms and flies, but not in other eukaryotes or any prokaryotes [1].
Hmmscan Out: # of c-Evalue i-Evalue score bias hmm coord from hmm coord to ali coord from ali coord to env coord from env coord to acc

1 29 7.5 1.9e+04 -3.3 4.3 38 62 337 364 329 380 0.58

2 29 2.2e-15 5.6e-12 46.4 4.4 1 86 573 645 573 646 0.86

3 29 1e-14 2.6e-11 44.3 5.0 1 87 673 742 673 742 0.83

4 29 9.2e-16 2.3e-12 47.6 0.2 1 87 764 836 764 836 0.85

5 29 3e-16 7.5e-13 49.2 6.3 1 87 934 1004 934 1004 0.82

6 29 5.2e-15 1.3e-11 45.2 3.2 1 86 1028 1099 1028 1100 0.82

7 29 9.5e-13 2.4e-09 38.0 1.2 1 87 1135 1203 1135 1203 0.81

8 29 3.2e-11 8.1e-08 33.1 2.5 1 86 1243 1312 1243 1313 0.77

9 29 2e-17 5e-14 53.0 0.3 1 86 1340 1409 1340 1410 0.82

10 29 8.4e-13 2.1e-09 38.2 1.5 1 85 1431 1499 1431 1501 0.79

11 29 7e-14 1.8e-10 41.6 0.7 1 86 1528 1599 1528 1600 0.84

12 29 3e-14 7.4e-11 42.8 2.0 1 86 1680 1749 1680 1750 0.83

13 29 2.4e-12 6.1e-09 36.7 0.1 1 86 1773 1841 1773 1842 0.82

14 29 3.4e-13 8.5e-10 39.4 1.3 1 87 1974 2043 1974 2043 0.80

15 29 3.1e-08 7.9e-05 23.5 0.0 1 86 2137 2202 2137 2203 0.79

16 29 7.1e-05 0.18 12.7 0.0 1 58 2218 2265 2218 2281 0.80

17 29 3e-12 7.6e-09 36.4 0.1 1 87 2295 2367 2295 2367 0.79

18 29 2.5e-14 6.2e-11 43.1 0.2 1 87 2427 2497 2427 2497 0.82

19 29 1.8e-10 4.5e-07 30.7 0.0 1 86 2532 2603 2532 2604 0.79

20 29 3.5e-11 8.8e-08 33.0 0.0 1 87 2612 2684 2612 2684 0.76

21 29 2e-13 5.1e-10 40.1 0.0 1 85 2708 2778 2708 2780 0.81

22 29 3.7e-08 9.3e-05 23.3 0.3 1 58 2808 2855 2808 2875 0.83

23 29 1.5e-12 3.8e-09 37.3 0.1 1 87 2893 2965 2893 2965 0.81

24 29 2e-15 5.1e-12 46.6 0.1 1 86 3072 3144 3072 3145 0.81

25 29 1.3e-12 3.3e-09 37.5 3.7 1 86 3208 3278 3208 3279 0.82

26 29 6.3e-14 1.6e-10 41.8 3.4 1 86 3349 3419 3349 3420 0.85

27 29 2.2e-11 5.6e-08 33.6 0.1 1 86 3503 3572 3503 3573 0.84

28 29 1.9e-10 4.8e-07 30.6 0.6 1 58 3601 3649 3601 3665 0.85

29 29 7.7e-09 1.9e-05 25.5 1.6 18 86 3667 3724 3655 3725 0.74

#	of	c-Evalue	i-Evalue	score	bias	hmm coord from	hmm coord to	ali coord from	ali coord to	env coord from	env coord to	acc
1	29	7.5	1.9e+04	-3.3	4.3	38	62	337	364	329	380	0.58
2	29	2.2e-15	5.6e-12	46.4	4.4	1	86	573	645	573	646	0.86
3	29	1e-14	2.6e-11	44.3	5.0	1	87	673	742	673	742	0.83
4	29	9.2e-16	2.3e-12	47.6	0.2	1	87	764	836	764	836	0.85
5	29	3e-16	7.5e-13	49.2	6.3	1	87	934	1004	934	1004	0.82
6	29	5.2e-15	1.3e-11	45.2	3.2	1	86	1028	1099	1028	1100	0.82
7	29	9.5e-13	2.4e-09	38.0	1.2	1	87	1135	1203	1135	1203	0.81
8	29	3.2e-11	8.1e-08	33.1	2.5	1	86	1243	1312	1243	1313	0.77
9	29	2e-17	5e-14	53.0	0.3	1	86	1340	1409	1340	1410	0.82
10	29	8.4e-13	2.1e-09	38.2	1.5	1	85	1431	1499	1431	1501	0.79
11	29	7e-14	1.8e-10	41.6	0.7	1	86	1528	1599	1528	1600	0.84
12	29	3e-14	7.4e-11	42.8	2.0	1	86	1680	1749	1680	1750	0.83
13	29	2.4e-12	6.1e-09	36.7	0.1	1	86	1773	1841	1773	1842	0.82
14	29	3.4e-13	8.5e-10	39.4	1.3	1	87	1974	2043	1974	2043	0.80
15	29	3.1e-08	7.9e-05	23.5	0.0	1	86	2137	2202	2137	2203	0.79
16	29	7.1e-05	0.18	12.7	0.0	1	58	2218	2265	2218	2281	0.80
17	29	3e-12	7.6e-09	36.4	0.1	1	87	2295	2367	2295	2367	0.79
18	29	2.5e-14	6.2e-11	43.1	0.2	1	87	2427	2497	2427	2497	0.82
19	29	1.8e-10	4.5e-07	30.7	0.0	1	86	2532	2603	2532	2604	0.79
20	29	3.5e-11	8.8e-08	33.0	0.0	1	87	2612	2684	2612	2684	0.76
21	29	2e-13	5.1e-10	40.1	0.0	1	85	2708	2778	2708	2780	0.81
22	29	3.7e-08	9.3e-05	23.3	0.3	1	58	2808	2855	2808	2875	0.83
23	29	1.5e-12	3.8e-09	37.3	0.1	1	87	2893	2965	2893	2965	0.81
24	29	2e-15	5.1e-12	46.6	0.1	1	86	3072	3144	3072	3145	0.81
25	29	1.3e-12	3.3e-09	37.5	3.7	1	86	3208	3278	3208	3279	0.82
26	29	6.3e-14	1.6e-10	41.8	3.4	1	86	3349	3419	3349	3420	0.85
27	29	2.2e-11	5.6e-08	33.6	0.1	1	86	3503	3572	3503	3573	0.84
28	29	1.9e-10	4.8e-07	30.6	0.6	1	58	3601	3649	3601	3665	0.85
29	29	7.7e-09	1.9e-05	25.5	1.6	18	86	3667	3724	3655	3725	0.74

Sequence Information

Coding Sequence: ATGTCACAACATAATCAACCCCACCAAGTTCCCCCGCACCCGCAACCGCATCCGCACTATCCCTACCACCACGCCTCCTTGTCACTGCccttgcagcagcagcagcagcatcagcagcaccagcaacagcagcagcatcaacagcagcagcatgcCAGCAGTTGGTACTCACATGTTGCTTCCTACCCACCCTCCCATACGGCCTTCAACCCCGCACTCCCCTGCAAGgccgccagcaacagcaacagcagcaccaccaacaacaactcCATCATGGGCCCCTATGGAGGGGGCGGCGACACGCATGGCTATTACGGCAATGTAAGCGCCGGAAtcggagtgggagtgggagtgggtggtggcGCAGTAGGCTCGACCTACGGCCTTGGGGCCAACACAGTGGCCTATGCCCACAATCAACTGCTTCAGTATCAGCCGCACcatcagcaacatcagcaggaGCAGCACTCGCAGCAGCCGCACCTGGGTCACCGGTCGTATATGGGGCACGATGTCATGACagggaccgggaccgggaccgggaccgggaccgcAACCGGTAGCTATCCGTATATCAAAAGCGAACCCATGGAGGCTTTCCAGCAGCCGCCAAATCCCATGGCACCGCCACCAGCCCTGCCCCCAGCCCAAGAGATGATCATAAAATCGGAACCCATTGACGAACAGGCCTACAAGTCCAACTATGTGGACGACAACACGCCCTTTGCCGACTTCAGTAAGTTCAACGAATTCAGCGAAGACATGCTGAGTCCCAAAGTGGAGCTGACCGTCAAAGACGAGTCGTACGCGAAAAACTTCCACCATCGAAAGCTGCAAAACGATCGCCCTGCCGGCAATGAAAGCCTGCCGGTGTGCCAGCGCTGCAAGGAGGTGTTCTTCAAGAAGCAGACCTACCTGCGCCACGTTGCAGAGAGCAGCTGCTGCATCCAGGAGTATGACTTCAAGTGCACCATCTGCCCCATGTCTTTCGTGAGCGCTGAAGAGCTGCAGCGGCACAAGCACCATCATCGGGCCGACCGATTCTTCTGCCACAAATACTGTGGCAAGCATTTCGAATCGATTGCCGAGTGTGAGGCGCATGAGTACATGCAGCATGAGTACGACAGCTTTGTCTGCAATATGTGCTCGGCTACCTTTGCGACGAGGGAGCAGCTCTACTCCCACCTACCGCAGCACAAGTTTCAGCAGCGCTTCGACTGCCCCATTTGCCGCCTATGGTATCAGACCGCTCTCCAGCTGCACGAGCACCGGATAGCGGAGCCCTATTACTGCGGCAAGTACTACGCAGGCGGACTTAACGCAGGGGCatcacagcagcagcagcatcaccACCAGAGCCAGACGAACTACAAGCTACAGGATTGTCACATGGCCACAATGGAGATGCCCAATACATCGCAACACAAGCCGAATTCCTCCAACTCCACCATGCCGGCTACGGCGGCACTTAGTTCCTTGCTCCAACAGCGTCAAGCAAAGGCCGATGGCGCAGCCATGTTCGCCGCCTCGGCGGTCAAGGCGGAGACGAACGTGAAGCTGGAGCGGAGCTACAGTAACTCGACCAGTGAGTCATCGTACGGTATGCAGGATGGCGGCTACAACAACTCCTTTTCCGGAGAGTCTTCGATGCACAGCGGGGCCATCGCCGGACCGCAGGCTAACTCCTCCACGCTGGACGACTCCGAGGACGCGCTGTGCTGTGTGCCATTATGTGGAGTACGCAAGAGCACCAGCCCCACGCTGCAGTTCTTTACGTTCCCCAAAGACGAAAAATACCTCAACCAGTGGCTGCACAATCTCAAGATGTTCCATGTGCCGGCCTCCAGCTACAGCAGCTTCCGGATCTGCAGTATGCACTTCCCCAAACGCTGCATTAATCGATATTCGCTCTGCTATTGGGCCGTACCGACATTCAACCTTGGCCACGACGACGTGGCCAATCTCTACCAGAACCGAGAGCTCACCAACACTTTCACCGTCGGCGAGGTGGCCCGGTGTAGCATGCCCCACTGTACCAGCCAGCGAGGCGAGagcaatttaaagttttacaaCTTTCCCAAGGACATCAAAAGCTTGATTAAATGGTGCCAGAACGCCCGTCTGCCTGTCCAGGCCAAGGAGCCGCGTCACTTCTGCAGCCGTCACTTCGAGGAACGGTGCATCGGCAAGTTTCGCCTTAAGCCCTGGGCGGTGCCCACTCTTCATCTGGGCGCTCAGTACGGAAAGATCCACGACAATCCCAAGAACTTGTATGTGGAAGAGAAACGCTGTTGTCTAAACTTCTGTCGCAGGAGCAGGTCCTCTGACTTCAATATGTCGCTGTATCGATTTCCCAGAGACGAAGTGCTCCTCCGTCGTTGGTGTTATAATCTTCGCTTAGATCCAGGAGTCTATCGAGGCAAGAATCACAAAATATGCAGCGCCCACTTTATCAAGGAGGCATTGGGTCTGCGAAAGTTATCTCCCGGAGCCGTGCCAACATTGCATTTAGGCCACAATGACACCTTCAACATCTACGAGAACGAGCTGTGGCCGCCGCCAACTCCTTCCACCAGCCATGGCGGTGGCCAGATGCAGTTGCAGCATCAACAACTCCCGGCGCACCACTCGCTCCAGCACCAGCTGCATATTGGTCAGGGAAAATCCTACCAACGCCACTCGGCCGTGTCCACTTCCTCCTCGGCGAGCTCCACCTCGCACTACGTGGACCCGGAGGTTAGCGCTTCATATCTGGCGATGGGTGGCTCCTCGATGAACGCCACCGACAGTATGGATGTTTGCTGTGTGCCCAGCTGCGAGAGCAAGCGACACAACTCGGAGAACATCACCTTCCACACGATTCCGCGAAGACCCGAGCAGATGCGAAAGTGGTGCCACAACCTGAAGATACCCGAGGACAAAATGCACAAGGGCATGCGGATTTGCAGCCGGCATTTCGAGCCCTACTGCATCGGCGGGTGCATGCGCCCGTTCGCAGTGCCCACGTTGCACCTGGGACATGACGACGAGGACATTAACCGCAACCCGGACGTAATCAAGAAGCTGAACATCCGCGAGACCTGCTGCGTAGCAGTGTGCAAGCGAAACCGGGACAGGGACCACGCCAATCTGCACCGGTTCCCCAGCAACGTGGCTTTGCTGACCAAGTGGTGTGCCAATTTGCAGCGCCCCGTTCCGGACGGCAGCAAGCTCTTCAACGACGCCATTTGCGAGGTGCACTTCGAAGATCGTTGTCTGCGAAACAAGCGCCTGGAAAAGTGGGCGGTTCCCACGCTGATCCTGGGCCACGAAGACATTGCCTATCCACTGCCCACGCCGGATCAGGTGGCCGAGTTCCATTCTCGACCCTCGGCCCCCAACAATGGCGAGGAGCAGGGCGAGTGCTGCGTCGAGACCTGTAAGCGAAATCCCAGCGTGGACGACATCAAACTATACCGGCCACCGGAGGAGGCCTCTGTGCTGGCCAAGTGGGCGCACAACCTACAGACTGAGGCCGCCCAGTTGGTAAGCCAGCGAATCTGCAATCTGCACTTCGAGGCCCACTGCATTGGCAAGCGAATGCGGCCGTGGGCCATACCCACCCTCAACTTGGCCGGAAACATTGAGAATCTCTACGAGAACCCGGAGCCCTCCATGCTTTACAAACGTCGAATGCACACGAAAGCCAAGTTGTCCGCCTCTGCGAAGCCTACCTGGGTGCCGCGTTGCTGCCTGCCACATTGCCGCAAGGTACGTGCCCTGCACAACGTCCAGCTCTACCGCTTCCCCAAGCACAACCGCTCTACGCTGGCCAAGTGGGCGCACAATTTGCAGGTGCCTATGGTGGGAAGTGCCCAACGCCGGGTTTGCTCGGCTCATTTTGAGCCGCACGTGCTGAGCAAAAAGTGTCCGGTGCCGTTGGCAGTGCCCACATTGGACCTGAACGCCCCACAAGGGCATGTGGTCTACCAGAATCCGGCCAAGCTGAGAGCCAGCAAACTGTGCCTGCAGCGCGTATGCATCGTAGAGAGCTGTCGCAAGACACGGGCGCAAGGCGTGCAACTCTTCCGGCTGCCGCACAATCCCACCCAGCTACGGAAGTGGATGCACAATATCCGGACACGTCCACGGGGTTCTATGCGGTCCCAATACCGGATTTGCTCGCGCCACTTTGAAACGCATTCGTTTAACGGCCGAAGGTTAAGTGCAGGGGCCATTCCCACGCTGGAACTGGGTCATGACGACGACGACATCTACCCCAACGAGGCGCAATCCTTTGTGGACGAGCACTGCGCCGTGGAAGGATGCGGGGCATCTAAAGAGCAACCGGAAGTGCGGCTTTTCCGCTTCCCCACCGACGACGACGACATGTTGTGGAAATGGTGCAACAACCTCAAAATGAATCCGGCCGACTGCACCGGCGTCCGAATCTGTAACAAGCATTTTGAGGCGGACTGCATTGGACCCAAGCACCTATTTAAGTGGGCTATTCCCACCCAGGAGCTGGGCCACGACGATGCCCAGATTGAACTCATTGCGAACCCGAAGCCGGAGGATCGTTACGTGGATCCGGTGTTCAAGTGCATTGTGCCCACCTGCGGCAAGACGCGGCGTTTTGACGAGGTCCAAATGAACAGCTTCCCCAAGGACTCCGAGCTCTTCCAGCGGTGGCGTCATAACCTCCGCTTAGACCACTTGTTCTTCCACGAGCGGGAACGTTACAAGATCTGTAACGCCCACTTCGAGGACGTTTGTATTGGCAAAACGCGTCTGAATATCGGCTCAATCCCCACACTAGAGCTGGGGCACGATGAGACCGATGACCTATTCCAGGTCAATCCCTCGGAGCTGCAGAGCAACTTGTTCGGACGCCAGCGGCGGCTGCTTGACGAATCGGAATCGGGCGAGGTGGTGATCAAGCAGGAGCTTCCAGACGGTGACACCGAGCCTGACGATGTAAAACTGGATGTAAGGGAACTTATAATTTCCAAACCCAGACAGGTGAAGGCCAAAAGAAGGGGCCTGGCGAATTTCAAATGCTGTGTGCGCAGTTGCGGAAGGAGCCGGCTCCAACATGGAGCACGTCTGTTTGCCTTTCCCTCGGGCAAGCAGCAGCACCTCAAGTGGCGCCACAATCTGCGACTAGAGCCCGAAGAGGTGGATAGTACCACCCGGGTGTGCAGCGCCCACTTCAATCGTCGCTGCATAGATGGCAAACAGCTGAGGAGCTGGGCAATGCCCACATTGCAGCTGGGGCATCGGGAGCAGCCCATCTACGAGAACCCCAAGAACATACCGGGCTTCTTTACACCCACTTGTGCCCTGAGCCACTGCCGGCAGCGAAGGAGCATCGACAACGACCTGCGAACATACCGGTATCCTCGGACGGAGGACTTGCTGGAAAAGTGGCGTGCGAATCTTCGCCTGGCTCCGGATCAATGTCGCGGCCGTATCTGTGCGGATCACTTTGAACCTCTGGTGCGGGGTAAATTGAAGCTGAAAACCGGCGCCGTGCCCACTCTGAAGCTGGGCCACAACGAGGGATTGATCTATGACAACGAGGCAATTAAGGCGGGCATAGCGGAGGACGAGGAAGTCACATGCAAGCAGGAGATAATGGACGAAGTGGAGGATGGCGAAGGAGAGGGCGAGGGCGAGGGAGAGGAGTCGCCGGAGGTGGATCCTGCAGTTAACGATGATGAAGACGACAAAGACGACAGTTACTTTGATCCCTTAGAGTTGGTGGAAACATTTGCAGAGCGAGCGAGCGACGAAGATGCGGAAGATCACGAAATGGGAGAGGAAAATGAACCCGATGAAGGGGATGAGGAGGCAGAGCAGCTCCTGCCGGACCTGCCACCCACTCCTCCACCCGTGCCCCAGCGTCGCGAAAAACCTGCCAATAATGTGACCCCCATCTGCTGCCTGAAGCACTGTCGCAAGGAACGTACGGCCTTCCACCTTTTGAGCACATTCGGCTTTCCTAAGGACCGTAAGCTCTTGCTGAAGTGGTGCGCCAATCTCCACCTGCATCCGGATGACATTGTCGGACGGGTCTGCATCGAGCACTTTGAGCCGGTGGTCCTCGGCACGCGTAAACTCAAACAGAATGCAGTTCCCACCGTGAATTTGGGGCACCAGGAACCGTTGCGCTACTCCTGCCATGGCGTGGAGCTGGATCAGGACTTGGAGCATGGACAGGCACAACATTCGGTTTTTCGGCTTTGGAGCCTGAAACACTGCCGCAAGAGGAAGCTATCGGATCCGCCGGACATTCGGGCCAGCGATTGGAAGGAGCTGAAGATGCACATGCAGAAGCAGAGGGAGTTGGAGATGGCGATGGAGAGGAGGAGGGACATTCGGATGAGCACTCCACCTCAGACACCGGTGAAGATTAAACCAAAAAGATGCTGCGTTGTCAGCTGTGGGAGCGAGGATGTGAAAAAATTGCTACCTCTGCCGGATGAGCGTAGCCTTTACCGCCAGTGGCAGCATAACCTTAAGTTGCCAGCATTAATAGATTTAAGTCTTGGTTTGTGCCTGGACCATTTCGAAGAGTCTCAAGTGCGAAATGGAAAGCCCTTGGAAAGGGCAGTGCCCACCCTGAAGTTGGGTCACAGCAGTTCTAATCTTTACCGAAATAACGCGGCTTGCCTGGTGACCAGTTGTCCAAGTTTGGGCTCCGATACCATTAGCTTTGTGGGCCTGCCCGCTAATTTAGTGATGAAAAAGGCCTGGCTGTCCTACCTACAACTTCCATTCGATAGTGAAGGACTTCTTTGTGGCACACACTTCGTGGAACTCTACGAGCAGGTGGATTTGCCCGAGGACTTACCCGTCCAGGATTTAGAGGAGCTGGAACGTACTGTTGATGAGCTGCAGTGCGCCGTACCCGGTTGTGAGTCCAAGAACGCCCGTGATGATCCCGTCCAGCTGGTCCAGTTGCCCCACAACGAGGGGGAACTTTCAAAGTGGCTTCACAACACAAAGATCACCTATGACTACTCGCGCCATAGTAGCTATCGGATCTGCCTGCTCCACTTTGACCCCATCTGCTTGGATGCGGACTTTCCAGCAAGTTGGGCCGTGCCTACACTAAACCTGGGACACGATGAAGAAATCCACCAGAATCCCGTGCAGCATCAACAGCTGAGGTTGCGCAGCGAAACCAACAACTATAATTCCTGTCAGTCCCCTCTCAGGATCAAAACGGAACTAACATCCGTGGAAAGCCCCAGTATAAGCGCCAGTCCCAGTCCAAAGGGTAAAATCCGGATATGCTGCATCCCCACATGCGGGCAGTTTGGGAACAGCCAAATACGGCTTTACCGCTTTCCCAGTGATGAGCAGTTCCTCCTCCAGTGGCTGGTAAACACTCAGCAACAACCCCGACTCGTTGACCCCATGGAGCTCTACGTGTGTCAGGCACACTTTGAAACCGACGCCGTTTCAAAGAAGCATCTTCGCAGCTGGGCATTGCCTACATTAAACCTGGGTCACGACAGGCATGTCTTCCTAAATCCCAGGCACAACGGAAACATTGCGGAAAGCTTGGACATAGAGGAAGCAGTTAAGTTTATTCGGGAGCGCTACTGCTCCGTGCTTAGTTGCTTTCAGCCTGGAGGAGAAGGCGTCCGGCTGTTCAAGTACCCCGAGGATATGGCCATGATCCGAAAGTGGGCAGTTGCCTGCAAACATCGTTCAATGCACGCCAGAACCCAGGGGCTCCAGGTGTGCCAGGCGCACTTTGCCGCCGAATGCTTTCATCCGGACACTGGAGATCTTCTAGAAGGGTCGATTCCCACACTAGAACTAATCCGCGACGACAGGCACTGCTTGGTGCGGGGATGTGAGCGGGATGAATCGGGTCCTCGATTGCGATTCTATAAGCTGCCCAAGATCACTGACCAAGTCGAGGCGTGGAGCAACAACTTGCTAATTCCCCTTTCAGAATTAATGCAAGGAGATCAACGCATTTGCGAGCGACACTTTGAAGCGTGCTGCTTTGGAGCTAGCCGCGGTCTCCGGCTGGGAGCTTTACCCACTCTGTTCCTGGGTCATGAAGAGGAAGTCGACTTGCTTTCCAATCCTGAGAAGTTACGACTGGGCAAGCAGGAGAACTGTTCCGTACCGGGCTGCGAACGAATCCGACTGCCTGATGATATCCCTTTTTACAGCTTCCCAAGGCTTTGGCCCTTAGCCAGGAAGTGGCTGCACAATCTTCGTCTAGAAAAAACCAGCAAGGACCAGCTACAAAAACTTAGGATATGCCCGGCGCACTTTGACTCGGACGTGCAAGATGAAGATGGACTTCTGCCAGGAGCCATGCCCACTAAGCAGCTTGGACATTCCTCCGAGGGCATTTTTCTGCCACAGGAAAAGGGTCTTCAGAGTAACAAAAACTCATTCCTTGAGTCTACTTGCTGTTATCCGAAATGTACTGATGCCTCCAAAAAAGAGTTATTAGAATTTCCCGACGAAACAGAGCTCCGTCAAGCCTGGTTGGatcatttaaatattaaggAGAGAGCTAATAGAGCCCTACACCTTTGTTCCCTCCATTATGTGATTCTTTATGAGCACAGTGTCAAGGAGTTCCCGGAGCATCTTCCAAGTCAGTTAATGCAACAGAACTACGAAATTGCCCGCGACAACCGACGGGTGAAGATCGTAAGTTGTGCCATCAAGGGATGCAGTATGCTAAAGCCTAGAGATGGAGTGCTGCTCCACGGCGTGCCCATGCGCAAGGACATCTTGCAGATGTGGATCGACAACGGGCAGATAGAGTTCTCCGAACAGCAACGTTACATGTTTAGGGTGTGCCACAGACACTTTGAGTCAAGTTGCTTCATCGACGAGCGTCGGCTCTCCTCCTGGAGTGTCCCCACTCTACATCTTCCTGGTGCGGTAATCCATCAGAATCTCAGCAAGGAAGAGTGGGAGGTCATTAAGCAGGAAAAGGAAGAACCAGAAATCAAGGAGGAACCTCTGGAGGCGGAGATGGAAACGGAAAACTCTCTTCTCGAGCCGGTTGTAAGGATGGAGCATGTGGAATCCGACGAGGACGACTCGCAAATGCAGGCATTGGAGGTGCTGCTAGAGGTGGGACACGTGGAACGGCTGGACAGCTATGAAAAGATTGACAAATCTCCTATTGTCTACCCCGAGCATGTTATGTATAGATCAAATAGGAGTCAATACAATGCCAACCGCTGCGCCGTGGAGGGATGCGAGGTTACCGTTGAGGACGTAGACGGAACCATCAAGTTGCACAAGTTTCCAGCCTCGACGGAGGCTGCCCAGAAGTGGATGCATAACACTCAGGTGGACATGGAAGTGAAGTACTGGTGGCGGTACCGCATCTGCAGCTATCACTTTGATCCGGAATGCTTCCAAGGATCTAGAATCCGGAAGGGAGCCATGCCCACGCTGTTGTTGGGGTCCCAGAGACCGGATGAGCTCTACGACAATGAGTTCGTTTCCATGCCGGAGGTTGAGGATCTACCTTTGCCGGTCGAGATTAGCCAGATTAGCCAGAGCGATGTGACAGAACGAACTGTTCCAGAAGTGACCAATATTTGCCTGCCCCCGCCAGCTGCGCCGCGAAAATCCAGCAAGTTCTGCCAGATCGAAGGATGCTCAAATCATCTCACCACCGAACACATAACCCTCCACAAGTTTCCGCACTCGAAGGATATGTGCATCCGATGGCAGCACAACACACAAGTGCCATTCGATCCAGATCATCGTTGGCGGTACAGGATATGTACAGCCCATTTTGAGCCCGTGTGCCTGTCCAATTTGCGCCTGCTCCACGGCAGTGTGCCCACCTTAAAGCTGGGACCCAAAGCTCCCGCTGAACTTTTCGACAACGACTTTGAGGCCATCAATCAGCGACTGGATAAGAAATCGGCGGCAGAGGTATATCAGGAACGGGGGGATATGGAAGACGAGCTTAGCGAGGATCAGGTAGAGGCGCCTATCTGTATTCCTGTAAAACAGGAGAAGATATCCTTTAACCAGATCAAGTCCGGCTACGACAAGTGCTCACTGGCCCACTGCCAACGGCAAAGGTCTCTGCATGGCGTACATATCTATAAGTTCCCTAGGTCGCAGCGCCAGCAGGAGCGATGGATTCACAACCTCCGCATCCGCTACGATGACCGCCGACCCTGGCGGTTCATGATTTGCAGTGTCCACTTCGAGCCGCACTGCATCAGCCTTAGGAAGCTGCGTCCCTGGGCAGTTCCTACGCTGGAGTTGGGCCCGAATGTACCGGAGAAAATCTTTACCAACGAGCAGTGCCAGGAACTGGAGGTAGAGCAACCTAGCGATCGTAGCGAGGCGGAGAGCGAGGAGGAGGATGGCCTGGAAGAAGACGATGATGGGGAGGAGGACAATATCGAGGAAGATGGACAAGAACTCAATGTGCCCAATAAGAAAGAGCGTCGCTCGAAGTTGGACTCATGTCCGTCCGGTCAGGTTGCACCATGGAAGGTAAAGCAGTGTTGCCTGCCCTACTGTCGCGCCTTTCGAGGAGATGGCATCAAGCTCTTCCGACTGCCCAACAACCGATCCTCCATCCGCAACTGGGAGATAGCCACGGGCATGATGTTTAAGGAGTCGCAGCGAAACACACGACTTATTTGTAGTCGACATTTTGACCCGGAACTTATTGGTGTCCGTCGACTCATGCGCAACGCTATTCCCACCCGGCACCTGAATCCAAAATCCGTTACAGGCGACGAGAAAAGGGTTTTCCCGGTCAAGACCAAGGATACGCCTCGCCCAATGCCCTCCTGCTGCATGGCGGACTGCCATTATAATGGTAATGTGAAGATGCATAAATTTCCCAGTGATCCCACACAGCTGAGGCAGTGGTGCCAGGCTCTCAGACTCACGGATACGCAACGTTATCGTGGCAAGTATATTTGCGCGGCCCACCTGCCTACCAATATGTCAGTTAGCTGCGTCGTCTGCGGGATGGATGACGTACAGCTGCCGATGCTGGACTTCCCAGAGAACCGCAACCAGCGGGCCAAATGGTGCTACAACCTAAAGATTGAGACCATACCCAAGTGGGATCGCTCCAAGCACATCTGCTGCCGGCACTTTGAGGCACACTGCTTTGTCCGGCCGGGTGAACTTCGTCAAGGAGCGACCCCAACAGTGGCTTTGAACCACAACGACACAAACATATTTCTTAGCGACTACTCCATCGATTCGGCGACCTCCTATGGGGGTAATCGAATCAAAGACGAACCCAAGGACGGCGACGACACACTCCTGGTCTAG
Protein Sequence: MSQHNQPHQVPPHPQPHPHYPYHHASLSLPLQQQQQHQQHQQQQQHQQQQHASSWYSHVASYPPSHTAFNPALPCKAASNSNSSTTNNNSIMGPYGGGGDTHGYYGNVSAGIGVGVGVGGGAVGSTYGLGANTVAYAHNQLLQYQPHHQQHQQEQHSQQPHLGHRSYMGHDVMTGTGTGTGTGTATGSYPYIKSEPMEAFQQPPNPMAPPPALPPAQEMIIKSEPIDEQAYKSNYVDDNTPFADFSKFNEFSEDMLSPKVELTVKDESYAKNFHHRKLQNDRPAGNESLPVCQRCKEVFFKKQTYLRHVAESSCCIQEYDFKCTICPMSFVSAEELQRHKHHHRADRFFCHKYCGKHFESIAECEAHEYMQHEYDSFVCNMCSATFATREQLYSHLPQHKFQQRFDCPICRLWYQTALQLHEHRIAEPYYCGKYYAGGLNAGASQQQQHHHQSQTNYKLQDCHMATMEMPNTSQHKPNSSNSTMPATAALSSLLQQRQAKADGAAMFAASAVKAETNVKLERSYSNSTSESSYGMQDGGYNNSFSGESSMHSGAIAGPQANSSTLDDSEDALCCVPLCGVRKSTSPTLQFFTFPKDEKYLNQWLHNLKMFHVPASSYSSFRICSMHFPKRCINRYSLCYWAVPTFNLGHDDVANLYQNRELTNTFTVGEVARCSMPHCTSQRGESNLKFYNFPKDIKSLIKWCQNARLPVQAKEPRHFCSRHFEERCIGKFRLKPWAVPTLHLGAQYGKIHDNPKNLYVEEKRCCLNFCRRSRSSDFNMSLYRFPRDEVLLRRWCYNLRLDPGVYRGKNHKICSAHFIKEALGLRKLSPGAVPTLHLGHNDTFNIYENELWPPPTPSTSHGGGQMQLQHQQLPAHHSLQHQLHIGQGKSYQRHSAVSTSSSASSTSHYVDPEVSASYLAMGGSSMNATDSMDVCCVPSCESKRHNSENITFHTIPRRPEQMRKWCHNLKIPEDKMHKGMRICSRHFEPYCIGGCMRPFAVPTLHLGHDDEDINRNPDVIKKLNIRETCCVAVCKRNRDRDHANLHRFPSNVALLTKWCANLQRPVPDGSKLFNDAICEVHFEDRCLRNKRLEKWAVPTLILGHEDIAYPLPTPDQVAEFHSRPSAPNNGEEQGECCVETCKRNPSVDDIKLYRPPEEASVLAKWAHNLQTEAAQLVSQRICNLHFEAHCIGKRMRPWAIPTLNLAGNIENLYENPEPSMLYKRRMHTKAKLSASAKPTWVPRCCLPHCRKVRALHNVQLYRFPKHNRSTLAKWAHNLQVPMVGSAQRRVCSAHFEPHVLSKKCPVPLAVPTLDLNAPQGHVVYQNPAKLRASKLCLQRVCIVESCRKTRAQGVQLFRLPHNPTQLRKWMHNIRTRPRGSMRSQYRICSRHFETHSFNGRRLSAGAIPTLELGHDDDDIYPNEAQSFVDEHCAVEGCGASKEQPEVRLFRFPTDDDDMLWKWCNNLKMNPADCTGVRICNKHFEADCIGPKHLFKWAIPTQELGHDDAQIELIANPKPEDRYVDPVFKCIVPTCGKTRRFDEVQMNSFPKDSELFQRWRHNLRLDHLFFHERERYKICNAHFEDVCIGKTRLNIGSIPTLELGHDETDDLFQVNPSELQSNLFGRQRRLLDESESGEVVIKQELPDGDTEPDDVKLDVRELIISKPRQVKAKRRGLANFKCCVRSCGRSRLQHGARLFAFPSGKQQHLKWRHNLRLEPEEVDSTTRVCSAHFNRRCIDGKQLRSWAMPTLQLGHREQPIYENPKNIPGFFTPTCALSHCRQRRSIDNDLRTYRYPRTEDLLEKWRANLRLAPDQCRGRICADHFEPLVRGKLKLKTGAVPTLKLGHNEGLIYDNEAIKAGIAEDEEVTCKQEIMDEVEDGEGEGEGEGEESPEVDPAVNDDEDDKDDSYFDPLELVETFAERASDEDAEDHEMGEENEPDEGDEEAEQLLPDLPPTPPPVPQRREKPANNVTPICCLKHCRKERTAFHLLSTFGFPKDRKLLLKWCANLHLHPDDIVGRVCIEHFEPVVLGTRKLKQNAVPTVNLGHQEPLRYSCHGVELDQDLEHGQAQHSVFRLWSLKHCRKRKLSDPPDIRASDWKELKMHMQKQRELEMAMERRRDIRMSTPPQTPVKIKPKRCCVVSCGSEDVKKLLPLPDERSLYRQWQHNLKLPALIDLSLGLCLDHFEESQVRNGKPLERAVPTLKLGHSSSNLYRNNAACLVTSCPSLGSDTISFVGLPANLVMKKAWLSYLQLPFDSEGLLCGTHFVELYEQVDLPEDLPVQDLEELERTVDELQCAVPGCESKNARDDPVQLVQLPHNEGELSKWLHNTKITYDYSRHSSYRICLLHFDPICLDADFPASWAVPTLNLGHDEEIHQNPVQHQQLRLRSETNNYNSCQSPLRIKTELTSVESPSISASPSPKGKIRICCIPTCGQFGNSQIRLYRFPSDEQFLLQWLVNTQQQPRLVDPMELYVCQAHFETDAVSKKHLRSWALPTLNLGHDRHVFLNPRHNGNIAESLDIEEAVKFIRERYCSVLSCFQPGGEGVRLFKYPEDMAMIRKWAVACKHRSMHARTQGLQVCQAHFAAECFHPDTGDLLEGSIPTLELIRDDRHCLVRGCERDESGPRLRFYKLPKITDQVEAWSNNLLIPLSELMQGDQRICERHFEACCFGASRGLRLGALPTLFLGHEEEVDLLSNPEKLRLGKQENCSVPGCERIRLPDDIPFYSFPRLWPLARKWLHNLRLEKTSKDQLQKLRICPAHFDSDVQDEDGLLPGAMPTKQLGHSSEGIFLPQEKGLQSNKNSFLESTCCYPKCTDASKKELLEFPDETELRQAWLDHLNIKERANRALHLCSLHYVILYEHSVKEFPEHLPSQLMQQNYEIARDNRRVKIVSCAIKGCSMLKPRDGVLLHGVPMRKDILQMWIDNGQIEFSEQQRYMFRVCHRHFESSCFIDERRLSSWSVPTLHLPGAVIHQNLSKEEWEVIKQEKEEPEIKEEPLEAEMETENSLLEPVVRMEHVESDEDDSQMQALEVLLEVGHVERLDSYEKIDKSPIVYPEHVMYRSNRSQYNANRCAVEGCEVTVEDVDGTIKLHKFPASTEAAQKWMHNTQVDMEVKYWWRYRICSYHFDPECFQGSRIRKGAMPTLLLGSQRPDELYDNEFVSMPEVEDLPLPVEISQISQSDVTERTVPEVTNICLPPPAAPRKSSKFCQIEGCSNHLTTEHITLHKFPHSKDMCIRWQHNTQVPFDPDHRWRYRICTAHFEPVCLSNLRLLHGSVPTLKLGPKAPAELFDNDFEAINQRLDKKSAAEVYQERGDMEDELSEDQVEAPICIPVKQEKISFNQIKSGYDKCSLAHCQRQRSLHGVHIYKFPRSQRQQERWIHNLRIRYDDRRPWRFMICSVHFEPHCISLRKLRPWAVPTLELGPNVPEKIFTNEQCQELEVEQPSDRSEAESEEEDGLEEDDDGEEDNIEEDGQELNVPNKKERRSKLDSCPSGQVAPWKVKQCCLPYCRAFRGDGIKLFRLPNNRSSIRNWEIATGMMFKESQRNTRLICSRHFDPELIGVRRLMRNAIPTRHLNPKSVTGDEKRVFPVKTKDTPRPMPSCCMADCHYNGNVKMHKFPSDPTQLRQWCQALRLTDTQRYRGKYICAAHLPTNMSVSCVVCGMDDVQLPMLDFPENRNQRAKWCYNLKIETIPKWDRSKHICCRHFEAHCFVRPGELRQGATPTVALNHNDTNIFLSDYSIDSATSYGGNRIKDEPKDGDDTLLV

Similar Transcription Factors

Sequence clustering based on sequence similarity using MMseqs2

100% Identity: iTF_00545997;
90% Identity: iTF_00545997;
80% Identity: -