Basic Information

Insect: Drosophila subpulchrella
Gene Symbol: -
Assembly: GCA_014743375.2
Location: NC:16719087-16733769[+]

Transcription Factor Domain

TF Family: THAP
Domain: THAP domain
PFAM: PF05485
TF Group: Zinc-Coordinating Group
Description: The THAP domain is a putative DNA-binding domain (DBD) and probably also binds a zinc ion. It features the conserved C2CH architecture (consensus sequence: Cys - 2-4 residues - Cys - 35-50 residues - Cys - 2 residues - His). Other universal features include the location of the domain at the N-termini of proteins, its size of about 90 residues, a C-terminal AVPTIF box and several other conserved residues. Orthologues of the human THAP domain have been identified in other vertebrates and probably worms and flies, but not in other eukaryotes or any prokaryotes [1].
Hmmscan Out: # of c-Evalue i-Evalue score bias hmm coord from hmm coord to ali coord from ali coord to env coord from env coord to acc

1 29 3.8 6.2e+03 -2.2 2.1 44 62 330 351 311 365 0.59

2 29 2.8e-15 4.5e-12 46.3 3.9 1 86 558 630 558 631 0.85

3 29 1.1e-14 1.9e-11 44.3 5.0 1 87 658 727 658 727 0.83

4 29 1e-15 1.7e-12 47.6 0.2 1 87 749 821 749 821 0.85

5 29 4.8e-16 7.8e-13 48.7 5.5 1 87 919 989 919 989 0.82

6 29 1.6e-14 2.6e-11 43.8 2.6 1 86 1013 1084 1013 1085 0.81

7 29 3.6e-13 5.8e-10 39.5 1.1 1 87 1120 1188 1120 1188 0.80

8 29 9.3e-11 1.5e-07 31.8 1.4 1 86 1228 1297 1228 1298 0.76

9 29 5.1e-17 8.2e-14 51.8 0.4 1 86 1325 1394 1325 1395 0.83

10 29 5.2e-13 8.4e-10 39.0 1.5 1 85 1416 1484 1416 1486 0.80

11 29 3.8e-14 6.2e-11 42.6 0.4 1 86 1513 1584 1513 1585 0.85

12 29 5.6e-13 9.1e-10 38.9 3.1 1 85 1661 1729 1661 1731 0.82

13 29 1.2e-12 2e-09 37.8 0.1 1 86 1754 1822 1754 1823 0.81

14 29 3.2e-13 5.2e-10 39.7 2.0 1 87 1956 2025 1956 2025 0.79

15 29 1.4e-10 2.2e-07 31.2 0.2 1 86 2127 2193 2127 2194 0.78

16 29 0.0064 10 6.7 0.0 1 59 2209 2254 2209 2270 0.79

17 29 3.5e-13 5.8e-10 39.5 1.6 1 87 2283 2353 2283 2353 0.83

18 29 8.2e-13 1.3e-09 38.3 0.4 1 87 2412 2482 2412 2482 0.82

19 29 2e-11 3.3e-08 33.9 0.1 1 86 2517 2588 2517 2589 0.81

20 29 3.4e-13 5.5e-10 39.6 0.0 1 86 2599 2670 2599 2671 0.81

21 29 4.1e-12 6.6e-09 36.1 0.0 1 86 2695 2765 2695 2766 0.79

22 29 0.00024 0.39 11.2 0.1 1 58 2799 2846 2799 2869 0.79

23 29 2.3e-13 3.7e-10 40.1 0.5 1 87 2884 2957 2884 2957 0.82

24 29 6.8e-16 1.1e-12 48.2 0.3 1 86 3069 3141 3069 3142 0.81

25 29 2e-12 3.2e-09 37.1 2.8 1 86 3203 3273 3203 3274 0.80

26 29 3.7e-14 6e-11 42.7 4.4 1 86 3374 3444 3374 3445 0.85

27 29 2.3e-11 3.7e-08 33.7 0.1 1 86 3527 3596 3527 3597 0.83

28 29 1.5e-10 2.5e-07 31.1 2.0 1 58 3621 3669 3621 3684 0.83

29 29 2.7e-10 4.4e-07 30.3 1.9 17 87 3686 3745 3676 3745 0.74

#	of	c-Evalue	i-Evalue	score	bias	hmm coord from	hmm coord to	ali coord from	ali coord to	env coord from	env coord to	acc
1	29	3.8	6.2e+03	-2.2	2.1	44	62	330	351	311	365	0.59
2	29	2.8e-15	4.5e-12	46.3	3.9	1	86	558	630	558	631	0.85
3	29	1.1e-14	1.9e-11	44.3	5.0	1	87	658	727	658	727	0.83
4	29	1e-15	1.7e-12	47.6	0.2	1	87	749	821	749	821	0.85
5	29	4.8e-16	7.8e-13	48.7	5.5	1	87	919	989	919	989	0.82
6	29	1.6e-14	2.6e-11	43.8	2.6	1	86	1013	1084	1013	1085	0.81
7	29	3.6e-13	5.8e-10	39.5	1.1	1	87	1120	1188	1120	1188	0.80
8	29	9.3e-11	1.5e-07	31.8	1.4	1	86	1228	1297	1228	1298	0.76
9	29	5.1e-17	8.2e-14	51.8	0.4	1	86	1325	1394	1325	1395	0.83
10	29	5.2e-13	8.4e-10	39.0	1.5	1	85	1416	1484	1416	1486	0.80
11	29	3.8e-14	6.2e-11	42.6	0.4	1	86	1513	1584	1513	1585	0.85
12	29	5.6e-13	9.1e-10	38.9	3.1	1	85	1661	1729	1661	1731	0.82
13	29	1.2e-12	2e-09	37.8	0.1	1	86	1754	1822	1754	1823	0.81
14	29	3.2e-13	5.2e-10	39.7	2.0	1	87	1956	2025	1956	2025	0.79
15	29	1.4e-10	2.2e-07	31.2	0.2	1	86	2127	2193	2127	2194	0.78
16	29	0.0064	10	6.7	0.0	1	59	2209	2254	2209	2270	0.79
17	29	3.5e-13	5.8e-10	39.5	1.6	1	87	2283	2353	2283	2353	0.83
18	29	8.2e-13	1.3e-09	38.3	0.4	1	87	2412	2482	2412	2482	0.82
19	29	2e-11	3.3e-08	33.9	0.1	1	86	2517	2588	2517	2589	0.81
20	29	3.4e-13	5.5e-10	39.6	0.0	1	86	2599	2670	2599	2671	0.81
21	29	4.1e-12	6.6e-09	36.1	0.0	1	86	2695	2765	2695	2766	0.79
22	29	0.00024	0.39	11.2	0.1	1	58	2799	2846	2799	2869	0.79
23	29	2.3e-13	3.7e-10	40.1	0.5	1	87	2884	2957	2884	2957	0.82
24	29	6.8e-16	1.1e-12	48.2	0.3	1	86	3069	3141	3069	3142	0.81
25	29	2e-12	3.2e-09	37.1	2.8	1	86	3203	3273	3203	3274	0.80
26	29	3.7e-14	6e-11	42.7	4.4	1	86	3374	3444	3374	3445	0.85
27	29	2.3e-11	3.7e-08	33.7	0.1	1	86	3527	3596	3527	3597	0.83
28	29	1.5e-10	2.5e-07	31.1	2.0	1	58	3621	3669	3621	3684	0.83
29	29	2.7e-10	4.4e-07	30.3	1.9	17	87	3686	3745	3676	3745	0.74

Sequence Information

Coding Sequence: ATGTCACAACAACACCCCCATCACGcccacccccacccccatCACTACGCCCACCACTACCCGCCCCCTGCTACGCCCATGTCcctgcagcaacagcagcagcagcagctgcagcaaaCGCAGCAGacgccgcagcagcagcacgcCAATTGGTACTCACATGTTGCTTCCTACCCCACACCCCACTCGGCCTTCGGCCCCGCCCCCGCCCCCGACCCATCCTGCAAggccaccagcaacagcaacaacaacatcatgGGTGGGGGAGGAGGAGGCTATGGCCCACAAGGGGGTGGTGGTGGCACGCAGGGTTATTATGGCGCCGCTGGCGGTGGCCTCAATGTCAGTGGGacggtggtgggtggtggtgggcCGAGCTACGGCCTTGGGGCCAACACAGTGGCATATGCCCACAACCAACTGCTGCAgtaccaacaacaacaacaacagcagcagcagcaacaacatcagcaACTTCCACAACACCTAAGCCAACAAAGGCCCTATATGGGCCACAATATCATGACCGGCAGCTATCCCTATATCAAAAGCGAACCCATGGAGGCCTTCCAGCAGCCTCCCAATCCCATGGCCCCGCCCCCGGCACCAGAAATATTGATAAAATCGGAACCCATTGACGAACATTCCTACAAGTCAAACTATATAGACGACAACACTCCATTTGCGGACTTTAGCAAGTTCAGCGAATTCAGCGAGGACATGTTGAGTCCCAAAGTGGAACTGACCGTCAAGAATGAGTCCTACGGAAGGAATACCAGCAGCTTTCTGCGCCGCAAACAGCAATTGGATCGGAGCTCCGAGAGCCTGCCCATCTGCCAGCGCTGCAAGGAAGTCTTCTTCAAGAAGCAGGCCTATCTGCGCCACGTGGCCGAGAGCAATTGCGGGATGCAGGAGTACGACTTCAAGTGCACCACCTGCCCCATGTCCTTCATGACCACCGAGGAGCTGCAGCGGCACAAGCATCTCCACCGTGCCGACAAGTTCTTCTGCCACAAGTATTGCGGCAAGCACTTCGACACGATCGCAGAGTGCGAAGCGCATGAGTACATGCAGCACGAATACGATAGCTTTGTCTGCAACATGTGCTCTGGAACCTTCGCTACCCGTGAGCAGCTTTACGCCCACCTGCCGCAACATAAATTCCAGCAGCGCTTCGACTGTCCCATCTGCCGCCTGTGGTATCAGACGGCTCTCGAGCTCCACGAACATCGTTTGGCCGCACCCTACTTCTGCGGCAAGTATTATACGGGGGTTCAGGCAACCTCTGGATCACACTCGCAGGCGCAGCAGCACCAGACGAACTACAAGCTGCAGGATTGCCATATGGCGACTATGGAAAtgCCCACCGCCCCGCACCACAAATCGAACCCATCCAGCTCGTCCTTGCCGGCCACGGCTGCATTAAATTCACTGCTGCAGCAGCGCCAGGCAAATGCCGATGGAGCAGCCATGTTCGCAGCTTCTGCGCTTAAGAACGATGTGAATGTGAAGCTGGAGCGCAGCTATAGCAACTCGACCAGCGAGTCATCCTACAGCGTTCAGGAGAATAGCTACAATAATGCCTATGGAAGCGATAGCTCAATCCATGGAGGAGCGATCGCTGGGCCACAGGCACACTCATCGACGCTGGACGACTCCGAGGACGCATTGTGCTGTGTGCCACTGTGCGGAGTACGGAAGAGCACCAGCCCCACGCTGCAGTTTTTCACGTTCCCCAAGGACGAAAAGTACCTCAACCAGTGGCTGCACAATCTCAAGATGTTCCACATACCCGCCGCAAGCTACGCCAATTTCCGCATCTGCAGCATGCACTTCCCGAAGCGCTGCATCAATCGCTATTCGCTGTGCTATTGGGCAGTGCCCACGTTCAACCTGGGTCATGATGACGTGGCCAATCTCTACCAGAACAGGGAACTGACCAACACCTTCACCACCGGCGAGGTAGCGCGTTGCAGCATGCCGCACTGCACCAGTCAACGGGGTGAGAGCAACTTAAAGTTCTACAATTTTCCCAAGGACATCAAGAGCCTCATCAAGTGGTGCCAGAACGCACGACTTCCCGTTCAGGCGAAGGAGCCGCGTCACTTCTGTAGCCGCCATTTCGAGGAGCGCTGCATCGGCAAGTTCCGGCTGAAGCCATGGGCGGTGCCAACCTTACATCTGGGTGCCCAGTATGGCAAGATCCACGACAACCCCAAGAATCTGTACGTGGAGGAGAAACGCTGCTGCCTCAACTTCTGCCGCCGGAGCCGATCCTCTGACTTCAATATGTCGCTATATCGTTTTCCCAGAGATGAGGTGCTCCTACGACGCTGGTGCTACAATCTACGCCTGGATCCGGGAGTGTATCGCGGCAAGAATCACAAAATATGTAGCGCCCACTTTATCAAAGAGGCTTTGGGTCTGCGGAAGCTATCACCGGGTGCCGTTCCCACGCTTCACCTGGGTCACACTGACACCTTCAACATCTACGAGAACGAGCTGTGGCCACCGCCAACGGCTTCCAACAGTCACAGCAATGTCCTCCAGCAGCACCAGGCGCATCATCACCATTCGCAACATTCACTGCAACAGCACCTGCACAGCAAATCATACCAGCGTCACTCAGCGGCGTCTACGTCATCCTCGGCCAGTTCGACCTCTCACTACGTTGATCCTGAGCTGACGTCCTCTTACCTGGCCATGGGTGCCGGTGGATCCTCGGCGATGAACGCCAGCGACAGCATGGACATCTGCTGTGTGCCTAGTTGCGAGAGCAAGCGACACAACAACGAGAACATCACATTCCACACCATACCGCGCCGACCGGAGCAGATGCGCAAGTGGTGCCACAACCTAAAGATACCAGAGGAAAAGATGCACAAAGGCATGCGTATCTGTAGTCTGCACTTCGAGCCTTACTGCATCGGCGGTTGTATGCGTCCATTTGCGGTGCCCACCCTCAATTTGGGTCACGACGAGGAAGATATTCATCGGAATCCGGATGTGATTAAAAAGCTGAATATCCGGGAAACATGCTGCGTCGCCGTATGCAAGAGAAATCGAGACAGGGATCATGCCAACCTGCACCGATTCCCAAGTAATGTGTCATTGCTGACCAAGTGGTGTGGCAATCTCCAAAGGGCCGTTCCGGATGGCAGTAAACTGTTTAACGACGCCATCTGTGAGGTGCACTTCGAGGATCGATGCCTGCGCAATAAAAGGCTGGAGAAGTGGGCGGTGCCTACACTGATCCTGGGCCACGAAAACATCCCATATCCTCTTCCAACACCGGAACAGGTCACTGAGTTCTATTCTCGACCCACTGCGCCAAACAATGGCGAAGAACAGGGCGAGTGCTGCGTGGAGAGCTGCAAGAGAAATCCCAGTGTGGACGACATCAAGCTTTACCGGCCGCCGGAGGAGGCTTCCGTGTTGGCCAAATGGGCACACAACCTGCAAACAGAGGCTAGTCAGCTGACGAGCATGAGGATCTGTAATCTTCACTTCGAGGCACACTGCATCGGCAAGCGGATGCGACCTTGGGCGATACCGACATTAAACCTGGCTGGCAATATAGAGAATCTCTATGAGAATCCAGAGCACTCGATGCTGTACAAGCGGCGAACTCACACGAAAACCAAGCTCCCGGCTTCCGTAAAGCCCACTTGGGTGCCCAGGTGCTGTCTTCCACACTGCCGCAAAGTTCGAGCTCTACACAACGTTCAGCTCTATCGGTTCCCCAAGCTTAATCGCTCTACTCTGGCCAAGTGGGCGCACAATCTGCAGGTCCCCATGGTTGGCAGTGCCCAACGCCGGCTGTGCTCGGCTCATTTTGAGCCACATGTGCTGAGCAAAAAGTGTCCGGTGCCGCTGGCGGTACCCACACTGGACTTAAACTCGCCGCCCGGCTTAAAGATCTACCAAAATCCGGCAAAGCTGAAGGCAAGCAAGCTGTGTCTGCAGCGTGTGTGCATAGTAGAAAGTTGCCGCAAGACGAGGGCGCAGGGCGTCCAGCTCTTCCGGCTCCCGCATAGTCCCACGCAGCTGCGCAAGTGGATGCACAACATCAAGACGCGTCCTAGGGCGGCTATGAGGGCTCAATACCGAGTATGTTCCCGTCATTTCGAGACACACTCGTTCAATGGCAGGAGATTAAGCGCTGGCGCCATTCCTACCCTGGAATTGGGTCACGACGACGAGGACATCTATCCCAACGAAGCACAGGCCTTTGCGGACGAGCACTGCGTGGTGGAGGGTTGCGAGGCATCCAAGGAACAGGCGGAGGTACGACTCTTCCGATTTCCCACGGATGACGACGATATGCTATGGAAGTGGTGCAACAATCTTAAGATGAACCCAGTGGATTGCACAGGAGTTCGCATATGTAACAAACACTTCGAGGCGGATTGCATCGGGCCCAAGCACCTGTACAAGTGGGCTATCCCCACTCAGGAACTCGGTCACGACGATGCCGAGATCGAGTTAATACCGAACCCCAAGCCAGAGGACCGGTATGTGGATCCGGTGTTCAAGTGCATTGTGCCCACCTGCGGGAAGACGCGCCGCTTTGACGAGGTGCAGATGAACAGCTTTCCCAAGGACCCTAATCTCTTCCAGCGCTGGCAGCACAATCTGCGACTGGATCACCTTAACTTCCTGGAACGCGAACGCTACAAGATCTGTAATGCGCACTTTGAGGACATCTGTATTGGCAAGACTCGGTTAAACATAGGCTCGATCCCTACCCTAGAGTTGGGCCACGACGAGACGGATGATCTGTTCCAGGTGAATCCGTCGGAGTTGCAGAGCAACCTTTTCGGACGACAGCGGCGGATACACGAGGAATCTGGTGGGATAGCCATCAAGCAGGAACTTTCCGAGTCGGAAGACGTTAAACCGGATGTGACAATCATGCCCGATGCCACAGATTCGAGAACTAGACAGGTAAAGTTTAAGAAAACGATGTCCGATCTGAAGTGCTGTGTCCACAGTTGTGGACGCAGTCGTATGGAGCACGGAGCACGGCTTTTTCCCTTTCCCACCGGCAAGCAGCAACATCTCAAGTGGCGACACAACCTGCGACTGGAGCCCGACGAGGTGGACCGATCGACACGGGTTTGCAGTGCCCACTTTAACCGGCGTTGCATTGACGGCAAGCAACTGAGGAGTTGGGCAATGCCCACGCAACAACTGGGCCACCATGAGCAGCCGATCTACGAGAATCCGAAGAACATACCGGGATTCTTCACACCCACCTGTGCCCTGGGGCACTGCCGCAAGCGTCGGAGCATCGACAACGATCTGCGCACCTACCGATATCCAAGAAGTGAGGATCTGCTGGAGAAGTGGCGGGCGAATTTGCGTCTAACCCCGGATCAGTGCCGCGGCAGGATTTGTGCGGATCACTTTGAGGCACAGGTTCGGGGCAAACTAAAGCTGAAGACAGGTGCAGTGCCCACTTTGAAACTGGGTCACGATGAGGGGTTAATCTACGACAATGAGGCTATAAAGGTTGGACTGACCGAGGATGAGGAAGGCAGCTCTGAGTTGCCGCGACTGAAACCAAAAAAGGAGCTAATCGATGAGGAGGAGGAAGACGGGGAGGCTGAGGAGGAGCACAATGACCAGGATAATGAGGATGAAGATGAGAAAGACGACCACTATTTTGATCCGCTTGAACTGGTAGAGACCTTTGCCGAACATCCAAGCGATGATGAAGCCGAATATCGTCGGGATGAAGAGGATGATCGAGACGAAGAAGAGGACTTGGAGGAAATGGATCACTTCCTGCCAGACACGCCACCGACTCCTCCAATCGTCCCACTGCGCCGGGAAAAGCCCGCCAACAATGTGACGCCCATTTGCTGCCTAAAGCACTGCAGGAAGGAACGTACTGCCTTTCACCTTCTCAGCACCTTTGGTTTTCCCAAGGATCGCCAGCTGCTGCTCAAGTGGTGTGCCAATCTTCACCTGAATCCGGATGATTGCATCGGCCGGGTTTGCATAGAGCACTTCCAGGCTGAGGTACTCGGAACCCGAAAGCTCAAGCAGAATGCGGTACCCACACTCAACGTGGGACATAATGAGCCACTTAGATACTCGTGTAATGGAATGGATCTGGATCTGGAGCAATCACAGCCACAGCACTCGGTTTTTCGGCTTTGGAGCCTGAAACACTGCCGCAAGAGGAAGCTAACAGAGCCGCCGGATATTCGACCAAGCAAATGGAGGACAGCGGAAGTTCAGATGATGCAGAGATTGAAGATGGAGATTCAGGAAGAGAGGAAGATCAAGATGGAGATGCAGACGGAGAGGGATATAAAGACGGAGGCGAAGACTCTAACGAAGAATCAGAGGGAGAGTAAACCGATAAAATGTTGCATCAGCACCTGCGCAAAAGAGGAGGATAAGCAATTATTCTCACTGCCTGAGGAGCGAAGTCTTTTAAGAAAGTGGCAGCACAACCTAAAGCTCTCCATGGACACGAGTTTCAGCGATATTCGAGTATGTCTGTATCATTTTGAAGCGGAAGTTATGGAAAATGGAAAGCCGTTGGAGCAGGCAATTCCCACCTTAAGGCTAGACCAAAATAGTTGGAACATCTACAGAAACAACGGAGCTTGTCTGATCGCCGCTTGTGAAAATTCTTCCTCAAGCTTAGTGGACTTGCCTGGAAATATGATAATTAGAACCGCCTGGATGTCCCACCTTAATCTGCCTCTCGGCAGTGATGGTCTTCTATGTGGCTCCCACTTCATGGAGCTGTATGAACAAGTGGAATTGCCCAAGGTTCTCGCAGAAAAGGATTTGGAGGATTTGCTGTGGACTGCTGACGAACTCAAATGCGCTGTGCCTGGTTGCTCCTCCAAAAATGTCAAGGATCTTCAGCTCACTCAGCTTCCAGACAAGGAGGAGACGCTTTTCAAGTGGCTACATAATACTAAGATAGCTTACGATCATTCGAGGCATAAAAGCTATCGCATCTGTGTGCGCCACTTTGAACCAGCGTGCATAGAAGCGGATTTTCCAAAACCATGGGCTATACCCACCTTGCATCTGAGCCATGAGGGCAAGATTCACTTGAATCCCTGTCAGCAAGATCTTGAGTCACGCAGTATAACTCCCAATAGCAATGCAAGGCTAACTCCACTAAGAATTAAAACAGATCTCGCATCTCTGAGCAGTCCCTGCGCGAGTGCAAGTCCCAGTCCTCGAGGCAGGATGAGGATATGTTGTATTCCCACATGTGGACAGTTTGGAAACAGCCAAATACGGCTCTACCGCTTCCCCACCGAAGAGCAGGCTTTGCTCCGGTGGCTGGTGAACACGCAACAGCAACCCCGCCTTGTGGATCCCCTGGAGCTTTACGTGTGCCAGTCTCACTTCGAACCCGATGCCATTTGTAAGAAGCAACTTCGCAGCTGGGCAGAGCCCACATTAAACTTGGGCCACGACGGCTATGTTATCCCCAATGCCAGGCACAACGGAAACATCGCTGGCGGGCAGGACACTGAGCAGGCGATGAGGTTTATCCGGGAACGCTTTTGCTCCGTGCTGTCTTGTTTCCAGGCTGAAGATAGTGGAATACGGCTCTATGAGTATCCCAAGGATATGGCAACGATACGAAAGTGGGCAGCCGCCTGCAGACATCGCTCGATGCAGGCCAGCAGCCATGGGTTCAAGGTGTGCCAGTCTCATTTTGCCCCGGAATGCTTTCAACCGGACACTTTGGATTTAATTGACGGATCAGTTCCAACTCTGGAGTTAAGCAGAGATGACATTGAAAAACACTGCTTGGTGCCCGGATGTGTGAAGGATGCGAGTGGCGACCGTCTCCGCTTCTACAAGGTACCAAAGAACGCTGCTCATCTGGAAGCTTGGAGCAACAACCTGAAGATCAATTCCCTGGACCTCGGTCAGGGAGAGCAGCTCATCTGCGAGCGCCACTTTGAATCCTTTTGTTTTGGTGCCAACAGGGGTTTGCGCCCTGGGGCGCTTCCGACTCTTTTGCTTGGTCATGACGAGCAGGTGGAGATGTTACCCAATCCCGAAAATCTCTGTCAAAGTAAACCAGAGGTGTGCTGTGCACCTGGATGCGGACGGGTACGGCAGCTGGGAGACGCTCAGTTCAATGGTTTTCCGAAAGTATTGGCGTTGGCCGAGAAGTGGATGTATAACCTCCGTCTGAGAGTTACTAAGGATCAGCTAGGCAGGCTGAAAGTCTGCAGTGAACACTTTGAATCCTCTCTCTTTGAAAAAAGTGGATTAATCTCCGGTTCGATACCCACTCTGGAACTGGGACATTCCTCTCCGGACATTTTCCAGACGGAGCTACAAAATCTGGGCAAATGCTTAAAGCTTTCCAAGCGAGCCCTGATGCCGGATGTCGATTGCTGTTATCCTGAGTGCAAAGAATTCTCTAGGAACCTGTCTTACACTCTGCCCCATGAGGAGAACCTCAGAAGAGCTTGGCTGCGTCATTTGGACATCGAAGAGCCGGCTAATGGTGTCGGCCAGCTTTGTCCGCTGCATTATGTGATTCTCTATGATCTCAGTGATAAAAACTTTCCAGAGCACGTTCCAAATAGATTCCTCGAAGATAATTACCATTCTGCTCGAAGCAATCGGCGCGTGAAAATAGTTAGCTGCGCAGTCAAAGGTTGTGAGATGATCAGGCCCCGGGATAAAGTTCTGTTGCACGGATTGCCGCAAAGAAAAGACATCCTCAAGATGTGGGTGGAAAATGGACAATTGGAGATTACGGAGCAGCAGCATCAATACATGCTCAAGGTATGTCGCAACCACTTTGAGTCACGCTGCTCGTTTGATGACCGAAGGCTGCATCCCTGGAGCGTTCCCACTCTGCACTTGCCAGCAGATCCTGTGCATCAGATTCCCACCAAAGAGGAGTGGCTCGAGATGACAGCCAAACTGACTCAGGAAGCCGGGACAATCAAACAAGAAAGGGTGGAGGAATTTCAGGAGGAGGACGAGTGTGACAACTCTCTGTTGGAACCCATTGTAAGAATGGAGCACATCGAGTCCGATGAGGAAGACTCGGAGATGCAGGCTCTGGAGGTGCTTCTGGAGGTTGGTCATGTTGAGCGGATGGACAGCTACGAGAAGGTGGACAAATCCTATAACGAACTCGCCTCCATTTACCAACCTATTGGCATTCGGAACCAGTACAATGCCAACCACTGTGCCGTTGAGGGATGCGAGGTGACTGTTGAGGACGTGGATGGGACTATTAAGCTTCACAAATTCCCCGCCTCTTCGGAGGCTGCTAGGAAGTGGATGCACAACACCCAAGTTGACATGGACGAGAAGTTCTGGTGGCGCTATCGCATTTGCAGTTACCATTTCGATCAGGAGTGCTTTCAAAGCGCCAGGATAAAGAAGGGAGCGATGCCCACTCTACTCTTGGGGCCAAAGAGACCGGACAAGCTGTACGAGAATGAGTTTGCCATACAGGATATGGAAGAGCTTCTTTTGCCTTTGCCACAAGGTGCTCTGCCAAGTGAGCATAAGGGGGAGACCGTTCGAGAGGTCACCAAATTATGCATGCCGACGCCGGCTCCGCCTCAAAAGTCCAGCAAGTTTTGTCAGATTGAGGGATGTATGAATCACCTGACCACTGAAAACATGACGCTGCACAAATTCCCTCATTCCGAGGACATGTGCCTCAAGTGGCAGCACAACACACAGGTGCCATTCGATCCCTTTTACCGGTGGCGCTATCGCATCTGCAGTGCCCACTTTCATCCGGTGTGCCTGCTCAACATGCGACTAGTTCACGGCAGTGTGCCCACGCTGAAACTGGGAAGCAAGGCTCCCAGCGAGCTCTTCGACAACGACTTCGAGGCCATCAACCTTAGGCTGGACAAGAGGTCGGGAGCGGAGTCAAGCAACGTACAGATCAAGGAGGAAAGGGATGAAGACGAAGACTCTATGCTGTTCCTAGAGCCAGAGTTGCAGCTGCACGAGGACCAAGAAGAGGAGGATACGGTACCTATACAACTATCGTTTAGCCAGTCAAACTGGAAAAGCCATTTACGTCTTCCTGTTAAGCAAGAGAAGGTTACCTACAACCAGGTAAAGTCGGGATACGATAAGTGCTCATTGGCTCATTGCCAGCGTCAGAGATCTCAGCACGGCGTCCACATATACAAGTTCCCCAAATCGAGGCGCCAGCAAGACCGTTGGATGCACAACCTACGCATCCGTTACGATGAGCGGCGTCCGTGGAAGTTCATGATCTGCAGCGTTCACTTCGAGCCGCACTGCATCAGCCTGAGGAAGCTGCGCCCCTGGGCGGTGCCCACGCTGGAGCTGGGCGTCAATGTGCCGGAGAAGATCTTCACGAACGAACAGTGCCAGGAGCTAGCAACAGATCGCAGTGAGGCCGAAAGCGACGGCGGCGAGGAGGAGGATGGCCTACAGGAGGACGAGGAAGACGAGGATGGCCTACAGGAGGACGATGAAATGGAGCCGGAGGTTCGCATCAAGCGAGAGCGACGTTCCAAGTTCGACCCTTGGCCTCCTGGCACGATTCCGCCGTGGAAGGTCAAGCAGTGCTGCCTCCCGTACTGCCGCGCCTTCCGTGGCGAAGGGATCAAGCTGTTCCGGCTGCCCAATAACCGCACCTCCGTCCGCAACTGGGAGCTGGCAACGGGCATGGTCTTCAAGGAGACTCAGCGAAATACGCGATTGATCTGCAGCCGTCACTTCGAGCCCGAGTTGATTGGGGTAAGGCGTCTCATGCGCAACGCCATCCCCACGCGGCATTTGAATCCCCAAGGAGGTGTCTCGGTCGAAGTTAAGAAAAAGCCAAATCCTCCCGTCCCCATTGCAACCTGTTGCATGGCTGACTGCCATCACAATGGAAATGTCAAGCTCCACAAGTTTCCCAGTGatccCTCGCTGCTTAGACAGTGGTGCCAAGCACTCAGGCTTACGGATACTCAGAGATACCGGGGCAAACATATCTGCTCGGTCCACCTGCCCACCGACAAGACCATAAGATGCGTTATCTGCGAGGTGGACAACGTTCAGCTGCCGATGCTGGACTTTCCGGAGCAGCGCAATCAGCGCGCCAAGTGGTGCTACAATCTCAAGATCGAGGCCATACCAAAGTGGGACCGCTCCAAGCACATCTGCTGTCGTCACTTTGAGTCGCATTGTTTTGCCCAGCCTGGTGAATTGCGTCCTGGTGCAATTCCCACGCTGCATTTGAACCACGACGATACGAACATATTCCTCAGCGACTACGCCAGTGGTCCGACCAGCAATCGGATCAAGGACGAGCCCATGGACAACGACGACATGCTGCTGGTTTAG
Protein Sequence: MSQQHPHHAHPHPHHYAHHYPPPATPMSLQQQQQQQLQQTQQTPQQQHANWYSHVASYPTPHSAFGPAPAPDPSCKATSNSNNNIMGGGGGGYGPQGGGGGTQGYYGAAGGGLNVSGTVVGGGGPSYGLGANTVAYAHNQLLQYQQQQQQQQQQQHQQLPQHLSQQRPYMGHNIMTGSYPYIKSEPMEAFQQPPNPMAPPPAPEILIKSEPIDEHSYKSNYIDDNTPFADFSKFSEFSEDMLSPKVELTVKNESYGRNTSSFLRRKQQLDRSSESLPICQRCKEVFFKKQAYLRHVAESNCGMQEYDFKCTTCPMSFMTTEELQRHKHLHRADKFFCHKYCGKHFDTIAECEAHEYMQHEYDSFVCNMCSGTFATREQLYAHLPQHKFQQRFDCPICRLWYQTALELHEHRLAAPYFCGKYYTGVQATSGSHSQAQQHQTNYKLQDCHMATMEMPTAPHHKSNPSSSSLPATAALNSLLQQRQANADGAAMFAASALKNDVNVKLERSYSNSTSESSYSVQENSYNNAYGSDSSIHGGAIAGPQAHSSTLDDSEDALCCVPLCGVRKSTSPTLQFFTFPKDEKYLNQWLHNLKMFHIPAASYANFRICSMHFPKRCINRYSLCYWAVPTFNLGHDDVANLYQNRELTNTFTTGEVARCSMPHCTSQRGESNLKFYNFPKDIKSLIKWCQNARLPVQAKEPRHFCSRHFEERCIGKFRLKPWAVPTLHLGAQYGKIHDNPKNLYVEEKRCCLNFCRRSRSSDFNMSLYRFPRDEVLLRRWCYNLRLDPGVYRGKNHKICSAHFIKEALGLRKLSPGAVPTLHLGHTDTFNIYENELWPPPTASNSHSNVLQQHQAHHHHSQHSLQQHLHSKSYQRHSAASTSSSASSTSHYVDPELTSSYLAMGAGGSSAMNASDSMDICCVPSCESKRHNNENITFHTIPRRPEQMRKWCHNLKIPEEKMHKGMRICSLHFEPYCIGGCMRPFAVPTLNLGHDEEDIHRNPDVIKKLNIRETCCVAVCKRNRDRDHANLHRFPSNVSLLTKWCGNLQRAVPDGSKLFNDAICEVHFEDRCLRNKRLEKWAVPTLILGHENIPYPLPTPEQVTEFYSRPTAPNNGEEQGECCVESCKRNPSVDDIKLYRPPEEASVLAKWAHNLQTEASQLTSMRICNLHFEAHCIGKRMRPWAIPTLNLAGNIENLYENPEHSMLYKRRTHTKTKLPASVKPTWVPRCCLPHCRKVRALHNVQLYRFPKLNRSTLAKWAHNLQVPMVGSAQRRLCSAHFEPHVLSKKCPVPLAVPTLDLNSPPGLKIYQNPAKLKASKLCLQRVCIVESCRKTRAQGVQLFRLPHSPTQLRKWMHNIKTRPRAAMRAQYRVCSRHFETHSFNGRRLSAGAIPTLELGHDDEDIYPNEAQAFADEHCVVEGCEASKEQAEVRLFRFPTDDDDMLWKWCNNLKMNPVDCTGVRICNKHFEADCIGPKHLYKWAIPTQELGHDDAEIELIPNPKPEDRYVDPVFKCIVPTCGKTRRFDEVQMNSFPKDPNLFQRWQHNLRLDHLNFLERERYKICNAHFEDICIGKTRLNIGSIPTLELGHDETDDLFQVNPSELQSNLFGRQRRIHEESGGIAIKQELSESEDVKPDVTIMPDATDSRTRQVKFKKTMSDLKCCVHSCGRSRMEHGARLFPFPTGKQQHLKWRHNLRLEPDEVDRSTRVCSAHFNRRCIDGKQLRSWAMPTQQLGHHEQPIYENPKNIPGFFTPTCALGHCRKRRSIDNDLRTYRYPRSEDLLEKWRANLRLTPDQCRGRICADHFEAQVRGKLKLKTGAVPTLKLGHDEGLIYDNEAIKVGLTEDEEGSSELPRLKPKKELIDEEEEDGEAEEEHNDQDNEDEDEKDDHYFDPLELVETFAEHPSDDEAEYRRDEEDDRDEEEDLEEMDHFLPDTPPTPPIVPLRREKPANNVTPICCLKHCRKERTAFHLLSTFGFPKDRQLLLKWCANLHLNPDDCIGRVCIEHFQAEVLGTRKLKQNAVPTLNVGHNEPLRYSCNGMDLDLEQSQPQHSVFRLWSLKHCRKRKLTEPPDIRPSKWRTAEVQMMQRLKMEIQEERKIKMEMQTERDIKTEAKTLTKNQRESKPIKCCISTCAKEEDKQLFSLPEERSLLRKWQHNLKLSMDTSFSDIRVCLYHFEAEVMENGKPLEQAIPTLRLDQNSWNIYRNNGACLIAACENSSSSLVDLPGNMIIRTAWMSHLNLPLGSDGLLCGSHFMELYEQVELPKVLAEKDLEDLLWTADELKCAVPGCSSKNVKDLQLTQLPDKEETLFKWLHNTKIAYDHSRHKSYRICVRHFEPACIEADFPKPWAIPTLHLSHEGKIHLNPCQQDLESRSITPNSNARLTPLRIKTDLASLSSPCASASPSPRGRMRICCIPTCGQFGNSQIRLYRFPTEEQALLRWLVNTQQQPRLVDPLELYVCQSHFEPDAICKKQLRSWAEPTLNLGHDGYVIPNARHNGNIAGGQDTEQAMRFIRERFCSVLSCFQAEDSGIRLYEYPKDMATIRKWAAACRHRSMQASSHGFKVCQSHFAPECFQPDTLDLIDGSVPTLELSRDDIEKHCLVPGCVKDASGDRLRFYKVPKNAAHLEAWSNNLKINSLDLGQGEQLICERHFESFCFGANRGLRPGALPTLLLGHDEQVEMLPNPENLCQSKPEVCCAPGCGRVRQLGDAQFNGFPKVLALAEKWMYNLRLRVTKDQLGRLKVCSEHFESSLFEKSGLISGSIPTLELGHSSPDIFQTELQNLGKCLKLSKRALMPDVDCCYPECKEFSRNLSYTLPHEENLRRAWLRHLDIEEPANGVGQLCPLHYVILYDLSDKNFPEHVPNRFLEDNYHSARSNRRVKIVSCAVKGCEMIRPRDKVLLHGLPQRKDILKMWVENGQLEITEQQHQYMLKVCRNHFESRCSFDDRRLHPWSVPTLHLPADPVHQIPTKEEWLEMTAKLTQEAGTIKQERVEEFQEEDECDNSLLEPIVRMEHIESDEEDSEMQALEVLLEVGHVERMDSYEKVDKSYNELASIYQPIGIRNQYNANHCAVEGCEVTVEDVDGTIKLHKFPASSEAARKWMHNTQVDMDEKFWWRYRICSYHFDQECFQSARIKKGAMPTLLLGPKRPDKLYENEFAIQDMEELLLPLPQGALPSEHKGETVREVTKLCMPTPAPPQKSSKFCQIEGCMNHLTTENMTLHKFPHSEDMCLKWQHNTQVPFDPFYRWRYRICSAHFHPVCLLNMRLVHGSVPTLKLGSKAPSELFDNDFEAINLRLDKRSGAESSNVQIKEERDEDEDSMLFLEPELQLHEDQEEEDTVPIQLSFSQSNWKSHLRLPVKQEKVTYNQVKSGYDKCSLAHCQRQRSQHGVHIYKFPKSRRQQDRWMHNLRIRYDERRPWKFMICSVHFEPHCISLRKLRPWAVPTLELGVNVPEKIFTNEQCQELATDRSEAESDGGEEEDGLQEDEEDEDGLQEDDEMEPEVRIKRERRSKFDPWPPGTIPPWKVKQCCLPYCRAFRGEGIKLFRLPNNRTSVRNWELATGMVFKETQRNTRLICSRHFEPELIGVRRLMRNAIPTRHLNPQGGVSVEVKKKPNPPVPIATCCMADCHHNGNVKLHKFPSDPSLLRQWCQALRLTDTQRYRGKHICSVHLPTDKTIRCVICEVDNVQLPMLDFPEQRNQRAKWCYNLKIEAIPKWDRSKHICCRHFESHCFAQPGELRPGAIPTLHLNHDDTNIFLSDYASGPTSNRIKDEPMDNDDMLLV

Similar Transcription Factors

Sequence clustering based on sequence similarity using MMseqs2

100% Identity: iTF_00605601;
90% Identity: iTF_00548096;
80% Identity: -