Basic Information

Insect: Drosophila gaucha
Gene Symbol: -
Assembly: GCA_035045545.1
Location: JAWNOY010000318.1:422575-441413[+]

Transcription Factor Domain

TF Family: THAP
Domain: THAP domain
PFAM: PF05485
TF Group: Zinc-Coordinating Group
Description: The THAP domain is a putative DNA-binding domain (DBD) and probably also binds a zinc ion. It features the conserved C2CH architecture (consensus sequence: Cys - 2-4 residues - Cys - 35-50 residues - Cys - 2 residues - His). Other universal features include the location of the domain at the N-termini of proteins, its size of about 90 residues, a C-terminal AVPTIF box and several other conserved residues. Orthologues of the human THAP domain have been identified in other vertebrates and probably worms and flies, but not in other eukaryotes or any prokaryotes [1].
Hmmscan Out: # of c-Evalue i-Evalue score bias hmm coord from hmm coord to ali coord from ali coord to env coord from env coord to acc

1 30 10 1.9e+04 -9.3 6.1 31 47 29 45 9 58 0.38

2 30 1.5 2.9e+03 -0.8 1.8 45 63 346 367 329 383 0.56

3 30 5e-15 9.8e-12 45.6 4.3 1 86 574 646 574 647 0.85

4 30 3.1e-15 6.1e-12 46.3 4.6 1 87 674 743 674 743 0.83

5 30 7.6e-16 1.5e-12 48.2 0.4 1 87 765 837 765 837 0.85

6 30 6.9e-16 1.3e-12 48.3 5.1 1 86 942 1011 942 1012 0.82

7 30 1e-14 2e-11 44.6 3.6 1 86 1036 1107 1036 1108 0.82

8 30 1.2e-12 2.3e-09 38.0 1.1 1 87 1143 1211 1143 1211 0.80

9 30 8.9e-11 1.7e-07 32.0 1.2 1 86 1255 1324 1255 1325 0.76

10 30 7.7e-17 1.5e-13 51.4 0.2 1 86 1352 1421 1352 1422 0.83

11 30 4.2e-13 8.1e-10 39.4 0.6 1 86 1443 1512 1443 1513 0.80

12 30 1.5e-14 2.9e-11 44.1 1.6 1 86 1540 1611 1540 1612 0.85

13 30 3.2e-13 6.3e-10 39.8 0.7 1 85 1665 1733 1665 1735 0.81

14 30 2.5e-12 5e-09 36.9 0.1 1 86 1758 1826 1758 1827 0.82

15 30 8e-15 1.6e-11 45.0 1.1 1 87 1992 2061 1992 2061 0.80

16 30 1.1e-11 2.1e-08 34.9 0.2 1 62 2125 2186 2125 2203 0.78

17 30 0.0079 15 6.5 0.0 1 58 2208 2260 2208 2276 0.77

18 30 4.1e-13 8.1e-10 39.5 1.2 1 87 2299 2369 2299 2369 0.85

19 30 4.8e-14 9.3e-11 42.5 3.1 1 86 2435 2504 2435 2505 0.81

20 30 3.8e-12 7.5e-09 36.4 0.9 1 86 2540 2611 2540 2612 0.82

21 30 5.7e-13 1.1e-09 39.0 1.0 1 87 2622 2693 2622 2693 0.80

22 30 7.5e-14 1.5e-10 41.8 0.1 1 87 2716 2787 2716 2787 0.83

23 30 4.4e-06 0.0086 16.9 0.1 1 58 2818 2870 2818 2889 0.81

24 30 1.3e-14 2.6e-11 44.2 0.1 1 86 2905 2977 2905 2978 0.81

25 30 3.9e-13 7.5e-10 39.5 0.1 1 86 3136 3208 3136 3209 0.81

26 30 3.6e-14 7.1e-11 42.8 1.7 1 86 3267 3337 3267 3338 0.83

27 30 9.2e-15 1.8e-11 44.8 4.0 1 86 3444 3514 3444 3515 0.85

28 30 9e-14 1.8e-10 41.6 0.1 1 87 3601 3671 3601 3671 0.85

29 30 2e-09 3.8e-06 27.7 0.7 1 58 3685 3733 3685 3744 0.87

30 30 7.7e-10 1.5e-06 29.0 0.8 19 87 3751 3808 3739 3808 0.76

#	of	c-Evalue	i-Evalue	score	bias	hmm coord from	hmm coord to	ali coord from	ali coord to	env coord from	env coord to	acc
1	30	10	1.9e+04	-9.3	6.1	31	47	29	45	9	58	0.38
2	30	1.5	2.9e+03	-0.8	1.8	45	63	346	367	329	383	0.56
3	30	5e-15	9.8e-12	45.6	4.3	1	86	574	646	574	647	0.85
4	30	3.1e-15	6.1e-12	46.3	4.6	1	87	674	743	674	743	0.83
5	30	7.6e-16	1.5e-12	48.2	0.4	1	87	765	837	765	837	0.85
6	30	6.9e-16	1.3e-12	48.3	5.1	1	86	942	1011	942	1012	0.82
7	30	1e-14	2e-11	44.6	3.6	1	86	1036	1107	1036	1108	0.82
8	30	1.2e-12	2.3e-09	38.0	1.1	1	87	1143	1211	1143	1211	0.80
9	30	8.9e-11	1.7e-07	32.0	1.2	1	86	1255	1324	1255	1325	0.76
10	30	7.7e-17	1.5e-13	51.4	0.2	1	86	1352	1421	1352	1422	0.83
11	30	4.2e-13	8.1e-10	39.4	0.6	1	86	1443	1512	1443	1513	0.80
12	30	1.5e-14	2.9e-11	44.1	1.6	1	86	1540	1611	1540	1612	0.85
13	30	3.2e-13	6.3e-10	39.8	0.7	1	85	1665	1733	1665	1735	0.81
14	30	2.5e-12	5e-09	36.9	0.1	1	86	1758	1826	1758	1827	0.82
15	30	8e-15	1.6e-11	45.0	1.1	1	87	1992	2061	1992	2061	0.80
16	30	1.1e-11	2.1e-08	34.9	0.2	1	62	2125	2186	2125	2203	0.78
17	30	0.0079	15	6.5	0.0	1	58	2208	2260	2208	2276	0.77
18	30	4.1e-13	8.1e-10	39.5	1.2	1	87	2299	2369	2299	2369	0.85
19	30	4.8e-14	9.3e-11	42.5	3.1	1	86	2435	2504	2435	2505	0.81
20	30	3.8e-12	7.5e-09	36.4	0.9	1	86	2540	2611	2540	2612	0.82
21	30	5.7e-13	1.1e-09	39.0	1.0	1	87	2622	2693	2622	2693	0.80
22	30	7.5e-14	1.5e-10	41.8	0.1	1	87	2716	2787	2716	2787	0.83
23	30	4.4e-06	0.0086	16.9	0.1	1	58	2818	2870	2818	2889	0.81
24	30	1.3e-14	2.6e-11	44.2	0.1	1	86	2905	2977	2905	2978	0.81
25	30	3.9e-13	7.5e-10	39.5	0.1	1	86	3136	3208	3136	3209	0.81
26	30	3.6e-14	7.1e-11	42.8	1.7	1	86	3267	3337	3267	3338	0.83
27	30	9.2e-15	1.8e-11	44.8	4.0	1	86	3444	3514	3444	3515	0.85
28	30	9e-14	1.8e-10	41.6	0.1	1	87	3601	3671	3601	3671	0.85
29	30	2e-09	3.8e-06	27.7	0.7	1	58	3685	3733	3685	3744	0.87
30	30	7.7e-10	1.5e-06	29.0	0.8	19	87	3751	3808	3739	3808	0.76

Sequence Information

Coding Sequence: ATGTCACAACACAATAATCAaccgcattcgcattcgcattcgcatcagcatcaacaacaacatcttcACTactaccagcagcagcaacagcatctacagcagcaacaacaacaccaacagcagtcgcagcagcagcagcagcatttacagcataaacaaatacaacagcagcacagtTGGTACTCACATGTTGCTTCCTACCCGCCCCAACAGCCGCACCCCTATGCGACGCCCTGCAAGAGCAGCatcaccaacaacaaccataataataacaacaacaacattatgaATGCATACGGAACGGGTGGCACGCACTATTacggtgctgctgctgctgcgggggTGGGCTATAACCTTGAGGCCAATACTGTGGCCTATGCGCACAACCAGCTGCtgcaataccaacaacaacaacaacaacagcagcagcatccacaGCTCAGTCAACGCTCGTATATGCCGCACAGCATAATGCACGCGTCGTATCCTTATATAAAGAGCGAACCGTTGGAGCTGCCCGATGATAGACAACGCCATCAACAACACCAAAAccaaacgcagcagcagcagcagctacaacactTTCAAAATCCAATGGCACCGCCGCCAGCACCCGCCGCCAATCGCCACACGCTCGATGCCAGTGGtgaaatgataataaaatCGGAACCCATTGACGAACATGCGTTCAAGTCCAACTATATCGATGATAATACGCCCTTTGCCGATTTTAGCAAGTTTCCCGAATTCGGCGATGAAATGCTGAGTCCAAAGGTGGAGCTGACTGTCAAGGATGATGCCTATGGCAGCCAAAAGAACCCGCTTAGCTTTCCGCGCCGCAAGCTGCAAACGGAACGCTCCTCGGAGAGTCTTCCCATTTGCCAGCGGTGCAAGGAGGTGTTCTTCAAGAAGCAAATCTATCTGCGTCATGTGGCcgagagcagctgcagcatacACGAGTACGACTACAAATGCAACATCTGCCCTATGTCCTTCATGGGCGTCGAGGAGCTGCAGAAGCACAAGCAACTGCATCGCACTGACAAGTTCTTTTGCCACAAATACTGTGGCAAGCACTTTGACAACATTGCCGATTGCGAGTCGCACGAGTATATGCAACATGACTACGACAGTTTTGTGTGCAACATGTGCTCCGTGACATTTGACACGCGTGAACAGCTTTATGCTCATTTGCCACAGCACAAGTTTCAACAGCGTTACGATTGTCCCATCTGTCGCTTGTGGTATCAGACGGCGCTGGAGTTGCACGAGCATCGTCTAGCGGCGCCTTACTTTTGTGGCAAGTACTATGCGGCAacacaccagcaacaacaacagcagcagcagcagcaattgtcgGAGCAGAGCAACTACAAATTGCAGGATTGCCACATGGGCACCATAGAGATGACTGCGCCGCAGCATAAGCCGAATGCGTTGCCTGCCACAGCGGCACTTAGTTCcttgctgcagcagcgtcaAGCCAATGCCGATGGCGGCGCCTCTCTGTTTGCCTCTTCGCTCAAGAACGAACCGAGCGTTAATGTTAAGCTGGAGCGCAGCTACAGCAACTCCACCAGCGAGTCCGGATATAGTCTGCACGAGAGCAGCGGCTACAATAATGCTTACGGCAGTGACAACTCGTTGCATGGCGGCGGCGCTGCCATTGGTGGACCGCAGGCACATTCTTCCACGCTGGACGAATCGGAGGATGCGCTGTGCTGTGTGCCGCTGTGTGGTGTACGCAAAAGCACCAGCCCCACTCTGCAGTTCTTTACGTTTCCCAAGGACGAGAAGTATCTGCATCAGTGGCTGCACAATCTCAAAATGTTTCACATACCCGCCTCGAGCTATGCCAGCTTTCGCATCTGCAGCATGCATTTCCCAAAGCGGTGTATTAATCGCTATTCGTTGTGCTATTGGGCGGTGCCCACGTTCAATCTGGGCCACGATGATGTCGCCAATTTGTATCAGAATAGAGAGTTGACCAACACCTTTACCACCGGCGAGGTGGCACGCTGCAGCATGCCCAATTGCACGAGTCAGCGCGGCGAAAGCAATCTCAAGTTTTACAATTTCCCCAAGGACATCAAGAGCCTGATCAAATGGTGTCAGAACGCACGTCTGCCCGTCCAGGCCAAAGAGCCGCGTCATTTCTGCAGTCGTCACTTCGAGGAGCGTTGCATTGGCAAATTCCGACTGAAGCCCTGGGCTGTGCCCACACTCCATTTGGGCGCTCAGTATGGCAAGATTCATGACAATCCCAAGAATCTGTATGTGGAGGAGAAACGCTGCTGCCTGAACTTTTGTCGACGCAGCCGTTCCTCGGACTTCAACATGTCCCTCTATCGCTTCCCCAGAGATGAGGTCCTGCTGCGTCGCTGGTGCTATAATCTAAGACTCGATCCGGCCGTCTACCGGGGCAAGAATCACAAGATATGCAGCGCCCACTTCATCAAGGAGGCTCTCGGCTTACGCAAATTGTCGCCTGGAGCTGTGCCGACTCTTCATCTGGGTCACAATGACACCTTCAATATCTACGAGAACGAGCTGTGGCCACCACCAACACCCTCGACGCCCACCCACCAcaatcatcatcagcagcagcagcaactgcagcagcatcatctgcagcagcatcaacagcagcagcagcaggtccATCACAAATATCAGAGGCATTCTGCTGCATCCACATCCTCGTCGGCGAGCTCGGCATCCCACTATGTGGATCCAGAACTAAGTTCCTCGTACATGGCCATGGGCATGGGCGGTGGTGCCTCATCCTCTGGTCTGATGAATGTGAGCGACAGCATGGACGTCTGCTGTGTGCCCAGCTGCGAGAGCAAGCGGCACAACAATGAGAACATCACATTCCACACGATACCCAGGCGGCCGGAGCAGATGCGCAAGTGGTGTCACAATCTGCGCATACCCGAGGACAAGATGCACAAGGGCATGCGTATATGTAGTCTACATTTCGAGCCCTATTGCATTGGCGGCTGCATGCGTCCGTTCGCGGTGCCCACGCTGCAGCTGGGCCACGACGAGGAGGACATTCATCGCAATCCGGACGTGATCAAGAAACTGAACATACGCGAAACCTGTTGTGTGGCTGTTTGCAAACGCAATCGGGATCGTGATCATGCCAATCTGCATCGCTTTCCCAGCAATGTGCCCCTGCTAACCAAATGGTGTGCCAATCTACAGCGATCTGTGCCGGATGGCAGTAAACTCTTTAACGATGCCATCTGCGAGGTGCACTTCGAGGATCGCTGCTTGCGCAACAAGCGGCTGGAGAAGTGGGCAGTGCCCACACTTGTTCTCGGCCACGAGAACATTGCTTATCCGCTGCCCACGCCCGAGCAAGTGGCCGAGTTTTATGCCCGGCCGAGTGCTCCGAACAATGGCGAGGAGCAGGGCGAATGCTGTGTGGAGACCTGCAAGCGTAATCCCAGCGTGGATGACATCAAGCTCTATCGCCCGCCCGAGGAGTCGCAAGTGCTGAACAAGTGGGCTCACAATCTGCAAATCGACATTGCCCAGCTACCTGCGATGCGCATTTGCAATCTGCACTTTGAATCCCATTGCATTGGCAAGCGAATGCGCCCGTGGGCCATACCCACGCTCAATCTGGCCAACAACATAGAGAATCTCTTTGAGAATCCCGAGCAGCAAATGTTATACAAGCGACGCAGTTCACATCTCAGCAGGAACAGAGAAGGAGGTGACGGTAGCATCAAGCCCACCTGGGTGCCACGCTGTTGCCTGCCCCATTGCCGCAAGGTGCGCGCTCTGCACAATGTCCAATTGTATCGCTTTCCCAAGCTCAATCGTGCCACCTTGGCTAAGTGGGCGCATAATCTGCAAGTGCCGCTGGTCGGCAGTGCTCAGAGGCGTCTCTGCTCGGCGCACTTTGAGCCGCATGTGCTCAGCAAGAAGTGCCCGGTGCCGTTGGCGGTGCCCACGCTCGATCTCAACACTCCGCCCGGCTACAAGATTTACCAGAATCCGGCCAAGATAAAGGCGAACAAGCTGTGCCTGCAGCGCGTCTGCATCGTGGAGAGCTGTCGCCGGCAGCGAGGCCAGGGCGTCCAGCTCTTCCGCCTGCCGCACAGTCCTACCCAGCTGCGCAAGTGGATGCACAACATACAGATGCGACCGCGCGGTGCAATGCGGCAACAGTATCGCATCTGCTCCCGGCACTTCGAGACGCATTCGTTCAATGGCAAGCGGCTGAGCACGGGCGCCATTCCCACTCTGGAGCTGGGACATGAGGACGACGACATTTATCCGAATGAGGCGCAATCGTTTGTCGAGGAGCACTGCACCATCGAGGGCTGTGACGCATCCAAGGAGCAGGCGGATGTGCGTCTCTTCCGTTTTCCCAATGATGACGAGGATCTGCTGTGGAAGTGGTGCAACAATCTGAAAATGAATCCAATTGATTGCATTGGCATGCGCATCTGCAACAAGCATTTCGAAGCGGACTGCATCGGACCCAAGCATCTCTACAAGTGGGCTATACCCACGTTGATGCTGGGCCATGACGATGTTCAGATCGAGCTCATATCGAACCCGAAGCCGGAGGAACGCTATGTGGATCCGGTGTTCAAGTGCTGTGTGCCCACCTGTGGCAAGACGCGCAAATTCGATGAGGTGCAAATGAATAGCTTTCCCAAGGACTCGACGCTCTTCGAGCGCTGGCGCCACAATCTCCGACTCGAGCATCTCAATTTCAAGGAACGCGAAcgctataaaatttgtaatgctCATTTTGAAGACATTTGCATTGGGAAGACGCGCCTCAACATTGGATCCATACCCACTCTGGAGCTGGGCCACGACGAGACCGAAGATCTGTATCGTGTCAATCCCGACGATGTACAGAGCAATCTGTTTGGACGACAGCGACGCGTCAACATCAAGCCGGACCCGGACGAGCACTTTACCAGACAGGTTAAGCTTAAACGATCCCAGTCGGAGCTTAAGTGCTGTGTGGCGAGCTGTGGACGCAGTCGATTAGAAAATGGTGCTCGCTTGTTTCCCTTTCCCACAGGCAAGCATCAGCTGAGCAAGTGGCGTCACAATCTGCGCCTCAAGGCCGGCGATGTGGATAGGACGACACGTATTTGCAGTGCCCATTTCAATCGACGCTGCATCGATGGCAAGCAGCTACGGGGATGGGCCATGCCCACACAGCAGCTGGGCCACCAGGAGCCGAACATCTATGAGAATCCAAAGAATATACCGGGCTTCTTTACGCCCACCTGTGCGCTGGCGCATTGTCGTAAAAGGCGAAGCATTGACAACGATTTGCGAACCTATCGCTATCCGCGCAGCGAGGAGTTGCTCGAGAAATGGCGTGTGAATCTCCGCCTGACGCCAGATCAATGTCGTGGTCGCATTTGTGCGGATCACTTTGAGCCCCTCGTGCGTGgcaagctgaagctgaagacGGGCGCGGTGCCCACGCTGAAGCTGGGTCACGACGAAGGCGTGGTCTTTGACAATGAAGCTATTAAAGTGGGTCTGCAcccggaggaggaggaggacgcTGATGCTGGAGAGGCGGCGAACAGCTTGGACTCTCTCGTAAAGGTGAAGAGTGAACAGCAGCAAGAAGAGGAGCAGCAGTTTGTAAATGATGACCAAGatgaagaggaggaggaggagcagaatgaagaagaggaagagcagCAGGATGAATTTGACGATGAGGAGGAGGACCAACAGGAGCACGGTTATTTTGATCCATTGGAGCTTGTGGAAACCTTTGCCGAACAGCATAGCGAAGATGACCAACTCTATAATGACGAAGATGAGGAGGATGTtgacaatgatgatgacgaGGAGGAGGATATACCTGGCAACGATGATGAGCTGTTGCTGCCCGATACTCTGCCCATTCAGCTACCATTTCCAGCTCAACGTGAAAAACGAGAGAAAGCCGTGAATAATGTCACGCCCATTTGTTGTCTCAAGCATTGTCGCAAGGAGCGCACTGCGAGCCATCAGCTGAGCACCTTTGGTTTCCCCAaggatcagcagcagctgctcaaatGGAGCGCCAATCTACAGCTAGATCCATCCGATTGTGTCGGACGCGTTTGTATTGAACACTTCGAGTCGGAGATGTTGGGCACACGCAAGCTCAAGCAGAACGCGGTACCCACCTTGAATTTGggccatgccacgcccctgagCTACCGTTGCAATGGACAAGCTGTCGACATACATGATGCACAGCCGCAGCATTCGGTTTTTCGGCTTTGGAGCCTGAAACACTGCCGCAAAAGGAAGTCGCCGCTGGCGACGACAACGGAGACGGAGATGAGTTTGGCAgagacgatgacgacgactaGGCGTCGCTGCTGCCTGCCCAGCTGTGGCAAGAAACCGGAGCTGCATGGCGTCAAGCTTCGACGCATGCCGAAGGAACGTTTGCTGCTGCGCAAGTGGCTGCACAATCTAAAGCTGCCTGAACACCTGCAGCTGTACACCAGCAAGTCTTTTGTGTGCGAGGAGCACTTTGAGAAGCAGTCCACGTTGCCCACCCTGCAGCTAGGGCACACGGACAGCAATATTTATCGGAGCATCAACTCAATGGCAGCCGGTAGCTGTCTGGTGCCGAGCTGCCTATGTGCACGTCTTCATATCTATCGTGGCTATCCGCTGCCCGAACATCCGCAGGTGCAGGCGGCCTGGCTGAAGTGGCTTCAACTGCCGCAGCGTCCTCCCCACCTATCGAGCCATGCCGAGCTGTGCGTCATGCACTATATGCAGCTGTTCGAGCAGGTGCCGCTGCCGGACGACCTGCCCGAGCTGGTGCTGTGCGAGCTGAAGGAGACCTATGAACAGATCGCCACTTCCAGCATGGCTATGGCGCTGCGCTGTGCCGTGCCCGGTTGCCAAGCCAAATACACGGACAATGTACGTCTCACCAAGCTGCCCGTTTGCCAAAAGACTCGCGCGCAATGGCTGCACAATATAAAGATCGACTACGATCCGGAGCGTCATCATCTCTATCGCATCTGCATGCGGCATTTCGAGCCGCACTGCCTGGGCTTAGTGCGTCCCAGACTGTGGGCGGTGCCCACGCTGCATCTCAACCACAACGATCCGGGCATCTATCAGAATCCCAAGATGAAAAACAATGCTGTTGGCATAGCAAGCCAGCCGCTGCCTGTCGTCCCTGTGGAATTGCCGCTGCGCATCAAGACAGAGCTGCCGCACTTCCTGTCCCTTAGTCCCACGGCCAGTGCGAGCGCAAGTCCGAGTCCTCGGGGCAAACTGCGCACCTGCTGCATTCCCAGCTGCGGACAGCAGGCGAATCCGCTCACGCGTCTCTTTCGCTTTCCCAGCACTGAGACGGCACTGCTCAAATGGCTGGTGAATACGCAACAGCAGCCCCGCCAGGTGGATGCACAGCATCTGTTCGTCTGCCAGAAACACTTCGTGCGAGATGCCTTTTGCAACAAGCAGCTCCGCAGCTGGGCTGTGCCGACGCTGAAACTGGGCCACCACGGCCATGTCATACGCAATGCAAGGCACAATGGCAACATTGCCAACAGCCAGGAGGACAAGCAGGCTTTGCAGTACATCTGGGCCAACTACTGCTCGGTGCTCACCTGCTTCCAGCAGCGCAGCGACAATCTGCGTCTCTTCGCCTATCCCACGGATCGACCAACCATACGAAGGTGGGCCGCCAACTGTAAGCATCGATCCATGCAGGCTAGCAGCGATGGCTTTCAGGTCTGTCAGTCGCATTTTGCGCCAGATTGCTTTGACCCCGAAACCGGGGAGCTGAAGGAAAACGCTTTGCCTACGCTGGAGCTGAGTCGACCCATCTCTGAGATGCGATGCGTCGTCAATGGCTGCGCCGAGGAGAATGCAACGCGCCGCCGCTTACTGAAAATGCCAAAGCGAACGTCACAGCTGGAGGATTGGTGCCACAATTTACGTATAGATGCGGCGTCTATCGTCGGCCAGGAGTCGCATGTGTGTGAACGGCACTTTGAGGAGCACTGCTTCAATGCGTACAAGATGCTGCGTCCAGGTGCGCGACCCACACTCCATTTGGGCCATGACGCTCACCAGGATGTGCTGCCCAATCCGGCCAAGTGGGAGGAAGATGCGAACGTATGCTTTGTGCCCACTTGTGGACGTTCGAAAGATGTGGACAATGTGGAGCTATTCGGGCTGCCAAAGCTGAGGGCTCTGCTAGAGAAATGGCTGCAAAATTTCCGCTTCGAAACGTTCAAGGGGCACCTGCATGGTCGACGCATATGCAGTGCGCATTTCGAGCCCAGCTGCATAGAAAATGGGCGTCTGCACATGGGTGCCATGCCCACACTCCATCTTGGCCATGACGAGCTGGACAATATACACCAAAGCGTGAAAGAGCTGCCAGCGCCGGTGCGAGGCAAGCGAATGCCCATcaactgcgactgctgctATCCGCACTGCGTGGAGCTCCAGAAGAGCTATCAGAGGATAGCCTACGAGCTGCCAGAACAGCAGCCGCTGCGTGAGACGTGGCTGTCGTTTATGGGACTGGACCAGTCAAACTCGACGCAGCAGACGTTCAAGCTCTGCCCGCTGCACTTGATCATGATGTACGAGCAGTTCCCCGAGCAGTCGGCAGAGGATCAGCTGTTAACCTATAGCTACGAAGCTTCGCGCAACAGCGTGCGCATTCGCCTCGTCAGCTGTGCTGTGCGTGGCTGCAAGACTTTGAAGCCGAGAGATGATTATCGCCTGCACTCGTTGCCAACGCGCCGAGATTTGCTCGAGCTGTGGCTGGACAACATGCAGATGACCTACTATGATAATCAGCGCTATTTGTATCGGGTGTGTGGCAAGCATTTTGAGCCCAAATGCGAGATGGAGATGACGCGACGTCTGAAGACTTGGAGTTTGCCCACGCTGGAGCTGCCGGAGCCGCCAATGCATCAGAATCCCACGGAGGAACAGTGGCAGCGCATGAATGAGCAGCTATCggcacagcagctgctggacgCCGAAGTcaagcaggagcaggagccaGACCAGTCTCAGGTCAAGCTGGAGTCTCAGCTAAAGCTGGAGCCACAGCTTAAGCTGGAGTCACAGCAGGAGCCAGACCAGTCTCAGGTCAAGCTGGAGTCTCAGCTAAAGCTGGAGCCACAGCCCTTGTACGAGGAGGAGTATGAAGAGGCACTAGATGAACAGCAGCCAGATGAGCCACAAGAGCTGGAGGTGCTGCTCGAGGTGGGGCACGTTGAGAAGTGCACCACATACGAGCAAATAGCCACAAAGCCTGCTATAAAATATGTCGAGCAGCTTTACCATAACCCCATAGCACAGACGCAGTCAATGAGCAGCGGCTCAACAGTAAGCCTGAGTCACTACAATGGTCGAAATTGTAGTGTGCGAGGCTGCGGTGTGACGTCGTTCGATCTGAATGGCAATCTGAAGCTGCACAAGTTTCCCGCAGCGCCGGATGCCATGGAGAAGTGGATGCACAATACCCAGGTGGATGTGGACATTAACTTCGTTTGGCGCTTTCGCATTTGCAGCTATCATTTTGCCGCCGAGTGCTTCAGTGGATCGCGCATTAGACGCGGATCCATTCCCACGTTGCGTTTGGGCTCACGACGTCCCGCGCACATTTACGAAAATACATTCAATGCGGAGCAGGAGCAACCGCCAGCTAATAGCGTCACAGTggagcagccagcagcagttgttgAGTCGAAGCATGAAATAAGTCTGCGCCTGCCCCGTCCAGCTCCGCCTCGCAAATCCAGTAAATTCTGTCAAATCGACGGATGCTCGAATCATCTGACCAGTGATAACTTGACGCTTCACAAGTTTCCGCACTCGGCGGACATGTGCGCCAAGTGGCAGCACAATACGCAGGTGCCCTTCGATCCGGAGTTCCGTTGGCGCTATCGCATTTGCAGCGCACACTTTGAGCCCATCTGCCTGGGTAATATGCGACTGATGCACGGAAGTGTGCCCACCTTGAAGCTGGGTCCACGGGCTCCTAAACAACTCTTTGACAATGACTTTGCAGCGATCAACTTGCGTTTGGACAAGGAGAAGCGCAGCGAGCACAACTTTACAATCAAGCAGGAGCAAGTGCAGCAATTCGAGCAGGATGACCACGAGCAGGATGACTTGAGCCTGCTGGTGCCAGAGCTACAGTTGCTGGAAGGCGACGACCAGGACGAACAGCAGGACAATTCTTCGAGCTACAATAACAATTGGAGTCTTTCCAGCGTCAAGCAGGAGAAgtccagcaacagcagcaactttaATCCGATCAAGTCGGGCTATGACAAGTGCTCCTTGGTCCACTGTCAGCGCCAGAGATCACAGCATGGCGTGCACATCTATAAATTTCCACGCTCacgccagctgcagcagcactgGATGCACAATTTGCGCATTCGCTACGATGAGCGACGTCCATGGAAGACCATGATTTGCAGCGCGCACTTTGAGCCGCAGTGCATACGGCTGAGGAAGCTTCGTCCCTGGGCAGTGCCCACTTTGGAGCTGGGCGACAATGTGCCAGAGCAGCTGTACACGAACGAGCAGAGCCAGCAACAGATGGAGGCGGGCAGTGAGGGCGAGAACCAAGGCGAGTGCGAGGATTACGAGTTGGAGGATACGATGCTGGAGGAGTACGACGATGATAATGAAAACAATGAGTCGCAGCTGCTGCCCGCGGAAACGCATATCAAGCAAGAGCGACGTTCACGTTGCGATCCTTTGCCTGCTGGTCAGCTGCCGCCATGGAAAATCAAGCAATGCTGTTTGCCCTATTGCCGCAGTCCACGCGGCGATGGCATCAAACTCTTCCGGCTGCCCAACAACATCAGCGCCATACGCAAATGGGAACAGGCGACGGGCATGCGCTTCTATGAATCTCAGCGCAACACGAAGCTCATCTGCAGTCGTCACTTCGATCCACAGCTAATTGGCGTACGTCGGCTTATGACTAATGCGGTGCCCACAATAAATCTGGGTCCGAATAGCCAAGAACCGGCAACTAGTCCACGCTGCTGCATCACAGATTGCCAACACAATGGGCAGGTTAAGCTGCATAAGTTTCCCAGTGATCCTATGTTGCTCCATCAATGGTGCCAGGCGCTCGACTTACCGGACGTCCAGCGCTATACTGGTAAACACATTTGTGCAGCCCATCTGCCCGCCAAGGCTTATAGTTGCCTCATCTGTGGCGTCGAGGATGTGCAGCTGCCCATGCAGGACTTTCCCGAGAACCGCAATCAGCGTGTCAAATGGTGCTATAATCTAAAAATCGATCCCATTCCCAAGTGGGACAACGCAAAGCACCTCTGCTCTAAGCATTTTGAGAGCTATTGCTTTATACAGCCGGGTCGCCTACTCCCGGATGCGATGCCCACGCTGCATCTGAGGCACAGCGATAACAATATATTCCTCAATGAGTATGCCATAAATAAGAGTAAGATGCTCTGCATCAAGGATGAGCCCATGGAGTGTGACGATCTGATGCTTTAA
Protein Sequence: MSQHNNQPHSHSHSHQHQQQHLHYYQQQQQHLQQQQQHQQQSQQQQQHLQHKQIQQQHSWYSHVASYPPQQPHPYATPCKSSITNNNHNNNNNNIMNAYGTGGTHYYGAAAAAGVGYNLEANTVAYAHNQLLQYQQQQQQQQQHPQLSQRSYMPHSIMHASYPYIKSEPLELPDDRQRHQQHQNQTQQQQQLQHFQNPMAPPPAPAANRHTLDASGEMIIKSEPIDEHAFKSNYIDDNTPFADFSKFPEFGDEMLSPKVELTVKDDAYGSQKNPLSFPRRKLQTERSSESLPICQRCKEVFFKKQIYLRHVAESSCSIHEYDYKCNICPMSFMGVEELQKHKQLHRTDKFFCHKYCGKHFDNIADCESHEYMQHDYDSFVCNMCSVTFDTREQLYAHLPQHKFQQRYDCPICRLWYQTALELHEHRLAAPYFCGKYYAATHQQQQQQQQQQLSEQSNYKLQDCHMGTIEMTAPQHKPNALPATAALSSLLQQRQANADGGASLFASSLKNEPSVNVKLERSYSNSTSESGYSLHESSGYNNAYGSDNSLHGGGAAIGGPQAHSSTLDESEDALCCVPLCGVRKSTSPTLQFFTFPKDEKYLHQWLHNLKMFHIPASSYASFRICSMHFPKRCINRYSLCYWAVPTFNLGHDDVANLYQNRELTNTFTTGEVARCSMPNCTSQRGESNLKFYNFPKDIKSLIKWCQNARLPVQAKEPRHFCSRHFEERCIGKFRLKPWAVPTLHLGAQYGKIHDNPKNLYVEEKRCCLNFCRRSRSSDFNMSLYRFPRDEVLLRRWCYNLRLDPAVYRGKNHKICSAHFIKEALGLRKLSPGAVPTLHLGHNDTFNIYENELWPPPTPSTPTHHNHHQQQQQLQQHHLQQHQQQQQQVHHKYQRHSAASTSSSASSASHYVDPELSSSYMAMGMGGGASSSGLMNVSDSMDVCCVPSCESKRHNNENITFHTIPRRPEQMRKWCHNLRIPEDKMHKGMRICSLHFEPYCIGGCMRPFAVPTLQLGHDEEDIHRNPDVIKKLNIRETCCVAVCKRNRDRDHANLHRFPSNVPLLTKWCANLQRSVPDGSKLFNDAICEVHFEDRCLRNKRLEKWAVPTLVLGHENIAYPLPTPEQVAEFYARPSAPNNGEEQGECCVETCKRNPSVDDIKLYRPPEESQVLNKWAHNLQIDIAQLPAMRICNLHFESHCIGKRMRPWAIPTLNLANNIENLFENPEQQMLYKRRSSHLSRNREGGDGSIKPTWVPRCCLPHCRKVRALHNVQLYRFPKLNRATLAKWAHNLQVPLVGSAQRRLCSAHFEPHVLSKKCPVPLAVPTLDLNTPPGYKIYQNPAKIKANKLCLQRVCIVESCRRQRGQGVQLFRLPHSPTQLRKWMHNIQMRPRGAMRQQYRICSRHFETHSFNGKRLSTGAIPTLELGHEDDDIYPNEAQSFVEEHCTIEGCDASKEQADVRLFRFPNDDEDLLWKWCNNLKMNPIDCIGMRICNKHFEADCIGPKHLYKWAIPTLMLGHDDVQIELISNPKPEERYVDPVFKCCVPTCGKTRKFDEVQMNSFPKDSTLFERWRHNLRLEHLNFKERERYKICNAHFEDICIGKTRLNIGSIPTLELGHDETEDLYRVNPDDVQSNLFGRQRRVNIKPDPDEHFTRQVKLKRSQSELKCCVASCGRSRLENGARLFPFPTGKHQLSKWRHNLRLKAGDVDRTTRICSAHFNRRCIDGKQLRGWAMPTQQLGHQEPNIYENPKNIPGFFTPTCALAHCRKRRSIDNDLRTYRYPRSEELLEKWRVNLRLTPDQCRGRICADHFEPLVRGKLKLKTGAVPTLKLGHDEGVVFDNEAIKVGLHPEEEEDADAGEAANSLDSLVKVKSEQQQEEEQQFVNDDQDEEEEEEQNEEEEEQQDEFDDEEEDQQEHGYFDPLELVETFAEQHSEDDQLYNDEDEEDVDNDDDEEEDIPGNDDELLLPDTLPIQLPFPAQREKREKAVNNVTPICCLKHCRKERTASHQLSTFGFPKDQQQLLKWSANLQLDPSDCVGRVCIEHFESEMLGTRKLKQNAVPTLNLGHATPLSYRCNGQAVDIHDAQPQHSVFRLWSLKHCRKRKSPLATTTETEMSLAETMTTTRRRCCLPSCGKKPELHGVKLRRMPKERLLLRKWLHNLKLPEHLQLYTSKSFVCEEHFEKQSTLPTLQLGHTDSNIYRSINSMAAGSCLVPSCLCARLHIYRGYPLPEHPQVQAAWLKWLQLPQRPPHLSSHAELCVMHYMQLFEQVPLPDDLPELVLCELKETYEQIATSSMAMALRCAVPGCQAKYTDNVRLTKLPVCQKTRAQWLHNIKIDYDPERHHLYRICMRHFEPHCLGLVRPRLWAVPTLHLNHNDPGIYQNPKMKNNAVGIASQPLPVVPVELPLRIKTELPHFLSLSPTASASASPSPRGKLRTCCIPSCGQQANPLTRLFRFPSTETALLKWLVNTQQQPRQVDAQHLFVCQKHFVRDAFCNKQLRSWAVPTLKLGHHGHVIRNARHNGNIANSQEDKQALQYIWANYCSVLTCFQQRSDNLRLFAYPTDRPTIRRWAANCKHRSMQASSDGFQVCQSHFAPDCFDPETGELKENALPTLELSRPISEMRCVVNGCAEENATRRRLLKMPKRTSQLEDWCHNLRIDAASIVGQESHVCERHFEEHCFNAYKMLRPGARPTLHLGHDAHQDVLPNPAKWEEDANVCFVPTCGRSKDVDNVELFGLPKLRALLEKWLQNFRFETFKGHLHGRRICSAHFEPSCIENGRLHMGAMPTLHLGHDELDNIHQSVKELPAPVRGKRMPINCDCCYPHCVELQKSYQRIAYELPEQQPLRETWLSFMGLDQSNSTQQTFKLCPLHLIMMYEQFPEQSAEDQLLTYSYEASRNSVRIRLVSCAVRGCKTLKPRDDYRLHSLPTRRDLLELWLDNMQMTYYDNQRYLYRVCGKHFEPKCEMEMTRRLKTWSLPTLELPEPPMHQNPTEEQWQRMNEQLSAQQLLDAEVKQEQEPDQSQVKLESQLKLEPQLKLESQQEPDQSQVKLESQLKLEPQPLYEEEYEEALDEQQPDEPQELEVLLEVGHVEKCTTYEQIATKPAIKYVEQLYHNPIAQTQSMSSGSTVSLSHYNGRNCSVRGCGVTSFDLNGNLKLHKFPAAPDAMEKWMHNTQVDVDINFVWRFRICSYHFAAECFSGSRIRRGSIPTLRLGSRRPAHIYENTFNAEQEQPPANSVTVEQPAAVVESKHEISLRLPRPAPPRKSSKFCQIDGCSNHLTSDNLTLHKFPHSADMCAKWQHNTQVPFDPEFRWRYRICSAHFEPICLGNMRLMHGSVPTLKLGPRAPKQLFDNDFAAINLRLDKEKRSEHNFTIKQEQVQQFEQDDHEQDDLSLLVPELQLLEGDDQDEQQDNSSSYNNNWSLSSVKQEKSSNSSNFNPIKSGYDKCSLVHCQRQRSQHGVHIYKFPRSRQLQQHWMHNLRIRYDERRPWKTMICSAHFEPQCIRLRKLRPWAVPTLELGDNVPEQLYTNEQSQQQMEAGSEGENQGECEDYELEDTMLEEYDDDNENNESQLLPAETHIKQERRSRCDPLPAGQLPPWKIKQCCLPYCRSPRGDGIKLFRLPNNISAIRKWEQATGMRFYESQRNTKLICSRHFDPQLIGVRRLMTNAVPTINLGPNSQEPATSPRCCITDCQHNGQVKLHKFPSDPMLLHQWCQALDLPDVQRYTGKHICAAHLPAKAYSCLICGVEDVQLPMQDFPENRNQRVKWCYNLKIDPIPKWDNAKHLCSKHFESYCFIQPGRLLPDAMPTLHLRHSDNNIFLNEYAINKSKMLCIKDEPMECDDLML

Similar Transcription Factors

Sequence clustering based on sequence similarity using MMseqs2

100% Identity: iTF_00519952;
90% Identity: -
80% Identity: -