Basic Information

Insect: Drosophila kanapiae
Gene Symbol: -
Assembly: GCA_008042475.1
Location: VNJM01000420.1:169088-184327[+]

Transcription Factor Domain

TF Family: THAP
Domain: THAP domain
PFAM: PF05485
TF Group: Zinc-Coordinating Group
Description: The THAP domain is a putative DNA-binding domain (DBD) and probably also binds a zinc ion. It features the conserved C2CH architecture (consensus sequence: Cys - 2-4 residues - Cys - 35-50 residues - Cys - 2 residues - His). Other universal features include the location of the domain at the N-termini of proteins, its size of about 90 residues, a C-terminal AVPTIF box and several other conserved residues. Orthologues of the human THAP domain have been identified in other vertebrates and probably worms and flies, but not in other eukaryotes or any prokaryotes [1].
Hmmscan Out: # of c-Evalue i-Evalue score bias hmm coord from hmm coord to ali coord from ali coord to env coord from env coord to acc

1 29 4.5 1.2e+04 -2.8 1.2 47 60 333 347 319 364 0.57

2 29 2.4e-15 6.2e-12 46.1 4.0 1 86 560 632 560 633 0.85

3 29 8.9e-15 2.4e-11 44.3 5.0 1 87 660 729 660 729 0.83

4 29 8.1e-16 2.2e-12 47.6 0.2 1 87 751 823 751 823 0.85

5 29 5.3e-16 1.4e-12 48.2 5.5 1 87 921 991 921 991 0.83

6 29 1.9e-15 5.1e-12 46.4 3.6 1 86 1015 1086 1015 1087 0.82

7 29 3.1e-13 8.2e-10 39.4 1.1 1 87 1122 1190 1122 1190 0.81

8 29 6.3e-11 1.7e-07 32.0 1.6 1 86 1232 1301 1232 1302 0.77

9 29 3.9e-17 1e-13 51.8 0.4 1 86 1329 1398 1329 1399 0.83

10 29 4.3e-13 1.1e-09 38.9 1.1 1 86 1420 1489 1420 1490 0.80

11 29 4.4e-14 1.2e-10 42.1 1.2 1 86 1517 1588 1517 1589 0.85

12 29 1.6e-12 4.2e-09 37.1 3.7 1 85 1663 1731 1663 1733 0.82

13 29 3.9e-13 1e-09 39.0 0.2 1 86 1756 1824 1756 1825 0.83

14 29 5.9e-13 1.6e-09 38.5 2.5 1 87 1971 2040 1971 2040 0.80

15 29 5.9e-14 1.6e-10 41.7 0.1 1 86 2126 2197 2126 2198 0.84

16 29 0.00011 0.28 12.0 0.0 1 59 2213 2263 2213 2281 0.81

17 29 2.9e-11 7.7e-08 33.0 0.5 1 86 2292 2362 2292 2371 0.74

18 29 3.5e-12 9.3e-09 36.0 0.2 1 87 2415 2485 2415 2485 0.82

19 29 2.1e-11 5.7e-08 33.5 0.0 1 86 2520 2595 2520 2596 0.82

20 29 2.1e-12 5.6e-09 36.7 0.0 1 86 2606 2679 2606 2680 0.80

21 29 7e-12 1.9e-08 35.0 0.1 1 84 2705 2776 2705 2779 0.69

22 29 0.00088 2.3 9.1 0.1 1 58 2801 2851 2801 2876 0.70

23 29 9.1e-12 2.4e-08 34.7 0.2 1 86 2891 2962 2891 2963 0.82

24 29 3.4e-16 8.9e-13 48.9 0.4 1 86 3075 3147 3075 3148 0.81

25 29 2.9e-12 7.6e-09 36.3 3.5 1 86 3211 3281 3211 3282 0.80

26 29 2.9e-14 7.6e-11 42.7 3.1 1 86 3374 3444 3374 3445 0.85

27 29 1.1e-12 2.9e-09 37.6 0.2 1 86 3525 3594 3525 3595 0.84

28 29 2e-10 5.4e-07 30.3 0.3 1 58 3619 3668 3619 3678 0.82

29 29 3e-10 8e-07 29.8 0.4 18 87 3686 3744 3675 3744 0.76

#	of	c-Evalue	i-Evalue	score	bias	hmm coord from	hmm coord to	ali coord from	ali coord to	env coord from	env coord to	acc
1	29	4.5	1.2e+04	-2.8	1.2	47	60	333	347	319	364	0.57
2	29	2.4e-15	6.2e-12	46.1	4.0	1	86	560	632	560	633	0.85
3	29	8.9e-15	2.4e-11	44.3	5.0	1	87	660	729	660	729	0.83
4	29	8.1e-16	2.2e-12	47.6	0.2	1	87	751	823	751	823	0.85
5	29	5.3e-16	1.4e-12	48.2	5.5	1	87	921	991	921	991	0.83
6	29	1.9e-15	5.1e-12	46.4	3.6	1	86	1015	1086	1015	1087	0.82
7	29	3.1e-13	8.2e-10	39.4	1.1	1	87	1122	1190	1122	1190	0.81
8	29	6.3e-11	1.7e-07	32.0	1.6	1	86	1232	1301	1232	1302	0.77
9	29	3.9e-17	1e-13	51.8	0.4	1	86	1329	1398	1329	1399	0.83
10	29	4.3e-13	1.1e-09	38.9	1.1	1	86	1420	1489	1420	1490	0.80
11	29	4.4e-14	1.2e-10	42.1	1.2	1	86	1517	1588	1517	1589	0.85
12	29	1.6e-12	4.2e-09	37.1	3.7	1	85	1663	1731	1663	1733	0.82
13	29	3.9e-13	1e-09	39.0	0.2	1	86	1756	1824	1756	1825	0.83
14	29	5.9e-13	1.6e-09	38.5	2.5	1	87	1971	2040	1971	2040	0.80
15	29	5.9e-14	1.6e-10	41.7	0.1	1	86	2126	2197	2126	2198	0.84
16	29	0.00011	0.28	12.0	0.0	1	59	2213	2263	2213	2281	0.81
17	29	2.9e-11	7.7e-08	33.0	0.5	1	86	2292	2362	2292	2371	0.74
18	29	3.5e-12	9.3e-09	36.0	0.2	1	87	2415	2485	2415	2485	0.82
19	29	2.1e-11	5.7e-08	33.5	0.0	1	86	2520	2595	2520	2596	0.82
20	29	2.1e-12	5.6e-09	36.7	0.0	1	86	2606	2679	2606	2680	0.80
21	29	7e-12	1.9e-08	35.0	0.1	1	84	2705	2776	2705	2779	0.69
22	29	0.00088	2.3	9.1	0.1	1	58	2801	2851	2801	2876	0.70
23	29	9.1e-12	2.4e-08	34.7	0.2	1	86	2891	2962	2891	2963	0.82
24	29	3.4e-16	8.9e-13	48.9	0.4	1	86	3075	3147	3075	3148	0.81
25	29	2.9e-12	7.6e-09	36.3	3.5	1	86	3211	3281	3211	3282	0.80
26	29	2.9e-14	7.6e-11	42.7	3.1	1	86	3374	3444	3374	3445	0.85
27	29	1.1e-12	2.9e-09	37.6	0.2	1	86	3525	3594	3525	3595	0.84
28	29	2e-10	5.4e-07	30.3	0.3	1	58	3619	3668	3619	3678	0.82
29	29	3e-10	8e-07	29.8	0.4	18	87	3686	3744	3675	3744	0.76

Sequence Information

Coding Sequence: ATGTCACAACACAACCCCAATCACGCCCACCCGCACTACCACTACCCGTCCCATGCGACGCCGCTTgctctgcagcagcaccagcagcagcagcagcaacagcaacagcaccagcaccagcaccagcagcacggCAGTAGTTGGTACTCACATGTTGCTTCCTACCCAGCTGCCTCCCACTCCCACCCCCTCTCTCACTCGGCCTTTGGTCCTGCGCCCCCCTGCAAGGCCAGcataagcaacaacaacaccattATGGGCGCCTACggaacaggaggaggaggagggggtGGTGGCTCGCATGGATATTTCGGCGCCGCTGGCGGTGGCCTCAATGTCAGCGGGGCGGGGGGTGGTGCTGGGTCTTCCTACGGCCTTGGGGCCAACACTGTGGCATATGCTCACAACCAGCTGCTGCAGtaccagcatcatcatcagcaacaccagcagcagcagcagcaacagcagcagcagcagcacctgggTCTGAGCCAGCGATCCTACATGGGCCACGATGTCATGGCCGGAAGCTATCCCTATATCAAGAGCGAACCCCTGGAAGGGTTCCAGCAGCCGCCCAATCCAATGGCCCCACCCCCGGCCCCagaaatgataataaaatCGGAACCAATTGACGACCTTGCTTACAAGTCAAACTACATAGACGACAATACACCATTTGCGGACTTCAGCAAGTTTAGCGAATTCAGCGAGGACATGCTGAGTCCCAAAGTCGAGCTGACAGTTAAGGATGAGTCCTTCGTCCGGAATCCCAATAGCTTTTTACGCCGTAAGCAACAATTGGATCGGGCGTCAGCAGAGAGCCTGCCCGTCTGCCAGCGATGCAAGGAGGTGTTCTTCAAGAAGCAAACTTACCTGCGCCACGTCGCCGAGAGCAACTGCGGCATCCAGGAGTATGACTTCAAGTGCAGCATTTGCCCCATGTCCTTCATGGCCGCCGAGGAGCTACAGCTgcacaagcagcagcatcgaGCGGACAGGTTCTTTTGCCACAAGTACTGTGGAAAGCACTTTGGAACGATCGCAGAGTGCGAGGCGCACGAGTACATGCAACACGAATACGAAAACATTGTGTGCAACATGTGCTCGGGATCGTTCGCTACGCGGGAACAACTATACGCCCACTTGCCGCAGCACAAGTTCCAGCAGCGTTTCGACTGCCCCGTTTGCCGCTTGTGGTACCAAACGGCTCTTGAGCTGCACGAGCACCGCCTGGCTGCACCTTACTTTTGCGGCAAATACTATACGGGCGGACAATCCCCGTCGTCctcccagcagcaacaacagcaccaTGGTCAGACGAACTACAAACTGCAGGATTGTCATATGGCAACAATGGAGATGCCAAGCGCACCGCTCCTCAAGACGAACCCCTCCAACCCGCCTGCCTTACCCGCGACTGCGGCACTTAACTCACTGTTGCAACAGCGTCAGGCCAATGCCGATGGTGCGCCTTTATTTGCCGCATCTACGCAAAAGAACGAGGTCACCGTGAAGCTGGAGCGTAGCTACAGTAACTCGACTAACGAATCTTCATATAGCGTTCAGGAGAGCGGCTACAACAATGTGTATAGCAGCGGCGAGAGCTCGATCCACGGCAACATCGCCGGGCCGCAGGCACACTCCTCGACGCTTGACGACTCCGAGGATGCGCTGTGCTGTGTGCCGTTGTGCGGTGTGCGAAAGAGCACAAGTCCTACCCTGCAGTTCTTCACGTTCCCAAAGGACGAGAAATATCTCAACCAGTGGCTGCACAATCTCAAGATGTTCCACATACCCGCCTCCAGCTACGTTAGCTTCCGCATCTGCAGCATGCACTTCCCGAAGCGATGTATCAACCGCTACTCTCTGTGCTATTGGGCGGTGCCGACGTTCAACCTTGGTCACGATGACGTAGCCAACCTCTACCAGAATCGTGAACTGACCAACACCTTTACCACGGGCGAAGTGGCACGCTGCAGCATGCCACACTGCACTAGCCAGCGCGGTGAGAGCAACCTCAAGTTTTACAACTTCCCCAAGGACATCAAAAGCTTGATTAAGTGGTGCCAAAACGCCCGACTTCCGGTGCAGGCGAAGGAGCCGCGTCACTTTTGCAGCCGCCACTTTGAGGAGCGATGCATTGGCAAGTTTCGACTAAAGCCCTGGGCGGTACCCACCTTGCACCTGGGCGCCCAGTACGGCAAGATTCACGACAATCCGAAAAATCTATATGTGGAAGAGAAGCGTTGTTGCCTCAATTTTTGCCGTCGAAGCCGATCCTCGGATTTCAATATGTCGCTGTATCGATTTCCCAGGGACGAAGTCCTTTTACGTCGCTGGTGCTACAATCTTCGCCTCGATCCGGGCGTGTATCGCGGCAAGAATCACAAAATATGCAGCGCCCACTTTATAAAGGAGGCGTTGGGTCTTCGTAAACTATCCCCTGGTGCCGTGCCCACACTTCATCTGGGCCACAATGACACCTTCAACATCTACGAGAACGAACTGTGGCCGCCGCCGACACCGACACCTTCCTCGTGTCacctgcaacagcaacaacagtcaTCACTTCACTCGCTGCAACAGCAGATACACAGCAAGTCCTACCAGCGTCGTTCGGTGGCATCCACTTCGTCGTCGGCGAGCTCGGCAGCCTCGCATTACGTGGACCCGGAGATGAGTGCCTCCTACCACCTAGCCATGTCCGCCTCCGCCGGTGGCTCTGCGGCGATGAACGCCAGCGACAGCATGGATGTCTGTTGCGTGCCCAGTTGCGAGAGCAAGCGGCACAATAATGAGAACATAACATTCCACACGATACCGCGACGGCCCGAGCAGATGCGCAAGTGGTGTCACAACCTCAAGATAGCCGAAGACAAGATGCACAAGGGCATGCGGATATGTAGCCTTCACTTCGAGCCCTACTGCATCGGCGGCTGTATGCGACCGTTTGCGGTGCCCACTCTTCACTTGGGCCACGACGACGAGGACATCCATCGCAATCCGGACGTGATCAAGAAGCTGAACATCCGGGAGACGTGCTGCGTGGCCGTGTGCAAGCGGAACAGGGACAGGGACCACGCCAACCTGCATCGCTTCCCCAGCAACGTGGCGTTACTGAAGAAATGGTGCGCCAACTTGCAACGCAGTGTTCCCGATGGCAGTAAACTCTTTAATGATGCCATCTGCGAGGTGCACTTTGAGGATCGCTGCCTGCGCAACAAGAGGCTGGAGAAGTGGGCCGTTCCTACTCTGATCCTCGGGCACGAGGACATCCCCTATCCGCTGCCCACGCCGGAACAAGTGACCGAGTTCTATGCCCGGCCTACGGCTCCCAACAATGGCGAGGAACAGGGCGAGTGCTGTGTGGATACTTGCAAGAGGAATCCCAGCGTCGACGATATCAAGCTTTACCGCCCGCCGGAGGACGCCACCGTGCTGGCAAAGTGGGCGCACAACCTGCAGACGGAGGCCAATCAGCTGACAAGCATGCGGATCTGCAACCTTCACTTCGAGGCGCACTGCATTGGCAAGCGAATGCGCCAGTGGGCCATACCTACATTGAATCTAGCCGGCAACATCGAGAATCTCTATGAGAATCCAGAGCAATCACTGCTGTACAGGCGGCGGACGACTCATATGAAGTCTAAGCTGCCGGCATCCTCTGCGAAACCCACCTGGGTGCCCAGGTGCTGTCTTCCACACTGTCGCAAAGTCAGAGCCCTGCACAATGTCCAGCTCTACCGCTTCCCCAAACTCAATCGCTCGACATTGGCCAAGTGGGCGCATAACCTGCAGGTTCCAATGGTGGGCAGTGCCCAGCGCAGGCTATGCTCGGCTCACTTCGAGCCGCATGTGCTTAGCAAGAAGTGCCCGGTGCCGCTGGCAGTGCCTACGATCGATCTGAACTCGCCGTCCGGCTTGAAAATCTACCAGAATCCGGCCAAGCTGAAGGCCAGCAAACTGTGCCTGCAGCGGGTTTGCATCGTCGAGAGCTGCCGCAAGACGCGGGCGCAGGGCGTGCAACTCTTCCGGTTGCCGCACAGCCCGACACAGCTGCGGAAGTGGATGCACAACATAAAGACGCGGCCGCGAGCAGCAATGCGGGCCCAATACCGGGTCTGTTCCCGCCACTTCGAGACGCACTCATTCAACGGCCGAAGATTGAGTGCTGGTGCCATTCCGACCCTGGAACTAGGCCACGACGGCGACGATATCTATCCCAATGAAGCACAGGCCTTTGTGGATGAGCATTGTGCTGTCGAGGGCTGCGAGGCGTCCAAGGAGCAGCCGGAGGTGAGACTGTTCCGCTTCCCCACCGATGACGACGACATGCTGTGGAAGTGGTGCAACAACCTCAAAATGAATCCCGTCGACTGCATTGGGGTGCGTATCTGCAACAAGCACTTCGAGGCCGACTGCATCGGTCCCAAGCACCTCTACAAGTGGGCCATTCCCACGATGGAGCTGGGCCATGACGATGCGCAGATCGAGCTTGTCCCGAACCCCAAGCCAGAGGAGAGGTATGTGGATCCGGTCTTCAAGTGCATCGTGCCCACCTGCGGCAAGACGCGACGCTTTGACGAGGTGCAAATGAACAGCTTCCCCAAGGATCCGGATCTATTCCAGCGCTGGCGGCACAACCTGCGCTTGGAGCACCTCTGTTTCCAGGAGCGCGAGCGCTACAAGATCTGCAACGTTCACTTCGAAGAGATCTGTATTGGGAAGACACGGCTAAACATCGGATCAGTGCCAACCTTGGAGCTCGGCCatgacgaggaggatgatATTTTCCAAGTGAATCCAGCGGAGCTGCAAAGCAACTTATTTGGGCGACAACGTCGACTGCTCCTCGAGGGATCCGGCGAAGTCAGTGTCAAGCAGGAGCTGTCCGAGTCGGAGGACAACAATAAAGCGGATTTGACGGCCGCAGGTCCTAATTCCAAACAGGTGAAGACCAAGAGATCTACTTTGGAGCTAAAGTGCTGTGTGCACAGCTGTGGAAGGAGCCGCTTGGAGCACGGAGCACGCCTGTTCCCCTTTCCCACGGGCAAACAGCAACACCTCAAGTGGCGACATAATCTGCACCTGGAACCGGAGGAGGTGGACCGGTCAACGCGAGTGTGCAGCGCCCACTTCAATCGGCGTTGCATCGAGGGCAAACAGCTGAGGAGCTGGGCGATGCCCACTCAGCAGTTGGGACACCACGACCAGCCGATCTACGAGAACCCCAAGAACATACCGGGATTTTTCACACCCACCTGTGCCCTGGAACACTGTCGCAAGAGGAGGAGTATTGACAACGATCTGCGCACCTATCGATATCCGCGAagcgaggagctgctggaaaaATGGAGAGCCAACTTACGGCTGGCACCGGATCAGTGCCGAGGTAGGATTTGTGCAAATCACTTCGAGCCGCAGGTGCGGGGAAAGCTTAAGTTGAAGACTGGAGCCGTGCCCACATTGAAACTGGGACACGACGAGGGATTAGTCTACGACAATGAGGCAATAAAGGCGGGCATGGCCGAAGAAGATGAGGGTGTAGCCACGGAATACGCGCGactgaaaccaaaaaaagaggtattggaagaggaggaggaggaagaggttGACGACGAGCAGCAACACCCAGACGACCGGGACattgctgatgatgatgacgaggacAAAGATGATCACTACTTTGATCCTCTTGAACTCGTTGAGACTTTTGCTGAACATCGCAGCGATGATGAAGCCCAGGATTATGAGGATGAAGCAGACGAAGGCCGAGTTGAGGACTCTCCTTCCGGGTACGAGATCGAAGAGGAATTGGAAAAACCGCCAAGCGTTCCACCATCACCCCCACCCAGACGGCCCCAAGTTCCGCGGCGAGACAAGCCGGCTAACAACGTCACGCCCATTTGCTGCCTAAAGCACTGCAGAAAGGAACGCACTGCATTCCATCTGCTGAGCACCTTTGGCTTCCCCAAAGATCGCCAATTGCTGCTAAAGTGGTGTGTCAATCTGCATCTGAACCCGGATGACTGCGTCGGTCGGGTTTGCATTGAGCACTTCCAGCCGGAGGTACTTGGAACCCGTAAGCTCAAGCAGAATGCGGTGCCCACCGTTAATGTGGGACATGAGGAGCCGCTGAGGTACTCGTGTCATGGCGTGGACCAGAACGTCGAGGAGCAGGACCCCCAGCCGCAACATTCGGTTTTTCGGCTTTGGAGCCTGAAACACTGCCGGAAAAGGAAGCCAACGGAGCCGCCGGACATTCCCCTAGCCAAGATGATGAAGCGGGAGTGGGAGATGGAGACGCCGATGCCGATGGAGCGGACGCGGGTGTTGAAGATGATGAATCAAACGGAGAATAAGTCAAATAGGTGCTGTATCAGCAATTGCGGAAACCAGGATGTCAGCCAATTGCTGTCTCTGCCCGAGGAGAAATCCCTGCTAAGAAAGTGGATGCATAACTTAAGGCTGTCCACGTCCACTGAGGACACTGCTTTTGTGAGAGTTTGCCTGGCGCACTTTGAGTCGCAGCTGGTGGAGAATGGCAGGCTGAGAAAGGAATCAGAGCCAGAGGCAGTGCCCACTTTAAAACTGGGCCACAGCAGTTGGAACCTGTACCAAAGCAATGGGATCTGCCTAGTGCCAGACTGCACGAGCAACACCTTGGTTCGCTTAACCTATATCGATCTCCCGGATAACAGTCTAATTAGGGAGGCATTCTTCTCATATCTCAACCTCGCTGATCATCCCGAGGAACAGGCGAGACTATGTGGAGTCCACTTTATGGAGGTATACAATGAGTTAAGTCTTCCCAAGGTTTTGGCCCCCCAAGATATGATGGAACTACAAAGTGCTTTAGACGAACTGCAATGCGCTGTGCCCGGCTGCTGCTTCGAGAGTTCTGGCCAGGATTTTCACCTAATCCCACTTCCAGATGACAAAGACGTGCTGTCGAAGTGGCTGCACAACACCAAGATCCCTTATGATCATTTTAGGCACCGAAGCTACCGCATTTGCAGGCATCACTTTGAATCGGAGTACTTAGAAGTGGATGGGCCGCTAAAATGGGCTCTACCGACGCTCTATCTAAACCATAAAGATGAGATCCACCCAAATATGAAGCCTTTGGCAGAGGAGCAGGACTCCTTGCTAACACCACTGCGAATTAAGACGGATCTTGCCTTCTTGGGCAGCCCCAGTGCAAGTGCAAGCCCCAGTCCTCGGGGCAGGATCCGGATATGCTGCATAACGACCTGTGGACAGTTTGGAAGCAGCCAGGTAAGGCTCTATCGCTTTCCCGTCGAGGAGCAGGCGCTGCTTCGGTGGCTAGTAAACACGCAACAGCAGCCACGACTTGTTGATCCCATGGACTTATATGTGTGCCAGTCGCATTTTGAGCCAGAGGCCATTTGCAAGAAGCAGCTGCGCAGCTGGGCGGGACCCACCTTGAACCTGGGACACGACGGCCATGTAATCCCGAATGCCAAGCACAACGGCAATATTTCCGACAGCCAGGATACCGAGCAGGCAATGAGGTTCATTCGCGAACGCTTCTGCTCCGTCATTTCCTGCTTTCAGGAAGGAGGACAGGAGGAGGTGGGAGGAGTGAGGCTCTATGATTACCCTGAGGATATGGCAACTACTCGAAAGTGGGCAGCCGCCTGCCGACATCGCTCAATGCAGGCCAGGAGCCATGGCTTTAAGGTGTGCCAGTCCCACTTCGCAACGGAATGCTTTGACCAAGATACTGGTAACTTGGTTGAAGGCTCGGTGCCCACGCTGGAGTTGAGCAGGGACGATATGGAGAGGCAGTGCTTGGTAACTGGATGCATACGAAATGATGGCGATGGAGCTCGTCCCCGCTACTTTAAGATACCAAAAACCGCCGCTCAATTGGAAGCGTGGAGCAACAACCTGAAAATCCAACCAACGGATCTCATGCAAGGCGAGCAGCAGTACATCTGCGAGAAACACTTTGAGGCGTTCTGCTTTGGAGCCAACAAGGCACTGCGCTCTGGTGCGCTTCCAACCCTCTATCTGGGCCACGATGAGGACGTTGATATGCTTCCCAACCCGGAGAGTCTCTTCTTCCAGAACAAAATCGAAAAGTGCTGCGTACCAGGCTGCGAGCGTATCTGGCAGACTGGGGACCGCAAGTTCCGTGGATTTCCCAAATCGTTGACCATGGTCAAAAAATGGCGGCATAACCTTCGTTTGGCAGCGACCACGGAGCAACTGGGCAAGCTGAAGGTCTGCAGTGCTCACTTTGAGGCAACCTCCCCCCAACTCGGTACCAATGGACAGAGCTATAGTAATTTGATACCCACCCTGGAATTGGGGCACTCTTCTCCAGATATTTACCAAGCGGACATGAGCTTAAAGACGCcgaaaatttattgtttgtatCCCAAGTGCGAGGAAATCTGCCTACCCAAGAGTTTGTCCTACGGACTTCCCCAAGAAGAGCATCTGCGGAATGCCTGGCTAAGCCACATGAACATTGAAGATTTGAAAGATGAAGTTGCCGCACAACTGTGCCCGCTGCACTACGTCATCCTCTACCAGCACAGTGCCAAAAACCATGCAGAGCATCATGCTTCAAGCCGCATGCTTCTGGATGACAATTACAAGGACGCGCGGAACAACAGGCGAGTGAAGATTGTGAGCTGTGCGATCAAGGGCTGCGACATGGTTCGGCCACGTGATGGAGTACGCTTGCACGGGATGCCGCAAAGCAAGGACATCCTGCAGATGTGGATAGACAATGGCCAGTTTGATTTCCTAGAGCAACAGCGGTACATGTTCAAGGTCTGCCACAATCACTTTGAGCCAAGCTGCTTCTTCGACGACAGACGCTTGTTCTCTTGGAGCGTACCCACTTTGCGCCTACCTGGCGACGCAATCCACCAAAATCCGACCGCCGAGCAGTGGCAGAACATGGTCAACAAACaggcagcgacaacaacatcCGCGGAAGAGACGGAAGAGACTGATCTTTATGAGGATGTGGATAGAACGGAGCCCGTAATAAAGATGGAGCATATCGAATCGGAATATGAAGATGAAAACTCGGGAATGCAGGCCCTAGAGGTCCTCCTAGAAGTTGGTCATGTGGAGCGAATGGAGAGCTATGAGGAAGTGGATAAGTCACCGGTGATCTATGCCGAAAATTCAGCCTTCCGGTACTCACCCATACGATGCCAATACAATGCCAATCACTGTGCCGTAGAGGGATGCCAGGTGACCGTCGAGGATGTGGACGGGACAATTAAGCTCCACAAATTTCCCGCGTCGCAGGAAGCCGCTCAGAAGTGGATGCACAATACCCAAGTTGACATGGACGAGAAGTTCTGGTGGCGCTACCGCATATGCAGTTACCACTTTGATAAAGAGTGCTTTCAGAGTGCTAGGATTCGAAAAGGCGCGATGCCGACGCTTTTGTTAGGACCTCGGCAACCGGATACGGTGTACGATAATGAGTTTGCCCTACCAGAGACGGAAGAGTCTTTTCCAGACCCACCGGAGATTCAGCTGGACGACAGTACTCCAGTGGTGTCCAGAGTTCAAAAGGAGGTATCCAGCTTATGCCTGCCTCCGCGGGCGCCGCCTCGAAAGTCGAGCAAGTTTTGCCAGATTGATTCTTGCACGAACCACCTGACCACTGAGAACATGACACTCCACAAGTTTCCGCACTCTGAGGACATGTGTCTCAAGTGGCAGCACAACACGCAAGTGCCATTCGATCCCTACTACCGCTGGCGTTACCGCATCTGCAGTGCTCATTTCCATCCGGTGTGCTTGGTCAACATGCGTCTAGTCCACGGAAGCGTTCCTACTTTGAAGCTGGGTCCCAAGGCTCCGTCCGAGCTCTTTGACAACGACTTCGAGGCCATAAACCTAAGGCTGGATAAAAGGTTGACCGAGTCCAATGCCAATGTGTATATCAAGCACGAAAGGCGGGACGAGGATGAAGACTCGCAGATGTTCCTGGAGCCCGAGCTCCAGTTACACGAGGATCAAGGCGAAAAGATATCAACCTGGAATAGCAAACTTCTATTGCCACCTGTAAAGCAGGAGAAAATGATCTGCAGCCAGATCAAGTCTGGCTATGACAAGTGTTCGCTGGCTCACTGCCAACGGCAAAGGTCTCAGCATGGCGTCCACATCTATAAGTTTCCCAGGTCGGGGCGCCAACAGGAGCGTTGGATGCACAACCTCCGCATCCGCTATGATGAGCGGACTCCGTGGAAATTCATGATCTGTAGCGTTCATTTCGAGCCACACTGCATCAGCCTAAGGAAGCTGCGACCTTGGGCTGTACCCACTCTGGAGCTGGGCGACAACGTGCCAGAGACGATCTTTACAAACGAACAGTgcgaggaggagctggtaACCGATCGCAGTGAGATGGATAGCGACGTCGAGGAAGAAGATGGCTTGCAGGAGGATGACGAAGATGAAGACGAAGACGATCTGAAGCCGGATGTGGTTGGCATAAAGAGGAGGAGACGTTTCAAGGCAGATTCCATCCTCCATTCCAGCCATTTGGCGCCCTGGAAAGTCAAACAATGCTGCCTCCCCTATTGTCGTGCCTACCGAGGCGATGGCATCAAGCTATTTCGACTTCCCAACAACCGAAATTCGATTAGCAACTGGGAAAAGGCCACAGGAATGGTATTCAAAGAGTCGCAACGGAATACGCGTCTGATCTGCAGCCGCCACTTTGAGCCAGAGCTGATTGGAGTCAGGCGTCTAATGCGCAACGCCATTCCCACAAAGCACTTAAGCCCGCAAGGAGCTCACCAGGTCAACACTAAAAAGGAGAAGACACAAGCCGCTATGATTCCCACCTGCTGCATGGCGGACTGCCACTACAATGGAACACTTGTCAAGCTCCACAAGTTTCCAAGTGATCCCACATTGCTTAAACAGTGGTGCCAGGCTCTCCGGCTCACTGATACGCAGCGGTATTTGGGCAAGCACATTTGTTCGATGCACCTGCCAATGAACAAGACCATGAGCTGTGTCATCTGCGGTGGGGACAACGTGGAGTTGCCGATGCTTGGATTTCCGGAGAACCGCAACCAGCGTGCCAAGTGGTGTTATAATCTCAAAATTGAGACAATAGCAAAGTGGGACCACTCAAAACTTATTTGCTGCCGGCACTTTGAGCCCCATAGCTTTGAGAAGCCGGGTGAGCTACGTCCAGGAGCGGCGCCCACGCTCCATCTGAATCACGATGACACAAACATATTCTTCAGCGACTATGCCACTGGTCTTCCGTCCTCGCCACTAGGCAATCGAATCAAAGACGAGCCCCTGGAATCGGAGTCTGACGAGATGCTGCTGGTGTAG
Protein Sequence: MSQHNPNHAHPHYHYPSHATPLALQQHQQQQQQQQQHQHQHQQHGSSWYSHVASYPAASHSHPLSHSAFGPAPPCKASISNNNTIMGAYGTGGGGGGGGSHGYFGAAGGGLNVSGAGGGAGSSYGLGANTVAYAHNQLLQYQHHHQQHQQQQQQQQQQQHLGLSQRSYMGHDVMAGSYPYIKSEPLEGFQQPPNPMAPPPAPEMIIKSEPIDDLAYKSNYIDDNTPFADFSKFSEFSEDMLSPKVELTVKDESFVRNPNSFLRRKQQLDRASAESLPVCQRCKEVFFKKQTYLRHVAESNCGIQEYDFKCSICPMSFMAAEELQLHKQQHRADRFFCHKYCGKHFGTIAECEAHEYMQHEYENIVCNMCSGSFATREQLYAHLPQHKFQQRFDCPVCRLWYQTALELHEHRLAAPYFCGKYYTGGQSPSSSQQQQQHHGQTNYKLQDCHMATMEMPSAPLLKTNPSNPPALPATAALNSLLQQRQANADGAPLFAASTQKNEVTVKLERSYSNSTNESSYSVQESGYNNVYSSGESSIHGNIAGPQAHSSTLDDSEDALCCVPLCGVRKSTSPTLQFFTFPKDEKYLNQWLHNLKMFHIPASSYVSFRICSMHFPKRCINRYSLCYWAVPTFNLGHDDVANLYQNRELTNTFTTGEVARCSMPHCTSQRGESNLKFYNFPKDIKSLIKWCQNARLPVQAKEPRHFCSRHFEERCIGKFRLKPWAVPTLHLGAQYGKIHDNPKNLYVEEKRCCLNFCRRSRSSDFNMSLYRFPRDEVLLRRWCYNLRLDPGVYRGKNHKICSAHFIKEALGLRKLSPGAVPTLHLGHNDTFNIYENELWPPPTPTPSSCHLQQQQQSSLHSLQQQIHSKSYQRRSVASTSSSASSAASHYVDPEMSASYHLAMSASAGGSAAMNASDSMDVCCVPSCESKRHNNENITFHTIPRRPEQMRKWCHNLKIAEDKMHKGMRICSLHFEPYCIGGCMRPFAVPTLHLGHDDEDIHRNPDVIKKLNIRETCCVAVCKRNRDRDHANLHRFPSNVALLKKWCANLQRSVPDGSKLFNDAICEVHFEDRCLRNKRLEKWAVPTLILGHEDIPYPLPTPEQVTEFYARPTAPNNGEEQGECCVDTCKRNPSVDDIKLYRPPEDATVLAKWAHNLQTEANQLTSMRICNLHFEAHCIGKRMRQWAIPTLNLAGNIENLYENPEQSLLYRRRTTHMKSKLPASSAKPTWVPRCCLPHCRKVRALHNVQLYRFPKLNRSTLAKWAHNLQVPMVGSAQRRLCSAHFEPHVLSKKCPVPLAVPTIDLNSPSGLKIYQNPAKLKASKLCLQRVCIVESCRKTRAQGVQLFRLPHSPTQLRKWMHNIKTRPRAAMRAQYRVCSRHFETHSFNGRRLSAGAIPTLELGHDGDDIYPNEAQAFVDEHCAVEGCEASKEQPEVRLFRFPTDDDDMLWKWCNNLKMNPVDCIGVRICNKHFEADCIGPKHLYKWAIPTMELGHDDAQIELVPNPKPEERYVDPVFKCIVPTCGKTRRFDEVQMNSFPKDPDLFQRWRHNLRLEHLCFQERERYKICNVHFEEICIGKTRLNIGSVPTLELGHDEEDDIFQVNPAELQSNLFGRQRRLLLEGSGEVSVKQELSESEDNNKADLTAAGPNSKQVKTKRSTLELKCCVHSCGRSRLEHGARLFPFPTGKQQHLKWRHNLHLEPEEVDRSTRVCSAHFNRRCIEGKQLRSWAMPTQQLGHHDQPIYENPKNIPGFFTPTCALEHCRKRRSIDNDLRTYRYPRSEELLEKWRANLRLAPDQCRGRICANHFEPQVRGKLKLKTGAVPTLKLGHDEGLVYDNEAIKAGMAEEDEGVATEYARLKPKKEVLEEEEEEEVDDEQQHPDDRDIADDDDEDKDDHYFDPLELVETFAEHRSDDEAQDYEDEADEGRVEDSPSGYEIEEELEKPPSVPPSPPPRRPQVPRRDKPANNVTPICCLKHCRKERTAFHLLSTFGFPKDRQLLLKWCVNLHLNPDDCVGRVCIEHFQPEVLGTRKLKQNAVPTVNVGHEEPLRYSCHGVDQNVEEQDPQPQHSVFRLWSLKHCRKRKPTEPPDIPLAKMMKREWEMETPMPMERTRVLKMMNQTENKSNRCCISNCGNQDVSQLLSLPEEKSLLRKWMHNLRLSTSTEDTAFVRVCLAHFESQLVENGRLRKESEPEAVPTLKLGHSSWNLYQSNGICLVPDCTSNTLVRLTYIDLPDNSLIREAFFSYLNLADHPEEQARLCGVHFMEVYNELSLPKVLAPQDMMELQSALDELQCAVPGCCFESSGQDFHLIPLPDDKDVLSKWLHNTKIPYDHFRHRSYRICRHHFESEYLEVDGPLKWALPTLYLNHKDEIHPNMKPLAEEQDSLLTPLRIKTDLAFLGSPSASASPSPRGRIRICCITTCGQFGSSQVRLYRFPVEEQALLRWLVNTQQQPRLVDPMDLYVCQSHFEPEAICKKQLRSWAGPTLNLGHDGHVIPNAKHNGNISDSQDTEQAMRFIRERFCSVISCFQEGGQEEVGGVRLYDYPEDMATTRKWAAACRHRSMQARSHGFKVCQSHFATECFDQDTGNLVEGSVPTLELSRDDMERQCLVTGCIRNDGDGARPRYFKIPKTAAQLEAWSNNLKIQPTDLMQGEQQYICEKHFEAFCFGANKALRSGALPTLYLGHDEDVDMLPNPESLFFQNKIEKCCVPGCERIWQTGDRKFRGFPKSLTMVKKWRHNLRLAATTEQLGKLKVCSAHFEATSPQLGTNGQSYSNLIPTLELGHSSPDIYQADMSLKTPKIYCLYPKCEEICLPKSLSYGLPQEEHLRNAWLSHMNIEDLKDEVAAQLCPLHYVILYQHSAKNHAEHHASSRMLLDDNYKDARNNRRVKIVSCAIKGCDMVRPRDGVRLHGMPQSKDILQMWIDNGQFDFLEQQRYMFKVCHNHFEPSCFFDDRRLFSWSVPTLRLPGDAIHQNPTAEQWQNMVNKQAATTTSAEETEETDLYEDVDRTEPVIKMEHIESEYEDENSGMQALEVLLEVGHVERMESYEEVDKSPVIYAENSAFRYSPIRCQYNANHCAVEGCQVTVEDVDGTIKLHKFPASQEAAQKWMHNTQVDMDEKFWWRYRICSYHFDKECFQSARIRKGAMPTLLLGPRQPDTVYDNEFALPETEESFPDPPEIQLDDSTPVVSRVQKEVSSLCLPPRAPPRKSSKFCQIDSCTNHLTTENMTLHKFPHSEDMCLKWQHNTQVPFDPYYRWRYRICSAHFHPVCLVNMRLVHGSVPTLKLGPKAPSELFDNDFEAINLRLDKRLTESNANVYIKHERRDEDEDSQMFLEPELQLHEDQGEKISTWNSKLLLPPVKQEKMICSQIKSGYDKCSLAHCQRQRSQHGVHIYKFPRSGRQQERWMHNLRIRYDERTPWKFMICSVHFEPHCISLRKLRPWAVPTLELGDNVPETIFTNEQCEEELVTDRSEMDSDVEEEDGLQEDDEDEDEDDLKPDVVGIKRRRRFKADSILHSSHLAPWKVKQCCLPYCRAYRGDGIKLFRLPNNRNSISNWEKATGMVFKESQRNTRLICSRHFEPELIGVRRLMRNAIPTKHLSPQGAHQVNTKKEKTQAAMIPTCCMADCHYNGTLVKLHKFPSDPTLLKQWCQALRLTDTQRYLGKHICSMHLPMNKTMSCVICGGDNVELPMLGFPENRNQRAKWCYNLKIETIAKWDHSKLICCRHFEPHSFEKPGELRPGAAPTLHLNHDDTNIFFSDYATGLPSSPLGNRIKDEPLESESDEMLLV

Similar Transcription Factors

Sequence clustering based on sequence similarity using MMseqs2

100% Identity: iTF_00490113; iTF_00561794; iTF_00492264; iTF_00593867; iTF_00612846; iTF_00541107; iTF_00617683; iTF_00485173; iTF_00613541; iTF_00594581; iTF_00594582; iTF_00488697; iTF_00491545; iTF_00571930; iTF_00489405; iTF_00527336; iTF_00533131; iTF_00478047; iTF_00524447;
90% Identity: -
80% Identity: -