Basic Information

Insect: Drosophila kurseongensis
Gene Symbol: -
Assembly: GCA_018153305.1
Location: JAECXX010000210.1:6653532-6667407[-]

Transcription Factor Domain

TF Family: THAP
Domain: THAP domain
PFAM: PF05485
TF Group: Zinc-Coordinating Group
Description: The THAP domain is a putative DNA-binding domain (DBD) and probably also binds a zinc ion. It features the conserved C2CH architecture (consensus sequence: Cys - 2-4 residues - Cys - 35-50 residues - Cys - 2 residues - His). Other universal features include the location of the domain at the N-termini of proteins, its size of about 90 residues, a C-terminal AVPTIF box and several other conserved residues. Orthologues of the human THAP domain have been identified in other vertebrates and probably worms and flies, but not in other eukaryotes or any prokaryotes [1].
Hmmscan Out: # of c-Evalue i-Evalue score bias hmm coord from hmm coord to ali coord from ali coord to env coord from env coord to acc

1 29 5.3 1e+04 -2.7 3.3 38 62 314 341 305 356 0.59

2 29 2.2e-15 4.2e-12 46.6 4.1 1 86 550 622 550 623 0.86

3 29 1.1e-14 2.2e-11 44.3 5.0 1 87 650 719 650 719 0.83

4 29 1e-15 2e-12 47.6 0.2 1 87 741 813 741 813 0.85

5 29 6.5e-16 1.2e-12 48.3 5.4 1 86 909 978 909 979 0.82

6 29 1.3e-14 2.5e-11 44.1 2.8 1 86 1003 1074 1003 1075 0.82

7 29 5.7e-13 1.1e-09 38.9 0.7 1 87 1110 1178 1110 1178 0.81

8 29 1.7e-10 3.2e-07 31.0 1.6 1 86 1218 1287 1218 1288 0.76

9 29 5.7e-17 1.1e-13 51.7 0.4 1 86 1315 1384 1315 1385 0.83

10 29 5.1e-13 9.9e-10 39.0 1.5 1 85 1406 1474 1406 1476 0.80

11 29 3.2e-14 6.2e-11 42.9 0.4 1 86 1503 1574 1503 1575 0.85

12 29 7.7e-13 1.5e-09 38.4 3.0 1 85 1651 1719 1651 1721 0.82

13 29 1.6e-12 3e-09 37.4 0.1 1 86 1744 1812 1744 1813 0.81

14 29 2.9e-13 5.5e-10 39.8 2.2 1 87 1944 2013 1944 2013 0.79

15 29 5.2e-11 9.9e-08 32.6 0.2 1 85 2113 2178 2113 2180 0.76

16 29 0.0017 3.3 8.5 0.0 1 58 2195 2242 2195 2256 0.80

17 29 3.3e-10 6.3e-07 30.0 0.7 1 86 2272 2341 2272 2342 0.79

18 29 6.2e-13 1.2e-09 38.8 0.4 1 87 2398 2468 2398 2468 0.82

19 29 2e-10 3.9e-07 30.7 0.1 1 86 2503 2574 2503 2575 0.80

20 29 5e-11 9.6e-08 32.6 0.0 1 86 2585 2656 2585 2657 0.79

21 29 2.9e-09 5.6e-06 27.0 0.0 1 86 2681 2751 2681 2752 0.76

22 29 0.0002 0.39 11.4 0.0 1 58 2785 2832 2785 2854 0.81

23 29 1.8e-12 3.5e-09 37.2 0.1 1 86 2870 2942 2870 2943 0.82

24 29 1.6e-15 3.1e-12 47.0 0.6 1 86 3053 3125 3053 3126 0.82

25 29 8.4e-13 1.6e-09 38.3 3.1 1 86 3186 3256 3186 3257 0.79

26 29 2e-14 3.9e-11 43.5 4.8 1 86 3354 3424 3354 3425 0.85

27 29 7.2e-12 1.4e-08 35.3 0.2 1 86 3505 3574 3505 3575 0.84

28 29 9.2e-11 1.8e-07 31.8 1.3 1 58 3598 3646 3598 3660 0.84

29 29 1.7e-10 3.3e-07 30.9 2.0 17 87 3663 3722 3653 3722 0.75

#	of	c-Evalue	i-Evalue	score	bias	hmm coord from	hmm coord to	ali coord from	ali coord to	env coord from	env coord to	acc
1	29	5.3	1e+04	-2.7	3.3	38	62	314	341	305	356	0.59
2	29	2.2e-15	4.2e-12	46.6	4.1	1	86	550	622	550	623	0.86
3	29	1.1e-14	2.2e-11	44.3	5.0	1	87	650	719	650	719	0.83
4	29	1e-15	2e-12	47.6	0.2	1	87	741	813	741	813	0.85
5	29	6.5e-16	1.2e-12	48.3	5.4	1	86	909	978	909	979	0.82
6	29	1.3e-14	2.5e-11	44.1	2.8	1	86	1003	1074	1003	1075	0.82
7	29	5.7e-13	1.1e-09	38.9	0.7	1	87	1110	1178	1110	1178	0.81
8	29	1.7e-10	3.2e-07	31.0	1.6	1	86	1218	1287	1218	1288	0.76
9	29	5.7e-17	1.1e-13	51.7	0.4	1	86	1315	1384	1315	1385	0.83
10	29	5.1e-13	9.9e-10	39.0	1.5	1	85	1406	1474	1406	1476	0.80
11	29	3.2e-14	6.2e-11	42.9	0.4	1	86	1503	1574	1503	1575	0.85
12	29	7.7e-13	1.5e-09	38.4	3.0	1	85	1651	1719	1651	1721	0.82
13	29	1.6e-12	3e-09	37.4	0.1	1	86	1744	1812	1744	1813	0.81
14	29	2.9e-13	5.5e-10	39.8	2.2	1	87	1944	2013	1944	2013	0.79
15	29	5.2e-11	9.9e-08	32.6	0.2	1	85	2113	2178	2113	2180	0.76
16	29	0.0017	3.3	8.5	0.0	1	58	2195	2242	2195	2256	0.80
17	29	3.3e-10	6.3e-07	30.0	0.7	1	86	2272	2341	2272	2342	0.79
18	29	6.2e-13	1.2e-09	38.8	0.4	1	87	2398	2468	2398	2468	0.82
19	29	2e-10	3.9e-07	30.7	0.1	1	86	2503	2574	2503	2575	0.80
20	29	5e-11	9.6e-08	32.6	0.0	1	86	2585	2656	2585	2657	0.79
21	29	2.9e-09	5.6e-06	27.0	0.0	1	86	2681	2751	2681	2752	0.76
22	29	0.0002	0.39	11.4	0.0	1	58	2785	2832	2785	2854	0.81
23	29	1.8e-12	3.5e-09	37.2	0.1	1	86	2870	2942	2870	2943	0.82
24	29	1.6e-15	3.1e-12	47.0	0.6	1	86	3053	3125	3053	3126	0.82
25	29	8.4e-13	1.6e-09	38.3	3.1	1	86	3186	3256	3186	3257	0.79
26	29	2e-14	3.9e-11	43.5	4.8	1	86	3354	3424	3354	3425	0.85
27	29	7.2e-12	1.4e-08	35.3	0.2	1	86	3505	3574	3505	3575	0.84
28	29	9.2e-11	1.8e-07	31.8	1.3	1	58	3598	3646	3598	3660	0.84
29	29	1.7e-10	3.3e-07	30.9	2.0	17	87	3663	3722	3653	3722	0.75

Sequence Information

Coding Sequence: ATGTCACAACAACACCACCATCACGCCCACCCCCACTACCACCACTATCCGCCCCCTGCGACGCNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNTGTTGCTTCCTACCCCACACCCCACTCGGCCTTCAGCTCCGCCCACCCCTCCCCCTGCAAGGCCACCAACAACAACATCATCATGGGTGGTGGCTATGGCTCAGGGGTACCAGGGGGTGTTGGTGGTGGCACGCAGGGGTATTATGGCGCCGCTGGCGGTGGCCTCAATGTCAGTGGGGCGGCNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNGCTCCTATATGGGCCACGAAATCATGACCGGCAGCTACCCTTATATCAAAAGCGAACCGCTGGAGGCCTTCCAGCAGCCCCCCAATCCCATGGCCCCGCCCCCAGCTCCAGAAATATTAATAAAATCGGAACCCATTGACGAACATTCCTACAAGTCCAACTATATAGACGACAACACGCCATTTGCAGACTTCAGCAAGTTCAGCGAATTCAGTGAGGACATGCTGAGTCCCAAAGTGGAGTTGACCGTCAAGGATGAGTCCTACGGAAGGAATCCCAACAGTTTTCTGCGCCGGAAACAGCAGTTGGATCGCAGCGCCGAAAGTCTGCCGATCTGCCAACGCTGCAAAGAGGTCTTCTTCAAGAAGCAGACCTATCTGCGGCACGTGGCTGAGAGCAACTGCGGCATACAGGAGTACGACTTTAAGTGCAGCACCTGCCCCATGTCTTTCATGACCACCGAGGAGCTGCAGCGGCACAAGCACCAGCACCGGGCAGACAGGTTCTTCTGCCACAAGTACTGCGGCAAGCACTTTGACACGATCGCAGAGTGCGAGGCGCACGAGTACATGCAGCACGAATACGAGAGCTTTGTGTGCAACATGTGCTCGGGAACCTTCGCCAATCGAGAGCAGCTATATGCGCATCTTCCTCAACACAAGTTCCAGCAGCGCTTCGACTGTCCCATCTGCCGTTTATGGTATCAGACAGCCCTTGAGCTCCACGAGCATCGCCTGGCAGCTCCATATTTCTGTGGCAAATACTACACGGGCGGACAGTCCTCCTCAGCTTCGCAGCCGCAGACACAGCAGCACCAAAACCAGACGAATTACAAGCTACAAGATTGCCATATGGCGACCATGGAAATGCCCACCGCCCCGCATCACAAATCGAACCCATCCAGCTCATCCTTGCCGGCTACAGCTGCACTAAATTCACTGCTGCAGCAGCGGCAGGCGAATGCCGATGGAGCGGCCATGTTTGCCGCATCCGCGCTGAAGAACGAGGTGAATGTTAAGCTGGAGCGTAGCTATAGCAACTCGACCAGCGAGTCATCCTACAGCGTTCAGGATAGCAGCTACAACAATGCCTATGGCAGCGATAGCTCCATCCACGGCGGAGCCATCGCCGGTCCGCAGGCCCATTCTTCCACGCTGGACGATTCCGAGGACGCATTGTGCTGTGTGCCGCTGTGCGGAGTGCGGAAAAGCACAAGTCCCACGCTGCAGTTTTTCACGTTCCCCAAGGACGAGAAGTACCTCAACCAGTGGCTGCACAATCTCAAGATGTTCCACATACCCGCCGCAAGCTACACCAATTTCCGCATCTGCAGCATGCACTTCCCGAAACGCTGCATCAACCGCTACTCGCTGTGCTATTGGGCGGTGCCCACCTTCAACCTGGGCCACGACGACGTGGCCAATCTCTACCAGAACCGGGAACTGACCAACACCTTCACTACCGGCGAGGTGGCCCGCTGCAGCATGCCGCACTGCACCAGCCAACGGGGTGAGAGCAACCTTAAGTTCTACAATTTTCCCAAGGACATAAAGAGCCTGATCAAGTGGTGCCAGAACGCACGACTTCCTGTGCAGGCGAAAGAGCCGCGTCACTTCTGCAGTCGTCACTTTGAGGAGCGCTGCATCGGCAAGTTCCGACTGAAGCCCTGGGCGGTGCCCACTTTGCATCTGGGTGCCCAATATGGCAAGATACACGACAATCCAAAGAATCTCTACGTGGAGGAAAAACGCTGCTGCCTAAATTTCTGCCGCCGAAGCCGATCCTCTGACTTCAATATGTCGCTATATCGATTCCCCAGAGACGAGGTGCTCCTGCGGCGCTGGTGCTATAATCTCCGTCTGGATCCAGGAGTATATCGAGGAAAGAATCATAAAATATGCAGCGCCCACTTTATCAAGGAGGCGTTGGGTCTGCGGAAACTATCCCCGGGTGCCGTTCCAACGCTCCACCTGGGTCACACTGACACCTTTAACATCTACGAGAACGAGCTGTGGCCCCCGCCAACAGCCTCTGGCAGTGGCCTCCAGCAGCACCAGGCGCAACATCACACCTCGCAACACTCACTGCAGCAACAGCTGCACAGCAAATCCTACCAGCGCCATTCGGCGGCCTCTACGTCATCATCGGCCAGTTCGGCCACCTCTCACTACGTGGATCCGGAAATGAACGCCTCCTATCTGGCCATGGGTGCCGGCGGATCCTCGGCGATGAACGCCAGTGACTGCATGGACATCTGTTGCGTGCCTAGTTGCGAGAGCAAGCGGCACAACAACGAGAACATTACATTCCACACCATCCCACGCCGGCCAGAGCAAATGCGCAAGTGGTGCCACAACTTGAAGATACCCGAGGAAAAGATGCACAAGGGCATGCGGATCTGCAGCCTGCACTTCGAGCCCTACTGCATCGGCGGCTGCATGCGTCCGTTTGCGGTGCCCACCCTTCAGTTGGGTCACGATGACGAGGATATTCATCGGAATCCGGACGTGATTAAGAAGCTCAACATCCGGGAAACATGCTGCGTCGCCGTGTGTAAACGAAATAGGGACAGGGACCACGCCAACCTGCACCGGTTCCCTAGCAACGTGTCGCTACTGACCAAGTGGTGTGGCAATCTGCAGCGGTCTGTTCCGGATGGCAGTAAGCTTTTCAACGACGCCATCTGCGAGGTGCACTTCGAGGATCGATGCCTGCGCAACAAAAGGCTAGAAAAGTGGGCGGTACCCACCCTAATTCTGGGTCACGAGAACATCCCCTATCCGCTGCCAACGCCGGAACAGGTGGCCGAGTTCTACGCTCGACCCACGGCTCCCAATAATGGCGAGGAGCAGGGCGAGTGTTGTGTAGAGAGCTGCAAGAGGAATCCCAGTGTGGACGACATCAAGCTATACCGGCCGCCTGAGGAAGCCTCTGTGCTGGCCAAGTGGGCGCACAACCTGCAAACGGAGGCCGGTCAGCTGACGAGCATGAGGATCTGTAATCTTCACTTCGAGGCCCACTGCATTGGAAAGCGAATGCGGCCGTGGGCCATACCCACACTAAATCTGGCCGGCAACATAGAGAATCTCTACGAAAATCCGGAGCACTCGATGCTGTACAAGCGGCGAACTCACGCAAAGACTAAGCTTCCGGCCTCGGTGAAGCCAACTTGGGTGCCCAGATGTTGCCTTCCACATTGTCGTAAAGTTCGAGCTCTGCACAACGTCCAACTTTATCGCTTCCCCAAGCTCAATCGCTCCACTCTGGCCAAGTGGTCGCATAATCTGCAGGTTCCCATGGTGGGCAGTGCCCAACGCCGACTATGTTCAGCTCATTTTGAACCGCATGTGCTGAGCAAGAAGTGTCCGGTGCCGCTGGCGGTGCCCACGCTAGATCTTAACTCTCCGCCCGGCCTGAAAATTTACCAGAATCCGGCCAAGCTAAAGGCAAGCAAGCTGTGCCTGCAGCGGGTTTGCATTGTAGAAAGCTGCCGCAAGACGCGGGCGCAGGGCGTCCAGCTATTCCGACTTCCCCATAGTCCGACGCAACTGCGCAAGTGGATGCACAACATCAAGACGCGACCGAGGGCGGCGATGAGGGCTCAGTACCGGGTTTGTTCCCGGCACTTTGAGACGCACTCGTTTAATGGTCGGAGACTAAGCGCTGGCGCCATTCCCACCCTGGATTTGGGTCATGACGACGAGGACATCTATCCCAACGAGGCGCAGGCCTTTGCCGACGAGCACTGTGTTGTGGAGGGCTGCGAGGCATCCAAGGAACAGGCGGAGGTGAGACTCTTCCGTTTTCCCACCGATGACGACGATATGCTGTGGAAGTGGTGCAACAACCTCAAGATGAATCCCGTGGATTGCACCGGAGTGCGCATATGTAACAAACACTTCGAAGCGGATTGCATCGGACCCAAGCACCTGTACAAGTGGGCTATTCCCACCCAGGAACTGGGCCACGACGACGCCCAGATCGAGCTGATACCGAATCCCAAGCCAGAGGACAGGTATGTGGATCCGGTGTTCAAGTGCATCGTACCCACTTGCGGAAAGACGCGTCGCTTCGATGAGGTACAGATGAACAGCTTCCCCAAGGACCCGAATCTCTTCCAACGCTGGCAGCACAACCTGCGACTGGAGCACCTTAATTTCCTGGAACGCGAGCGCTATAAGATCTGCAATGCTCATTTTGAGGACATATGTATTGGCAAGACACGGCTGAACATAGGTTCGATTCCCACTCTGGAGCTTGGTCACGACGAAACGGAGGATCTGTTCCAGGTGAATCCGGGGGAGTTGCAAAGCAACCTTTTCGGACGCCAGCGGCGAGTTCACGAGGAATCGGGCGGAATAAGCATAAAGCAAGAACTTTCGGAGCCGGAAGACGTCAAGCCGGATGTGACGATCATGTCCGGTCTCAGAGATTCCATTACTAGACAGGCTAAGTTCAAGAAAACGATGTGCGAACTAAAGTGCTGTGTCCACAGCTGTGGGCGCAGTCGCCTTGAGCACGGAGCTCGACTCTTTCCGTTTCCCACCGGCAAGCAGCAGCATCTCAAGTGGCGCCACAATCTGCGCCTGGAGCCCGACGAGGTGGACCGTTCGACGAGGGTTTGCAGTGCCCACTTCAACCGGCGCTGCATCGACGGCAAGCAATTGAGGAGTTGGGCAATGCCCACCCAGCAACTGGGCCACCAGGAGCAGCCGATCTACGAGAACCCAAAGAACATTCCAGGATTCTTCACGCCCACCTGCGCCCTCGGTCATTGCCGCAAGCGGAGGAGCATCGACAACGACCTGCGCACGTATCGGTACCCAAGAAGTGAAGATCTGCTGGAGAAATGGCGGGCGAATCTGCGACTGTCGCCGGATCAGTGCCGCGGTCGGATTTGTGCGGATCATTTTGAGGCACAAGTGCGGGGCAAGCTGAAGCTAAAGACTGGGGCGGTGCCCACTTTAAAATTAGGCCACGATGAAGGCTTAATCTTTGACAATGAAGCCATTAAGGTGGGCGTGCCCGAAGAAGAGGAGGGAAGCTCGGAGTTGCCGCGACTGAAGCCCAAAAGGGAGCCAATCGATGAGGAGGAGGAAGACGGCGAGGTTGACGAGGAGCACCATGACCAGGATCACGAGGATGAAGATGAAAAAGACGACCACTATTTTGATCCCCTTGAACTGGTGGAAACCTTTGCCGAGCATGCATCCGATGAAGAAGCGGAATATCGTGGGGATGAGGAGGACAATCGGGACGAAGAGGAAGAAGACTTGGAGGAAGTCCTGCCGGACATGCCACCCACTCCTCCAATCGTGCCTCTGCGTCGCGAAAAGCCCGCCAACAATGTGACGCCTATTTGCTGCCTCAAGCACTGCAGAAAGGAACGCACTGCCTTTCACCTGCTCAGTACCTTTGGTTTCCCCAAGGATCGCCAGCTGCTGCTCAAGTGGTGTGCCAATCTCCACCTGAATCCGGATGACTGCATCGGCCGAGTTTGCATCGAGCACTTCCAGTCGGAGGTACTCGGAACCCGTAAACTTAAGCAGAACGCAGTGCCCACACTCAATGTGGGCCATAATGAGCCACTCAAATACTCATACAACGGTGTGGACCAGGATCAGGAGCAATCACCGGCACAGCAGTCGGTTTTTCGGCTTTGGAGCCTAAAACACTGCCGCAAGAGGAAACTAACAGAGCCGCCGGACATTCGCCAAAGCAAGTGGAATTCGATGGAGGTTCAGATGATGCGGAGGTCGAAGATGGAAATGCAGAGAGAGAGGGAGATCAAGAAGGAGATGCAGATGGAGAGGGAGATAAAGACGGAGACTCTAACGAAGAATCTGAGGGAGAGTGAAGTGCAAAGATGTTGCATCAGTACCTGCGAAAACAAGGATGCTGGCCAGTTACTTCCAATGCCTGAGGACCGAACTCTTTTAAGAAAATGGCTGCACAACCTGAAGCTGTCTATAGACACGGTGCCAAGCAAGATTCGCGTATGCCTGGATCATTTTGAGGCGAAAGTTGTGCGAAATGGAAAGCCCACGGAGCAGGCAGTACCGACCTTCAAACTGGACCAAAGCAGTCTGAACATCTACAGAAATAACGGGTCGTGTTTGGTGCTCGACTGCGCCAGTTCCCTTTCGGATCGCTTGAGCTTTGTGGATTTGCCGGGAAATATGGTCATAAGAGCGGAATGGATGTCCTATCTAAAACTCCCTCTTGGCAGTGAGGGACTTTTATGTGGTATCCACTTTTTGGAACTGTATGAGAATGTGGTTTTGCCAAAGGTTTTGCCCGCACAAGATTTCGAAATGCTGCATTTGACTTTTGACGAATTTAAATGCGCTGTGCCCGACTGCTCCTCCAAAATTTCCCATGATCTTCAGCTTATCCCGCTGCCAGACAAGGAAGTGACGCTTTTCAAGTGGCTGCATAACACTAAGATTGCATACGATCAATCACGGCATAAGAGCTATCGCATCTGCCTGCATCACTTTGAGCCAACGTGCCTAGAGGCGGATTTACCGAAGGTTTGGGCTTTACCCACTTTGCATCTGAACCATGAGGACAAGATTCATTTGAATCCTGGGCAGGACTCACGCAGTGAAACCCCGAATAGCAACTCCAGACTGACTCCTCTAAGAATTAAGACAGATCTCGCCTCACTGGGCAGTCCCTGCGCGAGTGCAAGTCCCAGTCCTCGAGGCAGGATCAGGATATGCTGCATTCCTTCATGCGGACAGTTTGGGAATAGTCAAATACGTCTCTACCGCTTTCCCACCGAAGAGCAGGCCCTGCTACGTTGGCTGGTGAACACACAGCAACAGCCTCGCCTGGTGGATCCCCTCGAGCTTTACGTGTGCCAGTCCCACTTCGAACCCGATGCCATATGCAAGAAGCAGCTTCGCAGCTGGGCGGAGCCCACCTTGAACCTGGGCCACGACGGTCATGTGATCCCCAATGCCAGGCACAACGGGAACATCGCCGACAGCCAGGAGACTGAGCAGGCGATGACGTTCATCCGGGAACGCTATTGCTCCGTGCTGACCTGCTTCCAGGCTGAAGGGAATGGAGTCAGGCTCTATGACTATCCCAAGGATATGACAACGATACGAAAGTGGGCAGCCGCGTGCCGACATCGCTCCATGCAGGCCAGCAGCCATGGGTTCAAGGTGTGCCAGTCTCACTTTGCTCCGGAATGCTTCGATCCTATCACTTTAGATCTGATTGACGGATCGGTTCCCACTCTGGAGTTGAGTAGAGATGATATTGAAAGACACTGCTTAGTGTCGGGATGTGTGAAGGATGCGACTGGAGAACGTCTGCGCTACTACAAGGTGCCAAAGACTGCGGGTCAGCTGGATGCCTGGAGCAACAACCTGAAGATCAATTCCATGGACCTCCTTCAGGGGGATCAGCTTATCTGCGAGCGTCACTTTGAATCCTTTTGCTTTGGTGCCAGCAAGGGACTGCGACCTGGAGCGCTTCCAACTCTCCAGCTAGGTCATGACGAAGAGGTGGAGATGTTACCCAATCCTGAAAGCCTCTGCCAGAGCAAGACGCAGGTATGCTGCGCCCCAGGATGCGGTCGTATTTGGCAGCTTGGAGAAACTCACTTCAGTGGGTTTCCCAAAGTATGGGCTTTGGCCGACAAATGGATGTATAATCTCCGACTGAAAGTATCTAAGGAGCTGCTAGGCAAGCTGAAAGTCTGCGGTTCCCATTTCGAAGCCTCCCTATTCGATAAAAGTGGATTAATTTTTGGTGCGATGCCCACTCTGGAGCTGGGTCATTCCTCTCCGGACATTTTTCAAACGGATAAGCAAAGCCTCGGCAAAAACTTAAAGGTTTCCAAGCGTGCCCAGATAGCGGAGACCGATTGCTGTTATCCTGAGTGCAAGGAACTGTCTAAAAGCTTGTCCTTCAATCTGCCCCAGGAGGAGCACCTTAGAATAGCATGGCTGCGTCATTTGGACATGGAAGAGCCGGCGAATGGTGTCGCACTGCTTTGCCCGCTGCACTACGTGATTCTATATGAGCTTAGTGTCAAAAGTTTTCCAGAGCATGTTCCAAATCGATTACTTGAGGATAATTACCACTCTGCTAGGAGCAACAGGCGCGTAAAGATCGTTAGCTGTGCGGTCAAAGGTTGTGATATGATCCGTCCCCGGGATAAGGTTCTCCTGCACGGATTGCCGCAAAGAAAAGACATCCTGATGATGTGGATAGAAAATGGACAGTTGGAGATCACCGAGCAGCAGCAACAGTACATGCTCAAGGTATGCCGCAATCACTTTGAGTCACGATGCTCGTTTGACGACAGGCGTCTGCATCCTTGGAGCGTTCCCACTCTACTTTTACCAGCTGATCCAGTGTATCAGATTCCCACCAAAGAAGAGTGGCTGGAGATGACGGCCAAAATTAGACAGGATCCAGGGGAAATCAATGGGGAAATGGAGGAAGAGCTGCCGGTGCAGGAAGAGGATGAGGCGGATAACTCTCTGTTGGAGCCCGTTGTGAGAATGGAGCACATCGAGTCCGAGGAGGAAGACTCGGAGATGCAGGCCCTGGAGGTGCTCTTGGAGGTCGGTCACGTTGAGCGGATGAACAGCTACGAGAATGTGGACACCGACCATGCCACCTACCAATCTGGTGGCATTCGAAACCAGTACAATGCCAACCACTGCGCCGTTGAGGGATGTGAGGTGACCGCCGAGGACGTGGACGGTACCATCAAGCTGCACAAGTTTCCCGCGTCTTCGGAGGCCGCCCATAAGTGGATGCACAACACCCAAGTTCACATGGACGCGAAGTTCTGGTGGCGCTATCGCATTTGCAGTTACCATTTCGACCAAGAGTGCTTCCAGAGCGCCAGAATAAGGAAGGGAGCGATGCCCACGCTGCTTTTAGGTCCTAACAGACCGGACAAGCTGTACGACAATGAATTCGCATTGCAGGAGGCAGAAGAGCCGCCTCCTTTGCCAGCAGATGTTCTGTTTGAGGAGCAAGAGGAGCCGCTAATTGAAAAGGTCACCAATCTGTGCCTGCCGCCGCCAGCTCCGCCTCGAAAGTCCAGCAAGTTTTGCCAGATAGACGGATGTACGAATCACCTGACCACCGAAAACATGACGCTACACAAGTTTCCCCACTCAGAGGACATGTGCCTCAAGTGGCAGCACAACACCCAGGTGCCATTCAATCCCTACTACCGGTGGCGGTACCGCATCTGCAGTGCCCACTTCCATCCCGTGTGCCTGGTGAACATGCGTCTAGTCCACGGCAGCGTGCCCACCTTGAAACTGGGAACCAAGGCTCCCACCGAGCTCTTCGACAACGACTTCCAGGCCATCAACCTACGGCTGGACAAGCGATCGGGAGCGGAGCCAAATTCTGTGCAGATCAAGGAGGAACGGAAAGAGGATGAAGACTCTATGCTGTTCCTAGAGCCCGAACTGCAGTTGCACGAAGACCAAGAGGAGGAGGAGATGGCAGAGATGCAGATACCCTTTAATCACTCCAACTGGAAGAGCCAGCTGCGCCTGCCCGTAAAGGTTTACTGCAACCAGGTGAAGTCCGGCTACGATAAGTGCTCTTTGAGTCATTGCCAGCGGCAGAGATCTCAGCACGGCGTCCATATCTACAAGTTTCCGAAATCGAAGCAACAACAGGATCGTTGGATGCACAACCTCCGCATCCGATACGATGAGCGGCGGCCCTGGAAGTTCATGATCTGCAGTGTGCACTTTGAGCCACACTGCATCAGTCTGAGAAAGCTGCGTCCCTGGGCAGTGCCCACGCTGGAACTGGGCGACAATGTGCCGGATAAGATCTTTACAAACGAGCAATGCCAGGAAATTTCCACTGATCGCAGCGAGGCGGACAGCGAAGGGGACGAGGAGGAGGATGGCCTGCAAGAGGACGAGGAAGAGGAGGAGGAATATGACGAAGACATGGAGCCGGAGGTTCACGTCAAGCGAGAGCGGCGTTCCAAGCTGGATCCTTGTCCTCCTGGCCAGCTTCCGCTTTGGAAGGTTAAGCAGTGCTGCCTTCCATATTGCCGTGCTTTCCGGGGTGACGGCATTAAGCTTTTCCGACTTCCGAACAACCGCAACTCCATTCGCAACTGGGAAGTGGCAACGGGAATGGTTTTCAAGGAGTCGCAGCGAAACACTCGTCTGATCTGTAGCCGCCATTTCGAGCCCGAGCTAATTGGGGTAAGGCGTCTCATGCGCAACGCTATTCCCACAAGGCATTTGAATTCCCAGGGTGCACATGACGACGTGAAGAGGAAGCCGGATCCTCCTATTCCCATTGCAACTTGCTGCATGGCTGACTGCCATCACAATGGAAACGTCAAGTTGCACAAGTTTCCCAGTGATCCCGCGCTGCTTAGGCAGTGGTGCCAAGCACTCCGATTAACGGATACGCAACGATACCGGGGCAAACATATCTGCTCGGTCCACCTGCCCACCGACAAGACGATTAGCTGCGTTGTCTGCGGAGTGGACAACGTTCAGCTGCCGATGCTGGACTTTCCGCAGCAGCGCAATCAGCGCGCCAAGTGGTGCTACAATCTCAAGATCGAGGCCATACCAAAGTGGGACCACTCCAAGCACATCTGCTGTCGTCACTTTGAGCCCCATTGCTTTGTCCAGCCGGGTGAACTACGACCAGGAGCGATTCCCACGCTGCATCTGAATCACGATGATACAAACATATTCCTCATCGACTATGCCGCTGGTGCGACGGGCAATCGGATTAAGGACGAGACCCTGGACAACGACGACATGCTGCTGGTTTAG
Protein Sequence: MSQQHHHHAHPHYHHYPPPATXXXXXXXXXXXXXXXXXXXXXXXXXXXXVASYPTPHSAFSSAHPSPCKATNNNIIMGGGYGSGVPGGVGGGTQGYYGAAGGGLNVSGAAXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXSYMGHEIMTGSYPYIKSEPLEAFQQPPNPMAPPPAPEILIKSEPIDEHSYKSNYIDDNTPFADFSKFSEFSEDMLSPKVELTVKDESYGRNPNSFLRRKQQLDRSAESLPICQRCKEVFFKKQTYLRHVAESNCGIQEYDFKCSTCPMSFMTTEELQRHKHQHRADRFFCHKYCGKHFDTIAECEAHEYMQHEYESFVCNMCSGTFANREQLYAHLPQHKFQQRFDCPICRLWYQTALELHEHRLAAPYFCGKYYTGGQSSSASQPQTQQHQNQTNYKLQDCHMATMEMPTAPHHKSNPSSSSLPATAALNSLLQQRQANADGAAMFAASALKNEVNVKLERSYSNSTSESSYSVQDSSYNNAYGSDSSIHGGAIAGPQAHSSTLDDSEDALCCVPLCGVRKSTSPTLQFFTFPKDEKYLNQWLHNLKMFHIPAASYTNFRICSMHFPKRCINRYSLCYWAVPTFNLGHDDVANLYQNRELTNTFTTGEVARCSMPHCTSQRGESNLKFYNFPKDIKSLIKWCQNARLPVQAKEPRHFCSRHFEERCIGKFRLKPWAVPTLHLGAQYGKIHDNPKNLYVEEKRCCLNFCRRSRSSDFNMSLYRFPRDEVLLRRWCYNLRLDPGVYRGKNHKICSAHFIKEALGLRKLSPGAVPTLHLGHTDTFNIYENELWPPPTASGSGLQQHQAQHHTSQHSLQQQLHSKSYQRHSAASTSSSASSATSHYVDPEMNASYLAMGAGGSSAMNASDCMDICCVPSCESKRHNNENITFHTIPRRPEQMRKWCHNLKIPEEKMHKGMRICSLHFEPYCIGGCMRPFAVPTLQLGHDDEDIHRNPDVIKKLNIRETCCVAVCKRNRDRDHANLHRFPSNVSLLTKWCGNLQRSVPDGSKLFNDAICEVHFEDRCLRNKRLEKWAVPTLILGHENIPYPLPTPEQVAEFYARPTAPNNGEEQGECCVESCKRNPSVDDIKLYRPPEEASVLAKWAHNLQTEAGQLTSMRICNLHFEAHCIGKRMRPWAIPTLNLAGNIENLYENPEHSMLYKRRTHAKTKLPASVKPTWVPRCCLPHCRKVRALHNVQLYRFPKLNRSTLAKWSHNLQVPMVGSAQRRLCSAHFEPHVLSKKCPVPLAVPTLDLNSPPGLKIYQNPAKLKASKLCLQRVCIVESCRKTRAQGVQLFRLPHSPTQLRKWMHNIKTRPRAAMRAQYRVCSRHFETHSFNGRRLSAGAIPTLDLGHDDEDIYPNEAQAFADEHCVVEGCEASKEQAEVRLFRFPTDDDDMLWKWCNNLKMNPVDCTGVRICNKHFEADCIGPKHLYKWAIPTQELGHDDAQIELIPNPKPEDRYVDPVFKCIVPTCGKTRRFDEVQMNSFPKDPNLFQRWQHNLRLEHLNFLERERYKICNAHFEDICIGKTRLNIGSIPTLELGHDETEDLFQVNPGELQSNLFGRQRRVHEESGGISIKQELSEPEDVKPDVTIMSGLRDSITRQAKFKKTMCELKCCVHSCGRSRLEHGARLFPFPTGKQQHLKWRHNLRLEPDEVDRSTRVCSAHFNRRCIDGKQLRSWAMPTQQLGHQEQPIYENPKNIPGFFTPTCALGHCRKRRSIDNDLRTYRYPRSEDLLEKWRANLRLSPDQCRGRICADHFEAQVRGKLKLKTGAVPTLKLGHDEGLIFDNEAIKVGVPEEEEGSSELPRLKPKREPIDEEEEDGEVDEEHHDQDHEDEDEKDDHYFDPLELVETFAEHASDEEAEYRGDEEDNRDEEEEDLEEVLPDMPPTPPIVPLRREKPANNVTPICCLKHCRKERTAFHLLSTFGFPKDRQLLLKWCANLHLNPDDCIGRVCIEHFQSEVLGTRKLKQNAVPTLNVGHNEPLKYSYNGVDQDQEQSPAQQSVFRLWSLKHCRKRKLTEPPDIRQSKWNSMEVQMMRRSKMEMQREREIKKEMQMEREIKTETLTKNLRESEVQRCCISTCENKDAGQLLPMPEDRTLLRKWLHNLKLSIDTVPSKIRVCLDHFEAKVVRNGKPTEQAVPTFKLDQSSLNIYRNNGSCLVLDCASSLSDRLSFVDLPGNMVIRAEWMSYLKLPLGSEGLLCGIHFLELYENVVLPKVLPAQDFEMLHLTFDEFKCAVPDCSSKISHDLQLIPLPDKEVTLFKWLHNTKIAYDQSRHKSYRICLHHFEPTCLEADLPKVWALPTLHLNHEDKIHLNPGQDSRSETPNSNSRLTPLRIKTDLASLGSPCASASPSPRGRIRICCIPSCGQFGNSQIRLYRFPTEEQALLRWLVNTQQQPRLVDPLELYVCQSHFEPDAICKKQLRSWAEPTLNLGHDGHVIPNARHNGNIADSQETEQAMTFIRERYCSVLTCFQAEGNGVRLYDYPKDMTTIRKWAAACRHRSMQASSHGFKVCQSHFAPECFDPITLDLIDGSVPTLELSRDDIERHCLVSGCVKDATGERLRYYKVPKTAGQLDAWSNNLKINSMDLLQGDQLICERHFESFCFGASKGLRPGALPTLQLGHDEEVEMLPNPESLCQSKTQVCCAPGCGRIWQLGETHFSGFPKVWALADKWMYNLRLKVSKELLGKLKVCGSHFEASLFDKSGLIFGAMPTLELGHSSPDIFQTDKQSLGKNLKVSKRAQIAETDCCYPECKELSKSLSFNLPQEEHLRIAWLRHLDMEEPANGVALLCPLHYVILYELSVKSFPEHVPNRLLEDNYHSARSNRRVKIVSCAVKGCDMIRPRDKVLLHGLPQRKDILMMWIENGQLEITEQQQQYMLKVCRNHFESRCSFDDRRLHPWSVPTLLLPADPVYQIPTKEEWLEMTAKIRQDPGEINGEMEEELPVQEEDEADNSLLEPVVRMEHIESEEEDSEMQALEVLLEVGHVERMNSYENVDTDHATYQSGGIRNQYNANHCAVEGCEVTAEDVDGTIKLHKFPASSEAAHKWMHNTQVHMDAKFWWRYRICSYHFDQECFQSARIRKGAMPTLLLGPNRPDKLYDNEFALQEAEEPPPLPADVLFEEQEEPLIEKVTNLCLPPPAPPRKSSKFCQIDGCTNHLTTENMTLHKFPHSEDMCLKWQHNTQVPFNPYYRWRYRICSAHFHPVCLVNMRLVHGSVPTLKLGTKAPTELFDNDFQAINLRLDKRSGAEPNSVQIKEERKEDEDSMLFLEPELQLHEDQEEEEMAEMQIPFNHSNWKSQLRLPVKVYCNQVKSGYDKCSLSHCQRQRSQHGVHIYKFPKSKQQQDRWMHNLRIRYDERRPWKFMICSVHFEPHCISLRKLRPWAVPTLELGDNVPDKIFTNEQCQEISTDRSEADSEGDEEEDGLQEDEEEEEEYDEDMEPEVHVKRERRSKLDPCPPGQLPLWKVKQCCLPYCRAFRGDGIKLFRLPNNRNSIRNWEVATGMVFKESQRNTRLICSRHFEPELIGVRRLMRNAIPTRHLNSQGAHDDVKRKPDPPIPIATCCMADCHHNGNVKLHKFPSDPALLRQWCQALRLTDTQRYRGKHICSVHLPTDKTISCVVCGVDNVQLPMLDFPQQRNQRAKWCYNLKIEAIPKWDHSKHICCRHFEPHCFVQPGELRPGAIPTLHLNHDDTNIFLIDYAAGATGNRIKDETLDNDDMLLV

Similar Transcription Factors

Sequence clustering based on sequence similarity using MMseqs2

100% Identity: iTF_00605601;
90% Identity: iTF_00512037; iTF_00588176; iTF_00494418;
80% Identity: -