Basic Information

Insect: Drosophila ercepeae
Gene Symbol: -
Assembly: GCA_018150545.1
Location: JAECWL010000189.1:9903639-9916502[-]

Transcription Factor Domain

TF Family: THAP
Domain: THAP domain
PFAM: PF05485
TF Group: Zinc-Coordinating Group
Description: The THAP domain is a putative DNA-binding domain (DBD) and probably also binds a zinc ion. It features the conserved C2CH architecture (consensus sequence: Cys - 2-4 residues - Cys - 35-50 residues - Cys - 2 residues - His). Other universal features include the location of the domain at the N-termini of proteins, its size of about 90 residues, a C-terminal AVPTIF box and several other conserved residues. Orthologues of the human THAP domain have been identified in other vertebrates and probably worms and flies, but not in other eukaryotes or any prokaryotes [1].
Hmmscan Out: # of c-Evalue i-Evalue score bias hmm coord from hmm coord to ali coord from ali coord to env coord from env coord to acc

1 29 8 1.5e+04 -3.5 4.5 38 62 324 351 316 370 0.60

2 29 3.2e-15 6.3e-12 45.9 4.2 1 86 560 632 560 633 0.86

3 29 1e-14 2e-11 44.3 5.0 1 87 660 729 660 729 0.83

4 29 9.2e-16 1.8e-12 47.6 0.2 1 87 751 823 751 823 0.85

5 29 3.9e-16 7.6e-13 48.8 6.2 1 87 922 992 922 992 0.82

6 29 5.2e-15 1e-11 45.2 3.2 1 86 1016 1087 1016 1088 0.82

7 29 9.5e-13 1.8e-09 38.0 1.2 1 87 1123 1191 1123 1191 0.81

8 29 3.2e-11 6.2e-08 33.1 2.5 1 86 1231 1300 1231 1301 0.77

9 29 2e-17 3.8e-14 53.0 0.3 1 86 1328 1397 1328 1398 0.82

10 29 8.4e-13 1.6e-09 38.2 1.5 1 85 1419 1487 1419 1489 0.79

11 29 6.9e-14 1.3e-10 41.6 0.7 1 86 1516 1587 1516 1588 0.84

12 29 2.9e-14 5.7e-11 42.8 2.0 1 86 1668 1737 1668 1738 0.83

13 29 2.4e-12 4.7e-09 36.7 0.1 1 86 1761 1829 1761 1830 0.82

14 29 8.5e-14 1.6e-10 41.3 1.4 1 87 1958 2027 1958 2027 0.81

15 29 4.5e-08 8.7e-05 23.0 0.0 1 86 2123 2188 2123 2189 0.79

16 29 1.7e-05 0.033 14.7 0.0 1 58 2204 2251 2204 2267 0.80

17 29 2.4e-12 4.7e-09 36.7 0.1 1 87 2281 2353 2281 2353 0.79

18 29 2.6e-14 5e-11 43.0 0.2 1 87 2413 2483 2413 2483 0.82

19 29 2e-10 3.8e-07 30.6 0.0 1 86 2518 2589 2518 2590 0.79

20 29 3.5e-11 6.7e-08 33.0 0.0 1 87 2598 2670 2598 2670 0.76

21 29 9e-14 1.7e-10 41.3 0.1 1 85 2694 2764 2694 2766 0.81

22 29 3.2e-08 6.2e-05 23.5 0.3 1 58 2794 2841 2794 2861 0.84

23 29 1.6e-12 3.1e-09 37.2 0.1 1 87 2879 2951 2879 2951 0.81

24 29 2e-15 3.9e-12 46.6 0.1 1 86 3058 3130 3058 3131 0.81

25 29 7.6e-13 1.5e-09 38.3 3.3 1 86 3191 3261 3191 3262 0.82

26 29 6.7e-14 1.3e-10 41.7 3.6 1 86 3332 3402 3332 3403 0.85

27 29 2.2e-11 4.3e-08 33.6 0.1 1 86 3486 3555 3486 3556 0.84

28 29 5.1e-10 9.9e-07 29.2 0.9 1 58 3584 3632 3584 3645 0.85

29 29 1.9e-09 3.6e-06 27.4 1.6 18 86 3650 3707 3638 3708 0.74

#	of	c-Evalue	i-Evalue	score	bias	hmm coord from	hmm coord to	ali coord from	ali coord to	env coord from	env coord to	acc
1	29	8	1.5e+04	-3.5	4.5	38	62	324	351	316	370	0.60
2	29	3.2e-15	6.3e-12	45.9	4.2	1	86	560	632	560	633	0.86
3	29	1e-14	2e-11	44.3	5.0	1	87	660	729	660	729	0.83
4	29	9.2e-16	1.8e-12	47.6	0.2	1	87	751	823	751	823	0.85
5	29	3.9e-16	7.6e-13	48.8	6.2	1	87	922	992	922	992	0.82
6	29	5.2e-15	1e-11	45.2	3.2	1	86	1016	1087	1016	1088	0.82
7	29	9.5e-13	1.8e-09	38.0	1.2	1	87	1123	1191	1123	1191	0.81
8	29	3.2e-11	6.2e-08	33.1	2.5	1	86	1231	1300	1231	1301	0.77
9	29	2e-17	3.8e-14	53.0	0.3	1	86	1328	1397	1328	1398	0.82
10	29	8.4e-13	1.6e-09	38.2	1.5	1	85	1419	1487	1419	1489	0.79
11	29	6.9e-14	1.3e-10	41.6	0.7	1	86	1516	1587	1516	1588	0.84
12	29	2.9e-14	5.7e-11	42.8	2.0	1	86	1668	1737	1668	1738	0.83
13	29	2.4e-12	4.7e-09	36.7	0.1	1	86	1761	1829	1761	1830	0.82
14	29	8.5e-14	1.6e-10	41.3	1.4	1	87	1958	2027	1958	2027	0.81
15	29	4.5e-08	8.7e-05	23.0	0.0	1	86	2123	2188	2123	2189	0.79
16	29	1.7e-05	0.033	14.7	0.0	1	58	2204	2251	2204	2267	0.80
17	29	2.4e-12	4.7e-09	36.7	0.1	1	87	2281	2353	2281	2353	0.79
18	29	2.6e-14	5e-11	43.0	0.2	1	87	2413	2483	2413	2483	0.82
19	29	2e-10	3.8e-07	30.6	0.0	1	86	2518	2589	2518	2590	0.79
20	29	3.5e-11	6.7e-08	33.0	0.0	1	87	2598	2670	2598	2670	0.76
21	29	9e-14	1.7e-10	41.3	0.1	1	85	2694	2764	2694	2766	0.81
22	29	3.2e-08	6.2e-05	23.5	0.3	1	58	2794	2841	2794	2861	0.84
23	29	1.6e-12	3.1e-09	37.2	0.1	1	87	2879	2951	2879	2951	0.81
24	29	2e-15	3.9e-12	46.6	0.1	1	86	3058	3130	3058	3131	0.81
25	29	7.6e-13	1.5e-09	38.3	3.3	1	86	3191	3261	3191	3262	0.82
26	29	6.7e-14	1.3e-10	41.7	3.6	1	86	3332	3402	3332	3403	0.85
27	29	2.2e-11	4.3e-08	33.6	0.1	1	86	3486	3555	3486	3556	0.84
28	29	5.1e-10	9.9e-07	29.2	0.9	1	58	3584	3632	3584	3645	0.85
29	29	1.9e-09	3.6e-06	27.4	1.6	18	86	3650	3707	3638	3708	0.74

Sequence Information

Coding Sequence: ATGTCACAACATAATCAACCCCACCAAGTTCCCCCGCACCCGCATCCGCATCCGCACTATCCCTACCACCACGNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNTGTTGCTTCCTACCCACCCTCCCATACGGCCTTCAGCCCCGCACTCCCCTGCAAGGCCGCCAGCAACAGCAACAGCGCCACCAACAACAACTCCATCATGGGCGCCTATGGAGGGGGCGGCGACACGCATGGCTATTACGGCAATGTAAGCGCCGGAATCGGAGTGGGAGTGGGTGGTGGGGCAGTAGGCTCGACCTACGGCCTTGGGGCNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNCCTGGGCCACCGGTCGTATATGGGGCACGATGTCATGACAGGGACAGGGACCGCAACCGGTACCTATCCGTATATCAAAAGCGAACCCATGGAGGCTTTTCAGCAGCCGCCAAACCCCATGGCTCCGCCACCATCCCTGCCCCCAGCCCAAGAGATGATCATAAAATCGGAACCCATTGACGAACAGGCCTACAAGTCCAACTATGTTGACGACAACACGCCCTTTGCCGACTTCAGTAAGTTCAACGAATTCAGCGAAGACATGCTGAGTCCCAAAGTGGAGCTGACCGTCAAAGACGAGTCGTACGCCAAAAACTTCCACCATCGAAAGCTGCAAAACGATCGCCCTGCCGGCAATGAAAGCCTGCCGGTGTGCCAGCGCTGCAAGGAGGTGTTCTTCAAGAAGCAGACCTACCTGCGCCACGTTGCAGAGAGCAGCTGCTGCATCCAGGAGTATGACTTCAAGTGCACCATCTGCCCCATGTCCTTCGTGAGCGCTGAGGAGCTGCAGCGGCACAAGCACCATCATCGGGCCGATCGTTTCTTCTGCCACAAATACTGTGGCAAGCATTTCGAATCGATTGCCGAGTGTGAGGCGCATGAGTACATGCAGCATGAGTACGACAGCTTTGTCTGCAATATGTGCTCGGCCAACTTTGCGACCAGGGAGCAGCTTTACTCCCACCTACCGCAGCACAAGTTTCAGCAGCGCTTCGACTGCCCCATATGCCGCCTATGGTATCAGACCGCTCTCCAGCTGCACGAGCACCGGATAGCGGAGCCCTATTACTGCGGCAAATATTACGCAAGCGGACTTAACACAGGCGCATCACAGCAGCAGCAGCAACACCACCAGAGCCAGACGAACTACAAGCTACAGGATTGTCACATGGCCACAATGGAGATGCCCAATACATCGCAACACAAGCCGAATTCCTCCAACTCCACCATGCCGGCTACGGCGGCACTTAGTTCCTTGCTCCAGCAGCGGCAAGCAAAAGCCGATGGGGCAGCCTTGTTCGCTGCCTCGGCGGTCAAGGCGGAAACAAACGTGAAGCTGGAGCGGAGCTACAGTAACTCGACCAGTGAATCATCGTACGGTATGCAGGATGGCGGCTACAACAACTCCTTTTCCGGAGAGTCTTCGATGCACAGCGGGGCCATCGCCGGACCGCAAGCCAACTCCTCCACGCTTGACGACTCCGAGGACGCGCTGTGCTGTGTGCCATTATGTGGAGTACGCAAGAGCACCAGCCCCACGCTGCAGTTCTTTACGTTCCCCAAAGACGACAAATACCTCAACCAGTGGCTGCACAATCTGAAGATGTTCCATGTGCCGGCCTCCAGCTACAGCAGCTTCCGGATCTGCAGCATGCACTTCCCCAAACGCTGCATCAATCGATATTCGCTGTGCTATTGGGCCGTACCGACATTCAACCTGGGCCACGACGACGTGGCCAATCTCTACCAGAACCGAGAGCTCACCAACACTTTCACCGTCGGCGAGGTGGCCCGGTGCAGCATGCCCCACTGTACCAGCCAGCGGGGCGAGAGCAATTTGAAGTTTTACAACTTTCCCAAGGACATCAAGAGCTTGATTAAATGGTGCCAGAACGCCCGTCTGCCTGTCCAGGCCAAGGAGCCGCGCCACTTCTGCAGCCGTCACTTCGAGGAACGCTGCATCGGCAAGTTCCGCCTTAAGCCCTGGGCGGTGCCCACTCTTCATCTGGGCGCTCAGTATGGAAAGATTCACGACAATCCCAAGAACTTGTATGTGGAAGAGAAACGCTGTTGCCTAAACTTTTGTCGCAGGAGCAGGTCCTCTGACTTCAATATGTCGCTGTATCGATTCCCCAGAGACGAAGTGCTCCTTCGTCGTTGGTGCTATAATCTCCGCTTGGATCCAGGAGTTTATCGAGGCAAGAATCACAAAATATGCAGCGCCCACTTTATCAAGGAGGCATTGGGTCTGCGAAAGTTATCTCCCGGAGCCGTGCCAACATTGCATTTGGGTCACAATGACACCTTCAACATCTACGAGAACGAGCTGTGGCCGCCGCCGACTCCTTCCACCAGCCATGGTGGTGGCCAGATGCAGTTGCAGCACCAACAACAACTCCCGGCGCACCACTCGCTCCAGCACCAGCTGCATATTGGACAGGGAAAGTCCTACCAACGCCACTCAGCCGCTTCCACTTCCTCCTCGGCGAGCTCCACCTCGCACTACGTGGACCCGGAGGTAAGCGCTTCATACCTGGCGATGGGTGGCTCCTCGATGAACGCCACCGACAGCATGGATGTCTGCTGTGTGCCCACCTGCGAGAGCAAGCGACACAACTCGGAGAACATCACCTTCCACACGATTCCGCGAAGACCGGAGCAGATGCGAAAGTGGTGTCACAACCTGAAGATACCCGAGGACAAAATGCACAAGGGCATGCGAATTTGCAGCCGGCATTTCGAGCCCTACTGCATCGGCGGGTGCATGCGCCCGTTCGCAGTGCCCACGTTGCACCTGGGGCATGACGACGAGGACATTAACCGAAACCCGGACGTAATCAAGAAGCTGAACATCCGCGAGACATGTTGCGTAGCTGTGTGCAAGCGAAACCGGGACAGGGACCACGCAAACCTGCACCGCTTCCCCAGCAACGTGGCTTTGCTGACCAAGTGGTGTGCCAATTTGCAGCGTCCCGTTCCGGACGGCAGCAAGCTCTTCAACGACGCCATTTGCGAGGTGCACTTCGAAGATCGTTGTTTGCGAAACAAGCGCCTGGAAAAGTGGGCGGTGCCAACACTGATCCTGGGCCACGAAGACATTGCCTATCCACTGCCCACGCCGGATCAGGTGGCCGAGTTCCATTCTCGACCCTCGGCCCCCAACAATGGCGAGGAGCAGGGCGAGTGCTGCGTCGAGACCTGTAAGCGAAATCCCAGCGTGGACGACATCAAACTATACCGGCCACCGGAGGAGGCCTCTGTGCTGGCCAAGTGGGCGCACAACCTACAGACTGAGGCCGCCCAGTTGGTAAGCCAGCGAATCTGCAATCTGCACTTCGAGGCCCACTGCATTGGCAAGCGAATGCGGCCGTGGGCCATTCCCACCCTCAACTTGGCCGGAAACATTGAGAATCTCTACGAGAACCCGGAGCCCTCGATGCTTTACAAACGTCGAATGCACACGAAAGCCAAGTTGTCCGCCTCTGCGAAGCCTACCTGGGTACCGCGTTGCTGCTTGCCACATTGCCGCAAGGTACGTGCCCTGCACAACGTCCAGCTCTACCGCTTCCCCAAGCACAACCGCTCTACGCTGGCCAAGTGGGCGCACAATTTGCAAGTGCCCATGGTGGGAAGTGCCCAACGACGGGTTTGCTCCGCTCATTTTGAGCCGCACGTGCTGAGCAAAAAGTGTCCGGTGCCGTTGGCAGTGCCCACTCTGGACCTGAACGCGCCACAAGGGCATGTGGTCTACCAGAATCCGGCCAAGCTGAGGGCTAGCAAACTGTGCCTGCAGCGCGTATGCATCGTAGAGAGCTGTCGCAAGACACGGGCGCAAGGCGTGCAACTTTTCCGGCTGCCGCACAATCCCACCCAGCTACGGAAGTGGATGCACAATATCCGGACACGTCCACGGGGTTCCATGCGGTCCCAATACCGGATTTGCTCGCGCCACTTTGAAACGCATTCGTTTAACGGCCGAAGGTTAAGTGCAGGGGCCATTCCCACGCTGGAGCTGGGTCATGAGGACGACGACATCTACCCCAACGAGGCGCAATCCTTTGTGGACGAGCACTGCGCCGTGGAAGGATGCGGGGCATCTAAAGAGCAACCGGAAGTGCGGCTTTTCCGCTTCCCCACCGACGACGACGACATGTTGTGGAAATGGTGCAACAATCTCAAAATGAATCCGGCCGACTGCACCGGCGTCCGAATCTGTAACAAGCATTTTGAGGCGGACTGCATTGGACCCAAGCACCTATTTAAGTGGGCTATTCCCACCCAGGAGCTGGGCCACGACGATGCCCAGATCGAACTCATTCCGAACCCGAAGCCGGAGGATCGTTACGTGGATCCGGTGTTCAAGTGCATTGTGCCCACCTGCGGCAAGACGCGGCGTTTCGACGAGGTCCAAATGAACAGCTTCCCTAAGGACTCCGAGCTCTTCCAGCGATGGCGTCATAACCTCCGCTTAGACCACTTGTTCTTCCACGAGCGGGAACGCTACAAGATCTGTAACGCCCACTTCGAGGACGTTTGTATTGGCAAAACGCGTCTGAATATCGGCTCAATACCTACACTGGAGCTGGGACACGATGAGACCGATGACCTATTCCAGGTCAATCCTGCGGAGCTGCAGAGCAACTTGTTCGGTCGCCAGCGGCGGCTGCTTGACGAATCGGAATCGGGCGAGGGGGTGATCAAGCAGGAGCTTCCGGACGGTGATATCGAGCCTGACGATGTAAAACCTGATGTAAGGGAACTAATAATTTCCAAACCCAGACAGGTGAAGGCCAAAAGAAGGGGCCTGACGAATTTGAAATGCTGTGTGCGCAGTTGCGGAAGGAGCCGCCTCCAACATGGGGCACGTCTGTTTGCCTTTCCCTCGGGCAAGCAGCAGCACCTCAAGTGGCGCCACAATCTTCGACTAGAGCCCGAGGAGGTGGATAGTACCACACGGGTGTGCAGCGCTCACTTCAATCGCCGCTGCATAGATGGCAAACAGCTGAGGAGCTGGGCAATGCCCACATTGCAGCTGGGGCATCGGGAGCAGCCCATCTACGAGAACCCCAAGAACATACCGGGCTTCTTTACGCCCACTTGTGCCCTGAGCCACTGCCGGCAGCGAAGAAGCATCGACAACGACCTGCGAACATACAGGTATCCTCGGACGGAGGACTTGCTGGAAAAGTGGCGCGCGAATCTTCGCCTGGCTCCGGATCAATGTCGCGGCCGCATCTGTGCGGATCACTTTGAACCCCTGGTGCGGGGTAAGTTGAAGCTGAAAACCGGCGCCGTGCCCACTCTGAAGCTGGGCCACAACGAGGGATTGATCTATGACAACGAGGCAATTAAGGCGGGCATAGCGGAGGACGAGGAAGTCGCATGCAAGCAGGAAATAATGGACGAAGGGGAGGAGGTCGAAGGAGAGGGAGAAGAGTCGCCTGAGGTGGATCCTGCAGTTAACGATGATGAAGACGACAAAGACGACAGTTACTTCGATCCTTTAGAGTTGGTTGAAACATTTGCAGAGCGAGCGAGCGACGAAGATGCGGAAGATCACGAAATGGGAGAGGAAAATGAACCCGATGAAGGGGATGAGGATGCAGAGCAGCTCCTGCCGGACCTGCCACCCACTCCTCCACCCGTGCCCCAGCGTCGCGAAAAACCTGCCAATAATGTGACCCCCATCTGCTGCCTGAAGCATTGTCGCAAGGAACGTACGGCCTTCCACCTTTTGAGCACATTCGGCTTTCCTAAGGACCGTAAGCTATTGCTGAAGTGGTGCGCCAATCTTCACCTGCATCCGGATGACATTGTCGGACGGGTCTGCATCGAGCACTTTGAGCCGGAGGTCCTCGGCACGCGTAAACTCAAACAGAATGCTGTGCCCACCGTGAACTTGGGGCACCAGGAACCGTTACGCTACTCCTGCCATGGCGTGGAACTGGATCAGGACTTGGAGCATGGACAGGCACAACATTCGGTTTTTCGGCTTTGGAGCCTGAAACACTGCCGCAAGAGGAAGCTATCGGATCCGCCGGATATTCGGGCCAGCGATTGGAAGGAGCTGAAGATGCACATCCAGAAGCAGAGGGAGTTGGAGATGGCGGCGGAGCGGGACAGGGAGAGGGACATTCGGATGAGCACTCCACCTCAGACACCGGTGAAGATTAAACCAAAAAGATGCTGCGTTGTCAGCTGTGGGAGCGAGGATATGAAAAAATTGCTACCTCTGCCGGATGAGCGTGGCCTTTTCCGCCAGTGGCAGCATAACCTCAAGTTGCCAGCATTAATAGATTTAAGTCTCGGTTTGTGCCTGGACCATTTCGAAGAGTCTCAAGTGCGAAATGGAAAGCCCTTAGAAAGGGCAGTGCCCACCCTGAAGTTGGGTCACAGCAGTTGTAATCTTTACCGAAACAACGCGGCTTGCCTGGTGACCAGTTGTCCAAGTTCTGGCTCCGATACCATTAGCTTTGTGGGCCTGCCCGCGAATTTAGTGATGAAAAAGGCCTGGCTGTCCTACCTTCAACTTCCATTCGATAGTGAAGGACTCCTTTGTGGCACACACTTTGTGGAACTCTACGAGCAGGTGGATTTGCCCGAGGACTTACCCGTCCAGGATTTAGAGGAGCTGGAACGTACTGTTGATGAGCTGCAGTGCGCTGTACCCGGTTGCGAGTCCAAGAACGCCCGTGATGAACCCGTCCAGCTGGTCCAATTGCCCCACAACGAGGGGGAACTTTCAAAGTGGCTACACAACACAAAGATCACCTATGACTACTCGCGACATAGTAGCTATAGAATCTGCCTGCTCCACTTTGACCCCGTCTGCTTGGATGCAGACTTTCCAGCAAGTTGGGCAGTGCCTACCCTAAATCTGGGCCACGACGAAGAAATCCACCAGAATCCCGTGCATCATCAACAGCTGAGGTTGCGCAGCGAAACCAGCAACTATAATTCCTGTCAGACTCCTCTCAGGATCAAAACGGAACTAACTTCCGTGGAAAGCCCCAGTATAAGCGCCAGTCCCAGTCCAAAGGGTAAAATCCGGATATGCTGCATCCCCACATGTGGGCAGTTTGGGAACAGCCAAATACGTCTTTACCGCTTTCCCAGTGATGAGCAGTTCCTCCTCCAGTGGCTGGTAAACACTCAGCAACAACCCCGACTCGTTGACCCCATGGAGCTCTATGTGTGCCAGGCACACTTTGAAACCGACGCCATTTCAAAGAAGCATCTTCGCAGCTGGGCATTGCCTACCTTAAACCTGGGTCACGACAGGCATGTCTTCCAAAATCCCAGGCACAACGGAAACATTGCGGAAAGCTTGGACATAGAGGAAGCAGTTAAGTTTATTCGAGAGCGCTACTGTTCCGTACTAAGTTGCTTTCAGCCTGGAGGAGAAGGCGTCCGGCTGTTCAAGTACCCCGAGGATATGGCCATGATCCGAAAGTGGGCAGTTGCCTGCAAACATCGTTCAATGCACGCCAGAACCCAGGGGCTCCAGGTGTGCCAGGCGCACTTTGCCGCCGAATGCTTTCATCCGGACACTGGAGCTCTTCTAGAAGGGTCGATTCCCACACTAGAACTAATCCGCGATGACAGGCACTGCTTGGTGCGGGGATGTGAGCGGGATGAATCGGGTCCCCGATTGCGATTCTATAAGCTGCCCAAGATCACTGACCAGGTCGAGGCTTGGAGCAACAACTTGCTAATTCCACTTTCAGAATTAATGCAAGGAGATCAACGCATTTGCGAGCGACACTTTGAAGCGTGCTGCTTTGGAGCTAGCCGAGGTCTTCGGCTGGGAGCTTTACCCACTTTGTTTCTGGGTCATGAAGAAGAAGTCGACTTGCTTTCCAATCCCGAGAAGTTGCGGCTGGGCAAGCAGGAGAACTGTTGCGTATCGGGCTGCGAGCGAATCCGACTGGCTGATGATATCCCTTTTTACAGCTTCCCAAGGCTTTGGCCCTTAGCCAGGAAGTGGCTGCACAATCTCCGTCTAGAAAAAACAAGCAAGGACCAGCTACAAAAACTTAGGATATGCCCGGCGCACTTTGACTCGGACGTGCAAGATGAAGATGGACTGCTGCCAGGAGCCATGCCCACCAAGCAGCTTGGACATTCCTCCGAGGGAATTTTTCTGCCACAGGAGAAGGATTTTCAGAGTAACAAAAACTCATTCCATGAGTATACTTGCTGTTATCCGAAATGTACTGATGCCTCCAAAAAAGAGTTATTAGAATTTCCCGACGAAACAGAGCTCCGCCAAGCCTGGTTGGATCATTTAAATATTAAGGAGAGAGCTAATAGAACCCTACAGCTCTGTTCCCTCCATTATGTGATTCTTTATGAGCACAGTGTCAAGGAGTTCCCGGAGCATCTTCCAAGCCAGTTAATGCAACAGAACTACGAAATTGCCCGCGACAATCGTCGGGTGAAGATCGTTAGTTGTGCCATCAAGGGATGCAGTATGCTAAAGCCTAGAGATGGAGTGCTGCTCCACGGCGTGCCCATGCGCAAGGACATCTTGCAGATGTGGATCGACAACGGGCAGATAGAGTTCTCCGAACAGCAACGTTACATGTTTAGGGTGTGCCACAGACACTTTGAGTCACGTTGCTTCATCGACGAGCGTCGGCTCTCCTCCTGGAGTGTCCCCACTCTGCATCTTCCTGGTGAGGTTATCCATCAGAATCTCAGCAAGGAAGAGTGGGAGGTCATTAAGCAGGAAAAGGTAGATCCAGAAATTGAGCAGGAACCTCTAGAGACGGAGATGGAAACGGAAAACTCTCTTCTCGAGCCGATTGTAAGGATGGAGCATGTGGAATCCGACGAGGACGACTCGCAAATGCAGGCATTGGAGGTGCTGCTGGAGGTGGGACACGTGGAACGGCTGGACAGTTACGAAAAGATTGACAAATCTCCAATTGTCTACCCCGAGCATGTTATGTATAGATCAAATAGGAGTCAGTACAATGCCAACCGCTGCGCCGTGGAGGGATGCGAGGTTACCGTCGAGGACGTAGACGGAACCATCAAGTTGCACAAGTTTCCAGCCTCCACGGAGGCTGCCCAGAAGTGGATGCATAACACTCAGGTGGACATGGAAGTGAAGTACTGGTGGCGGTACCGCATCTGCAGCTATCACTTTGATCCGGAGTGCTTCCAGGGATCTAGAATCCGGAAGGGAGCCATGCCCACACTGTTGTTGGGATCCCAGAGACCGGATGAGCTCTACGACAATGAGTTCATTTCCATGCCGGAGGTTGAGGACCTACCTTTGCCGGTCGAGATTAGCCAGAGCGATGTGGCAGAGAAAACTGTTCCAGAAGTGACCAATATTTGCCTGCCCCCGCCAGCTGCGCCGCGAAAATCCAGCAAGTTCTGCCAGATCGAAGGGTGCTCGAATCATCTAACCACCGAGAACATAACCCTCCACAAGTTTCCGCACTCGAAGGATATGTGCATCCGATGGCAGCACAACACACAAGTTCCATTCGACCCAGATCATCGTTGGCGGTACAGGATATGTACAGCCCATTTTGAGCCCGTGTGCTTGTCCAATTTGCGCCTGCTCCACGGAAGTGTGCCCACCTTAAAGCTGGGACCCAAAGCTCCCGCCGAACTTTTCGACAACGACTTTGAGGCCATCAACCAGCGACTGGATAAGAAATCGGCGGCAGAGGTATATCAGGAACGGGTGGATATGGAAGACGAGCTTAGCGAGGATCAGGTAGAGACACCTATCTGTATTCCTGTAAAACAGGAGAAGATATCCTTTAACCAGATCAAGTCCGGCTACGACAAGTGCTCACTGGCCCACTGCCAACGGCAAAGATCTCTGCATGGCGTACATATCTATAAGTTCCCTAGGTCGCAGCGCCAGCAGGAGCGATGGATGCACAACCTCCGCATCCGCTACGATGAGCGCCGGCCCTGGCGTTTCATGATTTGCAGTGTCCACTTCGAGCCGCACTGTATCAGCCTTAGGAAGCTGCGTCCATGGGCAGTTCCTACGCTGGAGCTGGGCCCGAATGTACCGGAGAAAATCTTTACAAACGAGCAGTGCCAGGAACTGGAGGTTGAACAACCAAGTGATCGTAGCGAGGCAGAGAGCGAGGAGGAGGATGGTCTGGAAGAAGACGATGATGGGGAGGAGGACAATATCGAGGAAGATGGACAAGAACTCAATGTGCACAATAAGAAAGAGCGGCGCTCGAAGTTGGACTCGTGTCCGTCCGGTCAGGTTGCGCCATGGAAGGTAAAGCAGTGTTGCCTGCCCTATTGTCGCGCCTTCCGAGGAGATGGCATCAAGCTGTTCCGGCTGCCCAACAACCGATCCTCCATCCGCAACTGGGAGATTGCCACGGGCATGATGTTTAAGGAGTCGCAGCGAAACACACGACTCATTTGTAGTCGACATTTTGACCCGGAACTTATTGGTGTCCGTCGTCTCATGCGCAACGCAATTCCCACCCGGCACCTGAATCCAAAATCCGTTACAAGCGACGAGAAAAGGGTTTTGCCGGTCAAGACTATGGATACGCCTCCCCCAATGCCCTCCTGCTGCATGGCGGACTGCCATTATAATGGTAATGTGAAGATGCATAAATTTCCCAGTGATCCCACACACCTGAGGCAGTGGTGCCAGGCTCTCAGACTCACGGATACGCAACGTTATCGTGGCAAGTATATTTGCGCGGCCCACCTGCCTACCAACATGTCAGTTAGCTGCGTCGTCTGCGGGATGGATGACGTACAGCTGCCGATGCTGAACTTCCCAGAGAACCGCAACCAGCGGGCTAAATGGTGCTACAACCTAAAGATTGAGACCATACCCAAGTGGGATCGCTCCAAGCACATCTGCTGCCGGCACTTCGAGGCACACTGCTTTGTCCGGCCGGGTGAACTTCGTCCAGGAGCGACCCCTACAGTGGCTTTGAACCACAACGACACAAACATATTCCTTAGCGACTACTCCATCGATTCGGCGACCTCCTATGGCGGTAATCGAATCAAGGACGAACCCAAGGACGGCAACGACACGCTCCTGGTCTAG
Protein Sequence: MSQHNQPHQVPPHPHPHPHYPYHHXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXVASYPPSHTAFSPALPCKAASNSNSATNNNSIMGAYGGGGDTHGYYGNVSAGIGVGVGGGAVGSTYGLGAXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXLGHRSYMGHDVMTGTGTATGTYPYIKSEPMEAFQQPPNPMAPPPSLPPAQEMIIKSEPIDEQAYKSNYVDDNTPFADFSKFNEFSEDMLSPKVELTVKDESYAKNFHHRKLQNDRPAGNESLPVCQRCKEVFFKKQTYLRHVAESSCCIQEYDFKCTICPMSFVSAEELQRHKHHHRADRFFCHKYCGKHFESIAECEAHEYMQHEYDSFVCNMCSANFATREQLYSHLPQHKFQQRFDCPICRLWYQTALQLHEHRIAEPYYCGKYYASGLNTGASQQQQQHHQSQTNYKLQDCHMATMEMPNTSQHKPNSSNSTMPATAALSSLLQQRQAKADGAALFAASAVKAETNVKLERSYSNSTSESSYGMQDGGYNNSFSGESSMHSGAIAGPQANSSTLDDSEDALCCVPLCGVRKSTSPTLQFFTFPKDDKYLNQWLHNLKMFHVPASSYSSFRICSMHFPKRCINRYSLCYWAVPTFNLGHDDVANLYQNRELTNTFTVGEVARCSMPHCTSQRGESNLKFYNFPKDIKSLIKWCQNARLPVQAKEPRHFCSRHFEERCIGKFRLKPWAVPTLHLGAQYGKIHDNPKNLYVEEKRCCLNFCRRSRSSDFNMSLYRFPRDEVLLRRWCYNLRLDPGVYRGKNHKICSAHFIKEALGLRKLSPGAVPTLHLGHNDTFNIYENELWPPPTPSTSHGGGQMQLQHQQQLPAHHSLQHQLHIGQGKSYQRHSAASTSSSASSTSHYVDPEVSASYLAMGGSSMNATDSMDVCCVPTCESKRHNSENITFHTIPRRPEQMRKWCHNLKIPEDKMHKGMRICSRHFEPYCIGGCMRPFAVPTLHLGHDDEDINRNPDVIKKLNIRETCCVAVCKRNRDRDHANLHRFPSNVALLTKWCANLQRPVPDGSKLFNDAICEVHFEDRCLRNKRLEKWAVPTLILGHEDIAYPLPTPDQVAEFHSRPSAPNNGEEQGECCVETCKRNPSVDDIKLYRPPEEASVLAKWAHNLQTEAAQLVSQRICNLHFEAHCIGKRMRPWAIPTLNLAGNIENLYENPEPSMLYKRRMHTKAKLSASAKPTWVPRCCLPHCRKVRALHNVQLYRFPKHNRSTLAKWAHNLQVPMVGSAQRRVCSAHFEPHVLSKKCPVPLAVPTLDLNAPQGHVVYQNPAKLRASKLCLQRVCIVESCRKTRAQGVQLFRLPHNPTQLRKWMHNIRTRPRGSMRSQYRICSRHFETHSFNGRRLSAGAIPTLELGHEDDDIYPNEAQSFVDEHCAVEGCGASKEQPEVRLFRFPTDDDDMLWKWCNNLKMNPADCTGVRICNKHFEADCIGPKHLFKWAIPTQELGHDDAQIELIPNPKPEDRYVDPVFKCIVPTCGKTRRFDEVQMNSFPKDSELFQRWRHNLRLDHLFFHERERYKICNAHFEDVCIGKTRLNIGSIPTLELGHDETDDLFQVNPAELQSNLFGRQRRLLDESESGEGVIKQELPDGDIEPDDVKPDVRELIISKPRQVKAKRRGLTNLKCCVRSCGRSRLQHGARLFAFPSGKQQHLKWRHNLRLEPEEVDSTTRVCSAHFNRRCIDGKQLRSWAMPTLQLGHREQPIYENPKNIPGFFTPTCALSHCRQRRSIDNDLRTYRYPRTEDLLEKWRANLRLAPDQCRGRICADHFEPLVRGKLKLKTGAVPTLKLGHNEGLIYDNEAIKAGIAEDEEVACKQEIMDEGEEVEGEGEESPEVDPAVNDDEDDKDDSYFDPLELVETFAERASDEDAEDHEMGEENEPDEGDEDAEQLLPDLPPTPPPVPQRREKPANNVTPICCLKHCRKERTAFHLLSTFGFPKDRKLLLKWCANLHLHPDDIVGRVCIEHFEPEVLGTRKLKQNAVPTVNLGHQEPLRYSCHGVELDQDLEHGQAQHSVFRLWSLKHCRKRKLSDPPDIRASDWKELKMHIQKQRELEMAAERDRERDIRMSTPPQTPVKIKPKRCCVVSCGSEDMKKLLPLPDERGLFRQWQHNLKLPALIDLSLGLCLDHFEESQVRNGKPLERAVPTLKLGHSSCNLYRNNAACLVTSCPSSGSDTISFVGLPANLVMKKAWLSYLQLPFDSEGLLCGTHFVELYEQVDLPEDLPVQDLEELERTVDELQCAVPGCESKNARDEPVQLVQLPHNEGELSKWLHNTKITYDYSRHSSYRICLLHFDPVCLDADFPASWAVPTLNLGHDEEIHQNPVHHQQLRLRSETSNYNSCQTPLRIKTELTSVESPSISASPSPKGKIRICCIPTCGQFGNSQIRLYRFPSDEQFLLQWLVNTQQQPRLVDPMELYVCQAHFETDAISKKHLRSWALPTLNLGHDRHVFQNPRHNGNIAESLDIEEAVKFIRERYCSVLSCFQPGGEGVRLFKYPEDMAMIRKWAVACKHRSMHARTQGLQVCQAHFAAECFHPDTGALLEGSIPTLELIRDDRHCLVRGCERDESGPRLRFYKLPKITDQVEAWSNNLLIPLSELMQGDQRICERHFEACCFGASRGLRLGALPTLFLGHEEEVDLLSNPEKLRLGKQENCCVSGCERIRLADDIPFYSFPRLWPLARKWLHNLRLEKTSKDQLQKLRICPAHFDSDVQDEDGLLPGAMPTKQLGHSSEGIFLPQEKDFQSNKNSFHEYTCCYPKCTDASKKELLEFPDETELRQAWLDHLNIKERANRTLQLCSLHYVILYEHSVKEFPEHLPSQLMQQNYEIARDNRRVKIVSCAIKGCSMLKPRDGVLLHGVPMRKDILQMWIDNGQIEFSEQQRYMFRVCHRHFESRCFIDERRLSSWSVPTLHLPGEVIHQNLSKEEWEVIKQEKVDPEIEQEPLETEMETENSLLEPIVRMEHVESDEDDSQMQALEVLLEVGHVERLDSYEKIDKSPIVYPEHVMYRSNRSQYNANRCAVEGCEVTVEDVDGTIKLHKFPASTEAAQKWMHNTQVDMEVKYWWRYRICSYHFDPECFQGSRIRKGAMPTLLLGSQRPDELYDNEFISMPEVEDLPLPVEISQSDVAEKTVPEVTNICLPPPAAPRKSSKFCQIEGCSNHLTTENITLHKFPHSKDMCIRWQHNTQVPFDPDHRWRYRICTAHFEPVCLSNLRLLHGSVPTLKLGPKAPAELFDNDFEAINQRLDKKSAAEVYQERVDMEDELSEDQVETPICIPVKQEKISFNQIKSGYDKCSLAHCQRQRSLHGVHIYKFPRSQRQQERWMHNLRIRYDERRPWRFMICSVHFEPHCISLRKLRPWAVPTLELGPNVPEKIFTNEQCQELEVEQPSDRSEAESEEEDGLEEDDDGEEDNIEEDGQELNVHNKKERRSKLDSCPSGQVAPWKVKQCCLPYCRAFRGDGIKLFRLPNNRSSIRNWEIATGMMFKESQRNTRLICSRHFDPELIGVRRLMRNAIPTRHLNPKSVTSDEKRVLPVKTMDTPPPMPSCCMADCHYNGNVKMHKFPSDPTHLRQWCQALRLTDTQRYRGKYICAAHLPTNMSVSCVVCGMDDVQLPMLNFPENRNQRAKWCYNLKIETIPKWDRSKHICCRHFEAHCFVRPGELRPGATPTVALNHNDTNIFLSDYSIDSATSYGGNRIKDEPKDGNDTLLV

Similar Transcription Factors

Sequence clustering based on sequence similarity using MMseqs2

100% Identity: iTF_00545997;
90% Identity: iTF_00545997;
80% Identity: -