Basic Information

Insect: Drosophila tristis
Gene Symbol: -
Assembly: GCA_018150885.1
Location: JAECWT010000135.1:309549-326925[-]

Transcription Factor Domain

TF Family: THAP
Domain: THAP domain
PFAM: PF05485
TF Group: Zinc-Coordinating Group
Description: The THAP domain is a putative DNA-binding domain (DBD) and probably also binds a zinc ion. It features the conserved C2CH architecture (consensus sequence: Cys - 2-4 residues - Cys - 35-50 residues - Cys - 2 residues - His). Other universal features include the location of the domain at the N-termini of proteins, its size of about 90 residues, a C-terminal AVPTIF box and several other conserved residues. Orthologues of the human THAP domain have been identified in other vertebrates and probably worms and flies, but not in other eukaryotes or any prokaryotes [1].
Hmmscan Out: # of c-Evalue i-Evalue score bias hmm coord from hmm coord to ali coord from ali coord to env coord from env coord to acc

1 29 5.6 6.5e+03 -2.3 2.7 43 62 271 293 257 308 0.55

2 29 8.1e-15 9.3e-12 45.3 3.5 1 86 462 534 462 535 0.85

3 29 1.8e-14 2e-11 44.2 4.8 1 87 562 631 562 631 0.82

4 29 1.5e-15 1.7e-12 47.6 0.2 1 87 653 725 653 725 0.85

5 29 9.1e-16 1.1e-12 48.3 5.0 1 86 783 852 783 853 0.82

6 29 5.1e-15 5.8e-12 45.9 3.2 1 86 878 949 878 950 0.82

7 29 5.3e-13 6.1e-10 39.5 0.5 1 87 985 1054 985 1054 0.82

8 29 8e-06 0.0092 16.5 1.2 26 86 1102 1148 1087 1149 0.70

9 29 6.3e-17 7.3e-14 52.0 0.4 1 86 1176 1245 1176 1246 0.82

10 29 3.8e-13 4.4e-10 39.9 0.8 1 86 1267 1336 1267 1337 0.79

11 29 7.6e-14 8.8e-11 42.2 1.1 1 86 1364 1435 1364 1436 0.85

12 29 6.6e-07 0.00076 19.9 0.6 31 85 1515 1556 1498 1558 0.79

13 29 5e-12 5.8e-09 36.3 0.0 1 86 1581 1649 1581 1650 0.82

14 29 7.1e-14 8.1e-11 42.3 0.5 1 87 1815 1884 1815 1884 0.78

15 29 1.2e-09 1.4e-06 28.7 0.0 1 85 1972 2041 1972 2045 0.76

16 29 0.0076 8.7 6.9 0.0 1 58 2063 2107 2063 2125 0.79

17 29 7.2e-12 8.3e-09 35.8 0.1 1 86 2143 2212 2143 2213 0.81

18 29 7.7e-14 8.8e-11 42.2 0.2 1 86 2307 2376 2307 2377 0.81

19 29 5.3e-11 6.1e-08 33.1 0.1 1 85 2412 2482 2412 2484 0.79

20 29 1.9e-11 2.2e-08 34.5 1.0 1 87 2495 2567 2495 2567 0.79

21 29 1.3e-16 1.5e-13 51.0 0.5 1 86 2592 2668 2592 2669 0.80

22 29 0.00078 0.9 10.1 0.1 1 58 2696 2749 2696 2764 0.77

23 29 4.4e-12 5.1e-09 36.5 0.7 1 87 2788 2860 2788 2860 0.80

24 29 2e-12 2.3e-09 37.6 0.0 1 86 2992 3062 2992 3063 0.79

25 29 1e-11 1.2e-08 35.3 4.2 1 86 3121 3191 3121 3192 0.80

26 29 2.5e-14 2.9e-11 43.7 5.5 1 86 3327 3397 3327 3398 0.84

27 29 5.1e-12 5.9e-09 36.3 0.2 1 86 3492 3561 3492 3562 0.84

28 29 1.8e-09 2.1e-06 28.1 0.6 1 58 3586 3635 3586 3642 0.87

29 29 2.3e-09 2.7e-06 27.8 0.6 18 87 3654 3712 3643 3712 0.73

#	of	c-Evalue	i-Evalue	score	bias	hmm coord from	hmm coord to	ali coord from	ali coord to	env coord from	env coord to	acc
1	29	5.6	6.5e+03	-2.3	2.7	43	62	271	293	257	308	0.55
2	29	8.1e-15	9.3e-12	45.3	3.5	1	86	462	534	462	535	0.85
3	29	1.8e-14	2e-11	44.2	4.8	1	87	562	631	562	631	0.82
4	29	1.5e-15	1.7e-12	47.6	0.2	1	87	653	725	653	725	0.85
5	29	9.1e-16	1.1e-12	48.3	5.0	1	86	783	852	783	853	0.82
6	29	5.1e-15	5.8e-12	45.9	3.2	1	86	878	949	878	950	0.82
7	29	5.3e-13	6.1e-10	39.5	0.5	1	87	985	1054	985	1054	0.82
8	29	8e-06	0.0092	16.5	1.2	26	86	1102	1148	1087	1149	0.70
9	29	6.3e-17	7.3e-14	52.0	0.4	1	86	1176	1245	1176	1246	0.82
10	29	3.8e-13	4.4e-10	39.9	0.8	1	86	1267	1336	1267	1337	0.79
11	29	7.6e-14	8.8e-11	42.2	1.1	1	86	1364	1435	1364	1436	0.85
12	29	6.6e-07	0.00076	19.9	0.6	31	85	1515	1556	1498	1558	0.79
13	29	5e-12	5.8e-09	36.3	0.0	1	86	1581	1649	1581	1650	0.82
14	29	7.1e-14	8.1e-11	42.3	0.5	1	87	1815	1884	1815	1884	0.78
15	29	1.2e-09	1.4e-06	28.7	0.0	1	85	1972	2041	1972	2045	0.76
16	29	0.0076	8.7	6.9	0.0	1	58	2063	2107	2063	2125	0.79
17	29	7.2e-12	8.3e-09	35.8	0.1	1	86	2143	2212	2143	2213	0.81
18	29	7.7e-14	8.8e-11	42.2	0.2	1	86	2307	2376	2307	2377	0.81
19	29	5.3e-11	6.1e-08	33.1	0.1	1	85	2412	2482	2412	2484	0.79
20	29	1.9e-11	2.2e-08	34.5	1.0	1	87	2495	2567	2495	2567	0.79
21	29	1.3e-16	1.5e-13	51.0	0.5	1	86	2592	2668	2592	2669	0.80
22	29	0.00078	0.9	10.1	0.1	1	58	2696	2749	2696	2764	0.77
23	29	4.4e-12	5.1e-09	36.5	0.7	1	87	2788	2860	2788	2860	0.80
24	29	2e-12	2.3e-09	37.6	0.0	1	86	2992	3062	2992	3063	0.79
25	29	1e-11	1.2e-08	35.3	4.2	1	86	3121	3191	3121	3192	0.80
26	29	2.5e-14	2.9e-11	43.7	5.5	1	86	3327	3397	3327	3398	0.84
27	29	5.1e-12	5.9e-09	36.3	0.2	1	86	3492	3561	3492	3562	0.84
28	29	1.8e-09	2.1e-06	28.1	0.6	1	58	3586	3635	3586	3642	0.87
29	29	2.3e-09	2.7e-06	27.8	0.6	18	87	3654	3712	3643	3712	0.73

Sequence Information

Coding Sequence: ATGTCACAGCATAATCCGCACGCCCATCCGCACTACCATCACCACCCACTGCACCAGTCGAACAACAACAACAACAACAACGACTATCAATCTGGGATTGGGATGTACTCGGCGCCGCCCGTGCCACCCCACCACCATGCGACGGCTACCTCCGCATTTGCCGCCACCTCTACACCTTGCAAGGGCAGTAACAGTGGCAGTGGCAGTGTCAGCAGCAACAACATGAATGCGTATGGGGCAGGCAGCACGCACGGATATTATGCTGCTGCTGCAGCCGCTGCCGCCGCTGGCGGTGGGCTGAATGTCAATGCTGTGGCTGGGGGTGGGGTCGGCGAACCCATGGAGGCCGCGTATCAGCAGCCACCCCCCAATCCGATGGCCCCACCCCCAGCGCCAGATATGATAATAAAATCGGAACCCATGGATGAACATGCCTACAAGTCCAACTACATTGATGACAATACGCCCTTTGCTGATTTTAATAAATTCAATGAATTCAGCGGCGATATGCTGAGCCCCAAAGTGGAGCTAACCATCAAGGATGAGACCTATGGAAAGACCTCCAGCGGCAGCAGCTTTGCACGCCGCAAAGTCCAACAGCAGCCGCAGCAACAGCAACAGCTGCCAACGACAGATCGTTCAGCGGAGAGTCTGCCCATTTGTCAGCGCTGCAAGGAGGTGTTCTTCAAGAAGCAATCCTACCTAAGGCATGTTGCCGAGAGCAGTTGTGGCATACAGGAGTACGATTTCAAGTGCAACATTTGCCCCATGTCCTTCATGACCAGCGAGGAGCTGCAGCGGCACAAGCATCTGCATCGTGCGGACAAGTACTTTTGCCACAAATACTGCGGCAAGCATTTCGATACGATAGCCGAGTGCGAAACGCATGAGTACATGCAGCACGAGTATGACAGTTTCGTTTGTAATATGTGCTCGGGTACCTTTGCCACACGTGAGCAGCTGTACGCCCACTTGCCGCAGCACAAGTTCCAGCAGCGTTACGACTTGCCCACATTGCCCACAGCACCGCTTCTTAAGGCACCAACGAACTGCAATGCTTCGGTGCTGCCAGCCACCGCGGCTTTGAGCTCTCTGCTGCAGCAGCGGCAGGCGAATGCCGATGGAGCAGCGGCCATGTTTGCTGCGGCTTCGTCCTCCTCCTCCGCCGCCGCCGCCGCCGCCGCCACCTCTGTCTCGCTGAAGAGCGAGGTGAGCGTGAAGCTCGAGCGCAGCTACAGCAACTCCACCAGCGAGTCCTCGTACAGCCATCAGGACAACAGCAGCTACAACAATGCCTATGGCAGCGACAGCTCCATTCATGGCGGTGCACTGGCCGGACCACAGGCGCACTCCTCAACGCTGGACGACTCGGAGGATGCTTTGTGCTGTGTGCCGCTGTGCGGCGTGCGTAAGAGCACCAGTCCCACGCTGCAGTTCTTTACGTTCCCCAAGGACGACAAGTATCTGAATCAGTGGCTGCACAACCTCAAGATGTTCCACATACCGGCGGCCAGCTATGCGACATTTCGCATCTGCAGCATGCACTTCCCGAAGCGTTGCATCAATCGGTATTCGCTGTGCTATTGGGCGGTGCCCACCTTCAATTTGGGCCACGACGATGTCGCCAATCTGTACCAGAATCGCGAGCTAACCAACACCTTCACCACCGGCGAGGTGGCCCGTTGCAGCATGCCGCACTGCACCAGCCAGCGGGGCGAGAGCAATCTGAAGTTCTACAATTTCCCCAAGGACATCAAGAGCCTGATCAAGTGGTGCCAGAATGCGCGCCTGCCGGTGCAGGCCAAGGAGCCGCGTCACTTTTGCAGCCGCCACTTTGAGGATCGCTGCATTGGCAAGTTCCGTCTGAAGCCCTGGGCCGTGCCCACGCTCCACCTGGGTGCGCAGTACGGCAAGATCCATGACAATCCCAAGAATCTGTATGTGGAGGAGAAGCGCTGCTGCCTGAACTTTTGCCGTCGCAGCCGCTCCTCGGACTTTAACATGTCGCTGTATCGCTTTCCACGCGACGAGGTGCTCCTGCGACGCTGGTGCTATAATCTAAGGCTCGATCCGGGCGTCTATCGTGGCAAGAATCATAAAATATGCAGTGCACATTTCATCAAGGAAGCGCTGGGCCTCAGGAAGCTATCGCCAGGAGCCGTGCCGACATTGCACTTGGGACACAATGACACCAAATCCTCGTATCAGCGACATTCGGCAGCCTCCACTTCATCCTCTGCCAGTTCGGCGTCGCATTATGTGGATGCCGAGATGAGTGCCTCGTATTTGAGCGTCTCTGCGGCTGGCTCCTCGGGCGGCATGAATGCCAGCGACTGCATGGACGTGTGCTGTGTGCCCAGCTGTGAGAGCAAGCGGCACAACAGCGAGAACATCACATTCCACACGATACCGCGCCGGCCGGAGCAGATGCGCAAGTGGTGCCACAATCTGAAGATACCCGAGGACAAGATGCACAAAGGGATGCGCATATGCAGCCTGCACTTTGAGCCCTACTGCATCGGCGGCTGCATGCGTCCGTTTGCCGTGCCCACGCTGCAGTTGGGGCACGAGGATCTGGAGGACATACACCGCAATCCGGATGTGATCAAGAAGCTGAACATACGCGAGACCTGCTGCGTGGCGGTGTGCAAGCGGAATCGGGACCGAGACCATGCCAATCTGCATCGTTTCCCCAGCAATGTAGCGCTGCTGACCAAGTGGTGTGCGAATCTGCAGCGGACAGTGCCCGATGGCAGCAAACTGTTCAACGATGCCATTTGCGAGGTGCACTTCGAGGACCGTTGTCTGCGCAACAAGCGGCTGGAGAAGTGGGCGGTGCCCACGCTGATGCTCGGCCACGAGGCCATGGCCTATCAGCTGCCCACTCCGGAGCAGGTGGCCGAGTTCTATGCCAGGCCCAGCGCCCCGAACAATGGCGAGGAGCAGGGCGAGTGCTGTGTGGAGACGTGCAAACGGAATCCCAGTGTGGATGACATCAAACTGTATCGGCCGCCGGAGGACAGCTCGGTGCTGGCCAAATGGGCGCACAATCTGCAAACGGAGGCCGCAGCTCTCACCAACGGACTGCGGATATGCAATCTGCACTTTGAGGCCCACTGCATTGGCAAGCGGATGCGTCCGTGGGCCATACCCACCCTCAATCTGGCCGGCAACATTGAGAACCTCTACGAGAACCCGGAGCACTCGATGCTGTACAAGCGACGGACGCACCTCAAACAGAAGGTGCCCGTGGCGAAGCCCACGTGGGTGCCACGCTGCTGCCTGCCGCACTGCCGCAAGCTCAACCGCTCCACGCTGGCCAAGTGGGCGCACAATCTGCAAGTGCCGCAGGTGGGCAGTGCCCAGCGGCGTGTCTGTTCCGCACACTTTGAGCCGCATGTCCTCAGCAAGAAGTGCCCGGTGCCGCTGGCGGTGCCCACACTGGACCTCAACTCGCCCGCTGGCCACAAGATCTACCAGAATCCGGCCAAGCTGAAGGCCAACAAGCTTTGCCTGCAGCGGGTCTGCATTGTGGAGAGCTGCCGGAAGACCAGGGCCCAGGGCGTCCAGCTCTTCCGTCTGCCGCACAGCCCCACGCAGCTGAGGAAGTGGATGCACAACATCAGGACACGCCCAAGGGCGGCCATGAGGAGCCAGTATCGTGTGTGTTCGCGTCACTTTGAGACGCACTCCTTCAATGGGCGTCGACTGAGCGCGGGGGCCATTCCCACGCTGGAGTTGGGCCACGACGACGATGACATCTTCCCGAACGAAGCGCAGGCCTTTGCGGATGAGCACTGCGCCGTGGAGGGCTGTGAATCGTCCAAGGAGCAGGCCGAAGTGCGTCTCTTCCGCTTCCCCACGGACGACGACGACATGCTGTGGAAGTGGTGCAACAATCTGAAGATGAATCCCGTCGACTGCATCGGTGTGCGGATATGCAACAAGCACTTCGATGCGGACTGCATCGGGCCGAAGCATCTGTACAAGTGGGCCATACCGACGATGCTGCTGGGCCACGATGACTCCCAGATCGAGCTGATACTCAATCCGAAGCCCGAGGAGCGCTATGTGGACCCCGTGTTCAAGTGCATTGTGCCCACGTGCGGCAAGACGCGTCGCTTCGATGAGGTGCAAATGAACAGCTTCCCCAAGGATGCGGATCTCTTTCAGCGCTGGCGTCACAATCTGAGGTTGGAGCATTTGTGCTTTAAGGAGCGCGAGAAGTACAAGATATGCAATGCCCACTTCGAGGACATGTGCATTGGCAAGACGCGTCTGAACATTGGCTCGATACCCACCCTGGAGCTGGGCCACGCGGAAACTGAGGATCTGTTCAAGGTGAATCCGGCTGAGCTGCAGAGCAACCTATTTGGGCGTCCGCGTCGACTGCTGCGAGGATACAACAATGTGAGCATCAAACAGGAGCTGCCAGAGACGCAGGAGGAGCAGCAGCAGCTGGACGTGAAGCCCGATATAGGCATGGATTTTACACAGGTTAAAATCAAGAAATCTCTGGGGGATGTCAAGTGTTGTCAGCACCTCAAGTGGCGGCACAATCTGCGCCTGGAGCCGGACGAAGTGGACAAATCGACGCGCGTGTGCAGCGCCCACTTCAACAGGCGCTGCATCGATGGCAAGCAGCTGCGTGGCTGGGCCATGCCCACACAGCAGCTGGGCCACCAGGAGCAGCCCATCTACGAGAATCCCAAGAATATTCCGGGCTTCTTTACGCCCACCTGTGCGCTGGGGCACTGCCGCAAGCGGCGTAGCATTGACAACGATTTGCGCACGTATCGGTATCCGCGCAGCGAGGATCTGCTCGAGAAGTGGCGGGCGAATCTCGGCCTGTCGCTGGACCAGTGCCGTGGCAGGATCTGTGCGGATCACTTTGAGCCGCAGGTGCGTGGCAAACTGAAGCTAAAGACGGGCGCTGTGCCCACACTAAAGCTGGGCCATGAGGAGGCTCTGATCTACGACAATGAGGCTATAAAGGCGGGCGTGGCCGAAGAGGAGGCGGCGGCGGCGCCAGCACCGGGCAGTGCCTCGCCTCTGGTGACACCCAAAACGGAAGTGCTGGACGAGGAGGAGCGCGAGGAAGATGAGGAGGAGGAGGATGACAAGCCCGAAGGAGCGGAGCAGCTGAGGGATGAGGATGACGATGAAGACGACGATGAGGATCCTGGCAACTATTTTGATCCTTTGGAGCTGGTGGAGACGTATGCAGAGCATCCCAGCGACGACGACGACGACGAGGCAGGAGAGAAGGATGCCAGAGAGGATGAGGAGGAGGAGGAGGCAGAAACTCTACTGCCTGACACACCACCCAAATCGTCGGCAGTCCTTCGCATGCCCAAGCCATGGGACAGACCTGCTGCCGCGGTCGCCGCCGCTGTAGTTGTGCCACGCCGCGAGAAGCGTCCGAATAACGTGGATCCCATCTGCTGCCTCAAGCACTGCCGCAAGGAACGCTCCGCCATGTATCTGCTGAGCACCTTTGGCTTCCCCAAGGACCAGCAGCTGCTGCTCAAGTGGTGCGCCAATCTCCAAATGGATCCCTCCGGCTGCATTGGTCGCGTCTGCATCGAGCACTTTCAGTCGGAGGTGCTGGGCACGCGCAAACTCAAACAGAATGCGGTGCCCACGCTCAACGTGGGCCACGATGCGCCGCTGCGTTACAGCTGCAACGGCCAGGAGATCTCCGCCGGCAGCAACAGTTTTCCGGATGAAATGCCACAGCATTCGGTTTTTCGGCTTTGGAGCCTGAAACACTGCCGCAAGAGGAAGCTGTCGGAGAGTTCAGCTCCAGCTCCAGCAGCGATCAAGAAGGAGAAGGAGGAGCAGAAGCAGCAGCAGACACCGATGGAGATGGAGATGCAGCTGGAGCTGGAGCTGGAGACTAAACCAAAGATTTGCTGCCTGCCCAGCTGTGGCAATGTGGAGGGTTATGGCCCCGGCGGGCACTTCCAGCCGCTGCCCGTGGACCAGAGACTGCTCAAAAAGTGGCAGCACAACCTAAGGCTGCCCACCATCAATTCCGACAGGGAACTTCGTCTGTGCCTGGAGCACTTTGAGCCGCAACAAATCGAGAATGGCTGCCCCGTGCGGATGGCAGTGCCGACTGTCAAGCTGGGCCACTCCAGTCCGAATATCTTCAGGAACAGCGAGGGCTCCCGGCTGCCCGGCTGCCTGTGGCCCTCGTGTCCGCCCAATCGCAAGCTGTGCTACGACCTGCCGGAGCATGAGGCTGTCCGCGTGGCCTGGCTGTCGTATGTGCGGCTGCCAGTGGACAGCCAGGGACGCCTCTGCGGCCTGCACTTCCTGCAGCTGTACGAGGAGGTGGATCTGCCGGGAGACGTGCCCGAAAAGGTGCTCGAACGACTGCAGGATACCTACGATCAGGCCTCCATCTCGCTGAAGTTTCAGTGCTCCGTGCTGGGCTGTGGCTCCAAGTACAAGCAGGACACGCACCTGGCGAAGCTGCCACGCGACGCGCAGCTGCTGGCCAAGTGGCTGCACAACACCAGAATCTCCTACGATCGCTCCCTGCACTTTAGCTATCGCATTTGCCTGCTGCACTTTGAGGCGCTCTGCTTGAATGGCCACAGACCACAGACGTGGGCCATACCCACACTGCAGCTGAATCACGACGGGGAGATCTACCAGAATAGCGTCAAGCAGGAGCTGCTGGAGAACCCTCCGAAGCAGGAGCTGCTGGAGAACCCTCCGAAGCAGGAGTCCGAGAATCACGAGACCCCCGTGAAGCAGGAGAAGCAGGAGAAGCCTCACTGCAGCCTCAGTCTCTCGATTCCGCTGCACATCAAGACGGAGCAGGTCACTCCTGTGCTGCGGGGCACATCCTCGCTGAGCAGTCCCTGCCTCAGTGCCAGCTCCAGTCCCCGCGCGAAGAACCGAGTGTGCTGCATACCCAACTGCGGGGAGATGCCAGCCAGATCCCAGCGGCTGCATCGCTTTCCCACCGCCGAACCGACGCTGCTCAAGTGGCTGGTGAACACCCAGCAAAAACCCGGGCTGGTGGACATTCAGAGTCTGTTTGTGTGCCAGCTGCACTTTGAGGCGGATGCCATTAACCAGACGCAGCTGAGAAGCTGGGCCGTGCCCACGCTGCGGCTGGGCCACGATGGCCATGTCATACCGAATGCCCGGCACAATGGGAACATTGCCAACAGCCAGGAGACGGAGCAGGCCATGGAGTTCATTCGGGCCAACTACTGTTCGGTGCTGAGCTGCTTCCAGCCGAAGGGCGAGGGTGTGCGCTTCCACAAGTATCCCAGCGACATTGCCATGGTGCGCAAGTGGGCCACAAATCTCAAGCATCGGTCCATGCAGGCCAGCAGCCATGGCTTTCTCGTCTGCCAGTCGCACTTTCCAGCCGAGTGCTTCGATCCGGGCACGGGAGAGCTCCGCGAGGATGCCGTACCCGTCGCTAGTAGTGTGAAAACGGAGAGCCTGCCGCTGCATTGCCTGGTCAAGGGCTGCTCCACGGATAACTGCGGCAAGGAGGGGCGGCTGCTGTTCAAGGTGCCAAAGAAGAATCGCGTGCGGGATGCGTGGGCCCACAACCTGTGGATGCATCCGATCGAGCTGATGGGCGAGCAACACATCTGCGAGCGGCACTTCGAGGCGCACTGCGTGAATGAGCAGAAAATGCTGCACGCGGGCTCAGTGCCAACGCTCCACCTCGGACACACTGAACCGCTGGAACTGCTGCCCAATCCACAGACCTTCAACGAGTGCCAGGAGGAGTGCGTGTGCTGTGTGCCGGGCTGTGGGCGCAGCAATCGAAAGGATAGCCAGCAGGAGCTGCAGTTCAGCAGATTCCCCAAGTGGCGGGTGCTCTACGACAAGTGGCTGCACAACTTCCGCCTGGAAGTGCCCAAGGAGCAGCGCATCGGCACGCTGCGCGTCTGCCACACGCACTTTGAGGAGAGCTGCTTTGAGCCGGGGCAGGGTGGCGTGCGACGGGGAGCCATGCCCACACTGCAGCTGGGACACTCGCATCCGGACATTTATCGCACGGACAAGGGCTCGCTGTGGAAGAAGGTGCACAAGAGATTCAGCGACTGCTGCTATCCGGACTGCTACGAGGACTGCCACAAGGCCAACACCAATCGCATGGTCTACGAACTGCCAGGCGCGGGGCCGCTGCGTGAGGCCTGGCAGCAGCACTTGGGCATCCCTGACAGCGGCTCCTCGGTGCTCCTCAGGCTCTGTGCCCTCCACTACATCATGCTGTACGAGCACAGCGAGCAGAACTGGCCCGAGCACGCAGCAGATCTCCTGCTGCTGGCCAAGAACTACGCGCACGCCCGCCAGCTGGCCTATCTGCGACGCTTCATGTGTGCCGTGCAGGGCTGTCGCCATTTGCAGCCGCGGGACGGGGGATCGATGCATGGCATACCCAGGCGGCGGCAGATACTTCGCATGTGGGTGGAGAATGCGCAGCTGCGGCTGAACGAGCACGAGATTTACATGACGAAGCTATGCAGCAAACACTTTGAGCCGCACTGCCTGTTCGAGGGCAAGAAGTGCTATCCGTGGAGCGTGCCCACGCTCCATCTGCCCGCGCTGCTGCCGGGTCAGGTGCTGCACCAGAATCCCACCACGGAGGAGTGGCAGCAAATGAAGCAGCGCATGAAAATGGAGGAGCAGACGCTGAAGGCCGAACCGCACGCAGATGGCGGACTACAAATGGAGCCCTACGTTAAGATGGAGCCGCACGATGACGACGCTGGATCGCAAACGGAGTCGGAACTGCTGGTAAATGAGAGCACCATGGACGACTCGCAGGAGACGGACTTTCAAGCGAATGAGCCACTGGAGGTGCTGCTGGAGGTGGGCCATGTGGAGCGGCTGGAGAGCTACGAGAAGAAGGATTACCCCGCTGTCAGCTATGCGCCGCCGCCGCCGTTGCCGCCGAAACGCTTCCGCCATCCGTACAGTGCCCACAAGTGCAGTGTCGCTGGCTGTGGCGTCTCGCTCGAGGATGTGGGCGGCAATCTGAAGCTGCACAAGCTACCCAGCGCCACGGAGGCGACCCGCAAGTGGCTGTACAACATACAGGTGGACATAGAGGACAAATGGCGGATACGCGTCTGCAGTCATCACTTTGACAGGCAGTGCCTGAATGGCTCGCGGCTCAGGCGGGGATCGATGCCCACGCTGCTGCTGGGGCCACGTGTCCCGGCGAATATCCACCAGAACGAGTTTGCGCCGCTGCCGTTGGACGATGCGGCGCCAGCAGCACCGAATGGAGTGATCCACGCGGAGCCCTCCATTGGCAAGGTGTTGCATCCGTGCGTGCCGCGGCCCTCGCCGCCGCGAAAGTCCAGCAAATTCTGCCAGATCGAGGGGTGTGCGAACCATTTGACCAGCGAGCACATGACACTGCACAAGTTTCCGCACTCCGCGTGGATCTGCACCAAGTGGCAGCACAACACCCAGGTGCCATTCGACCCGGAGTACCGCTGGCGCTATCGCATCTGCAGCGCCCACTTCCATCCCGTGTGCATGGTCAATATGCGGCTGCTGCATGGCAGTGTGCCCACCCTCAAGCTGGGCCCGCGGGCACCCGCCGAGCTCTTCGACAGCGACTTTGAGGCCATAAACATCAAGATTGAGAAGCTGGAGAAGATGGAGCGGAGGGCGGAGGCTCAGAGAGTCACCTCCAGTCACAGTCACAGTCACAGTCGCCATCCCACCATGCCGGACATGGGGGAGGTCAGACTGAAGGTCAAGACTGAGCAGCTGGACGATAGCGGTGGACCAATGCAGGAGCTGGAGGAGGAGGAGGGGGAGGAGGATGCCATGCTCTACCTGGAGCCAGAGATGCAGCTGTACGAGGATCAGGAGGAGCAGCAGCAGAAGCCACAGGTCAATGGGGGCTGGAAAACGGAACTTCGTTTGCCATCAAAGGGCAGGGTGGCCTTCAATCCGGTGCGTTCGGGCTACGACAAGTGCTCGCTGATGCATTGCCAGCGCCAGAGATCGAAGCACGGCGTCCACATCTACAAGTTCCCCCGCTCGCAGGAGCACCAGCAGCGATGGATGCACAATCTGCGCATCCGCTACGACGAGAAGCGCCCCTGGAAGTTCATGGTGTGCAGCGTGCACTTCGAGCCGCATTGCATACGGCTGCGGAAGCTGCGACCCTGGGCAGTGCCCACACTGGAGCTGGGCGACAATGTGCCCGAGGAAATTTACACGAACGAGCAGTGCCAGATGTTTGCCAGTGGCCAAGCAGGAGGCGAGATCCAGGCAGGAGGCGAGGACAGTGATGCGGAGGCAGAAGCAGAAGCAGAGAGCGATGGGAATGAGGAGGATGGCCTGCAAGAGGACGAGGATGAGGAGACAGATGACCAGGAGCCCAGCACCGCTAAGAAGCGTCGTCGTTCGCGACTGGATGCCACTGGATGGCCGCCCGGCCAGGTGCCACCGTGGAAGGTTAAGCAATGCTGTCTGCCCTACTGCCGCAGTCCGCGCGGCGATGGCATCAAGCTGTTCCGACTGCCCAACAAAGTCAACTCCATTCGCAACTGGGAGCTGGCCACGGGCATGAAGTTCAAGGAGTCGCAGCGCAACACGCGGCTCATCTGCAGCCGCCACTTTGAGCCGCAGCTGATTGGAGTGCGTCGTCTCATGCGCAATGCCATTCCCACCAGGCATCTGGGACCCACGGCCGTCACGGGCGATGTGAAGCCAGTGGTGGCGCCACCGAGCACAGCTGGTCCCAAATGCTGCATGGCCGATTGCACCTACGATGTGGCCGATGTGAAGCTGCACAAGTTTCCCAGCAATCCCAAGCTACTGAGGGAGTGGTGCCAGGCCTTGAGAGTCACCGATATGCAGAGGTATCGCGGCAAGCACATTTGCTCCGCCCATCTGCCCGTCCACAAGGCCGTGCACTGCATTGTGTGTGGCACGGACAGCGTCCCACTGCTCCCGATGCTTAACTTTCCCGCCAACCGGAATCAGCGGGCCAAATGGTGCTACAATCTGAAGATCGAAACGATACCCAAGTGGGACATATCCAAGCACATTTGCTGCAAACACTTTGAGCCATATTGCTTTGCGGCGGCGGGTCTGCTCAAGCCAGAGGCGGCGCCCACACTGCATTTGAATCACAATGATACAAACATATTCCTTAACGATTGTGCCATAAATCCCGCCTACACAGGCGTCGGAGTGCTGCGGGTTAAGGATGAGCCCATGGACAATCAGGTCCTATCGTTGTTGTAG
Protein Sequence: MSQHNPHAHPHYHHHPLHQSNNNNNNNDYQSGIGMYSAPPVPPHHHATATSAFAATSTPCKGSNSGSGSVSSNNMNAYGAGSTHGYYAAAAAAAAAGGGLNVNAVAGGGVGEPMEAAYQQPPPNPMAPPPAPDMIIKSEPMDEHAYKSNYIDDNTPFADFNKFNEFSGDMLSPKVELTIKDETYGKTSSGSSFARRKVQQQPQQQQQLPTTDRSAESLPICQRCKEVFFKKQSYLRHVAESSCGIQEYDFKCNICPMSFMTSEELQRHKHLHRADKYFCHKYCGKHFDTIAECETHEYMQHEYDSFVCNMCSGTFATREQLYAHLPQHKFQQRYDLPTLPTAPLLKAPTNCNASVLPATAALSSLLQQRQANADGAAAMFAAASSSSSAAAAAAATSVSLKSEVSVKLERSYSNSTSESSYSHQDNSSYNNAYGSDSSIHGGALAGPQAHSSTLDDSEDALCCVPLCGVRKSTSPTLQFFTFPKDDKYLNQWLHNLKMFHIPAASYATFRICSMHFPKRCINRYSLCYWAVPTFNLGHDDVANLYQNRELTNTFTTGEVARCSMPHCTSQRGESNLKFYNFPKDIKSLIKWCQNARLPVQAKEPRHFCSRHFEDRCIGKFRLKPWAVPTLHLGAQYGKIHDNPKNLYVEEKRCCLNFCRRSRSSDFNMSLYRFPRDEVLLRRWCYNLRLDPGVYRGKNHKICSAHFIKEALGLRKLSPGAVPTLHLGHNDTKSSYQRHSAASTSSSASSASHYVDAEMSASYLSVSAAGSSGGMNASDCMDVCCVPSCESKRHNSENITFHTIPRRPEQMRKWCHNLKIPEDKMHKGMRICSLHFEPYCIGGCMRPFAVPTLQLGHEDLEDIHRNPDVIKKLNIRETCCVAVCKRNRDRDHANLHRFPSNVALLTKWCANLQRTVPDGSKLFNDAICEVHFEDRCLRNKRLEKWAVPTLMLGHEAMAYQLPTPEQVAEFYARPSAPNNGEEQGECCVETCKRNPSVDDIKLYRPPEDSSVLAKWAHNLQTEAAALTNGLRICNLHFEAHCIGKRMRPWAIPTLNLAGNIENLYENPEHSMLYKRRTHLKQKVPVAKPTWVPRCCLPHCRKLNRSTLAKWAHNLQVPQVGSAQRRVCSAHFEPHVLSKKCPVPLAVPTLDLNSPAGHKIYQNPAKLKANKLCLQRVCIVESCRKTRAQGVQLFRLPHSPTQLRKWMHNIRTRPRAAMRSQYRVCSRHFETHSFNGRRLSAGAIPTLELGHDDDDIFPNEAQAFADEHCAVEGCESSKEQAEVRLFRFPTDDDDMLWKWCNNLKMNPVDCIGVRICNKHFDADCIGPKHLYKWAIPTMLLGHDDSQIELILNPKPEERYVDPVFKCIVPTCGKTRRFDEVQMNSFPKDADLFQRWRHNLRLEHLCFKEREKYKICNAHFEDMCIGKTRLNIGSIPTLELGHAETEDLFKVNPAELQSNLFGRPRRLLRGYNNVSIKQELPETQEEQQQLDVKPDIGMDFTQVKIKKSLGDVKCCQHLKWRHNLRLEPDEVDKSTRVCSAHFNRRCIDGKQLRGWAMPTQQLGHQEQPIYENPKNIPGFFTPTCALGHCRKRRSIDNDLRTYRYPRSEDLLEKWRANLGLSLDQCRGRICADHFEPQVRGKLKLKTGAVPTLKLGHEEALIYDNEAIKAGVAEEEAAAAPAPGSASPLVTPKTEVLDEEEREEDEEEEDDKPEGAEQLRDEDDDEDDDEDPGNYFDPLELVETYAEHPSDDDDDEAGEKDAREDEEEEEAETLLPDTPPKSSAVLRMPKPWDRPAAAVAAAVVVPRREKRPNNVDPICCLKHCRKERSAMYLLSTFGFPKDQQLLLKWCANLQMDPSGCIGRVCIEHFQSEVLGTRKLKQNAVPTLNVGHDAPLRYSCNGQEISAGSNSFPDEMPQHSVFRLWSLKHCRKRKLSESSAPAPAAIKKEKEEQKQQQTPMEMEMQLELELETKPKICCLPSCGNVEGYGPGGHFQPLPVDQRLLKKWQHNLRLPTINSDRELRLCLEHFEPQQIENGCPVRMAVPTVKLGHSSPNIFRNSEGSRLPGCLWPSCPPNRKLCYDLPEHEAVRVAWLSYVRLPVDSQGRLCGLHFLQLYEEVDLPGDVPEKVLERLQDTYDQASISLKFQCSVLGCGSKYKQDTHLAKLPRDAQLLAKWLHNTRISYDRSLHFSYRICLLHFEALCLNGHRPQTWAIPTLQLNHDGEIYQNSVKQELLENPPKQELLENPPKQESENHETPVKQEKQEKPHCSLSLSIPLHIKTEQVTPVLRGTSSLSSPCLSASSSPRAKNRVCCIPNCGEMPARSQRLHRFPTAEPTLLKWLVNTQQKPGLVDIQSLFVCQLHFEADAINQTQLRSWAVPTLRLGHDGHVIPNARHNGNIANSQETEQAMEFIRANYCSVLSCFQPKGEGVRFHKYPSDIAMVRKWATNLKHRSMQASSHGFLVCQSHFPAECFDPGTGELREDAVPVASSVKTESLPLHCLVKGCSTDNCGKEGRLLFKVPKKNRVRDAWAHNLWMHPIELMGEQHICERHFEAHCVNEQKMLHAGSVPTLHLGHTEPLELLPNPQTFNECQEECVCCVPGCGRSNRKDSQQELQFSRFPKWRVLYDKWLHNFRLEVPKEQRIGTLRVCHTHFEESCFEPGQGGVRRGAMPTLQLGHSHPDIYRTDKGSLWKKVHKRFSDCCYPDCYEDCHKANTNRMVYELPGAGPLREAWQQHLGIPDSGSSVLLRLCALHYIMLYEHSEQNWPEHAADLLLLAKNYAHARQLAYLRRFMCAVQGCRHLQPRDGGSMHGIPRRRQILRMWVENAQLRLNEHEIYMTKLCSKHFEPHCLFEGKKCYPWSVPTLHLPALLPGQVLHQNPTTEEWQQMKQRMKMEEQTLKAEPHADGGLQMEPYVKMEPHDDDAGSQTESELLVNESTMDDSQETDFQANEPLEVLLEVGHVERLESYEKKDYPAVSYAPPPPLPPKRFRHPYSAHKCSVAGCGVSLEDVGGNLKLHKLPSATEATRKWLYNIQVDIEDKWRIRVCSHHFDRQCLNGSRLRRGSMPTLLLGPRVPANIHQNEFAPLPLDDAAPAAPNGVIHAEPSIGKVLHPCVPRPSPPRKSSKFCQIEGCANHLTSEHMTLHKFPHSAWICTKWQHNTQVPFDPEYRWRYRICSAHFHPVCMVNMRLLHGSVPTLKLGPRAPAELFDSDFEAINIKIEKLEKMERRAEAQRVTSSHSHSHSRHPTMPDMGEVRLKVKTEQLDDSGGPMQELEEEEGEEDAMLYLEPEMQLYEDQEEQQQKPQVNGGWKTELRLPSKGRVAFNPVRSGYDKCSLMHCQRQRSKHGVHIYKFPRSQEHQQRWMHNLRIRYDEKRPWKFMVCSVHFEPHCIRLRKLRPWAVPTLELGDNVPEEIYTNEQCQMFASGQAGGEIQAGGEDSDAEAEAEAESDGNEEDGLQEDEDEETDDQEPSTAKKRRRSRLDATGWPPGQVPPWKVKQCCLPYCRSPRGDGIKLFRLPNKVNSIRNWELATGMKFKESQRNTRLICSRHFEPQLIGVRRLMRNAIPTRHLGPTAVTGDVKPVVAPPSTAGPKCCMADCTYDVADVKLHKFPSNPKLLREWCQALRVTDMQRYRGKHICSAHLPVHKAVHCIVCGTDSVPLLPMLNFPANRNQRAKWCYNLKIETIPKWDISKHICCKHFEPYCFAAAGLLKPEAAPTLHLNHNDTNIFLNDCAINPAYTGVGVLRVKDEPMDNQVLSLL

Similar Transcription Factors

Sequence clustering based on sequence similarity using MMseqs2

100% Identity: iTF_00536072;
90% Identity: iTF_00563936;
80% Identity: -