Basic Information

Insect: Drosophila ambigua
Gene Symbol: -
Assembly: GCA_018150905.1
Location: JAECWS010000094.1:2837454-2853758[-]

Transcription Factor Domain

TF Family: THAP
Domain: THAP domain
PFAM: PF05485
TF Group: Zinc-Coordinating Group
Description: The THAP domain is a putative DNA-binding domain (DBD) and probably also binds a zinc ion. It features the conserved C2CH architecture (consensus sequence: Cys - 2-4 residues - Cys - 35-50 residues - Cys - 2 residues - His). Other universal features include the location of the domain at the N-termini of proteins, its size of about 90 residues, a C-terminal AVPTIF box and several other conserved residues. Orthologues of the human THAP domain have been identified in other vertebrates and probably worms and flies, but not in other eukaryotes or any prokaryotes [1].
Hmmscan Out: # of c-Evalue i-Evalue score bias hmm coord from hmm coord to ali coord from ali coord to env coord from env coord to acc

1 29 3.1 4.7e+03 -1.8 2.1 43 62 350 372 336 386 0.55

2 29 6.6e-15 1e-11 45.2 3.5 1 86 598 670 598 671 0.85

3 29 1.5e-14 2.2e-11 44.1 4.8 1 87 698 767 698 767 0.82

4 29 1.2e-15 1.9e-12 47.6 0.2 1 87 789 861 789 861 0.85

5 29 7.5e-16 1.1e-12 48.2 5.0 1 86 967 1036 967 1037 0.82

6 29 4.2e-15 6.3e-12 45.9 3.2 1 86 1062 1133 1062 1134 0.82

7 29 4.3e-13 6.5e-10 39.4 0.5 1 87 1169 1238 1169 1238 0.82

8 29 9.8e-12 1.5e-08 35.0 2.5 1 86 1277 1346 1277 1347 0.77

9 29 5.2e-17 7.9e-14 52.0 0.4 1 86 1374 1443 1374 1444 0.82

10 29 6.9e-13 1e-09 38.7 0.7 1 86 1465 1534 1465 1535 0.79

11 29 6.2e-14 9.4e-11 42.1 1.1 1 86 1562 1633 1562 1634 0.85

12 29 5.6e-13 8.5e-10 39.0 2.1 1 85 1709 1777 1709 1779 0.82

13 29 4.1e-12 6.2e-09 36.3 0.0 1 86 1802 1870 1802 1871 0.82

14 29 5.8e-14 8.8e-11 42.2 0.5 1 87 2037 2106 2037 2106 0.78

15 29 7.6e-10 1.2e-06 29.0 0.0 1 85 2194 2263 2194 2268 0.77

16 29 0.0053 7.9 7.1 0.0 1 58 2285 2329 2285 2346 0.79

17 29 3.8e-12 5.8e-09 36.4 0.1 1 86 2365 2434 2365 2435 0.81

18 29 6.3e-14 9.5e-11 42.1 0.2 1 86 2529 2598 2529 2599 0.81

19 29 4.8e-11 7.3e-08 32.8 0.1 1 85 2634 2704 2634 2705 0.79

20 29 4e-12 6e-09 36.3 0.4 1 87 2717 2789 2717 2789 0.81

21 29 1.4e-16 2.1e-13 50.6 0.5 1 86 2814 2890 2814 2891 0.80

22 29 0.00064 0.97 10.0 0.1 1 58 2918 2971 2918 2986 0.77

23 29 3.6e-12 5.5e-09 36.4 0.7 1 87 3010 3082 3010 3082 0.80

24 29 1.7e-12 2.5e-09 37.5 0.0 1 86 3214 3284 3214 3285 0.79

25 29 8.4e-12 1.3e-08 35.3 4.2 1 86 3343 3413 3343 3414 0.80

26 29 2e-14 3.1e-11 43.6 5.5 1 86 3549 3619 3549 3620 0.84

27 29 3.5e-12 5.3e-09 36.5 0.2 1 86 3714 3783 3714 3784 0.84

28 29 1.4e-09 2.2e-06 28.1 0.6 1 58 3808 3857 3808 3866 0.86

29 29 1.2e-09 1.8e-06 28.4 0.6 3 87 3867 3934 3861 3934 0.74

#	of	c-Evalue	i-Evalue	score	bias	hmm coord from	hmm coord to	ali coord from	ali coord to	env coord from	env coord to	acc
1	29	3.1	4.7e+03	-1.8	2.1	43	62	350	372	336	386	0.55
2	29	6.6e-15	1e-11	45.2	3.5	1	86	598	670	598	671	0.85
3	29	1.5e-14	2.2e-11	44.1	4.8	1	87	698	767	698	767	0.82
4	29	1.2e-15	1.9e-12	47.6	0.2	1	87	789	861	789	861	0.85
5	29	7.5e-16	1.1e-12	48.2	5.0	1	86	967	1036	967	1037	0.82
6	29	4.2e-15	6.3e-12	45.9	3.2	1	86	1062	1133	1062	1134	0.82
7	29	4.3e-13	6.5e-10	39.4	0.5	1	87	1169	1238	1169	1238	0.82
8	29	9.8e-12	1.5e-08	35.0	2.5	1	86	1277	1346	1277	1347	0.77
9	29	5.2e-17	7.9e-14	52.0	0.4	1	86	1374	1443	1374	1444	0.82
10	29	6.9e-13	1e-09	38.7	0.7	1	86	1465	1534	1465	1535	0.79
11	29	6.2e-14	9.4e-11	42.1	1.1	1	86	1562	1633	1562	1634	0.85
12	29	5.6e-13	8.5e-10	39.0	2.1	1	85	1709	1777	1709	1779	0.82
13	29	4.1e-12	6.2e-09	36.3	0.0	1	86	1802	1870	1802	1871	0.82
14	29	5.8e-14	8.8e-11	42.2	0.5	1	87	2037	2106	2037	2106	0.78
15	29	7.6e-10	1.2e-06	29.0	0.0	1	85	2194	2263	2194	2268	0.77
16	29	0.0053	7.9	7.1	0.0	1	58	2285	2329	2285	2346	0.79
17	29	3.8e-12	5.8e-09	36.4	0.1	1	86	2365	2434	2365	2435	0.81
18	29	6.3e-14	9.5e-11	42.1	0.2	1	86	2529	2598	2529	2599	0.81
19	29	4.8e-11	7.3e-08	32.8	0.1	1	85	2634	2704	2634	2705	0.79
20	29	4e-12	6e-09	36.3	0.4	1	87	2717	2789	2717	2789	0.81
21	29	1.4e-16	2.1e-13	50.6	0.5	1	86	2814	2890	2814	2891	0.80
22	29	0.00064	0.97	10.0	0.1	1	58	2918	2971	2918	2986	0.77
23	29	3.6e-12	5.5e-09	36.4	0.7	1	87	3010	3082	3010	3082	0.80
24	29	1.7e-12	2.5e-09	37.5	0.0	1	86	3214	3284	3214	3285	0.79
25	29	8.4e-12	1.3e-08	35.3	4.2	1	86	3343	3413	3343	3414	0.80
26	29	2e-14	3.1e-11	43.6	5.5	1	86	3549	3619	3549	3620	0.84
27	29	3.5e-12	5.3e-09	36.5	0.2	1	86	3714	3783	3714	3784	0.84
28	29	1.4e-09	2.2e-06	28.1	0.6	1	58	3808	3857	3808	3866	0.86
29	29	1.2e-09	1.8e-06	28.4	0.6	3	87	3867	3934	3861	3934	0.74

Sequence Information

Coding Sequence: ATGTCACAGCATAATCCGCACGCCCATCCGCACTACCATCACCACCCACTGCACCAGTCGAACAACAACAACAACAACAACGACTATCAATCTGGGATTGGGATGTACTCGGCGCCCAGTGCCCACTATGGGTGCCTCGACCAGAAGCAGCACCANNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNGTACTCACATGTTGCTTCCTACCCGCCAGTGCCACCCCACCACCATGCGACGGCTACCACCGCATTTGCCGCCACCTCTACACCTTGCAAGGGCAGTAACAGTGGCAGTGTCAGCAGCAACAACATGAATGCGTATGGGGCAGGCAGCACGCACGGATATTATGCTGCTGCTGCAGCCGCCGCCGCCGCTGGCGCAGCCTATAACCTTGAGGCAAANNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNAGCGTTCCTATATGGGGCATGATATAATGTCCGGCACATATCCGTATATCAAAAGCGAACCCATGGAGGCCGCTTATCAGCAGCCACCCCCCAATCCGATGGCCCCACCCCCAGCGCCAGATATGATAATAAAATCGGAACCCATGGATGAACATGCCTACAAGTCCAACTACATTGATGACAATACGCCCTTTGCTGATTTTAATAAATTCAATGAATTCAGCGGCGATATGCTGAGCCCCAAAGTGGAGCTAACCATCAAGGATGAGACCTATGGAAAGACCTCCAGCGGCAGCAGCTTTGCACGCCGCAAAGTCCAACAGCAGCCGCAGCAACAGCAACAGCTGCCAACGACAGATCGGTCAGCGGAGAGTCTGCCCATTTGTCAGCGCTGCAAGGAGGTGTTCTTCAAGAAGCAATCCTACCTAAGGCATGTGGCCGAGAGCAGTTGTGGCATACAGGAGTACGATTTCAAGTGCAACATTTGCCCCATGTCCTTCATGACCAGCGAGGAGCTGCAGCGGCACAAGCATCTGCATCGTGCGGACAAGTACTTTTGCCACAAATACTGCGGCAAGCATTTCGATACGATAGCCGAGTGCGAAACGCATGAGTACATGCAGCACGAGTATGACAGTTTCGTTTGTAATATGTGCTCGGGTACCTTTGCCACACGTGAGCAGCTGTACGCCCACTTGCCGCAGCACAAGTTCCAGCAGCGTTACGACTGTCCCATCTGTCGCTTGTGGTATCAAACGGCCGTCGAATTGCATGAACATCGACTGGCGGCTCCATACTTTTNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNGACTGCCATATGGCCACCATGGAAATGCCCACATTGCCCACCACACCGCTTCTTAAGGCACCAACGAACTGCAATGCTTCGGTGCTGCCAGCCAGCGCGGCTTTGAGCTCTCTGCTGCAGCAGCGGCAGGCGAATGCCGATGGAGCAGCGGCCATGTTTGCTGCGGCTTCGTCCTCCTCCGGCGCCGCGGCCGCCGCCACCTCTGTCTCGCTGAAGAGCGAGGTGAGCGTGAAGCTCGAGCGCAGCTACAGCAACTCCACCAGCGAGTCCTCGTACAGCCATCAGGACAACAGCAGCTACAACAATGCCTATGGCAGCGACAGCTCCATTCACGGCGGTGCACTGGCCGGACCACAGGCGCACTCCTCAACGCTGGACGACTCGGAGGATGCTTTGTGCTGTGTGCCGCTGTGCGGCGTGCGTAAGAGCACCAGTCCCACGCTGCAGTTCTTTACGTTCCCCAAGGACGACAAGTATCTGAATCAGTGGCTGCACAACCTCAAGATGTTCCACATACCGGCGGCCAGCTATGCGACATTTCGCATCTGCAGCATGCACTTCCCGAAGCGTTGCATCAATCGGTATTCGCTGTGCTATTGGGCGGTGCCCACCTTCAATTTGGGCCACGACGATGTCGCCAATCTGTACCAGAATCGCGAGCTAACCAACACCTTCACCACCGGCGAGGTGGCCCGTTGCAGCATGCCGCACTGCACCAGCCAGCGGGGCGAGAGCAATCTGAAGTTCTACAATTTCCCCAAGGACATCAAGAGCCTGATCAAGTGGTGCCAGAATGCGCGCCTGCCGGTGCAGGCCAAGGAGCCGCGTCACTTTTGCAGCCGCCACTTTGAGGATCGCTGCATTGGCAAGTTCCGTCTGAAGCCCTGGGCCGTGCCCACGCTCCACCTGGGTGCGCAGTACGGCAAGATCCATGACAATCCCAAAAATCTGTATGTGGAGGAGAAGCGCTGCTGCCTGAACTTCTGCCGTCGCAGCCGCTCCTCGGACTTTAACATGTCGCTGTATCGCTTTCCACGCGACGAGGTGCTCCTGCGACGCTGGTGCTATAATCTAAGGCTCGATCCGGGCGTCTATCGCGGCAAGAATCATAAAATATGCAGTGCACATTTCATCAAGGAAGCGCTGGGCCTCAGGAAGCTATCGCCAGGAGCCGTGCCGACATTGCATTTGGGACACAATGACACGTTTAATATCTATGAGAACGAGCTGTGGNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNTTCGGCAGCCTCCACTTCATCCTCTGCCAGTTCGGCGTCGCATTATGTGGATGCCGAGATGAGTGCCTCGTATTTGAGCGTCTCTGCGGCTGGCTCCTCGGGCGGCATGAATGCCAGCGACTGCATGGACGTGTGCTGTGTGCCCAGCTGTGAGAGCAAGCGGCACAACAGCGAGAACATCACATTCCACACGATACCGCGCCGGCCGGAGCAGATGCGCAAGTGGTGCCACAACCTGAAGATACCCGAGGACAAGATGCACAAAGGGATGCGCATATGCAGCCTGCACTTTGAGCCCTACTGCATCGGCGGCTGCATGCGTCCGTTTGCCGTGCCCACGCTGCAGTTGGGGCACGAGGATCTGGAGGACATACACCGCAATCCGGATGTGATCAAGAAGCTGAACATACGCGAGACCTGCTGCGTGGCGGTGTGCAAGCGGAATCGGGACCGAGACCATGCCAATCTGCACCGTTTCCCCAGCAATGTGGCGCTGCTGACCAAGTGGTGTGCGAATCTGCAGCGGACAGTGCCCGATGGCAGCAAACTGTTCAACGATGCCATCTGCGAGGTGCACTTCGAGGACCGTTGTCTGCGCAACAAGCGGCTGGAGAAGTGGGCGGTGCCCACGCTGATGCTCGGCCACGAGGCCATGGCCTATCAGCTGCCCACTCCGGAGCAGGTGGCCGAGTTCTACGCCAGGCCCAGCGCCCCGAACAATGGCGAGGAGCAGGGCGAGTGCTGTGTGGAGACGTGCAAACGGAATCCCAGTGTAGATGACATCAAACTGTATCGGCCGCCGGAGGACAGCTCGGTGCTGGCCAAATGGGCGCACAATCTGCAAACGGAGGCCGCAGCTCTCACCAACGGACTGCGGATATGCAATCTGCACTTTGAGGCCCACTGCATTGGCAAGCGGATGCGTCCGTGGGCCATACCCACCCTCAATCTGGCCGGCAACATTGAGAACCTCTACGAGAACCCGGAGCACTCGATGCTGTACAAGCGACGGACGCACCTCAAACAGAAGGTGCCCGTGGCGAAGCCGACGTGGGTGCCACGCTGCTGCCTGCCGCACTGCCGCAAGGTGCGTGCCCAGCACAATGTCCAGCTGTATCGCTTCCCCAAACTCAACCGCTCCACGCTGGCCAAGTGGGCGCACAATCTGCAAGTGCCGCAGGTGGGCAGTGCCCAGCGGCGTGTCTGTTCCGCACACTTTGAGCCGCATGTCCTCAGCAAGAAGTGCCCGGTGCCGCTGGCGGTGCCCACACTGGACCTCAACTCGCCCGCTGGCCACAAGATCTACCAGAATCCGGCCAAGCTGAAGGCCAACAAGCTGTGCCTGCAGCGGGTCTGCATTGTGGAGAGCTGCCGGAAGACCAGGGCCCAGGGCGTCCAGCTCTTCCGTCTCCCGCACAGCCCCACGCAGCTGAGGAAGTGGATGCACAACATCAGGACACGCCCAAGGGCGGCCATGAGGAGCCAGTATCGTGTGTGTTCGCGTCACTTTGAGACGCACTCCTTCAATGGGCGCCGACTGAGCGCGGGGGCCATTCCCACGCTGGAGTTGGGCCACGACGACGATGACATCTTCCCGAACGAGGCGCAAGCCTTTGCGGATGAGCACTGCGCCGTGGAGGGCTGTGAATCGTCCAAGGAGCAGCTCGAAGTGCGCCTCTTCCGCTTCCCCACGGACGACGACGACATGCTGTGGAAGTGGTGCAACAATCTGAAGATGAATCCCGTCGACTGCATCGGTGTGCGGATATGCAACAAGCACTTCGATGCGGACTGCATCGGGCCGAAGCATCTGTACAAGTGGGCCATACCCACGATGCTGCTGGGCCACGATGACTCCCAGATCGAGCTGATACTCAATCCGAAGCCCGAGGAGCGCTATGTGGACCCCGTGTTCAAGTGCATTGTGCCCACGTGCGGCAAGACGCGTCGCTTCGATGAGGTGCAAATGAACAGCTTCCCCAAGGATGCGGATCTCTTTCAGCGCTGGCGTCACAATCTGAGGCTGGAGCATTTGTGCTTTAAGGAGCGCGAGAAGTACAAGATATGCAATGCCCACTTCGAGGACATGTGCATTGGCAAGACGCGTCTGAACATTGGCTCGATACCCACCCTGGAGCTGGGCCACGCCGAAACTGAGGATCTGTTCAAGGTGAATCCGGCTGAGCTGCAGAGCAACCTATTTGGGCGTCCGCGTCGACTGCTGCGAGGATACAACAATGTGAGCATCAAACAGGAGCTGCCAGAGACGCAGGAGGAGCAGCAGCCGCAGGACGTGAAGCCCGATATAGGCACGGATTTTACACAGGTTAAAATCAAGAAATCTCTGGGGGATGTCAAGTGTTGTGTGCGCACCTGCGGCCGCAGCCGCCTGGAGCATGGGGCGCGGCTCTTTCCCTTTCCCAACGGCAAGCAGCAGCACCTGAAGTGGCGCCACAATCTGCGCCTCGAGCCGGACGAAGTGGACAAATCGACGCGCGTGTGCAGCGCCCACTTCAACAGGCGCTGCATCGATGGCAAGCAGCTGCGTGGCTGGGCCATGCCCACACAGCAGTTGGGCCACCAGGAGCAGCCCATCTACGAGAATCCCAAGAATATTCCGGGCTTCTTCACGCCCACCTGTGCGCTGGGGCACTGCCGCAAGCGGCGTAGCATTGACAACGATTTGCGCACGTATCGGTATCCGCGCAGCGAGGATCTGCTCGAGAAGTGGCGGGCGAATCTCGGCCTGTCGCTGGACCAGTGCCGTGGCAGGATCTGTGCGGATCACTTTGAGCCGCAGGTGCGTGGCAAACTGAAGCTAAAGACGGGCGCTGTGCCCACACTCAAGCTGGGCCATGAGGAGGCTCTGATCTACGACAATGAGGCCATAAAGGCGGGCGTGGCCGAAGAGGAGGCGGCGGTGGCGCCGGCACCGGGCAGTGCCTCGCCCCTGGTGACACCCAAAACGGAAGTGCTGGACGAGGAGGAGCGCGAGGAAGAAGAGGAGGAGGAGGATGACACGCCCGAAGGAGCAGAGCAGCTGAGGGATGAGGATGACGATGAAGACGACGATGAGGATCCTGGCAACTATTTTGATCCTCTGGAGCTGGTGGAGACGTATGCAGAGCATCCCAGCGACGACGACGACGACGAGGCAGGAGAGAAGGATGCCAGAGAGGATGAGGAGGAGGAGGAGGCAGAAACTCTACTGCCAGATACGCCACCCAAATCGTCGGCAGTCCTTCGCATGCCCAAACCATGGGACAGACCTGCTGCCGCCACCGCCGCCGCCGCTGTAGTTGTGCCACGCCGCGAGAAGCGTCCGAACAACGTTGATCCCATCTGCTGCCTCAAGCACTGCCGCAAGGAACGCTCCGCCATGTATCTGCTGAGCACCTTTGGCTTCCCCAAGGACCAGCAGCTGCTGCTCAAGTGGTGCGCCAATCTGCAAATGGATCCCTCCGGCTGCATTGGTCGCGTCTGCATCGAGCACTTTCAGTCGGAGGTGCTGGGCACGCGCAAACTCAAACAGAATGCGGTGCCCACGCTCAACGTGGGCCACGATGCGCCGCTGCGTTACAGCTGCAACGGCCAGGAGATCTCCGCCGGCAGCAACAGTTTTCCGGATGAAATGCCACAGCATTCGGTTTTTCGGCTTTGGAGCCTGAAACACTGCCGCAAGAGGAAGCTGTCGGAGAGTTCAGCTCCAGCTCCAGCAGCGATCAAGAGGGAGAAGGAGGAGCAGAAGCAGCAGCAGCAGCAGACACCGATGGAGATGGAGATGCAGCTGGAGCTGGAGACTAAGCCAAAGATTTGCTGCCTGCCCAGCTGTGGCAATGTGGAGGGTTATGGCCCCGGCGGGCACTTCCAGCCGCTGCCCGTGGACCAGAGACTGCTCAAAAAGTGGCAGCACAACCTGAGGCTGCCCAGCATCAATTCGGACAGGGAACTTCGTCTGTGCCTGGAGCACTTTGAGCCGCAACAAATCGAGAATGGCTGCCCCGTGCGGATGGCAGTGCCGACTGTCAAGCTGGGCCACTCCAGTCCGAATATCTTCAGGAACAACGAGGGCTCCCGGCTGCCCGGCTGCCTGTGGCCCTCGTGTCCGCCCAATCGCAAGCTGTGCTACGACCTGCCGGAGCATGAGGCTGTCCGCCTGGCCTGGCTGTCGTATGTGCGGCTGCCAGTGGACAGCCAGGGACGCCTCTGTGGCCTGCACTTCCTGCAGCTGTACGAGGAGGTGGATCTGCCGGGAGACGTGCCCGAACAGGTGCTCGAACGACTGCAGGATACCTACGATCAGGCCTCCATCTCGCTGAAGTTTCAGTGCTCCGTGCTGGGCTGTGGCTCCAAGTACAAGCAGGACACGCACCTGGCGAAGCTGCCACGCGACGCGCAGCTGCTGGCCAAGTGGCTGCACAACACCAGAATCTCCTACGATCGCTCCCTGCACTTTAGCTATCGCATTTGCCTGCTGCACTTTGAGGCGCTCTGCCTGAATGGCCACAGACCACAGACGTGGGCCGTACCCACACTGCAGCTGAATCACGACGGGGAGATCTACCAGAATAGCGTCAAGCAGGAGCTGCTGGAGAACCCTCCGAAGCAGGAGCTGCTGGAGAACCCTCCGAAGCAGGAGTCCGAGAATCACGAGACTCCCGTGAAGCTGGAGAAGCAGGAGAAGCCGCACTGCAGCCTCAGTCTCTCGATTCCGCTGCACATCAAGACGGAGCAGGGCACTCCTGTGCTGCGGGGCACATCCTCGCTGAGCAGTCCCTGCCTCAGTGCCAGCTCCAGTCCCCGCGCGAAGAACCGAGTGTGCTGCATACCCAACTGCGGGGAGATGCCAGCCAGATCCCAGCGGCTGCATCGCTTTCCCACCGCCGAACCGACGCTGCTCAAGTGGCTGGTGAACACCCAGCAAAAGCCGGGACTGGTGGACATTCAGAGTCTGTTTGTGTGCCAGCTGCACTTTGAGGCGGATGCCATTAACCAGACGCAGCTGAGAAGCTGGGCCGTGCCCACACTGCGGCTGGGCCACGATGGCCACGTCATACCGAATGCCCGGCACAACGGGAACATTGCCAACAGCCAGGAGACGGAGCAGGCCATGGAGTTCATTCGGGCCAACTACTGTTCGGTGCTGAGCTGCTTCCAGCCGAAGGGCGAGGGTGTGCGCTTCCACAAGTATCCCAGCGACATTGCCATGGTGCGCAAGTGGGCCACAAATCTCAAGCACCGCTCCATGCAGGCCAGCAGCCATGGCTTTCTCGTCTGCCAGTCGCACTTTCCAGCCGAGTGCTTCGATCCGGGCACGGGAGAGCTACGCGAGGATGCCGTACCCGTCGCTGGTAGTGTGAAAACGGAGAGCCTGCCGCTGCATTGCCTGGTCAAGGGCTGCTCCACGGATAACAGCGGCAAGGCGGGGCGGCTGCTGTTCAAGGTGCCAAAGAAGAATCGCGTGCGGGACGCGTGGGCCCACAACCTGTGGATGCATCCGATCGAGCTGATGGGCGAGCAGCACATCTGCGAGCGGCACTTCGAGGCGCACTGCGTCAATGAACAGAAGATGCTGCACGCGGGCTCAGTGCCAACGCTCCACCTCGGACACACTGAACCGCTGGAACTGCTGCCCAATCCAGAGACCTTCAACGAGTGCCAGGAGGAGTGCGTGTGCTGTGTGCCCGGCTGTGGGCGCAGCAATCGAAAGGATAGCCAGGAGGAGCTGCAGTTCAGCAGATTCCCCAAGTGGCGGGTGCTCTACGACAAGTGGCTGCACAACTTCCGCCTGGAAGTGCCCAAGGAGCAGCGCATTGGCACGCTGCGCGTCTGCCACACGCACTTTGAGGAGAGCTGCTTTGAGCCGGGGCAGGGTGGCGTGCGACGGGGAGCCATGCCCACACTGCAGCTGGGACACTCGCATCCGGACATCTATCGCACGGACGAGGGCTCGCTGTGGAAGAAGGTGCACAAGAGATTCAGCGACTGCTGCTACCCGGACTGCTACGAGGACTGCCACAAGGCCAACACCAATCGCATGGTCTACGAACTGCCAGGCGCGGGGCCGCTGCGTGAGGCCTGGCAGCAGCACTTGGGCATCCCTGACAGCGGCTCCTCGGTGCTCCTCAGGCTCTGTGCCCTCCACTACATCATGCTGTACGAGCACAGCGAGCAGAACTGGCCCGAGCACGCAGCAGACCTCCTGCTGCTGGCCAAGAACTACGCGCACGCCCGCCAGCTGGCCTATCTGCGACGCTTCATGTGTGCCGTGCAGGGCTGTCGCCACTTGCAGCCGCGGGACGGGGGATCGATGCACGGCATACCCAGGCGGCGGCAGATACTTCGCATGTGGGTGGAGAATGCGCAGCTGCGGCTGAACGAGCACGAGATTTACATGACGAAGCTGTGCAGCAAACACTTTGAGCCGCACTGCCTGTTCGAGGGCAAGAAGTGCTATCCGTGGAGCGTGCCCACGCTCCATCTGCCCGCGCTGCTGCCGGGTCAGGTGCTGCACCAGAATCCCACCACGGAGGAGTGGCAGCAAATGAAGCAGCGCATGAAAATGGAGGAGCAGACGCTGAAGGCCGAACCGCAGGCAGATGGCGGACTGCAAATGGAGCCCTACGTCAAGATGGAGCCGCACGATGACGACGCTGGATCGCAAACGGAGTCGGAACTGCTGGTAAATGAGAGCACCATGGACGACTCGCAGGAGACGGACTTTCAAGCGAATGAGCCACTGGAGGTGCTGCTGGAGGTGGGCCATGTGGAGCGGCTGGAGAGCTACGAGAAGAAGGATTACGCCGCCGACAGCTATGCGCCGCCGCTGCCGTCGCCGCCGAAACGCTGTCGCCATCCGTACAGTGCCCACAAGTGCAGTGTCGCGGGCTGTGGCGTCTCGCTCGAGGATGTGGGCGGCAATCTGAAGCTGCACAAGCTACCCAGCGCCACGGAGGCGACCCGCAAGTGGCTGTACAACATACAGGTGGACATTGAGGACAAATGGCGGATACGCGTCTGCAGTCATCACTTTGACAGGCAGTGCCTGAATGGCTCGCGGCTCAGGCGGGGATCGATGCCCACGCTGCTGCTGGGGCCACGTGTCCCGGCGATTATCCACCAGAACGAGTTTGCGCCGCTGCCGTTGGACGATGTGGCGCCAGCAGCACCGAATGGAGCGAGCCGCGCGGAGCCCTCCATTGGCAAGGTGTTGCATCCGTGCGTGCCGCGGCCCTCGCCGCCGCGAAAGTCCAGCAAATTCTGCCAGATCGAGGGGTGTGCGAACCATTTGACCAGCGAGCACATGACACTGCACAAGTTTCCGCACTCGGCGTGGATCTGCACCAAGTGGCAGCACAACACCCAGGTGCCATTCGACCCGGAGTACCGCTGGCGCTATCGCATCTGCAGCGCCCACTTCCATCCCGTGTGCATGGTCAATATGCGGCTGCTGCATGGCAGCGTGCCCACCCTCAAGCTGGGCCCGCGGGCACCCGCCGAGCTCTTTGACAGCGACTTTGAGGCCATAAACATCAAGATTGAGAAGCTGGAGAAGATGGAGCGCAAGGCGGAGGCTCAGAGAATCAGCAGCAGTCACAGTCACAGTCACCATCCCACCATGCCGGACATGGGGGAGGTCCGACTGAAGGTCAAGACTGAGCAGCTGGACGATAGCGGTGGACCAATGCAGGAGCAGGAGGAGGAGGAGGGAGAGGAGGATGCCATGCTCTACCTGGAGCCAGAGATGCAGCTGTACGAGGATCAGGAGGAGGAGGAGCAGCAGCAGAAGCCACAGGTAAATGGGGGCTGGAAAACGGAACTCCGTTTGCCATCAAAGGGCAGGGTGGCCTTCAATCCGGTGCGTTCGGGCTACGACAAGTGCTCCCTGATGCATTGCCAGCGCCAGAGATCGAAGCACGGCGTCCACATCTACAAGTTCCCCCGCTCGCAGGAGCACCAGCAGCGATGGATGCACAATCTGCGCATCCGCTACGACGAGAAGCGCCCCTGGAAGTTCATGGTGTGCAGCGTGCACTTCGAGCCGCATTGCATACGGCTGCGGAAGCTGCGGCCCTGGGCAGTGCCCACACTGGAGCTGGGCGACAATGTGCCCGAGGACATCTACACGAACGAGCAGTGCCAGATGTTGGCCAGTGGCCAGGCAGGAGGCGAGGTCCAGGCTGGAGGCGAGGACAGTGATGCGGAGGCAGAGGCAGAAGCAGAGAGCGATGGAAATGAGGAGGATGGCCTGCAAGAGGACGAGGATGAGGAGACAGATGACCAGGAGCCCAGCACCGCTAAGAAGCGTCGTCGTTCGCGACTGGATGCCGCTGTATGGCCGCCCGGCCAGGTGCCACCGTGGAAGGTGAAGCAATGCTGTCTGCCCTACTGCCGCAGTCCGCGCGGCGATGGCATCAAGCTGTTCCGACTGCCCAACAAAGTCAACTCCATTCGCAACTGGGAGCTGGCCACCGGCATGAAGTTCAAGGAGTCGCAGCGCAACACGCGGCTCATCTGCAGCCGCCACTTTGAGCCGGAGCTGATTGGAGTGCGTCGTCTCATGCGCAATGCCATTCCCACCAGGCATCTGGGACCCACGGCCGTCACGGGCGATGTGAAGCCAGTGGTGGTGTCACCGAGCACAGCTGGTCCCAAATGCTGCATGGCCGATTGCACCTACGATGTGGCCGATGTGAAGCTGCACAAGTTTCCCAGCAATCCCAAGCTACTGAGGGAGTGGTGCCAGGCCTTGAGAGTCACCGATATGCAGAGGTATCGCGGCAAGCACATTTGCTCCGCCCATCTGCCCGTCCACAAGGCCGTGCACTGCATTGTGTGTGGCACGGACAGCGACCCACTGCTGCCGATGCTTAACTTTCCCGCCAACCGGAATCAGCGGGCCAAATGGTGCTACAATCTGAAGATCGAAACGATACCCAAGTGGGACATATCCAAGCACATTTGCTGCAAACACTTTGAGCCATATTGCTTTGCGGCGGCGGGTCTGCTCAAGCCAGAGGCGGCGCCCACACTGCATTTGAATCACAATGATACAAACATATTCCTTAACGATTGTGCCATAAATCCCGCCTACACAGGTGTGGGTGTAGGCGCAGGAGTGCTGCGGGTAAAGGATGAGCCCATGGACAATCAGGTCCTGTCGTTGTTGTAG
Protein Sequence: MSQHNPHAHPHYHHHPLHQSNNNNNNNDYQSGIGMYSAPSAHYGCLDQKQHXXXXXXXXXXXXXXXXXXXXXXXYSHVASYPPVPPHHHATATTAFAATSTPCKGSNSGSVSSNNMNAYGAGSTHGYYAAAAAAAAAGAAYNLEAXXXXXXXXXXXXXXXXXXXXXXXXXXXRSYMGHDIMSGTYPYIKSEPMEAAYQQPPPNPMAPPPAPDMIIKSEPMDEHAYKSNYIDDNTPFADFNKFNEFSGDMLSPKVELTIKDETYGKTSSGSSFARRKVQQQPQQQQQLPTTDRSAESLPICQRCKEVFFKKQSYLRHVAESSCGIQEYDFKCNICPMSFMTSEELQRHKHLHRADKYFCHKYCGKHFDTIAECETHEYMQHEYDSFVCNMCSGTFATREQLYAHLPQHKFQQRYDCPICRLWYQTAVELHEHRLAAPYFXXXXXXXXXXXXXXXXXXXXXXXXXXXDCHMATMEMPTLPTTPLLKAPTNCNASVLPASAALSSLLQQRQANADGAAAMFAAASSSSGAAAAATSVSLKSEVSVKLERSYSNSTSESSYSHQDNSSYNNAYGSDSSIHGGALAGPQAHSSTLDDSEDALCCVPLCGVRKSTSPTLQFFTFPKDDKYLNQWLHNLKMFHIPAASYATFRICSMHFPKRCINRYSLCYWAVPTFNLGHDDVANLYQNRELTNTFTTGEVARCSMPHCTSQRGESNLKFYNFPKDIKSLIKWCQNARLPVQAKEPRHFCSRHFEDRCIGKFRLKPWAVPTLHLGAQYGKIHDNPKNLYVEEKRCCLNFCRRSRSSDFNMSLYRFPRDEVLLRRWCYNLRLDPGVYRGKNHKICSAHFIKEALGLRKLSPGAVPTLHLGHNDTFNIYENELWXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXSAASTSSSASSASHYVDAEMSASYLSVSAAGSSGGMNASDCMDVCCVPSCESKRHNSENITFHTIPRRPEQMRKWCHNLKIPEDKMHKGMRICSLHFEPYCIGGCMRPFAVPTLQLGHEDLEDIHRNPDVIKKLNIRETCCVAVCKRNRDRDHANLHRFPSNVALLTKWCANLQRTVPDGSKLFNDAICEVHFEDRCLRNKRLEKWAVPTLMLGHEAMAYQLPTPEQVAEFYARPSAPNNGEEQGECCVETCKRNPSVDDIKLYRPPEDSSVLAKWAHNLQTEAAALTNGLRICNLHFEAHCIGKRMRPWAIPTLNLAGNIENLYENPEHSMLYKRRTHLKQKVPVAKPTWVPRCCLPHCRKVRAQHNVQLYRFPKLNRSTLAKWAHNLQVPQVGSAQRRVCSAHFEPHVLSKKCPVPLAVPTLDLNSPAGHKIYQNPAKLKANKLCLQRVCIVESCRKTRAQGVQLFRLPHSPTQLRKWMHNIRTRPRAAMRSQYRVCSRHFETHSFNGRRLSAGAIPTLELGHDDDDIFPNEAQAFADEHCAVEGCESSKEQLEVRLFRFPTDDDDMLWKWCNNLKMNPVDCIGVRICNKHFDADCIGPKHLYKWAIPTMLLGHDDSQIELILNPKPEERYVDPVFKCIVPTCGKTRRFDEVQMNSFPKDADLFQRWRHNLRLEHLCFKEREKYKICNAHFEDMCIGKTRLNIGSIPTLELGHAETEDLFKVNPAELQSNLFGRPRRLLRGYNNVSIKQELPETQEEQQPQDVKPDIGTDFTQVKIKKSLGDVKCCVRTCGRSRLEHGARLFPFPNGKQQHLKWRHNLRLEPDEVDKSTRVCSAHFNRRCIDGKQLRGWAMPTQQLGHQEQPIYENPKNIPGFFTPTCALGHCRKRRSIDNDLRTYRYPRSEDLLEKWRANLGLSLDQCRGRICADHFEPQVRGKLKLKTGAVPTLKLGHEEALIYDNEAIKAGVAEEEAAVAPAPGSASPLVTPKTEVLDEEEREEEEEEEDDTPEGAEQLRDEDDDEDDDEDPGNYFDPLELVETYAEHPSDDDDDEAGEKDAREDEEEEEAETLLPDTPPKSSAVLRMPKPWDRPAAATAAAAVVVPRREKRPNNVDPICCLKHCRKERSAMYLLSTFGFPKDQQLLLKWCANLQMDPSGCIGRVCIEHFQSEVLGTRKLKQNAVPTLNVGHDAPLRYSCNGQEISAGSNSFPDEMPQHSVFRLWSLKHCRKRKLSESSAPAPAAIKREKEEQKQQQQQTPMEMEMQLELETKPKICCLPSCGNVEGYGPGGHFQPLPVDQRLLKKWQHNLRLPSINSDRELRLCLEHFEPQQIENGCPVRMAVPTVKLGHSSPNIFRNNEGSRLPGCLWPSCPPNRKLCYDLPEHEAVRLAWLSYVRLPVDSQGRLCGLHFLQLYEEVDLPGDVPEQVLERLQDTYDQASISLKFQCSVLGCGSKYKQDTHLAKLPRDAQLLAKWLHNTRISYDRSLHFSYRICLLHFEALCLNGHRPQTWAVPTLQLNHDGEIYQNSVKQELLENPPKQELLENPPKQESENHETPVKLEKQEKPHCSLSLSIPLHIKTEQGTPVLRGTSSLSSPCLSASSSPRAKNRVCCIPNCGEMPARSQRLHRFPTAEPTLLKWLVNTQQKPGLVDIQSLFVCQLHFEADAINQTQLRSWAVPTLRLGHDGHVIPNARHNGNIANSQETEQAMEFIRANYCSVLSCFQPKGEGVRFHKYPSDIAMVRKWATNLKHRSMQASSHGFLVCQSHFPAECFDPGTGELREDAVPVAGSVKTESLPLHCLVKGCSTDNSGKAGRLLFKVPKKNRVRDAWAHNLWMHPIELMGEQHICERHFEAHCVNEQKMLHAGSVPTLHLGHTEPLELLPNPETFNECQEECVCCVPGCGRSNRKDSQEELQFSRFPKWRVLYDKWLHNFRLEVPKEQRIGTLRVCHTHFEESCFEPGQGGVRRGAMPTLQLGHSHPDIYRTDEGSLWKKVHKRFSDCCYPDCYEDCHKANTNRMVYELPGAGPLREAWQQHLGIPDSGSSVLLRLCALHYIMLYEHSEQNWPEHAADLLLLAKNYAHARQLAYLRRFMCAVQGCRHLQPRDGGSMHGIPRRRQILRMWVENAQLRLNEHEIYMTKLCSKHFEPHCLFEGKKCYPWSVPTLHLPALLPGQVLHQNPTTEEWQQMKQRMKMEEQTLKAEPQADGGLQMEPYVKMEPHDDDAGSQTESELLVNESTMDDSQETDFQANEPLEVLLEVGHVERLESYEKKDYAADSYAPPLPSPPKRCRHPYSAHKCSVAGCGVSLEDVGGNLKLHKLPSATEATRKWLYNIQVDIEDKWRIRVCSHHFDRQCLNGSRLRRGSMPTLLLGPRVPAIIHQNEFAPLPLDDVAPAAPNGASRAEPSIGKVLHPCVPRPSPPRKSSKFCQIEGCANHLTSEHMTLHKFPHSAWICTKWQHNTQVPFDPEYRWRYRICSAHFHPVCMVNMRLLHGSVPTLKLGPRAPAELFDSDFEAINIKIEKLEKMERKAEAQRISSSHSHSHHPTMPDMGEVRLKVKTEQLDDSGGPMQEQEEEEGEEDAMLYLEPEMQLYEDQEEEEQQQKPQVNGGWKTELRLPSKGRVAFNPVRSGYDKCSLMHCQRQRSKHGVHIYKFPRSQEHQQRWMHNLRIRYDEKRPWKFMVCSVHFEPHCIRLRKLRPWAVPTLELGDNVPEDIYTNEQCQMLASGQAGGEVQAGGEDSDAEAEAEAESDGNEEDGLQEDEDEETDDQEPSTAKKRRRSRLDAAVWPPGQVPPWKVKQCCLPYCRSPRGDGIKLFRLPNKVNSIRNWELATGMKFKESQRNTRLICSRHFEPELIGVRRLMRNAIPTRHLGPTAVTGDVKPVVVSPSTAGPKCCMADCTYDVADVKLHKFPSNPKLLREWCQALRVTDMQRYRGKHICSAHLPVHKAVHCIVCGTDSDPLLPMLNFPANRNQRAKWCYNLKIETIPKWDISKHICCKHFEPYCFAAAGLLKPEAAPTLHLNHNDTNIFLNDCAINPAYTGVGVGAGVLRVKDEPMDNQVLSLL

Similar Transcription Factors

Sequence clustering based on sequence similarity using MMseqs2

100% Identity: iTF_00536072;
90% Identity: iTF_00563936;
80% Identity: -