Basic Information

Insect: Drosophila ananassae
Gene Symbol: -
Assembly: GCA_017639315.1
Location: CM029942.1:45449105-45462175[-]

Transcription Factor Domain

TF Family: THAP
Domain: THAP domain
PFAM: PF05485
TF Group: Zinc-Coordinating Group
Description: The THAP domain is a putative DNA-binding domain (DBD) and probably also binds a zinc ion. It features the conserved C2CH architecture (consensus sequence: Cys - 2-4 residues - Cys - 35-50 residues - Cys - 2 residues - His). Other universal features include the location of the domain at the N-termini of proteins, its size of about 90 residues, a C-terminal AVPTIF box and several other conserved residues. Orthologues of the human THAP domain have been identified in other vertebrates and probably worms and flies, but not in other eukaryotes or any prokaryotes [1].
Hmmscan Out: # of c-Evalue i-Evalue score bias hmm coord from hmm coord to ali coord from ali coord to env coord from env coord to acc

1 29 2.4 6.7e+03 -2.2 3.4 38 62 337 364 328 380 0.59

2 29 2e-15 5.7e-12 46.1 4.1 1 86 572 644 572 645 0.85

3 29 7.6e-15 2.1e-11 44.3 5.0 1 87 672 741 672 741 0.83

4 29 6.9e-16 1.9e-12 47.6 0.2 1 87 763 835 763 835 0.85

5 29 2.2e-16 6.2e-13 49.2 6.3 1 87 934 1004 934 1004 0.82

6 29 4.4e-15 1.2e-11 45.1 3.5 1 86 1028 1099 1028 1100 0.81

7 29 6e-13 1.7e-09 38.2 1.3 1 87 1135 1203 1135 1203 0.80

8 29 2.4e-11 6.7e-08 33.1 2.5 1 86 1243 1312 1243 1313 0.77

9 29 1.7e-17 4.8e-14 52.8 0.3 1 86 1340 1409 1340 1410 0.82

10 29 6.3e-13 1.8e-09 38.2 1.5 1 85 1431 1499 1431 1501 0.79

11 29 1.1e-14 2.9e-11 43.9 1.0 1 86 1528 1599 1528 1600 0.85

12 29 3.5e-14 9.7e-11 42.2 2.0 1 86 1682 1751 1682 1752 0.82

13 29 4.4e-13 1.2e-09 38.7 0.1 1 86 1772 1840 1772 1841 0.82

14 29 3e-14 8.2e-11 42.4 1.2 1 87 1970 2039 1970 2039 0.81

15 29 1.7e-08 4.8e-05 23.9 0.0 1 86 2131 2196 2131 2197 0.75

16 29 3.1e-07 0.00086 19.9 0.0 1 58 2212 2259 2212 2275 0.82

17 29 6.4e-13 1.8e-09 38.1 0.2 1 87 2289 2361 2289 2361 0.80

18 29 7.8e-14 2.2e-10 41.1 0.3 1 87 2421 2491 2421 2491 0.82

19 29 7.1e-11 2e-07 31.6 0.0 1 86 2526 2597 2526 2598 0.79

20 29 3.4e-13 9.5e-10 39.0 0.0 1 86 2608 2679 2608 2680 0.79

21 29 7.4e-15 2.1e-11 44.3 1.0 1 85 2704 2774 2704 2776 0.81

22 29 6.9e-06 0.019 15.6 0.2 1 58 2806 2853 2806 2887 0.76

23 29 1.5e-12 4.1e-09 37.0 0.1 1 87 2891 2963 2891 2963 0.81

24 29 4.8e-16 1.3e-12 48.2 0.2 1 86 3070 3142 3070 3143 0.81

25 29 5.4e-13 1.5e-09 38.4 3.1 1 86 3203 3273 3203 3274 0.82

26 29 5e-14 1.4e-10 41.7 3.6 1 86 3344 3414 3344 3415 0.85

27 29 5.1e-12 1.4e-08 35.2 0.1 1 87 3498 3568 3498 3568 0.84

28 29 1.7e-10 4.9e-07 30.3 2.0 1 58 3596 3644 3596 3659 0.84

29 29 1.5e-09 4.2e-06 27.3 1.5 18 86 3662 3719 3650 3720 0.74

#	of	c-Evalue	i-Evalue	score	bias	hmm coord from	hmm coord to	ali coord from	ali coord to	env coord from	env coord to	acc
1	29	2.4	6.7e+03	-2.2	3.4	38	62	337	364	328	380	0.59
2	29	2e-15	5.7e-12	46.1	4.1	1	86	572	644	572	645	0.85
3	29	7.6e-15	2.1e-11	44.3	5.0	1	87	672	741	672	741	0.83
4	29	6.9e-16	1.9e-12	47.6	0.2	1	87	763	835	763	835	0.85
5	29	2.2e-16	6.2e-13	49.2	6.3	1	87	934	1004	934	1004	0.82
6	29	4.4e-15	1.2e-11	45.1	3.5	1	86	1028	1099	1028	1100	0.81
7	29	6e-13	1.7e-09	38.2	1.3	1	87	1135	1203	1135	1203	0.80
8	29	2.4e-11	6.7e-08	33.1	2.5	1	86	1243	1312	1243	1313	0.77
9	29	1.7e-17	4.8e-14	52.8	0.3	1	86	1340	1409	1340	1410	0.82
10	29	6.3e-13	1.8e-09	38.2	1.5	1	85	1431	1499	1431	1501	0.79
11	29	1.1e-14	2.9e-11	43.9	1.0	1	86	1528	1599	1528	1600	0.85
12	29	3.5e-14	9.7e-11	42.2	2.0	1	86	1682	1751	1682	1752	0.82
13	29	4.4e-13	1.2e-09	38.7	0.1	1	86	1772	1840	1772	1841	0.82
14	29	3e-14	8.2e-11	42.4	1.2	1	87	1970	2039	1970	2039	0.81
15	29	1.7e-08	4.8e-05	23.9	0.0	1	86	2131	2196	2131	2197	0.75
16	29	3.1e-07	0.00086	19.9	0.0	1	58	2212	2259	2212	2275	0.82
17	29	6.4e-13	1.8e-09	38.1	0.2	1	87	2289	2361	2289	2361	0.80
18	29	7.8e-14	2.2e-10	41.1	0.3	1	87	2421	2491	2421	2491	0.82
19	29	7.1e-11	2e-07	31.6	0.0	1	86	2526	2597	2526	2598	0.79
20	29	3.4e-13	9.5e-10	39.0	0.0	1	86	2608	2679	2608	2680	0.79
21	29	7.4e-15	2.1e-11	44.3	1.0	1	85	2704	2774	2704	2776	0.81
22	29	6.9e-06	0.019	15.6	0.2	1	58	2806	2853	2806	2887	0.76
23	29	1.5e-12	4.1e-09	37.0	0.1	1	87	2891	2963	2891	2963	0.81
24	29	4.8e-16	1.3e-12	48.2	0.2	1	86	3070	3142	3070	3143	0.81
25	29	5.4e-13	1.5e-09	38.4	3.1	1	86	3203	3273	3203	3274	0.82
26	29	5e-14	1.4e-10	41.7	3.6	1	86	3344	3414	3344	3415	0.85
27	29	5.1e-12	1.4e-08	35.2	0.1	1	87	3498	3568	3498	3568	0.84
28	29	1.7e-10	4.9e-07	30.3	2.0	1	58	3596	3644	3596	3659	0.84
29	29	1.5e-09	4.2e-06	27.3	1.5	18	86	3662	3719	3650	3720	0.74

Sequence Information

Coding Sequence: ATGTCACAACATAACCANNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNTTGGTACTCACATGTTGCTTCCTACCCACCCTCCCATACGGCCTTCAACCCCTCACTCCCCTGCAAGGCCGCCAGCAACAGCAGCAGCACCAACAACAACTCCATCATGGGCGCCTACGGAGGGGGTGGTGGTGGTACGCATGGCTACTACGGCAATGTCAGCGGCGGAGTGGGTGTTGGAGTGGGAGGGGGCGGTGGCGGTGGCGGAGGCGGAGGTGGCGCAGTTGGCTCGACCTACGGCCTTGGGGCCAACACAGTGGCCTATGCCCACAACCAGCTGCTTCAGTACCAGCAACACCACCAGCAGCAGGACCNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNCGAACCCATGGAGGTCTTCCAGCAGCCGCCAAATCCGATGGCTCCACCGCCACCTCTGCCTCCGGCCCAGGAAATGATCATAAAATCGGAACCCATGGACGAACAGGCCTACAAGTCCAACTATATCGATGACAACACCCCGTTCGCGGACTTCAGCAAGTTCAACGAGTTCAGCGAGGACATGCTGAGCCCCAAGGTGGAGCTTACTGTCAAGGATGAGTCCTACGGCAAGAACCATAATAGCTTTCCTCGTCGCAAGCCACACAATGATCGACCCGCCGGCAATGAGAGCCTGCCGATCTGCCAGCGCTGCAAGGAGGTGTTCTTCAAGAAGCAGACCTACTTGCGCCACGTCGCCGAGAGCAGGTGCACCATCCAGGAGTATGACTTCAAGTGCAACATCTGCCCCATGTCCTTCGTGAGCGCCGAGGAGCTGCAGCGACACAAGAACCATCACCGGGCCGACCGGTTCTTCTGCCACAAGTACTGCGGCAAGCACTTTGAATCAATCGCCGAGTGTGAGGCGCACGAGTACATGCAGCATGAGTACGACAGCTTCGTCTGCAACATGTGCTCGGCCACTTTTGCGACCCGGGATCAGCTCTACTCCCACCTGCCGCAGCACAAGTTTCAGCAGCGCTTCGACTGCCCCATATGCCGCCTGTGGTACCAGACCGCCCTCCAGCTGCACGAGCACCGGATAGCGGAGCCCTTTTACTGCGGAAAGTACTACGGGGCCGGGCTGAACACGGCGACACCTCAGCAGCAACACCACCACCAGAGCCAGACCAACTACAAGCTACAGGATTGCCACATGGCCACCATGGAGATGCCCAACACATCGCAGCACAAGCCGAATTCCTCCAACTCCACCTTGCCGGCCACTGCGGCTCTAAGTTCCTTGCTGCAGCAGCGGCAAGCGAATGCCGATGGAGCTGCCATGTTCGCTGCCTCGGCGGTCAAGGCGGAGATGAACGTCAAGCTGGAGCGGAGCTTCAGCAACTCGACCAGCGAATCATCGTACGGTGNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNAGAAACTGCAATGCACAGTGGTGCTATCGCCGGACCACAGGCGAACTCCTCGACGCTGGACGACTCCGAGGATGCACTGTGCTGTGTGCCGTTGTGCGGAGTGCGCAAGAGCACCAGCCCTACGCTGCAGTTCTTCACGTTCCCCAAGGACGAAAAATACCTCAACCAGTGGCTGCACAACCTCAAGATGTTCCACGTGCCGGCCTCCAGCTACGCCAGCTTCCGCATCTGCAGCATGCACTTCCCCAAGCGCTGCATCAACCGCTACTCGCTGTGCTACTGGGCAGTTCCGACCTTCAACCTGGGCCACGACGACGTGGCCAATCTCTACCAGAACCGCGAGCTCACCAACACATTCACCGTCGGTGAAGTGGCCAGGTGCAGCATGCCCCACTGCACCAGCCAGCGGGGCGAGAGCAACCTCAAGTTCTACAACTTTCCCAAGGACATCAAGAGCCTGATCAAGTGGTGTCAGAACGCCCGGCTGCCCGTCCAGGCCAAGGAGCCACGGCACTTTTGCAGCCGACACTTCGAGGAGCGGTGTATTGGCAAGTTCCGCCTCAAGCCCTGGGCTGTGCCCACCCTTCATCTGGGCGCCCAGTACGGAAAGATTCACGACAATCCCAAGAACTTGTATGTGGAGGAGAAGCGTTGTTGCCTCAACTTCTGTCGCAGAAGTAGGTCCTCTGACTTCAATATGTCGCTATATCGTTTTCCCAGAGACGAGGTGCTCCTCCGCCGTTGGTGCTACAATCTTCGTCTGGATCCGGGAGTTTATCGCGGCAAGAATCATAAAATATGCAGTGCTCACTTCATCAAGGAGGCGTTGGGCTTGCGGAAGCTATCCCCTGGAGCGGTGCCAACATTGCATTTGGGCCACAACGACACCTTCAACATCTACGAGAACGAGCTGTGGCCGCCGCCGACTCCCTCCACCAGCCACGGCAGTGGCCAGGTGCACTTGCAACACCAGCCACATATCCCATCGCACCACTCGCTCCAGCACCAGCTGCATATTGGACAGAGCAAATCCTATCAACGGCACTCGGCCGCATCCACCTCCTCCTCGGCGAGCTCCACCTCGCACTACGTGGATCCGGAGGTGAGTGCTTCCTACCTGGCGATGGGCGGATCCTCGGTGAACGCCAGCGACAGCATGGATGTCTGCTGTGTGCCCAGCTGCGAGAGCAAGCGGCACAACTCTGAGAACATCACCTTCCACACGATCCCCCGACGACCCGAGCAGATGCGCAAGTGGTGCCACAATCTTAAGATACCCGAGGACAAGATGCACAAGGGCATGAGGATCTGCAGCCGGCACTTCGAGCCATACTGCATCGGCGGGTGCATGCGTCCGTTCGCAGTGCCCACCTTGCACCTGGGCCACGACGACGAGGACATTCACCGAAATCCGGACGTAATAAAGAAGCTGAACATCCGGGAGACCTGCTGCGTAGCTGTGTGCAAGCGGAACCGGGACAGGGACCACGCCAACCTGCACCGCTTCCCCAGCAACGTGGCGTTGCTGACCAAGTGGTGTGCCAATCTCCAGCGTCCCGTGCCGGACGGCAGCAAGCTCTTCAACGACGCCATTTGCGAGGTGCACTTCGAGGACCGCTGTCTGCGGAACAAGCGCCTGGAGAAGTGGGCAGTGCCTACCCTAACCCTGGGCCACGAAGACATTGCCTATCCTCTGCCCACGCCGGAGCAGGTGGCCGAGTTCCACTCGCGGCCCTCGGCGCCCAACAATGGCGAGGAGCAGGGCGAGTGCTGCGTTGAGACCTGCAAGCGAAACCCCAGCGTGGACGACATTAAGCTGTACCGTCCTCCGGAGGAGGCGTCCGTGCTAGCCAAGTGGGCGCACAACCTGCAAACCGAGGCCGCCCAGCTGGTGAACCAGCGGATCTGCAATCTGCACTTCGAGGCCCACTGCATCGGCAAGCGAATGCGCCCGTGGGCCATACCCACCCTGAACCTGGCCGGCAACATTGAGAATCTCTACGAGAACCCGGAGCCCTCGATGCTCTACAAGCGGCGCATGCACGCGAAGGCGAAACTGTCCGCATCTGCGAAGCCTACATGGGTGCCGCGGTGCTGCCTCCCGCATTGCCGCAAGGTGCGCGCCCTGCACAATGTCCAACTCTACCGCTTCCCCAAGCACAACCGCTCCACACTGGCCAAGTGGGCCCACAACCTGCAGGTGCCCATGGTGGGCAGTGCCCAACGGCGCGTCTGTTCGGCTCATTTCGAGCCTCATGTGCTGAGCAAAAAGTGTCCGGTGCCGTTGGCAGTGCCCACATTGGACCTGAACGCCCCGGCAGGGCACATGGTGTACCAGAATCCGGCCAAGCTGCGGGCTAGTAAACTGTGCCTGCAGCGCGTGTGCATCGTGGAGAGCTGTCGCAAGACCCGGGCGCAAGGCGTGCAACTCTTCCGGCTCCCGCACAATCCATCCCAGCTAAGGAAGTGGATGCACAACATCAGGACACGGCCACGGGGCTCTATGCGGTCCCAATACCGGATCTGTTCCCGCCACTTTGAGACACACTCGTTCAACGGACGGAGGCTCAGTGCAGGAGCCATTCCCACGCTGGAGCTGGGCCACGACGACGACGACATCTACCCGAACGAGGCACAGGCTTTTGTGGACGAGCACTGTGCCGTGGAGGGATGTGGGGCGTCCAAAGAACAGCCGGAGGTGCGACTATTCCGCTTCCCCACAGACGACGATGACATGTTGTGGAAGTGGTGCAACAACCTCAAGATGAACCCCGCCGACTGCACGGGCGTGCGCATCTGCAACAAGCATTTCGAAGCGGACTGCATCGGGCCCAAGCACCTGTTTAAGTGGGCCATTCCCACCCAAGAGCTGGGCCACGACGATGCCCAGATAGAACTTATTCCGAACCCGAAGCCGGAGGATCGGTACGTCGATCCAGTGTTCAAGTGCGTGGTTCCCACTTGCGGCAAGACGCGGCGGTTTGACGAAGTCCAGATGAACAGCTTCCCCAAGGACCCGGAGCTCTTCCAGCGGTGGCGGCACAACCTCCGCTTGGACCATTTGCACTTCCACGAGCGGGAACGCTACAAGATTTGCAACGCCCACTTCGAGGACGTGTGTATCGGCAAGACCCGCTTGAATATCGGCTCGATACCCACTCTAGAACTGGGCCACGATGAGACGGATGACCTATTCCAAGTCAATCCCTTGGAATTGCAGAGCAACTTGTTCGGTCGCCAAAGGCGGCTGCTTGACGGAACGGAATCCGCCGAGGTGATGGTCAAGCAGGAGCTTCCAGATGGGGAAGGTGACTCCGAGCCCGATGACATAAAACCGGATATAAGACAAATACTAATATCCAGACCCAGACAGGTGAAGGCCAAGAAAGGGACTCTGGGGAATCTGAAATGCTGCGTCCGGAGTTGCGGAAGGAGTCGGCTCCAACATGGGGCTCGTCTGTTTGCATTTCCAACGGGCAAGCAGCAGCACCTTAAATGGCGCCACAATCTCCGGCTGGAACCTGAGGACGTGGATCGGACCACCCGGGTATGCAGTGCTCACTTCAATCGCCGCTGCATAGACGGCAAGCAGCTGAGGAGCTGGGCCATGCCCACACTGCAGCTGGGGCATCGGGAGCAGCCCATCTACGAGAACATACCGGGCTTTTTCACGCCCACCTGTGCCCTGAGCCACTGCCGTCAGAGAAGGAGCATCGACAACGACCTACGGACCTACCGGTACCCCCGGACGGAAGACCTCTTGGAAAAGTGGCGAGCCAATCTCCGCCTGACTCCGGATCAGTGCCGCGGTCGCATCTGTGCCGATCATTTCGAGCCTATGGTGCGCGGCAAGTTGAAGCTTAAAACCGGAGCGGTGCCCACTTTGAAGCTCGGCCACGACGAGGGACTGATCTACGACAATGAGGCAATCAAGGCTGGCATGGCGGAGGAGGAGGAGGTCACCTGTAAGCAGGAGATCCTGGACGAGGAGGAGGAGGGCGAAGGCGAAGGCGAGGAGTCGCGAGAAGGTGTTCCCGCTGTCAACGAGGATGAGGACGACAAAGACGACAGTTACTTCGATCCTTTGGAGTTGGTAGAAACGTTCGCAGAACGGGCCAGCGATGACGAAGCGGAAGACCACGAAATGGAGGAAAAAAATGAGCCCGATGAGGGGGATGAGGAGGAGGCAGAGGAGCTCCTGCCCGACCTGCCTCCCACACCGCCTCCTGTGCCCCAGCGTCGCGAAAAACCCGCCAACAATGTGACCCCCATATGCTGTCTGAAGCACTGTCGCAAGGAGCGCACGGCCTTCCATCTGCTGAGCACATTCGGGTTTCCGAAGGACCGTAAGCTGTTGCTGAAATGGTGCGACAATCTCCACCTGCACCCGGATGACATTGTAGGGCGGGTCTGCATCGAGCACTTCGAGCCGGAGGTCCTCGGCACTCGGAAGCTTAAACAGAATGCAGTGCCCACCTTGAACTTGGGCCACGACGATCCGTTGCGGTACACCTGCCATGGCGTGGAGCAAGATGAGGACTTGGAGCATGGCCAGCCGCAGCACTCGGTTTTTCGGCTTTGGAGCCTGAAACACTGCCGCAAGAGGAAGCTATCGGATCCCCCGGACATTCGCCTCAGCCACTGGAAGGAGCTGAAGATGCACATGCAGAAGCAGAGGGAGATGGAGATGGCGATGGAGACGGACATAGTGATGAGCACTCCTCCTCAGACGCCGGTGAAGATTAGGCCAAAGAGATGCTGCGTTATCAGTTGCGGAAGTGAGGATACCAAAAAGTTGGTAACCATGCCGGATGAGCGCAGTCTTCTCCGCCGGTGGCAGCATAATCTCAAGTTGTCAGTGTTCACGGATCCAAGTCTTGGCCTGTGCCTGGACCACTTCGAAGAGTCTCTGGTGCAATTTGGAAAGCCCTTGGACAGGGCAGTGCCCACCCTGAAGCTGGGTCACAACAGTGGTAATCTCTACCGAAACAACGCCACTTGCCTAGTTCCCAGTTGTCCTAGTTCTGACTCCGATGTAACCAGTTTTGTGAGTCTGCCCGTGAATCCAGTGATGAGAAGGGCCTGGCTCTCCTACCTTCAATTGCCATTCCATAGCCAAGGGCTTTTATGTGGCAACCACTTCGTGGAACTCTACGAGCAGGTGGACTTGCCGGAGGACTTACCCGTCCAGGATCTGGAGGAGCTGGAACGAACTGTCGATGAACTGCAGTGCGCTGTGCCCGGTTGCGAGTCAAAGAATGCCCGTGAGATTCCTGTCCAGCTGGTCCAGTTACCGCACAACGAGGAGGAACTGTCCAAGTGGCTGCACAACACGAAGATCACTTATGACTATTCGCGGCACGGTAGCTATCGGATCTGCCTGCTCCACTTTGACCCCATCTGCCTGGAAGACGACTTTCCACAGAGTTGGGCAGTGCCCACACTAAACCTGGGCCACGAGGACGACATCCACCTGAATCCCGTCCAGAATCAAGTTCCAGAGGCTCTTAACGGAACCTCCAACAGCAATCCCTGGCTAACGCCTCTGAGAATCAAGACGGAACTCGCTTCCGTAAGCAGCCCCAGCGTAAGCGCCAGCCCAAGTCCGAGGGGAAAGATACGGATTTGCTGCATCCCCACCTGCGGCCAGTTTGGAAATAGCCAGGTGCGACTGTATCGCTTTCCCAGCGAGGAGCAGTTCCTCCTCCAGTGGCTGATCAACACGCAGCAGCAGCCCCGACTCGTGGATCCCATGGAGCTCTACGTGTGTCAGGCACACTTTGAAGCCGACGCCATTCACAAGAAGCATCTCCGCAGCTGGGCACTGCCGACCCTAAATCTTGGCCACGACGGGCATGTCTTTCAAAACGCCAGGCACAACGGAACCATTGCCGAGGCCTTGGATGTCGAGGAGGCCACTAAGTTTATCCGGGAGCGCTACTGCTCGGTGATGAGTTGCTTCCAACCCGCGGGAGAGGGAGTCAGGCTCTTCGAGTACCCCGAGGACATGGCTATTATCCGAAAGTGGGCAGTGGCCTGCAAGCATCGATCCATGCACGCCAGAAGCCATGGGCTCCGGGTGTGTCAGGCGCACTTTGCCGCCGAGTGTTTTGATCCCGGCACTGGAGATCTGCTAGAAGGGTCTGTACCCACGCTGGAACTCAACCGAGACGACATCGAGAGACACTGCTTGGTGCGAGGATGTGAGAGGGACGAGTCGGGTCCTCGCTTGCGCTTCTATAAGCTGCCCAAGACCGGTGACCAGATCCAGGCATGGAGCAACAATATGAAAATTCCGCCCACCGAACTGATGCAGGGAGACCAACGCATTTGCGAGCGCCACTTCGAGGCGTACTGCTTCGGACCCTGCCGGGGTCTTCGGCAGGGAGCTCTACCCACTTTGTCCCTGGGCCACGAGGAAGAGGTGGACTTGCTTCCCAATCCCGAGAAGTTGCGGTTGGGCAAGCAGGAGACATGTTGCGTACCGGGCTGCGACCGAGTCCGGCAGCCAGATGACATCCCTTTCTACTGCTTCCCGAAGCTCTGGCCTTTGGCCAGGAAGTGGCTGCACAATATCCGCCTAGAAAAGTCCAGCAAGGATCCGCTAAACAAACTTAGGGTGTGCCCGGCGCACTTTGAGTCGGATGTGCAAGAAAACGATGCACTCCTCCCGGAAGCCATGCCCACCAAGCAGCTGGGACACTCCTCCGAAGGCATTTTTCTCACCAACAAGCAGGACAGGAGCTTTCAGAATCACAAGAAATCCTTCCCGGAGGTGGTTTGCTGTTATCCGAACTGCACTGATTTGTCCAGGATCCAGTTGATGGATCTTCCCGACGCGGCAGAGCTTCGCAACGCGTGGTTAGAACACTTGGAAATCAAGGAGGCACATAATGATGCCCTACAGCTCTGTCCTCTCCATTATGTGATTCTTTATGAGCACAGTGCCAAGGAGTTTCCGGAGCACGTTCCTGACCAGTTGATGGAAGAAAACTACCAAAACGCCCGCAACAACCGGCGCGTGAAGATCGTCAGTTGTGCCATCAAGGGATGCAGTATGGTGAAGCCCAGGGATGGAGTGCAGCTGCACGGAATGCCCGTGTACAAGGACATCTTGCAGATGTGGGTGGACAACGGACAGATAGACTTCTCTGAGCAGCAGCGCTACATGCTTAAGGTGTGCCACAGACACTTTGAGCCAAGCTGCTTCATCGAGGAACGGCGGCTCACCTCCTGGAGTGTTCCTACTCTGCATCTTCCCGGCGAGACTATCCACCAGAATCCCAGCAAAGAGGAGTGGCTGGCCATAAAGCAGGAAAAGGAAGAGCCAGAGATTAAGGAGGAACCTCTGGAGCCGGAGATGGAAACTGAAAACTCTCTACTGGAGCCTATTGTGAAGATGGAACACATGGACTCCGAGGAGGACGACTCACAGATGCAGGCGTTGGAGGTGCTGCTGGAGGTGGGGCACGTGGAGCGGCTGGACAGCTATGAGAAGATTGACAAATCCCCCATCGCCTATCCGGAGCACGTCATATACAAATCCAATCGAAGTCAATACAACGCCAACCGCTGCGCCGTGGAGGGATGCGAGGTCACAGCCGAGGACGTAGACGGAACTATCCGGCTGCACAAGTTTCCCGCCTCAGCGGATGCCGCCCAGAAGTGGATGCACAACACGCAGGTGGACATGGAAGAGAAGTTCTGGTGGCGCTATCGCATTTGCAGCTATCACTTCCACCAGGAATGCTTTCAGGGCTCTAGAATCCGGAAGGGAGCCATGCCCACGCTACTCCTGGGTCCTCGGCGACCGGATGAGCTTTACGACAATGAGTTCGCTTCGCAGCAGGAGGCGGAGGACCCGTCTCTGCCCGTCGAGATGTGTCAGACCAGCGCTACAGAGCGGACTGCTCCGGACGTTACCAATCTCTGCCTGCCTCCGCCGGCTGCGCCGCGAAAGTCCAGCAAGTTCTGCCAAATCGAAGGCTGCTCGAATCATCTGACCACCGAGAACATAACCCTCCACAAGTTTCCCCACTCCGAGGACATGTGCATCCGATGGCAGCACAACACTCAAGTTCCATTCGATCCGAATCATCGCTGGCGGTACAGGATCTGTACCGCCCACTTCGAGCCTGTGTGCTTGGCCAACTTGCGCCTGCTCCACGGAAGTGTGCCCACCCTGAAGCTGGGTCCCAAAGCTCCAGCCCAGCTCTTCGACAACGACTTTGAGGCCATCAACCAGCGTCTGGATAAGAGGTCGGCGGCAGAGATAAAACAGGAACGAGTGGACATGGAAGACGAGCTGCACGAGGATCAGATGGATGTGCCTAGCTGGAAACCAGTGAAGCAGGAGAAGATAACCTTCAACCAGATAAAATCTGGCTACGACAAGTGCTCGCTGGCCCACTGCCAGCGCCAAAGATCTCTGCACGGCGTCCACATCTACAAGTTTCCCAGGTCGCAGCGCCAGCAGGAGCGGTGGATGCACAACCTCCGCATTCGCTACGATGAGCGCCGACCCTGGCGATTCATGATCTGCAGCGTCCACTTCGAGCCCCACTGCATCAGCCTTAGAAAGCTGCGCCCCTGGGCAGTTCCTACGCTGGAGCTGGGCACGAATGTGCCGGAGAAGATCTTCACGAACGAGCAGTGCCAGGAACTGGAGGTGGAACAGCCCAGCGATCGCAGCGAGGCGGAGAGCGAAGAGGAGGATGGCCTGGAAGAAGACGACGATGGGGAGGACGACGAGGGGGCGGAAGAAGGACTAGACTGCAATATCCGCATTAAGAAGGAGCGGCGTTCGAAGCTGGATCCATATCCTCCTGGTCAGGTTCCGCCCTGGAAGGTGAAGCAGTGCTGTCTTCCCTACTGTCGTGCCTTCCGAGGAGATGGCATCAAGCTTTTCCGGCTCCCCAACAACCGATCCTCCATTCGCAATTGGGAGCTAGCCACGGGCATGGTGTTCAAAGAGTCGCAGCGAAACACCCGCCTCATTTGCAGTCGACACTTTGACCCGGAACTAATCGGTGTGCGTCGTCTCATGCGCAACGCTATTCCCACCCTGCATCTGAATCCCCAGGCCGTAACAGTCAAGGAGAAGAAGATTTCGACCAGCAAGCCTAAGGATGTCCCCTCTTCCATGCCCACCTGCTGCATGGCGGATTGCCATCACAACGGAAATACGAAGCTGCATAAATTCCCCAGTGACTCCACCCACCTGAGGCAGTGGTGCCAGGCTCTCAGGCTCACGGATACACAACGTTATCGCGGCAAGTACATCTGTTCGGCCCACCTGCCGACCAACATGACAGTAAGCTGCGTTGTCTGCGGGGTAGATGACGTTCAGCTGCCGATGCTGGACTTCCCAGAGAACCGCAACCAGCGGGCCAAATGGTGCTACAACCTGAAAATCGAGACCATACCCAAGTGGGATCGCTCCAAGCATATCTGCTGCCGGCACTTTGAGGCACACTGCTTTGCCCGGCCGGGTGAACTTCGTCCAGGAGCGACCCCAACAGTGGCTTTGAACCACAACGACACAAACATATTCCTGAGCGACTACGCCACCGATCCGACGACCTCCTACGAGGGTAATCAGATCAAGGACGAGCCCATGGACGGCGACGAGACGCTCCTGGTCTAG
Protein Sequence: MSQHNXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXWYSHVASYPPSHTAFNPSLPCKAASNSSSTNNNSIMGAYGGGGGGTHGYYGNVSGGVGVGVGGGGGGGGGGGGAVGSTYGLGANTVAYAHNQLLQYQQHHQQQDXXXXXXXXXXXXXXXXXXXXXXXXXXXXXEPMEVFQQPPNPMAPPPPLPPAQEMIIKSEPMDEQAYKSNYIDDNTPFADFSKFNEFSEDMLSPKVELTVKDESYGKNHNSFPRRKPHNDRPAGNESLPICQRCKEVFFKKQTYLRHVAESRCTIQEYDFKCNICPMSFVSAEELQRHKNHHRADRFFCHKYCGKHFESIAECEAHEYMQHEYDSFVCNMCSATFATRDQLYSHLPQHKFQQRFDCPICRLWYQTALQLHEHRIAEPFYCGKYYGAGLNTATPQQQHHHQSQTNYKLQDCHMATMEMPNTSQHKPNSSNSTLPATAALSSLLQQRQANADGAAMFAASAVKAEMNVKLERSFSNSTSESSYGXXXXXXXXXXXXETAMHSGAIAGPQANSSTLDDSEDALCCVPLCGVRKSTSPTLQFFTFPKDEKYLNQWLHNLKMFHVPASSYASFRICSMHFPKRCINRYSLCYWAVPTFNLGHDDVANLYQNRELTNTFTVGEVARCSMPHCTSQRGESNLKFYNFPKDIKSLIKWCQNARLPVQAKEPRHFCSRHFEERCIGKFRLKPWAVPTLHLGAQYGKIHDNPKNLYVEEKRCCLNFCRRSRSSDFNMSLYRFPRDEVLLRRWCYNLRLDPGVYRGKNHKICSAHFIKEALGLRKLSPGAVPTLHLGHNDTFNIYENELWPPPTPSTSHGSGQVHLQHQPHIPSHHSLQHQLHIGQSKSYQRHSAASTSSSASSTSHYVDPEVSASYLAMGGSSVNASDSMDVCCVPSCESKRHNSENITFHTIPRRPEQMRKWCHNLKIPEDKMHKGMRICSRHFEPYCIGGCMRPFAVPTLHLGHDDEDIHRNPDVIKKLNIRETCCVAVCKRNRDRDHANLHRFPSNVALLTKWCANLQRPVPDGSKLFNDAICEVHFEDRCLRNKRLEKWAVPTLTLGHEDIAYPLPTPEQVAEFHSRPSAPNNGEEQGECCVETCKRNPSVDDIKLYRPPEEASVLAKWAHNLQTEAAQLVNQRICNLHFEAHCIGKRMRPWAIPTLNLAGNIENLYENPEPSMLYKRRMHAKAKLSASAKPTWVPRCCLPHCRKVRALHNVQLYRFPKHNRSTLAKWAHNLQVPMVGSAQRRVCSAHFEPHVLSKKCPVPLAVPTLDLNAPAGHMVYQNPAKLRASKLCLQRVCIVESCRKTRAQGVQLFRLPHNPSQLRKWMHNIRTRPRGSMRSQYRICSRHFETHSFNGRRLSAGAIPTLELGHDDDDIYPNEAQAFVDEHCAVEGCGASKEQPEVRLFRFPTDDDDMLWKWCNNLKMNPADCTGVRICNKHFEADCIGPKHLFKWAIPTQELGHDDAQIELIPNPKPEDRYVDPVFKCVVPTCGKTRRFDEVQMNSFPKDPELFQRWRHNLRLDHLHFHERERYKICNAHFEDVCIGKTRLNIGSIPTLELGHDETDDLFQVNPLELQSNLFGRQRRLLDGTESAEVMVKQELPDGEGDSEPDDIKPDIRQILISRPRQVKAKKGTLGNLKCCVRSCGRSRLQHGARLFAFPTGKQQHLKWRHNLRLEPEDVDRTTRVCSAHFNRRCIDGKQLRSWAMPTLQLGHREQPIYENIPGFFTPTCALSHCRQRRSIDNDLRTYRYPRTEDLLEKWRANLRLTPDQCRGRICADHFEPMVRGKLKLKTGAVPTLKLGHDEGLIYDNEAIKAGMAEEEEVTCKQEILDEEEEGEGEGEESREGVPAVNEDEDDKDDSYFDPLELVETFAERASDDEAEDHEMEEKNEPDEGDEEEAEELLPDLPPTPPPVPQRREKPANNVTPICCLKHCRKERTAFHLLSTFGFPKDRKLLLKWCDNLHLHPDDIVGRVCIEHFEPEVLGTRKLKQNAVPTLNLGHDDPLRYTCHGVEQDEDLEHGQPQHSVFRLWSLKHCRKRKLSDPPDIRLSHWKELKMHMQKQREMEMAMETDIVMSTPPQTPVKIRPKRCCVISCGSEDTKKLVTMPDERSLLRRWQHNLKLSVFTDPSLGLCLDHFEESLVQFGKPLDRAVPTLKLGHNSGNLYRNNATCLVPSCPSSDSDVTSFVSLPVNPVMRRAWLSYLQLPFHSQGLLCGNHFVELYEQVDLPEDLPVQDLEELERTVDELQCAVPGCESKNAREIPVQLVQLPHNEEELSKWLHNTKITYDYSRHGSYRICLLHFDPICLEDDFPQSWAVPTLNLGHEDDIHLNPVQNQVPEALNGTSNSNPWLTPLRIKTELASVSSPSVSASPSPRGKIRICCIPTCGQFGNSQVRLYRFPSEEQFLLQWLINTQQQPRLVDPMELYVCQAHFEADAIHKKHLRSWALPTLNLGHDGHVFQNARHNGTIAEALDVEEATKFIRERYCSVMSCFQPAGEGVRLFEYPEDMAIIRKWAVACKHRSMHARSHGLRVCQAHFAAECFDPGTGDLLEGSVPTLELNRDDIERHCLVRGCERDESGPRLRFYKLPKTGDQIQAWSNNMKIPPTELMQGDQRICERHFEAYCFGPCRGLRQGALPTLSLGHEEEVDLLPNPEKLRLGKQETCCVPGCDRVRQPDDIPFYCFPKLWPLARKWLHNIRLEKSSKDPLNKLRVCPAHFESDVQENDALLPEAMPTKQLGHSSEGIFLTNKQDRSFQNHKKSFPEVVCCYPNCTDLSRIQLMDLPDAAELRNAWLEHLEIKEAHNDALQLCPLHYVILYEHSAKEFPEHVPDQLMEENYQNARNNRRVKIVSCAIKGCSMVKPRDGVQLHGMPVYKDILQMWVDNGQIDFSEQQRYMLKVCHRHFEPSCFIEERRLTSWSVPTLHLPGETIHQNPSKEEWLAIKQEKEEPEIKEEPLEPEMETENSLLEPIVKMEHMDSEEDDSQMQALEVLLEVGHVERLDSYEKIDKSPIAYPEHVIYKSNRSQYNANRCAVEGCEVTAEDVDGTIRLHKFPASADAAQKWMHNTQVDMEEKFWWRYRICSYHFHQECFQGSRIRKGAMPTLLLGPRRPDELYDNEFASQQEAEDPSLPVEMCQTSATERTAPDVTNLCLPPPAAPRKSSKFCQIEGCSNHLTTENITLHKFPHSEDMCIRWQHNTQVPFDPNHRWRYRICTAHFEPVCLANLRLLHGSVPTLKLGPKAPAQLFDNDFEAINQRLDKRSAAEIKQERVDMEDELHEDQMDVPSWKPVKQEKITFNQIKSGYDKCSLAHCQRQRSLHGVHIYKFPRSQRQQERWMHNLRIRYDERRPWRFMICSVHFEPHCISLRKLRPWAVPTLELGTNVPEKIFTNEQCQELEVEQPSDRSEAESEEEDGLEEDDDGEDDEGAEEGLDCNIRIKKERRSKLDPYPPGQVPPWKVKQCCLPYCRAFRGDGIKLFRLPNNRSSIRNWELATGMVFKESQRNTRLICSRHFDPELIGVRRLMRNAIPTLHLNPQAVTVKEKKISTSKPKDVPSSMPTCCMADCHHNGNTKLHKFPSDSTHLRQWCQALRLTDTQRYRGKYICSAHLPTNMTVSCVVCGVDDVQLPMLDFPENRNQRAKWCYNLKIETIPKWDRSKHICCRHFEAHCFARPGELRPGATPTVALNHNDTNIFLSDYATDPTTSYEGNQIKDEPMDGDETLLV

Similar Transcription Factors

Sequence clustering based on sequence similarity using MMseqs2

100% Identity: iTF_00477366;
90% Identity: iTF_00538995;
80% Identity: -