Basic Information

Insect: Drosophila pseudoananassae
Gene Symbol: -
Assembly: GCA_018153035.1
Location: JAECXR010000056.1:4190975-4203889[-]

Transcription Factor Domain

TF Family: THAP
Domain: THAP domain
PFAM: PF05485
TF Group: Zinc-Coordinating Group
Description: The THAP domain is a putative DNA-binding domain (DBD) and probably also binds a zinc ion. It features the conserved C2CH architecture (consensus sequence: Cys - 2-4 residues - Cys - 35-50 residues - Cys - 2 residues - His). Other universal features include the location of the domain at the N-termini of proteins, its size of about 90 residues, a C-terminal AVPTIF box and several other conserved residues. Orthologues of the human THAP domain have been identified in other vertebrates and probably worms and flies, but not in other eukaryotes or any prokaryotes [1].
Hmmscan Out: # of c-Evalue i-Evalue score bias hmm coord from hmm coord to ali coord from ali coord to env coord from env coord to acc

1 29 2.4 6.3e+03 -2.2 3.3 38 62 328 355 319 371 0.59

2 29 2e-15 5.3e-12 46.1 4.1 1 86 563 635 563 636 0.85

3 29 7.6e-15 2e-11 44.3 5.0 1 87 663 732 663 732 0.83

4 29 6.9e-16 1.8e-12 47.6 0.2 1 87 754 826 754 826 0.85

5 29 3.8e-16 9.8e-13 48.5 5.8 1 87 925 995 925 995 0.81

6 29 4.3e-15 1.1e-11 45.1 3.5 1 86 1019 1090 1019 1091 0.81

7 29 7.1e-13 1.9e-09 38.0 1.2 1 87 1126 1194 1126 1194 0.81

8 29 4.9e-11 1.3e-07 32.1 1.6 1 86 1234 1303 1234 1304 0.75

9 29 1.7e-17 4.4e-14 52.8 0.3 1 86 1331 1400 1331 1401 0.82

10 29 6.3e-13 1.6e-09 38.2 1.5 1 85 1422 1490 1422 1492 0.79

11 29 1e-14 2.7e-11 43.9 1.0 1 86 1519 1590 1519 1591 0.85

12 29 3.4e-14 8.9e-11 42.2 2.0 1 86 1671 1740 1671 1741 0.82

13 29 9.6e-13 2.5e-09 37.6 0.1 1 86 1764 1832 1764 1833 0.82

14 29 1.8e-14 4.8e-11 43.1 1.4 1 87 1959 2028 1959 2028 0.81

15 29 6.3e-08 0.00016 22.1 0.0 1 86 2122 2187 2122 2190 0.75

16 29 2e-06 0.0051 17.3 0.0 1 58 2203 2250 2203 2266 0.81

17 29 3.4e-12 8.7e-09 35.8 0.2 1 87 2280 2352 2280 2352 0.80

18 29 4e-14 1e-10 42.0 0.2 1 87 2412 2482 2412 2482 0.81

19 29 4.1e-09 1.1e-05 25.9 0.0 1 86 2517 2588 2517 2589 0.78

20 29 2.3e-12 6e-09 36.4 0.0 1 87 2599 2671 2599 2671 0.79

21 29 1.3e-15 3.5e-12 46.7 0.4 1 85 2692 2762 2692 2764 0.82

22 29 7.3e-07 0.0019 18.7 0.1 1 58 2796 2843 2796 2876 0.81

23 29 3.2e-11 8.3e-08 32.7 0.3 1 87 2881 2953 2881 2953 0.79

24 29 2.9e-15 7.6e-12 45.6 0.2 1 86 3057 3129 3057 3130 0.80

25 29 8.9e-13 2.3e-09 37.7 3.5 1 86 3190 3260 3190 3261 0.82

26 29 5e-14 1.3e-10 41.7 3.6 1 86 3331 3401 3331 3402 0.85

27 29 6.7e-12 1.8e-08 34.9 0.1 1 87 3485 3555 3485 3555 0.84

28 29 3.1e-10 8.2e-07 29.5 1.8 1 58 3583 3631 3583 3639 0.85

29 29 1.8e-09 4.7e-06 27.1 1.5 18 86 3649 3706 3638 3707 0.73

#	of	c-Evalue	i-Evalue	score	bias	hmm coord from	hmm coord to	ali coord from	ali coord to	env coord from	env coord to	acc
1	29	2.4	6.3e+03	-2.2	3.3	38	62	328	355	319	371	0.59
2	29	2e-15	5.3e-12	46.1	4.1	1	86	563	635	563	636	0.85
3	29	7.6e-15	2e-11	44.3	5.0	1	87	663	732	663	732	0.83
4	29	6.9e-16	1.8e-12	47.6	0.2	1	87	754	826	754	826	0.85
5	29	3.8e-16	9.8e-13	48.5	5.8	1	87	925	995	925	995	0.81
6	29	4.3e-15	1.1e-11	45.1	3.5	1	86	1019	1090	1019	1091	0.81
7	29	7.1e-13	1.9e-09	38.0	1.2	1	87	1126	1194	1126	1194	0.81
8	29	4.9e-11	1.3e-07	32.1	1.6	1	86	1234	1303	1234	1304	0.75
9	29	1.7e-17	4.4e-14	52.8	0.3	1	86	1331	1400	1331	1401	0.82
10	29	6.3e-13	1.6e-09	38.2	1.5	1	85	1422	1490	1422	1492	0.79
11	29	1e-14	2.7e-11	43.9	1.0	1	86	1519	1590	1519	1591	0.85
12	29	3.4e-14	8.9e-11	42.2	2.0	1	86	1671	1740	1671	1741	0.82
13	29	9.6e-13	2.5e-09	37.6	0.1	1	86	1764	1832	1764	1833	0.82
14	29	1.8e-14	4.8e-11	43.1	1.4	1	87	1959	2028	1959	2028	0.81
15	29	6.3e-08	0.00016	22.1	0.0	1	86	2122	2187	2122	2190	0.75
16	29	2e-06	0.0051	17.3	0.0	1	58	2203	2250	2203	2266	0.81
17	29	3.4e-12	8.7e-09	35.8	0.2	1	87	2280	2352	2280	2352	0.80
18	29	4e-14	1e-10	42.0	0.2	1	87	2412	2482	2412	2482	0.81
19	29	4.1e-09	1.1e-05	25.9	0.0	1	86	2517	2588	2517	2589	0.78
20	29	2.3e-12	6e-09	36.4	0.0	1	87	2599	2671	2599	2671	0.79
21	29	1.3e-15	3.5e-12	46.7	0.4	1	85	2692	2762	2692	2764	0.82
22	29	7.3e-07	0.0019	18.7	0.1	1	58	2796	2843	2796	2876	0.81
23	29	3.2e-11	8.3e-08	32.7	0.3	1	87	2881	2953	2881	2953	0.79
24	29	2.9e-15	7.6e-12	45.6	0.2	1	86	3057	3129	3057	3130	0.80
25	29	8.9e-13	2.3e-09	37.7	3.5	1	86	3190	3260	3190	3261	0.82
26	29	5e-14	1.3e-10	41.7	3.6	1	86	3331	3401	3331	3402	0.85
27	29	6.7e-12	1.8e-08	34.9	0.1	1	87	3485	3555	3485	3555	0.84
28	29	3.1e-10	8.2e-07	29.5	1.8	1	58	3583	3631	3583	3639	0.85
29	29	1.8e-09	4.7e-06	27.1	1.5	18	86	3649	3706	3638	3707	0.73

Sequence Information

Coding Sequence: ATGTCACAACATAACCAACCCCACCAAGTTCCCCCCCATCCGCACTATCCTTACCACCACGCCTCTTTGTCNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNCGGCCTTCAACCCCTCACTCCCCTGCAAGGCCGCCAGCAACAGCAGCACCAACAACAACTCCATCATGGGTGCCTACGGAGGGGGTGGTGGCACGCATGGCTATTACGGCAATGTCAGCGGCAGCATAGGTGTTGGAGTAGGAGGAGCAGGCGGAGGAGGAGGGGGCGCCGTAGGCTCGACCTACGGCCTTGGGGCCAACACCGTGGCCTATGCCCACAACNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNCATCGCACCTGGGCCAGCGGTCCTATATGGGCCACGAAGTCATGGCCGGCGGCAGCTATCCCTACATCAAAAGCGAACCCATGGAGGCATTCCAGCACCCGCCAAACCCCATGGCGCCGCCGCCTCCCCTGCCTCCGGCCCCGGAAATGATCATAAAATCGGAACCCATGGACGAACAGGCCTACAAGTCCAACTATATAGACGACAACACCCCGTTCGCGGACTTTAGCAAGTTCAACGAATACAGTGAGGACATGCTGAGTCCCAAGGTGGAGCTTACCGTTAAGGACGAGTCCTACGGCAAGAACCACAATAGTTTTCCTCGTCGCAAGCCACAAAGTGATCGGCTAGCCGGCAATGAGAGCCTGCCGATCTGCCAGCGCTGCAAGGAGGTGTTCTTCAAGAAGCAGACCTACTTGCGCCACGTTGCCGAGAGCAGCTGCAGCATCCAGGAGTATGACTTCAAGTGCAACATCTGCCCCATGTCCTTCGTGAGCGCTGAGGAGCTGCAGCGCCACAAAAACCATCACCGGGCCGACCGATTCTTCTGCCACAAATACTGTGGCAAGCACTTTGAAACGATTGCCGAGTGCGAGGCGCATGAGTACATGCAGCACGAATACGACAGCTTTGTCTGCAACATGTGCTCTGCCACTTTTGCCACAAGGGATCAGCTTTACTCCCACCTGCCGCAGCACAAGTTCCAGCAGCGCTTCGACTGCCCCATATGCCGCCTGTGGTACCAGACCGCCCACCAGCTGCACGAGCACCGGCTGGCGGAACCCTACTACTGCGGGAAGTACTACGGGGCAGGGCTGAGCACGGCGACACCTCAGCAGCAGCATCACCACCCGAGCCAGACCAACTACAAGCTGCAGGATTGCCACATGGCCACGATGGAGATGCCCAACACATCGCAGCACAAGTCGAACTCTTCCAACTCCACCTTGCCGGCCACGGCGGCTCTCAGTTCCTTGCTGCAACAGCGGCAGGCGAATGCTGATGGCGCTGCCATGTTCGCCGCCTCGGCGGTCAAGGCGGAGATGAACGTGAAGCTGGAGCGGAGCTACAGTAACTCGACCAGTGAATCATCGTACGGTGTGCAGGATGGCGGCTACAACAACTCCTTTGCCGGAGAAACATCAATGCACAGTGGGGCCATCGCCGGGCCACAGGCGAACTCCTCGACGCTGGACGACTCCGAGGACGCGCTGTGCTGCGTGCCATTGTGTGGAGTGCGCAAGAGCACCAGCCCCACGCTGCAGTTCTTCACGTTCCCCAAAGACGAAAAATACCTCAACCAGTGGCTGCACAACCTCAAGATGTTCCACGTGCCGGCCTCCAGCTACGCCAGCTTCCGCATCTGCAGCATGCACTTCCCCAAGCGCTGCATTAACCGATACTCGCTGTGCTACTGGGCAGTTCCGACGTTCAACCTGGGCCACGACGACGTGGCCAATCTCTACCAGAACCGCGAGCTGACCAATACTTTCACCGTCGGCGAAGTGGCCAGGTGCAGCATGCCGCACTGCACCAGCCAGCGGGGCGAGAGCAACCTCAAGTTCTACAACTTTCCGAAGGACATCAAGAGCCTGATTAAGTGGTGTCAGAACGCCCGCCTCCCTGTCCAGGCCAAGGAGCCACGCCACTTCTGCAGCCGCCACTTCGAGGAGCGTTGTATTGGCAAGTTCCGTCTGAAGCCCTGGGCTGTGCCCACTCTCCACCTAGGCGCCCAGTACGGAAAGATCCATGACAATCCGAAGAACCTGTATGTGGAGGAGAAACGATGCTGCCTCAACTTCTGCCGCAGGAGCAGGTCCTCTGACTTCAATATGTCCCTATATCGTTTTCCCAGAGACGAAGTCCTCCTCCGCCGTTGGTGCTATAACCTTCGCCTAGACCCCGGAGTATATCGCGGCAAGAACCACAAAATATGCAGTGCCCACTTCATCAAGGAGGCGTTGGGCTTGCGGAAGCTATCACCTGGGGCGGTGCCAACATTGCACTTGGGCCACAACGACACCTTCAACATCTACGAGAACGAGCTGTGGCCGCCGCCGACGCCCTCCACCAGCCACGGCAGTGGCCAGGTGCACATGCAGCACCAGCAACATATCCCGTCGCACCACTCGCTCCAGCACCAGCTGCATCTTGGACAAAGCAAGTCCTATCAACGGCACTCGGCCGCGTCCACTTCGTCCTCGGCGAGCTCCACCTCCCACTACGTGGATCCGGAGGTGAGTGCTTCGTACCTTGCGATGGCCGGGTCCTCGGCGAACGCCAGCGACAGTATGGATGTCTGCTGCGTGCCCAGCTGCGAGAGCAAGCGGCACAACGCCGAGAACATCACCTTCCACACGATTCCCCGGAGACCCGAGCAGATGCGCAAGTGGTGCCACAACCTGAAGATACCCGAGGACAAGATGCACAAGGGCATGCGGATCTGCAGCCGGCACTTCGAGGCCTACTGCATCGGTGGGTGCATGCGCCCGTTCGCAGTGCCCACACTGCATCTGGGCCACGACGACGAGGACATCCACCGCAATCCGGACGTAATAAAGAAGCTAAACATCCGCGAAACCTGCTGCGTGGCTGTCTGCAAACGAAACCGGGACCGGGACCATGCCAACCTGCACCGCTTCCCCAGCAACGTGGCGCTGCTGACCAAGTGGTGTGCCAATCTCCAGCGCCCCGTCCCGGACGGCAGCAAGCTCTTCAACGACGCCATTTGCGAGGTGCACTTCGAGGACCGCTGCCTGCGGAACAAGCGCCTGGAAAAGTGGGCGGTGCCCACACTAACCCTGGGCCACGACGACATTGCCTATCCCCTGCCCACGCCAGAGCAGGTTGCCGAGTTCCACTCTCGGCCCTCGGCCCCCAACAACGGGGAGGAGCAGGGCGAGTGCTGCGTGGAGACCTGTAAGCGAAACCCCAGCGTGGACGACATCAAACTCTACCGCCCTCCGGAGGAGGCGTCCGTGCTGGCCAAGTGGGCGCACAACCTGCAGACGGAGGCGGCCCAGCTGGTGAGCCAGCGGATCTGCAATCTGCACTTCGAGGCCCACTGCATCGGTAAGCGGATGCGGCCATGGGCCATACCCACCCTCAACCTGGCCGGCAACATTGAGAATCTCTACGAGAATCCGGAGCCTTCGATGCTCTACAAGCGGCGGATGCACACCAAAGCAAAGCTTTCCGCCTCTGCGAAACCCACCTGGGTGCCGCGTTGCTGCCTGCCACATTGCCGCAAGGTGCGCGCCCTCCACAATGTCCAGCTCTACCGCTTCCCCAAGCACAACCGCTCCACGCTGGCCAAGTGGGCGCACAACCTGCAGGTGCCCATGGTGGGCAGCGCCCAACGCCGGGTGTGCTCGGCCCACTTTGAGCCTCTGGTGCTGAGCAAGAAGTGCCCGGTGCCACTGGCGGTGCCCACACTGGACCTGAACGCCCCGGCCGGGCATATGGTGTACCAGAATCCGGCCAAGCTAAGGGCCAGTAAGCTGTGCCTGCAGCGCGTGTGCATCGTAGAGAGCTGTCGCAAGACCCGGGCGCAAGGAGTGCAACTGTTCCGGCTCCCGCACAATCCATCCCAGCTACGGAAGTGGATGCACAATATCCGGACACGTCCGCGGGGTTCCATGCGGTCCCAGTACCGGATCTGCTCCCGCCACTTTGAGACGCACTCGTTTAACGGGCGGAGGCTCAGTGCAGGAGCCATTCCCACTCTGGAGCTGGGCCACGACGACGACGACATCTACCCCAACGAGGCGCAGGCCTTTGTGGACGAACACTGCGCCGTGGAGGGATGCGGGGCATCCAAGGAGCAGCCGGAAGTGCGGCTGTTCCGCTTCCCCACGGACGACGATGACATGTTGTGGAAGTGGTGCAACAACCTGAAGATGAACCCCGCGGACTGCACGGGCGTGCGTATCTGCAACAAGCACTTCGAGGCGGACTGCATTGGACCCAAGCACCTATTTAAGTGGGCCATTCCCACCCAGGAGCTGGGCCACGACGACGCCCAGATAGAACTCATTCCGAACCCCAAGCCGGAGGATCGCTACGTGGACCCTGTGTTTAAGTGTGTGGTCCCCACCTGCGGCAAGACGCGGCGCTTTGACGAGGTCCAGATGAACAGCTTCCCCAAGGACCCGGAGCTCTTCCAGCGGTGGCGACACAACCTCCGCTTGGACCACTTGCACTTCCACGAGCGGGAGCGCTACAAGATCTGCAACGCCCACTTCGAGGACGTGTGCATTGGCAAGACCCGCCTGAACATCGGCTCGATACCCACACTAGAGCTGGGCCACGACGAGACCGAGGACCTGTTCCAAGTCAATCCCGCGGAGCTGCAGAGCAACTTGTTTGGTCGCCAACGGCGGCTGCTCGACGGATCGGAATCCGGCGAGGTGGTGGTCAAGCAGGAGCTTCCGGATGATGAGACCGAGCCTGAGGACATCAAGCCGGACATTAGAGAACTATTAGTGTCCAGGCCCAGACAGGTGAAGGCCAAGAAAGGAACGCTGGGGAGTCTGAAGTGCTGCGTCCGGAGCTGCGGCAGGAGCCGGCTCCAACATGGAGCTCGTCTGTTTGCCTTTCCCACGGGCAAGCAGCAGCATCTCAAGTGGCGCCACAATCTGCGCCTGGAGCCTGAGGACGTGGATAGGTCTACGCGGGTGTGCAGCGCTCACTTCAATCGCCGTTGCATAGACGGGAAGCAGCTTAGGAGCTGGGCCATGCCCACCCTGCAGCTGGGCCATCGGGAGCAGCCCATCTACGAGAATCCCAAGAACATACCGGGCTTCTTCACGCCCACCTGTGCCCTGAGCCACTGCCGCCAGAGAAGGAGCATCGACAACGACCTTCGGACATACCGCTACCCGCGGACGGAAGACCTGCTGGAGAAGTGGCGGGCCAATCTTCGCCTGACTCCGGATCAGTGCCGCGGTCGTATCTGTGCGGATCACTTTGAACCTCTGGTGCGTGGCAAGTTGAAGCTGAAAACGGGAGCGGTGCCCACCTTGAAGCTCGGCCACGACGAGGGACTGATCTTCGACAATGAGGCGATCAAGGCTGGCATGGCGGCGGAGGAGGAGGAGGTCACCTGCAAGCAGGAGTTGGTCGAAGAGGAGGAAGAGGGCGAGGAGTCGCCTGAGGGCGTTCCCGCCGCCAACGAGGATGACGATGACAAGGAAGACAGCTACTTCGATCCTTTGGAGTTAGTAGAAACCTTCGCAGAGCGCGCCAGCGACGAAGAAGCGGAAGACCNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNGTACCCCAGCGTCGCGAAAAACCCGCCAACAACGTGACCCCCATCTGCTGTCTGAAGCACTGCCGCAAGGAGCGCACGGCCTTCCATCTGCTGAGCACATTCGGCTTCCCGAAGGACCGCAAGCTTTTGCTGAAGTGGTGCGCCAATCTCCACCTCCATCCGGATGACACTGTCGGGCGGGTCTGCATCGAGCACTTCGAGCCGGAGGTGCTCGGCACTCGGAAGCTGAAACAGAATGCGGTGCCCACCTTGAACTTGGGCCACGACGACCCGTTGCGGTACACCTGCCATGGTGTGGAGCAGGATCAGGACTTGGAGCATGGACAGCCGCAGCACTCGGTTTTTCGGCTTTGGAGCCTGAAACACTGTCGCAAGAGGAAGCTATCGGATCCGCCGGACATTCGCCCCAGCCACTGGAAGGAGCTGAAGCTCCACATGCAGAAGCAGAGGCAGATGGAAATGGCGATGGAGATGGAGACCGACATACTGATGAGCACTCCTCCTCAGACGCCGGTGAAGATTAAACCCAAAAGATGCTGCGTCATCAGCTGCGGGAGCGAGGATGCTAGAAAGTTGGTGGCGCTGCCGGATGAGCGCAGCCTGCTCCGACGGTGGCAGCACAACTTGAAGCTGTCAATGCCGGCGGATCCAGGTCTTGGCTTGTGCCTGGACCATTTCGAGGAGTCTCTGGTGCAATTTGGAAAGCCCATGGAGCGGGCAGTGCCCACCCTGAAGTTGGGTCACAAGAGCAGAAATCTCTACCGAAACAATGCTACTTGTCTGGTCCCCAGTTGTCCCAGTTCCGGCTCCGATAGCACTAGTTTTGTGGGTCTGCCCCTGAATCCGGTGATGAAAAGGGCCTGGCTCTCCTACCTCCAACTGTCATTCACTAGCGACGGACTTCTGTGTGGCAACCACTTCGTGGAGCTCTACGAGCAGGTGGACTTGCCTGAGGACTTGCCCGTCCAGGATTTGGAGGAGCTGGAACGAACCGTCGATGAGCTGCAGTGCGCTGTGCCTGGTTGCGCGTCAAAGAACGCCCGTGAGATTCCTGTCCAGCTGGTCCAGTTACCCCACACCGAGAAGGAGCTGTCCAAGTGGCTGCATAACACAAAGATCACCTATGACTATTCGCGGCACGGCAGCTACCGGATATGCCTGCTCCACTTCGACCCGATCTGCCTCGATGAAGACTTTCCCCAGAGTTGGGCAGTGCCTACTCTAAACCTGGGCCACGACGACCAGATCCACTCGAATCCCGTGCAGAACCAGGTGGCTGAGGCTCTTAACGGAACTTCCAATAGCCATCATAGCCATGGGCTGATACCTCTGAGGATTAAGACAGAACTAGCATCCAGCCCCAGCGTCAGTGCCAGTCCCAGTCCGAGAGGAAATATCCGGGTTTGTTGCATCCCCACTTGCGGTCAGTTTGGAAATAGCCAGGTGCGACTCTATCGCTTTCCCAGCGAGGAGCAGTTCCTCCTCCAGTGGCTGGTCAACACGCAGCAGCAGCCCCGACTCGTGGATCCCATGGAGCTCTACGTGTGCCAGGCGCACTTTGAAACCGACGCCACCTACAAGAAGCACCTTCGCAGCTGGGCCTTGCCGACCCTGAATCTTGGCCACGAAGGGCACGTCTTCCAGAACGCCAGGCACAACGGAAACACTGCCGATGTCCAGGATGTCGAGGAGGCAACTAAGTTCATCCGGGAGCGCTACTGTTCGGTGCTGAGTTGCTTTCAACTCGGAGGAGAGGGAGTCCGCCTCTTCGAGTACCCCGAGGACATGGGCATGATCCGAAAGTGGGCAGTTGCCTGCAAGCATCGTTCCATGCACGCCAGGAGCCATGGCCTTCAGGTGTGCCAGGCGCACTTTTCTGCCGACTGCTTTGATCTCGTTACTGGAGGCCTACTGGAGGGATCAATACCCACGCTGGAACTCAGCCGCGAGGACATCGAGAGACACTGCTTGGTGCCAGGATGTGAGCAGGACGATGCGGCCCCCCGTCTGCGATTCTATAAGCTGCCCAAAATCGGTGAAACGCTCGAGGCGTGGAGCATCAACATAAAGATTCCGGTCTCGGAACTGAAGCGAGGAGACCAGCGCATCTGTGAGCGCCACTTCGAGACGTACTGCTTCGGACCTAGCCGGGGTCTGCGGCTGGGAGCCTTACCCACCCTGTTCCTGGGTCACGAGGACCTGCTTCGCAATCCCGATAACTTGCGGCTGGGCAAGCAGGAGAACTGCTGCGTACCGGGATGCGGGCGTATCCGGCAGACTGACGACATTCCTTTCTACAGCTTCCCGAAGCATTGGTCCTTGGCCAGGAAGTGGCTGCACAACCTCCGCTTGGAAAAGACCAGCAAGGATCAGCTAAACAAACTAAGGGTATGCCCGGCGCACTTTGAGTCGGATGTGCGGGAAAACGACGGCCTCCTGCCGGAAGCCATGCCCACCAAGCAGCTGGGACATTCCTCCGAAGGAATTTTCCTTACGGACAAGGGCACGCAGGCTCGGAGTCTTCCGAACCTGAAAAAATCCTCCCCGGAGGTCATTTGCTGTTATCCGGACTGCACGGATTCGTCGAGATTCCAGTTGTTGGATTTTCCCGACCAGGCAGAGCTTCGCGAGGCATGGTTGGGTCACTTGCAACTCAAGGAGCTGCAGAACGAAGCCCCACAGCTCTGTCCCCTTCACTATGTGATTCTGTACGAGCACAGTGCCAAGGAGTTTCCGGAGCACGTTCCCGACCAGTTGATGGAAGAAAACTACACTAACGCCCGCGCCAACCGGCGGGTCAAGATCGTCAGTTGCGCCATCAAGGGATGCAGAACGGTGAGGCCTAGGGATGGAGTGCCGCTGCACGGCATGCCCATCTACAAGGATATCCTGCAGATGTGGGTGGACAACGGACAGGTGGACTTCTCCGAGCACCAACGGTACATGCTCAAGGTGTGTCGCAGGCACTTTGAGGCACGTTGCTTCGTCGACGAACGGCGGCTCTGCTCCTGGAGTGTTCCTACCCTGCATCTTCCCGGCGAGACTATCCACCAGAATCCCAGCAAAGAGGAGTGGGAGGCCATCAAGCGAGAGAGCAAGGAAGAGCCAGAAATCAAGGAGGAGCCTCTAGAGCCGGAGACGGAGATGGAGGTGGAAACGGACAACTCTCTACTGGAGCCCGTTGTCAAGATGGAACACCTGGAATCCGAGGAGGAGGACTCCGAAATGCAGGCGCTGGAGGTGCTGCTGGAGGTCGGACATGTGGAGCGACTGGACAGCTATGAAAAGATCGATGACGTCATCTACAACTCCAATCGTGGTCAGTACAACGCCAACAGCTGCGCCGTGGAAGGGTGTGACGTCACGGCCGAGGACGTGGGCGGCACAATTAAGCTGCACAAGTTTCCCGCCCCAGCGGAAGCCGCCCGCAAGTGGATGCACAACACACAGGTGGACATGGAGGAGAAGTTCTGGTGGCGCTATCGCATCTGCAGCTACCACTTTCACCAGGACTGCTTCCAGGGGTCTAGAATCCGAAAGGGAGCCATGCCCACGCTGCTCCTGGGACCTCGGAGACCGGACGAGGTCTACGACAATGAGTTCGCCTCGCAGCCGGATGTTAAGGAGCCTCCTCTGCCGGTCGAGATTGTCCAGACCGGTGTGAGTGAACGATTAGTGCCCGACGTTACCAATCTCTGCCTTCCTCCGCCGGCTGCGCCCCGGAAATCCAGCAAGTTCTGCCAAATCGAAGGCTGCTCGAACCACCTGACCACCGACAACATAACCCTCCACAAGTTTCCGCACTCGGAGGAGATGTGCGTCCGATGGCAGCACAACTCTCAAGTTCCGTTCGATCCGAACCATCGCTGGCGGTACAGGATCTGCACCGCCCACTTCGAACCCGTGTGCTTGTCTAACTTGCGCCTGCTCCACGGAAGTGTGCCCACCTTGAAGCTTGGACCCAAAGCTCCCGCAGAGCTCTTCGACAACGATTTCGAGGCCATCAACCAGCGGCTGGATAAGAGATCGGCGGCTGAGGTGAAACAGGAACGGGTGGACGTGGAAGACGAGCTGCACGAGGACCAAATGGATGTGCCTAGCTTGATGCCTGTGAAGCAAGAGAAGGTGTCCTTCAACCAGATCAAGTCTGGCTACGACAAGTGCTCACTGGCCCACTGCCAGCGCCAAAGATCTCTCCACGGCGTCCACATCTATAAGTTCCCCAGGTCGCAGCGCCAGCAGGAGCGATGGATGCACAACCTCCGCATCCGCTACGATGAGCGCCGTCCCTGGCGTTTCATGATCTGCAGCGTCCACTTCGAGCCCCACTGCATCAGCCTAAGGAAGCTGCGCCCCTGGGCAGTTCCTACCCTGGAGCTGGGCACCAATGTGCCGGAGATAATCTTCACCAACGAACAGTGCCAGGAACTGGAGGTGGAACCACCCAGCGATCGTAGCGAAGCGGACAGCGAAGAGGAGGATGGCCTGGAAGAAGACGACGATGGTGAGGAGGACGAGGCGAAGGAAGAAGGGCAGGACTCCAATGTCCGCATCAAAAAGGAACGGCGTTCGAGACTGGATCCATATCCTCCTGGTCAGGCCCCGCCCTGGAAAGTGAAGCAGTGCTGCCTTCCCTACTGTCGTGCCTTCCGAGGAGATGGCATCAAGCTCTTCCGGCTCCCCAACAACCGAACCTCCATTCACAATTGGGAGCTGGCCACGGGCATGGTGTTCAAGGAGTCGCAGCGAAACACGCGACTCATTTGTAGTCGACACTTTGATCCGGAGCTTATCGGAGTGCGTCGCCTCATGCGCAACGCCATTCCAACTCTGCATCTCAATCCGGAATCCGTAAAGAGCAAGGAGAAAATGATTCTGCAGGGCAAACCCAAGGAAACTCCGTCCCCCATCCCCACCTGCTGCATGGCGGACTGCCATCACAACGGAAATGCCAAGCTGCACAAGTTCCCCAATGATTCCACACACCTGAGGCAGTGGTGCCAGGCCCTCAGACTCACGGATATACAACGTTATCGTGGCAAGTACATCTGCTCGGCCCACCTGCCGACCAACATGACAGTAAGCTGCGTCGTCTGCGGAGTAGATGACGTTCAGCTACCGATGCTGGACTTTCCAGAGAACCGCAACCAGCGAGCCAAATGGTGCTACAACCTAAAAATCGAGACCATACCCAAGTGGGATCGCTCCAAGCACATCTGTTGCCGGCACTTTGAGTCACACTGCTTTGTCCGGCCGGGTGAACTTCGTCCAGGAGCGACCCCAACAGTGGCATTGAACCACAACGACACAAACATATTCCTCAGCGACTACGCCACCGATCCGACGACCTCCTATGCGGGTAATCAGATCAAGGACGAGCCCATGGACGGCGACGAGACGCTCCTGGTCTAG
Protein Sequence: MSQHNQPHQVPPHPHYPYHHASLSXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXAFNPSLPCKAASNSSTNNNSIMGAYGGGGGTHGYYGNVSGSIGVGVGGAGGGGGGAVGSTYGLGANTVAYAHNXXXXXXXXXXXXXXXXXXSHLGQRSYMGHEVMAGGSYPYIKSEPMEAFQHPPNPMAPPPPLPPAPEMIIKSEPMDEQAYKSNYIDDNTPFADFSKFNEYSEDMLSPKVELTVKDESYGKNHNSFPRRKPQSDRLAGNESLPICQRCKEVFFKKQTYLRHVAESSCSIQEYDFKCNICPMSFVSAEELQRHKNHHRADRFFCHKYCGKHFETIAECEAHEYMQHEYDSFVCNMCSATFATRDQLYSHLPQHKFQQRFDCPICRLWYQTAHQLHEHRLAEPYYCGKYYGAGLSTATPQQQHHHPSQTNYKLQDCHMATMEMPNTSQHKSNSSNSTLPATAALSSLLQQRQANADGAAMFAASAVKAEMNVKLERSYSNSTSESSYGVQDGGYNNSFAGETSMHSGAIAGPQANSSTLDDSEDALCCVPLCGVRKSTSPTLQFFTFPKDEKYLNQWLHNLKMFHVPASSYASFRICSMHFPKRCINRYSLCYWAVPTFNLGHDDVANLYQNRELTNTFTVGEVARCSMPHCTSQRGESNLKFYNFPKDIKSLIKWCQNARLPVQAKEPRHFCSRHFEERCIGKFRLKPWAVPTLHLGAQYGKIHDNPKNLYVEEKRCCLNFCRRSRSSDFNMSLYRFPRDEVLLRRWCYNLRLDPGVYRGKNHKICSAHFIKEALGLRKLSPGAVPTLHLGHNDTFNIYENELWPPPTPSTSHGSGQVHMQHQQHIPSHHSLQHQLHLGQSKSYQRHSAASTSSSASSTSHYVDPEVSASYLAMAGSSANASDSMDVCCVPSCESKRHNAENITFHTIPRRPEQMRKWCHNLKIPEDKMHKGMRICSRHFEAYCIGGCMRPFAVPTLHLGHDDEDIHRNPDVIKKLNIRETCCVAVCKRNRDRDHANLHRFPSNVALLTKWCANLQRPVPDGSKLFNDAICEVHFEDRCLRNKRLEKWAVPTLTLGHDDIAYPLPTPEQVAEFHSRPSAPNNGEEQGECCVETCKRNPSVDDIKLYRPPEEASVLAKWAHNLQTEAAQLVSQRICNLHFEAHCIGKRMRPWAIPTLNLAGNIENLYENPEPSMLYKRRMHTKAKLSASAKPTWVPRCCLPHCRKVRALHNVQLYRFPKHNRSTLAKWAHNLQVPMVGSAQRRVCSAHFEPLVLSKKCPVPLAVPTLDLNAPAGHMVYQNPAKLRASKLCLQRVCIVESCRKTRAQGVQLFRLPHNPSQLRKWMHNIRTRPRGSMRSQYRICSRHFETHSFNGRRLSAGAIPTLELGHDDDDIYPNEAQAFVDEHCAVEGCGASKEQPEVRLFRFPTDDDDMLWKWCNNLKMNPADCTGVRICNKHFEADCIGPKHLFKWAIPTQELGHDDAQIELIPNPKPEDRYVDPVFKCVVPTCGKTRRFDEVQMNSFPKDPELFQRWRHNLRLDHLHFHERERYKICNAHFEDVCIGKTRLNIGSIPTLELGHDETEDLFQVNPAELQSNLFGRQRRLLDGSESGEVVVKQELPDDETEPEDIKPDIRELLVSRPRQVKAKKGTLGSLKCCVRSCGRSRLQHGARLFAFPTGKQQHLKWRHNLRLEPEDVDRSTRVCSAHFNRRCIDGKQLRSWAMPTLQLGHREQPIYENPKNIPGFFTPTCALSHCRQRRSIDNDLRTYRYPRTEDLLEKWRANLRLTPDQCRGRICADHFEPLVRGKLKLKTGAVPTLKLGHDEGLIFDNEAIKAGMAAEEEEVTCKQELVEEEEEGEESPEGVPAANEDDDDKEDSYFDPLELVETFAERASDEEAEDXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXVPQRREKPANNVTPICCLKHCRKERTAFHLLSTFGFPKDRKLLLKWCANLHLHPDDTVGRVCIEHFEPEVLGTRKLKQNAVPTLNLGHDDPLRYTCHGVEQDQDLEHGQPQHSVFRLWSLKHCRKRKLSDPPDIRPSHWKELKLHMQKQRQMEMAMEMETDILMSTPPQTPVKIKPKRCCVISCGSEDARKLVALPDERSLLRRWQHNLKLSMPADPGLGLCLDHFEESLVQFGKPMERAVPTLKLGHKSRNLYRNNATCLVPSCPSSGSDSTSFVGLPLNPVMKRAWLSYLQLSFTSDGLLCGNHFVELYEQVDLPEDLPVQDLEELERTVDELQCAVPGCASKNAREIPVQLVQLPHTEKELSKWLHNTKITYDYSRHGSYRICLLHFDPICLDEDFPQSWAVPTLNLGHDDQIHSNPVQNQVAEALNGTSNSHHSHGLIPLRIKTELASSPSVSASPSPRGNIRVCCIPTCGQFGNSQVRLYRFPSEEQFLLQWLVNTQQQPRLVDPMELYVCQAHFETDATYKKHLRSWALPTLNLGHEGHVFQNARHNGNTADVQDVEEATKFIRERYCSVLSCFQLGGEGVRLFEYPEDMGMIRKWAVACKHRSMHARSHGLQVCQAHFSADCFDLVTGGLLEGSIPTLELSREDIERHCLVPGCEQDDAAPRLRFYKLPKIGETLEAWSINIKIPVSELKRGDQRICERHFETYCFGPSRGLRLGALPTLFLGHEDLLRNPDNLRLGKQENCCVPGCGRIRQTDDIPFYSFPKHWSLARKWLHNLRLEKTSKDQLNKLRVCPAHFESDVRENDGLLPEAMPTKQLGHSSEGIFLTDKGTQARSLPNLKKSSPEVICCYPDCTDSSRFQLLDFPDQAELREAWLGHLQLKELQNEAPQLCPLHYVILYEHSAKEFPEHVPDQLMEENYTNARANRRVKIVSCAIKGCRTVRPRDGVPLHGMPIYKDILQMWVDNGQVDFSEHQRYMLKVCRRHFEARCFVDERRLCSWSVPTLHLPGETIHQNPSKEEWEAIKRESKEEPEIKEEPLEPETEMEVETDNSLLEPVVKMEHLESEEEDSEMQALEVLLEVGHVERLDSYEKIDDVIYNSNRGQYNANSCAVEGCDVTAEDVGGTIKLHKFPAPAEAARKWMHNTQVDMEEKFWWRYRICSYHFHQDCFQGSRIRKGAMPTLLLGPRRPDEVYDNEFASQPDVKEPPLPVEIVQTGVSERLVPDVTNLCLPPPAAPRKSSKFCQIEGCSNHLTTDNITLHKFPHSEEMCVRWQHNSQVPFDPNHRWRYRICTAHFEPVCLSNLRLLHGSVPTLKLGPKAPAELFDNDFEAINQRLDKRSAAEVKQERVDVEDELHEDQMDVPSLMPVKQEKVSFNQIKSGYDKCSLAHCQRQRSLHGVHIYKFPRSQRQQERWMHNLRIRYDERRPWRFMICSVHFEPHCISLRKLRPWAVPTLELGTNVPEIIFTNEQCQELEVEPPSDRSEADSEEEDGLEEDDDGEEDEAKEEGQDSNVRIKKERRSRLDPYPPGQAPPWKVKQCCLPYCRAFRGDGIKLFRLPNNRTSIHNWELATGMVFKESQRNTRLICSRHFDPELIGVRRLMRNAIPTLHLNPESVKSKEKMILQGKPKETPSPIPTCCMADCHHNGNAKLHKFPNDSTHLRQWCQALRLTDIQRYRGKYICSAHLPTNMTVSCVVCGVDDVQLPMLDFPENRNQRAKWCYNLKIETIPKWDRSKHICCRHFESHCFVRPGELRPGATPTVALNHNDTNIFLSDYATDPTTSYAGNQIKDEPMDGDETLLV

Similar Transcription Factors

Sequence clustering based on sequence similarity using MMseqs2

100% Identity: iTF_00481571;
90% Identity: iTF_00538995;
80% Identity: -