Basic Information

Insect: Drosophila prosaltans
Gene Symbol: -
Assembly: GCA_018151275.1
Location: JAECWY010001382.1:1124359-1138850[-]

Transcription Factor Domain

TF Family: THAP
Domain: THAP domain
PFAM: PF05485
TF Group: Zinc-Coordinating Group
Description: The THAP domain is a putative DNA-binding domain (DBD) and probably also binds a zinc ion. It features the conserved C2CH architecture (consensus sequence: Cys - 2-4 residues - Cys - 35-50 residues - Cys - 2 residues - His). Other universal features include the location of the domain at the N-termini of proteins, its size of about 90 residues, a C-terminal AVPTIF box and several other conserved residues. Orthologues of the human THAP domain have been identified in other vertebrates and probably worms and flies, but not in other eukaryotes or any prokaryotes [1].
Hmmscan Out: # of c-Evalue i-Evalue score bias hmm coord from hmm coord to ali coord from ali coord to env coord from env coord to acc

1 31 4.1e-15 1e-11 45.6 4.4 1 86 596 668 596 669 0.85

2 31 1e-14 2.7e-11 44.3 5.2 1 87 696 765 696 765 0.83

3 31 3e-15 7.8e-12 46.0 0.3 1 87 788 860 788 860 0.84

4 31 6.2e-16 1.6e-12 48.2 5.5 1 87 969 1039 969 1039 0.82

5 31 4.9e-15 1.3e-11 45.3 3.2 1 86 1063 1134 1063 1135 0.81

6 31 5.6e-13 1.4e-09 38.7 0.6 1 87 1170 1238 1170 1238 0.81

7 31 8.1e-11 2.1e-07 31.8 1.6 1 86 1281 1350 1281 1351 0.77

8 31 2e-16 5.2e-13 49.7 0.4 1 86 1378 1447 1378 1448 0.83

9 31 1.4e-12 3.7e-09 37.4 2.3 1 86 1469 1538 1469 1539 0.81

10 31 7.2e-15 1.9e-11 44.8 1.6 1 86 1566 1637 1566 1638 0.85

11 31 5.3e-13 1.4e-09 38.8 2.0 1 85 1718 1786 1718 1788 0.82

12 31 1.4e-12 3.5e-09 37.5 0.1 1 86 1812 1880 1812 1881 0.82

13 31 7.1e-14 1.8e-10 41.6 2.8 1 87 2007 2076 2007 2076 0.80

14 31 3.8e-11 9.9e-08 32.8 0.3 1 86 2161 2227 2161 2228 0.82

15 31 0.028 72 4.4 0.0 1 58 2247 2294 2247 2317 0.73

16 31 1.1e-12 2.8e-09 37.8 0.2 1 86 2324 2393 2324 2394 0.83

17 31 7.5e-14 1.9e-10 41.5 1.2 1 87 2460 2530 2460 2530 0.82

18 31 1.8e-12 4.7e-09 37.1 0.6 1 86 2565 2636 2565 2637 0.80

19 31 9.1e-11 2.4e-07 31.6 0.7 1 87 2649 2722 2649 2722 0.78

20 31 4.6e-13 1.2e-09 39.0 0.2 1 86 2748 2820 2748 2821 0.81

21 31 2.5e-07 0.00066 20.6 0.5 1 58 2857 2908 2857 2925 0.86

22 31 6.6e-13 1.7e-09 38.5 0.1 1 87 2946 3018 2946 3018 0.81

23 31 8.4e-17 2.2e-13 51.0 2.6 1 86 3070 3141 3070 3142 0.83

24 31 4e-05 0.1 13.6 0.2 1 58 3173 3222 3173 3241 0.78

25 31 3.4e-13 8.7e-10 39.4 0.3 1 87 3260 3332 3260 3332 0.82

26 31 8.7e-15 2.2e-11 44.5 0.4 1 87 3475 3548 3475 3548 0.83

27 31 1.7e-12 4.5e-09 37.2 2.4 1 86 3613 3683 3613 3684 0.81

28 31 8.3e-15 2.1e-11 44.6 4.5 1 86 3787 3857 3787 3858 0.85

29 31 5.9e-13 1.5e-09 38.6 0.1 1 86 3938 4007 3938 4008 0.85

30 31 1.7e-11 4.5e-08 33.9 0.6 1 58 4034 4083 4034 4094 0.88

31 31 8.5e-11 2.2e-07 31.7 1.1 18 87 4100 4159 4089 4159 0.77

#	of	c-Evalue	i-Evalue	score	bias	hmm coord from	hmm coord to	ali coord from	ali coord to	env coord from	env coord to	acc
1	31	4.1e-15	1e-11	45.6	4.4	1	86	596	668	596	669	0.85
2	31	1e-14	2.7e-11	44.3	5.2	1	87	696	765	696	765	0.83
3	31	3e-15	7.8e-12	46.0	0.3	1	87	788	860	788	860	0.84
4	31	6.2e-16	1.6e-12	48.2	5.5	1	87	969	1039	969	1039	0.82
5	31	4.9e-15	1.3e-11	45.3	3.2	1	86	1063	1134	1063	1135	0.81
6	31	5.6e-13	1.4e-09	38.7	0.6	1	87	1170	1238	1170	1238	0.81
7	31	8.1e-11	2.1e-07	31.8	1.6	1	86	1281	1350	1281	1351	0.77
8	31	2e-16	5.2e-13	49.7	0.4	1	86	1378	1447	1378	1448	0.83
9	31	1.4e-12	3.7e-09	37.4	2.3	1	86	1469	1538	1469	1539	0.81
10	31	7.2e-15	1.9e-11	44.8	1.6	1	86	1566	1637	1566	1638	0.85
11	31	5.3e-13	1.4e-09	38.8	2.0	1	85	1718	1786	1718	1788	0.82
12	31	1.4e-12	3.5e-09	37.5	0.1	1	86	1812	1880	1812	1881	0.82
13	31	7.1e-14	1.8e-10	41.6	2.8	1	87	2007	2076	2007	2076	0.80
14	31	3.8e-11	9.9e-08	32.8	0.3	1	86	2161	2227	2161	2228	0.82
15	31	0.028	72	4.4	0.0	1	58	2247	2294	2247	2317	0.73
16	31	1.1e-12	2.8e-09	37.8	0.2	1	86	2324	2393	2324	2394	0.83
17	31	7.5e-14	1.9e-10	41.5	1.2	1	87	2460	2530	2460	2530	0.82
18	31	1.8e-12	4.7e-09	37.1	0.6	1	86	2565	2636	2565	2637	0.80
19	31	9.1e-11	2.4e-07	31.6	0.7	1	87	2649	2722	2649	2722	0.78
20	31	4.6e-13	1.2e-09	39.0	0.2	1	86	2748	2820	2748	2821	0.81
21	31	2.5e-07	0.00066	20.6	0.5	1	58	2857	2908	2857	2925	0.86
22	31	6.6e-13	1.7e-09	38.5	0.1	1	87	2946	3018	2946	3018	0.81
23	31	8.4e-17	2.2e-13	51.0	2.6	1	86	3070	3141	3070	3142	0.83
24	31	4e-05	0.1	13.6	0.2	1	58	3173	3222	3173	3241	0.78
25	31	3.4e-13	8.7e-10	39.4	0.3	1	87	3260	3332	3260	3332	0.82
26	31	8.7e-15	2.2e-11	44.5	0.4	1	87	3475	3548	3475	3548	0.83
27	31	1.7e-12	4.5e-09	37.2	2.4	1	86	3613	3683	3613	3684	0.81
28	31	8.3e-15	2.1e-11	44.6	4.5	1	86	3787	3857	3787	3858	0.85
29	31	5.9e-13	1.5e-09	38.6	0.1	1	86	3938	4007	3938	4008	0.85
30	31	1.7e-11	4.5e-08	33.9	0.6	1	58	4034	4083	4034	4094	0.88
31	31	8.5e-11	2.2e-07	31.7	1.1	18	87	4100	4159	4089	4159	0.77

Sequence Information

Coding Sequence: ATGTCACAACATAATCCACATTATCATCCCCACCCCCATCCCCTACACTATCAGCAACAACAGCAGCAGCAGCAGCTGCATCACCACCATACCTCTCTTCAACAGCAACAACATAAACAAATACAACACAGCAATTGGTACTCACATGTTGCTTCCACCTCTTCCGCTCCCTACCCTCATCACCCCTCCTCGACCACCTCATCGGTGGCGGCGTCAACTTCAGGCGCTAACAACAATCACATAATGAATGCCTATGGAACACATGGATATTATGGTGCCGCTGGCGGTGGCCTCAATGTCAATGCTGTGGGTGTAGGTGTTGGGGGTGGTGGTGGTGGGGGAAGTTCAAACAGTTATANNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNTGGGAGGTCATCATCATGGTATATATCCCTATATTAAAAGTGAACCCATGGAATATAGCCATAACACAATGGCTCCACCTCCAGCACCTACTACAGCAACCGCAGAAATGAGAATTAAATCGGAACCCATTGACGAACTGGCCTACAAATCGTCCAATTATATTGATGATAATACTCCATTTGCTGACTTTTCGAAATATAATGAATTTAGTGAGAATATGTTGAGTCCCAAAGTGGAATTAACTGTGAAAAATGAATCACCCTACGGCAAGCATCCTAATAATTATCCACGGCGTAAATTACAAACGGAACGCTCATCGGAAAATTTACCCATATGTCAACGTTGCAAAGAAGTCTTCTTCAAGAAGCAATCGTATCTACGTCATGTGGCCGAAAGTAGTTGTAGCATCCAGGAATATGAATTCAAATGCAACATTTGTCCCATGTCCTTTATGAGTGGCGAAGAATTGCAAAGGCATAAACATCTCCATCGGGCTGATAAATTCTTTTGTCATAAATATTGTGGAAAATATTTTGATACAATTGCCGAATGTGAATCCCATGAATATATGCAACATGAATATGATAGTTTTGTTTGTAATATGTGTTCGTTGACATTTGCCACCAGGGAGCAGCTTTATACCCATTTACCACAACATAAGTTCCAGCAGCGTTACGATTGTCCCATTTGTCGTTTATGGTATCAGACGGCTGTCGAACTCCATGAGCATCGTCTGGCGGCACCTTACTTCTGTGGNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNGGATTGTCATATGGCTACCATGGAAATGCCCACAGCACCACCACCGCCATCATCAGCGGTAACACATCACAAGTCTAATGCATCCGGAACATCTTCTACATTACCAGCAACGGCAGCTTTGAGTTCTCTGCTCCAACAACGTCAGGCCAATGCAGATGGTGCGGCCATGTTTGCTGCTGCTGCCTCCTCAACATCCCTCAAAGGGGAAGTCAACGTGAAGTTGGAACGAAGTTATAGCAACTCCACAAGTGACTCTTCATTTGGTGGAATGCATGAAGCCAACTATAATAATAATAATAATGCCTATGGCAGTGATAATTCCATTCATGGATCTGGTGCCGTTGGTGGGCCACAAGCTCATTCCTCAACGCTGGATGACTCTGAGGATGCTCTATGCTGTGTGCCCATGTGCGGTGTAAGCAAAAGCACTAGTCCCACTCTCCAGTTCTTCACATTCCCCAAAGATGACAAATATCTCCATCAATGGCTACACAATTTAAAGATGTTCCACATACCCGCCTCAAGCTATTCGACATTTCGTATCTGTAGCATGCATTTCCCGAAACGTTGCATCAATCGGTATTCGTTATGCTATTGGGCAGTGCCTACCTTCAATTTGGGACACGATGATGTCGCCAATCTCTATCAGAATCGCGAGCTAACAAATACCTTTACCACCGGCGAGGTCGCACGCTGCAGCATGCCGCACTGTAATAGCCAGCGGGGTGAGAGTAATCTCAAGTTCTATAACTTTCCCAAGGATATTAAAAGTTTAATCAAATGGTGTCAGAATGCTCGGCTGCCTGTTCAGGCCAAGGAGCCCCGACACTTTTGTAGCCGTCACTTTGAGGAGCGTTGCATTGGCAAATTTCGTTTAAAACCCTGGGCAGTGCCCACACTACATCTGGGTGGTGCCCAATATGGGAAAATCCATGATAATCCCAAAAATTTGTATGTAGAGGAGAAGCGCTGTTGTCTTAACTTTTGTCGTCGCAGCCGTTCAACGGATTTCAATATGTCGCTTTATCGTTTCCCAAGGAATGAGGTATTATTACGACGCTGGTGCTATAATCTGCGACTCGATCCGGGTGTATATCGGGGCAAGAATCATAAAATATGCAGTGCACACTTTATTAAAGAGGCATTGGGTTTAAGAAAACTGTCGCCGGGTGCTGTTCCTACACTTCATTTGGGTCACAATGATACCTTTAATATCTATGAAAATGAATTATGGCCACCGCCGACGCCAAGTTCCTCAACGCCANNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNTAGCTCAACTTCGCACTACGTGGATCCGGATAATATGGGCAGCGGAGCATATCATGGCATGGGTGGTGCTAACTCCCTTTCCGGTGGAATGAATGTCAGCGATAGCATGGACATTTGCTGTGTACCAAGTTGTGAGAGTAAGCGACATAATAGCGAGAACATCACATTCCATACGATACCCAGAAGGCCCGAGCAGATGAGGAAATGGTGTCACAATTTAAAAATACCCGAGGATAAAATGCACAAGGGCATGCGGATATGTAGTCTACATTTCGAGCCGTATTGCATTGGCGGCTGCATGCGTCCATTTGCAGTGCCAACTCTTCATCTGGGACATGACGATAAGGATATTCATCGTAATCCGGATGTGATTAAGAAACTTAATATAAGGGAAACTTGTTGTGTGGCAGTCTGTAAAAGGAATCGTGATCGTGATCATGCCAATCTCCATCGGTTCCCTAGCAATGTGGCCCTATTAACGAAATGGTGTGCCAATCTGCAAAGGCCTGTCCCAGATGGCAGTAAACTCTTTAACGATGCCATATGCGAAGTGCATTTCGAAGATCGTTGTTTGCGCAACAAGAGATTGGAGAAATGGGCAGTGCCGACGTTAATGTTGGGTCATGAGGATATTGCGTATCAGTTGCCCACATCCGAGCAAGTGGCAGAGTTCTATGCACGTCCAAATGCACCGAATAATGGCGAGGAGCAGGGAGAATGTTGTGTGGAAAGCTGTAAGCGTAATCCCAGTGTGGATGACATAAAACTATATCGTCCACCCGAAGAGTCAGATATACTGGCCAAATGGGCGCATAATCTTGAACTGGATGTGGCCGAGTTGCCAAATATGAGGATATGCAATCTACATTTCGAATCCCATTGCATTGGTAAACGGATGAGACCGTGGGCCATACCAACATTAAACCTATCTTCTAATATTGAGAATCTGTACGAGAATCCAGAGCACTCAATGTTGTACAAGAGGAGAACGAAGCGAGATCCAAATCGAGACGTATCCCTAGCGGCAACGAAACCAACTTGGGTTCCTAGATGCTGTTTGCCGCATTGTCGCAAGGTCCGAGCTCTGCATAATGTTCAACTCTATCGATTCCCCAAACTGAATCGTTCCACATTGGCCAAATGGGCACACAATCTACAAGTGCCAATGGTGGGCAGTGCCCAACGGAGACTCTGTTCGGCACATTTCGAACCTCATGTATTAAGTAAAAAGTGCCCTGTACCATTGGCTGTACCCACGATCGATTTAAATGCCCCGCCAGGTTACAAAATCTATCAAAATCCAGCCAAACTTAAAGCCAGCAAATTGTGCCTGCAAAGAGTTTGCATTGTGGAGAGTTGCCGTCGCACCAGGGCTCAAGGAGTCCAGCTCTTCCGTTTGCCTCACAGTCCGACGCAGTTAAGGAAATGGATGCACAACATCAAGACACGCCCACGGGCAGCTACAAGGTCGCAGTATCGCATCTGTTCGATACACTTTGAATCGCATTCGTTTAATGGCAAAAGATTAAGTGCTGGAGCCATTCCCACCTTGGAATTGGGTCATGACGATGACGACATCTATCCAAATGAGGCGCAAGCATTTGTGGATGAGCATTGTGTGGTCGAGAGTTGTGAATCGTCAAAGGATCAACCCGAAGTGCGTCTATTCCGTTTCCCCACCGAAGATGATGATCTTCTGTGGAAATGGTGCAACAATCTCAAAATGAATCCAGTTGATTGTGTAGGAGTGCGTATTTGTAATAAACATTTTGAAGCTGATTGCATTGGTCCCAAACACCTATTCAAATGGGCCATACCCACTATGGAGCTGGGACACGATGATAGTGAAATCGAACTGATACCAAATCCCAAGCCTGAAGAGCGATATGTTGATCCAGTTTTTAAGTGTTGTGTACCAACTTGTGGCAAGACCAGGAAATTTGATGAGGTGCAAATGAATAGTTTTCCGAAAGATCCTTTGCTCTTCCAGCGCTGGCGTCACAATCTGCGTTTGGATCACCTGAATTTTAAGGAGCGGGAACGCTACAAGATTTGCAATGATCACTTTGAGGATGTTTGCATTGGCAAAACTCGGCTTAATATAGGCTCCATACCCACCCTTCAGTTGGGTCACAATGAGACGGAGGATCTGTATCAAGTCAATCCTGCGGAATTGCAAAGTAATCTCTTTGGCAGACCACGTAGATTACATGGTGGGGTTGACATTAAGCTAGAATATGCGGAGGATTCCGAGGCGGAATCAGGACTGCAGGATGTTAAACCAGATATCTATGAGATGGCCGAAGCCACCGATATAAATATCAGGCAGGTGAAGATTAAGAAATCTCTCGCTGATCTAAAGTGTTGTGTACGCAGCTGTGGTCGTAGTCGCCTGGAGCATGGTGCTCGCCTCTTCCCCTTCCCCAATGGCAAGCAACAGAATCTGAAATGGCGTCACAATCTCCAACTTGAACCGGAAGAAGTGGACAAAATGACACGCGTCTGCAGTGCCCATTTCAATCGGCGTTGCATAGATGGCAAACATCTGCGGGGATGGGCCATACCCACACAACAATTGGGACACCATCATGAACAGCCAATTTATGAAAATCCCAAGAATATTCCAGGCTTCTTTACCCCAACATGTGCCCTAAGCCACTGTAGACAGAGGCGAAGCATTGATAATGATTTGCGCACCTATCGTTATCCGAGAAGTGAGGATCTATTAGAGAAATGGCGTGCTAATTTACGCTTGGCGCCAGATCAATGCCGTGGACGGATTTGTGCTGATCACTTTGAGCCGATGGTTAGGGGTAAACTGAAATTGAAGACTGGAGCAGTGCCCACTCTGAAATTAGGACATGATGAGGAATTAGTTTACGATAATGAAGCTATCAAAGCTAATCTAGTGGATGAAGAGGATGTCAGTTTGGAATCACCACCGCAAGTAATAACTAAAAAGGAGATTTTGGAAGAGGAAGATGATGAAGAAGATCTGCAAGAGCATGAGGATGATGATGAGGAGGAGGAGGAGGAAGAAAACGATCCACCAGAAGAGGATTCACATTCCGATTATTTCGATCCCCTAGAATTGGTAGAGACATATGCCGATGATCAAGTACCAGAAGATGAATATAGTGCACCCGCTCATCAACTCCCGGCACCACCATCAATAGCTGCTCCACCTTTTGGCAGGCGTGAAAAGGTAGCGAATAATGTAACACCCATTTGTTGTTTGAAGCATTGTCGAAAGGAACGCACTCCTACCCATCACTTGAGTACTTTTGGCTTTCCCAAAGATCATCAGCTTTTGCTGAAATGGTGTGCCAATCTTCACCTGGAACCCATGGATTGTGTGGGACGTGTTTGCATTGAGCATTTTGAAGCGGAAATGTTGGGAACACGCAAGCTAAAGCAAAATGCTGTTCCCACCATTAATGTGGGACATCAGATGCCTTTACCGTATACCTGCAATGGCCAGGAGCGTAGCGATGAGAAGGAGGATAATTCGGTTTTTCGGCTTTGGAGCCTGAAACATTGTCGCAAGAGGAAACTAATGGAACCACCAGATATTCGCCTAAAAGTGGAGAAGATGGATCCGATGGGACTAGTGAAAGTGAAGAAGGAGAAAATGGAAATGGAGGAGATGGAGGAGAAAGAGACGATGATGATGATGACTAAACCTAAGAGATGTTGCCTTAACCAATGTGAGCAAACTGCAGAATTGCAGAAATTTCCAAGAGATTTCAATTTGCTAAGAAAATGGTTGCACAACCTCAAGTTGACCCTTAACGAGGATTTGGATCCCTCACAGCTGCGTTTGTGTCTAAGGCACTTTGAAGGTCATTTGGTACGAAATGGACATCTTTCAAAAGAGGCATTACCCACTCTGGAACTGGGTCATCAGGATAAGAATATTTATAGAACAACTGTAGCAACTTCTGGTGGTTGCTTGGTGGCCAGTTGTCCATGTGCTCGTCTCAATCTCTATCGAAGTTATGCTCTACCCAAGGAGCCCTATATTAAAGAGGCGTGGCTAAACTATCTAAAGCTGCCGGCAATCACCCATGGACAACTCTGTGTTATGCACTATATGCAACTGTACGAGGAGATGCCCTTCAAGGAATTGCGTCATATCTATGAATCCATTGCCAATTCCACACAAGCTCTGAAATTGCGCTGTGCCGTACCCGGTTGTCGATCAAAGTACACGGATAATATACACTTGACCAAGTTGCCGCAAAATCAAAGCTTACTTACCAAATGGTTGCATAACACCATGTTGACCTATGATCCCAGCAAACATTCAATTTATCGCATTTGTTTGCTGCACTTTGAGCCATTCGCATTGGGTCCAGCATGTCCCAAGCCATGGGCAGTACCCACCTTGGAATTAAATTATCAGAATGACATTTATTTGAATCCTTCGAAAGAGGAATTGGCTAACATAACAGACTATCCCCGAATTAGTACTCCGCTGCAAATTAAAACAGAATTTACTTTACCATTGAGAATAAAAACGGAATTAGCCGCCTTAAGCAGTCCCAGTGTTGGTTCCACACCTAGTCCACGGGGCAAGGTTAGAATTTGTTGCATACAATCATGTCTGCAGCAGGCGAACTCCCAGTTGCGTCTCTATCGTTTTCCCAATACAGAATCCGCTCTACTCAAGTGGCTGGTCAATACGCAGCAGCAACCACGTCTTGTGGATCCCACACAGTTGTATGTGTGTCAATCCCACTTCGAACTTGAAGCTATCTGTAAGAAACAATTGAGAAGTTGGGCTGTGCCCACATTAAATTTAGGACATGATGGTCATGTCATACCCAATGCCAGGCATAATGGAAATATTGCCGATAGCCAGGAAACGGAACAGGCAATGGAATTTATTAGGGAAAACTATTGTTCCGTGCTAAGTTGCTTTCAGCCAAAGAGTGAGGCTCTGCGTTTGCATCCCTATCCCAAGGATATGCCTACCATACGGAAATGGGCTGCCAATTGTAAGCATCGTTCCATGCAGGCCAGCAGTCATGGATTCCAGGTCTGTCAATTGCATTTTGAAGCAGATTGCTTTGATCCGGATACAGGTGACTTACGTGAGGGATCTGTACCCACTCTGGATCTAACAGTGACTCGGCTAAACAGCGAGTTGCGTTGCCTGGTCACTAGCTGTGTCAAAGATGAAACTCAGCCGCGACGTCGTTACTACAAACTACCTAAGCGACCAGCTCTGCTCAGTGAATGGTGCAGAAATCTCGGTTTAGTTCCTTCTGGACTCCTACATGGTGCTGATCATCACGTTTGCGAACGTCACTTTGAATCTCGTTGCTTCAACATCCACAAACAGTTGCGTTCAGGATCACGTCCGACCCTGAATTTGGGTCACAATGAAAATATTACGTTGCTGCCAAATCCAGAGATATTCTGTGATGAGATTGACGACGTCAGTACTTGCTCTGTGCCAAATTGTGGTCAATCCAAGCTAACGGATGAAACACTTCAACTAAATAGTTTGCCCAGAATGCGTAAGTTGGCGGAGAAATGGTTGCATAATCTGCATCTACCATACACTGGAAAGGAGCAACTGGCCAAGTTTCGTGTCTGCCAGAAACACTTTGATCCATCTTGCTTTGAAAACGGGTTTTTGCGTCAGGGAGCCCTGCCCACCTTGGAGTTGGGTCATGAGTCTGTGGACATTTATCAAACAGATGACCAGAGTGTGGGCAAATACAGGAAGCACCAAAAAGTATTGCCTGGCGTACGTGTATCGGGGCACGACTGTTGTTATCCCCAATGTGTGCAACAGCAAAAGAATTACCAACGAATGGTGTACGACTTGCCCAAAGAGGAGAAGCTGCGTCAGAGATGGCTACAGCATTTGGAAATTGATGAAAGAGAAAGGGAAAGACCTTTGATATTATGTCCACTCCATTATATATTCCTATACGATTATAGTGTGAAAAACTTTGAAGAACATGTTCCAAATGATCTGCTGGAAAGCAACTATGAAGATGCAAGAAATGGCTCTAGAATCCGGCTTATCAGTTGTGCTGTGCGAGGATGTGGAACACTTCAGCCACGTGATGGTGGCAGATTGCATGGTCTGCCCACGAATCCAGAGATCTTCCAGATGTGGTTGGATAACACTGAATTGGTTGTATATGAGCCACAGCGTTACATGATCAAAGTCTGTAGCAAACACTTTGAGTCTATATGTTTTACGGATATTCGCAAATTGAAATGCTGGAGTGTGCCCACTCTTCATCTACCCGGTGAGGCAGTACATCAAAATCCAACCGAAGAGGAATGGTTAAAGATAAACGAAAGAATAGCTGTATCAGCCGCTCAGCCCGGAGAACCCTGTGAGGACAATTCAATGCTGGAACCAGTTGTTATAATGGAAGAAGAGGACTGTGTCTGTTGTGTACCCAATTGTGGACGGTCCAAGCAAATGGATAATTCCATTCAGTTTACAAGCTTCCCCAAGAACAACATGCTGGCCGAGAAATGGATTCTTAATTTTCATCTGAAAGTGACCAAAGATCAGTGGTCCAATCTTCGTGTATGCAATCGGCATTTTGAGGCAACTTGTTGGGAAAATGGTCGATTGCGAAGGGGAGCCATGCCAACCCTAGAATTGGGTCATGAGAGCAGTGATATTTATCGAACCGAGGAGCTAGATCTCTTCAAGAGTCGCAAGCAAACCAAGAGGACATATGGCCAGGGATGTTGTTTTCCTCAGTGCGTGGAACTTTTAAAGAATTTCCAACGTATGGTCTATGATTTGCCAAGAGAAGCTCAACTGCGACAACGCTGGTTACAATATATGGAATTGACGGAATCAGAGCAGCCATTAAAAATGTGCCCACTCCATTATATTATTATATATGATCACAGTGTGAAAAACTTTGAGGAACATGCTCCGGAAAAGCTGCTTGATTTTAATTATGAAAATGCTAGAAATTGTGTGAGAATTCGGATTATTAGCTGTGCGGTGGAAGGATGTAATACACTGCAGCCACGAGACGGAGGTCGCATGCATGGTCTGCCACCAAGATCAGATATACTCCAGATGTGGCTGGACAACACAAGATTAGTCTTCCATGAGCATCAACGTTACATGCTAAAAGTGTGCAGTAAGCATTTTGAGCCAAAATGTTTTACGGATATTCGTAAATTGAAGAGCTGGAGTATTCCGACGCTTCATCTGCCCGATGAGGTTGTGCATCAAAATCTCACCGAAAGAGAATGGCAGCAAATGAATGAGAGACTTGCCGTGCAAAACAATCGGGAAGAGGAAAGTTTTGATGAAAATTCAATGCTAGAACCGATTGTTATGATGGAGCACGCCGAATCCGAAGCGGAGCTGGAGGAGCAAGTCGAAACGATGCCTCAGCAAAAACTAGTGCCCCATGATAAATTAAAGCAAGAGTCCCAAGATGATAATGGCAATAATGATGATGAAATGCAAGCATTGGAAGTACTCCTCGAAGTGGGTCATGTTGAAAAGTGTTCCAGCTATGAGAAAATGGACAATAAATCACATTTACCATACTCCGAGACGAGTCCATTGAGTCCTTCGATGGGATCTATGCCACCGGGTCAACGCGGTGGTCATTATAATGCTCGTCACTGCAGTGTCCAGGGCTGTCAGATAACTGCCAATGATGTAGACGGTAATATCAAGCTGCACAAGTTCCCCACCTCCGTGGAGGCCACTGAAAAGTGGATGCATAACACCCAGGTAGATGTGGATGAGAACTATTCCTGGCGGTATCGCATTTGCAGTTACCATTTCGAACAGGAATGCTTCAATGGGGCCCGTATACGGCGGGGATCTATGCCCACATTGCATTTGGGTCCACTTCGACCCAAGGATATCTTTAGGAATGAGTTCCCGCAATTGGAAATGGATGAAACTATGGAAGAATCAATTCCTAAAGTTACTCCCACTGTTGAACAGGAACCTGGGGCTCAGCCTATAAAGAGTAAGGTGACACAACTATGCCTGCCACGTCCTGCTCCGCCTCGAAAATCGAGCAAATTCTGTCAGATTGAAGGCTGTTCGAATCATTTGACCAGCGAGAATATGACTTTGCACAAGTTTCCCCACTCCCTGGATATGTGTGCCCGCTGGCAGCACAATACTCAGGTGCCATTTGATCCAGAGTATCGTTGGCGCTACCGCATCTGTAGTATCCATTTTCATCCAGTCTGTTTGGTCAATATGAGATTATTGCATGGCAGTGTGCCTACTTTAAAACTGGGCCCTAGAGCTCCCGCTCAACTGTTTGACAATGATTTCGATGCCATTAACATGAGATTGGATAAGAGATCACATTTGGAGCAGGGAGGTAGCAAGGTCAAGCAAGAGAGACCCCACCATCAACAGCAATCCGATGAATTCTATTTAGAGCCAGAAATGGAAATGGAAGTAGATGATGAGGGGCAAGACCCAGATCAATCCCAATCCATGACATCATTTGAAAGCTGGAGACATCAACTTCGCCTACCAACTGTTAAGCAAGACAAGGTCGCCTACAATCCCATCAAATCTGGCTACGATAAATGCTCCCTAACACACTGTCAGCGTCAGAGATCCCTGCATGGCGTCCACATATACAAATTCCCACGATCGAAACGCCATCAGCAGCGATGGATGCACAATTTGCGCATACGTTATGATGAGAAGAAACCATGGAAATACATGATCTGCAGTGTTCACTTTGAACCAAATTGTATACGCCTGAGAAAACTTCGTCCATGGGCTGTGCCCACTTTGGAATTGGGTTCGAATGTGGCAGATCAGATTTACACCAATGAACAGTGCCAGGAAATGGCTTCAGATGTGAGTGAAGAAGAGGAAACCGGACCAGAAGAAAGTGGACAAGAAGAAGATGATGACGATGAAGTAGATGACGATGGAGATACTGGTGCAGAGGCCTACATAAAGCGTGAAAGACGCCCTTGGGGAACGTCCGGAGCCGCCGGTGGTCAAATGGCTCCTTGGAAAGTAAAACAATGTTGTCTGCCCTATTGTCGTCGACCACGAGGGGATGGTATCAAACTATTCCGACTGCCCGGCAATCCTACTTCCATACGTAATTGGGAAAAGGCCACGGGGATGACATTTAAAGCATCGCAACGGAACACACGACTCATTTGTAGTCGTCACTTTGAGCCGGAATTGATGGGGGTACGCCGTTTGATGCGAAATGCCATACCCACCAGACATCTATATCACCAAAGGGAGAGCTATAGCCCAGAATTGGTGATACCCACAAACACTCCAACTCCTATTGGTCCCCGTTGCTGCATTCCTGATTGCCCCCCACACGATGGGTCGTCTCAACTTCATCGATTTCCCAGTGATCCACAACTGTTGAAGCAATGGTGTGAATCTCTTAAACTCACGGATTTCCAACGCTATAGTGGACAATACGTTTGCTCTAATCATCTTCCTGCCCTGGATTTAGCATGCATTATCTGTGGCGTGGAGGATATACAATTGCCGCTTCTTGATTTTCCCGAGAATCGCAATTATCGGGCTAAATGGTGTTATAATCTCAAAATTGAAACAATACCCAAATGGGACAACTCCAAGCATATTTGCTCGAAACACTTTGAATCCTATTGCTTCAGTCAGCAAACCGGTGAACTGCATCCAGAGGCAGCACCTACATTGCATTTAAATCACAATGATACGAATATATTCCTCAATGAGTATGCCATAGAACAGCATTCTTTGATGAGGATTAAAGACGAGCCCTTGGACAACGATGAGATGTTGTTGGCTTAA
Protein Sequence: MSQHNPHYHPHPHPLHYQQQQQQQQLHHHHTSLQQQQHKQIQHSNWYSHVASTSSAPYPHHPSSTTSSVAASTSGANNNHIMNAYGTHGYYGAAGGGLNVNAVGVGVGGGGGGGSSNSYXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXGGHHHGIYPYIKSEPMEYSHNTMAPPPAPTTATAEMRIKSEPIDELAYKSSNYIDDNTPFADFSKYNEFSENMLSPKVELTVKNESPYGKHPNNYPRRKLQTERSSENLPICQRCKEVFFKKQSYLRHVAESSCSIQEYEFKCNICPMSFMSGEELQRHKHLHRADKFFCHKYCGKYFDTIAECESHEYMQHEYDSFVCNMCSLTFATREQLYTHLPQHKFQQRYDCPICRLWYQTAVELHEHRLAAPYFCGXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXDCHMATMEMPTAPPPPSSAVTHHKSNASGTSSTLPATAALSSLLQQRQANADGAAMFAAAASSTSLKGEVNVKLERSYSNSTSDSSFGGMHEANYNNNNNAYGSDNSIHGSGAVGGPQAHSSTLDDSEDALCCVPMCGVSKSTSPTLQFFTFPKDDKYLHQWLHNLKMFHIPASSYSTFRICSMHFPKRCINRYSLCYWAVPTFNLGHDDVANLYQNRELTNTFTTGEVARCSMPHCNSQRGESNLKFYNFPKDIKSLIKWCQNARLPVQAKEPRHFCSRHFEERCIGKFRLKPWAVPTLHLGGAQYGKIHDNPKNLYVEEKRCCLNFCRRSRSTDFNMSLYRFPRNEVLLRRWCYNLRLDPGVYRGKNHKICSAHFIKEALGLRKLSPGAVPTLHLGHNDTFNIYENELWPPPTPSSSTPXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXSSTSHYVDPDNMGSGAYHGMGGANSLSGGMNVSDSMDICCVPSCESKRHNSENITFHTIPRRPEQMRKWCHNLKIPEDKMHKGMRICSLHFEPYCIGGCMRPFAVPTLHLGHDDKDIHRNPDVIKKLNIRETCCVAVCKRNRDRDHANLHRFPSNVALLTKWCANLQRPVPDGSKLFNDAICEVHFEDRCLRNKRLEKWAVPTLMLGHEDIAYQLPTSEQVAEFYARPNAPNNGEEQGECCVESCKRNPSVDDIKLYRPPEESDILAKWAHNLELDVAELPNMRICNLHFESHCIGKRMRPWAIPTLNLSSNIENLYENPEHSMLYKRRTKRDPNRDVSLAATKPTWVPRCCLPHCRKVRALHNVQLYRFPKLNRSTLAKWAHNLQVPMVGSAQRRLCSAHFEPHVLSKKCPVPLAVPTIDLNAPPGYKIYQNPAKLKASKLCLQRVCIVESCRRTRAQGVQLFRLPHSPTQLRKWMHNIKTRPRAATRSQYRICSIHFESHSFNGKRLSAGAIPTLELGHDDDDIYPNEAQAFVDEHCVVESCESSKDQPEVRLFRFPTEDDDLLWKWCNNLKMNPVDCVGVRICNKHFEADCIGPKHLFKWAIPTMELGHDDSEIELIPNPKPEERYVDPVFKCCVPTCGKTRKFDEVQMNSFPKDPLLFQRWRHNLRLDHLNFKERERYKICNDHFEDVCIGKTRLNIGSIPTLQLGHNETEDLYQVNPAELQSNLFGRPRRLHGGVDIKLEYAEDSEAESGLQDVKPDIYEMAEATDINIRQVKIKKSLADLKCCVRSCGRSRLEHGARLFPFPNGKQQNLKWRHNLQLEPEEVDKMTRVCSAHFNRRCIDGKHLRGWAIPTQQLGHHHEQPIYENPKNIPGFFTPTCALSHCRQRRSIDNDLRTYRYPRSEDLLEKWRANLRLAPDQCRGRICADHFEPMVRGKLKLKTGAVPTLKLGHDEELVYDNEAIKANLVDEEDVSLESPPQVITKKEILEEEDDEEDLQEHEDDDEEEEEEENDPPEEDSHSDYFDPLELVETYADDQVPEDEYSAPAHQLPAPPSIAAPPFGRREKVANNVTPICCLKHCRKERTPTHHLSTFGFPKDHQLLLKWCANLHLEPMDCVGRVCIEHFEAEMLGTRKLKQNAVPTINVGHQMPLPYTCNGQERSDEKEDNSVFRLWSLKHCRKRKLMEPPDIRLKVEKMDPMGLVKVKKEKMEMEEMEEKETMMMMTKPKRCCLNQCEQTAELQKFPRDFNLLRKWLHNLKLTLNEDLDPSQLRLCLRHFEGHLVRNGHLSKEALPTLELGHQDKNIYRTTVATSGGCLVASCPCARLNLYRSYALPKEPYIKEAWLNYLKLPAITHGQLCVMHYMQLYEEMPFKELRHIYESIANSTQALKLRCAVPGCRSKYTDNIHLTKLPQNQSLLTKWLHNTMLTYDPSKHSIYRICLLHFEPFALGPACPKPWAVPTLELNYQNDIYLNPSKEELANITDYPRISTPLQIKTEFTLPLRIKTELAALSSPSVGSTPSPRGKVRICCIQSCLQQANSQLRLYRFPNTESALLKWLVNTQQQPRLVDPTQLYVCQSHFELEAICKKQLRSWAVPTLNLGHDGHVIPNARHNGNIADSQETEQAMEFIRENYCSVLSCFQPKSEALRLHPYPKDMPTIRKWAANCKHRSMQASSHGFQVCQLHFEADCFDPDTGDLREGSVPTLDLTVTRLNSELRCLVTSCVKDETQPRRRYYKLPKRPALLSEWCRNLGLVPSGLLHGADHHVCERHFESRCFNIHKQLRSGSRPTLNLGHNENITLLPNPEIFCDEIDDVSTCSVPNCGQSKLTDETLQLNSLPRMRKLAEKWLHNLHLPYTGKEQLAKFRVCQKHFDPSCFENGFLRQGALPTLELGHESVDIYQTDDQSVGKYRKHQKVLPGVRVSGHDCCYPQCVQQQKNYQRMVYDLPKEEKLRQRWLQHLEIDERERERPLILCPLHYIFLYDYSVKNFEEHVPNDLLESNYEDARNGSRIRLISCAVRGCGTLQPRDGGRLHGLPTNPEIFQMWLDNTELVVYEPQRYMIKVCSKHFESICFTDIRKLKCWSVPTLHLPGEAVHQNPTEEEWLKINERIAVSAAQPGEPCEDNSMLEPVVIMEEEDCVCCVPNCGRSKQMDNSIQFTSFPKNNMLAEKWILNFHLKVTKDQWSNLRVCNRHFEATCWENGRLRRGAMPTLELGHESSDIYRTEELDLFKSRKQTKRTYGQGCCFPQCVELLKNFQRMVYDLPREAQLRQRWLQYMELTESEQPLKMCPLHYIIIYDHSVKNFEEHAPEKLLDFNYENARNCVRIRIISCAVEGCNTLQPRDGGRMHGLPPRSDILQMWLDNTRLVFHEHQRYMLKVCSKHFEPKCFTDIRKLKSWSIPTLHLPDEVVHQNLTEREWQQMNERLAVQNNREEESFDENSMLEPIVMMEHAESEAELEEQVETMPQQKLVPHDKLKQESQDDNGNNDDEMQALEVLLEVGHVEKCSSYEKMDNKSHLPYSETSPLSPSMGSMPPGQRGGHYNARHCSVQGCQITANDVDGNIKLHKFPTSVEATEKWMHNTQVDVDENYSWRYRICSYHFEQECFNGARIRRGSMPTLHLGPLRPKDIFRNEFPQLEMDETMEESIPKVTPTVEQEPGAQPIKSKVTQLCLPRPAPPRKSSKFCQIEGCSNHLTSENMTLHKFPHSLDMCARWQHNTQVPFDPEYRWRYRICSIHFHPVCLVNMRLLHGSVPTLKLGPRAPAQLFDNDFDAINMRLDKRSHLEQGGSKVKQERPHHQQQSDEFYLEPEMEMEVDDEGQDPDQSQSMTSFESWRHQLRLPTVKQDKVAYNPIKSGYDKCSLTHCQRQRSLHGVHIYKFPRSKRHQQRWMHNLRIRYDEKKPWKYMICSVHFEPNCIRLRKLRPWAVPTLELGSNVADQIYTNEQCQEMASDVSEEEETGPEESGQEEDDDDEVDDDGDTGAEAYIKRERRPWGTSGAAGGQMAPWKVKQCCLPYCRRPRGDGIKLFRLPGNPTSIRNWEKATGMTFKASQRNTRLICSRHFEPELMGVRRLMRNAIPTRHLYHQRESYSPELVIPTNTPTPIGPRCCIPDCPPHDGSSQLHRFPSDPQLLKQWCESLKLTDFQRYSGQYVCSNHLPALDLACIICGVEDIQLPLLDFPENRNYRAKWCYNLKIETIPKWDNSKHICSKHFESYCFSQQTGELHPEAAPTLHLNHNDTNIFLNEYAIEQHSLMRIKDEPLDNDEMLLA

Similar Transcription Factors

Sequence clustering based on sequence similarity using MMseqs2

100% Identity: iTF_00604131;
90% Identity: iTF_00483726; iTF_00591002;
80% Identity: -