Basic Information

Insect: Zaprionus capensis
Gene Symbol: -
Assembly: GCA_018903675.1
Location: JAEIFN010001071.1:512095-525495[+]

Transcription Factor Domain

TF Family: THAP
Domain: THAP domain
PFAM: PF05485
TF Group: Zinc-Coordinating Group
Description: The THAP domain is a putative DNA-binding domain (DBD) and probably also binds a zinc ion. It features the conserved C2CH architecture (consensus sequence: Cys - 2-4 residues - Cys - 35-50 residues - Cys - 2 residues - His). Other universal features include the location of the domain at the N-termini of proteins, its size of about 90 residues, a C-terminal AVPTIF box and several other conserved residues. Orthologues of the human THAP domain have been identified in other vertebrates and probably worms and flies, but not in other eukaryotes or any prokaryotes [1].
Hmmscan Out: # of c-Evalue i-Evalue score bias hmm coord from hmm coord to ali coord from ali coord to env coord from env coord to acc

1 28 1.5e-15 3.1e-12 47.0 4.0 1 86 364 436 364 437 0.85

2 28 2.4e-15 4.9e-12 46.3 4.6 1 87 464 533 464 533 0.83

3 28 5.8e-16 1.2e-12 48.3 0.4 1 87 555 627 555 627 0.85

4 28 3.8e-16 7.7e-13 48.9 5.3 1 87 732 802 732 802 0.83

5 28 6.9e-15 1.4e-11 44.8 3.5 1 86 826 897 826 898 0.82

6 28 9.3e-13 1.9e-09 38.0 1.0 1 87 933 1001 933 1001 0.81

7 28 6.8e-11 1.4e-07 32.0 1.2 1 86 1047 1116 1047 1117 0.76

8 28 5.5e-16 1.1e-12 48.4 0.1 1 86 1144 1213 1144 1214 0.82

9 28 3.1e-12 6.4e-09 36.3 0.7 1 85 1235 1303 1235 1305 0.79

10 28 2.8e-15 5.7e-12 46.1 1.5 1 86 1332 1403 1332 1404 0.85

11 28 8.2e-14 1.7e-10 41.4 1.5 1 85 1478 1546 1478 1548 0.81

12 28 3.2e-12 6.6e-09 36.3 0.1 1 86 1571 1639 1571 1640 0.81

13 28 1.2e-13 2.4e-10 40.9 1.8 1 87 1785 1854 1785 1854 0.81

14 28 9e-12 1.8e-08 34.9 0.2 1 61 1928 1981 1928 1999 0.77

15 28 0.055 1.1e+02 3.5 0.0 1 58 2014 2064 2014 2086 0.74

16 28 3.2e-12 6.6e-09 36.3 0.4 1 86 2103 2172 2103 2173 0.86

17 28 9.1e-16 1.9e-12 47.7 1.9 1 86 2237 2306 2237 2307 0.83

18 28 6.9e-13 1.4e-09 38.4 1.0 1 86 2342 2413 2342 2414 0.81

19 28 7.5e-13 1.5e-09 38.3 2.0 1 87 2424 2496 2424 2496 0.80

20 28 1.2e-15 2.5e-12 47.3 0.1 1 86 2526 2600 2526 2601 0.79

21 28 1.3e-05 0.026 15.2 0.2 1 58 2637 2691 2637 2711 0.84

22 28 4.2e-15 8.6e-12 45.5 0.4 1 86 2729 2801 2729 2802 0.82

23 28 2.1e-13 4.3e-10 40.1 2.3 1 86 2947 3019 2947 3020 0.82

24 28 4.1e-14 8.4e-11 42.4 2.5 1 87 3080 3151 3080 3151 0.82

25 28 6.8e-14 1.4e-10 41.6 3.3 1 86 3264 3334 3264 3335 0.84

26 28 8.1e-13 1.7e-09 38.2 0.0 1 87 3421 3491 3421 3491 0.84

27 28 4e-09 8.2e-06 26.4 0.3 1 58 3513 3561 3513 3569 0.84

28 28 2e-10 4.1e-07 30.5 1.8 18 87 3578 3636 3564 3636 0.75

#	of	c-Evalue	i-Evalue	score	bias	hmm coord from	hmm coord to	ali coord from	ali coord to	env coord from	env coord to	acc
1	28	1.5e-15	3.1e-12	47.0	4.0	1	86	364	436	364	437	0.85
2	28	2.4e-15	4.9e-12	46.3	4.6	1	87	464	533	464	533	0.83
3	28	5.8e-16	1.2e-12	48.3	0.4	1	87	555	627	555	627	0.85
4	28	3.8e-16	7.7e-13	48.9	5.3	1	87	732	802	732	802	0.83
5	28	6.9e-15	1.4e-11	44.8	3.5	1	86	826	897	826	898	0.82
6	28	9.3e-13	1.9e-09	38.0	1.0	1	87	933	1001	933	1001	0.81
7	28	6.8e-11	1.4e-07	32.0	1.2	1	86	1047	1116	1047	1117	0.76
8	28	5.5e-16	1.1e-12	48.4	0.1	1	86	1144	1213	1144	1214	0.82
9	28	3.1e-12	6.4e-09	36.3	0.7	1	85	1235	1303	1235	1305	0.79
10	28	2.8e-15	5.7e-12	46.1	1.5	1	86	1332	1403	1332	1404	0.85
11	28	8.2e-14	1.7e-10	41.4	1.5	1	85	1478	1546	1478	1548	0.81
12	28	3.2e-12	6.6e-09	36.3	0.1	1	86	1571	1639	1571	1640	0.81
13	28	1.2e-13	2.4e-10	40.9	1.8	1	87	1785	1854	1785	1854	0.81
14	28	9e-12	1.8e-08	34.9	0.2	1	61	1928	1981	1928	1999	0.77
15	28	0.055	1.1e+02	3.5	0.0	1	58	2014	2064	2014	2086	0.74
16	28	3.2e-12	6.6e-09	36.3	0.4	1	86	2103	2172	2103	2173	0.86
17	28	9.1e-16	1.9e-12	47.7	1.9	1	86	2237	2306	2237	2307	0.83
18	28	6.9e-13	1.4e-09	38.4	1.0	1	86	2342	2413	2342	2414	0.81
19	28	7.5e-13	1.5e-09	38.3	2.0	1	87	2424	2496	2424	2496	0.80
20	28	1.2e-15	2.5e-12	47.3	0.1	1	86	2526	2600	2526	2601	0.79
21	28	1.3e-05	0.026	15.2	0.2	1	58	2637	2691	2637	2711	0.84
22	28	4.2e-15	8.6e-12	45.5	0.4	1	86	2729	2801	2729	2802	0.82
23	28	2.1e-13	4.3e-10	40.1	2.3	1	86	2947	3019	2947	3020	0.82
24	28	4.1e-14	8.4e-11	42.4	2.5	1	87	3080	3151	3080	3151	0.82
25	28	6.8e-14	1.4e-10	41.6	3.3	1	86	3264	3334	3264	3335	0.84
26	28	8.1e-13	1.7e-09	38.2	0.0	1	87	3421	3491	3421	3491	0.84
27	28	4e-09	8.2e-06	26.4	0.3	1	58	3513	3561	3513	3569	0.84
28	28	2e-10	4.1e-07	30.5	1.8	18	87	3578	3636	3564	3636	0.75

Sequence Information

Coding Sequence: ATGATAATAAAATCGGAACCCATTGACGAACATGCGTATAAGTCCAACTATATTGATGATAATACGCCGTTTGCTGATTTTAGTAAATATCCGGAATTTGGCGACGACATGCTGAGTCCCAAGGTAGAGCTGACCGTCAAGGATGAGGCGTATCAAAAGAACCCGCTTAGTTATCCGCGGCGCAAGCTGCAATCGGAACGTTCGGCGGAGAGCTTGCCGATTTGTCAGCGCTGCAAGGAGGTGTTCTTCAAGAAGCAAATCTACTTGCGGCATGTGGCAGAGAGTAGTTGCACCATACAGGAGTATGACTTCAAGTGCAACATATGCCCCATGTCCTTCATGAACACCGAAGAACTGCAAAAGCACAAGCATCTGCACAGGGCCGATAAGTTCTTCTGCCACAAATATTGTGGCAAGTACTTCGACACCATTGCAGAGTGCGAGTCACATGAGTACATGCAGCACGAGTATGAGAGCTTTGTTTGCAACATGTGCTCGGTTACATTTGCCACACGGGAGCAGCTCTATGCGCACTTGCCACAGCACAAATTCCAGCAACGTTTCGATTGTCCCATTTGCCGGCTGTGGTATCAAACGGCATTGGAGCTGCACGAGCATCGTCTGGCGGCGCCCTATTTCTGTGGCAAGTATTACGCAGGCGCACAGACCACACAGGNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNCATGGCCACCATGGAAATGCCGACGACACATCAAAAGGCAACTGCTGGCAGCGCATTGCCGGCAACGGCAGCGTTGAGCTCTCTGTTGCAACAACGTCAGGCAAATGCCGATGGTGCCGCATTGTTTGCATCCTCTCTGAAGAACGAAGTGAACGTCAAACTGGAGCGCAGCTATAGCAATTCTACAACAAGCGAATCTGGCTACAGTCTGCATGACAGCAGCAACTATAACAATGCATATGGCAGCGATGCCTCGTTGCATGGCGGCACAGGTGCCGGAGCTATTGGTGGTCCACAGGCGCATTCCTCAACGCTGGACGATTCAGAGGATGCGCTTTGCTGTGTGCCCCTATGTGGTGTGCGCAAGAGCACCAGCCCCACGCTGCAGTTCTTCACGTTCCCCAAAGACGAGAAGTACTTGCATCAATGGCTGCATAATCTCAAGATGTTTCATGTCCCGGCCTCGAGCTATGCCACTTATCGCATCTGTAGCATGCACTTTCCGAAGCGCTGCATCAATCGTTATTCATTGTGCTATTGGGCTGTGCCCACGTTCAATTTGGGACACGATGATGTTGCCAATCTATATCAGAATCGCGAGCTAACGAACACCTTTACCACCGGCGAGGTGGCACGTTGCAGCATGCCCAACTGCACCAGTCAACGAGGGGAAAGCAACCTCAAGTTTTACAACTTCCCGAAGGACATTAAGAGTCTTATCAAGTGGTGCCAGAACGCACGTTTGCCCGTCCAGGCCAAGGAGCCGCGTCACTTCTGCAGTCGGCACTTTGAGGAGCGATGCATTGGCAAGTTCCGGCTCAAGCCATGGGCGGTGCCAACGCTGCATTTGGGCGCCCAATACGGGAAGATTCATGACAATCCCAAGAACTTGTATGTGGAAGAGAAGCGCTGTTGCCTTAATTTCTGTCGTCGCAGTCGCTCCTCGGACTTTAACATGTCGCTGTATCGCTTCCCCAGAGACGAAGTGCTCTTGCGACGTTGGTGCTACAATTTACGCCTTGATCCTGCCGTCTATCGTGGCAAGAATCACAAGATATGCAGTGCTCACTTCATCAAGGAAGCACTGGGATTGCGAAAACTATCGCCGGGTGCCGTTCCTACGCTTCATTTGGGTCACAACGATACGTTTAACATCTATGAGAACGAACTGTGNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNTTCGGCATCGCACTATGTCGATCCAGAGTTGAGTGCATCGTATATGGGCATGGGAAGCGGATCGGGTGGATCCGCATCGGGCCTGAATGTGAGCGACAGCATGGATGTGTGCTGTGTGCCGAGTTGCGAGAGCAAGCGACACAACAACGAGAACATCACATTCCATACGATACCCAGGCGACCCGAGCAGATGCGCAAATGGTGTCACAATCTCAAGATACCCGAGGATAAGATGCACAAGGGAATGCGAATTTGTAGTCTGCACTTTGAGCCCTATTGCATTGGCGGCTGTATGCGCCCCTTTGCGGTGCCCACACTGAATCTCGGGCACGACGACGACGATATACATCGCAATCCGGATGTAATTAAGAAACTGAATATACGCGAAACCTGCTGTGTGGCTGTGTGCAAGCGTAACCGGGATCGCGATCATGCCAATCTGCATCGTTTCCCCAGCAATGTCTCGCTGCTGACGAAATGGTGCGCCAATCTGCAGCGACCTGTGCCCGATGGCACTAAGCTCTTCAACGATGCCATTTGCGAGGTGCACTTCGAGGATCGTTGCCTGCGCAACAAGCGATTGGAGAAATGGGCAGTGCCCACGCTGGTGCTGGGACACGACAACATTGCATATCCACTGCCCACGGCAGAGCAGGTGGCCGAGTTCTATGCCCGTCCCAGTGCACCCAACAATGGCGAGGAGCAGGGCGAGTGCTGTGTGGAGACCTGTAAGCGCAATCCCAGTGTCGATGACATCAAACTCTATCGCCCGCCCGAGGAGTCGTCGGTGCTGGCGAAATGGGCACATAATCTTGAAGTGGATGCTGCCAAGTTGTCCAGCATGCGTATATGCAATCTGCACTTTGAGTCCCACTGCATTGGCAAGCGCATGCGTCCCTGGGCCATACCCACACTCAATCTGTCCAACAATATTGAGAATATGTACGAGAATCCCGAGCATCACATGATCTACAAGCGTCGCACACAAATTAAAGCCGAGAGAGGTGCATCGGGAGCGGGGGCAAGCATGTCGAAGCCCACTTGGGTGCCACGTTGCTGCTTGCCACATTGTCGCAAGGTGCGTGCCCTGCACAATGTGCAGCTCTATCGCTTCCCCAAACTCAATCGTGCCACGCTGGCCAAGTGGGCGCACAATCTGCAAGTGCCACTGGTGGGCAGTGCCCAGAGGCGACTCTGCTCCGCCCACTTCGAGCCGCATGTGCTGAGCAAGAAGTGTCCGGTGCCGCTGGCGGTGCCCACACTGGATCTCAATGCGCCACCCGGCTACAAAATCTATCAGAATCCCGCCAAGCTAAAGGCCAACAAGCTGTGCCTGCAGCGTGTCTGCATTGTGGAGAGCTGCCGTCGGCAACGGGGTCAGGGCGTGCAGCTCTTCCGCCTGCCGCACAGTCCCACACAGCTGCGCAAATGGATGTACAACATCCGGATGCGACCCAGAGGTGCCATGCGGCAACAGTATCGCATCTGCTCGACACACTTTGAGACGCATTCGTTCAATGGCAAGCGACTGAGTGCGGGAGCGATACCAACACTGGAGCTGGGCCATGACGACGAGGACATCTATCCCAATGAGGCGCAATCATTTGTGGAGGAACACTGTGCCATCGATGGGTGCGATGCATCCAAGGAGCAGCCAGATGTGCGTCTCTTCCGCTTTCCCACCGACGATGAGGATTTGCTCTGGAAGTGGTGTAACAATCTGAAAATGAATCCTGTCGATTGTATTGGCGTGCGCATCTGCAACAAACACTTCGAGGGAGACTGCATAGGACCGAAGCATCTTTACAAGTGGGCCATACCCACGCAGGAGTTGGGCCACGATGACTCTCAGATTGAGCTCATTACCAATCCCAAGCCAGAGGAGCGTTATGTTGATCCCGTGTTCAAGTGCTGTGTTCCCACCTGCGGCAAGACGCGTAAATTCGACGAAGTGCAGATGAATAGCTTCCCCAAAGATCCTGCACTCTTCCAGCGCTGGCGACACAATCTGCGACTGGAGCATCTGCAGTTCAAGGAGCGCGAGCGCTATAAGATCTGCAATGCACACTTTGAGGATATTTGCATTGGCAAGACTCGTCTGAATATTGGTTCCATACCCACACTGGAGTTGGGGCACGACGATGCGGAAGATCTCTTCCAGGTGAATCCTGCAGAGTTGCAAAGCAATTTGTTTGGGCGCCAGCGACGTGTACAGGAGTCAGGTATGAGGGTTCGAATAAAGCAGGAGGAGCACTCCGAGCAAGAGGAGACGGATGTTACCATGTCGGAGGCTACGGACTTGAATACCAAGCAGGTTAAAATAAAGAAACGCCTTGCGGACTTGAAGTGCTGCGTGCCCAGCTGTGGTCGCAGTCGCCTGGAGCACGGCGCACGTTTGTTTCCCTTTCCAACTGGCAAACAACAGCAGAGCAAGTGGCGCCACAACTTGCGTCTGGATGCCAGCGATGTGGACAAGACGTCGCAAGTTTGCAGCGCACACTTCAATCGACGTTGCATCGATGGCAAGCAGCTGCGTGGCTGGGCCATCCCCACACAGCAGCTGGGACATCAGGAGCAACCTATCTATGAGAACCCAAAGAATATACCGGGCTTCTTTACGCCCACCTGTGCGCTGGCGCACTGCCGCAAGCGGCGCAGTATTGACAATGATTTGCGGACTTATCGTTATCCCCGCAGCGAGGAGCTGTTGGAGAAATGGCGAGTGAATCTACGCCTGGCTCCCGATCAGTGTCGCGGACGCATCTGTGCGGATCACTTTGAGCCAATGGTACGTGGCAAGCTGAAGCTGAGGACGGGTGCAGTGCCAACGCTTAAGCTGGGACACGATGAGGGCGTGGTCTTTGACAATGAGGCCATTAAGGCGGGACTGCAACTGGATGCAGCTGGAGAGCCAGAGGTGGAGGAGGGTGAGGCGAGTAGAGAATCGCTGATTAAGATTAAAAAGGAGAAACTAGAACCAGATGAGGAGGAGGCGGAGGTAGAGCAGACACAGCTCGACAATGGAGACGATGATGAAGAGCAGGAAGAAGATGTGGATGCGGATGAGGATGATGATCATGGCTATTTCGATCCATTGGAACTGGNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNACATCCGCTCCCGCCGCTGCTACGCCGCGAGAAGCCCGTGAATAATGTGACGCCAATTTGTTGTCTGAAGCATTGCCGCAAAGAACGCACTGCAACACATCAGCTGAGCACCTTTGGCTTTCCCAAGGATCGCCTGCAGCTGCGCAAGTGGAGCAGCAATCTACAAATCCCCGAGAGCGATTGCGTGGGACGTGTTTGCATTGAGCACTTCGAGGCGGAGGTGCTGGGCACGCGCAAGCTCAAACAGCACGCGGTGCCCACATTGAACTTGGGCCATGACACGCCCCTAATCTACAGGTGCAATGGGCAAGCGCAGCCCATGGGGGGCATCTTCGATGAGCAGCCGCAGCATTCGGTTTTTCGGCTTTGGAGCCTGAAACACTGTCGCAAAAGGAAGCTGGCAGCAATGGAACCGCCCGATCATCAGCGTCATCAACGAGCAGTGATTAAGCAGGAGCTGGAGGAGGAGCAGGAGGATGGACTGAGCTGTTGCCTGCCCCACTGTGGCATGCGGGCGAATGACGTGCAACTGCATCCTCTGCCCAGCAATCGCATTCGACTGCGCAAATGGTTGCACAATCTCAACCTGCCCCAAAGCATTCCCATCGGCAGTCAGACACGTGTCTGCAGCGAGCACTTTGATGTGCAGCCGGGTGAGGCACTAGAGGATTGTGTGCCCACCTTGAAACTGGGTCACAATGATATCAATATATACAGCAATCAAAACTCTACTGCCTCCTCATCCTGCTTGGTGCCCAGCTGCCCGTGTGCACGACTCAATCTCTATCGAGGCTATGACTTGCCTGAGCATCATCTGGTGCAGCAGGCTTGGCTGCAATTCCTGCGCCAACCCATGCCTCAGCTGCCCGGCGATGGCCAGCTCTGTGTGATGCACTATATGCAGCTGTACGAGCAGGTCTCGCTGCCCCAGGAGGTGCCAGCGACAGTGTTGCGTCAACTGCAGGAGACCTACGAACAGATAGCCAACTCCACCATGGCCATGAAGCTGCGCTGCGCCGTGCCCGGCTGCTACTCCAAGTACACGGACAACATAAGGTTAACCAAGCTGCCCACCTGCTCGGACATGTTTGCCAAGTGGCTGCACAACACCAAGATCAAATACGATGCCAACAGGCATTACATCTATCGCATTTGTATGCTCCACTTTGAGCCCCGTTGTCTGGGTCCAGTGCGTCCCAAATTGTGGGCGGTGCCGACGTTGCAACTACATCACAACGATGCAGATATCTATAGGAATCCCAAGCTGGATGGGAGTGGACAAGAGGTACAGCAAGTCCTTCCACAACCTGTGCCCGTGCCCGTGGAGTTGCCTTTGCGCATCAAGACGGAGCTGGCTTACAGTGGCAGTCCGAGTGCCAGCGCCAGTCCTAGTCCACGTGGCAAGTTGCGCATCTGCTGCATTCCCGGCTGTGCCCAACAGGCCAACTCTCAGATGCGTCTCTTTCGCTTCCCCACCTCGGAGACAATGCTGCTCAAGTGGCTGGTGAACACTCAGCAGAAGCCCCGCCTGGCGGATCCACAGCATCTGTTTGTCTGCCAGGATCATTTCGAATCGGAGGCCATTTGCAAGAAGCAGCTAAGCAGTTGGGCTGTGCCCACATTGAAGCTAGGACACGATGGCCACATCATTCCCAATGCCAAGCACAATGGCAACATTGCGGACACACATGAGAATCGACACACGCTGCAATTTATCTGGGCCAATTACTGCTCTGTGCTGGACTGCTTTGAGCCTCGCAGTGAGCAACTGCGTCTCTTCGCGTATCCCACAGATCGACCCACCATACGCAAGTGGGCTGCCAATTGCAAGCATCGTTCCATGCAGGCCAGCAGCGACGGCTTTCAGGTTTGTCAATCGCACTTTGAACCACATTGCTTTGACCCGGAAACGGGAGAGCTGCGGGAGGATGCAGTGCCCACGCTGGAGCTAAGTCGTGGCATCAACAAGATGGGTTGCATGGTGCCCGGTTGCGTCAAGGAGGAGACTGGACCGCGTCGTCGCCTGTTTAAGATGCCCAAGCGTTCATCGCAATTGTTGGATTGGTGTCACAATTTTCAACTGGATCCATCGACCATCTCAATTGAGAAGAGTGTTGTGTGCGATCGTCACTTTGAGTCGCATTGCTTGAATGTGCACAAGCAGCTGCGTCGTGGAGCACGTCCCACACTCCACTTGGGTCACACTGTGGATGTTGAGATATTGCAGAACCCTTCGAATTGGGCCCGTTGCACTGAGGTGCCTGAGACTCCTGCTGATGTCTGCTGTGTGCCCAACTGTGGACGGTACAAGGATGCCGAGGAAGAGGACACTGACATGCAGCTGTTTAGCTTTCCCAAGGTGCGGACACTGGCAGAAAAGTGGCTGAGGAACATTCGTCTCGAGGCAAACAAGGAACAGTTGGCTGAGTTGAAAGTCTGCAATGCGCACTTTGAGATCTTCTGTCTCGAGAATGGACGCCTCCAGTTGGGTGCCATGCCCACACTGCAGTTGGGACACGATGATCATCATGACATACATCGCTCCAGTTGCCTCACGTCCTTGTCGGCCTCCAAAATGAAACGTTATTGCAATAGGAATGGATACAGCTATGATTGCTGCTTTCCTCAGTGTGTGGAGCTGCAGAAGAGTTATCTACGGATTAGCTACAATTTGCCACAGTCGCAAGCACTGCGTAATGCCTGGATAGCCTACATGGAGTTGGAGGAACCGAAGGAGCACGAAAAGGAGCAGCAACTGAAGTTGTGCCCGCTGCACTTGATCATTCTTTACGAGCACAGCGTAGACAACTTCCCCGAGCACACAACAGAGGAACTGTTGGAGGACAACTATGCAGCTGCGAGAAATAGTGTGCGGATACGCATCATCAGTTGTGCAGTGCGTGGCTGCAGGACGCTGAAGACCCGCGACGGCGGTTGCCTTCATGGCCTGCCCCAGCGTCGGGATATACTGCAGATGTGGTTGCACAACATGCAGTTGGTGTTCTACGAGCAGCAGCGCTACATGTACAAGATCTGCAGCAAGCACTTTGAGCCCAATTGCTTTACGGACACAACACGCCGCCTCAAGCCGTGGAGTATGCCCACGTTGGAGTTGCCTGAGCCCGAGCCGGGTGAACCAGAAGTCTATCAGAATCCCACAGAAGCTGAATGGCAGCAAATGAATGAACAGTGGGCAGCAGAGCAGCTGCAAATAGCTCAGCCAATGATGGAGGATGAAGAGCATGAGGAAGTTGTGCAAGTGAAGTTGGAGCCGGAAACGGAGATAGAACAGGATAATCTGCTGGCATATGAGGAAGAGGATTACTCGCAGCCGCCAGTGGATGGAGAGGAGGATGCCAGTTCGCAGCAGCCGCTGGAGATGCAACCCTTGGAGGTGCTGCTTGAGGTGGGTCATGTGGAGAAGTGCAGAACATACGAGCAAATGGACACAAAGGCAAATCTGAGTTATGCCGAGCAACAGGCTGGGCCGCTGCCTAGTAATGGAAGCTTTGCCAGCAATGGCAACAAGTACACTGCACGCAATTGCAGTGTACAAGGCTGTCACGTGACCTTGAACGATATTTGTGGCACTGTGAAGCTGCACAAATTTCCCACGTCGTGGGGGGCAATGCAGAAGTGGATGCACAACACCCAAGTGAAGGTGTGCCGAAGTGTCTCGTGGCGTTTTCGCATTTGCAGCTATCATTTTATGGAAGATTGTTTTCAAGGCTCTCGCCTAAGGCGTGGTGCCATGCCCACATTGCAGTTGGGCCCCAAGCGACCTTCGCATATCTATGAGAGTGAGTTCAATGTTGGCGATGGCGACGAGGAGCAGCCCATTGAAGAGCCATCAGAACAAACACCACAGTCAAGGGTGGTAGCTGGCGATAATATTAGTCTGTGCCTGCCTAGCCCAGCACCGCCTCGCAAGTCGAGCAAGTTCTGCCAAGTCGACGGTTGTCCTAATCACTTGACCAGCGAGAATCTGACGCTGCACAAGTTCCCCCACTCGCCGGACATGTGTGCCAAGTGGCAGCACAATACGCAGGTGCCATTTGATCCCGTCTTCCGCTGGCGATATCGCATATGCAGCGCCCACTTCGAACCGATCTGTCTGTTGAATATGCGCCTGCTGCACGGCAGTGTGCCCACGCTGCACTTGGGTCCACGTGCTCCACAGCAGCTCTTCGACAGCGACTTTGAGGCCATCAGCATGCGCTTGGATAAGCAGAAGAGCAGCTCAGAGCAGCAGCTGTATATCAAGCAGGAGCAGGAAGAGGATCACGACGATGCGGAGCAAGATGAGGATGAGTTTAGTTTTCTGGTGCCAGAGATGCAGCTGCATGAGGATGCAGGCGAAGATGAAGCTGACATAAAGACGGAGCACAGTCAATCCTATAACGGACGCTGGAAGGATCTGCGTTTGCCCAGCATTAAGCAGGAGGATACGACGACCATGACGTGCTACAATCCCGTCAAGTCTGGCTATGACAAGTGCTCGCTGGTGCATTGTCAGCGTCAACGATCGCTGCACGGCGTGCATATCTATAAATTTCCACGTGCCCATCAACTACAGCAGCACTGGATGCACAATCTGCGAATACGCTATGATGAACGGAGACCCTGGAAAACAATGATATGCAGTGTACACTTTGAGGCGCAATGTATTCGTCTGCGTAAGCTGCGGCCTTGGGCGGTGCCCACACTGGAGCTGGGAGACAACGTGCCCCAGGAGATCTTTAGCAATGAACAGAGTCGGCAACAGTTTGAAAATGATGAAATGGATGTGGATTTTGACTTGGATCTAAAACAGCCAATGCTGGAGNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNTGCATCAGTGCGTCAGCCACTTTGGAAAAAGAGAAAGCAAAACAACAATCAGCTTGCAAAGATTAAGACTTGCTCCTTACCCTATTGCCGGAGTCCACGTGGCGATGGCATCAAGCTGTTCCGACTGCCGAACAGGCTGAGCGACATACACAAATGGGAGGAGGCAACGGGAATGCATTTCACCGAATCCCAGCGCAACACGAAGCTCATCTGCAGTCGTCACTTTGATCCGCAGTTGATTGGCGTGCGTCGGCTGATGTACAACGCGGTGCCGACTCTTCATCTGCGACCAGAGACTGCGCGAGAAGAAAGGATGCCTCCGCGTCCTCGTCCAGCGGGGCCACGTTGTTTCATGCCCAGTTGTCCACAGGATTTGCAGCAAAAGTTGCACAAGTTTCCCAGTGATCCTCAGCAGCTTCAGGAATGGTGTGCAGTGCTCAGAGTCTCCGAAACGCAGGACTTTAGTAACTTGTACATTTGTGACGATCACTTGCCAACGCTGGCAAGAAGCTGCCTCATCTGCAGTGTGGAGGAACTGCAGCTGCCACTGCTCAACTTCCCAGAGCATCGCAATCAACGCGCCAAGTGGTGCCATAATCTCAAAATCGATCCCATTCCCAAGTGGGATAACTCAAAGCACATTTGCAGTCGACATTTTGAGAGCTACTGCTTCATCCAGCCGGGTCAACTGGTTCCCGAGGCTGCTCCCACGTTGCACTTAAAGCACACGGACAACAACATATTCCTTAACGATTATGCCATAGATTCCAGCAAGATGATCTTGCGGATTAAGGACGAGCCCTTGGAGAGTGACGATCTGATGCTGTAA
Protein Sequence: MIIKSEPIDEHAYKSNYIDDNTPFADFSKYPEFGDDMLSPKVELTVKDEAYQKNPLSYPRRKLQSERSAESLPICQRCKEVFFKKQIYLRHVAESSCTIQEYDFKCNICPMSFMNTEELQKHKHLHRADKFFCHKYCGKYFDTIAECESHEYMQHEYESFVCNMCSVTFATREQLYAHLPQHKFQQRFDCPICRLWYQTALELHEHRLAAPYFCGKYYAGAQTTQXXXXXXXXXXXXXXXXXXXXXXXXXXMATMEMPTTHQKATAGSALPATAALSSLLQQRQANADGAALFASSLKNEVNVKLERSYSNSTTSESGYSLHDSSNYNNAYGSDASLHGGTGAGAIGGPQAHSSTLDDSEDALCCVPLCGVRKSTSPTLQFFTFPKDEKYLHQWLHNLKMFHVPASSYATYRICSMHFPKRCINRYSLCYWAVPTFNLGHDDVANLYQNRELTNTFTTGEVARCSMPNCTSQRGESNLKFYNFPKDIKSLIKWCQNARLPVQAKEPRHFCSRHFEERCIGKFRLKPWAVPTLHLGAQYGKIHDNPKNLYVEEKRCCLNFCRRSRSSDFNMSLYRFPRDEVLLRRWCYNLRLDPAVYRGKNHKICSAHFIKEALGLRKLSPGAVPTLHLGHNDTFNIYENELXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXSASHYVDPELSASYMGMGSGSGGSASGLNVSDSMDVCCVPSCESKRHNNENITFHTIPRRPEQMRKWCHNLKIPEDKMHKGMRICSLHFEPYCIGGCMRPFAVPTLNLGHDDDDIHRNPDVIKKLNIRETCCVAVCKRNRDRDHANLHRFPSNVSLLTKWCANLQRPVPDGTKLFNDAICEVHFEDRCLRNKRLEKWAVPTLVLGHDNIAYPLPTAEQVAEFYARPSAPNNGEEQGECCVETCKRNPSVDDIKLYRPPEESSVLAKWAHNLEVDAAKLSSMRICNLHFESHCIGKRMRPWAIPTLNLSNNIENMYENPEHHMIYKRRTQIKAERGASGAGASMSKPTWVPRCCLPHCRKVRALHNVQLYRFPKLNRATLAKWAHNLQVPLVGSAQRRLCSAHFEPHVLSKKCPVPLAVPTLDLNAPPGYKIYQNPAKLKANKLCLQRVCIVESCRRQRGQGVQLFRLPHSPTQLRKWMYNIRMRPRGAMRQQYRICSTHFETHSFNGKRLSAGAIPTLELGHDDEDIYPNEAQSFVEEHCAIDGCDASKEQPDVRLFRFPTDDEDLLWKWCNNLKMNPVDCIGVRICNKHFEGDCIGPKHLYKWAIPTQELGHDDSQIELITNPKPEERYVDPVFKCCVPTCGKTRKFDEVQMNSFPKDPALFQRWRHNLRLEHLQFKERERYKICNAHFEDICIGKTRLNIGSIPTLELGHDDAEDLFQVNPAELQSNLFGRQRRVQESGMRVRIKQEEHSEQEETDVTMSEATDLNTKQVKIKKRLADLKCCVPSCGRSRLEHGARLFPFPTGKQQQSKWRHNLRLDASDVDKTSQVCSAHFNRRCIDGKQLRGWAIPTQQLGHQEQPIYENPKNIPGFFTPTCALAHCRKRRSIDNDLRTYRYPRSEELLEKWRVNLRLAPDQCRGRICADHFEPMVRGKLKLRTGAVPTLKLGHDEGVVFDNEAIKAGLQLDAAGEPEVEEGEASRESLIKIKKEKLEPDEEEAEVEQTQLDNGDDDEEQEEDVDADEDDDHGYFDPLELXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXHPLPPLLRREKPVNNVTPICCLKHCRKERTATHQLSTFGFPKDRLQLRKWSSNLQIPESDCVGRVCIEHFEAEVLGTRKLKQHAVPTLNLGHDTPLIYRCNGQAQPMGGIFDEQPQHSVFRLWSLKHCRKRKLAAMEPPDHQRHQRAVIKQELEEEQEDGLSCCLPHCGMRANDVQLHPLPSNRIRLRKWLHNLNLPQSIPIGSQTRVCSEHFDVQPGEALEDCVPTLKLGHNDINIYSNQNSTASSSCLVPSCPCARLNLYRGYDLPEHHLVQQAWLQFLRQPMPQLPGDGQLCVMHYMQLYEQVSLPQEVPATVLRQLQETYEQIANSTMAMKLRCAVPGCYSKYTDNIRLTKLPTCSDMFAKWLHNTKIKYDANRHYIYRICMLHFEPRCLGPVRPKLWAVPTLQLHHNDADIYRNPKLDGSGQEVQQVLPQPVPVPVELPLRIKTELAYSGSPSASASPSPRGKLRICCIPGCAQQANSQMRLFRFPTSETMLLKWLVNTQQKPRLADPQHLFVCQDHFESEAICKKQLSSWAVPTLKLGHDGHIIPNAKHNGNIADTHENRHTLQFIWANYCSVLDCFEPRSEQLRLFAYPTDRPTIRKWAANCKHRSMQASSDGFQVCQSHFEPHCFDPETGELREDAVPTLELSRGINKMGCMVPGCVKEETGPRRRLFKMPKRSSQLLDWCHNFQLDPSTISIEKSVVCDRHFESHCLNVHKQLRRGARPTLHLGHTVDVEILQNPSNWARCTEVPETPADVCCVPNCGRYKDAEEEDTDMQLFSFPKVRTLAEKWLRNIRLEANKEQLAELKVCNAHFEIFCLENGRLQLGAMPTLQLGHDDHHDIHRSSCLTSLSASKMKRYCNRNGYSYDCCFPQCVELQKSYLRISYNLPQSQALRNAWIAYMELEEPKEHEKEQQLKLCPLHLIILYEHSVDNFPEHTTEELLEDNYAAARNSVRIRIISCAVRGCRTLKTRDGGCLHGLPQRRDILQMWLHNMQLVFYEQQRYMYKICSKHFEPNCFTDTTRRLKPWSMPTLELPEPEPGEPEVYQNPTEAEWQQMNEQWAAEQLQIAQPMMEDEEHEEVVQVKLEPETEIEQDNLLAYEEEDYSQPPVDGEEDASSQQPLEMQPLEVLLEVGHVEKCRTYEQMDTKANLSYAEQQAGPLPSNGSFASNGNKYTARNCSVQGCHVTLNDICGTVKLHKFPTSWGAMQKWMHNTQVKVCRSVSWRFRICSYHFMEDCFQGSRLRRGAMPTLQLGPKRPSHIYESEFNVGDGDEEQPIEEPSEQTPQSRVVAGDNISLCLPSPAPPRKSSKFCQVDGCPNHLTSENLTLHKFPHSPDMCAKWQHNTQVPFDPVFRWRYRICSAHFEPICLLNMRLLHGSVPTLHLGPRAPQQLFDSDFEAISMRLDKQKSSSEQQLYIKQEQEEDHDDAEQDEDEFSFLVPEMQLHEDAGEDEADIKTEHSQSYNGRWKDLRLPSIKQEDTTTMTCYNPVKSGYDKCSLVHCQRQRSLHGVHIYKFPRAHQLQQHWMHNLRIRYDERRPWKTMICSVHFEAQCIRLRKLRPWAVPTLELGDNVPQEIFSNEQSRQQFENDEMDVDFDLDLKQPMLEXXXXXXXXXXXXXXXXXXXXXXXXASVRQPLWKKRKQNNNQLAKIKTCSLPYCRSPRGDGIKLFRLPNRLSDIHKWEEATGMHFTESQRNTKLICSRHFDPQLIGVRRLMYNAVPTLHLRPETAREERMPPRPRPAGPRCFMPSCPQDLQQKLHKFPSDPQQLQEWCAVLRVSETQDFSNLYICDDHLPTLARSCLICSVEELQLPLLNFPEHRNQRAKWCHNLKIDPIPKWDNSKHICSRHFESYCFIQPGQLVPEAAPTLHLKHTDNNIFLNDYAIDSSKMILRIKDEPLESDDLML

Similar Transcription Factors

Sequence clustering based on sequence similarity using MMseqs2

100% Identity: iTF_01558329;
90% Identity: -
80% Identity: -