Basic Information

Insect: Scaptomyza pallida
Gene Symbol: -
Assembly: GCA_018152965.1
Location: JAECXP010000116.1:220614-233820[-]

Transcription Factor Domain

TF Family: THAP
Domain: THAP domain
PFAM: PF05485
TF Group: Zinc-Coordinating Group
Description: The THAP domain is a putative DNA-binding domain (DBD) and probably also binds a zinc ion. It features the conserved C2CH architecture (consensus sequence: Cys - 2-4 residues - Cys - 35-50 residues - Cys - 2 residues - His). Other universal features include the location of the domain at the N-termini of proteins, its size of about 90 residues, a C-terminal AVPTIF box and several other conserved residues. Orthologues of the human THAP domain have been identified in other vertebrates and probably worms and flies, but not in other eukaryotes or any prokaryotes [1].
Hmmscan Out: # of c-Evalue i-Evalue score bias hmm coord from hmm coord to ali coord from ali coord to env coord from env coord to acc

1 28 1e-14 8.8e-12 45.7 4.3 1 86 369 441 369 442 0.85

2 28 6.5e-15 5.8e-12 46.3 4.6 1 87 469 538 469 538 0.83

3 28 1.5e-15 1.3e-12 48.3 0.4 1 87 560 632 560 632 0.85

4 28 9.8e-16 8.7e-13 48.9 5.3 1 87 728 798 728 798 0.83

5 28 1.6e-14 1.4e-11 45.0 3.4 1 86 822 893 822 894 0.82

6 28 1.8e-12 1.6e-09 38.5 1.2 1 87 929 997 929 997 0.80

7 28 1e-10 9.3e-08 32.8 1.8 1 86 1044 1113 1044 1114 0.76

8 28 1e-16 9.1e-14 52.0 0.2 1 87 1141 1211 1141 1211 0.83

9 28 7.6e-13 6.7e-10 39.6 2.3 1 86 1232 1301 1232 1302 0.81

10 28 2.9e-14 2.5e-11 44.2 2.1 1 86 1329 1400 1329 1401 0.85

11 28 4.9e-13 4.3e-10 40.2 1.3 1 85 1477 1545 1477 1547 0.81

12 28 6.2e-12 5.4e-09 36.7 0.1 1 86 1570 1638 1570 1639 0.82

13 28 2.9e-13 2.6e-10 41.0 0.7 1 86 1788 1856 1788 1857 0.81

14 28 1.2e-11 1.1e-08 35.8 1.0 1 62 1925 1986 1925 2003 0.77

15 28 0.00094 0.83 10.5 0.0 1 59 2007 2057 2007 2073 0.71

16 28 5.3e-11 4.7e-08 33.7 0.6 1 86 2095 2164 2095 2165 0.83

17 28 4.6e-14 4e-11 43.6 1.2 1 87 2226 2296 2226 2296 0.82

18 28 2.3e-13 2e-10 41.3 0.5 1 86 2331 2402 2331 2403 0.82

19 28 7.4e-12 6.5e-09 36.5 0.8 1 87 2413 2484 2413 2484 0.80

20 28 2.1e-13 1.9e-10 41.4 0.5 1 86 2507 2577 2507 2578 0.78

21 28 2.5e-05 0.022 15.6 0.1 1 57 2611 2662 2611 2676 0.85

22 28 3e-13 2.7e-10 40.9 0.1 1 86 2701 2773 2701 2774 0.81

23 28 1.8e-14 1.6e-11 44.9 1.6 1 86 2914 2986 2914 2987 0.84

24 28 2.7e-14 2.4e-11 44.3 1.7 1 87 3052 3123 3052 3123 0.82

25 28 1.2e-12 1e-09 39.1 6.2 1 86 3231 3301 3231 3302 0.84

26 28 7e-13 6.1e-10 39.8 0.1 1 87 3394 3464 3394 3464 0.85

27 28 5.1e-09 4.5e-06 27.4 0.2 1 58 3482 3530 3482 3540 0.87

28 28 3.5e-09 3.1e-06 27.9 1.3 18 87 3547 3605 3536 3605 0.76

#	of	c-Evalue	i-Evalue	score	bias	hmm coord from	hmm coord to	ali coord from	ali coord to	env coord from	env coord to	acc
1	28	1e-14	8.8e-12	45.7	4.3	1	86	369	441	369	442	0.85
2	28	6.5e-15	5.8e-12	46.3	4.6	1	87	469	538	469	538	0.83
3	28	1.5e-15	1.3e-12	48.3	0.4	1	87	560	632	560	632	0.85
4	28	9.8e-16	8.7e-13	48.9	5.3	1	87	728	798	728	798	0.83
5	28	1.6e-14	1.4e-11	45.0	3.4	1	86	822	893	822	894	0.82
6	28	1.8e-12	1.6e-09	38.5	1.2	1	87	929	997	929	997	0.80
7	28	1e-10	9.3e-08	32.8	1.8	1	86	1044	1113	1044	1114	0.76
8	28	1e-16	9.1e-14	52.0	0.2	1	87	1141	1211	1141	1211	0.83
9	28	7.6e-13	6.7e-10	39.6	2.3	1	86	1232	1301	1232	1302	0.81
10	28	2.9e-14	2.5e-11	44.2	2.1	1	86	1329	1400	1329	1401	0.85
11	28	4.9e-13	4.3e-10	40.2	1.3	1	85	1477	1545	1477	1547	0.81
12	28	6.2e-12	5.4e-09	36.7	0.1	1	86	1570	1638	1570	1639	0.82
13	28	2.9e-13	2.6e-10	41.0	0.7	1	86	1788	1856	1788	1857	0.81
14	28	1.2e-11	1.1e-08	35.8	1.0	1	62	1925	1986	1925	2003	0.77
15	28	0.00094	0.83	10.5	0.0	1	59	2007	2057	2007	2073	0.71
16	28	5.3e-11	4.7e-08	33.7	0.6	1	86	2095	2164	2095	2165	0.83
17	28	4.6e-14	4e-11	43.6	1.2	1	87	2226	2296	2226	2296	0.82
18	28	2.3e-13	2e-10	41.3	0.5	1	86	2331	2402	2331	2403	0.82
19	28	7.4e-12	6.5e-09	36.5	0.8	1	87	2413	2484	2413	2484	0.80
20	28	2.1e-13	1.9e-10	41.4	0.5	1	86	2507	2577	2507	2578	0.78
21	28	2.5e-05	0.022	15.6	0.1	1	57	2611	2662	2611	2676	0.85
22	28	3e-13	2.7e-10	40.9	0.1	1	86	2701	2773	2701	2774	0.81
23	28	1.8e-14	1.6e-11	44.9	1.6	1	86	2914	2986	2914	2987	0.84
24	28	2.7e-14	2.4e-11	44.3	1.7	1	87	3052	3123	3052	3123	0.82
25	28	1.2e-12	1e-09	39.1	6.2	1	86	3231	3301	3231	3302	0.84
26	28	7e-13	6.1e-10	39.8	0.1	1	87	3394	3464	3394	3464	0.85
27	28	5.1e-09	4.5e-06	27.4	0.2	1	58	3482	3530	3482	3540	0.87
28	28	3.5e-09	3.1e-06	27.9	1.3	18	87	3547	3605	3536	3605	0.76

Sequence Information

Coding Sequence: ATGATAATAAAATCGGAACCCATTGATGAACATGCTTTCAAGTCCAGCTATATCGACGATAATACGCCCTTTGCCGATTTCAGTAAATATCCCGAATTCGGCGACGATATGCTAAGCCCCAAGGTTGAGCTAACAGTCAAAGATGAGGGCTATGGAAGCCAAAAAAATCCGTTGAATTATCCACGACGCAAGCTGCAAACGGATCGCGCTGCCGAAAATATGCCCATCTGTCAGCGCTGCAAGGAGGTGTTCTTCAAGAAACAGATTTATCTGCGCCATGTGGCCGAAAGCAATTGCAACATACACGAGTATGACTTCAAGTGCAACTTATGCGTTATGTCCTTCAGGGCCATCGAGGAGCTGCACAAACACAAGCTGCTTCATCGTGCCGACAAGTTTTTCTGCCACAAATACTGTGGCAAGTACTTTGACTCGATTGCAGAATGCGAATCTCATGAATACATGGAGCACGAGTACGAAAGCTTTGTGTGCAATATGTGCTCTGTTACGTTTCCGACACGGGAACAGCTGTATGCGCATTTGCCGCAACACAAGTTCCAGCAGCGTTATGATTGCCCCATATGCCGTTTGTGGTATCAAACGGCATTAGAGTTGCACGAGCATCGTATGGCGGCACCCTACTTCTNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNACTTCAAGATTGTCATATGGGCACCATAGAAATGACTCCACCTCACCACAAGGCGAATACAGCATTGCCGGCAACGGCGGCGCTTAGTTCACTGCTGCAGCAGCGTCAGGCAAATGCTGATGGCGCCGCCATGTATGCTTCCTCCATGAAGACGGAGGCTAATGCGAAGCTGGAGCGCAGTTTTAGTAACTCCACCAGCGAATCGGGATACAGCATGCAGGAGAGCAGCTATAACAATGCCTATGGCAGTGACAATTCGCTGCACGGTGGAGGCGGCGTCGGCGGCGGTATTGGTGGTCCTCAGGCGCATTCCTCGACGCTGGACGATTCGGATGATGCACTGTGCTGTGTGCCGCTGTGCGGTGTGCGCAAGAGCACCAGCCCCACACTACAGTTTTTTACGTTTCCCAAGGATGAAAAATATTTGCATCAGTGGCTGCACAATCTCAAAATGTTTCACATTCCAGCCTCGAGCTATGCCAGCTTTCGCATCTGCAGCATGCATTTTCCCAAACGCTGCATAAATCGTTATTCTTTGTGCTATTGGGCAGTGCCCACATTCAATCTGGGTCACGACGATGTGGCCAATTTGTATCAGAATCGCGAGCTGACCAACACATTCACCACTGGCGAGGTGGCACGCTGCAGCATGCCCAACTGCAGCAGTCAGCGTGGCGAAAGCAATCTCAAGTTCTACAACTTTCCAAAGGATATCAAGAGTTTGATCAAGTGGTGCCAAAATGCACGCCTGCCTGTTCAGGCCAAGGAGCCTCGTCATTTCTGCAGTCGTCACTTTGAGGAGCGCTGCATTGGCAAGTTTCGGCTTAAGCCTTGGGCTGTGCCCACACTACATTTGGGCGCTCAGTATGGCAAGATACACGACAATCCCAAGAATCTGTATGTGGAGGAGAAACGTTGCTGCCTCAACTTTTGCCGTCGCAGTCGTTCGTCCGATTTTAATATGTCGCTGTATCGTTTTCCTCGCGATGAGGTGCTGCTGCGTCGTTGGTGCTACAATCTGCGCCTGGATCCGGCCGTGTATCGTGGCAAAAATCACAAAATATGTAGCGCTCACTTCATAAAGGAAGCATTGGGTCTGCGCAAGCTATCGCCAGGCGCCGTGCCCACGCTGCATCTGGGTCACAATGACACCTTCAATATATACGAGAATGAGTTGTGGCCACCACCAACTCCATCTACACCCACGCANNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNCACTATGTTGATCCGGATCTGAGTGCATCCTACATGAGCATGGGCGCTGGCGGCTCATCATCCAGTCTCAACGTCAGCGACAGCATGGACATCTGTTGTGTGCCCAGCTGCGAAAGCAAGCGGCACAACAACGAGAACATTACATTCCACACAATTCCAAGGCGACCAGAGCAGATGCGCAAATGGTGTCACAATCTCAAGATACCCGAGGACAAGATGCACAAGGGCATGCGCATATGTAGCCTACACTTTGAGCCCTATTGCATTGGTGGCTGCATGCGTCCATTTGCTGTGCCCACACTCAATTTGGGCCACGACGATGAGGACATCCATCGCAATCCGGATGTCATCAAGAAGCTAAACATACGCGAAACCTGCTGTGTGGCTGTGTGCAAGCGCAACCGGGACCGGGATCATGCCAATCTGCATCGTTTTCCCAGCAATGTGTCATTGCTGACCAAATGGTGTGCTAATCTGCAGCGTCCCGTGCCGGATGGCACGAAACTCTTCAACGATGCCATCTGCGAGGTGCACTTTGAGGATCGCTGTCTGCGCAACAAGCGTTTGGAGAAGTGGGCTGTGCCCACGCTCATACTGGGACATGAGAATATACCGTATCCGGTGCCAACGCCCGAGCAGGTTGCCGAGTTCTATGCCCGTCCCAGTGCGCCCAACAATGGCGAGGAGCAGGGCGAGTGCTGTGTGGACACGTGTAAACGTAATCCTAGTGTCGATGACATTAAGCTTTATCGGCCACCCGAGGAGTCGCAAGTGCTGGCCAAATGGGCACACAATCTGGAGATAGAATTAACCAAGCTGACCAACATGAGAATATGCAATCTGCACTTTGAATCGCATTGCATTGGCAAGCGTATGCGTCCTTGGGCCATACCCACACTCAATCTGGCCAGCAACATTGAGAATCTTTACGAGAATCCCGACCGTCAAATGCTCTATAAGCGACGCACACATCTCAAACCGGAAAGAGCCGCTCGAGGTTCCTTGGCTGCCGCTGGCATAAAGCCCACCTGGGTGCCACGCTGCTGCCTGCCGCATTGTCGCAAGGTGCGTGCCACACACAACGTGCAACTGTATCGCTTCCCCAAACTCAATCGCTCCACGCTGGCCAAGTGGGCGCATAATCTGCAAGTGCCAATGGTGGGCAGCGCCCAACGTCGTCTCTGCTCCGCCCACTTTGAGCCGCATGTGCTCAGCAAGAAGTGTCCAGTGCCCTTGGCAGTGCCCACACTGGACCTCAATACACCACCCGGCCACAAGATCTATCAGAATCCGGCCAAGCTCAAGGCTAAGAACCTTTGTCTACAGCGCGTCTGCATTGTGGAGAGCTGCCGGCGTCAGCGGGCGCAGGGTGTGCAGCTGTTCCGGCTGCCACATAGCCCTACCCAGTTGCGAAAGTGGATGCACAACATCCGGATGCGTCCCCGTGGTGCTATGCGACAACAATATCGCATCTGCTCCGAGCACTTTGAGACGCACTCGTTCAACGGCAAGAGATTAAGTGCGGGTGCAATTCCAACTCTTAATCTGGGTCATCAGGATGAGGACATTTTCCCGAATGAGGCACAATCCTTTGTAGAGGAGCACTGCACCGTCGAAGGTTGCGAATCAGCCAAGGAGCAACCGGACGTACGTCTTTTCCGTTTCCCCAGCGACGATGAGGATCTGCTCTGGAAGTGGTGCAACAATCTCAAAATGAATCCCGTCGACTGCATTGGTGTACGCATCTGCAACAAGCATTTCGAACCGGACTGCATTGGTCCCAAGCATCTGTACAAGTGGGCCATACCCACACTATGCCTGGGTCACGATGATTCCGACATCGAACTGATATGCAATCCCAAGCCGGAGGATCGCTATATTGATCCGGTCTTCAAGTGCTGTGTGCCAACATGCGGCAAGACGCGCAAATTTGACGAGGTGCAAATGAATAGCTTTCCCAAAGATCCCACACTCTTCCATCGCTGGCGTCACAATCTGCGCTTGGAGCATCTCAATTTCAAGGAACGCGAACGCTATAAGATCTGCAATGCACACTTTGAGGACATTTGCATAGGCAAGACGCGCCTGAATATTGGTTCAATACCCACACTGGAGCTGGGCCATGACGAGACTGAAGACTTGTTCCAAGTCAATCCCGAGGAGCTGCAGAGCAATCTGTTTGGACGGCAGCGACGTGTGCAGGATGCCCTGAGAGTTGGCATCAAACAGGAGCCGCATTCTGAGCTAGATGAAGACATAAAACCGGATATTACCATGTCGGAAGCCACAAATACAAATACAACGCAGGTTAAAATCAAGATGTCATTGGCCGAGTTGAAGTGTTGTGTGCCCAGCTGTGGTCGCAGTCGCTTGGAGCACGGTGCCCGCCTCTTCCCCTTCCCGAGTGGTAAACAACAACAGACCAAATGGCGTCACAATCTTAAGCTATCTATTGCGGATGTGGACAAGTCAACGCGTATTTGCAGCGCACACTTTAGTCGTCGCTGCATTGATGGCAAGCAGCTGCGAGGCTGGGCAATGCCCACACAGCAGCTGGGCCACCAGGAGCAGCCAATCTATGAGAATCCAAAGAATATACCGGGCTTCTTTACGCCCACATGTGCGTTGGCGCACTGTCGCAAGCGGCGTAGCATTGATAATGAGCTGCGCACCTATCGCTATCCACGCAGCGAGGAGCTGCTGGAGAAGTGGCGTGTAAATCTGCGCTTGTCACCGGATCAGTGTCGCGGACGCATCTGTGCGGATCATTTTGAGCCACTGGTGAGGGGCAAGCTGAAGCTGAAGACGGGAGCTGTGCCCACGCTTAAATTGGGGCACAATGAGGGTGTGGTCTTTGATAATGAAGCCATTAAGGCGTTGCTGCAGCTGGACGAGGAGGAGGAGGATGAAGAAGCAGAAGGAGAGGGAGATGTCAACTTTGGGTCGTTGGTAAAAGTAAAGACTGAAAAGAAGGAAGAAGAGCAGGATGTTGAGGACGAACAGCAAATGGATAATGAGGATAACGATGAGGATGAGCATCCGGATTCAGATGATCATGGCTATTTTGATCCATTGGAGCTTGTCGAAANNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNGCTGCTTCTACCTGAAACACGCTCAATGCGACTAACCCTGCCGCCGCGTCGCGAAAAAGCTGTCAACAATGTGACACCCATTTGTTGCCTGAAGCATTGTCGCAAGGAGCGCACCGCCATCCATCACCTGAGCACCTTTGGCTTTCCCAAGGATCCGCAACTACTGCTCAAATGGAGTGCTAATCTGCAGCTGCCGCTGGAGGATTGTATGGGTCGTGTATGTGTGGAGCATTTTGAGCCCGTTATGCTGGGCACACGCAAGCTCAAGCAGAATGCTGTGCCCACTTTGAAGCTGGGGCATGCCACGCCGCTAACATATAGCTGCAATGGTCGGATGCTTTCGGGCATCTATGATGAACAGCCGCAACATTCGGTTTTTCGGCTTTGGAGCCTGAAACACTGCCGCAAAAGGAAACCGGAATCGGAGCTTGAGCTGGAGCCGGAGCAAAAGCACAAACCGCAGCAGCAGCCGGAAACTAGGCCCATACGTCGCTGTTGCCTGCCCAGCTGTGGCAAGCAATCGGAACTGCATGGCGTTCAGCTGCAGCGTCTGCCCAAGGAGCGCATGATGCTGCGCAAATGGCTGCACAATCTGAAGCTGCCGCCAACCACAGACTGCACCCACATGTTCCTCTGCAGCGATCACTTTGAGCAGAATGCACCGTGTCCCACTCTCAAACTGGGCCATACGGACACCAACATTTATAGGCACAGTACACCCAGCGCCATCAGTGCCGGCTGCCTGGTGCCCAAGTGTACTTGTGCGCGTCTCAATCTCTATCGTGGCTATGAGCTGCCCGCTAACCGACTCGTGCAGGAGGCTTGGCTCAGTTGGCTACAGCTGCCGCAGCCATCGCCCCAGCACGCTCAGCTGTGCGTCATGCACTTTATGCAGCTGTATGAACAGGTGCCGCTGCCCGATTCGGTGCCCGATATTGTGCATCGTCAGCTGCGTGAGACTTATGAGCTCATATCCAGCTCCAGCATGGCCATGAAGCTGCGCTGTGCTGTGCCCGGCTGCTACTCCAAGTATACGGACAATGTGCGTCTGACCAAGCTGCCCGTTTGCCCTCAAACCTGCGCCAAGTGGGTGCACAACACCAAGATTGGATACGAACCGGCTCGGCACTATGTCTATCGCATCTGTATGCTGCACTTTGAGCCCAGTTGCCTGGGTCCTGTGCGTCCCAAGGTGTGGGCCATGCCCACACTCCAGCTGCATCACACCGATAAGAATATTTATATGAATCCCAAACTGGAGGACAGCCCAACAACACAGGCTGTGGTGCCGGTGCCGCTGGAGCTGCCGCTGCGCATCAAAACCGAGCTGCCCATGTGCCATAGTCCAAGTTTTAGTGCCAGCGCCAGTCCCAGTCCGCGTGGCAAACTGCGCATCTGTTGCATCTCCAGCTGCGGACAGCAGGCTTCCGCTTTGACGCGTCTCTTTCGCTTTCCCAGCTCGGAGACAGCTTTGCTCAAATGGCTGGTGAATACGCAGCAACAGCCGCGCTCTGTCGATACACAACGTCTGTTCATCTGCCAGGAACACTTTGAGGCGGAGGCCATTTGCCAGAATCAGCTGCGCAGCTGGGCGGTGCCCACATTGAATCTGGGTCACGAGGGACACATCATTCCGAATGCGCGGCACAATGGCAACATTGCCGACAGTCAGGAGAACAAGCAGACACTGCAGTTTATATGGGCCAACTACTGTTCGGTGCTGAGCTGCTTTCAGCAAAAAAGCGACGAGCTGCGTCTATATCCATATCCAAAGGATCGTCCCATTATTCGCAAATGGGCTGCCAATTGTAAGCATCGTTCTATGCAGGCCAGCAGCGATGGCTTTCAGGTTTGCCAATCGCATTTTGCGCCGGATTGCTTTGATGCTGAAACTGGGGAGTTGAAGGAGGATGCAGTGCCCACGCTGGCGCTTAATCGGCTTGTGAATGAGATGCGTTGTGTGGCGAATGGTTGCGTCAAGGATGAGGATGCACCGCGTCGTTTGTTCAAGATGCCGAAGTCAGCTGCGCAGATGACCGATTGGTGCCACAATTTGCGTATAGATCGAACGGCCATAAGCGGCACGGATCCGCATGTGTGTGAACGCCACTTTGAGGCACAATGCTTCAATGTGTATAAAACGTTGCGTCCAGGAGCACGACCCACCCTACATCTAGGTCATGAAGACTTGTCCGACTTATTGCCAAATCCAGCCAACTTCGAGGAGGATGCCTTCATGTGCTGTGTGCCCAATTGTGGGCGCACCAAGGATGCGGATAATGCTCTACTGTTTGGGCTGCCAAAGGTGCGCCAGTTGGCAGAGAAATGGCTGCAAAATATACGCCTAGATCCGAGCAAAGAACAATTCACCTGCCTGCGTATCTGCAGCGTGCACTTTGAGGCCAGATGTTTGGAGAATGGACGTCCCACCTACAGTGCAATGCCAACGCTTCATCTGGGTCATGAGGAGCTGCACGACATTAACCAAATTCTCGAACCGTTGCCAACAAAGCAGAAACTGTATTGCAATCGAGATGGCGCCAGTCACGACTGCTGCTTTCCACAGTGTGTGGAGCTGCAGAAAAGCTATTTGCGTGTCACCTACGAGCTGCCCCAGAAGCAGGAGCTGCGCGAACAATGGCTTGCCTATATGGGCCTGAAGGAACCGCTTGATGAGCAGCAGTTTCCCAAGCTCTGCCCGCTACACTTGATCCTGCTCTATGATCACAGTGTGGAGAACTTTTCGGCACATGCGGGCGAGGAGCTGCTGGATGCCAACTATGAGGCATCACGCAATAGCGTGCGCATTCGTATTGTCAGCTGTGCGGTGCGTGGCTGCAGAACGCTCAAGCCACGCGATGGAGGACGTCTACATGGCTTGCCCACACGTCGGGATTTGTTGGAGATGTGGCTACACAATATGCAACTGGTGTTCTATGAGCAGCAACGTTATATGTACAAGATATGCATCAAACACTTTGAGCCCAGATGTCTGACGGAGACAACCAAACGCTTGAAGCCCTGGAGCATGCCAACGTTGGAGTTGCCGGAGCGTGAGCCGGGCGAACTGCCTCCGTATCAGAATCCCACAGAGGAGGAGTGGCAGCGTATGAACGAGCTGTATGCCAATGCCAATGCCAAAGCTATTGAGGTGGAGCCACCGATGCTTAAGCTTGAGCCCGTCTGCAAGATAGAATCGCCGCCAGAGCAGCCGGAGCCGGAACAGGAGCAGGATTATGAAGAGGATTATGACTACAGCTCACAGCCGCCACTAGAAATGCAACCGCTGGAGGTACTACTCGAAGTCGGTCATGTCGAGAAGTGTGCCACCTATGAGCAAATGGATACCGAACCAAATCCCAACTTTGCCGAGCCGCTCTCTCCCCTGGGAGCACCTGCACCTCAAAGCCGCAGCAGCATTGTGCCTGCCCAGAATGGTTTCCATTACAGTGCACGTGTGTGCAGCGTGCATGGCTGCAATGTCAACACGAATAACATCGATAGCAACATCAAGCTGCACAAGTTTCCCGTCTCCATGGATGCCATGCAAAAGTGGATGCACAATACCCAAGTCACAGTGGACGTTAAATTTGCTTGGCGTTTTCGCATCTGCAGTCATCATTTCATACCAGATTGCTTTCAGGGCTCGCGAATCAGACGTGGCGCCATGCCCACCTTGCGTTTGGGATCGCGTCGACCCAAGCATATCTATGATAATGAATTTAGTAGCCAACTGCAGCTGGAACTGCAGTCCAAGGAGGATGCCAATGAAGGGCTCGAGTCCGCACCAGTCGAATCTCAGCAACAGTTGCAATCAGCCAATATTGGCTTGCGCCTGCCACGTCCTGCTCCGCCACGCAAATCCAGCAAATACTGTCAAATCGAAGGCTGTTCGAATCATTTGACCAGCGAGAATGTCACACTACACAAATTCCCGCACTCGGCGGACATGTGCGCCAAGTGGCAGCACAATACACAAGTGCCCTTTGATCCAGAGTATCGCTGGCGCTATCGCATCTGCAGCGCACACTTTGAGCCCATTTGCTTGGGCAATGTGCGGCTGATGCATGGCAGTGTGCCCACGCTTAATCTGGGACCGTTTGCGCCCAAGAAAGTATTTGAGAATGATTTCATTCGTCTGGACAAGCCCAGAAGCAGTTTGGACCTTGGCGCCATGGATCAATTTGATCAGTTTGATGCAAATGATGATGATGAACAGGAGCAGGAGGATTATAGTTTGCTGGAGCCAGAGCTGCAGCTACATGAAGGTAGCGATGACGACGACCAACCCTACGACAATCATTTAAGCCGCAACAATTCCTTCAACTGGAGCGAGCAGCAGCTGCGTTTGCCCAGCATTAAACAGGAGAAAAGCACCAGTTTCAATCCAGTCAAGTCGGGCTATGACAAGTGCTCGTTGGTGCACTGCCAGCGTCATCGTTCGCACCATGGCGTTCACATCTATAAGTTTCCACGTTCGCGCCAAATGCAGCAGCGTTGGATGCACAATTTGCGCATTCAATACGACGAGCGACGGCCCTGGAAGACCATGATTTGTAGCGTACACTTTGAGCCGCATTGCATACGTTTGCGTAAGTTGTGTCCGTGGGCGGTGCCCACACTGGAACTTGGGGAGAATGTGCCACAGGAGCTCTTTACGAATGAGCAGAGCCAGCATATGTATGCTCAGTCCGAGGCAGGTAGCGAGGGTGATGAGATGGATGTAGATATAGAGGACACCATGCTGGAGGACTCGGAGGACGATGAATTCGATAATCATGATAATGAGGATGATGCCGACGATGAACGCTTACAGGCAGCTCCATATGTTAAGAGGGAAAGACGCTCACGATTTGATCCTTTGCCGCCAGGACAGTTGCCACCATGGAAGATCAAAACGTGCTGCTTGCCGTACTGCCGCAGACCACGCGGCGATGGCATTAAGCTCTTTCGTCTGCCCAACAACATCAGCTCCATACGCAAATGGGAACGGGCTACAGGCATGCGCTTCTATGAGTCCCAGCGCAACACAAAGCTCATATGCAGTCGTCACTTTGAACCGTCGCTTATAGGCGTGCGTCGTCTCATGTCGAATGCAGTACCTAGTCTCCATTTGGAACCAGAAGACGCTGATGAGGAGCTGCTGCCGCCCGTTGGGCCACGTTGTTGCATTGCCGATTGTCCCGAGGATGTTAATGCTCAGCTACACAAGTTTCCAAGTGATCCCATGCTACTGGATCAATGGTGCCACGCTCTAAATTTGACGGATGCTGAAAGCTACACCGGCAAATATGTTTGTGACACACACCTGCCCACCAACGCGCTAAGCTGCCTCATTTGTGGCGTTGAGGATGTGCAAATGCCAATGCTAGACTTCCCGGCAAATCGTAATCAGCGTACCAAGTGGTGCTACAATCTGAAAATCGAGCCCCTGCCCAAGTGGGACAACTCAAAGCACATATGCTGCAAGCACTTTGAGAGCTACTGTTTCATTCAGCCGGGTCAATTGCTGCCAGAGGCAATGCCCACACTACATTTAAAGCATAGCGACAACAACATATTCCTTAACGATGATACCATAGACAGCAGCAAGATGCTGCGCATCAAGGACGAGCCCATGGAAAGCGATGACCTGATGCTATAA
Protein Sequence: MIIKSEPIDEHAFKSSYIDDNTPFADFSKYPEFGDDMLSPKVELTVKDEGYGSQKNPLNYPRRKLQTDRAAENMPICQRCKEVFFKKQIYLRHVAESNCNIHEYDFKCNLCVMSFRAIEELHKHKLLHRADKFFCHKYCGKYFDSIAECESHEYMEHEYESFVCNMCSVTFPTREQLYAHLPQHKFQQRYDCPICRLWYQTALELHEHRMAAPYFXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXLQDCHMGTIEMTPPHHKANTALPATAALSSLLQQRQANADGAAMYASSMKTEANAKLERSFSNSTSESGYSMQESSYNNAYGSDNSLHGGGGVGGGIGGPQAHSSTLDDSDDALCCVPLCGVRKSTSPTLQFFTFPKDEKYLHQWLHNLKMFHIPASSYASFRICSMHFPKRCINRYSLCYWAVPTFNLGHDDVANLYQNRELTNTFTTGEVARCSMPNCSSQRGESNLKFYNFPKDIKSLIKWCQNARLPVQAKEPRHFCSRHFEERCIGKFRLKPWAVPTLHLGAQYGKIHDNPKNLYVEEKRCCLNFCRRSRSSDFNMSLYRFPRDEVLLRRWCYNLRLDPAVYRGKNHKICSAHFIKEALGLRKLSPGAVPTLHLGHNDTFNIYENELWPPPTPSTPTXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXHYVDPDLSASYMSMGAGGSSSSLNVSDSMDICCVPSCESKRHNNENITFHTIPRRPEQMRKWCHNLKIPEDKMHKGMRICSLHFEPYCIGGCMRPFAVPTLNLGHDDEDIHRNPDVIKKLNIRETCCVAVCKRNRDRDHANLHRFPSNVSLLTKWCANLQRPVPDGTKLFNDAICEVHFEDRCLRNKRLEKWAVPTLILGHENIPYPVPTPEQVAEFYARPSAPNNGEEQGECCVDTCKRNPSVDDIKLYRPPEESQVLAKWAHNLEIELTKLTNMRICNLHFESHCIGKRMRPWAIPTLNLASNIENLYENPDRQMLYKRRTHLKPERAARGSLAAAGIKPTWVPRCCLPHCRKVRATHNVQLYRFPKLNRSTLAKWAHNLQVPMVGSAQRRLCSAHFEPHVLSKKCPVPLAVPTLDLNTPPGHKIYQNPAKLKAKNLCLQRVCIVESCRRQRAQGVQLFRLPHSPTQLRKWMHNIRMRPRGAMRQQYRICSEHFETHSFNGKRLSAGAIPTLNLGHQDEDIFPNEAQSFVEEHCTVEGCESAKEQPDVRLFRFPSDDEDLLWKWCNNLKMNPVDCIGVRICNKHFEPDCIGPKHLYKWAIPTLCLGHDDSDIELICNPKPEDRYIDPVFKCCVPTCGKTRKFDEVQMNSFPKDPTLFHRWRHNLRLEHLNFKERERYKICNAHFEDICIGKTRLNIGSIPTLELGHDETEDLFQVNPEELQSNLFGRQRRVQDALRVGIKQEPHSELDEDIKPDITMSEATNTNTTQVKIKMSLAELKCCVPSCGRSRLEHGARLFPFPSGKQQQTKWRHNLKLSIADVDKSTRICSAHFSRRCIDGKQLRGWAMPTQQLGHQEQPIYENPKNIPGFFTPTCALAHCRKRRSIDNELRTYRYPRSEELLEKWRVNLRLSPDQCRGRICADHFEPLVRGKLKLKTGAVPTLKLGHNEGVVFDNEAIKALLQLDEEEEDEEAEGEGDVNFGSLVKVKTEKKEEEQDVEDEQQMDNEDNDEDEHPDSDDHGYFDPLELVEXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXLLLPETRSMRLTLPPRREKAVNNVTPICCLKHCRKERTAIHHLSTFGFPKDPQLLLKWSANLQLPLEDCMGRVCVEHFEPVMLGTRKLKQNAVPTLKLGHATPLTYSCNGRMLSGIYDEQPQHSVFRLWSLKHCRKRKPESELELEPEQKHKPQQQPETRPIRRCCLPSCGKQSELHGVQLQRLPKERMMLRKWLHNLKLPPTTDCTHMFLCSDHFEQNAPCPTLKLGHTDTNIYRHSTPSAISAGCLVPKCTCARLNLYRGYELPANRLVQEAWLSWLQLPQPSPQHAQLCVMHFMQLYEQVPLPDSVPDIVHRQLRETYELISSSSMAMKLRCAVPGCYSKYTDNVRLTKLPVCPQTCAKWVHNTKIGYEPARHYVYRICMLHFEPSCLGPVRPKVWAMPTLQLHHTDKNIYMNPKLEDSPTTQAVVPVPLELPLRIKTELPMCHSPSFSASASPSPRGKLRICCISSCGQQASALTRLFRFPSSETALLKWLVNTQQQPRSVDTQRLFICQEHFEAEAICQNQLRSWAVPTLNLGHEGHIIPNARHNGNIADSQENKQTLQFIWANYCSVLSCFQQKSDELRLYPYPKDRPIIRKWAANCKHRSMQASSDGFQVCQSHFAPDCFDAETGELKEDAVPTLALNRLVNEMRCVANGCVKDEDAPRRLFKMPKSAAQMTDWCHNLRIDRTAISGTDPHVCERHFEAQCFNVYKTLRPGARPTLHLGHEDLSDLLPNPANFEEDAFMCCVPNCGRTKDADNALLFGLPKVRQLAEKWLQNIRLDPSKEQFTCLRICSVHFEARCLENGRPTYSAMPTLHLGHEELHDINQILEPLPTKQKLYCNRDGASHDCCFPQCVELQKSYLRVTYELPQKQELREQWLAYMGLKEPLDEQQFPKLCPLHLILLYDHSVENFSAHAGEELLDANYEASRNSVRIRIVSCAVRGCRTLKPRDGGRLHGLPTRRDLLEMWLHNMQLVFYEQQRYMYKICIKHFEPRCLTETTKRLKPWSMPTLELPEREPGELPPYQNPTEEEWQRMNELYANANAKAIEVEPPMLKLEPVCKIESPPEQPEPEQEQDYEEDYDYSSQPPLEMQPLEVLLEVGHVEKCATYEQMDTEPNPNFAEPLSPLGAPAPQSRSSIVPAQNGFHYSARVCSVHGCNVNTNNIDSNIKLHKFPVSMDAMQKWMHNTQVTVDVKFAWRFRICSHHFIPDCFQGSRIRRGAMPTLRLGSRRPKHIYDNEFSSQLQLELQSKEDANEGLESAPVESQQQLQSANIGLRLPRPAPPRKSSKYCQIEGCSNHLTSENVTLHKFPHSADMCAKWQHNTQVPFDPEYRWRYRICSAHFEPICLGNVRLMHGSVPTLNLGPFAPKKVFENDFIRLDKPRSSLDLGAMDQFDQFDANDDDEQEQEDYSLLEPELQLHEGSDDDDQPYDNHLSRNNSFNWSEQQLRLPSIKQEKSTSFNPVKSGYDKCSLVHCQRHRSHHGVHIYKFPRSRQMQQRWMHNLRIQYDERRPWKTMICSVHFEPHCIRLRKLCPWAVPTLELGENVPQELFTNEQSQHMYAQSEAGSEGDEMDVDIEDTMLEDSEDDEFDNHDNEDDADDERLQAAPYVKRERRSRFDPLPPGQLPPWKIKTCCLPYCRRPRGDGIKLFRLPNNISSIRKWERATGMRFYESQRNTKLICSRHFEPSLIGVRRLMSNAVPSLHLEPEDADEELLPPVGPRCCIADCPEDVNAQLHKFPSDPMLLDQWCHALNLTDAESYTGKYVCDTHLPTNALSCLICGVEDVQMPMLDFPANRNQRTKWCYNLKIEPLPKWDNSKHICCKHFESYCFIQPGQLLPEAMPTLHLKHSDNNIFLNDDTIDSSKMLRIKDEPMESDDLML

Similar Transcription Factors

Sequence clustering based on sequence similarity using MMseqs2

100% Identity: iTF_00595971;
90% Identity: iTF_01324934;
80% Identity: -