Basic Information

Insect: Scaptomyza hsui
Gene Symbol: -
Assembly: GCA_018152825.1
Location: JAECXO010000269.1:6514972-6526871[-]

Transcription Factor Domain

TF Family: THAP
Domain: THAP domain
PFAM: PF05485
TF Group: Zinc-Coordinating Group
Description: The THAP domain is a putative DNA-binding domain (DBD) and probably also binds a zinc ion. It features the conserved C2CH architecture (consensus sequence: Cys - 2-4 residues - Cys - 35-50 residues - Cys - 2 residues - His). Other universal features include the location of the domain at the N-termini of proteins, its size of about 90 residues, a C-terminal AVPTIF box and several other conserved residues. Orthologues of the human THAP domain have been identified in other vertebrates and probably worms and flies, but not in other eukaryotes or any prokaryotes [1].
Hmmscan Out: # of c-Evalue i-Evalue score bias hmm coord from hmm coord to ali coord from ali coord to env coord from env coord to acc

1 28 1.6e-14 1.3e-11 45.2 4.2 1 86 289 361 289 362 0.85

2 28 6.9e-15 5.6e-12 46.4 4.6 1 87 389 458 389 458 0.83

3 28 1.7e-15 1.4e-12 48.3 0.4 1 87 480 552 480 552 0.85

4 28 1.1e-15 9e-13 48.9 5.3 1 87 646 716 646 716 0.83

5 28 1e-14 8.6e-12 45.8 3.2 1 86 740 811 740 812 0.82

6 28 2.6e-11 2.1e-08 34.9 2.5 1 87 847 915 847 915 0.79

7 28 1.2e-10 9.7e-08 32.8 1.8 1 86 962 1031 962 1032 0.75

8 28 1.7e-16 1.4e-13 51.5 0.3 1 87 1059 1129 1059 1129 0.83

9 28 2.8e-11 2.3e-08 34.8 3.5 1 86 1150 1219 1150 1220 0.81

10 28 3.5e-14 2.9e-11 44.1 2.0 1 86 1247 1318 1247 1319 0.85

11 28 4.6e-13 3.8e-10 40.5 1.7 1 86 1396 1465 1396 1466 0.81

12 28 4.6e-12 3.8e-09 37.3 0.1 1 86 1489 1557 1489 1558 0.82

13 28 5.1e-13 4.2e-10 40.4 0.9 1 86 1708 1776 1708 1777 0.80

14 28 8.6e-12 7.1e-09 36.4 0.8 1 62 1849 1910 1849 1927 0.78

15 28 0.00011 0.088 13.7 0.2 1 59 1931 1983 1931 2004 0.77

16 28 9.7e-11 8e-08 33.1 1.0 1 86 2021 2090 2021 2091 0.83

17 28 3.8e-14 3.2e-11 44.0 1.2 1 87 2149 2219 2149 2219 0.82

18 28 1.9e-12 1.6e-09 38.5 0.7 1 86 2254 2325 2254 2326 0.82

19 28 4.6e-12 3.7e-09 37.3 0.6 1 87 2336 2407 2336 2407 0.81

20 28 1.4e-13 1.1e-10 42.2 0.1 1 87 2430 2501 2430 2501 0.79

21 28 2.8e-05 0.023 15.6 0.1 1 57 2534 2585 2534 2599 0.85

22 28 4.9e-14 4e-11 43.6 0.1 1 86 2624 2696 2624 2697 0.81

23 28 4e-14 3.3e-11 43.9 1.3 1 86 2831 2903 2831 2904 0.82

24 28 3.4e-14 2.8e-11 44.1 1.9 1 87 2969 3040 2969 3040 0.82

25 28 2.4e-14 2e-11 44.6 3.3 1 86 3138 3208 3138 3209 0.84

26 28 5.8e-13 4.8e-10 40.2 0.3 1 87 3302 3372 3302 3372 0.86

27 28 2e-08 1.6e-05 25.7 0.5 1 58 3389 3437 3389 3453 0.87

28 28 5e-09 4.1e-06 27.6 1.8 18 87 3454 3512 3442 3512 0.76

#	of	c-Evalue	i-Evalue	score	bias	hmm coord from	hmm coord to	ali coord from	ali coord to	env coord from	env coord to	acc
1	28	1.6e-14	1.3e-11	45.2	4.2	1	86	289	361	289	362	0.85
2	28	6.9e-15	5.6e-12	46.4	4.6	1	87	389	458	389	458	0.83
3	28	1.7e-15	1.4e-12	48.3	0.4	1	87	480	552	480	552	0.85
4	28	1.1e-15	9e-13	48.9	5.3	1	87	646	716	646	716	0.83
5	28	1e-14	8.6e-12	45.8	3.2	1	86	740	811	740	812	0.82
6	28	2.6e-11	2.1e-08	34.9	2.5	1	87	847	915	847	915	0.79
7	28	1.2e-10	9.7e-08	32.8	1.8	1	86	962	1031	962	1032	0.75
8	28	1.7e-16	1.4e-13	51.5	0.3	1	87	1059	1129	1059	1129	0.83
9	28	2.8e-11	2.3e-08	34.8	3.5	1	86	1150	1219	1150	1220	0.81
10	28	3.5e-14	2.9e-11	44.1	2.0	1	86	1247	1318	1247	1319	0.85
11	28	4.6e-13	3.8e-10	40.5	1.7	1	86	1396	1465	1396	1466	0.81
12	28	4.6e-12	3.8e-09	37.3	0.1	1	86	1489	1557	1489	1558	0.82
13	28	5.1e-13	4.2e-10	40.4	0.9	1	86	1708	1776	1708	1777	0.80
14	28	8.6e-12	7.1e-09	36.4	0.8	1	62	1849	1910	1849	1927	0.78
15	28	0.00011	0.088	13.7	0.2	1	59	1931	1983	1931	2004	0.77
16	28	9.7e-11	8e-08	33.1	1.0	1	86	2021	2090	2021	2091	0.83
17	28	3.8e-14	3.2e-11	44.0	1.2	1	87	2149	2219	2149	2219	0.82
18	28	1.9e-12	1.6e-09	38.5	0.7	1	86	2254	2325	2254	2326	0.82
19	28	4.6e-12	3.7e-09	37.3	0.6	1	87	2336	2407	2336	2407	0.81
20	28	1.4e-13	1.1e-10	42.2	0.1	1	87	2430	2501	2430	2501	0.79
21	28	2.8e-05	0.023	15.6	0.1	1	57	2534	2585	2534	2599	0.85
22	28	4.9e-14	4e-11	43.6	0.1	1	86	2624	2696	2624	2697	0.81
23	28	4e-14	3.3e-11	43.9	1.3	1	86	2831	2903	2831	2904	0.82
24	28	3.4e-14	2.8e-11	44.1	1.9	1	87	2969	3040	2969	3040	0.82
25	28	2.4e-14	2e-11	44.6	3.3	1	86	3138	3208	3138	3209	0.84
26	28	5.8e-13	4.8e-10	40.2	0.3	1	87	3302	3372	3302	3372	0.86
27	28	2e-08	1.6e-05	25.7	0.5	1	58	3389	3437	3389	3453	0.87
28	28	5e-09	4.1e-06	27.6	1.8	18	87	3454	3512	3442	3512	0.76

Sequence Information

Coding Sequence: ATGTACATTGCGGAACCCATTGACGAACATGCTTTCAAGTCCAACTATATCGATGATAATACGCCCTTTGCCGATTTTAGTAAATTTCCCGAATTCGGCGACGATATGCTGAGCCCCAAGGTTGAGCTAACCGTCAAGGATGAGGGCTATGGCAGCCAAAAAAACCCGCTTAACTATCCACGTCGCAAGCTGCAATCGGATCGCTCTGCTGAAAATATGCCCATTTGCCAGCGCTGCAAGGAGGTGTTCTTCAAGAAGCAGATTTACCTGCGCCATGTGGCTGAGAGCAATTGCAACATACACGAGTATGACTACAAGTGCAACATTTGTGTCATGTCCTTCAGGGCTATCGAGGAGCTGCACAAGCACAAGCTTCTGCATCGCGCCGACAAGTTCTTCTGCCACAAATATTGTGGCAAGCACTTTGACTCGATTGCAGAATGCGAATCGCATGAATACATGGAGCACGAGTACGATAACTTCGTGTGCAATATGTGCTCTGTTACGTTTCCCACACGGGAACAGCTGTATGCTCATTTGCCGCAACACAAGTTTCAGCAGCTGAATACTACTCATCACAAAGCGAATACAGCATTGCCGGCAACGGCGGCGCTCAGTTCTCTGCTGCAGCAACGTCAGGCGAACGCCGATAGCGCCGCCTTGTACGCTTCTGGGTTGAAGACGGAGACAAATGTAAAACTGGAGCGCAGTTTTAGCAACTCGACTAGCGAATCGGGTTACAGCATGCAGGAGAGTAGCTATAATAATGCCTACGGCAGCGACAATTCGCTGCACGGCGGGGGCAGCGGAATTGGTGGTCCACAGGCGCATTCCTCGACGCTGGACGATTCGGAGGATGCACTGTGCTGTGTGCCGCTGTGCGGTGTGCGCAAGAGCACCAGCCCAACGCTGCAGTTTTTTACGTTTCCCAAGGATGACAAATACTTGCATCAGTGGCTGCACAATCTCAAGATGTTTCACATTCCAGCCTCGAGCTATGCCAGCTTTCGTATCTGCAGCATGCACTTTCCCAAGCGCTGCATTAATCGTTACTCGTTGTGCTATTGGGCAGTGCCCACATTCAATCTGGGTCACGACGATGTAGCCAATCTCTATCAGAATCGTGAGCTAACCAACACATTCACCACCGGCGAAGTGGCGCGCTGCAGCATGCCCAACTGCACCAGTCAGCGTGGCGAGAGCAATCTCAAGTTCTACAACTTTCCTAAGGATATCAAGAGTTTGATTAAGTGGTGCCAAAATGCCCGCCTGCCCGTTCAGGCCAAGGAGCCGCGACACTTCTGCAGTCGTCACTTTGAGGAGCGCTGCATCGGCAAGTTTCGGCTCAAGCCCTGGGCAGTGCCCACACTACATCTGGGCGCTCAATACGGCAAGATTCACGACAATCCCAAGAACCTGTATGTGGAGGAGAAGCGTTGCTGCCTCAACTTTTGTCGTCGCAGTCGTTCCTCCGATTTCAATATGTCACTGTATCGCTTCCCCAGGGATGAGGTGCTGCTGCGTCGTTGGTGCTACAATTTGCGCCTTGATCCCGCTGTGTATCGTGGCAAGAATCACAAAATATGCAGCGCTCACTTCATCAAGGAAGCATTGGGTCTACGCAAGCTATCGCCAGGCGCTGTTCCCACGCTGCACCTGGGTCACAATGACACCTTCAATATCTACGAGAACGAATTGTGGCCACNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNCATTATGTTGATCCGGATCTAAGTGCATCCTACATGAGCATGGGTGCTGGCGGCTCATCCTCTAGCCTCAACGTCAGCGACAGCATGGACATCTGTTGTGTGCCCAGCTGCGAGAGCAAGCGTCACAATAACGAGAACATTACATTCCACACAATTCCCAGGCGGCCAGAGCAGATGCGCAAATGGTGTCACAATCTCAAGATACCCGAGGACAAGATGCACAAGGGCATGCGAATATGTAGCCTGCACTTTGAGCCCTACTGCATAGGTGGCTGCATGCGTCCGTTTGCTGTGCCCACACTGAATCTGGGCCACGACGACGAGGACATTCATCGCAATCCGGATGTGATCAAGAAGCTCAACATACGCGAAACCTGTTGTGTGGCCGTTTGCAAGCGGAATCGTGACCGGGACCATGCCAACCTGCACCGTTTTCCCAGCAATCTGTCACTGCTGACCAAGTGGTGTGCCAACCTGCAGCGTCCTGTGCCGGATGGCACTAAGCTCTTCAACGATGCCATCTGTGAGGTGCACTTTGAGGACCGTTGCCTGCGCAACAAGCGGTTGGAGAAGTGGGCAGTGCCCACTCTGATATTGGGTCATGAGAATATACCGTATCCGGTGCCAACACCAGAGCAGATTGCCGATTTCTATGCCCGTCCCAGTGCACCCAACAACGGCGAGGAGCAGGGCGAGTGCTGTGTGGAGACTTGCAAGCGTAATCCATGTGTTGATGACATTAAGCTATATCGACCGCCGGAGGAGTCACAGGTGCTGGCCAAATGGGCACACAATCTAGAAGTGGAGATTACCAAGCTACCAAATTTGAGAATATGCAATCTGCACTTTGAATCCCATTGCATTGGCAAGCGAATGCGTCCCTGGGCCATACCCACACTTAATCTGGCCAGCAACATTGAGAATCTCTTCGAGAATCCCGAACGCCAAATGCTTTACAAGCGACGCACACATCTCAAACCGGAAAGAGCCGCTCGAGGCTCTTTGGCAGCCGCTGGTGTTAAGCCCACCTGGGTGCCTCGTTGCTGCCTGCCGCACTGTCGCAAGGTGCGTGCCACACACAACGTTCAACTGTATCGCTTCCCCAAACTCAATCGCTCCACGCTGGCCAAGTGGGCACATAATCTGCAGGTGCCGCTCGTGGGCAGTGCCCAGCGTCGTCTCTGCTCCGCCCACTTTGAGCCGCATGTGCTCAGCAAGAAGTGTCCGGTGCCTTTGGCCGTACCCACACTGGAGCTCAATACACCGCCCGGCTACAAGATCTATCAGAATCCAGCCAAGCTCAAGGCTAAGAACCTTTGCCTTCAGCGCGTCTGCATTGTGGAGAGCTGCCGGCGTCAGCGGGCGCAGGGTGTGCAGCTCTTCCGGCTGCCCCATAGTCCCACCCAGCTGCGCAAGTGGATGCACAACATCCGCATGCGTCCTCGAGGCGCCATGCGACAACAGTATCGCATCTGCTCACAGCACTTTGAGACGCATTCGTTCAACGGGAAGAGACTGAGTGCTGGTGCGATTCCAACGCTGAATCTGGGTCATCAGGATGAGGACATTTTTCCAAATGAGGCGCAATCTTTCGTGGAGGAACACTGCACCGTTGAGGGCTGTGATGCAGCCAAGGAGCAACCGGATGTGCGTCTCTTCCGCTTCCCCTGCGAAGATGAGGATCTGCTCTGGAAGTGGTGCAACAATCTCAAAATGAATCCCGTCGACTGCATTGGCGTCCGCATCTGCAACAAACACTTCGAACCGGATTGCATTGGACCCAAGCACATCTACAAGTGGGCCATTCCCACCCTTTGCCTGGGTCACGATGATGCCGACATCGAACTTATATGCAATCCCAAGCCGGAGGACCGCTACGTGGATCCGGTCTTTAAATGCTGTGTGCCCACGTGCGGCAAGACGCGCAAGTTCGATGAGGTGCAGATGAATAGCTTCCCCAAAGATCCCACACTCTTCCATCGCTGGCGTCACAATCTGCGCCTGGATCATCTTAATTTCAAGGAACGCGAACGCTATAAGATCTGCAATGCACACTTTGAGGACATTTGCATTGGCAAGACGCGTTTGAACATTGGTTCAATACCTACACTGGAACTGGGCCATGACGAGACTGAAGACTTGTTCCAAGTCAATCCCGAGGAGCTGCAGAGCAATCTGTTTGGACGCCAGCGACGCATTCAAGACTCCATGAGGGTCGGCATTAAACAGGAGCCGAACTCCTCCGAGCTAGATGAAGATATTAAACCGGATTTGACCATGTCGGAAGCCACCGATTCAAACACAACGCAGGTTAAGATCAAGAAATCATTGTCAGATTTCAAGTGCTGTGTGCCGAGCTGCGGTCGGAGTTGCCTGGAGCATGGTGCCCGCCTCTTTCCCTTTCCATCTGGCAAACAGCAGCACAGCAAGTGGCGTCAGAATCTACAGCTGTCTGCTTCGGATGTGGACAAGAATACGCGCATCTGCAGCGCACACTTCAATCGTCGCTGCATCGATGGCAAGATGCTGAGGGGTTGGGCAATGCCCACACTGCAGCTGGGCCATCAGGAGCAGCCGCTCTATGAGAATCCAAAGAATATACCGGGCTTCTTTACGCCCACATGTGCGCTGGCGCACTGTCGCCAGCGGCGCAGCATTGACAACGATCTGCGCACCTATCGCTATCCACGCAGCGAGGAGCTGCTCGAGAAGTGGCGTGTTAATCTGCGCTTGTCGCCGGATCAGTGTCGCGGACGCATCTGTGCGGATCACTTTGAGCCGGTGGTGCGGGGCAAATTAAAGCTTAAGACGGGCGCAGTGCCTACGCTCAAATTGGGTCACGATGAGGGCGTGGTCTTTGACAATGAAGCCATTAAGGCGCTACTACAGCTGGATGATGAGGAGGAGGATGAGGAAGAGGAGGGCGATGCCAGCTTAAAGTCGTTGGTAAAAGTAAAGACTGAGAAGGAGGAGGAGGAGGAGGAAAGACAGGAACTTCAGCNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNGCTGCTCCTACCCGAAACACAGCCCCTGCGATTAACCCTACCACCGCGTCGCGAAAAAGCTGTAAACAATGTGACGCCCATTTGCTGCCTGAAACACTGTCGCAAGGAGCGCACCGCAACTCATCATCTGAGCACCTTTGGCTTTCCCAAGGATCCGCAGCTGTTGCTCAAGTGGAGCGCCAATCTGCAGCTGCCGCTGGAGGATTGCGTGGGACGTGTATGCGTCGAGCACTTTGAGCCTGTAATGCTGGGAACACGCAAGCTCAAACAGAATGCTGTGCCCAGTTTAAAGTTGGGGCATGACACACCGCTCACCTACAGCTGCAACGGCAAGATGCTATCATTGGTATACGGGGAACAGCCGCAGCATTCGGTTTTTCGGCTTTGGAGCCTGAAACACTGCCGCAAAAGGAAACCGGAGTTGGAGATGAAGCAGCAGAACCAGCAGAAGCAGCTGCAGCAGAAACAGCAGAAGGGCCAGGCGGAGAATAAGCCCGTGCGTCATTGTTGCCTGCCCAGCTGTGGCAAGCAGTCGGAGTTGCATGGTGTTCAGCTGCAGCGTCTGCCCAAAGATCGAATGATGTTGCGCAAATGGTTGCACAATCTAAAGCTGCCACCGAACACGGACTGCACCCAGCTATTCCTCTGCAGCGATCACTTCGAGACGAACTCACCGTGTCCAACTCTAAAGCTCGGCCATTCGGATACCAATATCTATCGCCACAGTACACCCAGCGCCATCAGTGCCGGCTGCCTGGTGCCCAAGTGTACTTGTGCGCGTCTCAATCTCTATCGTGGCTACGATCTGCCGGCGAATCAACAGGTGCAGGAGGCATGGCTCCGTTGGCTACAGCTGCCCCATCCGCAGCCATCGCCTCGGCACGCCCAGCTGTGTGTGATGCACTTCATGCAGCTTTATGAGCAGGTGCCGCTGCCCGACTCAGTGCCGGATTTTGTGCACCGCCAGCTGCGTGAGACCTACGAGCTAATCTCCAGCTCCAGCATGGCCATGAAACTACGCTGTGCTGTGCCCGGCTGCTACTCCAAATACACGGACAATGTGCGTTTGACCAAGCTGCCCATTTGCCAAAACACCTGCGCCAAGTGGGTGCACAACACCAAGATTCCATACGAAGCGGCGCGACACTATGTCTATCGCATCTGTATGCTGCACTTTGAGCCAAGCTGCCTGGGTCCAGTGCGTCCCAAGGTGTGGGCAATGCCCACCCTCCAACTGCATCACACGGATAAAAATATTTATTTGAATCCCAAAGTGGATGAGAGTCTACCGCAGCCTGTGGTGCCGCTGGAGCTGCCGCTGCGCATTAAAACGGAGCTGCCCACATGCAACAGTCCCAGTTTCAGTGCGAGTGCAAGTCCCAGTCCACGTGGCAAACATCGCACCTGTTGCATTCCCAGCTGCGGACAGCAGGCTTCCGCTCTGACGCGTCTCTTCCGCTTTCCCAGCGCGGAGACGGCTTTGCTGAAATGGCTGGTGAATACGCAGCAACAGCCGCGCTTTGTCGATACCCAACGGCTGTTCATCTGTCAGGAACACTTCGAGGCGGAGGCCATTTGCCAAAATCAGCTGCGCAGCTGGGCGGTACCCACGCTGAATCTGGGACATGACGGACACATCATTCCAAATGCACGGCACAATGGCAACATTGCCGACAGCCAGGAGAACAAGCAGACGCTGCAGTTCATCTGGGAGAACTATTGCTCGGTGCTGAGCTGCTTTCAGCTGAAAAGCGAGAACCTGCGTCTATATCCATATCCAACGGATCGACCAATTATACGTAAATGGGCCGCCAACTGTAAGCATCGCTCTATGCAGGCCAGCAGCGATGGCTTCCAGGTTTGCCATTCACACTTTACACCGGATTGTTTTGAACCCGAAACTGGGGAGTTAAAGGAGGATGCTGTGCCCACGCTGGCGCTTAGCCGGATTGTGAATGAGATGCGCTGTATTGTGAATGGTTGCATTAAGGATGAGGAGACACCGCGCCGTCTGTTCAAGATGCCCAAGCTTGCCGCACAGGTAGCCGATTGGTGCCACAATTTGCGCCTAGATCGAGCTTCCATAAGCGGCACTGATCCGCACGTTTGTGAGCGTCACTTTGAGGCACAATGCTTCAATGTGTATAAAACGCTGCGTCCAGGAGCGCGACCCACACTTCATTTGGGTCATGAGGAGCTAGAGGATTTATTGCCCAATCCAGCCAACTTTGAGGAGGATGCCTTCATGTGCTGTGTGCCCAACTGCGGCCGATCTAAGGATGCAGATAATGCTCTACTGTTTGGACTGCCAAAGCTGCGTCAATTGGCTGAGAAGTGGCTGCAAAATATTCGCCTCGATCCAAGCAAGGGACAGCTCACCTGCCTAAGAATCTGCAGTGTGCACTTCGAAGCCAGATGTTTGGAGAATGGACGTCCCACCTACGGTGCCATGCCAACGCTCCATCTGGGTCACGAGGAGCTGCGCGACATACACCCAATTGTTGAGCCGTTGCCAACCAAGCAGAAGCTCTATTGCAATAGAGATGGCGCCAGTCACGACTGCTGCTATCCAGAGTGCGTGGAGCTGCAGAAGAGCTATCTGCGTGTTACCTACGAGCTGCCCCAGAAGCAGGAGCTGCGTGAACAATGGCTCTCCTATATGGGCCTAAAGGAGCCGCTTGATAAGCAGCAGTTCCCAAAGCTATGTCCGCTGCACTTGATCTTGCTGTATGATCACAGTGTGGATAACTTTTCGGCACATGCAGGCGAGGAGCTGCTGGATGCCGACTATGAGGCATCGCGCAGCAGCGTTCGCATTCGTATTGTCAGCTGTGCGGTGCGTGGATGCAGAACGCTTAAGCCACGGGATGGAGGACGACTGCATGGCTTGCCCACCCGCCGGGATGTGCTCGAGATGTGGCTACACAATATGCAGCTGGTGTTTTACGAGCAGCAGCGTTATATGTACAAGATATGCAGCAAGCACTTTGAGCCCAGATGCCTGACGGAGACAACCAAGCGCCTGAAGCCCTGGAGCATGCCAACGCTGGAGCTGCCGGAGCGTCAACCGGGTGAAATGCCGCCCTATCAGAATCCCACAGAGGAGGAGTGGCAGCACATGAATGAGCTGCAGGCCAGCGCCAAAGAGGTTGAGGTGCAGCCGGATCCATTACTCAAGCTAGAGCCGCTGTGCAAGATGGAGCCAACGCCACAGGATACAGAAATGGAATATGAAGAGGATTATGACTACAACTCACAGCAGCCGCTGGAAATGCAGGCGCTGGAGGTGCTGCTTGAGGTTGGTCATGTCGAGAAGTGCGCCACCTATGAGCAAATGGATACCGAGCCAAATCCCAACTACGCCGAGCAACTCTCTCCCTTGGATGTGCCTGTGCCTCCAGTGCGCAGCATCGCGCCTGCCCAGAATGGATTCCATTACAGTGCACGTGTGTGCAGCGTGCATGGGTGCAATGTCAACACGAGCAACATAGATAGCAACATCAAGCTGCACAAGTTTCCCGTCTCGCTGGATGCCATGCAAAAGTGGATGCACAACACCCAAGTGAATGTGGACGTCAAAGTTGCTTGGCGCTTTCGCATCTGCAGTCATCATTTTATACCAGATTGCTTCCAGGGCTCGCGCATCAGACGTGGTGCAATGCCCACCTTGCGATTGGGATCGCGTCGACCAAAGCACATCTATGATAATGAGTTCAATAGCCAAATGCAGCTGGAACTGCAGTCCAAAGAGGAGCCCAGTGAGCCGCCTGAAGCAGCCCCTCCGGAGTCGCAGCAACAGTTGCTATCAGCGAATATTGGCCTGCGTCTGCCGCGTCCTGCCCCGCCCCGCAAATCCAGCAAATACTGTCAAATCGAGGGCTGTTCCAATCATTTGACCAGCGAGAATGTAACGCTACACAAGTTCCCCCACTCGACGGACATGTGCGCCAAGTGGCAGCACAACACGCAGGTGCCCTTTGATCCGGAATACCGTTGGCGCTATCGCATCTGCAGCGCACACTTCGAGCCCATTTGTTTGGGCAATGTGCGGCTGATGCACGGCAGTGTGCCCACACTGAATCTGGGACCGCTTGCGCCCAAGAAAGTGTTTGAGAACGATTTCATTCGGTTGGAAAAGCCCAGAAACAGTATTGACTTTGGCACTATGGACCAATATGATGAGGATGATGATCAGGAGCAGGAGGATTATAGCTTGCTGGAGCCAGAGCTGCAGCTACACGAGGGTAGCGACGAAGAGGAGCAACAGTATGACAATCAATCCTATAACTGGAGCGATCAGCAGCTGCGTTTGCCCAGCATTAAGCAGGAGAAGAGCACTAGCTTTAATACCGTCAAATCGGGCTATGACAAGTGCTCGTTGGGGCACTGCCAGCGCCAGCGTTCGCATCATGGCGTCCACATCTATAAGTTCCCGCGCTCGCGTCAACTGCAGCAGCGTTGGATGCACAACTTGCGCATCCAATACGACGAGCGACGGCCGTGGAAGACAATGATTTGCAGCGTTCACTTTGAGCCGAACTGCATCCGTTTGCGCAAGTTGCGTCCCTGGGCGGTGCCCACGCTGGAACTGGGTGACAATGTGCCACAGGAACTCTTCACAAATGAGGAGAGCCAGCAGCTGTATGCTCAGTCCGAAGCAGGCAGCGAGTGTGATGAGTTTGATGTGGATGTGGAGGACACCATGCTGGAGGACTTNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNCCAAATACGCACAGCTTCATATGTGAAAAGGGAACGTCGCTCGCGATTTGATCCTCTGCCGCCGGGACAGCTGCCACCTTGGAAGATCAAAACGTGCTGCCTGCCCTACTGTCGCAGTCCTCGCGGTGATGGCATCAAACTCTTTCGTCTGCCCAACAACGTTAGCTCCATACGTAAATGGGAACGGGCTACAGGCATGCGTTTCTGTGAGTCCCAGCGCAACACAAAGCTCATATGCAGTCGTCACTTTGAACCATCTCTTATTGGCGTGCGTCGCCTGATGTCCAATGCAGTGCCCAGCCTTCACCTGGGACCAGACAATGCAGAAGGCGAGCTGCCTCCTGTTGGGCCACGTTGCTGCATGGCTGATTGTCCGGAGGATGTTAATGTCGAGCTGCACAAGTTTCCAAAGGATCCTTTGCTGCTGCATCAATGGTGCCAGGCGCTCAATTTATCGAATGCGGACAGTTTTACCGGCAAACATATTTGTGACATGCATTTGCCAGCCAACGCGCTAAGCTGCCTCATTTGTGGTGTTGAGGATGTGCAAATGCCAATGCTGGACTTTCCTGAAAATCGCAATCAGCGCACCAAGTGGTGCTACAATCTTAAAATCGAACCTCTAACCAAATGGGACAACTCGAAGCACATTTGCTGCAAGCACTTTGAGAGCTTCTGTTTTATTCAGCCGGGTCAATTGCTGCCGGAGGCAATGCCCACGCTGCATTTAAAGCATGACGATATCAATATATTCCTAAACAATGATAGCATGGACAACAGCAAGATGCTGCGCATCAAGGACGAGCCCATGGATAGCGAAGATCTGATGCTGTAA
Protein Sequence: MYIAEPIDEHAFKSNYIDDNTPFADFSKFPEFGDDMLSPKVELTVKDEGYGSQKNPLNYPRRKLQSDRSAENMPICQRCKEVFFKKQIYLRHVAESNCNIHEYDYKCNICVMSFRAIEELHKHKLLHRADKFFCHKYCGKHFDSIAECESHEYMEHEYDNFVCNMCSVTFPTREQLYAHLPQHKFQQLNTTHHKANTALPATAALSSLLQQRQANADSAALYASGLKTETNVKLERSFSNSTSESGYSMQESSYNNAYGSDNSLHGGGSGIGGPQAHSSTLDDSEDALCCVPLCGVRKSTSPTLQFFTFPKDDKYLHQWLHNLKMFHIPASSYASFRICSMHFPKRCINRYSLCYWAVPTFNLGHDDVANLYQNRELTNTFTTGEVARCSMPNCTSQRGESNLKFYNFPKDIKSLIKWCQNARLPVQAKEPRHFCSRHFEERCIGKFRLKPWAVPTLHLGAQYGKIHDNPKNLYVEEKRCCLNFCRRSRSSDFNMSLYRFPRDEVLLRRWCYNLRLDPAVYRGKNHKICSAHFIKEALGLRKLSPGAVPTLHLGHNDTFNIYENELWPXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXHYVDPDLSASYMSMGAGGSSSSLNVSDSMDICCVPSCESKRHNNENITFHTIPRRPEQMRKWCHNLKIPEDKMHKGMRICSLHFEPYCIGGCMRPFAVPTLNLGHDDEDIHRNPDVIKKLNIRETCCVAVCKRNRDRDHANLHRFPSNLSLLTKWCANLQRPVPDGTKLFNDAICEVHFEDRCLRNKRLEKWAVPTLILGHENIPYPVPTPEQIADFYARPSAPNNGEEQGECCVETCKRNPCVDDIKLYRPPEESQVLAKWAHNLEVEITKLPNLRICNLHFESHCIGKRMRPWAIPTLNLASNIENLFENPERQMLYKRRTHLKPERAARGSLAAAGVKPTWVPRCCLPHCRKVRATHNVQLYRFPKLNRSTLAKWAHNLQVPLVGSAQRRLCSAHFEPHVLSKKCPVPLAVPTLELNTPPGYKIYQNPAKLKAKNLCLQRVCIVESCRRQRAQGVQLFRLPHSPTQLRKWMHNIRMRPRGAMRQQYRICSQHFETHSFNGKRLSAGAIPTLNLGHQDEDIFPNEAQSFVEEHCTVEGCDAAKEQPDVRLFRFPCEDEDLLWKWCNNLKMNPVDCIGVRICNKHFEPDCIGPKHIYKWAIPTLCLGHDDADIELICNPKPEDRYVDPVFKCCVPTCGKTRKFDEVQMNSFPKDPTLFHRWRHNLRLDHLNFKERERYKICNAHFEDICIGKTRLNIGSIPTLELGHDETEDLFQVNPEELQSNLFGRQRRIQDSMRVGIKQEPNSSELDEDIKPDLTMSEATDSNTTQVKIKKSLSDFKCCVPSCGRSCLEHGARLFPFPSGKQQHSKWRQNLQLSASDVDKNTRICSAHFNRRCIDGKMLRGWAMPTLQLGHQEQPLYENPKNIPGFFTPTCALAHCRQRRSIDNDLRTYRYPRSEELLEKWRVNLRLSPDQCRGRICADHFEPVVRGKLKLKTGAVPTLKLGHDEGVVFDNEAIKALLQLDDEEEDEEEEGDASLKSLVKVKTEKEEEEEERQELQXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXLLLPETQPLRLTLPPRREKAVNNVTPICCLKHCRKERTATHHLSTFGFPKDPQLLLKWSANLQLPLEDCVGRVCVEHFEPVMLGTRKLKQNAVPSLKLGHDTPLTYSCNGKMLSLVYGEQPQHSVFRLWSLKHCRKRKPELEMKQQNQQKQLQQKQQKGQAENKPVRHCCLPSCGKQSELHGVQLQRLPKDRMMLRKWLHNLKLPPNTDCTQLFLCSDHFETNSPCPTLKLGHSDTNIYRHSTPSAISAGCLVPKCTCARLNLYRGYDLPANQQVQEAWLRWLQLPHPQPSPRHAQLCVMHFMQLYEQVPLPDSVPDFVHRQLRETYELISSSSMAMKLRCAVPGCYSKYTDNVRLTKLPICQNTCAKWVHNTKIPYEAARHYVYRICMLHFEPSCLGPVRPKVWAMPTLQLHHTDKNIYLNPKVDESLPQPVVPLELPLRIKTELPTCNSPSFSASASPSPRGKHRTCCIPSCGQQASALTRLFRFPSAETALLKWLVNTQQQPRFVDTQRLFICQEHFEAEAICQNQLRSWAVPTLNLGHDGHIIPNARHNGNIADSQENKQTLQFIWENYCSVLSCFQLKSENLRLYPYPTDRPIIRKWAANCKHRSMQASSDGFQVCHSHFTPDCFEPETGELKEDAVPTLALSRIVNEMRCIVNGCIKDEETPRRLFKMPKLAAQVADWCHNLRLDRASISGTDPHVCERHFEAQCFNVYKTLRPGARPTLHLGHEELEDLLPNPANFEEDAFMCCVPNCGRSKDADNALLFGLPKLRQLAEKWLQNIRLDPSKGQLTCLRICSVHFEARCLENGRPTYGAMPTLHLGHEELRDIHPIVEPLPTKQKLYCNRDGASHDCCYPECVELQKSYLRVTYELPQKQELREQWLSYMGLKEPLDKQQFPKLCPLHLILLYDHSVDNFSAHAGEELLDADYEASRSSVRIRIVSCAVRGCRTLKPRDGGRLHGLPTRRDVLEMWLHNMQLVFYEQQRYMYKICSKHFEPRCLTETTKRLKPWSMPTLELPERQPGEMPPYQNPTEEEWQHMNELQASAKEVEVQPDPLLKLEPLCKMEPTPQDTEMEYEEDYDYNSQQPLEMQALEVLLEVGHVEKCATYEQMDTEPNPNYAEQLSPLDVPVPPVRSIAPAQNGFHYSARVCSVHGCNVNTSNIDSNIKLHKFPVSLDAMQKWMHNTQVNVDVKVAWRFRICSHHFIPDCFQGSRIRRGAMPTLRLGSRRPKHIYDNEFNSQMQLELQSKEEPSEPPEAAPPESQQQLLSANIGLRLPRPAPPRKSSKYCQIEGCSNHLTSENVTLHKFPHSTDMCAKWQHNTQVPFDPEYRWRYRICSAHFEPICLGNVRLMHGSVPTLNLGPLAPKKVFENDFIRLEKPRNSIDFGTMDQYDEDDDQEQEDYSLLEPELQLHEGSDEEEQQYDNQSYNWSDQQLRLPSIKQEKSTSFNTVKSGYDKCSLGHCQRQRSHHGVHIYKFPRSRQLQQRWMHNLRIQYDERRPWKTMICSVHFEPNCIRLRKLRPWAVPTLELGDNVPQELFTNEESQQLYAQSEAGSECDEFDVDVEDTMLEDXXXXXXXXXXXXXXXXXXXQIRTASYVKRERRSRFDPLPPGQLPPWKIKTCCLPYCRSPRGDGIKLFRLPNNVSSIRKWERATGMRFCESQRNTKLICSRHFEPSLIGVRRLMSNAVPSLHLGPDNAEGELPPVGPRCCMADCPEDVNVELHKFPKDPLLLHQWCQALNLSNADSFTGKHICDMHLPANALSCLICGVEDVQMPMLDFPENRNQRTKWCYNLKIEPLTKWDNSKHICCKHFESFCFIQPGQLLPEAMPTLHLKHDDINIFLNNDSMDNSKMLRIKDEPMDSEDLML

Similar Transcription Factors

Sequence clustering based on sequence similarity using MMseqs2

100% Identity: iTF_00595971;
90% Identity: -
80% Identity: -