Basic Information

Insect: Drosophila arawakana
Gene Symbol: -
Assembly: GCA_018151165.1
Location: JAECWX010000440.1:4648925-4663042[-]

Transcription Factor Domain

TF Family: THAP
Domain: THAP domain
PFAM: PF05485
TF Group: Zinc-Coordinating Group
Description: The THAP domain is a putative DNA-binding domain (DBD) and probably also binds a zinc ion. It features the conserved C2CH architecture (consensus sequence: Cys - 2-4 residues - Cys - 35-50 residues - Cys - 2 residues - His). Other universal features include the location of the domain at the N-termini of proteins, its size of about 90 residues, a C-terminal AVPTIF box and several other conserved residues. Orthologues of the human THAP domain have been identified in other vertebrates and probably worms and flies, but not in other eukaryotes or any prokaryotes [1].
Hmmscan Out: # of c-Evalue i-Evalue score bias hmm coord from hmm coord to ali coord from ali coord to env coord from env coord to acc

1 28 3e-15 5.4e-12 46.1 5.1 1 86 412 484 412 485 0.86

2 28 2.7e-15 4.8e-12 46.3 4.6 1 87 512 581 512 581 0.83

3 28 5.9e-16 1e-12 48.4 0.4 1 87 603 675 603 675 0.84

4 28 9e-16 1.6e-12 47.8 5.3 1 87 779 849 779 849 0.82

5 28 5.4e-15 9.5e-12 45.4 3.0 1 86 873 944 873 945 0.82

6 28 7.8e-13 1.4e-09 38.4 1.3 1 87 980 1048 980 1048 0.80

7 28 9.3e-11 1.6e-07 31.8 1.4 1 86 1096 1165 1096 1166 0.76

8 28 5.8e-16 1e-12 48.5 0.1 1 86 1193 1262 1193 1263 0.83

9 28 5.2e-13 9.2e-10 39.0 1.0 1 86 1284 1353 1284 1354 0.80

10 28 1.5e-14 2.7e-11 43.9 1.6 1 86 1381 1452 1381 1453 0.85

11 28 3.8e-14 6.8e-11 42.6 1.2 1 86 1536 1605 1536 1606 0.82

12 28 3.1e-12 5.5e-09 36.5 0.1 1 86 1629 1697 1629 1698 0.81

13 28 3.6e-08 6.4e-05 23.5 3.1 1 87 1841 1910 1841 1910 0.67

14 28 3.9e-13 6.8e-10 39.4 0.2 1 81 1966 2026 1966 2041 0.79

15 28 0.0081 14 6.3 0.0 1 58 2061 2111 2061 2126 0.78

16 28 9.3e-13 1.7e-09 38.2 0.9 1 86 2150 2219 2150 2220 0.85

17 28 7.7e-15 1.4e-11 44.9 2.2 1 86 2301 2370 2301 2371 0.83

18 28 1.1e-12 2e-09 37.9 0.9 1 86 2406 2477 2406 2478 0.80

19 28 1.7e-13 2.9e-10 40.6 1.1 1 87 2488 2562 2488 2562 0.82

20 28 2.9e-16 5.2e-13 49.4 0.1 1 86 2590 2660 2590 2661 0.82

21 28 6.1e-06 0.011 16.3 0.0 1 58 2694 2744 2694 2766 0.78

22 28 4.2e-13 7.5e-10 39.3 0.1 1 86 2782 2854 2782 2855 0.80

23 28 1.8e-14 3.2e-11 43.7 0.5 1 86 3025 3097 3025 3098 0.82

24 28 1.7e-13 3e-10 40.6 1.6 1 86 3165 3235 3165 3236 0.82

25 28 1.3e-14 2.4e-11 44.1 2.8 1 86 3331 3401 3331 3402 0.84

26 28 7.6e-13 1.3e-09 38.5 0.1 1 87 3486 3556 3486 3556 0.85

27 28 6e-08 0.00011 22.8 0.4 1 58 3575 3621 3575 3625 0.87

28 28 3e-11 5.3e-08 33.4 0.8 2 87 3628 3697 3627 3697 0.74

#	of	c-Evalue	i-Evalue	score	bias	hmm coord from	hmm coord to	ali coord from	ali coord to	env coord from	env coord to	acc
1	28	3e-15	5.4e-12	46.1	5.1	1	86	412	484	412	485	0.86
2	28	2.7e-15	4.8e-12	46.3	4.6	1	87	512	581	512	581	0.83
3	28	5.9e-16	1e-12	48.4	0.4	1	87	603	675	603	675	0.84
4	28	9e-16	1.6e-12	47.8	5.3	1	87	779	849	779	849	0.82
5	28	5.4e-15	9.5e-12	45.4	3.0	1	86	873	944	873	945	0.82
6	28	7.8e-13	1.4e-09	38.4	1.3	1	87	980	1048	980	1048	0.80
7	28	9.3e-11	1.6e-07	31.8	1.4	1	86	1096	1165	1096	1166	0.76
8	28	5.8e-16	1e-12	48.5	0.1	1	86	1193	1262	1193	1263	0.83
9	28	5.2e-13	9.2e-10	39.0	1.0	1	86	1284	1353	1284	1354	0.80
10	28	1.5e-14	2.7e-11	43.9	1.6	1	86	1381	1452	1381	1453	0.85
11	28	3.8e-14	6.8e-11	42.6	1.2	1	86	1536	1605	1536	1606	0.82
12	28	3.1e-12	5.5e-09	36.5	0.1	1	86	1629	1697	1629	1698	0.81
13	28	3.6e-08	6.4e-05	23.5	3.1	1	87	1841	1910	1841	1910	0.67
14	28	3.9e-13	6.8e-10	39.4	0.2	1	81	1966	2026	1966	2041	0.79
15	28	0.0081	14	6.3	0.0	1	58	2061	2111	2061	2126	0.78
16	28	9.3e-13	1.7e-09	38.2	0.9	1	86	2150	2219	2150	2220	0.85
17	28	7.7e-15	1.4e-11	44.9	2.2	1	86	2301	2370	2301	2371	0.83
18	28	1.1e-12	2e-09	37.9	0.9	1	86	2406	2477	2406	2478	0.80
19	28	1.7e-13	2.9e-10	40.6	1.1	1	87	2488	2562	2488	2562	0.82
20	28	2.9e-16	5.2e-13	49.4	0.1	1	86	2590	2660	2590	2661	0.82
21	28	6.1e-06	0.011	16.3	0.0	1	58	2694	2744	2694	2766	0.78
22	28	4.2e-13	7.5e-10	39.3	0.1	1	86	2782	2854	2782	2855	0.80
23	28	1.8e-14	3.2e-11	43.7	0.5	1	86	3025	3097	3025	3098	0.82
24	28	1.7e-13	3e-10	40.6	1.6	1	86	3165	3235	3165	3236	0.82
25	28	1.3e-14	2.4e-11	44.1	2.8	1	86	3331	3401	3331	3402	0.84
26	28	7.6e-13	1.3e-09	38.5	0.1	1	87	3486	3556	3486	3556	0.85
27	28	6e-08	0.00011	22.8	0.4	1	58	3575	3621	3575	3625	0.87
28	28	3e-11	5.3e-08	33.4	0.8	2	87	3628	3697	3627	3697	0.74

Sequence Information

Coding Sequence: ATGAATGCATACGGTACGGGAGCTGGTGGAGCGCATGCAGCATATTATGGCTCTGGTGGGGTGGGAGGCTATAACCTTGAGGGCAATACTAATCCTATGGCACCGCCGCCAGCTCCCGCGAATCGTCACAGTCTCGATGCCAGCGGCGAAATGATAATAAAATCGGAACCAGTAGATGAACATGCCTTCAAGTCCAACTATATTGATGATAACACGCCCTTCGCAGATTTTAGCAAATATCCAGAATTTAACGACGATATGTTGAGTCCCAAGGTTGAGCTATCGGTCAAGGACGAGGGCTATGGCAATCACAAAGTTCCCAATCCCCTGAGCTATCCCAGACGCAAGCTGCAGTCGGAGCGCTCATCGGAAGTTCTTCCCATTTGTCAGCGCTGCAAGGAGGTGTTCTTCAAGAAACAGATCTACGTGCGGCATGTGGCAGAGAGCAGTTGCACCATACAGGAGTATGACTTCAAGTGCAACATATGCCCCATGTCCTTTATGAGCACCGATGAATTGCAAAAGCACAAGCATCTACACAGAGCGGACAAGTTCTTTTGCCACAAATACTGTGGCAAGTACTATGATACAATTGCCGACTGTGAGTCGCATGAGTATATGCATCATGAGTACGATAGCTTTGTCTGCAATATGTGTTCCGTTACGTTTGCCACACGGGAGCAGCTGTACGCCCACTTGCCGCAGCACAAATTCCAACAGCGCTACGATTGCCCCATTTGCCGCTTGTGGTACCAGACGGCACACGAGCTGCACGAGCATCGTCTAGCTGCACCCTATTTCTGTGGCAAGTACTACGTTGGCTCACAGTCTGCGGCGGCACACCAGCAACAGCAGCAGCAGCATCCACAAGTCGGCTACAAGCTGCAGGACTGTCACATGGGAACCATGGAAATGGCCACTCCGCATCACAAGTCCAATGCAGCTGCCACCGCATTGCCAGCAACTGCAGCGCTCAGTTCGTTGTTGCAGCAACGACAGGCGAATGCCGATGGTGCTGCGCTGTTCGCCTCAAATCTTAAGAACGAATCAAATGTGAAGCTGGAGCGAAGTTATAGCAACTCCACAAGCGAATCGGGCTACAGTTTGCACGACAGCAGCTATAACAATGCCTATGGCAGTGATAACTCACTGCATGCTGGTGGTGCCGGTGGCGGTGCACTTGGTGGTCCACAGGCGCACTCCTCGACGCTGGACGATTCGGAGGATGCATTGTGTTGTGTGCCGCTGTGTGGTGTGCGCAAGAGCACCAGTCCAACGCTACAGTTCTTTACGTTCCCCAAGGATGAGAAGTACTTGCATCAGTGGCTGCATAATCTCAAAATGTTTCATATACCGCAATCCAGTTACTCAACCTTTCGCATCTGTAGCATGCACTTTCCGAAGCGTTGCATCAATCGTTATTCCCTGTGCTATTGGGCGGTGCCTACGTTTAATCTTGGCCACGATGATGTGGCCAATTTGTATCAGAATCGTGAACTGACCAATACCTTTACCACCGGCGAGGTGGCACGCTGCAGCATGCCCAACTGCACAAGTCAGCGGGGCGAGAGTAACCTCAAGTTTTATAACTTTCCCAAGGATATTAAGAGTCTGATCAAATGGTGCCAGAATGCACGTCTGCCCGTCCAGGCCAAGGAGCCGCGACACTTTTGCAGTCGTCACTTCGAGGAGCGTTGCATTGGCAAGTTTCGCCTGAAGCCCTGGGCTGTGCCCACATTACATTTGGGGGCACAGTACGGCAAGATACATGACAATCCGAAGAACTTGTATGTGGAGGAGAAACGCTGTTGTCTAAACTTCTGTCGTCGCAGTCGATCCTCCGACTTTAACATGTCCCTCTATCGCTTTCCTCGGGATGAGGTGCTGCTACGTCGCTGGTGCTACAATCTACGATTGGATCCTTCTGTTTATCGCGGCAAGAATCATAAAATATGCAGTGCTCACTTCATCAAAGAGGCGCTGGGACTTCGCAAGTTATCGCCAGGAGCTGTGCCCACGTTGCACTTGGGACACAACGACACGTTTAACATCTACGAGAATGAATTGTGGNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNGGCCGCTTCGACCTCCTCGTCGGCCAGCTCTGCATCGCATTATGTGGACCCGGAGATGAGTGGATCCTATATGGGAGTGGGCAACTCGGGTGGATCGGGATCAGGCATGAATGTAAGCGACAGCATGGATGTGTGCTGTGTGCCCAGCTGTGAGAGTAAGCGGCACAACAGTGAGAACATTACATTCCACACGATACCCAGGCGACCGGAGCAGATGAGCAAATGGTGTCACAATCTCAAGATACCCGAGGACAAGATGCACAAAGGTATGCGCATCTGTAGCCTGCACTTTGAGCCCTATTGTATTGGTGGTTGCATGCGTCCATTTGCGGTGCCCACACTGCATCTGGGCCACGACGACGAGGACATTCATCGCAATCCGGATGTGATCAAGAAGCTCAACATACGCGAGACCTGCTGTGTGGCTGTCTGCAAACGCAATCGGGATCGTGATCATGCCAATCTCCATCGTTTCCCCAGCAACATTGCGCTGCTGACCAAGTGGTGTGCCAATCTGCAACGTCCAGTGCCGGATGGCACTAAGCTCTTTAACGATGCCATCTGTGAGGTGCACTTTGAGGATCGTTGTCTGCGCAACAAGCGATTGGAGAAATGGGCTGTGCCCACTTTGATACTGGGTCATGAAAACATAGCGTATCCACTGCCCACGGCGGAGCAGGTGGCCGAGTTCTATGCTCGTCCCAGTGCACCCAACAATGGCGAGGAGCAGGGCGAGTGCTGTGTGGAGACTTGTAAGCGTAATCCCAGCGTGGATGACATCAAGCTCTATCGTCCGCCCGAGGAGTCACAAGTGCTGGCCAAGTGGGCACACAATCTGCAGGTGGATGTTGCCAAATTGACCAATCTGAGGATCTGTAATCTCCACTTTGAATCCCATTGCATTGGCAAACGCATGCGCCCTTGGGCCATACCCACGCTCAATCTCTCCACAAACATTGAGAATCTCTACGAGAATCCCGAGCATCAAATGCTCTACAAGCGTCGCAAGCATCTCAATACTGGACGCAGTGCAGCCTCCCATGACGGCGCTGGTGGCCTCGTGAAACCAACGTGGGTGCCACGCTGCTGTTTGCCACATTGCCGCAAGGTGCGTGCCCTGCACAATGTGCAGCTCTATCGCTTCCCCAAGCTCAATCGGTCCACGCTGGCCAAGTGGGCGCATAATCTGCAGGTGCCGCTGGTGGGCAGTGCCCAGAGACGTCTCTGTTCCGCCCACTTTGAGCCGCATGTGCTGAGCAAGAAGTGCCCCGTGCCACTGGCTGTGCCCACACTGGATCTGAACTCACCACCCGGCTACAAGATCTACCAAAACCCCGCCAAGCTCAAGGCCAACAAGCTGTGCCTGCAGCGCGTCTGCATTGTCGAAAGTTGTCGTCGCCAGCGTGGTCAGGGTGTGCAGCTCTTCCGGCTGCCCCATAATCCCACGCAGCTGCGCAAGTGGATGCACAACATAAGGATGCGACCCAGAGGCGCTATGCGTCAACAGTATCGCATGTGTTCCATACACTTTGAGACACACTCCTTCAATGGCAAGCGATTGAGTGCAGGAGCAATACCTACGCTGGAGCTGGGACATGACGATGATGATATCTATCCCAATGAGGCGCAATCCTTTGTCGAGGAGCACTGCACCGTTGAGGGTTGTGAGGCGTCCAAGGAGCAGCCAGACGTACGGCTCTTCCGCTTCCCCACCGACGACGAGGATCTGCTCTGGAAGTGGTGCAATAATCTCAAGATGAATCCCGTCGATTGTGCGGGTGTGCGCATTTGTAATAAACACTTTGAGCTGGACTGCATCGGTCCCAAGCATCTGTATAAGTGGGCGATACCCACTCTGGAGCTGGGACACGATGATGTTGAAATCGAGCTCATCGATAATCCTAAGCCAGAGGAGCGCTACGTGGATCCGGTGTTCAAGTGCTGTGTGCCCACCTGCGGCAAGACGCGCAAGTTCGATGAGGTCCAAATGAATAGCTTCCCCAAGGATCCCGTTGTCTTCCAGCGCTGGCGACACAATCTTCGTCTCGACCATCTGAATTTCAAGGAGCGCGAACGCTATAAGATCTGCAATGCTCACTTCGAGGACATCTGCATTGGTAAGACACGTCTCAACATTGGTTCTATACCCACGCTGGAGCTGGGACACGACGAGACCGAGGATCTATATCAGGTGAATCCCGAGGAGCTGCAGAGCAATCTCTTTGGACGTCAACGACGTGTACACGAGGCCATGGGCATGTCCATCAAGCAGGAGGAGGGTGAGGAGGAGGAAGGCGAAGAGGAGGAGCACTCTGAGCTGGATGAGGACATCAAGCCGGACATTAATATGCTACAAGCGAAGGCATCACAGGCAAAAATCAAGAGATCACTGACGGATCTGAAGTGCTGTGTGCCGAGTTGTGGTCGCAGCCGTTTAGAACATGGCGCACGTCTCTTCCCATTCCCCAGCGGCAAGCAACAGCAGACCAAATGGCGTCACAATCTACGCCTAGCGCCCAACGATGTGGATCGCAGCACACGTGTCTGCAGCGTTCACTTCAATCGGCGTTGCATCGATGGGAAACAGTTAAGGGGCTGGGCCATGCCCACGCTACAGTTGGGACACCAGGAGCAGCCCATCTATGAGAATCCTAAGAATATACCTGGCTTCTTTACGCCCACCTGTGCGCTGGCCCATTGCCGTAAACGTCGGAGCATTGACAACGATCTGCGCACCTATCGCTATCCCCGCAGCGAAGATCTACTCGAGAAATGGCGTGTGAATCTGCGCTTGGCGCCAGATCAGTGCCGTGGACGCATTTGTGCCGATCACTTTGAGCCGATGGTGCGTGGCAAGCTGAAACTGAAGACGGGAGCGGTGCCCACACTGAAATTGGGCCATGATGAAGGCGTCGTCTTTGACAACGAGGTCATTAAGGCAGGCCTGCAGCAAGAGGCGGACGAAAATGAGGCAAGCATGGACTCGTTGGTTAAGGTCAAGCAGGAAAAGTTGGAAGCAGAGGATGATGAGGATGAGGAGACGGTAGAGAAACAACAGCAGGAGGAAGATCATGGCTACTTCGATCCCTTGGAGTTGGTGGAAACCTTTGCGGAGCAGCNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNCCGCCAATTCGTATGCCGCTGCCTCCAATGCCAGCACGTCGCGAGAAGGCGGTGAACAATGTCACGCCCATTTGTTGCCTCAAGCATTGCCGCAAGGAGCGCACAGCCACGCATCCACTGAGCACTTTTGGCTTCCCCAAGGATCGTCAGNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNTTGCATGGGACGCGTCTGCATCGAACACTTTGATCCCGAGATGCTGGGCACCCGTAAGCTCAAGCAGAATGCGGTGCCCACTCTGAATCTGGGACACACGACACCGTTGCGGTACCGCTGCAATGGTCAAACTGTGGCCGTCTATGGGGATCAGCCGGAGCATTCGGTTTTTCGGCTTTGGAGCCTGAAACATTGTCGCAAACGGAAGCTTCCAATGGAGCCACCGATTCAGACAGCGACTAAGCGACGACGCTGCTGCCTGCCCAGCTGTGGCAAGCAGCCGGATCTTCACGGTGTTCAGCTGCATCGACTGCCCACCAATCGCATACAGCTGCGCAAGTGGCTGCATAATCTAAAGCTAGCACCCATGGTGGACAGCAGTCAGGCGCGGATTTGTAGCGAACACTTTGAGGCGCAGCTGGAGACGCTCGAGGATTGTGTGCCCACGCTGCGTCTGGGTCACGACGACACCCATATCTATCGGAATCGTGGTGGTGCCAGTGGTAGTGCCAGTGGCAGCTCGTCCTCATCCAGTGCCTGCATGGTGCCCAGTTGTCCCTGTGCGCGTCTCAATCTGTATCGCTGCTATGATCTGCCCGAGAATCGTCTGGTGCAACAGGCCTGGCTGGAGTGGCTACAGCAACCCATGCCTCAGTTGGCCAGTGATGGCAAGCTCTGTGTAATGCACTACATGCAGCTCTACGAGCAGGTTCCACTGCCCCCAGCGTTGCCCCAGCTGGTGCTGCGTCGTCTGCAGGAAACCTATGATTTAATCGCTGGCTCCACAATGGCCATGAAGCTACGCTGTGCCGTGCCAGGCTGTTACTCCAAGTACACGGACAACATACGGCTCACCAAGCTGCCCATGTGCCCGGAGACCTGTGCCAAGTGGGTGCACAACACCAAGATCAGCTATGAACCATCCCGTCACTACATCTATCGCATTTGCATGCTGCACTTTGAGCCAAGCTGCTTGGGTCCAGTGCGTCCCAAGCAGTGGGCGGTGCCGACGCTGCTATTGAATCACCAGGATGCCAAGATCTATCTGAATCCCAAGCTGGACACCAGCGCTGATAACCAGTCTGGCTCTGCTTTGTCCCTGTCGGATCCCATAGCCATCTCCACGCCTGTGCCCATAGCCATGTCCGCGTCGGTTCCCGTGGAGCTGCCGCTGCGCATTAAAACGGAGCTCGCCTTCAGTGGCAGTCCCTGTGCCAGCGCCAGTGCGAGTCCCAGTCCACGTGGCAGGCTGCGCATCTGCTGCATTCCAAGCTGTACACAGCAAGCTTCAAGTCACACCCGTCTCTATCGCTTTCCCACCGCCGAGACGGCGCTGCTCAAGTGGCTAGTAAACACACAGCAGCAGCCCAGATTGGTGGACACCACACAGTTGTTTGTGTGCCAGGAACACTTTGAGACGGAGGCCATTTGCAAGAATCAGCTGCGTAGCTGGGCAGTGCCTACGCTTAAGCTGGGACACGATGGTCATGTCATACCCAATGCTAGGCACAATGGCAACATTGCCGACAGCCAGGAGAACAAAACGACGCTGCAGTTTATCTGGGAGAACTATTGCTCGGTGCTGAGCTGCTTCCAGCCACGGTCGGAGCAACTGCGTCTCTATGCCTACCCCAAGGATCGACCCACCATACGCAAGTGGGCCACCAACTGCAAGCATCGTTCCATGCAGGCCAGCAGCGATGGCTTCCAGGTTTGTCAAACGCATTTTGGTCCACATTGCTTTGACCCAGAGACGGGTGAGTTGCGGGAGGATGCTGTGCCCACGTTGGAGCTCAGCCGTTGCCTCAATGAGATGCGCTGTGTGGTGGCCAATTGTCATCCTGTTTACACGGAGGATGCACCACGTCGCCGCTTCCACAAGTTGCCCAAACGCTACGCTCAGCTAAACATTTGGTGTCACAATCTGGGCCTGGACTCCGCTACATTGGGCTCCAGTGAGAATTACGTCTGCGATCGTCACTTTGAGATGCAGTGCTTCAATCCACAGAAGCAACTGCGTCCCGGAGCACGTCCCACGTTGCATTTGGGACACGAGCAGCCCATTGAGTTGTTACCCAATCCGGAGAATTTGGGCAGCTACGTGGAAGTGCCCGAGTCCATGGTCTGTTGTGTGCCCAACTGTGGACAAACCAAGGATGATCAAGATGTGCAGCTCTTTAATTTTCCCAAGATCCGTACGCTGGCAGAGAAGTGGCTGCAGAACCTACGCCTGGAGGCGGGCCGTGAACAGTTGCTCAAAATGAAGATCTGCGGCGCACACTTTGAGCCCAGTTGTGTGGAGAACAAGCGGCTCCAGCTGGGTGCCATGCCCACACTACAATTGGGACACGAGGAGCAGCACAACATACATCGAAGTGCCGAGCCGAATGTGGGCAAAGTCAAGAAATATTGTAATCGCAGTGGTTCCAGCTATGAGTGCTGTTATCCCAACTGTGTGGAGCTGCAGAAGACTTATCTGAGGATTAGCTATGATCTGCCCGAGGACGAGGCGTTGCGGCAAAAGTGGCTGGAGTATATGGATATAGTGGATGCAGAGCAGAAGCCACTGAAGCTCTGTCCGCTGCACTTGATCATACTCTATGATCACAGTGATGAGAACTTTGCAGAGCACACCAAGGAGGAACTGCTAGTCTCCAACTATGAGGATGCCAGGAACAGTGTGCGCATACGGGTCATCAGCTGTGCGGTGCGTGGTTGTCGTACACTCAAACCAAGAGACGGTGGACGATTGCATGGACTGCCCCAGCGGCGGGATGTGCTCGAGATGTGGCTATATAACATGCAGTTGGTGTTCTATGAGCACCAGCGATACTTGTACAAAATCTGTAGTCGACACTTTGAGCCCAGCTGCTTCATGGACACCACGCGACGTATGAAGCCCTGGACTATGCCGACGCTGGAGCTGCCCGAGCGTGAGCCAGGCGAGGCACCGGCTTATCAGAATCCCAGCGAGGAGGAGTGGCAGCGCATGAATGAACTGTTTGCCGCGGNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNGAAGAGCAGTACGAGGAAGATTGCGATTTGTTGGAACCGATTGTGAAGATTGAGCACATGGGCAACGAAGATCAGTTCGATGAGGAGGCCGAGTATCAGCAGCAGGAGCAGCAACGGGAAGAGCTGGAGGAGGATGAGTATGACAACTCACAGCAGCCACTGGAGGTGCTGCTTGAGGTGGGACACGTTGAGAAGTGCACCACCTACGAGCAAATGGACTCCGAAGCCGATCAAAGCTATGCCGCCGCCGCAGCCGAGCAGCAGCTGAATAGTTTCAGTGCCACAGCAGCATCAACGCCGCATCATGGTAGTGGCAACAAGGTCAACAATGGCCAAATTGTCAAGTACAATGCTCGGCACTGCAGCGTGCAGGGCTGTGATGTGACGGCCAATGATGTGAATGGCACCATCAAGCTGCACAAGTTCCCTACATCCCTGGATGCGATGAAGAAGTGGATGCACAACACGCAGGTGGATGTGGACACGAATTTCGCTTGGCGTTTTCGCATCTGTAGCTATCACTTTAGCAATGAATGCTTCAATGGCTCACGCATTCGACGTGGCTCAATGCCCACCTTGAGCCTCGGTCCACGTTGTCCACGGAAAATCTACCACAATGAGTTCAATACATCGCTGCAGTTGGAACAGGAGCAGTCCAATGATGTGGACAACGAGGAGCAGCCACAAATGAAACTGGACACGAAGCATGGCAGCACAACGGGTGGAAAGGTCAGTCTACGACTGCCACATCCGGCTCCGCCACGTAAATCCAGTAAATACTGTCAGATCGATGGTTGTCCCAATCACCTGACCAGCGAGAATCTCACACTGCACAAGTTCCCGCACTCAGTGGACATGTGCGCCAAGTGGCAGCACAATACCCAGGTGCCATTCGATCCAGAGTTCCGCTGGCGTTATCGCATCTGCAGTGCCCACTTTGAGCCCATCTGCCTGATGAATATGCGCCTGATGCACGGCAGTGTGCCCACTTTGCTGCTGGGACCACGTGCGCCTCGCCAACTCTTCGATAGTGACTTTGAGGCCATAAGTATGCGACTGGATAAGCAGAAGAGTGGATCAGAGCAGCAGGAGCACATGCTGCTTGAGCCAGAGGATGGAGAGGAAATGGGTTATCTCGAGCCGGAGATGCAGCTGCTGGAGGATGCCGAAGCGGAGCAATCCGATAATCCCAATGAAAGCTGGAAGGATCTGCCTTTGCCTGGCATTAAGATGGAGACGGGCACCAGCTACAATCCTGTAAAGTCTGGCTATGATAAGTGCTCCCTGGTGCACTGCCAGCGTCAGCGTTCCATGCACGGTGTACACATCTACAAGTTTCCACGCTCCCGACAACTGCAGCAACGTTGGATGCACAATCTACGCATACGCTATGATGAACGTCGTCCCTGGAAGACCATGATATGCAGCGTGCACTTTGAAGCCAGTTGCATACGTCTGCGTAAGCTGCGTCCCTGGGCGGTGCCTACTCTGGAGCTGGGCGACAATGTACCCGACCAGATCTATACAAATGAACAGTGCCGCCAGCAGCTGGAGACGGGCAGTAGTGACAATGAGGAACTCGGTCTGGATGCGTCCATGGAGGAGGATTTGGCCTTGGAAGACGACGACTTTGCTGATGAAGACGATGATGTGCTGGCCACGGAGCCGTTGGTGAAGAGAGAGCGTCGCTCTAAGTTTGATGCCTATGCACCGGGTCAGTTGCCGCCTTGGAAAGTTAAATTCTGTTCCTTGCCCTATTGCCGGCATCCACGTGGCGATGGCATCAAGCTCTTCCGCCTGCCCAACAACATCAGTTCCATACGCAAATGGGAGCACGCGACGGGCATTAAATTCACAGAGTCCCAGCGCAACACGAAGCTCATTTGTAGTCGTCACTTTGATCCGCAACTGATTGGAGTGCGTCGTCTGATGTACAATGCGGTGCCCACGTTGCATTTGGGGCCAATGAGTGATTTGGTTGAGCCAGCGCCAGCTGCTCCTGCTCCGCGTTGCTATATGCCCAATTGTCGGGAGGACGAGAAGCTGCACAAGTTTCCTAGTGATCCCGTGCTGCTGCAGCAGTGGTGTCACTCACTGAATCTCTCGGATACTGCAAACTATAGTGGCAAACACATCTGTGCCTTCCATATGCCCGATCTGGGACCGTGTTGCCTCATCTGTGGCACGGAGGACATGCAGTTGCCGTTGCTAAACTTCCCAGAGAATCGCAATCAACGCGCCAAATGGTGCTATAATCTCAAAATCGAATCCATAGCCAAGTGGGATACCTCAAAGCAGATATGCAGCAAGCATTTTGAGAGCTACTGCTTCGCAGAGTCGGGTCAACAGCTGCTAGCTGATGCAGCGCCCACGTTGCACCTAAGACACAACGATAGCAACATATTCCTTAACGATTACGAGGTCACAGAGCAAGATCCAAGCAGAATGTTGGCCATTAAGGATGAGCCCTTTGGACAGTAG
Protein Sequence: MNAYGTGAGGAHAAYYGSGGVGGYNLEGNTNPMAPPPAPANRHSLDASGEMIIKSEPVDEHAFKSNYIDDNTPFADFSKYPEFNDDMLSPKVELSVKDEGYGNHKVPNPLSYPRRKLQSERSSEVLPICQRCKEVFFKKQIYVRHVAESSCTIQEYDFKCNICPMSFMSTDELQKHKHLHRADKFFCHKYCGKYYDTIADCESHEYMHHEYDSFVCNMCSVTFATREQLYAHLPQHKFQQRYDCPICRLWYQTAHELHEHRLAAPYFCGKYYVGSQSAAAHQQQQQQHPQVGYKLQDCHMGTMEMATPHHKSNAAATALPATAALSSLLQQRQANADGAALFASNLKNESNVKLERSYSNSTSESGYSLHDSSYNNAYGSDNSLHAGGAGGGALGGPQAHSSTLDDSEDALCCVPLCGVRKSTSPTLQFFTFPKDEKYLHQWLHNLKMFHIPQSSYSTFRICSMHFPKRCINRYSLCYWAVPTFNLGHDDVANLYQNRELTNTFTTGEVARCSMPNCTSQRGESNLKFYNFPKDIKSLIKWCQNARLPVQAKEPRHFCSRHFEERCIGKFRLKPWAVPTLHLGAQYGKIHDNPKNLYVEEKRCCLNFCRRSRSSDFNMSLYRFPRDEVLLRRWCYNLRLDPSVYRGKNHKICSAHFIKEALGLRKLSPGAVPTLHLGHNDTFNIYENELWXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXAASTSSSASSASHYVDPEMSGSYMGVGNSGGSGSGMNVSDSMDVCCVPSCESKRHNSENITFHTIPRRPEQMSKWCHNLKIPEDKMHKGMRICSLHFEPYCIGGCMRPFAVPTLHLGHDDEDIHRNPDVIKKLNIRETCCVAVCKRNRDRDHANLHRFPSNIALLTKWCANLQRPVPDGTKLFNDAICEVHFEDRCLRNKRLEKWAVPTLILGHENIAYPLPTAEQVAEFYARPSAPNNGEEQGECCVETCKRNPSVDDIKLYRPPEESQVLAKWAHNLQVDVAKLTNLRICNLHFESHCIGKRMRPWAIPTLNLSTNIENLYENPEHQMLYKRRKHLNTGRSAASHDGAGGLVKPTWVPRCCLPHCRKVRALHNVQLYRFPKLNRSTLAKWAHNLQVPLVGSAQRRLCSAHFEPHVLSKKCPVPLAVPTLDLNSPPGYKIYQNPAKLKANKLCLQRVCIVESCRRQRGQGVQLFRLPHNPTQLRKWMHNIRMRPRGAMRQQYRMCSIHFETHSFNGKRLSAGAIPTLELGHDDDDIYPNEAQSFVEEHCTVEGCEASKEQPDVRLFRFPTDDEDLLWKWCNNLKMNPVDCAGVRICNKHFELDCIGPKHLYKWAIPTLELGHDDVEIELIDNPKPEERYVDPVFKCCVPTCGKTRKFDEVQMNSFPKDPVVFQRWRHNLRLDHLNFKERERYKICNAHFEDICIGKTRLNIGSIPTLELGHDETEDLYQVNPEELQSNLFGRQRRVHEAMGMSIKQEEGEEEEGEEEEHSELDEDIKPDINMLQAKASQAKIKRSLTDLKCCVPSCGRSRLEHGARLFPFPSGKQQQTKWRHNLRLAPNDVDRSTRVCSVHFNRRCIDGKQLRGWAMPTLQLGHQEQPIYENPKNIPGFFTPTCALAHCRKRRSIDNDLRTYRYPRSEDLLEKWRVNLRLAPDQCRGRICADHFEPMVRGKLKLKTGAVPTLKLGHDEGVVFDNEVIKAGLQQEADENEASMDSLVKVKQEKLEAEDDEDEETVEKQQQEEDHGYFDPLELVETFAEQXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXPPIRMPLPPMPARREKAVNNVTPICCLKHCRKERTATHPLSTFGFPKDRQXXXXXXXXXXXXXXXCMGRVCIEHFDPEMLGTRKLKQNAVPTLNLGHTTPLRYRCNGQTVAVYGDQPEHSVFRLWSLKHCRKRKLPMEPPIQTATKRRRCCLPSCGKQPDLHGVQLHRLPTNRIQLRKWLHNLKLAPMVDSSQARICSEHFEAQLETLEDCVPTLRLGHDDTHIYRNRGGASGSASGSSSSSSACMVPSCPCARLNLYRCYDLPENRLVQQAWLEWLQQPMPQLASDGKLCVMHYMQLYEQVPLPPALPQLVLRRLQETYDLIAGSTMAMKLRCAVPGCYSKYTDNIRLTKLPMCPETCAKWVHNTKISYEPSRHYIYRICMLHFEPSCLGPVRPKQWAVPTLLLNHQDAKIYLNPKLDTSADNQSGSALSLSDPIAISTPVPIAMSASVPVELPLRIKTELAFSGSPCASASASPSPRGRLRICCIPSCTQQASSHTRLYRFPTAETALLKWLVNTQQQPRLVDTTQLFVCQEHFETEAICKNQLRSWAVPTLKLGHDGHVIPNARHNGNIADSQENKTTLQFIWENYCSVLSCFQPRSEQLRLYAYPKDRPTIRKWATNCKHRSMQASSDGFQVCQTHFGPHCFDPETGELREDAVPTLELSRCLNEMRCVVANCHPVYTEDAPRRRFHKLPKRYAQLNIWCHNLGLDSATLGSSENYVCDRHFEMQCFNPQKQLRPGARPTLHLGHEQPIELLPNPENLGSYVEVPESMVCCVPNCGQTKDDQDVQLFNFPKIRTLAEKWLQNLRLEAGREQLLKMKICGAHFEPSCVENKRLQLGAMPTLQLGHEEQHNIHRSAEPNVGKVKKYCNRSGSSYECCYPNCVELQKTYLRISYDLPEDEALRQKWLEYMDIVDAEQKPLKLCPLHLIILYDHSDENFAEHTKEELLVSNYEDARNSVRIRVISCAVRGCRTLKPRDGGRLHGLPQRRDVLEMWLYNMQLVFYEHQRYLYKICSRHFEPSCFMDTTRRMKPWTMPTLELPEREPGEAPAYQNPSEEEWQRMNELFAAXXXXXXXXXXXXXXXXXXXXEEQYEEDCDLLEPIVKIEHMGNEDQFDEEAEYQQQEQQREELEEDEYDNSQQPLEVLLEVGHVEKCTTYEQMDSEADQSYAAAAAEQQLNSFSATAASTPHHGSGNKVNNGQIVKYNARHCSVQGCDVTANDVNGTIKLHKFPTSLDAMKKWMHNTQVDVDTNFAWRFRICSYHFSNECFNGSRIRRGSMPTLSLGPRCPRKIYHNEFNTSLQLEQEQSNDVDNEEQPQMKLDTKHGSTTGGKVSLRLPHPAPPRKSSKYCQIDGCPNHLTSENLTLHKFPHSVDMCAKWQHNTQVPFDPEFRWRYRICSAHFEPICLMNMRLMHGSVPTLLLGPRAPRQLFDSDFEAISMRLDKQKSGSEQQEHMLLEPEDGEEMGYLEPEMQLLEDAEAEQSDNPNESWKDLPLPGIKMETGTSYNPVKSGYDKCSLVHCQRQRSMHGVHIYKFPRSRQLQQRWMHNLRIRYDERRPWKTMICSVHFEASCIRLRKLRPWAVPTLELGDNVPDQIYTNEQCRQQLETGSSDNEELGLDASMEEDLALEDDDFADEDDDVLATEPLVKRERRSKFDAYAPGQLPPWKVKFCSLPYCRHPRGDGIKLFRLPNNISSIRKWEHATGIKFTESQRNTKLICSRHFDPQLIGVRRLMYNAVPTLHLGPMSDLVEPAPAAPAPRCYMPNCREDEKLHKFPSDPVLLQQWCHSLNLSDTANYSGKHICAFHMPDLGPCCLICGTEDMQLPLLNFPENRNQRAKWCYNLKIESIAKWDTSKQICSKHFESYCFAESGQQLLADAAPTLHLRHNDSNIFLNDYEVTEQDPSRMLAIKDEPFGQ

Similar Transcription Factors

Sequence clustering based on sequence similarity using MMseqs2

100% Identity: iTF_00569010; iTF_00470904;
90% Identity: iTF_00470904;
80% Identity: -