Basic Information

Insect: Drosophila mojavensis
Gene Symbol: -
Assembly: GCA_018153725.1
Location: JAECYD010000049.1:3498649-3514598[+]

Transcription Factor Domain

TF Family: THAP
Domain: THAP domain
PFAM: PF05485
TF Group: Zinc-Coordinating Group
Description: The THAP domain is a putative DNA-binding domain (DBD) and probably also binds a zinc ion. It features the conserved C2CH architecture (consensus sequence: Cys - 2-4 residues - Cys - 35-50 residues - Cys - 2 residues - His). Other universal features include the location of the domain at the N-termini of proteins, its size of about 90 residues, a C-terminal AVPTIF box and several other conserved residues. Orthologues of the human THAP domain have been identified in other vertebrates and probably worms and flies, but not in other eukaryotes or any prokaryotes [1].
Hmmscan Out: # of c-Evalue i-Evalue score bias hmm coord from hmm coord to ali coord from ali coord to env coord from env coord to acc

1 28 4.5e-15 1e-11 45.4 4.4 1 86 371 443 371 444 0.85

2 28 2.4e-15 5.4e-12 46.3 4.6 1 87 471 540 471 540 0.83

3 28 5.8e-16 1.3e-12 48.3 0.4 1 87 562 634 562 634 0.85

4 28 5.2e-16 1.2e-12 48.4 5.6 1 87 739 809 739 809 0.83

5 28 5.7e-15 1.3e-11 45.1 3.0 1 86 833 904 833 905 0.82

6 28 1e-12 2.3e-09 37.9 1.0 1 87 940 1008 940 1008 0.81

7 28 9.8e-11 2.2e-07 31.5 1.4 1 86 1053 1122 1053 1123 0.76

8 28 2.9e-17 6.6e-14 52.5 0.2 1 86 1150 1219 1150 1220 0.83

9 28 3.9e-14 8.7e-11 42.4 0.8 1 86 1241 1310 1241 1311 0.81

10 28 6.3e-15 1.4e-11 45.0 1.7 1 86 1338 1409 1338 1410 0.85

11 28 7e-14 1.6e-10 41.6 2.2 1 86 1461 1531 1461 1532 0.83

12 28 7.5e-13 1.7e-09 38.3 0.1 1 86 1555 1623 1555 1624 0.81

13 28 6.7e-14 1.5e-10 41.7 1.0 1 87 1779 1848 1779 1848 0.80

14 28 2e-12 4.5e-09 36.9 0.7 1 62 1984 2045 1984 2060 0.78

15 28 5.4e-05 0.12 13.1 0.1 1 58 2065 2115 2065 2130 0.83

16 28 2.9e-13 6.6e-10 39.6 0.4 1 87 2154 2224 2154 2224 0.83

17 28 4.8e-15 1.1e-11 45.3 1.0 1 86 2288 2357 2288 2358 0.83

18 28 1.6e-13 3.7e-10 40.4 0.7 1 86 2393 2464 2393 2465 0.80

19 28 1.2e-10 2.7e-07 31.3 1.1 1 87 2475 2547 2475 2547 0.81

20 28 1.9e-14 4.3e-11 43.4 0.1 1 87 2570 2641 2570 2641 0.83

21 28 0.00072 1.6 9.5 0.0 1 58 2672 2723 2672 2743 0.80

22 28 5.2e-14 1.2e-10 42.0 0.9 1 86 2758 2830 2758 2831 0.82

23 28 2.8e-13 6.3e-10 39.7 0.1 1 86 2993 3065 2993 3066 0.81

24 28 1.1e-14 2.6e-11 44.1 1.3 1 86 3124 3194 3124 3195 0.82

25 28 8.3e-15 1.9e-11 44.6 3.9 1 86 3310 3380 3310 3381 0.85

26 28 2.7e-12 6.2e-09 36.5 0.1 1 86 3465 3534 3465 3535 0.84

27 28 4.7e-08 0.00011 22.9 1.0 1 58 3555 3603 3555 3616 0.87

28 28 3.3e-10 7.4e-07 29.9 0.7 19 87 3621 3678 3609 3678 0.76

#	of	c-Evalue	i-Evalue	score	bias	hmm coord from	hmm coord to	ali coord from	ali coord to	env coord from	env coord to	acc
1	28	4.5e-15	1e-11	45.4	4.4	1	86	371	443	371	444	0.85
2	28	2.4e-15	5.4e-12	46.3	4.6	1	87	471	540	471	540	0.83
3	28	5.8e-16	1.3e-12	48.3	0.4	1	87	562	634	562	634	0.85
4	28	5.2e-16	1.2e-12	48.4	5.6	1	87	739	809	739	809	0.83
5	28	5.7e-15	1.3e-11	45.1	3.0	1	86	833	904	833	905	0.82
6	28	1e-12	2.3e-09	37.9	1.0	1	87	940	1008	940	1008	0.81
7	28	9.8e-11	2.2e-07	31.5	1.4	1	86	1053	1122	1053	1123	0.76
8	28	2.9e-17	6.6e-14	52.5	0.2	1	86	1150	1219	1150	1220	0.83
9	28	3.9e-14	8.7e-11	42.4	0.8	1	86	1241	1310	1241	1311	0.81
10	28	6.3e-15	1.4e-11	45.0	1.7	1	86	1338	1409	1338	1410	0.85
11	28	7e-14	1.6e-10	41.6	2.2	1	86	1461	1531	1461	1532	0.83
12	28	7.5e-13	1.7e-09	38.3	0.1	1	86	1555	1623	1555	1624	0.81
13	28	6.7e-14	1.5e-10	41.7	1.0	1	87	1779	1848	1779	1848	0.80
14	28	2e-12	4.5e-09	36.9	0.7	1	62	1984	2045	1984	2060	0.78
15	28	5.4e-05	0.12	13.1	0.1	1	58	2065	2115	2065	2130	0.83
16	28	2.9e-13	6.6e-10	39.6	0.4	1	87	2154	2224	2154	2224	0.83
17	28	4.8e-15	1.1e-11	45.3	1.0	1	86	2288	2357	2288	2358	0.83
18	28	1.6e-13	3.7e-10	40.4	0.7	1	86	2393	2464	2393	2465	0.80
19	28	1.2e-10	2.7e-07	31.3	1.1	1	87	2475	2547	2475	2547	0.81
20	28	1.9e-14	4.3e-11	43.4	0.1	1	87	2570	2641	2570	2641	0.83
21	28	0.00072	1.6	9.5	0.0	1	58	2672	2723	2672	2743	0.80
22	28	5.2e-14	1.2e-10	42.0	0.9	1	86	2758	2830	2758	2831	0.82
23	28	2.8e-13	6.3e-10	39.7	0.1	1	86	2993	3065	2993	3066	0.81
24	28	1.1e-14	2.6e-11	44.1	1.3	1	86	3124	3194	3124	3195	0.82
25	28	8.3e-15	1.9e-11	44.6	3.9	1	86	3310	3380	3310	3381	0.85
26	28	2.7e-12	6.2e-09	36.5	0.1	1	86	3465	3534	3465	3535	0.84
27	28	4.7e-08	0.00011	22.9	1.0	1	58	3555	3603	3555	3616	0.87
28	28	3.3e-10	7.4e-07	29.9	0.7	19	87	3621	3678	3609	3678	0.76

Sequence Information

Coding Sequence: ATGGCCCCGCCGCCAGCACCCGCCTCCAATCGCCACACGCTTGATGCTAGCGGCGAAATGATAATAAAATCGGAACCCATTGAGGAACATGTGTTTAAGTCCAACTATATTGATGATAATACGCCCTTTGCCGATTTTAACAAATTTCCCGAATTCGGCGACGAAATGCTGAGTCCAAAGGTGGAGCTAACTGTAAAGGATGATGCCTATGGCAACCAAAAGAATCCGCTCAGCTTTCCTCGCCGAAAGCTGCAAACGGAACGTTCCTCGGAAAGCCTGCCCATCTGCCAACGCTGCAAGGAGGTGTTCTTTAAGAAACAAATCTATTTGCGGCATGTGGCCGAGAGCAGTTGCACGATCCAAGAGTACGACTACAAGTGCAACATCTGTCCCATGTCCTTCATGGGCGCCGAGGATATACAGAAGCACAAGCAACTGCACCGCGCTGACAAGTTCTTCTGTCACAAATACTGTGGCAAGTACTTTGACAATATTGCCGATTGCGAGTCGCACGAGTACATGGAACACGACTACGACAGCTTTGTTTGCAATATGTGCTCAATGACATTTCCTACGCGCGAACAGCTTTACGCCCATTTGCCGCAGCACAAGTTTCAGCAGCGCTTCGATTGCCCGATTTGCCGCTTATGGTATCAAACCGCGCTCGAGTTGCACGAGCATCGCCTAGCGGCCCCATACTNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNAACTGCAGGATTGCCACATGGGAACGATAGAGATGACTGCGTCTCAGCATAAAGCAAATGCGCTGCCTGCCACGGCGGCGCTTAGTTCCTTGCTACATCAGCGTCAAGCGAATGCTGATGGTGGCGCCTCCCTCTTTGCCTCTTCCTTAAAGAACGAGCCGAGTGTTAAGCTGGAGCGAAGCTACAGCAACTCGACCAGCGAGTCCGGATATAGCATGCACGAGAACAGCGGCTACAACAATGCATATGGGAGTGACAACTCGCTGCATGCGAGTGGTGTTGCAATCGGTGGACCGCAGGCACATTCCTCCACGCTGGATGAATCGGAAGATGCGCTGTGCTGCGTACCATTGTGTGGAGTGCGCAAAAGCACCAGCCCTACTCTGCAGTTCTTCACGTTTCCCAAGGACGAGAAGTATCTGCATCAATGGCTGCACAATCTCAAAATGTTTCACATACCTGCGTCGAGCTATGTCAGCTTTCGCATTTGTAGCATGCATTTTCCGAAGCGTTGCATAAATCGCTATTCGTTGTGCTATTGGGCAGTGCCTACGTTCAACCTGGGCCACGACGATGTCGCAAATTTGTATCAGAATCGAGAGTTGACCAACACATTTACCACCGGAGAGGTGGCTCGGTGCAGCATGCCCAATTGCACGAGCCAGCGTGGCGAAAGTAATCTCAAGTTTTACAATTTTCCGAAAGACATCAAGAGTCTGATCAAATGGTGCCAGAACGCACGTCTGCCCGTCCAGGCCAAAGAGCCGCGTCACTTCTGCAGTCGGCACTTCGAGGAGCGTTGCATTGGCAAATTCCGACTGAAACCCTGGGCTGTACCTACGCTCCATTTGGGAGCTCAGTATGGCAAGATTCATGACAATCCGAAGAATCTGTATGTTGAGGAGAAACGTTGCTGCCTGAACTTTTGTCGCCGCAGTCGCTCCTCGGACTTCAACATGTCGCTTTACCGGTTCCCCAGAGATGAGGTATTGCTGCGTCGCTGGTGCTATAACTTGAGACTCGATCCGGCAGTGTATCGTGGGAAAAATCACAAAATTTGCAGCGCTCACTTCATTAAGGAAGCCCTCGGCTTACGGAAATTGTCGCCAGGCGCTGTGCCAACTCTACACCTGGGCCACAGTGACACCTTCAACATCTACGAAAATGAACTGTGGCCTCCTCCGACGGCCTCGACGCCCANNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNATTCATCACAAATACCAGAGGCACTCTGCTGCGTCCACTTCCTCGTCGGCCAGCTCTACATCCCACTATGTGGATCCGGAGCTAAGTGCCTCCTACATGGCCATGGGCATGGGCTCTGGCAATTCAACCTCTGGACTGAATGTGAGCGACAGCATGGACGTCTGCTGTGTGCCCAGCTGCGAAAGCAAGCGACACAACAATGAGAACATCACATTCCATACGATACCTAGGCGCCCGGAGCAGATGCGCAAATGGTGTCACAATCTGCGTATACCCGAGGACAAGATGCACAAGGGCATGCGCATATGCAGTCTGCATTTCGAGCCCTATTGCATTGGCGGCTGCATGCGTCCGTTCGCGGTGCCAACGCTGCATTTGGGCCACGATGAAGAGGACATTCATCGCAATCCGGATGTAATCAAGAAGCTGAACATACGCGAGACCTGTTGCGTGGCAGTGTGCAAACGCAATCGGGATCGGGACCACGCCAATCTGCATCGTTTTCCCAGCAATGTGGCGCTGCTAACCAAATGGTGTGCCAATTTGCAGCGCACTGTTCCGGATGGGATCAAACTCTTCAACGATGCTATTTGCGAGGTTCATTTCGAGGAACGGTGCTTACGTAATAAGCGGCTAGAGAAGTGGGCAGTGCCCACTCTTATGCTCGGCCACGATAACATTCCCTATCCTCTTCCCACTCCAGAGCAGGTGGCCGAGTTCTATGCTCGACCAAGTGCTCCAAACAATGGCGAAGAACAGGGTGAATGCTGTGTGGAGACCTGTAAGCGCAATCCCAGCGTGGATGACATCAAGCTCTATCGACCGCCGGAGGAGTCCCAAGTGCTGACCAAATGGGCGCACAATCTGCAGATAGACATCGCTCAGCTGCCTTCCATGCGCATCTGCAATCTACACTTCGAAGCCCACTGCATAGGCAAGCGAATGCGTCCGTGGGCCATACCCACGCTCAATCTTGCCACTAACATAGAGAATCTCTTTGAGAACCCCGAGCAGCAGATGCTGTACAAGCGCCGCACCTCCCATCTCAGCGGGCAAAGAGAAGGAAGTGGTGGAAGCATTACCAAGCCCACCTGGGTGCCACGCTGCTGTCTGCCCCACTGCCGCAAGGTGCGCGCTTTGCACAACGTCCAACTATATCGGTTTCCCAAACTCAATCGCGCCACGTTGGCAAAGTGGGCGCACAATCTGCAAGTTCCGATGGTTGGAAGTGCTCAGAGACGTCTCTGCTCCGCGCACTTTGAGTCTCACGTCCTTAGCAAGAAGTGCCCAGTGCCGCTAGCGGTGCCTACGCTCGATCTCAATACTCCACCAGGTTACAAGATTTACCAAAACCCAGCCAAGATCAAAGCAAACAAGCTGTGCATGCAACGCGTCTGCATTGTGGAGAGCTGTCGTCGGCAGCGTGGCCAGGGTGTCCAGCTCTTCCGGCTGCCCCACAACCCCACCCAGCTGCGCAAGTGGATGCACAACATACGCATGCGACCGCGCGGTGCCATGCGACAACAGTACCGCATCTGCTCGCGGCACTTTGAGACGCACTCGTTCAACGGCAAGCGCTTGAGCACTGGCGCCATTCCGACTCTCGAGCTGGGCCATCAGGACGACGACATCTATCCGAATGAGGCGCAGTCGTTTGTCGAGGAGCACTGCGCTATCGAGGGCTGTAACGCCTCCAAGGATCAGCCGGATGTGCGGCTCTTCCGGTTCCCCAACGACGACGAGGATCTGCTGTGGAAGTGGTGCAACAATCTGAAGATGAATCCAATTGATTGCATTGGCATGCGCATCTGCAACAGGCACTTCGAGCCCGATTGTATCGGTTCCAAGCATCTCTACAAGTGGGCCATTCCCACGCTGATGCTTGGACACGACGATGTCCAGATTGAGCTGATATCGAATCCGAAGCCGGAAGCTCGCTACGTAGACCCAGTGTTTAAGTGCTGCGTTCCCACCTGTGGCAAGACTCGCAAATTCGATGAGGTGCAAATGAACAGCTTTCCCAAGGATCCGACCCTCTTCGAGCGCTGGCGCCACAATCTCCGACTCAACCATCTCAATTTCAAGGAGCGCGAGCGCTATAAGATTTGTAATGCTCATTTCGAAGACATATGCATCGGCAAGACGCGCCTCAACCTAGGCTCCATACCTACACTGGAGTTGGGACACGACGAGACGGAAGACCTGTACCGTGTGAATCCCGATGAGCTGCAGAGCAATATGTTTGGACGGCACCAGCGCGTGGGTATTAAACAGGGGGAGCACTTTACTAGACAGGTCAAGTTCGAGCGATCCACGCCCCAGTTCACGTGTTGTGTTCGCAGCTGTCCACGCAACAAATGGGTAGAAAGCGGTGCCCGTTTGTTTCCCTTTCCCACGGGCAAGCAACAGCAGAACAAGTGGCGTCATAATCTCCGACTAAAAGCTGGCGAAGTGGATAGGACGACACGTGTTTGCAGCGCCCATTTCAATCGCCGCTGCATTGATGGCAAACAGCTAAGAGGATGGGCCATGCCCACACTGCAGCTGGGTCACCAGGAGACGAACATCTATGAGAATCCAAAGAACATCCCGGGCTTCTTTACTCCCACCTGTGCGTTGGCCCATTGCCGCAAAAGGCGGAGCATTGACAATGATTTGCGCACCTATCGCTATCCGCGCAATGAGGAGCTGCTTGAGAAGTGGCGTGTGAATCTCCGCCTCGCACCAGATCAATGTCGCGGTCGCATATGTGCGGATCATTTTGAGCCCATGGTGCGTGGAAAGCTAAAGCTAAAGACGGGGGCAGTGCCGACACTGAAGCTGGGCCACGATGAGGGCGTAGTCTTTGACAACGAGGCTATTAAGGCAGGCCTGCAGCAGGAGGAGGAGGAGGAGTATGAAGGTGGAGAGGTGGCGAACAGCTTGGACTCGCTTGTTAGGGTGAAGAATGAACTAAATGAGGAGGATCAGTCAATGGCAAACGACGAGCAGACAGAAGAACAGGATGATGATGACGAGGAGCAGACCAATCATCAATCAGAAGAAGAGGAGCAGCAAGAGCACGGCTACTTTGATCCCTTGGAGCTTGTAGAGACTTTTGCAGAGCAGCACAGCGAAGATGAACAGCTCTACAATAACGAAGATGACGAGGTTGATGACAATATGGAAGAGGAGGATATACCCGGCAACGATGATGAGCTGTTGCTCCCCGATACTCTACCTATTCAAATAGCTCTTCCTCCGAGACGTCAGAAGAGAACTGTGAATAATGTGACGCCCATATGCTGCCTTAAGCACTGCCGTAAGGAGCGTACTGCTACCCATCAGCTAAGCACTTTCGGCTTTCCCAAGGATCCGCAGCAACTGTTCAAATGGAGTGTAAACCTGCAAATAGATATCGACGACTGTGTTGGGCGTGTTTGCATTGAGCACTTCGAGGCGGAGATGTTAGGCACGCGCAAGCTGAAGCAGAACGCGGTGCCCACCTTGAATTTGGGCCATGATACACCCCTTAGCTATCGTTGCAATGGCCAAGCTGCGGACATCCATGATGCGCAATCACAGCAGCATTCGGTTTTTCGGCTTTGGAGCCTGAAACACTGTCGCAAAAGGAAAGATTCGTTGACGACGACAGCGACGCCAACGACGCCAACGACGACAGTGACGACAGCGTCGCCAACGACGACAACGACGCCAGCGACGACAACGACGCCAGCGACGACAACGATGCTAGCGACAACGACGATGCCAACGACGCCAGCGGTGACAACAACGACGACGACAATGCCGGAAAAGTCGCCAACGACAATGACGACGGCAACGACAATGACGACGGAAACGTTCCCAACGACGATGACGACGACGACAGCGAATCCAGCAGCGATGACTAAGCGCGTGTGCTGCGTGCCCAGTTGTAGAAAGGAATGGAAGCTGCATGCCGCTAACCTGCGACGCATGCCAAGAGATCGTTTGTTGCTGCGCAAGTGGCTGCACAATTTAAAGCTGCCTGCCAATTTGAGCCACAACCAGACGTATGTGTGCGAGGATCATTTCGAGGAGCAGGCAATGTTGCCCACCTTGCGCCTAGGCCATACGGATAGTAACATTTATCGTAGCCACAACTCAATAAATGGCATTGGCTGCCTGGTGCCCAACTGTCCATGTGCTCGCCTCTATCGTGGCTACGCCCTGCCCGAGCATCCCCAAGTGCGAGAGGCGTGGCTGCAGTGGCTGCAACTACCGCCTCGTTCTCCCCAATCGTCGAACCACGAGCAGCTGTGCATCATGCACTACATGCAGCTGTTCGAGCAGGTGCCGTTGCCGGATCAGTTGCCTGAGATAGTCCTGTGCGAGCTAAGGGAAACGTACGAGCTCATCGCCACATCCACCATTGCCATGGAGCTGCGCTGTTCAGTGCCCGGCTGCCAAACCAAATTCACAGACAACGTGCATCTCACCAGGCTTCCAACATGCCAACGTACCCGCGCCAAATGGCTGCACAATACGAAAATTGACTACGATCCGGATCGCGAGCGCTCCTATCGCATCTGCCTACGGCACTTCGAGCCCCATACCCTGGGCGCAGTGCGTCCTAGGCTAGGAGCGGTGCCTACACTGCACCTCAACCACAACGACCCGGATATTCATAAGAATCTTAAGTTGGAAGACAACGCTGATGGCGCACTAACCCAGCAAGGTGTGCCTCTTGAAATGCCGCTACGAATCAAGACGGAGCTACCGCTTTACCTCTCCGTCAGTCCGACGGCCAGCGCGAGCGCAAGTCCAAGTCCCCGGGGTAAACTGCGCACCTGCTGCATTGCCAGCTGTGGCCAGCAGGAGAACGCACTCACCCATCTGTTTCGCTTTCCCACTATCGAGACTGCGCTGCGCAAGTGGCTGGTGAACACGCAGCAGCAGCCGCGTCTCGTGGATACACAGCATCTGTTTGTGTGCCAGGAACACTTCGAGCCAGACGCCATTTACAAGAGGCAGTTGCGCAGCTGGGCGGTGCCGACGCTGAAGCTGGGTCACGATGGTCATATCATACCCAATGCTCGGCACAATGGCAACATTGCTGACAGCAAGGAGGATAGGCAGGCGCTGCAGTACATCTATGCGAACTTCTGCTCCGTTCTCACCTGCTTTCAGCAGCGCAGCGACCAGCTGCGCCTCTTTGCTTACCCTACGGATCGGCCCACCCTGCGCCGATGGGCTGCCAATTGCAAGCATCGTTCCATGCAGGCAAGCAGCGATGGATTTCAGGTGTGCCAGTCTCATTTCGCGGACGACTGCTTCGACCCTGAGTCTGGGCAACTGAAGGAGGATGCTGTGCCCACTCTTGAACTGAGCCGACCCATCTACGAGATGCGCTGCTTAGTCAATGGCTGCATTGTGGAGGAGGGTGCAAGGCGTCCTCGCCTTTTTAAAATGCCAAAGCGGACACATCAGATGGAGGATTGGTGTCATAACCTGCGCATTGATGCGGCGTCTTTGGTGGGCCAGGAGCCACATGTCTGTGAACGGCACTTCGAGGCGCACTGCTTCAATGCGGACAAGCTGTTACGCCAAGCTGCACGACCCACACTTCATTTGGGCCACGATGACCTGCTAGATGTGCTGCCCAATCCGGCCAGCTGGGAGGAGGAAGCCCACGTATGCGTTGTGCCCAGCTGTGGACGCTCGAAGGATGCGGATAACGTGCAGTTATTCGGGCTGCCAAAGTCTAAGTTTCTAGTAGAGAAATGGCTGCAGAATTTCCGCCTCGATCCTAACAAGGTTCCAGTGAAAGGCCGTCGCATATGTAGCGTGCACTTCGAGCCCAGCTGCATAGACAGTGACCGACTACATATAGGCGCCATGCCTACACTCCACTTGGGTCACGCTGAGACGGATAACATACACGAAAGCATCAAAGAGCTGCCAATGTCGGCTCGGTCCGGGCGTTTCCGTATCCACTGCGACTGTTGCTATCCAGATTGCGTGGAACTGCAAAAGGGCTTTCAAAAAATTACCTACGATTTGCCACAAGGGCTGGCACTGCGTGAAACATGGCTGTCGTATCTGGGATTGGAGGAACACGATCAGCAGCAGCCGCTCAAACTCTGCCCGCTGCACTTGATCATGCTGTACGAGGAGTTCCCTGAACAATCGGCGGAGGAGGAACTGCTAACATCCAACTACGAAGCTGCTCGCAACAGTGTGCGCATTCGCATCGCCAGCTGCGCTGTGCCTGGCTGCAGGACTCTAAGGCCGAGAGATGAGCATTGCCTGCACTTGTCGCCCACACGACGTGATGTGCTCGAGCTGTGGCTGGACAACATGCGGATGCCTTACAATGATAATGAGCGTTACAAGTTTCGGGTGTGCGGCAGGCACTTCGAGTCCAATTGCCTAGTGGAGAAGGCGCGACGACTAAAACCCTGGAGCGTGCCTACGTTGGAGCTGCCAGAGCCACCAGTGCATCAGAATCCTACGGAGGAGCAGTGGCAACGCATGAATGAGCAACTATCAGCACTGCAGGCATTGGAAGCCAGTGTTGAGCTGAATGATAAGCAGAAGCAGAGGGAAATGCGGAATATAAAATATGCGATGCATAAGCACCAAATACTGGAGCAGGAGAATGACCAGGGGCAGGAGGACGAGCAGGAACAGGAAGAGTCGCAAATCAAACTGGAATCACAGGTCAAGCAGGAGCCTCTATCTGTGTACGAAGATGACTATTATGAAGAGCAGCCGCAAGAGATGCAGGAGCTGGAGGTGCTACTCGAGGTGGGGCACGTAGAGAAGTGCACCACCTATGAGCAGATGGACACAGAGCCCTCCATAAGCTATGCCGAACAGCCGTCGCATAATCCTTCAGGTTCGTCACATCCACCAGGTAGCGGAGCAGTAAACGGCAATAACTCTCGCTACAGCGCGAGGCATTGCAGCGTGCGAGGTTGCGGTGTGACGGTGCTAGATGTGGACGGCAATCTGAAGTTGCACAAGTTCCCCACATCGATAGATGCTATGGAAAAGTGGATGCACAATACCCAGGTGGATGTAGACACCAACTATGCGTGGCGCTTTCGCATTTGCAGCTATCATTTTGTCCCTGAGTGCTTCAATGGATCGCGCATTAGACGTGGAGCCATGCCCACGTTGCGTTTGGGGTCCCGACGTCCTGCGCGTATCTACGATAACGAATTCAATGTTCAGCAGGAACAGACGGCAGCGAATGCAGTGGAAGAGCAGTCTCCACTGCCTACTGAGGACTCCAAGCTTGACATCAAATTGCGCCTGCCCTGTCCCGCTCCGCCTCGCAAATCCAGCAAGTTCTGTCAGATCGAAGGCTGCTCGAATCATCTGACCAGTGAAAATTTGACTCTTCACAAGTTCCCACACTCGGCGGACATGTGCGCCAAGTGGCAGCACAACACGCAGGTGCCTTTCGATCCAGAGTATCGTTGGCGCTATCGCATCTGCAGCGCACACTTTGAACCCATCTGCCTGGGCAACATGCGACTGATGCAAGGCAGTGTGCCCACCCTGAAGCTAGGGCCCCGCGCACCTAAGCAGCTCTTTGACAATGACTTTTTGGTCATTGGCTTGCGCTCGGATAAGGATATGCATAGCGAACAAAATTTCACTGTAAAGCATGAGCAAGCGCAGCCATTCGAGGAGGATGATTCGGTGCAGGCACAGAAGCAGGAGGCGGAACAGGAACAGGACTTAAGTATGCTAGAACCACAACTCCAATTGCATGAAGGTCAGGAAGAAGCGGAACATGAGGACAATTATTTGAACTGCAATAACAATTGGAATGAGCGCAGCATTAAGCAGGAGAAGTGCAGCGACAACAGCTACTATAATCCGGTCAAGTCGGGCTATGACAAGTGCTCCCTAATCCATTGTCAGCGCCAGCGCTCACAGCATGGCGTGCACATCTATAAATTTCCACGTTCCCGCCAGCTTCAGCAACACTGGATGCACAATTTGCGTATTCGATACGACGAACGGCGACCATGGAAGACCATGATATGCAGCGCGCACTTTGAGCCGCGATGCATACGACTAAGGAAGCTCCGTCCCTGGGCAGTGCCTACCTTGGAGCTGGGCGAAAATGTGCCGGAGCAACTCTACACGAACGAGCAAAGCCAGCAGCAGATGGAGGTGGGTAGCGACGGTGAGGCAGACGGCTATGATTATGATGTGGACGATACTATGTTGGAGGATTACAACGATGATTACGAAGACAATGGGTCTGAGCAGCTGCCTGCGGAACCACAGCTCAAACGAGAGCGTCCTTCACGCTGCGATCCCTGCCCTCCTGGCCAGTTGCAGCCATGGAAAATAAAACAATGCTGTTTGCCCCACTGTCGCAGGCCACGAGGCGATGGCATCAAACTCTTCCGACTGCCCAACAACATTGGCGCCATACGTAAATGGGAGCAAGCGACAGGCATGCGCTTTATTCCATCGCAGCGGAACACTAAGCTCATCTGTAGCCGTCATTTTGATCCGCAACTGATTGGCGTTCGTCGCCTCTTCACCAATGCCGTGCCAACAAGGAATCTTGGTCCAAATATTAAAGAGTCGGAGCTGCCTGAGTTACCGGAAAGTACTCCACGCTGTTGCATCACTGACTGCGAACACAATGGATTTGTCAAGCTGCATAAGTTTCCAAGTGATCCTTTGCTGCTTCATCAATGGTGCCAAGCCCTAGATTTTCCGGATGTACAACGCTACTCTGGTAAACACATTTGTGCAGTCCATCTACCTGCGAAGGCATTCAGTTGCCTCATTTGTGGCGTTGAGGATGTGCAGCTGCCCATGCAAGACTTCCCCGATAACCGCAATCAGCGAGTCAAGTGGTGCTATAATCTTAAAATCGAACCCATTGCCAAGTGGGACAATACGAAACACATCTGCTCTAAACACTTTGAGAGTTATTGTTTCATAGAGCCGGGTCGTCTGCTCCCGGACGCAATGCCTACATTGCATTTGACGCACAATGATAACAACATATTTCTCAACGATTATGTTATAAACAATCCTAAGATGCTCTGCATCAAGGATGAGCCCCTAGAAAGTGACGATTTGATGCTATAA
Protein Sequence: MAPPPAPASNRHTLDASGEMIIKSEPIEEHVFKSNYIDDNTPFADFNKFPEFGDEMLSPKVELTVKDDAYGNQKNPLSFPRRKLQTERSSESLPICQRCKEVFFKKQIYLRHVAESSCTIQEYDYKCNICPMSFMGAEDIQKHKQLHRADKFFCHKYCGKYFDNIADCESHEYMEHDYDSFVCNMCSMTFPTREQLYAHLPQHKFQQRFDCPICRLWYQTALELHEHRLAAPYXXXXXXXXXXXXXXXXXXXXXXXXXLQDCHMGTIEMTASQHKANALPATAALSSLLHQRQANADGGASLFASSLKNEPSVKLERSYSNSTSESGYSMHENSGYNNAYGSDNSLHASGVAIGGPQAHSSTLDESEDALCCVPLCGVRKSTSPTLQFFTFPKDEKYLHQWLHNLKMFHIPASSYVSFRICSMHFPKRCINRYSLCYWAVPTFNLGHDDVANLYQNRELTNTFTTGEVARCSMPNCTSQRGESNLKFYNFPKDIKSLIKWCQNARLPVQAKEPRHFCSRHFEERCIGKFRLKPWAVPTLHLGAQYGKIHDNPKNLYVEEKRCCLNFCRRSRSSDFNMSLYRFPRDEVLLRRWCYNLRLDPAVYRGKNHKICSAHFIKEALGLRKLSPGAVPTLHLGHSDTFNIYENELWPPPTASTPXXXXXXXXXXXXXXXXXXXXXXXXXXXIHHKYQRHSAASTSSSASSTSHYVDPELSASYMAMGMGSGNSTSGLNVSDSMDVCCVPSCESKRHNNENITFHTIPRRPEQMRKWCHNLRIPEDKMHKGMRICSLHFEPYCIGGCMRPFAVPTLHLGHDEEDIHRNPDVIKKLNIRETCCVAVCKRNRDRDHANLHRFPSNVALLTKWCANLQRTVPDGIKLFNDAICEVHFEERCLRNKRLEKWAVPTLMLGHDNIPYPLPTPEQVAEFYARPSAPNNGEEQGECCVETCKRNPSVDDIKLYRPPEESQVLTKWAHNLQIDIAQLPSMRICNLHFEAHCIGKRMRPWAIPTLNLATNIENLFENPEQQMLYKRRTSHLSGQREGSGGSITKPTWVPRCCLPHCRKVRALHNVQLYRFPKLNRATLAKWAHNLQVPMVGSAQRRLCSAHFESHVLSKKCPVPLAVPTLDLNTPPGYKIYQNPAKIKANKLCMQRVCIVESCRRQRGQGVQLFRLPHNPTQLRKWMHNIRMRPRGAMRQQYRICSRHFETHSFNGKRLSTGAIPTLELGHQDDDIYPNEAQSFVEEHCAIEGCNASKDQPDVRLFRFPNDDEDLLWKWCNNLKMNPIDCIGMRICNRHFEPDCIGSKHLYKWAIPTLMLGHDDVQIELISNPKPEARYVDPVFKCCVPTCGKTRKFDEVQMNSFPKDPTLFERWRHNLRLNHLNFKERERYKICNAHFEDICIGKTRLNLGSIPTLELGHDETEDLYRVNPDELQSNMFGRHQRVGIKQGEHFTRQVKFERSTPQFTCCVRSCPRNKWVESGARLFPFPTGKQQQNKWRHNLRLKAGEVDRTTRVCSAHFNRRCIDGKQLRGWAMPTLQLGHQETNIYENPKNIPGFFTPTCALAHCRKRRSIDNDLRTYRYPRNEELLEKWRVNLRLAPDQCRGRICADHFEPMVRGKLKLKTGAVPTLKLGHDEGVVFDNEAIKAGLQQEEEEEYEGGEVANSLDSLVRVKNELNEEDQSMANDEQTEEQDDDDEEQTNHQSEEEEQQEHGYFDPLELVETFAEQHSEDEQLYNNEDDEVDDNMEEEDIPGNDDELLLPDTLPIQIALPPRRQKRTVNNVTPICCLKHCRKERTATHQLSTFGFPKDPQQLFKWSVNLQIDIDDCVGRVCIEHFEAEMLGTRKLKQNAVPTLNLGHDTPLSYRCNGQAADIHDAQSQQHSVFRLWSLKHCRKRKDSLTTTATPTTPTTTVTTASPTTTTTPATTTTPATTTMLATTTMPTTPAVTTTTTTMPEKSPTTMTTATTMTTETFPTTMTTTTANPAAMTKRVCCVPSCRKEWKLHAANLRRMPRDRLLLRKWLHNLKLPANLSHNQTYVCEDHFEEQAMLPTLRLGHTDSNIYRSHNSINGIGCLVPNCPCARLYRGYALPEHPQVREAWLQWLQLPPRSPQSSNHEQLCIMHYMQLFEQVPLPDQLPEIVLCELRETYELIATSTIAMELRCSVPGCQTKFTDNVHLTRLPTCQRTRAKWLHNTKIDYDPDRERSYRICLRHFEPHTLGAVRPRLGAVPTLHLNHNDPDIHKNLKLEDNADGALTQQGVPLEMPLRIKTELPLYLSVSPTASASASPSPRGKLRTCCIASCGQQENALTHLFRFPTIETALRKWLVNTQQQPRLVDTQHLFVCQEHFEPDAIYKRQLRSWAVPTLKLGHDGHIIPNARHNGNIADSKEDRQALQYIYANFCSVLTCFQQRSDQLRLFAYPTDRPTLRRWAANCKHRSMQASSDGFQVCQSHFADDCFDPESGQLKEDAVPTLELSRPIYEMRCLVNGCIVEEGARRPRLFKMPKRTHQMEDWCHNLRIDAASLVGQEPHVCERHFEAHCFNADKLLRQAARPTLHLGHDDLLDVLPNPASWEEEAHVCVVPSCGRSKDADNVQLFGLPKSKFLVEKWLQNFRLDPNKVPVKGRRICSVHFEPSCIDSDRLHIGAMPTLHLGHAETDNIHESIKELPMSARSGRFRIHCDCCYPDCVELQKGFQKITYDLPQGLALRETWLSYLGLEEHDQQQPLKLCPLHLIMLYEEFPEQSAEEELLTSNYEAARNSVRIRIASCAVPGCRTLRPRDEHCLHLSPTRRDVLELWLDNMRMPYNDNERYKFRVCGRHFESNCLVEKARRLKPWSVPTLELPEPPVHQNPTEEQWQRMNEQLSALQALEASVELNDKQKQREMRNIKYAMHKHQILEQENDQGQEDEQEQEESQIKLESQVKQEPLSVYEDDYYEEQPQEMQELEVLLEVGHVEKCTTYEQMDTEPSISYAEQPSHNPSGSSHPPGSGAVNGNNSRYSARHCSVRGCGVTVLDVDGNLKLHKFPTSIDAMEKWMHNTQVDVDTNYAWRFRICSYHFVPECFNGSRIRRGAMPTLRLGSRRPARIYDNEFNVQQEQTAANAVEEQSPLPTEDSKLDIKLRLPCPAPPRKSSKFCQIEGCSNHLTSENLTLHKFPHSADMCAKWQHNTQVPFDPEYRWRYRICSAHFEPICLGNMRLMQGSVPTLKLGPRAPKQLFDNDFLVIGLRSDKDMHSEQNFTVKHEQAQPFEEDDSVQAQKQEAEQEQDLSMLEPQLQLHEGQEEAEHEDNYLNCNNNWNERSIKQEKCSDNSYYNPVKSGYDKCSLIHCQRQRSQHGVHIYKFPRSRQLQQHWMHNLRIRYDERRPWKTMICSAHFEPRCIRLRKLRPWAVPTLELGENVPEQLYTNEQSQQQMEVGSDGEADGYDYDVDDTMLEDYNDDYEDNGSEQLPAEPQLKRERPSRCDPCPPGQLQPWKIKQCCLPHCRRPRGDGIKLFRLPNNIGAIRKWEQATGMRFIPSQRNTKLICSRHFDPQLIGVRRLFTNAVPTRNLGPNIKESELPELPESTPRCCITDCEHNGFVKLHKFPSDPLLLHQWCQALDFPDVQRYSGKHICAVHLPAKAFSCLICGVEDVQLPMQDFPDNRNQRVKWCYNLKIEPIAKWDNTKHICSKHFESYCFIEPGRLLPDAMPTLHLTHNDNNIFLNDYVINNPKMLCIKDEPLESDDLML

Similar Transcription Factors

Sequence clustering based on sequence similarity using MMseqs2

100% Identity: iTF_00519952;
90% Identity: iTF_00554413;
80% Identity: -