Basic Information

Insect: Drosophila quadrilineata
Gene Symbol: -
Assembly: GCA_018150725.1
Location: JAECWN010000452.1:8591180-8605646[+]

Transcription Factor Domain

TF Family: THAP
Domain: THAP domain
PFAM: PF05485
TF Group: Zinc-Coordinating Group
Description: The THAP domain is a putative DNA-binding domain (DBD) and probably also binds a zinc ion. It features the conserved C2CH architecture (consensus sequence: Cys - 2-4 residues - Cys - 35-50 residues - Cys - 2 residues - His). Other universal features include the location of the domain at the N-termini of proteins, its size of about 90 residues, a C-terminal AVPTIF box and several other conserved residues. Orthologues of the human THAP domain have been identified in other vertebrates and probably worms and flies, but not in other eukaryotes or any prokaryotes [1].
Hmmscan Out: # of c-Evalue i-Evalue score bias hmm coord from hmm coord to ali coord from ali coord to env coord from env coord to acc

1 30 2 6.4e+03 -2.1 2.5 49 62 356 373 322 388 0.63

2 30 2.7e-15 8.8e-12 45.5 4.7 1 86 559 631 559 632 0.86

3 30 1.7e-15 5.6e-12 46.1 4.4 1 87 659 728 659 728 0.83

4 30 3.9e-16 1.3e-12 48.2 0.4 1 87 750 822 750 822 0.85

5 30 4.3e-16 1.4e-12 48.1 5.3 1 87 917 987 917 987 0.83

6 30 3.2e-15 1e-11 45.3 3.0 1 86 1011 1082 1011 1083 0.82

7 30 6.1e-13 2e-09 37.9 1.5 1 87 1118 1186 1118 1186 0.80

8 30 1e-10 3.3e-07 30.8 1.4 1 84 1232 1299 1232 1302 0.73

9 30 1.4e-16 4.5e-13 49.6 0.1 1 86 1329 1398 1329 1399 0.83

10 30 4.7e-13 1.5e-09 38.3 1.1 1 86 1420 1489 1420 1490 0.80

11 30 2.4e-14 7.8e-11 42.4 1.1 1 86 1517 1588 1517 1589 0.85

12 30 2.3e-14 7.4e-11 42.5 0.4 1 86 1659 1728 1659 1729 0.80

13 30 1.8e-12 6e-09 36.4 0.1 1 86 1752 1820 1752 1821 0.81

14 30 5e-13 1.6e-09 38.2 1.9 1 87 1975 2044 1975 2044 0.80

15 30 5.6e-14 1.8e-10 41.3 0.6 1 86 2109 2176 2109 2177 0.75

16 30 0.00059 1.9 9.2 0.0 1 59 2204 2255 2204 2278 0.76

17 30 1.3e-12 4.1e-09 36.9 0.3 1 86 2293 2362 2293 2363 0.85

18 30 2.6e-12 8.4e-09 35.9 0.7 1 86 2475 2544 2475 2545 0.80

19 30 2.7e-12 8.8e-09 35.9 1.3 1 86 2580 2651 2580 2652 0.80

20 30 3.4e-11 1.1e-07 32.4 4.8 1 87 2667 2737 2667 2737 0.79

21 30 1.3e-14 4.4e-11 43.3 0.3 1 86 2771 2852 2771 2853 0.78

22 30 4.8e-05 0.16 12.6 4.4 1 48 2881 2925 2881 2954 0.78

23 30 2.9 9.5e+03 -2.7 0.4 39 58 3005 3024 2989 3041 0.67

24 30 7.6e-12 2.5e-08 34.4 0.1 1 86 3062 3134 3062 3135 0.81

25 30 4.7e-18 1.5e-14 54.3 1.3 1 86 3279 3351 3279 3352 0.84

26 30 2.3e-13 7.3e-10 39.3 3.4 1 86 3405 3475 3405 3476 0.82

27 30 1.8e-13 5.7e-10 39.7 3.6 1 86 3570 3640 3570 3641 0.83

28 30 1e-12 3.4e-09 37.2 0.0 1 87 3719 3789 3719 3789 0.85

29 30 1.3e-08 4.1e-05 24.1 0.3 1 58 3803 3849 3803 3858 0.86

30 30 1.4e-11 4.7e-08 33.5 2.0 2 87 3859 3926 3857 3926 0.76

#	of	c-Evalue	i-Evalue	score	bias	hmm coord from	hmm coord to	ali coord from	ali coord to	env coord from	env coord to	acc
1	30	2	6.4e+03	-2.1	2.5	49	62	356	373	322	388	0.63
2	30	2.7e-15	8.8e-12	45.5	4.7	1	86	559	631	559	632	0.86
3	30	1.7e-15	5.6e-12	46.1	4.4	1	87	659	728	659	728	0.83
4	30	3.9e-16	1.3e-12	48.2	0.4	1	87	750	822	750	822	0.85
5	30	4.3e-16	1.4e-12	48.1	5.3	1	87	917	987	917	987	0.83
6	30	3.2e-15	1e-11	45.3	3.0	1	86	1011	1082	1011	1083	0.82
7	30	6.1e-13	2e-09	37.9	1.5	1	87	1118	1186	1118	1186	0.80
8	30	1e-10	3.3e-07	30.8	1.4	1	84	1232	1299	1232	1302	0.73
9	30	1.4e-16	4.5e-13	49.6	0.1	1	86	1329	1398	1329	1399	0.83
10	30	4.7e-13	1.5e-09	38.3	1.1	1	86	1420	1489	1420	1490	0.80
11	30	2.4e-14	7.8e-11	42.4	1.1	1	86	1517	1588	1517	1589	0.85
12	30	2.3e-14	7.4e-11	42.5	0.4	1	86	1659	1728	1659	1729	0.80
13	30	1.8e-12	6e-09	36.4	0.1	1	86	1752	1820	1752	1821	0.81
14	30	5e-13	1.6e-09	38.2	1.9	1	87	1975	2044	1975	2044	0.80
15	30	5.6e-14	1.8e-10	41.3	0.6	1	86	2109	2176	2109	2177	0.75
16	30	0.00059	1.9	9.2	0.0	1	59	2204	2255	2204	2278	0.76
17	30	1.3e-12	4.1e-09	36.9	0.3	1	86	2293	2362	2293	2363	0.85
18	30	2.6e-12	8.4e-09	35.9	0.7	1	86	2475	2544	2475	2545	0.80
19	30	2.7e-12	8.8e-09	35.9	1.3	1	86	2580	2651	2580	2652	0.80
20	30	3.4e-11	1.1e-07	32.4	4.8	1	87	2667	2737	2667	2737	0.79
21	30	1.3e-14	4.4e-11	43.3	0.3	1	86	2771	2852	2771	2853	0.78
22	30	4.8e-05	0.16	12.6	4.4	1	48	2881	2925	2881	2954	0.78
23	30	2.9	9.5e+03	-2.7	0.4	39	58	3005	3024	2989	3041	0.67
24	30	7.6e-12	2.5e-08	34.4	0.1	1	86	3062	3134	3062	3135	0.81
25	30	4.7e-18	1.5e-14	54.3	1.3	1	86	3279	3351	3279	3352	0.84
26	30	2.3e-13	7.3e-10	39.3	3.4	1	86	3405	3475	3405	3476	0.82
27	30	1.8e-13	5.7e-10	39.7	3.6	1	86	3570	3640	3570	3641	0.83
28	30	1e-12	3.4e-09	37.2	0.0	1	87	3719	3789	3719	3789	0.85
29	30	1.3e-08	4.1e-05	24.1	0.3	1	58	3803	3849	3803	3858	0.86
30	30	1.4e-11	4.7e-08	33.5	2.0	2	87	3859	3926	3857	3926	0.76

Sequence Information

Coding Sequence: ATGTCACAACACAATAATCCTCTANNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNAATTGGTACTCACATGTTGCTTCCTACCCGCCCCACCATTCGCATGCGGCACCCTTTGCGGCGCCCTGCAAAACCAATAACAATAATACCAACCACAACAACAACAACAACAATCTTATGAATGCATACGGCACGGGAGCCCACACATCATACTATGGCTCTGGGAGTGGTGGAGTGGGTGTCTCTGCTGCTGGTGCTAGTGGTGGTGGGGTGGGCTATAACCTTGAGACCAATTCAGTGGCNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNGCTCCTCTTATATGCCTCACAGCTTAATGCATAGCTCATATCCGTATATCAAGAGCGAGCCAATGGAGCTGTCAGATGATATACAACGCAGACAACAACTCCAGCAGCAGCAACAGCAACAGCACTTCCAGAATCCGATGGCACCGCCGCCGGTTCCCGCCAATCGTCATCCACTCGATGCCAACAGCGAAATGATAATAAAATCTGAACCTATAGATGAACATGCTTACAAGTCCAATTATATTGATGACAATACGCCTTTTGCCGACTTCAGTAAATATCCTGAATTCGGTGACGATATGCTGAGTCCCAAACTGGAACTACCGGTCAAGGACGAGAGCTATGGAAATCAAAAAAATCCGCTTCACTTCACCAGGAGGAAGATGCCTTCGGATGATTTGCCAATATGCTATCGCTGCAGGGAGGTGTTCTACAAGAAGCCAGTCTACTTGCAGCATGTGGCAGAGAGCAATTGCAACATTAAGGAGTATGATTACAAGTGCAACGTCTGCCCCATGTCCTTCATGACCACCGACGAGCTACAGAAGCACAAACATCTCCACAGGACCGACAAATTCCTTTGCCTTCGATACTGTGGCAAGCACTTTGACACCATTGCCGAATGCGAGTCACACGAGTACATGCAACATGAATATGAAAGCTTTATCTGCAACATGTGTTCCGTCACCTTTGCCACGCGAGAGGAACTCTTTGCCCATTTGCCACAACACAAGTTTCAACCGCGCTTCGACTGCCCCATCTGCCGACTGTGGTATCAGACGGCAGTGGAGCTGCACGAGCATCGCATGGCGGCACCCTATTTCTGTGGCAAGTACTATGTGGCAACACAGCAACAGCCACAATCCAACTATAAACTCCAGGACTGTCATATGAACAATATGGAAATGACGAAGGGAAATTCAGCGGGGAATGCCTTGCCTGCCACAGCAGCCCTGAACTCGTTGCTGCAACAGCGCCAGGCGAATGCCGAGGGAGGCACCCCCCTCTTCGGCGAGGCACATATCAAGCTGGAGCGGAGCTATAGCAACTCGACGAGTGACTCCAGCTTCAGCCAGCAGGACAGCAGCTATAACAATGCCTATGGCAGTGACACATCGATGCATGCGGTAGGTGGACCACAGGCACACTCCTCGACGTTGGATGACTCGGAGGATGCACTGTGCTGTGTGCCGCTGTGTGGAGTGCGCAAGAGCACCAGTCCGACACTGCAGTTCTTTACGTTCCCCAAGGACGAGAAGTATTTGCATCAGTGGCTGCACAACCTCAAGATGTTCCATGTGCCGGCCTCGACCTATACCACGTTTAGGATCTGCAGCATGCACTTCCCGAAGCGCTGCATCAATCGGTATTCGCTGTGCTATTGGGCAGTGCCTACCTTCAATTTGGGCCACGACGATGTGGCCAATCTGTATCAGAATCGGGAGCTGACCAATACCTTCACCACTGGGGAAGTGGCGCGCTGCAGCATGCCCAATTGCACAAGCCAGCGGGGCGAGAGTAATCTGAAGTTCTACAACTTTCCCAAGGATATCAAGAGTCTGATCAAGTGGTGCCAGAATGCCCGTCTGCCTGTCCAGGCCAAGGAGCCGCGTCACTTCTGCAGTCGACACTTTGAGGATCGCTGCATCGGTAAGTTCAGACTGAAACCGTGGGCGGTGCCCACGTTGCACTTGGGTGCCCAGTACGGCAAGATCCACGACAATCCCAAGAATCTGTATGTGGAGGAGAAACGCTGTTGTCTCAACTTTTGTCGACGCAGTCGCTCCTCGGACTTTAACATGTCCCTGTACCGCTTTCCGCGGGATGAAGTCCTCCTCAGGCGGTGGTGCTACAATCTGCGCCTGGATCCGGCTGTCTATCGTGGCAAGAACCACAAGATATGCAGTGCACACTTTATCAAGGAAGCCTTGGGACTACGCAAACTGTCCCCGGGAGCTGTGCCTACACTTCACTTGGGTCACAATGACACCTTCAACATTTACGAGAACGAGCTGTGNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNCATGTCCCCCAGCAAGTACCAACGTCACTCGGCGGCATCCACATCGTCCTCAGCCAGCTCCACTTCCCATTATATGGATGCCTTGGATCACAATTCCTCGTACATGTCAGGTCTGGGCGGATCATCCTCGACCCTGAATACCAGCGATAGCATGGATGTGTGCTGTGTGCCCAGTTGTGAGAGCAAGCGCCACAACAATGAGAACATCACATTCCACACGATTCCACGGCGACCCGAGCAGATGGCCAAGTGGTGTCATAACCTCAAGATACCCGAGGACAAGATGCACAAGGGTATGCGTATCTGTAGCCTTCACTTTGAACCCTATTGCATTGGCGGCTGTATGCGTCCGTTTGCCGTGCCCACCCTGCATTTGGGTCACGATGACGAAGACATTCATCGCAATCCAGACGTGATCAAGAAGCTCAATATTCGGGAAACCTGCTGTGTGGCGGTCTGCAAACGAAACCGGGACAGGGATCATGCCAATCTGCATCGGTTCCCCAGTAACATCGCTTTGCTGACTAAGTGGTGCGCCAATCTTCAAAGGCCTGTGCCGGATGGCACCAAACTCTTTAACGATGCCATCTGTGAAGTACACTTCGAGGATCGTTGTCTGCGCAACAAGCGGCTGGAGAAATGGGCCGTACCCACGCTCATTTTGGGTCACGAAAACATTGCCTATCCGCTGCCCACGCCGGAGCAAGTGGCCGAGTTTTATGCCCGGCCCAGTGCTCCCAACAATGGTGAGGAGCAGGGTGAGTGCTGTGTGGAGACCTGTAAGCGAAATCCTAGCGTGGATGATATCAAGCTGTATAGACCACCGGAGGAGTCACAGGTGCTGGCCAAATGGGCCCACAATTTGCAGGTGGACATGACCAAGCTATCCAGCCTCAAGATCTGTAACCTCCACTTCGAGACCCACTGCATTGGCAAGCGTATGCGACCCTGGGCGATACCCACCATCAACTTGTCTACCAACGTGGAGAATCCCTACGACAATCCCGAACGCCAACTGCTCTATAAGCGTCGCTCCCATCTCAATTCCAATCGCAGCTCGGGATCTCATGGATCTGGCATAACCAAGCCGACGTGGGTGCCGCGCTGTTGCCTGCCACATTGCCGCAAGGTGCGCGCTCTACACAATGTGCAACTCTATCGTTTCCCAAAGATCAATCGTTCCACGCTGGCCAAGTGGGCGCATAACCTCCAGGTGCCGGCGGTGGGCAGTGCCCAGCGACGTCTGTGCTCCGCTCACTTTGAGCCGCATGTGCTGAGCAAGAAGTGCCCGGTGTCATTGGCTGTGCCCACTTTGGATCTGAATACACCACCAGGTTATAAGATCTACCAGAATCCTGCCAAGTTGAAGGCCGCCAAACTGTGTCTGCAGCGGGTTTGCATTGTGGAGAGTTGTCGCCGTCAGCGTGGCCAAGGAATCCAGCTCTTCCGTCTGCCGCACAGTCCCACCCAGCTGCGCAAGTGGATGCACAACATCCGCATGCGACCACGAGGTGCGATGCGGCAGCAGTACCGGATTTGCTCCGTCCACTTCGAGACGCACTCGTTCAATGGGAAGCGTCTCAGTGCGGGAGCGATACCCACCTTGGAACTGGGACATCAGAGCGAAGACATCTATCCGAATGAGGCGCAGTCCTTTGTGGAGGAGCACTGCGTCATTGAGGGCTGCACTGGCACTAAGGAGCAGCCGGATGTGCGTCTCTTCCGCTTCCCCACCGATGACGAGGATCTGCTCTGGAAGTGGTGCAACAATCTCAAGATGAATCCCGTGGACTGCTTCGGTGTGCGTATCTGCAACAAACACTTCGAAACGGACTGCATCGGACCCAAGCATCTCTACAAATGGGCCATACCCACGATGGAACTGGGCCACGACGATGCCGATATCGAGCTAATACCCAATCCCAAACCAGAGGATCGCTACGTGGATCCCGTGTTCAAGTGTTGTGTACCCACGTGTGGCAAGACGCGACGATTCGATGAAGTTCAGATGAATAGTTTTCCCAAGGATGTTGCCATGTTCCAGCGTTGGAAGCACAATCTTCGGCTGGAGCATTTGGAGTTCAAGGATCGGGATCGCTACAAGATCTGCAATGCCCACTTTGAGGATATCTGCATTGGCAAGACACGACTCAACATTGGTTCCATACCCACCCTTGAGCTGGGTCATGATGAGACCGAGGATTTGCACAAGGTGAATCCCGAGGAGCTCAAGAGTAATCTCTTTGGACGCCCGCGGCGCGTCTCAAGTGTCATGGGAGCAGCTTCAATCAAGCAGGAGGACAACTCCGAGTTGGAAGAGGATGACTTCCATTCGGATGTGGATACTAGCCAGGTGAAGACCAAGCGATCCCAGCTGGATCTCAAGTGCAGCGTGCCCAACTGTGGCCGCAGTGGCATCCAGCATGGCATTCGTCTCTTCCCCTTCCCCACTGGCAAGCAGCAACAACTCAAGTGGCGACACAATCTCCGATTGGATGCCCGTGACGTGGATCGTTCAACCCGCGTATGCAGCGTTCACTTCAACCGACGCTGCATCGATGGCAATCAGCTAAGGAGCTGGGCTATTCCCACTCTGCAGCTGGGACATCAGGAGCAGCCCATTCATGAGAATCCCAAGAATATACCGGGTTTCTTCACACCGACCTGTGCCCTGGCTCACTGTCGCAAGCGTCGCAGTATTGATAACGATCTGAGGACCTATCGATATCCTCGGAGCGAGGATCTGCTCGAGAAGTGGCGTATTAATTTGAGATTGTCGCCGGATCAGTGCAGGGGACGTATCTGTGCGGATCACTTTGAGCCCATGGTGCGGGGCAAGCTAAAGTTGAAGACGGGAGCAGTGCCCACCCTAAAGCTGGGGCATGAGGAAGGTGCGGTGTTTGATAACGAGGCCATTAAGGCGGGACTACAGGAGACTGAGACTGAGGAGGCCGACACCAGCCTGGAGTCTTCAATCAAGGTGCGGGTGAAGAAGGAACGCGTTGAAAGGGATGAGNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNGCTCTTGTTGCCCCCTGATACGCCCAGCGCTCCCCTGAAGTCTCCACGCCGCGAGAGGGTCGCCAACAATGTGACGCCCATCTGCTGTCTGAAGCACTGCCGCAAGGAGCGCACGTCCACCCACCAGCTAAGCACCTTTGGTTTCCCCAAGGATCAGCAACAGCTGCTCAAATGGAGCGCCAATCTGCATATACCGCCCGCGGACTGCATAGGTCGGGTCTGTGTTGAGCATTTCGAGCTGGAGGTGCTCGGCACCAGGAAGCTGAAACAGCATGCGGTGCCCACAGTGAATCTGGGGCACAATATGCCCCTCAGCTACAGCTGTACTGGTCTGCCGATGGAGGGCATCCATGATGAGCAGCCGCAGCATTCGGTTTTTCGGCTTTCGAGCCTGAAACATTGCCGCAAAAGGAAGCACTCAACGGATGCCGAACCCAATCCGAATCTCGATCAGGATCAGGATCTGGCACGGAGTAAACGTCGCTGTCTGTTGCCCAGTTGTGGCAAACGGATAGAGCAGGATGATGTGCAACTACATAAATTCCCCAGCAGCCGCACCCAGCTACGTAAGTGGCTCCACAACCTCAAGCTATCTCCACAAAAGGACTACAATCAGGCGCGTCTCTGCAGCGATCACTTTCACCAGCAACCGGCGGATTCCGCTCCAGAGGATTGGGTGCCCACGCTGCGGCTGGGACACAGGGATACCCACATCTATCAAAATCATGCTGGCGTGGGAAGCATATCCAGCACAGCAACCAACACTGGCTGTATGGTCCCCAGCTGCACTTGTGCCCGCCTCAATCTCTATCGCTGCTATGATCTACCCGCTAATCCGCTGGTGCAGCAGGCCTGGCTCCAATGGCTGCAGCTGCCCCAGCCCAAGCTGGCCAGCGATGGCAAGCTTTGTGTAATGCACTACATGCAGCTGGTCGAGCAGGTGACCTTGCCAGAGGATGTACCTCAATCGGAGAGGGAGGTCCTACAGCAAACCTACGATCTGATTGCCGGCTCGGCTATGGCCATGAAGCTACGCTGTGCCGTTCCTGGCTGCTACTCCAAGTACACGGACAACATACGGCTAACGAAGCTGCCCACCTGCCAGGAGATGTGTGCCAAGTGGATACACAACACCAGCATCGAATATGATGCCTCCAGACACTACATCTATCGCATCTGCATGCTGCACTTTGAGCCACATGTCTTGGGTCCTGTGCGTCCCAAAGCATGGGCGGTGCCAACGCTGCAACTTAACCACAAGCGTAGTGATATCCATCACAATCCACAGCAGGTTAATGATGGTAGTGACGTCCCCACAACTGTGAAAATTGAACCTGGTCTATCGGATCCTATATCCGTGGCTGTCCCTGCTCTGGAACCCCGCCAAATGGTTAGAATCATGTGCGATATTGAGTCTTTGCATTCGCCAGCTACTCCTGGTTACCTGCCTGGTTCCTCGTCAGAGTTGGCCTCACCAGTTCCTTCGCTCCCGCTGCGCATGATGCTGCGGAATACAGCGGACCGCTCCTTCAGCGATAGTCCGGGTGCCAGCGTCAGCTCCAGTCCGCGAAAGCGACGCACCTGCTGCATCTGGAGCTGTGGCAAGCACGCTTCACCGACAACACTTCTCTTCCACTTCCCCACCACCGATATGGAAAAGGTCAAATGGCTGATAAACACCCAGCAAAACCTGCGGGTCCTGGAGACCCAAGACCTGTACGTCTGCCAGGATCACTTTGAACCAGAGGCCATATACCGCAACGAGTTGCGCAACTGGGCAGTGCCCACCCTCAAGTTGGGCTACGATGGACACGTCGTCGAGAATGGCAGAGATACTGGAAATGTCGCGGATTCAAATGAGAAGAGAGTAACCCTGAGGTTTATTTGGGAGAACTATTGCTCTGTGTTCAGCTGTTTGCAGCAGTGCAGTGACAAGCTGCGTCTCTTCCCCTATCCCAAGGATCGGGCCATCGCACGCGAGTGGGCGCGCAACTGCAAGCATCGCTCCATGCAGGCCAGCAGCGATGGCTTCCAGGTGTGTCAGACGCACTTCTCGGAGGATTGCTTTGATCTCGAGACAGGCGAGTTGCTGGATGAAGCTGTGCCCACGCTGAAGCTTGGGCGAGATGGCACCGATACCTGCGAAAGCCGTGTGCGCTGCGTTGTGCCGCACTGTGTCAAGGAGAAGGATGCTCCACGTCGACGATTCTACAGGGTGCCCAAGCGACTCAGCCAGCTAACCATCTGGTGCAGTAATCTCCAGATGCCCGTGGAGACCGCCGCGGATCAGCACATTTGCGATAAACATTTTGAGGCGCAGTGCTTCCATCCAAACCGCTCGTTGCGCTGCGGAGCACGACCCACGCTGCACTTGGGCCACGACAAGCCCGTGGCTCTTCCGCCCGAAGGCAAAAAGTTGCCATTAGCCGACGAGAGTGTAACCCCAAGTTCAGTTGAAACTGCAAAGGATTGTTGTGTGCCCAACTGCGCTAGTGCTCCCATAAAAGGCGCAGCTAAATCTGCAATGGCAGGTCAGGAGTTCAAGATCAAGTGCTTCAGTTTCCCCAAGAATCGCACTTTGGTGGACAAATGGCTGCAGAACCTACGTCTGACCGCAAACAAAAGGTTCCTCGCCAAGCGACGGGTGTGTGAGGTGCACTTTGAACCCAACAGCATTGAGAACGGTCGTCTACTTTTGGGCTCCATTCCTACACTCCAGCTGGGACACAGTGAAAAAACCAACATACATCCCAATGCCATCAAGGCTAAGTTTAAGCGCAAGGAACTTGTCAGTGATGTGTGCTGCTATCCGAAGTGTACAGAGCTTCAGAAGACTTTCCAACGGGCGACCTACGAGTTGCCCCAGGATGAGGAGCTGCGTGCCGCTTGGATGAAGCATATGGGGCTGGAACCAGAAAATTCAAAGAAGGAAAAACGGGAGAAACAAGAGGAGCAGGAGAAGCAAGAAGAGCAGAAAAAGCAAGAAGAGCAGAAGAAGCAAGAAGAGCAGGATAAACAAGAAGATAAGCTGGGGAAGAAAGATGAACAGAAAAAGCTAGGAGAGCAGGATAAGCAAAAAGATCAGGAGCAGCAAGAAGAGCAGGAGAAGCAAGAAGAGCAGGAAAAGCAAGAAGAGCAGAATAATCAAGAAGAAAAGATGGAGAAGCATAAAGAGCAGGATAAGCAAGAAGAACAGGAGAAGCAAGTGTACAAACTGTGCGCGTTGCATCTTATAATGATCTACGAGCACAGCCTGGACAACCTGTCCTCTCACAAATCCGAGTCCAAACTGGACGCAGACTACGCCGAGTGCCGGGACAGCGTGCGGATGCGTGTTGTGAGCTGCGCTGTGCGAGGCTGTCGCATGCTAAAGCCGCGTGACGGTGGTTGCCTCCATGGACTGCCCACGCGTCCGGATCTGCTAGAGAAGTGGCTCTACAACATACAGTTGGAGTGCCCCGAAAGCCAGCGTTACATGTTCAAGTTGTGTGGCCGGCACTTTGAGCCGCACTGCATCATGGACTCGGGAAGACGACTGAGGACCTGGACTTTGCCCACATTGGCGCTGCCCGAGCGGCAGCCAGGCGAGCAGCCCCCATATCAGAATCCCACAGAGGAGGAACTGCAGCAACAGGCACAGGAGCAGCTGGAACAGAAGCAGCTGGCAGCCCAGAGGTTGGAAGCGGAGAGACTGGCAGCTCTGGAGCCCATTGTTAATCTGGAGGAGGGAGAGATCCCAGTGAAGATGGAAATAGCAGTGCCGGAATATCTGAAGGAAAGTGGCAAGTATCCGGAGTATGACAACAGCGATCAGCCGCTGGAGGTAAAGCTCGAGGTTGCTCACGTCGAGAAGTGCACCACCTACGAAAAAATGGACACCGATAACCAAAAGCAGTATGACGTCTACGAGACGCCTCCGATACAACCGCCCAAGAAGCGTCACCTCGCTGGAAGACAAGCAACAGATTCCACACGCATCTACTCGACCAACAGCTGCTGTGTGAATGGCTGCCAGGTGACCAGCGAGGATCTGCAGCAGAATATCAAGCTCCACAAGTTTCCCTCCTCGCCGGACGCTCTCTACAAATGGATGCACAACACCCAGGTACATGTGGACACCAATTATAGCTGGCGGTATCGCATCTGTAGTCATCACTTCAGAGATGATTGCTTCAATGGCATCCGACTGAGAAAGGGTGCAGTTCCCACCATAGGACTGGGTCCCGAGCGTCCACAGCAGATTTTTGAGTACAACCCCTCCCAGCCGCTGGATCAGTCCCAGGAGTTGCAGGTACTCATTCCGCCGCGCATTGTCAATGGGGTTACACTGTGCCTGCCTCCGAACGGTCCACCGCTGAAGTCCAGCAAATTCTGTCAGATCGATGGCTGCCGCAGTCACATGTCCAGCAAGAATGTCACGTTGCACAAGTTCCCCTACTCGAAGGAAATGTGCGTCAAGTGGCGACACAATACCCAGGTGCCCTTCGATACCAAGTTCCGCTGGCGCTATCGCATCTGTAGCATCCATTTCCTGCCAGTGTGCCTGGAAAACCAGCGATTGCTCAATGGAAGTGTGCCCACACTTAAGCTGGGACGACGTGCTCCAGCTCAGCTCTTTCCCAATGAGATTGAAGCTGCTGGGATGCAGCCAGAGAAGCAGATCACTAACAACCACAGCCCGGAACAGCTAGTCAAGCAGGAAGTGCAAGATGAGCACGACCATGACTCGGCTGTGGATGGAGAGGGAATGCATTTTCTGGTGCCCGATATGCAGCTGTTCGAGTCAGGCATGGAGCAGGATCAATCCATCAGCTGGCTAGATGCCATCCATGGCAACTACAATCCCGTCAGCTCCGGCTGCGATAAGTGCTCCCTGGTGCACTGCCAACGCCAGCGGAGTCAACATGGCGTCCACATCTACAAGTTTCCACGGACGCCACACCTGCAAAAGCTCTGGACGCACAACTTGAGGATTAAGTTCAATGAGCAGCGTCCCTGGAAGACGATTATCTGCAGCGCGCACTTCGAGCCGAACTGCATCCGGCTGGGTAAACTGGTGCCATGGGCAGTGCCCACATTGAAACTGGGTCATAATGTGCCTGGTGGTATCTACACGAATGAGCAGAGTCGGGAGCTGCTGGAGACGGGAGGCAGTGATGTGGATGATGGCGAGATGACCATTGAGGAGACACAGATATTGGGCACCTGCAATGATAGTGATGACGACGGACAGGATGGGACGCAATTTCCAAATGCGAAACGACGTCGTTCACGAGTCGAGGCGGGACAGCTGCCGCTCTCCAAGATCAAGGTGTGCTCCTTGCCCTACTGCCGTCGTCCACGTGGCGATGGCATCAAGTTGTTCCGACTGCCCAACAACACCGACGATCTTCACCGATGGGAGCAGGCGACAGGGATGCGCTTCACCGAATCCCAGCGGAATACGAAGCTCATCTGCAGTCGGCACTTTGAGCCGCATCTGATTGGAGTCCGTCGGCTCATGTACAGAGCGGTGCCAACACTCAATCTGGAGCCGATCAATGGTGTCTACGATTCCGGACCCAGTTGCTGTGTGCCGGATTGCGAGGAGCAGGAGAATCTGTACAATTTCCCCAGCGACCCCGTGCAGATGATGTCCTGGTGCCAACTTTTGAATCTTCCCGACAACCAAGACTATCATGGCAAATATATCTGCAGTGCCCACATGCTCAATCCGATGATGACGACCAACTGCATCGTGTGCGGCAGTGAGGATCTGCAGCCGCCACTACTTCACTTCCCGGAGAATCATAATGAACGAACCAAATGGTGCCACAATCTGAAGATCGAGGCCATACCCCAGTGGGACAACTCCAAGCTGATCTGCAGCAAACACTTTGAGAGCAGTTGCTTCAAGGAGACGGGACAGCTGCTGCCCGACGCATTTCCAACGCTCCACTTGAACCACAACGATGCCAATATATTCCTCAATGAGCCGGCCACGTTGCCGAGCATCAAGGATGAGCCCCAGGACATCGAGGACTTGACATAA
Protein Sequence: MSQHNNPLXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXNWYSHVASYPPHHSHAAPFAAPCKTNNNNTNHNNNNNNLMNAYGTGAHTSYYGSGSGGVGVSAAGASGGGVGYNLETNSVAXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXSSYMPHSLMHSSYPYIKSEPMELSDDIQRRQQLQQQQQQQHFQNPMAPPPVPANRHPLDANSEMIIKSEPIDEHAYKSNYIDDNTPFADFSKYPEFGDDMLSPKLELPVKDESYGNQKNPLHFTRRKMPSDDLPICYRCREVFYKKPVYLQHVAESNCNIKEYDYKCNVCPMSFMTTDELQKHKHLHRTDKFLCLRYCGKHFDTIAECESHEYMQHEYESFICNMCSVTFATREELFAHLPQHKFQPRFDCPICRLWYQTAVELHEHRMAAPYFCGKYYVATQQQPQSNYKLQDCHMNNMEMTKGNSAGNALPATAALNSLLQQRQANAEGGTPLFGEAHIKLERSYSNSTSDSSFSQQDSSYNNAYGSDTSMHAVGGPQAHSSTLDDSEDALCCVPLCGVRKSTSPTLQFFTFPKDEKYLHQWLHNLKMFHVPASTYTTFRICSMHFPKRCINRYSLCYWAVPTFNLGHDDVANLYQNRELTNTFTTGEVARCSMPNCTSQRGESNLKFYNFPKDIKSLIKWCQNARLPVQAKEPRHFCSRHFEDRCIGKFRLKPWAVPTLHLGAQYGKIHDNPKNLYVEEKRCCLNFCRRSRSSDFNMSLYRFPRDEVLLRRWCYNLRLDPAVYRGKNHKICSAHFIKEALGLRKLSPGAVPTLHLGHNDTFNIYENELXXXXXXXXXXXXXXXXXXXXXXXXXXXMSPSKYQRHSAASTSSSASSTSHYMDALDHNSSYMSGLGGSSSTLNTSDSMDVCCVPSCESKRHNNENITFHTIPRRPEQMAKWCHNLKIPEDKMHKGMRICSLHFEPYCIGGCMRPFAVPTLHLGHDDEDIHRNPDVIKKLNIRETCCVAVCKRNRDRDHANLHRFPSNIALLTKWCANLQRPVPDGTKLFNDAICEVHFEDRCLRNKRLEKWAVPTLILGHENIAYPLPTPEQVAEFYARPSAPNNGEEQGECCVETCKRNPSVDDIKLYRPPEESQVLAKWAHNLQVDMTKLSSLKICNLHFETHCIGKRMRPWAIPTINLSTNVENPYDNPERQLLYKRRSHLNSNRSSGSHGSGITKPTWVPRCCLPHCRKVRALHNVQLYRFPKINRSTLAKWAHNLQVPAVGSAQRRLCSAHFEPHVLSKKCPVSLAVPTLDLNTPPGYKIYQNPAKLKAAKLCLQRVCIVESCRRQRGQGIQLFRLPHSPTQLRKWMHNIRMRPRGAMRQQYRICSVHFETHSFNGKRLSAGAIPTLELGHQSEDIYPNEAQSFVEEHCVIEGCTGTKEQPDVRLFRFPTDDEDLLWKWCNNLKMNPVDCFGVRICNKHFETDCIGPKHLYKWAIPTMELGHDDADIELIPNPKPEDRYVDPVFKCCVPTCGKTRRFDEVQMNSFPKDVAMFQRWKHNLRLEHLEFKDRDRYKICNAHFEDICIGKTRLNIGSIPTLELGHDETEDLHKVNPEELKSNLFGRPRRVSSVMGAASIKQEDNSELEEDDFHSDVDTSQVKTKRSQLDLKCSVPNCGRSGIQHGIRLFPFPTGKQQQLKWRHNLRLDARDVDRSTRVCSVHFNRRCIDGNQLRSWAIPTLQLGHQEQPIHENPKNIPGFFTPTCALAHCRKRRSIDNDLRTYRYPRSEDLLEKWRINLRLSPDQCRGRICADHFEPMVRGKLKLKTGAVPTLKLGHEEGAVFDNEAIKAGLQETETEEADTSLESSIKVRVKKERVERDEXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXLLLPPDTPSAPLKSPRRERVANNVTPICCLKHCRKERTSTHQLSTFGFPKDQQQLLKWSANLHIPPADCIGRVCVEHFELEVLGTRKLKQHAVPTVNLGHNMPLSYSCTGLPMEGIHDEQPQHSVFRLSSLKHCRKRKHSTDAEPNPNLDQDQDLARSKRRCLLPSCGKRIEQDDVQLHKFPSSRTQLRKWLHNLKLSPQKDYNQARLCSDHFHQQPADSAPEDWVPTLRLGHRDTHIYQNHAGVGSISSTATNTGCMVPSCTCARLNLYRCYDLPANPLVQQAWLQWLQLPQPKLASDGKLCVMHYMQLVEQVTLPEDVPQSEREVLQQTYDLIAGSAMAMKLRCAVPGCYSKYTDNIRLTKLPTCQEMCAKWIHNTSIEYDASRHYIYRICMLHFEPHVLGPVRPKAWAVPTLQLNHKRSDIHHNPQQVNDGSDVPTTVKIEPGLSDPISVAVPALEPRQMVRIMCDIESLHSPATPGYLPGSSSELASPVPSLPLRMMLRNTADRSFSDSPGASVSSSPRKRRTCCIWSCGKHASPTTLLFHFPTTDMEKVKWLINTQQNLRVLETQDLYVCQDHFEPEAIYRNELRNWAVPTLKLGYDGHVVENGRDTGNVADSNEKRVTLRFIWENYCSVFSCLQQCSDKLRLFPYPKDRAIAREWARNCKHRSMQASSDGFQVCQTHFSEDCFDLETGELLDEAVPTLKLGRDGTDTCESRVRCVVPHCVKEKDAPRRRFYRVPKRLSQLTIWCSNLQMPVETAADQHICDKHFEAQCFHPNRSLRCGARPTLHLGHDKPVALPPEGKKLPLADESVTPSSVETAKDCCVPNCASAPIKGAAKSAMAGQEFKIKCFSFPKNRTLVDKWLQNLRLTANKRFLAKRRVCEVHFEPNSIENGRLLLGSIPTLQLGHSEKTNIHPNAIKAKFKRKELVSDVCCYPKCTELQKTFQRATYELPQDEELRAAWMKHMGLEPENSKKEKREKQEEQEKQEEQKKQEEQKKQEEQDKQEDKLGKKDEQKKLGEQDKQKDQEQQEEQEKQEEQEKQEEQNNQEEKMEKHKEQDKQEEQEKQVYKLCALHLIMIYEHSLDNLSSHKSESKLDADYAECRDSVRMRVVSCAVRGCRMLKPRDGGCLHGLPTRPDLLEKWLYNIQLECPESQRYMFKLCGRHFEPHCIMDSGRRLRTWTLPTLALPERQPGEQPPYQNPTEEELQQQAQEQLEQKQLAAQRLEAERLAALEPIVNLEEGEIPVKMEIAVPEYLKESGKYPEYDNSDQPLEVKLEVAHVEKCTTYEKMDTDNQKQYDVYETPPIQPPKKRHLAGRQATDSTRIYSTNSCCVNGCQVTSEDLQQNIKLHKFPSSPDALYKWMHNTQVHVDTNYSWRYRICSHHFRDDCFNGIRLRKGAVPTIGLGPERPQQIFEYNPSQPLDQSQELQVLIPPRIVNGVTLCLPPNGPPLKSSKFCQIDGCRSHMSSKNVTLHKFPYSKEMCVKWRHNTQVPFDTKFRWRYRICSIHFLPVCLENQRLLNGSVPTLKLGRRAPAQLFPNEIEAAGMQPEKQITNNHSPEQLVKQEVQDEHDHDSAVDGEGMHFLVPDMQLFESGMEQDQSISWLDAIHGNYNPVSSGCDKCSLVHCQRQRSQHGVHIYKFPRTPHLQKLWTHNLRIKFNEQRPWKTIICSAHFEPNCIRLGKLVPWAVPTLKLGHNVPGGIYTNEQSRELLETGGSDVDDGEMTIEETQILGTCNDSDDDGQDGTQFPNAKRRRSRVEAGQLPLSKIKVCSLPYCRRPRGDGIKLFRLPNNTDDLHRWEQATGMRFTESQRNTKLICSRHFEPHLIGVRRLMYRAVPTLNLEPINGVYDSGPSCCVPDCEEQENLYNFPSDPVQMMSWCQLLNLPDNQDYHGKYICSAHMLNPMMTTNCIVCGSEDLQPPLLHFPENHNERTKWCHNLKIEAIPQWDNSKLICSKHFESSCFKETGQLLPDAFPTLHLNHNDANIFLNEPATLPSIKDEPQDIEDLT

Similar Transcription Factors

Sequence clustering based on sequence similarity using MMseqs2

100% Identity: -
90% Identity: -
80% Identity: -