Basic Information

Insect: Drosophila aldrichi
Gene Symbol: -
Assembly: GCA_035045965.1
Location: JAWNOM010000534.1:3989847-4004248[-]

Transcription Factor Domain

TF Family: THAP
Domain: THAP domain
PFAM: PF05485
TF Group: Zinc-Coordinating Group
Description: The THAP domain is a putative DNA-binding domain (DBD) and probably also binds a zinc ion. It features the conserved C2CH architecture (consensus sequence: Cys - 2-4 residues - Cys - 35-50 residues - Cys - 2 residues - His). Other universal features include the location of the domain at the N-termini of proteins, its size of about 90 residues, a C-terminal AVPTIF box and several other conserved residues. Orthologues of the human THAP domain have been identified in other vertebrates and probably worms and flies, but not in other eukaryotes or any prokaryotes [1].
Hmmscan Out: # of c-Evalue i-Evalue score bias hmm coord from hmm coord to ali coord from ali coord to env coord from env coord to acc

1 28 4.7e-15 9.8e-12 45.5 4.3 1 86 568 640 568 641 0.85

2 28 2.8e-15 5.8e-12 46.3 4.8 1 87 668 737 668 737 0.83

3 28 7.1e-16 1.5e-12 48.2 0.4 1 87 759 831 759 831 0.85

4 28 6.9e-16 1.4e-12 48.2 5.8 1 87 934 1004 934 1004 0.82

5 28 8.9e-15 1.9e-11 44.6 3.3 1 86 1028 1099 1028 1100 0.82

6 28 2.4e-12 5e-09 36.8 0.6 1 87 1135 1203 1135 1203 0.80

7 28 8.4e-11 1.8e-07 31.9 1.4 1 86 1248 1317 1248 1318 0.76

8 28 3.5e-17 7.3e-14 52.4 0.2 1 86 1345 1414 1345 1415 0.83

9 28 7.6e-14 1.6e-10 41.7 0.6 1 86 1436 1505 1436 1506 0.81

10 28 6.9e-15 1.4e-11 45.0 1.4 1 86 1533 1604 1533 1605 0.85

11 28 1.2e-13 2.4e-10 41.1 2.5 1 86 1656 1726 1656 1727 0.82

12 28 9.1e-13 1.9e-09 38.2 0.1 1 86 1750 1818 1750 1819 0.81

13 28 2.3e-14 4.7e-11 43.4 0.6 1 87 1971 2040 1971 2040 0.80

14 28 7.3e-11 1.5e-07 32.1 0.2 1 62 2244 2306 2244 2320 0.76

15 28 0.00056 1.2 10.0 0.0 1 58 2325 2375 2325 2391 0.81

16 28 1.1e-11 2.2e-08 34.8 0.4 1 87 2414 2484 2414 2484 0.81

17 28 7.6e-14 1.6e-10 41.7 3.3 1 86 2548 2613 2548 2614 0.85

18 28 4.3e-13 9e-10 39.2 0.7 1 86 2649 2720 2649 2721 0.80

19 28 7.6e-11 1.6e-07 32.1 0.5 1 86 2731 2802 2731 2803 0.81

20 28 1.9e-14 4e-11 43.6 0.1 1 87 2826 2897 2826 2897 0.84

21 28 0.0028 5.8 7.8 0.0 1 58 2928 2979 2928 2999 0.79

22 28 2e-14 4.1e-11 43.5 0.9 1 86 3014 3086 3014 3087 0.82

23 28 5.4e-13 1.1e-09 38.9 0.1 1 86 3259 3331 3259 3332 0.81

24 28 2.6e-14 5.3e-11 43.2 1.2 1 86 3390 3460 3390 3461 0.82

25 28 1.5e-14 3e-11 44.0 4.0 1 86 3576 3646 3576 3647 0.83

26 28 1.3e-12 2.8e-09 37.7 0.3 1 86 3732 3801 3732 3802 0.85

27 28 1.4e-08 2.9e-05 24.8 0.5 1 58 3822 3870 3822 3877 0.86

28 28 2.7e-10 5.7e-07 30.3 0.8 18 87 3887 3945 3875 3945 0.75

#	of	c-Evalue	i-Evalue	score	bias	hmm coord from	hmm coord to	ali coord from	ali coord to	env coord from	env coord to	acc
1	28	4.7e-15	9.8e-12	45.5	4.3	1	86	568	640	568	641	0.85
2	28	2.8e-15	5.8e-12	46.3	4.8	1	87	668	737	668	737	0.83
3	28	7.1e-16	1.5e-12	48.2	0.4	1	87	759	831	759	831	0.85
4	28	6.9e-16	1.4e-12	48.2	5.8	1	87	934	1004	934	1004	0.82
5	28	8.9e-15	1.9e-11	44.6	3.3	1	86	1028	1099	1028	1100	0.82
6	28	2.4e-12	5e-09	36.8	0.6	1	87	1135	1203	1135	1203	0.80
7	28	8.4e-11	1.8e-07	31.9	1.4	1	86	1248	1317	1248	1318	0.76
8	28	3.5e-17	7.3e-14	52.4	0.2	1	86	1345	1414	1345	1415	0.83
9	28	7.6e-14	1.6e-10	41.7	0.6	1	86	1436	1505	1436	1506	0.81
10	28	6.9e-15	1.4e-11	45.0	1.4	1	86	1533	1604	1533	1605	0.85
11	28	1.2e-13	2.4e-10	41.1	2.5	1	86	1656	1726	1656	1727	0.82
12	28	9.1e-13	1.9e-09	38.2	0.1	1	86	1750	1818	1750	1819	0.81
13	28	2.3e-14	4.7e-11	43.4	0.6	1	87	1971	2040	1971	2040	0.80
14	28	7.3e-11	1.5e-07	32.1	0.2	1	62	2244	2306	2244	2320	0.76
15	28	0.00056	1.2	10.0	0.0	1	58	2325	2375	2325	2391	0.81
16	28	1.1e-11	2.2e-08	34.8	0.4	1	87	2414	2484	2414	2484	0.81
17	28	7.6e-14	1.6e-10	41.7	3.3	1	86	2548	2613	2548	2614	0.85
18	28	4.3e-13	9e-10	39.2	0.7	1	86	2649	2720	2649	2721	0.80
19	28	7.6e-11	1.6e-07	32.1	0.5	1	86	2731	2802	2731	2803	0.81
20	28	1.9e-14	4e-11	43.6	0.1	1	87	2826	2897	2826	2897	0.84
21	28	0.0028	5.8	7.8	0.0	1	58	2928	2979	2928	2999	0.79
22	28	2e-14	4.1e-11	43.5	0.9	1	86	3014	3086	3014	3087	0.82
23	28	5.4e-13	1.1e-09	38.9	0.1	1	86	3259	3331	3259	3332	0.81
24	28	2.6e-14	5.3e-11	43.2	1.2	1	86	3390	3460	3390	3461	0.82
25	28	1.5e-14	3e-11	44.0	4.0	1	86	3576	3646	3576	3647	0.83
26	28	1.3e-12	2.8e-09	37.7	0.3	1	86	3732	3801	3732	3802	0.85
27	28	1.4e-08	2.9e-05	24.8	0.5	1	58	3822	3870	3822	3877	0.86
28	28	2.7e-10	5.7e-07	30.3	0.8	18	87	3887	3945	3875	3945	0.75

Sequence Information

Coding Sequence: ATGTCACAACACAATAATCAACCGCATtcgcatcagcatcaacaacaacaactccattactaccagcagcagcagcagcaacatcagctacagcaacaacagcaacagcagcatcagcatttacaacataaacaaatacagcagcagcacagttGGTACTCACATGTTGCTTCCTACCCGCCCCAACAGCCGCACCCGTATGCGACACCCTGCaagagcgccaacaacaacaatcacaacaacaacaacaacattatgAATGCATACGGAGCGGGTGGGACGCACTATTATGgggctgctactgctactgctgctgcgggGGTGGGATATAACCTTGAAGCTAATACAGTGGCCTATGCGCACAACCAGCTGCTGCAATaccagcaagaacaacaacaacagcagcaacatcagcagcagcaacagcacctcGGTCAACGCTCGTATATGCCGCACAGCATAATGCACAATTCCTATCCATATATTAAGAGCGAGCCATTGGAGCTGCCCGATGAAAGACAACGccatcaacaacatcaaacgcagcaacagcaccacctACAACAACATTTCCAAAACCCAATGGCACCGCCGCCAGCACCCGCCTCCAATCGCCACACGCTTGATGCCAGCGGcgaaatgataataaaatCGGAACCCATTGACGAACATGCGTTCAAGTCCAACTATATTGATGATAATACGCCCTTTGCCGATTTTAGCAAATTCCCCGAATTCGGCGACGAAATGTTGAGTCCAAAGGTGGAGTTAACTGTAAAGGATGATGCCTATGGCAACCAAAAGAACCCGCTCAGCTTTCCTCGCCGTAAGCTGCAAACGGAACGTTCCTCGGAGAGCCTGCCCATCTGCCAACGTTGCAAGGAGGTGTtctttaaaaaacaaatctatTTGCGACATGTGGCCGAAAGCAGTTGTACGATCCAAGAGTACGACTACAAGTGCAACATCTGTCCCATGTCCTTCATGAGTGCCGAGGAGCTACAGAAGCACAAGCAACTGCACCGCGCTGACAAGTTCTTCTGCCACAAGTACTGTGGCAAGTTCTTTGACAACATTGCCGATTGCGAGTCGCACGAGTACATGCAACACGACTACGACAGCTTTGTGTGCAACATGTGTTCAATGGCATTTCCTACGCGTGAACAGCTTTACGCCCATTTGCCGCAACACAAGTTTCAGCAGCGCTTCGATTGCCCGATTTGCCGCTTATGGTATCAAACAGCGCTGGAGTTGCACGAGCATCGCCTAGCGGCCCCTTACTTTTGCGGCAAATACTATGCAGCAgcacatcagcatcagcagcaacagcaactccagCAGCTGTCGGAGCAGAGCAACTATAAACTGCAGGATTGCCACATGGGCACGATAGAGATGACTACGTCTCAGCATAAAGCCAATGCGTTGCCTGCCACCGCGGCGCTTAGTTCCTTGCTACAGCAGCGTCAAGCGAATGCTGATGGTGGCGCTTCCCTCTTTGCATCTTCGCTAAAGAACGAGCCGAGTGTTAAGCTGGAGCGAAGCTACAGCAACTCGACCAGCGAGTCCGGATATAGCATGCACGAGAACAGCGGCTACAACAATGCATATGGGAGCGACAACTCGCTGCATACGAGCGGCGTTGCAATCGGTGGACCGCAGGCGCATTCCTCCACGCTGGATGAATCGGAAGATGCGCTGTGCTGCGTGCCATTGTGTGGAGTGCGCAAGAGCACCAGCCCCACTCTGCAGTTCTTCACGTTTCCCAAGGATGAGAAGTACCTGCATCAATGGCTGCACAATCTCAAAATGTTTCACATACCTGCGTCGAGCTATGCCAGCTTTCGCATTTGTAGCATGCATTTCCCGAAGCGTTGCATAAATCGCTATTCGTTGTGCTATTGGGCAGTGCCCACGTTCAACCTGGGCCACGACGATGTCGCCAATTTGTACCAGAATCGAGAGTTGACCAACACATTTACCACCGGCGAGGTGGCTCGCTGCAGCATGCCCAATTGCACGAGCCAGCGCGGCGAAAGCAATCTCAAGTTTTACAATTTTCCGAAGGACATCAAGAATCTGATCAAATGGTGCCAGAACGCACGTCTGCCCGTCCAGGCTAAGGAGCCGCGTCACTTCTGCAGTCGGCACTTCGAGGAGCGTTGCATTGGCAAATTCCGACTGAAACCCTGGGCAGTACCTACGCTCCATCTGGGTGCTCAGTATGGCAAGATTCATGACAATCCGAAGAATCTGTATGTTGAGGAGAAGCGTTGCTGCCTGAACTTTTGTCGCCGCAGTCGCTCCTCGGACTTCAACATGTCGCTCTACCGGTTCCCCCGAGATGAGGTATTGCTGCGTCGTTGGTGCTACAACTTAAGACTCGATCCGGCTGTGTATCGTGGgaaaaatcacaaaatatGCAGCGCTCACTTCATTAAGGAAGCCCTCGGCTTACGGAAATTGTCGCCGGGCGCTGTGCCAACTCTGCACCTGGGCCACAATGACACGTTCAACATATACGAGAATGAGCTGTGGCCTCCTCCTACGGCTTCGACGCCCACGCATCacaatcatcatcagcaacagcagctgcaacagcagcacatgcagcagcagctgccgcagcagcagactCACCACAAATATCAGAGGCACTCTGCCGCGTCCACTTCGTCGTCGGCCAGCTCTACATCCCACTATGTAGATCCAGAGCTAAGTGCCTCCTACATGGCCATGGGCATGGGATCAGGCAACTCATCCTCTGGGCTGCTGAATGTGAGCGACAGCATGGACGTCTGCTGTGTGCCCAGCTGCGAAAGCAAGCGACACAACAATGAGAACATCACATTCCATACGATACCTAGGCGTCCGGAGCAGATGCGCAAATGGTGTCACAATCTGCGTATACCCGAGGAAAAGATGCACAAGGGCATGCGCATATGCAGCCTGCATTTCGAGCCCTATTGCATTGGCGGCTGCATGCGTCCGTTTGCGGTGCCCACGCTGCATTTGGGCCACGACGAAGAGGACATTCATCGCAATCCGGATGTAATCAAGAAGCTCAACATTCGCGAGACCTGTTGCGTGGCAGTGTGCAAACGCAATCGGGATCGGGACCACGCCAATCTGCATCGTTTTCCCAGCAATGTGTCGCTGCTAACCAAATGGTGCGCCAATTTGCAGCGCACGGTTCCGGATGGGATCAAGCTCTTCAACGATGCTATCTGCGAGGTGCATTTCGAGGAACGCTGCTTACGTAACAAGCGGCTGGAGAAGTGGGCCGTGCCCACTCTTATGCTCGGCCACGATAACATTCCCTATCCTCTTCCCACTCCGGAGCAGGTGGCCGAGTTCTATTCTCGACCAAGTGCTCCAAACAATGGCGAAGAGCAGGGTGAATGCTGTGTGGAGACCTGTAAGCGCAATCCCAGCGTGGATGACATCAAGCTCTATCGACCGCCCGAGGAGTCCCAAGTGCTGACCAAATGGGCGCATAATCTGCAGATTGACATCGCCCAGCTGCCTGGCATGCGCATCTGCAATCTACACTTCGAGGCCCACTGCATAGGCAAGCGAATGCGGCCGTGGGCCATACCCACGCTCAATCTTGCCACCAACATAGAGAACCTCTTTGAGAATCCCGAGCAGCAGATGCTGTACAAGCGCCGCACCTCCCATCTCAGCGTGCAAAGAGAAGGAAGTGATGGAAGCATTACCAAACCCACCTGGGTGCCACGCTGCTGTCTGCCCCACTGCCGCAAGGTGCGCGCCCTGCACAACGTCCAGTTGTATCGGTTTCCCAAGCTCAATCGCACCACGTTGGCAAAGTGGGCGCACAATCTGCAAGTTCCGATGGTTGGAAGTGCTCAGAGGCGTCTCTGCTCCGCGCACTTTGAGCCGCACGTCCTTAGCAAGAAGTGCCCAGTGCCGCTTGCGGTGCCGACGCTTGATCTCAATACTCCACCCGGCTACAAGATTTACCAGAACCCAGCCAAGATCAAAGCAAACAAGCTGTGCCCGCAGCGCGTCTGCATTGTGGAGAGCTGCCGTCGGCAGCGTGGCCAGGGAGTCCAGCTCTTCCGGCTGCCCCACAACCCCACCCAGCTGCGCAAGTGGATGCACAACATACGCATGCGACCGCGTGGCGCCATGCGGCAACAGTACCGCATCTGCTCGCGGCACTTTGAGACGCACTCGTTCAATGGCAAGCGCTTGAGCACTGGCGCCATTCCGACTCTCGAGCTGGGCCATCAGGACGACGACATCTATCCGAATGAGGCGCAGCCGTTTGTCGAGGAGCACTGCGCTATCGAGGGCTGTGACGCCTCCAAGGATCAGCCGGATGTGCGGCTCTTCCGGTTCCCGAACGACGACGAGGATCTGCTTTGGAAGTGGTGCAACAATCTCAAGATGAATCCAATTGACTGCATTGGCATGCGCATCTGCAATAGGCACTTCGAGCCCGATTGCATTGGTTCCAAGCATCTCTACAAGTGGGCCATTCCCACGCTGATGCTTGGGCATGATGATGTCCAGATTGAGCTGATATCGAATCCGAAGCCGGAGGCTCGCTACGTAGACCCAGTGTTCAAGTGCTGCGTTCCCACCTGTGGCAAGACTCGCAAGTTCGATGAGGTGCAGATGAACAGCTTCCCCAAAGATCCGACCCTCTTCGAGCGCTGGCGCCACAATCTTCGACTCGACCATCTCAATTTCAAGGAGCGCGAGCGCTATAAGATTTGCAATGCACATTTCGAAGACATATGCATCGGCAAGACGCGCCTCAACCTAGGCTCCATACCCACACTGGAGCTGGGCCACGACGAGACGGAAGACCTGTACCGTGTGAATCCCGATGAGCTGCAAAGCAATATGTTTGGACGACACCAGCGCGTGGGCCCTAAACAGGCGGAGCACTTTACTAGACAGGTCAAGTTCAACCGATTCACGCCGGAGCTCAAGTGCTGTGTACGGAGCTGTCCACGCAGCAAATGGGTAGAAAGTGGAGCCCACTTGTTTCCCTTTCCCACGggcaagcaacagcagaagaagTGGCGTCATAATCTCCGACTCAAAACTGGCGAAGTGGATAGGACGACGCGTGTTTGCAGCGCCCATTTCAATCGCCGCTGCATTGATGGCAAAGAGTTGAGGGGTTGGGCcatgcccacactgcagttGGGCCACCAGGAGACGAACATCTATGAGAATCCGAAGAACATCCCCGGCTTCTTTACGCCCACCTGTGCGTTGGCCCATTGCCGCAAAAGGCGGAGCATTGACAACGATTTGCGCACCTATCGCTATCCGCGCAACGAGGAGCTGCTTGAGAAGTGGCGTGTGAATCTGCGCCTCGCGCCGGATCAATGTCGTGGTCGCATATGTGCGGATCACTTTGAGCCCATGGTGCGTggaaagctaaagctaaagacGGGGGCAGTGCCTACGCTGAAGCTGGGCCACGATGAGGGCGTAGTCTTTGACAACGAGGCTATTAAGGCAGGTATGCAgcacgaggaggaggaggagcatgAAGGTGGAGAGAGCTTTGACTCCCTTGTTAAGGTAAAGAATGAGCTAAATGAAGAGGATCACTCAATGGCTAACGACGAGCAGACAGAAGAAcaggatgatgatgacgaggaGCAGACGAATCATCAATCCGAAGAAGACGAGCAGCAAGAACACGGCTACTTTGATCCTTTGGAGCTTGTGGAAACGTTTGCCGAGCAGCACAGCGAAGACGAACAGCTCTACAATAACGAAGATGACGATGGCGACGACAATATGGAAGAGGAGGATATCCCTGGCAACGATGATGAGCTGTTGCTCCCCGATACTCTGCCTATTCAACTGACTCCTCCCCCGAGACGTGAGAAGAGAGCCGTGAATAATGTGACTCCCATATGCTGCCTCAAGCACTGCCGTAAGGAGCGTACTGCTACCCATCAGCTAAGCACCTTCGGCTTTCCCAAGGATCCACAGCAACTGCTCAAATGGAGCGCAAACCTGCAAATCGATCTGGCCGATTGTGTTGGACGTGTTTGCATTGAGCACTTCGAGGCGGAGATGTTAGGAACGCGCAAGCTGAAGCAAAATGCGGTGCCCACCTTGAATTTGGGCCATGACACACCCCTTAGCTATCGTTGCAATGGACAAGCTGCGGACATCCATGATGCGCAATCACAGCAGCATTCGGTTTTTCGGCTTTGGAGCCTGAAACACTGTCGCAAAAGGAAAGATTCGCTGACGACGCCAACGACGCCAGCGACGCCAACGACGCCAACGACGCCAACGACGCCAGCGACGCCAACGACGCCAACGACGCCAACGACGCCAGCGACGCCAACGACGTCGACGACGCCAGCGATAATAACGATGTCCACGACGTCGACGACgccagcgacaacaacgaTGCTAACGACGTCGACAACgccagcgacaacaacgaTGTCAACGACGTCGACGACGCCAGCGGCAACAACGATGCTAATGAcaccagcagcggcaacgacagcgacagcgacgatgACGACAATGGAGGAAACATcgtcaacgacaacgacgatgacgacaatGGAGGAAACGTcgtcaacgacgacgacgacaatggAGGAAACATcgtcaacgacgacgacgacgacgatgacgacaatGGAGGCAACATCGTCAACGACGACGAAGACGACGACAGCGAATCTAGCAGTGATCCCGACTAAGCGAGTCTGCTGCGTGCCCAGTTGTGGAAAGGAATGGCAGCTGAATGCCACTAACCTGCAACGCATGCCAAAAGAACGTTTGTTGCTGCGCAAGTGGCTGCACAATTTAAGGCTTCCTGCCAACTTTAACCTCAGTCTGGCGTATGTATGCAAAGATCATTTCGAGGATCAGGCAGTGTTGCCCACCTTGCGCCTAGGCCATACGGATAGTAACATTTATCGTAGCCACAAATCAGTCGGTGGCAATGGCTGCATTGTGCCCAGCTGCCCATGTGCCCGTATCTATCGTGGCTACGCCCTGCCCGAGCATCCCCAAGTGCGGGAGGCGTGGCTGCAGTGGCTACAACTACCGCCTCGTTCTCTCGAATCGTTGAGCCACGAGCAGCTGTGCATCATGCACTATATGCAGTTGTTCGAGCAGGTGAAGTTGCCGGAGCAGTTGCCTGAGATGGTGCTGTGCGAGCTGAGGGAAACGTATGACCTCATCGCCACTACCAGCGTTTCCAAGGGGCTACGCTGCTCAGTGCCCGGCTGCCAAAGCAAATTCACGGACAAGGTGCGTCTCACCAGGCTTCCCATATGCCAACGTACGCGGGCCAAGTGGCTGCACAATACGAAAATTGACTTCGATCCGGATTTCGAGCGCGTCTATCGCATCTGCTTGCGGCACTTCGAGCCGCATACCCTGGGTGCAATGCGACCCAGGCTAGGATCGGTGCCTACGCTGCATCTCAACCACAACGACCCGGATATTTTTCAGAATCCCAAGCTGGAAGACAACGCTGATGGCACACTAACCCAGCAAGGGGTGCCTCTTGAAACGCCGCTACGAATCAAGACGGAGCTACCACTTTATCTCTCTGTCAGCCCGTCGGCCAGCGCGAGCGCAAGTCCAAGTCCTCGGGGTAAACTGCGCACCTGTTGCATTGCCAGCTGTGGACAGCAGGAGAATCTGTTTCGCTTTCCCACTAACGAGACGGCGCTGCGCAAGTGGCTGGTGaacacgcagcagcagccgcgtcTCGTGGATACACAGCATCTGTTCGTGTGCCAGGAACACTTCGAGCCGGAGGCCTTTAACAAGAGGCAGTTGCGCAGCTGTGCGGTGCCGACGCTGAAGCTGGGTCACGATGGTAAAATCATACCCAATCCACGACACAATGGCAACATTGCTGACAGCGATGAGTATAGGCAGGCCCTGCAGTACATCTATGCGAACTTCTGCTCCGTTCTCACCTGCTTCCAGCAGCGCAGCGACCAGCTGCGCCTCTTTGCCTACCCGACGGATCGACCCACTCTGCGCCGGTGGGCTGTCAACTGCAAGCATCGTTCCATGCAGGCCAGCAGCGACGGATTTCAGGTGTGCCAGTCTCATTTCGCGGACGACTGCTTTGACCCTGAGACTGGGCAGTTGAAGGAGGATGCTGTGCCCACCCTTGAACTGAGCCGACCCGTCTACGAGATGCGCTGCTTAGTCAATGGCTGCGTTACTGAGGAGGGTGAAAGGCGCCCTCGCTTATTTAAAATGCCAAAACGGACATACCAGATGGAGGATTGGTGTCACAACTTGCGCATCGATGCGGCGTCTTTAGTGGGCCAGGAGCCGCACGTCTGTGAGCGGCACTTCGAGGCGCACTGCTTCAATGCGGATAAGCTGCTACGCCAGGCAGCGCGGCCCACACTTTATTTGGGCCACGATGACCTGCTAGATGTGCTGCCTAATCCGGCCTGGTGGGAGGAGGAAGCCCACGTATGCGTCGTGCCCAGCTGTGGACGCTCGAAGGATGGGGATAATGTGCAGCTGTTCGGGCTGCCAAAGGCTAAATTTCTGCTAGATAAATGGCTGCAGAACTTCCGCCTCGATCCTAGCAAGGTGAAAGTGAAGGGCCGTCGCATATGCAGCGTGCACTTCGAGCCCAGCTGCATAGACAGTGACCGTCTACATATAGGCGCCATGCCTACACTCCACCTGGGTCACGATGAGACAGACAATATACACGAAAGCATCAAAGAGCTGCCAGTGATGTCTCGGATCGGGCATACGCGTATCCACTGCGACTGTTGCTATCCAAATTGCGTGGAACTGAAAAATGGCTTTCGAAAAGTTAACTACGACTTGCCACAGGGGCTGTCACTGCGTGACATGTGGCTGACGTATCTGGGATTGGAGGAATtcgatcagcagcagccgctcaAGCTCTGCCCGCTGCACTTGATCATGCTGTACGAGGAGTTTCCTGAGCAATCGGCGGAGGAGGAGCTGCTGACATCCAACTACGAAGCTGCTCGCAATAGCGTGCGCATTCGCAACGCCAGCTGCGCTGTGAGTGGCTGCAAAACTCTAAGGCCTAGAGATGAGCATTGCCTGCACTTGTCGCCCACGCGCCCTGATATGCTCAAGCTGTGGCTGGACAACATGCAGATGCCTTATGATGAAAATGAGCGCTACAAGTTTCGGGTGTGCGGCAGGCACTTCGAGTCCAATTGCATAGTGGAGAAGGCGCGACGACTAAAGCCCTGGAGCGTGCCTACGCTGGAGTTGCCAATGCCACCAGTGCATCTGAATCCCACGGAGGAGCAGTGGCAACACATGAATGAGCAACTATCCGCACTGCAGGCATTGGAAGCCAATGTTGAGCTGACTGATGtgcagaaaaagaaacaaatacgCAATATAAAATACGCGATGCAGAACTACGTCATACAGGAGCAGGAGAACGACGAGGGGCAGGAAgacgagcaggagcaggaggtcGAGCAGGAGgacgagcaggagcaggaggggTTGCAAATCAAACTGGAACCACAAGTCAAGCAGGAGCCTCAGCCTTTGTACTACGATAACTATTATGAACAGCAGCCGCAAGAAATGCAGGAGCTAGAGGTGCTGCTCGAGGTGGGGCACGTAGAGAAGTGCACCACCTATGAGCAGATGGACACAGCGCCCTCCATAACCTATGCCGAACAGTCGTCGCATATTCCTTCATATCCGTCACATCCACTAGGTAGCGGAGCAACAAACGGCAGTAACTCTCGCTACAGCGCGAGGAATTGCAGCGTACAAGGCTGCGGTGTGACGGTGCTGGATGTGGACGGCAATCTGAAGTTGCACAAGTTTCCCACAGCGATAGATGCAATGGAGAAGTGGATGCACAACACCCAGGTGGATGTAGACGTCAACTTCGCGTGGCGCTTTCGCATTTGCAGCCAACATTTTGTCGCCGAGTGCTTCAATGGATCACGCATTAGACGTGGAGCCATGCCCACGTTGCGTTTGGGACCCCGACGTCCTGCACGTATCTACGATAACGAATTCAATGTTCAGCAGGAACCGACGACAGAGAGTGCAGTGGAAGAGCAGGCTCTACTGCCTGCTGGGGACTCCAAGTTGGACATACAAATGCGCTTACCCTGTCCCGGTCCGCCTCGCAAATCCAGCAAGTACTGTCAAATCGACGGCTGCTCGAATCATCTGACCAGTGAAAATTTGACTCTTCACAAGTTCCCACACTCTGCTGACATGTGCGCCAAGTGGCAGCACAACACGCAGGTGCCCTTTGATCCAGAGTATCGTTGGCGCTATCGCATCTGCAGCGCACACTTTGAACCCATCTGCCTGGGCAACATGCGTCTGGTACAAGGCAGTGTGCCCACCCTGAAGCTGGGTCCCCGCGCTCCTAAGCAGCTCTTTGACAATGACTTTTCGGTCGCTGGCTTGCGCTCGGATAAGGATATGCATGGCGAACAAACTTTCACTGTAAAGCATGAGCAAGCGCAGCCATTCGAGGAGGATGATTCTGTGCAGgcacaggagcaggaggcagagCAGGAACAGGACTTTAGTATGCTAGAGCCAGAACTCCAATTGCATGAAGGTCAGGTAGAGGAGGAACATGAGGACAATTACTTGAACTGCAATAACAATTGGAATGAGGGGAGCATTAAGCAGGAGAAGTGCAGCGAAAACAGCTTTTATAACCCGGTCAAGTCGGGCTATGACAAGTGCTCCTTAATCCATTGTCAGCGACAGCGCTCACAGCATGGCGTGCACATCTATAAATTTCCACGTTCCCGCCAGCTCCAGCAACACTGGATGCACAATTTGCGTATTCGGTACGACGAACGGCGTCCATGGAAGACCATGATATGCAGCGCGCACTTTGAGACTCGATGCATACGACTAAGGAAGCTCCGTCCCTGGGCAGTGCCTACTTTGGAGCTGGGCGACAATGTGCCGGAGCAGCTGTACACGAACGAGCAAAGCCAGCAGCAGATGGAGGTGGGCAGCGAAGGTGAGGCTGACGGCTATGATTACGATGTGGAGGATACTCTGTTGGAGGACTACAACGATGATTACGAAGACAATGGGTCGGAGCAGCTGCCTGCGGAGCCACAGCTCAAGCAAGAACGTCAATCACGCTGCGATCCCAGCCCTCCTTCTGCCCAGTTGCAGCCATGGAAAATAAAGCAATGCTGTTTGCCCCACTGCCGCAGGCCACGAGGCGACGGCATCAAACTCTTCCGACTGCCCAACAACAGTGGCGCCATACGCAAATGGGAGCAGGCGACAGGCATGCGCTTCTTTGCATCGCAGCGCAACACTAAGCTCATCTGTAGCCGTCATTTCGATCCGCAAGTGATTGGCGTTCGTCGCCTTTTCACCAATGCCGTGCCGACAAGGAATCTGGGGCCAAATATTGAGGAACCAGAGCTGCCTGAGTTGCCGGAAAGTACTCCACGCTGCTGCATCACGGACTGCGAGCACAATGGGATAGTCAAGCTGCACAAGTTTCCAAGTGATCCTATGCTGCTTCATCAATGGTGCCAAGCCCTGGATTTGCCGGAGGTACAACGCTACTCTGGTAAACACATTTGTGCAGTTCACCTACCTGCGAAGGCTTTCAGCTGCATCATCTGTGGCGTCGAGGATGTGCAGCTGCCCATGCAAGACTTCCCCGAGAACCGCAATCAGCGGGTCAAATGGTGCTATAATCTTAAAATCGAACCCATTGCCAAGTGGGACAACACGAAACACATCTGCTCTAAACACTTTGAGAGCTATTGCTTTATAGAGCCGGGTCGTCTGCTCCCGGACGCAATGCCTACATTGCATTTGACGCACAATGATAACAACATATTTCTCAACGAGTATGCTGTAAACAACCCCAAAATGCTCTGCATCAAGGACGAGCCCCTGGAGAGTGACGATCTGATGCTATAA
Protein Sequence: MSQHNNQPHSHQHQQQQLHYYQQQQQQHQLQQQQQQQHQHLQHKQIQQQHSWYSHVASYPPQQPHPYATPCKSANNNNHNNNNNIMNAYGAGGTHYYGAATATAAAGVGYNLEANTVAYAHNQLLQYQQEQQQQQQHQQQQQHLGQRSYMPHSIMHNSYPYIKSEPLELPDERQRHQQHQTQQQHHLQQHFQNPMAPPPAPASNRHTLDASGEMIIKSEPIDEHAFKSNYIDDNTPFADFSKFPEFGDEMLSPKVELTVKDDAYGNQKNPLSFPRRKLQTERSSESLPICQRCKEVFFKKQIYLRHVAESSCTIQEYDYKCNICPMSFMSAEELQKHKQLHRADKFFCHKYCGKFFDNIADCESHEYMQHDYDSFVCNMCSMAFPTREQLYAHLPQHKFQQRFDCPICRLWYQTALELHEHRLAAPYFCGKYYAAAHQHQQQQQLQQLSEQSNYKLQDCHMGTIEMTTSQHKANALPATAALSSLLQQRQANADGGASLFASSLKNEPSVKLERSYSNSTSESGYSMHENSGYNNAYGSDNSLHTSGVAIGGPQAHSSTLDESEDALCCVPLCGVRKSTSPTLQFFTFPKDEKYLHQWLHNLKMFHIPASSYASFRICSMHFPKRCINRYSLCYWAVPTFNLGHDDVANLYQNRELTNTFTTGEVARCSMPNCTSQRGESNLKFYNFPKDIKNLIKWCQNARLPVQAKEPRHFCSRHFEERCIGKFRLKPWAVPTLHLGAQYGKIHDNPKNLYVEEKRCCLNFCRRSRSSDFNMSLYRFPRDEVLLRRWCYNLRLDPAVYRGKNHKICSAHFIKEALGLRKLSPGAVPTLHLGHNDTFNIYENELWPPPTASTPTHHNHHQQQQLQQQHMQQQLPQQQTHHKYQRHSAASTSSSASSTSHYVDPELSASYMAMGMGSGNSSSGLLNVSDSMDVCCVPSCESKRHNNENITFHTIPRRPEQMRKWCHNLRIPEEKMHKGMRICSLHFEPYCIGGCMRPFAVPTLHLGHDEEDIHRNPDVIKKLNIRETCCVAVCKRNRDRDHANLHRFPSNVSLLTKWCANLQRTVPDGIKLFNDAICEVHFEERCLRNKRLEKWAVPTLMLGHDNIPYPLPTPEQVAEFYSRPSAPNNGEEQGECCVETCKRNPSVDDIKLYRPPEESQVLTKWAHNLQIDIAQLPGMRICNLHFEAHCIGKRMRPWAIPTLNLATNIENLFENPEQQMLYKRRTSHLSVQREGSDGSITKPTWVPRCCLPHCRKVRALHNVQLYRFPKLNRTTLAKWAHNLQVPMVGSAQRRLCSAHFEPHVLSKKCPVPLAVPTLDLNTPPGYKIYQNPAKIKANKLCPQRVCIVESCRRQRGQGVQLFRLPHNPTQLRKWMHNIRMRPRGAMRQQYRICSRHFETHSFNGKRLSTGAIPTLELGHQDDDIYPNEAQPFVEEHCAIEGCDASKDQPDVRLFRFPNDDEDLLWKWCNNLKMNPIDCIGMRICNRHFEPDCIGSKHLYKWAIPTLMLGHDDVQIELISNPKPEARYVDPVFKCCVPTCGKTRKFDEVQMNSFPKDPTLFERWRHNLRLDHLNFKERERYKICNAHFEDICIGKTRLNLGSIPTLELGHDETEDLYRVNPDELQSNMFGRHQRVGPKQAEHFTRQVKFNRFTPELKCCVRSCPRSKWVESGAHLFPFPTGKQQQKKWRHNLRLKTGEVDRTTRVCSAHFNRRCIDGKELRGWAMPTLQLGHQETNIYENPKNIPGFFTPTCALAHCRKRRSIDNDLRTYRYPRNEELLEKWRVNLRLAPDQCRGRICADHFEPMVRGKLKLKTGAVPTLKLGHDEGVVFDNEAIKAGMQHEEEEEHEGGESFDSLVKVKNELNEEDHSMANDEQTEEQDDDDEEQTNHQSEEDEQQEHGYFDPLELVETFAEQHSEDEQLYNNEDDDGDDNMEEEDIPGNDDELLLPDTLPIQLTPPPRREKRAVNNVTPICCLKHCRKERTATHQLSTFGFPKDPQQLLKWSANLQIDLADCVGRVCIEHFEAEMLGTRKLKQNAVPTLNLGHDTPLSYRCNGQAADIHDAQSQQHSVFRLWSLKHCRKRKDSLTTPTTPATPTTPTTPTTPATPTTPTTPTTPATPTTSTTPAIITMSTTSTTPATTTMLTTSTTPATTTMSTTSTTPAATTMLMTPAAATTATATMTTMEETSSTTTTMTTMEETSSTTTTTMEETSSTTTTTTMTTMEATSSTTTKTTTANLAVIPTKRVCCVPSCGKEWQLNATNLQRMPKERLLLRKWLHNLRLPANFNLSLAYVCKDHFEDQAVLPTLRLGHTDSNIYRSHKSVGGNGCIVPSCPCARIYRGYALPEHPQVREAWLQWLQLPPRSLESLSHEQLCIMHYMQLFEQVKLPEQLPEMVLCELRETYDLIATTSVSKGLRCSVPGCQSKFTDKVRLTRLPICQRTRAKWLHNTKIDFDPDFERVYRICLRHFEPHTLGAMRPRLGSVPTLHLNHNDPDIFQNPKLEDNADGTLTQQGVPLETPLRIKTELPLYLSVSPSASASASPSPRGKLRTCCIASCGQQENLFRFPTNETALRKWLVNTQQQPRLVDTQHLFVCQEHFEPEAFNKRQLRSCAVPTLKLGHDGKIIPNPRHNGNIADSDEYRQALQYIYANFCSVLTCFQQRSDQLRLFAYPTDRPTLRRWAVNCKHRSMQASSDGFQVCQSHFADDCFDPETGQLKEDAVPTLELSRPVYEMRCLVNGCVTEEGERRPRLFKMPKRTYQMEDWCHNLRIDAASLVGQEPHVCERHFEAHCFNADKLLRQAARPTLYLGHDDLLDVLPNPAWWEEEAHVCVVPSCGRSKDGDNVQLFGLPKAKFLLDKWLQNFRLDPSKVKVKGRRICSVHFEPSCIDSDRLHIGAMPTLHLGHDETDNIHESIKELPVMSRIGHTRIHCDCCYPNCVELKNGFRKVNYDLPQGLSLRDMWLTYLGLEEFDQQQPLKLCPLHLIMLYEEFPEQSAEEELLTSNYEAARNSVRIRNASCAVSGCKTLRPRDEHCLHLSPTRPDMLKLWLDNMQMPYDENERYKFRVCGRHFESNCIVEKARRLKPWSVPTLELPMPPVHLNPTEEQWQHMNEQLSALQALEANVELTDVQKKKQIRNIKYAMQNYVIQEQENDEGQEDEQEQEVEQEDEQEQEGLQIKLEPQVKQEPQPLYYDNYYEQQPQEMQELEVLLEVGHVEKCTTYEQMDTAPSITYAEQSSHIPSYPSHPLGSGATNGSNSRYSARNCSVQGCGVTVLDVDGNLKLHKFPTAIDAMEKWMHNTQVDVDVNFAWRFRICSQHFVAECFNGSRIRRGAMPTLRLGPRRPARIYDNEFNVQQEPTTESAVEEQALLPAGDSKLDIQMRLPCPGPPRKSSKYCQIDGCSNHLTSENLTLHKFPHSADMCAKWQHNTQVPFDPEYRWRYRICSAHFEPICLGNMRLVQGSVPTLKLGPRAPKQLFDNDFSVAGLRSDKDMHGEQTFTVKHEQAQPFEEDDSVQAQEQEAEQEQDFSMLEPELQLHEGQVEEEHEDNYLNCNNNWNEGSIKQEKCSENSFYNPVKSGYDKCSLIHCQRQRSQHGVHIYKFPRSRQLQQHWMHNLRIRYDERRPWKTMICSAHFETRCIRLRKLRPWAVPTLELGDNVPEQLYTNEQSQQQMEVGSEGEADGYDYDVEDTLLEDYNDDYEDNGSEQLPAEPQLKQERQSRCDPSPPSAQLQPWKIKQCCLPHCRRPRGDGIKLFRLPNNSGAIRKWEQATGMRFFASQRNTKLICSRHFDPQVIGVRRLFTNAVPTRNLGPNIEEPELPELPESTPRCCITDCEHNGIVKLHKFPSDPMLLHQWCQALDLPEVQRYSGKHICAVHLPAKAFSCIICGVEDVQLPMQDFPENRNQRVKWCYNLKIEPIAKWDNTKHICSKHFESYCFIEPGRLLPDAMPTLHLTHNDNNIFLNEYAVNNPKMLCIKDEPLESDDLML

Similar Transcription Factors

Sequence clustering based on sequence similarity using MMseqs2

100% Identity: iTF_00519952;
90% Identity: -
80% Identity: -