Basic Information

Insect: Drosophila basisetae
Gene Symbol: -
Assembly: GCA_035041595.1
Location: JAWNLB010000162.1:3366213-3383835[-]

Transcription Factor Domain

TF Family: THAP
Domain: THAP domain
PFAM: PF05485
TF Group: Zinc-Coordinating Group
Description: The THAP domain is a putative DNA-binding domain (DBD) and probably also binds a zinc ion. It features the conserved C2CH architecture (consensus sequence: Cys - 2-4 residues - Cys - 35-50 residues - Cys - 2 residues - His). Other universal features include the location of the domain at the N-termini of proteins, its size of about 90 residues, a C-terminal AVPTIF box and several other conserved residues. Orthologues of the human THAP domain have been identified in other vertebrates and probably worms and flies, but not in other eukaryotes or any prokaryotes [1].
Hmmscan Out: # of c-Evalue i-Evalue score bias hmm coord from hmm coord to ali coord from ali coord to env coord from env coord to acc

1 29 8 1.6e+04 -5.5 2.5 21 71 390 439 370 452 0.50

2 29 5.9e-15 1.2e-11 45.1 4.2 1 86 574 646 574 647 0.85

3 29 2.5e-15 5e-12 46.3 4.6 1 87 674 743 674 743 0.83

4 29 6e-16 1.2e-12 48.2 0.4 1 87 765 837 765 837 0.85

5 29 6.7e-16 1.4e-12 48.1 5.9 1 87 932 1002 932 1002 0.81

6 29 7.4e-15 1.5e-11 44.7 3.4 1 86 1026 1097 1026 1098 0.81

7 29 1.2e-12 2.4e-09 37.7 1.0 1 87 1133 1201 1133 1201 0.81

8 29 2.6e-11 5.2e-08 33.4 1.9 1 86 1249 1318 1249 1319 0.77

9 29 5.4e-17 1.1e-13 51.6 0.3 1 86 1346 1415 1346 1416 0.82

10 29 2.9e-12 5.9e-09 36.4 1.3 1 86 1437 1506 1437 1507 0.80

11 29 1.2e-15 2.4e-12 47.3 1.7 1 86 1534 1605 1534 1606 0.85

12 29 1.8e-12 3.5e-09 37.1 1.6 1 85 1682 1750 1682 1752 0.82

13 29 2.7e-12 5.3e-09 36.6 0.1 1 86 1775 1843 1775 1844 0.82

14 29 4.3e-14 8.7e-11 42.3 0.9 1 86 1993 2061 1993 2062 0.82

15 29 6.3e-11 1.3e-07 32.2 0.7 1 61 2115 2169 2115 2190 0.80

16 29 6.5e-05 0.13 12.9 0.1 1 58 2196 2247 2196 2271 0.77

17 29 2.8e-11 5.6e-08 33.3 0.1 1 86 2286 2355 2286 2356 0.83

18 29 2.4e-14 4.7e-11 43.1 1.3 1 87 2414 2484 2414 2484 0.81

19 29 2.8e-13 5.5e-10 39.7 0.6 1 86 2519 2590 2519 2591 0.81

20 29 1.4e-13 2.8e-10 40.7 1.2 1 87 2601 2673 2601 2673 0.81

21 29 8.3e-13 1.7e-09 38.2 0.5 1 85 2696 2765 2696 2767 0.72

22 29 3.9e-06 0.0078 16.8 0.1 1 58 2800 2853 2800 2870 0.84

23 29 4.9e-15 9.9e-12 45.3 0.2 1 86 2891 2963 2891 2964 0.80

24 29 4e-14 8e-11 42.4 1.4 1 86 3097 3169 3097 3170 0.81

25 29 1.3e-14 2.6e-11 43.9 2.4 1 87 3233 3304 3233 3304 0.83

26 29 4.4e-15 8.8e-12 45.5 3.6 1 86 3417 3487 3417 3488 0.85

27 29 1.8e-13 3.7e-10 40.3 0.1 1 87 3580 3650 3580 3650 0.85

28 29 4.3e-10 8.6e-07 29.5 0.4 1 58 3667 3715 3667 3726 0.87

29 29 5e-09 1e-05 26.1 2.5 18 87 3732 3790 3721 3790 0.76

#	of	c-Evalue	i-Evalue	score	bias	hmm coord from	hmm coord to	ali coord from	ali coord to	env coord from	env coord to	acc
1	29	8	1.6e+04	-5.5	2.5	21	71	390	439	370	452	0.50
2	29	5.9e-15	1.2e-11	45.1	4.2	1	86	574	646	574	647	0.85
3	29	2.5e-15	5e-12	46.3	4.6	1	87	674	743	674	743	0.83
4	29	6e-16	1.2e-12	48.2	0.4	1	87	765	837	765	837	0.85
5	29	6.7e-16	1.4e-12	48.1	5.9	1	87	932	1002	932	1002	0.81
6	29	7.4e-15	1.5e-11	44.7	3.4	1	86	1026	1097	1026	1098	0.81
7	29	1.2e-12	2.4e-09	37.7	1.0	1	87	1133	1201	1133	1201	0.81
8	29	2.6e-11	5.2e-08	33.4	1.9	1	86	1249	1318	1249	1319	0.77
9	29	5.4e-17	1.1e-13	51.6	0.3	1	86	1346	1415	1346	1416	0.82
10	29	2.9e-12	5.9e-09	36.4	1.3	1	86	1437	1506	1437	1507	0.80
11	29	1.2e-15	2.4e-12	47.3	1.7	1	86	1534	1605	1534	1606	0.85
12	29	1.8e-12	3.5e-09	37.1	1.6	1	85	1682	1750	1682	1752	0.82
13	29	2.7e-12	5.3e-09	36.6	0.1	1	86	1775	1843	1775	1844	0.82
14	29	4.3e-14	8.7e-11	42.3	0.9	1	86	1993	2061	1993	2062	0.82
15	29	6.3e-11	1.3e-07	32.2	0.7	1	61	2115	2169	2115	2190	0.80
16	29	6.5e-05	0.13	12.9	0.1	1	58	2196	2247	2196	2271	0.77
17	29	2.8e-11	5.6e-08	33.3	0.1	1	86	2286	2355	2286	2356	0.83
18	29	2.4e-14	4.7e-11	43.1	1.3	1	87	2414	2484	2414	2484	0.81
19	29	2.8e-13	5.5e-10	39.7	0.6	1	86	2519	2590	2519	2591	0.81
20	29	1.4e-13	2.8e-10	40.7	1.2	1	87	2601	2673	2601	2673	0.81
21	29	8.3e-13	1.7e-09	38.2	0.5	1	85	2696	2765	2696	2767	0.72
22	29	3.9e-06	0.0078	16.8	0.1	1	58	2800	2853	2800	2870	0.84
23	29	4.9e-15	9.9e-12	45.3	0.2	1	86	2891	2963	2891	2964	0.80
24	29	4e-14	8e-11	42.4	1.4	1	86	3097	3169	3097	3170	0.81
25	29	1.3e-14	2.6e-11	43.9	2.4	1	87	3233	3304	3233	3304	0.83
26	29	4.4e-15	8.8e-12	45.5	3.6	1	86	3417	3487	3417	3488	0.85
27	29	1.8e-13	3.7e-10	40.3	0.1	1	87	3580	3650	3580	3650	0.85
28	29	4.3e-10	8.6e-07	29.5	0.4	1	58	3667	3715	3667	3726	0.87
29	29	5e-09	1e-05	26.1	2.5	18	87	3732	3790	3721	3790	0.76

Sequence Information

Coding Sequence: atgtcacaacaacaacacaatccCCCTCCACAtcaccaacatcaacatcactactatcagcaacagcaacaacaacaacaacatctgcagcagcagcagcatttgcagcataaacaaatacaacaacaacagcacagtTGGTACTCACATGTTGCTTCCTATCCGCCCCCGCATGCCGCTGCCTTTGCGTCGCcctgcaaaagcagcagcagcaacaacaataacaacaacaaccacattaTGAATGCATACGGCACGGGTGCAGGAGCGTATTATGGCTCAACGGGAGCGGGTGGCGTTGGGGTTGGCTATAACCTTGAGGCCAATACTGTGGCCTATGCGCACAACCAGCTGCtgcaataccaacaacaacaacagcagcaacaacagcagcatcagcaacaacaacaacatcagcagcagcagcagctcagccaGCGCTCGTATATGCCTCCACATATAATGCACAGCTCGTATCCGTACATTAAGAGCGAACCTTTGGAGCCACTGCCCGAacgtcatcagcagcagcagcaacagcaactcttTCAGAATCCTATGGCACCGCCGCCAGCACCCGCCATTGCTAATCGTCATTCGCTCGATGCTAGTGGCGAaatgataattaaatCGGAACCCATTGACGAACATGCTTTCAAGTCCAACTATATCGATGATAATACTCCCTTTGCCGATTTTAGTAAATATCCCGAATTCGGCGACGATATGCTAAGTCCCAAGCTAGAGCTAAACGTCAAGGATGAGGCCTATGGAAACCAAAAAaaTCCGCTGAACTACCCACGCCGTAAGCTCCAGACGGATCGCTCCGCGGAGAGTATGCCGATTTGTCAGCGCTGCAAAGAGGTGTTCTTCAAGAAGCACATTTACCTGCGGCATGTGGCCGAGAGCAGTTGCAGCATACACGAGTATGAGTTCAAGTGCAACATCTGTCCCATGTCCTTTATGGGCGGCGAGGAGCTGCAGAAGCACAAGCATCTGCATCGAACCGACAAGTTCTTCTGCCACAAATACTGTGGCAAGCACTACGACTCGATTGCAGAGTGCGAATCGCACGAGTACATGGAGCACGAGTACGATAGCTTTGTGTGCAATATGTGCTCTGTTACGTTCCCCACACGGGAACAGCTGTATGCCCATTTGCCGCAACACAAGTTCCAACAGCGTTACGATTGCCCCATTTGCCGGTTGTGGTACCAAACGGCATTAGAGCTGCACGAGCATCGACTGGCGGCGCCCTACTTTTGTGGCAAGTATTACGCTGCagcacaccagcaacagcagcagcagcagcagcaacaacaacaacaacagcagcagcagcagcagcagcatacacAACAACATGTGCAACAGGGCAACTACAAACTGCAGGATTGTCACATGGGCACCATTGAAAtgaCTCCACCGCAGCACAAGGCGAATGCGGCATTACCGGCAACGGCGGCGCTCAATTCGCTGTTGCAGCAACGCCAGGCGAACGCTGATGGCGCCGCCTTATATGCCTCGGCGCTGAAGAGCGAGACGAACGTGAAACTGGAGCGCAGCTATAGCAACTCCACCAGCGAGTCTGGTTACAGTATGCACGAGAGCAGCTATAACAATGCCTACGCCAGCGACAATTCTCTGCATGGCGGGGGCGGTGCAATTGGTGGTCCGCAGGCGCATTCCTCGACGCTGGACGATTCGGAGGATGCGCTGTGCTGTGTGCCACTTTGCGGGGTGCGCAAGAGCACAAGCCCGACGCTGCAATTCTTTACGTTTCCCAAAGATGACAAGTACTTGCATCAGTGGCTGCACAACCTCAAGATGTTCCACATTCCGGCGTCGAGCTATGCCAGCTTTCGCATCTGCAGCATGCACTTCCCTAAGCGTTGCATCAATCGTTACTCTCTGTGCTATTGGGCGGTGCCCACATTTAATCTGGGCCACGACGATGTGGCCAATCTCTATCAGAATCGTGAGCTGACCAACACATTCACCACCGGCGAGGTGGCCCGCTGCAGTATGCCAAACTGCACTAGTCAGCGTGGCGAGAGTAATCTGAAGTTCTACAACTTTCCCAAGGACATCAAGAGTTTGATTAAGTGGTGCCAAAACGCTCGCCTGCCCGTCCAGGCCAAGGAACCGCGTCACTTCTGCAGTCGCCACTTCGAGGAGCGTTGCATCGGCAAGTTCCGGCTGAAGCCTTGGGCAGTGCCCACTTTACACCTTGGCGCCCAGTACGGCAAGATTCATGACAATCCCAAAAATCTGTATGTGGAGGAGAAGCGCTGCTGCCTCAACTTTTGTCGTCGCAGTCGCTCCTCCGACTTCAACATGTCGCTGTATCGCTTCCCCAGGGATGAGGTGCTACTGCGTCGTTGGTGCTACAATCTACGCCTTGATCCGGCTGTCTATCGTGGCAAGAATCACAAAATTTGTAGCGCTCACTTTATCAAAGAAGCATTGGGATTACGCAAACTATCTCCGGgCGCTGTGCCCACGCTGCATCTGGGTCATAATGACACCTTTAACATCTACGAGAACGAACTGTGGCCACCGCCAACGCCCTCCACGCCCACCCAcaatcatcagcagcagctgcagcaacaccagttgcagcagcagccgcagcaagtGCATCATAAATATCAGCGGCACTCGGCTGCATCCACATCCTCGTCGGCCTCGTCGACATCGCATTATGTGGATCCGGAGCTAAGTGCATCCTACATGAGCATGGGCGCTGGAGGCTCATCGTCTGGCCTTAATGTCAGCGACAGCATGGATGTCTGCTGTGTGCCCAGCTGCGAGAGTAAGCGCCACAACAATGAGAACATCACATTCCACACAATACCCAGGCGGCCAGAGCAGATGCGCAAGTGGTGTCACAATCTTAAGATACCCGAGGACAAGATGCACAAGGGCATGCGGATATGTAGCTTGCACTTTGAGTCTTACTGCATTGGCGGCTGCATGCGTCCGTTTGCGGTGCCGACATTGCATCTGGGTCACGATGACGAGGACATTCACCGCAATCCGGATGTGATCAAGAAGCTCAACATACGCGAAACTTGCTGCGTGGCTGTTTGCAAACGCAATCGGGACCGTGACCATGCCAATCTGCATCGCTTTCCCAGCAATGTGCCGCTGTTGACCAAATGGTGCGCAAATCTGCAGCGTCCTGTGCCGGATGGCAGTAAACTCTTCAACGACGCCATCTGTGAGGTGCACTTTGAGGATCGATGCCTGCGAAACAAACGGCTGGAGAAGTGGGCAGTGCCCACACTCATCCTTGGGCATGGGAATATACCCTATCCGCTGCCCACGCCGGAGCAAGTTGCCGAGTTCTATGCGCGTCCCACTGCGCCTAACAATGGCGAGGAGCAGGGCGAGTGCTGTGTGGAGACGTGCAAGCGTAATCCCAGTGTTGATGACATCAAGCTATATCGCCCCCCCGAGGAGTCGCAGGTGCTGGTAAAGTGGGCGCACAATCTCCAACTGGAGATTGCCCAGCTGCCCAATATGCGAATATGCAATCTGCATTTCGAAGCCCACTGCATTGGCAAGCGGATGCGTCCCTGGGCAATACCCACGCTCAATCTGGCAAGCAACATAGAGAATCTCTACGAGAATCCCGAACACCAGATGCTCTACAAGCGGCGCACGCATCTCAAGACGGGCAGAGCGGCGCGAGGCTCTGAAGCAAGCGCTGGTGGTGTGAAGCCCACCTGGGTGCCacgctgctgcttgccacactgCCGCAAGGTGCGTGCCACGCACAATGTCCAGCTGTATCGCTTCCCCAAACTCAATCGCTCCACGCTGGCCAAGTGGGCGCATAATCTGCAGGTGCCGCTCGTGGGCAGCGCTCAGCGTCGCCTTTGCTCCGCACACTTTGAGCCGCATGTGCTCAGCAAGAAATGCCCGGTGCCCATGGCGGTGCCCACACTGGACCTCAATACGCCATCCGGCTACAAGATCTATCAGAATCCGGCCAAGCTCAAGGCGAATAAGCTGTGCTTGCAGCGTGTCTGCATTGTGGAGAGCTGCCGGCGTCAGCGGGCGCAGGGGGTGCAGCTATTCCGTCTGCCTCACAGCCCCACCCAGCTGCGTAAGTGGATGCACAACATCCGGATGCGGCCCCGAGGAGCTATGCGACAACAGTATCGCATCTGCTCGAAGCACTTCGAGACGCACTCGTTCAATGGGAAGAGACTCAGTGCGGGTGCAATTCCAACGCTTGAGTTGGGCCATGAGGACGAAGACATATTTCCGAATGAGGCGCAGTCTTTCGTGGAGGAGCACTGCACCGTCGAGGGCTGCGATGCCGTCAAGGAGCAACCGGATGTGCGTCTCTTCCGCTTCCCCAACGACGATGAGGATCTGCTCTGGAAGTGGTGCAACAACCTGAAAATGAGTCCTGTCGACTGCATCGGCGTTCGCATATGCAACAGACACTTCGAGACTGATTGCATTGGACCAAAGCACCTGTTCAAGTGGGCCATTCCCACGCTCTCCCTCGGccacgatgatgatgacatcGAGCTGATGTTAAATCCCAAGCCGGAGGAGCGCTATATTGATCCGGTCTTCAAGTGCTGTGTGCCCTCGTGCGGCAAGACGCGTAAATTCGATGAAGTACAGATGAACAGTTTTCCCAAAGATCCGGAGCTCTTCCAGCGCTGGCGCCACAATCTCCGCCTCGAGCATCTCAACTTCAAGGAGCGCGAACGCTATAAGATCTGCAACGCCCACTTCGAGGACATTTGCATTGGTAAGACACGCTTGAACATTGGCTCCATACCGACACTGGAGCTTGGCCACGATGAGACTGATGACTTGTTCCAAGTCAACCCCGAGGAGCTGCAGAGCAATCTCTTTGGACGCCAGAGACGCGTGCAGGATTCCATGAGGATCAACATTAAGCAGGAGGCGCACTCCGACCTCGATGAAGACACTAAACCGGACATTAACCTGTCTGAGGCCACAGATTCAAATACAACACAGATTAAAATCAAGAAATCTATGACCGATTTCAAGTGCTGTGTGTCGAGCTGTGATCGCAGTCGCCTGGAGCATGGTGCCCGCCTCTTTCCGTTTCCGAGCgggaaacagcagcagagcaagTGGCGCCACAATCTCCGGCTGCCTGCTGCCGACGTGGACAAGACGACGCGCATCTGCAGCGTCCACTTCAATCGACGTTGCATCGATGGCAGTCAGCTGAGGGGCTGGGCAATGCCCACACAGCAGCTGGGGCATCAGGAGCTGCCGATCTATGAGAATCCAAAGAATATACCGGGCTTCTTTACGCCCACCTGTGCGCTGGCGCACTGCCGCAAGCGGCGCAGCATTGACAACGATCTGCGTACCTATCGCTATCCACGCAGCGAGGAGCTGCTCGAGAAGTGGCGTGTCAATCTGCGCTTGTCGCCGGACCAATGCCGCGGACGCATCTGTGCGGATCATTTCGAGCCACTGGTGCGTggcaagctgaagctgaagacGGGAGCAGTGCCTACGCTCAAATTGGGACACGACGAGGGCGTGGTCTTCGATAATGAGGGCATTAAGGCGGGTctgcagctggaggaggaggcggaggaaGAAGAGGGCGATGCCAGCTTGAAGTCGTTGGTCAAAGTAAAGACTGAGCAGGAGGATGAGCAGGAGCTAGAGAATGAAGATGaagagcagctggagcaggagcaggatcAAGATATGGACGAGGATGGGGAGGAGCATCGAGACTCTGAGGAACATGGCTATTTTGATCCCTTGGAACTTGTGGAAACCTACGCTGACCAAAACAGCGATGATAACTCTGCCGGACATGATAATCtcgacaatgatgatgatgaagatgaggaCATTCCCGGCAATGACGACGAGCTTCTTCTGCCTGATACGCGGCCACTTCGAATGACAATGGCGCCTCGGCGCGAGAAGGCTGTGAATAATGTGACGCCCATTTGCTGTCTGAAGCATTGTCGCAAGGAGCGCACCGCCATCCATCATCTGAGCACCTTTGGCTTTCCCAAGGatccgcagctgctgctcaagtgGAGCGCCAATCTACAGCTGCCATTGGAGTCGTGCATGGGTCGCGTATGCGTCGAGCACTTTGAGCCCTCGATGCTGGGCACGCGCAAGCTGAAGCAGAATGCGGTGCCCACCTTAAAACTGGGCCATGCCACACCGCTCACCTACAGCTGCAATGGCCGGATGCTGTCTGGCATTTACGATGAACAGCCGCAGCATTCGGTTTTTCGGCTTTGGAGCCTGAAACACTGCCGCAAACGGAAACCGGATCTGGCGGAGATTAAGCCCGGTCGTCGCTGTTGCCTGCGAAGTTGCGGCAAGCAGTCGGAGTTGCACGGCGTCCAGCTGCAGCGTCTGCCCAAGGATCGTCTGATGCTGCGCAAATGGTTGCACAACCTCAAGCTGCCTCCAACGATGGACTGCTCCCAAATGTTCCTCTGCAGCGATCACTTTGAGCTGAATGCGCCGTGTCCCACTTTGAAACTGGGCCACTCGGATACCAATATTTATCGCCACAGTGTGGCTAGCACCAGTGGCAGCTGCCTGGTGCCCAAATGTACTTGTGCTCGTCTCAATCTCTATCGCGGCTATGATCTGCCTGCGCATCCGCAGGTGCAACAGGCCTGGCTACActggctgcagctgccccATCCGCAGCCGTCGCTCAGGCACGCCCAGCTGTGTGTGATGCACTTTATGCAGCTCTACGAACTGGTGCCGCTGCCCGAATCGGTGCCAGATGTTGTGCGCAGGCAGCTGCGTGAGACTTACGAACTGATTTCCAGCTCCAGCATGGCCATGAAGCTGCGTTGCGCTGTGCCTGGCTGCTACTCGAAGTATACGGACAATGTGCGTCTGACCAAGCTGCCGGTTTACCCCGACACCTGCGCCAAGTGGGTGCATAACACCAAGATTCAATATGATCCGGCCCGACATTATGTCTATCGCATCTGCATGTTGCACTTTGAGCCAGGCTGCCTGGGCCCAGTGCGTCCAAAAGTGTGGGCAATGCCaacgctgcagctgcaccacAAGGATGCCAACATCTATTTAAATCCAAAGCTGGATGGCACCCAAACACAGCCGGCCGTGCCGCTGGACCTGCCGCTGCGCATTAAAACTGAGCTGCCGATGTGCAACAGTCCCAGCTTTAGTGCGAGTGCCAGTCCCAGTCCGCGTGGCAAGCTTCGCACTTGCTGCATTCCCAGCTGCGGTCAGCAGGCTTCCGCCCTGACGCGTCTCTTTCGCTTTCCCAGCGCAGAGACGTCGATGCTGAAGTGGCTGGTGAAtacccagcagcagccgcgcTTTGTCGATGCACAACGGCTGTTCGTCTGCCAGGATCACTTCGAGGCGGAGGCCATTTGCAAGAATCAGCTACGCAGCTGGGCGGTGCCAACACTGAATCTAGGACACGATGAACACATCATACCGAATGCCAAGCACAATGGCAACATTGCCGACAGCCAAGAGAACAAGCAGACGCTGCAGTTCATCTGGGCCAACTACTGTTCGGTGCTGACCTGCTTCCAGCAAAGTAGCGAGCAGTTGCGTCTCTACCAATACCCCACGGATCGACCAACCATCCGCAAGTGGGCCGCCAATTGTAAGCATCGCTCCATGCAGGCCAGCAGTGATGGATTCCAGGTGTGTCAGTCGCATTTTACGGCGGATTGCTTTGATCCTGATACCGGGGAGCTGAAGGAGGACGCTGTGCCCACACTGGCGCTGAGCCGGTCTGTCACTGAGGTGCGCTGTGTGGTCAATGGTTGCGTTAAGGACGAAGATGCATCGCGTCGCCGTCTGTTTAAGATGCCCAAGCGTAACCCACAGATATTGGATTGGTGCCACAATTTGCGACTGGATCAGGCGGCCATGAGCGGGTCGGAACAGCACGTTTGTGAACGCCACTTCGAGGCGAACTGCTTCAATGCATCTAGAGTCCTGCGGCCAGGAGCACGACCCACACTTCATTTAGGTCATGAGGACCTAGACGATGTGATACCCAATCCGGCGAACTGGGAAGAGGATGTGATCGCGTGCTGTGTGCCCCACTGCGAAAGCGCCAAGGATGCGGATGAAGTCCAACTGTTTGGGCTGCCAAAGGTGCGTCAGTTGGCGGACAAGTGGCTGCAAAATGTGCACCTCGATCCGACCAAAGAACAACTGGCCGGCCTGAAGATCTGCAGTGTACACTTCGAGGCGAGCTGCATGGAGAATGGTCGACCCACCTATTGTGCAATGCCCACACTCCATCTCGGTCACGATGAGCTCGACAATATACATCCAAGCGTAGAGTCGGTGCCGACGCAGCAGAAGCGCTACTGCAATAGAGATGGCGCCAGTCACGATTGTTGCTATCCGCAGTGCGTGGAGCTGCAGAAGAGCTATCTGCGTGTCACCTACGAGCTGCCCCAGGAGCAAGAGCTCCGTCAGCAGTGGCTCTCCTATATGGGCCTGGAAGCGCAGCAGCTCGAtaaacagcagctgctcaagcTCTGTCCACTCCACCTAATCGTGCTCTACGATCACAGTGCGGATCACTTTTCGGCACACGCCGTTGAGGAGCTGTTGGATTCCAATTATGAGGCAGCGCGCAGCAGCGTTCGCATACGCGTTGTCAGCTGTGCTGTGCGCGGCTGCAGAACACTCAAACCACGCGACGGTGGTCGGCTGCATGGTTTGCCCACGCGGCGAGATCTGCTGGAGATGTGGCTGCACAACATGCAGCTGGTGTTTTACAAGCAACAGCGTTATATGTACAAGATTTGCAGCAAGCACTTTGAGTCCACATGCTTCTCGGAGACAACCAAGCGCCTGAAGCCGTGGAGCATGCCAACGCTCGAGTTGCCGGAGCGCCAACCGGGCGAGATGCCTGCCTATCAGAATCCCACAAAGTTGGAGTGGCAACACATGAATGAGCTCCAGGTTAACGAGAAAGTTGTTGAGGCTCAGCCGGAGCCATTACTCAAGCTGGAGTCGTCCAAGAAggagccaccaccaccgcagGTTATGGAATATGAAGAGGATTGCGACAATAACTCACAGCAGCCACTGGAAATGCAGGCGCTGGAGGTGCTGCTCGAGGTGGGCCATGTCGAGAAGTGTACCACCTACGAGCAAATGGATACCGAGGCAAATCTCAACTATGCCGAGCAGTTCTCGCACAATCCTCTCAGTCCAGGTCCACCCCAATGCCGTATCCCCGTTGTCCAGAATGGACTCCATTACAGTGCACGCACCTGCAGCGTGCATGGCTGCAATGTCACCTCCAATAAtctgagcagcagcatcaagcTACACAAGTTCCCCGTCTCGCTGGATGCCATGCAAAAGTGGATGCACAACACCCAGGTGCTCGTGGACGTCAAATTCGCTTGGCGTTTTCGCATCTGCAGTCATCATTTCATCGAGGATTGCTTTCACGGCTCGCGCATCAGACGTGGGGCGATGCCCACGTTGCGACTGGGCTCACGTCGACCGAAGCATATCTATGATAATGAATTCAACgcccaactgcaactggaacaGTCCAAAGAAGAGGCCAGGGAGGCTCTCGCTGCCCCGCTGGAGTctcagcaacagttgctctcTGCGAATGTAGGTATGCGCCTGCCGCGTCCAGCCCCGCCCTGCAAATCCAGCAAATACTGTCAGATCGAGGGCTGCTCCAATCATTTGACCAGCGAGAATGTGACGCTGCACAAGTTCCCCCATTCGTCGGATATGTGCGCCAAGTGGCAGCACAACACTCAGGTGCCCTTCGACCCCGAGTTCCGCTGGCGCTATCGCATCTGCAGCGCACACTTTGAGCCCATCTGTCTAGGCAACGTGCGACTGATGCACGGCAGTGTGCCCACCCTGAATCTGGGGCCGCTTGCTCCCAAGAAACTGTTTCACAATGAATTCTTGCGTCTGGACAAGCCAACGAGCAGTTCGGAGCTGGGTGTGACCGTCAAACAGGAACAAATGGAGCAATTTGATCAAATGGAGCTGGAAGATGGCAACCAGGAGCAGGATGATTTCAGTCTGCTGGAGCCCGAGCTGCAGTTGCACGAGGGTAGCGAGGATGAGCAACAATATGACAATCATTTCAGTCAAAACGATTCCTATAACTGGTCCGATCAGCAGCTGCGTCTGCCCAGCATTAATCAGGAGAAGTGCACCACCATCTACAATCCGGTCAAGTCCGGGTATGATAAGTGCTCATTGGTCCACTGCCAACGACAGCGTTCCCAGCACGGCGTGCACATCTACAAGTTTCCACGCTCGCGTCAGCTACAGCAACGATGGATGCATAATTTGCGCATCCAATACGATGAGCGACGGCCGTGGAAGACAATGATATGCAGTGTCCATTTCGAGCCGCAATGCATCCGTCTGCGCAAATTGCGTCCCTGGGCGGTGCCCACGCTGGAACTGGGGGACAATGTGCCGCTGGAGATCTTTACGAATGAGCAGAGCCAGCAGCTGTTTGCTCAGTCCGAAGCAGGCAGCGAGTGTGATGACTTTGAAGTGGATGTTGAGGACACCATACTGGAGGACTTGGATGATGACTATGATGACAATGAAGCTGATGCGAATGTGAACGCTGATGATCAAATGCGAACAGTTCCATATGTTAAAAGAGAGCGTCGCTCTCGATTTGATCCTCTGCCACCGGGTCAGCTACCACAGTGGAAGATCaaatgctgctgtttgccCTATTGCCGCAGTCCTCGCGGTGATGGCATCAAGCTCTTTCGACTGCCCAACAACATCAGCTCCATACGTAAATGGGAGCAGGCCACAGGCATGCGCTTCTACGAGTCCCAGCGCAACACAAAGCTCATCTGCAGTCGACACTTTGATCCGCAGCTTATAGGCGTGCGTCGCCTCATGTCCAATGCGGTACCCAGCCTCCATTTGGGCCCAGACAGCGACGAGCCCGAGCTGCCTCCTGTGGGACCACGTTGCTGCATGCCTGATTGCTCTGAGGATGTCAATGTCCAGCTGCACAAGTTTCCCAAAGATCCCATGCTGCTGCATCAATGGTGTCAGGCGCTCAATCTACCGGATGTTCAAAGCTACTCCGGCCAATTCATTTGTGCGGCACATCTGCCCTCCAACGCGATGAGCTGTTTAATTTGTGGCGTGGACGATGTACAGCTGCCAATGCTGGACTTTCCCCAGAATCGCAATCAGCGCACCAAGTGGTGCCACAATCTGAAAATCGAGCCTCTGCCCAAGTGGGACAACTCAAAGCAAATTTGCTGCAAACACTTTGAGAGTTTTTGCTTTATCCAGCCGGGTCAACTTCTGGAGGAGGCATTGCCCACGCTACACTTGGAGCACGGGGATAGCAACATATTCCTAAACGATGAGGCCATGGATAACAGCAAGTTGTTGCGTATCAAGGACGAGCCCATGGAGAGCGAGGATCTGATGCTGTAA
Protein Sequence: MSQQQHNPPPHHQHQHHYYQQQQQQQQHLQQQQHLQHKQIQQQQHSWYSHVASYPPPHAAAFASPCKSSSSNNNNNNNHIMNAYGTGAGAYYGSTGAGGVGVGYNLEANTVAYAHNQLLQYQQQQQQQQQQHQQQQQHQQQQQLSQRSYMPPHIMHSSYPYIKSEPLEPLPERHQQQQQQQLFQNPMAPPPAPAIANRHSLDASGEMIIKSEPIDEHAFKSNYIDDNTPFADFSKYPEFGDDMLSPKLELNVKDEAYGNQKNPLNYPRRKLQTDRSAESMPICQRCKEVFFKKHIYLRHVAESSCSIHEYEFKCNICPMSFMGGEELQKHKHLHRTDKFFCHKYCGKHYDSIAECESHEYMEHEYDSFVCNMCSVTFPTREQLYAHLPQHKFQQRYDCPICRLWYQTALELHEHRLAAPYFCGKYYAAAHQQQQQQQQQQQQQQQQQQQQHTQQHVQQGNYKLQDCHMGTIEMTPPQHKANAALPATAALNSLLQQRQANADGAALYASALKSETNVKLERSYSNSTSESGYSMHESSYNNAYASDNSLHGGGGAIGGPQAHSSTLDDSEDALCCVPLCGVRKSTSPTLQFFTFPKDDKYLHQWLHNLKMFHIPASSYASFRICSMHFPKRCINRYSLCYWAVPTFNLGHDDVANLYQNRELTNTFTTGEVARCSMPNCTSQRGESNLKFYNFPKDIKSLIKWCQNARLPVQAKEPRHFCSRHFEERCIGKFRLKPWAVPTLHLGAQYGKIHDNPKNLYVEEKRCCLNFCRRSRSSDFNMSLYRFPRDEVLLRRWCYNLRLDPAVYRGKNHKICSAHFIKEALGLRKLSPGAVPTLHLGHNDTFNIYENELWPPPTPSTPTHNHQQQLQQHQLQQQPQQVHHKYQRHSAASTSSSASSTSHYVDPELSASYMSMGAGGSSSGLNVSDSMDVCCVPSCESKRHNNENITFHTIPRRPEQMRKWCHNLKIPEDKMHKGMRICSLHFESYCIGGCMRPFAVPTLHLGHDDEDIHRNPDVIKKLNIRETCCVAVCKRNRDRDHANLHRFPSNVPLLTKWCANLQRPVPDGSKLFNDAICEVHFEDRCLRNKRLEKWAVPTLILGHGNIPYPLPTPEQVAEFYARPTAPNNGEEQGECCVETCKRNPSVDDIKLYRPPEESQVLVKWAHNLQLEIAQLPNMRICNLHFEAHCIGKRMRPWAIPTLNLASNIENLYENPEHQMLYKRRTHLKTGRAARGSEASAGGVKPTWVPRCCLPHCRKVRATHNVQLYRFPKLNRSTLAKWAHNLQVPLVGSAQRRLCSAHFEPHVLSKKCPVPMAVPTLDLNTPSGYKIYQNPAKLKANKLCLQRVCIVESCRRQRAQGVQLFRLPHSPTQLRKWMHNIRMRPRGAMRQQYRICSKHFETHSFNGKRLSAGAIPTLELGHEDEDIFPNEAQSFVEEHCTVEGCDAVKEQPDVRLFRFPNDDEDLLWKWCNNLKMSPVDCIGVRICNRHFETDCIGPKHLFKWAIPTLSLGHDDDDIELMLNPKPEERYIDPVFKCCVPSCGKTRKFDEVQMNSFPKDPELFQRWRHNLRLEHLNFKERERYKICNAHFEDICIGKTRLNIGSIPTLELGHDETDDLFQVNPEELQSNLFGRQRRVQDSMRINIKQEAHSDLDEDTKPDINLSEATDSNTTQIKIKKSMTDFKCCVSSCDRSRLEHGARLFPFPSGKQQQSKWRHNLRLPAADVDKTTRICSVHFNRRCIDGSQLRGWAMPTQQLGHQELPIYENPKNIPGFFTPTCALAHCRKRRSIDNDLRTYRYPRSEELLEKWRVNLRLSPDQCRGRICADHFEPLVRGKLKLKTGAVPTLKLGHDEGVVFDNEGIKAGLQLEEEAEEEEGDASLKSLVKVKTEQEDEQELENEDEEQLEQEQDQDMDEDGEEHRDSEEHGYFDPLELVETYADQNSDDNSAGHDNLDNDDDEDEDIPGNDDELLLPDTRPLRMTMAPRREKAVNNVTPICCLKHCRKERTAIHHLSTFGFPKDPQLLLKWSANLQLPLESCMGRVCVEHFEPSMLGTRKLKQNAVPTLKLGHATPLTYSCNGRMLSGIYDEQPQHSVFRLWSLKHCRKRKPDLAEIKPGRRCCLRSCGKQSELHGVQLQRLPKDRLMLRKWLHNLKLPPTMDCSQMFLCSDHFELNAPCPTLKLGHSDTNIYRHSVASTSGSCLVPKCTCARLNLYRGYDLPAHPQVQQAWLHWLQLPHPQPSLRHAQLCVMHFMQLYELVPLPESVPDVVRRQLRETYELISSSSMAMKLRCAVPGCYSKYTDNVRLTKLPVYPDTCAKWVHNTKIQYDPARHYVYRICMLHFEPGCLGPVRPKVWAMPTLQLHHKDANIYLNPKLDGTQTQPAVPLDLPLRIKTELPMCNSPSFSASASPSPRGKLRTCCIPSCGQQASALTRLFRFPSAETSMLKWLVNTQQQPRFVDAQRLFVCQDHFEAEAICKNQLRSWAVPTLNLGHDEHIIPNAKHNGNIADSQENKQTLQFIWANYCSVLTCFQQSSEQLRLYQYPTDRPTIRKWAANCKHRSMQASSDGFQVCQSHFTADCFDPDTGELKEDAVPTLALSRSVTEVRCVVNGCVKDEDASRRRLFKMPKRNPQILDWCHNLRLDQAAMSGSEQHVCERHFEANCFNASRVLRPGARPTLHLGHEDLDDVIPNPANWEEDVIACCVPHCESAKDADEVQLFGLPKVRQLADKWLQNVHLDPTKEQLAGLKICSVHFEASCMENGRPTYCAMPTLHLGHDELDNIHPSVESVPTQQKRYCNRDGASHDCCYPQCVELQKSYLRVTYELPQEQELRQQWLSYMGLEAQQLDKQQLLKLCPLHLIVLYDHSADHFSAHAVEELLDSNYEAARSSVRIRVVSCAVRGCRTLKPRDGGRLHGLPTRRDLLEMWLHNMQLVFYKQQRYMYKICSKHFESTCFSETTKRLKPWSMPTLELPERQPGEMPAYQNPTKLEWQHMNELQVNEKVVEAQPEPLLKLESSKKEPPPPQVMEYEEDCDNNSQQPLEMQALEVLLEVGHVEKCTTYEQMDTEANLNYAEQFSHNPLSPGPPQCRIPVVQNGLHYSARTCSVHGCNVTSNNLSSSIKLHKFPVSLDAMQKWMHNTQVLVDVKFAWRFRICSHHFIEDCFHGSRIRRGAMPTLRLGSRRPKHIYDNEFNAQLQLEQSKEEAREALAAPLESQQQLLSANVGMRLPRPAPPCKSSKYCQIEGCSNHLTSENVTLHKFPHSSDMCAKWQHNTQVPFDPEFRWRYRICSAHFEPICLGNVRLMHGSVPTLNLGPLAPKKLFHNEFLRLDKPTSSSELGVTVKQEQMEQFDQMELEDGNQEQDDFSLLEPELQLHEGSEDEQQYDNHFSQNDSYNWSDQQLRLPSINQEKCTTIYNPVKSGYDKCSLVHCQRQRSQHGVHIYKFPRSRQLQQRWMHNLRIQYDERRPWKTMICSVHFEPQCIRLRKLRPWAVPTLELGDNVPLEIFTNEQSQQLFAQSEAGSECDDFEVDVEDTILEDLDDDYDDNEADANVNADDQMRTVPYVKRERRSRFDPLPPGQLPQWKIKCCCLPYCRSPRGDGIKLFRLPNNISSIRKWEQATGMRFYESQRNTKLICSRHFDPQLIGVRRLMSNAVPSLHLGPDSDEPELPPVGPRCCMPDCSEDVNVQLHKFPKDPMLLHQWCQALNLPDVQSYSGQFICAAHLPSNAMSCLICGVDDVQLPMLDFPQNRNQRTKWCHNLKIEPLPKWDNSKQICCKHFESFCFIQPGQLLEEALPTLHLEHGDSNIFLNDEAMDNSKLLRIKDEPMESEDLML

Similar Transcription Factors

Sequence clustering based on sequence similarity using MMseqs2

100% Identity: iTF_00595971;
90% Identity: iTF_00500343;
80% Identity: -