Basic Information

Insect: Drosophila melanocephala
Gene Symbol: -
Assembly: GCA_037043625.1
Location: JBAMBD010000738.1:370104-384314[+]

Transcription Factor Domain

TF Family: THAP
Domain: THAP domain
PFAM: PF05485
TF Group: Zinc-Coordinating Group
Description: The THAP domain is a putative DNA-binding domain (DBD) and probably also binds a zinc ion. It features the conserved C2CH architecture (consensus sequence: Cys - 2-4 residues - Cys - 35-50 residues - Cys - 2 residues - His). Other universal features include the location of the domain at the N-termini of proteins, its size of about 90 residues, a C-terminal AVPTIF box and several other conserved residues. Orthologues of the human THAP domain have been identified in other vertebrates and probably worms and flies, but not in other eukaryotes or any prokaryotes [1].
Hmmscan Out: # of c-Evalue i-Evalue score bias hmm coord from hmm coord to ali coord from ali coord to env coord from env coord to acc

1 29 9 1.7e+04 -5.3 2.6 21 71 393 442 372 457 0.50

2 29 6.7e-15 1.3e-11 45.1 4.2 1 86 579 651 579 652 0.85

3 29 2.8e-15 5.3e-12 46.3 4.6 1 87 679 748 679 748 0.83

4 29 6.8e-16 1.3e-12 48.2 0.4 1 87 770 842 770 842 0.85

5 29 6e-16 1.1e-12 48.4 5.7 1 87 937 1007 937 1007 0.83

6 29 8.4e-15 1.6e-11 44.7 3.4 1 86 1031 1102 1031 1103 0.81

7 29 1.2e-12 2.2e-09 37.8 1.2 1 87 1138 1206 1138 1206 0.80

8 29 2.9e-11 5.5e-08 33.4 1.9 1 86 1254 1323 1254 1324 0.77

9 29 6.1e-17 1.1e-13 51.6 0.3 1 86 1351 1420 1351 1421 0.82

10 29 3.3e-12 6.2e-09 36.4 1.3 1 86 1442 1511 1442 1512 0.80

11 29 4.7e-15 8.9e-12 45.5 1.3 1 86 1539 1610 1539 1611 0.85

12 29 2.7e-13 5.1e-10 39.9 2.5 1 85 1688 1756 1688 1758 0.82

13 29 3e-12 5.6e-09 36.5 0.1 1 86 1781 1849 1781 1850 0.82

14 29 3.2e-13 5.9e-10 39.7 1.4 1 86 2004 2072 2004 2073 0.82

15 29 2.6e-11 4.9e-08 33.5 0.6 1 61 2126 2180 2126 2201 0.80

16 29 2.6e-05 0.048 14.3 0.1 1 58 2207 2258 2207 2282 0.79

17 29 3.2e-11 6e-08 33.3 0.1 1 86 2297 2366 2297 2367 0.83

18 29 4.5e-14 8.4e-11 42.4 1.5 1 87 2425 2495 2425 2495 0.81

19 29 2e-13 3.7e-10 40.3 0.8 1 86 2530 2601 2530 2602 0.81

20 29 1.6e-13 2.9e-10 40.7 1.2 1 87 2612 2684 2612 2684 0.81

21 29 1.8e-14 3.3e-11 43.7 0.2 1 87 2707 2778 2707 2778 0.77

22 29 6.1e-06 0.011 16.3 0.1 1 58 2811 2864 2811 2883 0.84

23 29 7.3e-15 1.4e-11 44.9 0.1 1 86 2902 2974 2902 2975 0.80

24 29 8.3e-14 1.6e-10 41.5 1.3 1 86 3109 3181 3109 3182 0.81

25 29 5.3e-15 1e-11 45.4 2.7 1 87 3245 3316 3245 3316 0.85

26 29 8.4e-15 1.6e-11 44.7 4.0 1 86 3429 3499 3429 3500 0.85

27 29 2.1e-13 3.9e-10 40.3 0.1 1 87 3592 3662 3592 3662 0.85

28 29 9.5e-10 1.8e-06 28.5 0.3 1 58 3679 3727 3679 3743 0.86

29 29 2.1e-08 4e-05 24.2 1.5 18 87 3744 3802 3734 3802 0.75

#	of	c-Evalue	i-Evalue	score	bias	hmm coord from	hmm coord to	ali coord from	ali coord to	env coord from	env coord to	acc
1	29	9	1.7e+04	-5.3	2.6	21	71	393	442	372	457	0.50
2	29	6.7e-15	1.3e-11	45.1	4.2	1	86	579	651	579	652	0.85
3	29	2.8e-15	5.3e-12	46.3	4.6	1	87	679	748	679	748	0.83
4	29	6.8e-16	1.3e-12	48.2	0.4	1	87	770	842	770	842	0.85
5	29	6e-16	1.1e-12	48.4	5.7	1	87	937	1007	937	1007	0.83
6	29	8.4e-15	1.6e-11	44.7	3.4	1	86	1031	1102	1031	1103	0.81
7	29	1.2e-12	2.2e-09	37.8	1.2	1	87	1138	1206	1138	1206	0.80
8	29	2.9e-11	5.5e-08	33.4	1.9	1	86	1254	1323	1254	1324	0.77
9	29	6.1e-17	1.1e-13	51.6	0.3	1	86	1351	1420	1351	1421	0.82
10	29	3.3e-12	6.2e-09	36.4	1.3	1	86	1442	1511	1442	1512	0.80
11	29	4.7e-15	8.9e-12	45.5	1.3	1	86	1539	1610	1539	1611	0.85
12	29	2.7e-13	5.1e-10	39.9	2.5	1	85	1688	1756	1688	1758	0.82
13	29	3e-12	5.6e-09	36.5	0.1	1	86	1781	1849	1781	1850	0.82
14	29	3.2e-13	5.9e-10	39.7	1.4	1	86	2004	2072	2004	2073	0.82
15	29	2.6e-11	4.9e-08	33.5	0.6	1	61	2126	2180	2126	2201	0.80
16	29	2.6e-05	0.048	14.3	0.1	1	58	2207	2258	2207	2282	0.79
17	29	3.2e-11	6e-08	33.3	0.1	1	86	2297	2366	2297	2367	0.83
18	29	4.5e-14	8.4e-11	42.4	1.5	1	87	2425	2495	2425	2495	0.81
19	29	2e-13	3.7e-10	40.3	0.8	1	86	2530	2601	2530	2602	0.81
20	29	1.6e-13	2.9e-10	40.7	1.2	1	87	2612	2684	2612	2684	0.81
21	29	1.8e-14	3.3e-11	43.7	0.2	1	87	2707	2778	2707	2778	0.77
22	29	6.1e-06	0.011	16.3	0.1	1	58	2811	2864	2811	2883	0.84
23	29	7.3e-15	1.4e-11	44.9	0.1	1	86	2902	2974	2902	2975	0.80
24	29	8.3e-14	1.6e-10	41.5	1.3	1	86	3109	3181	3109	3182	0.81
25	29	5.3e-15	1e-11	45.4	2.7	1	87	3245	3316	3245	3316	0.85
26	29	8.4e-15	1.6e-11	44.7	4.0	1	86	3429	3499	3429	3500	0.85
27	29	2.1e-13	3.9e-10	40.3	0.1	1	87	3592	3662	3592	3662	0.85
28	29	9.5e-10	1.8e-06	28.5	0.3	1	58	3679	3727	3679	3743	0.86
29	29	2.1e-08	4e-05	24.2	1.5	18	87	3744	3802	3734	3802	0.75

Sequence Information

Coding Sequence: atgtcacaacaacaacacaatccCCCTCCACAtcaccaacatcaacatcactactatcagcaacagcagcaacaacaacaacaacatcatctgcagcagcagcatttgcagcataaacaaatacaacaacaacagcacagtTGGTACTCACATGTTGCTTCCTATCCGCCCCCGCATGCCGCTGCCTTTGCGTCGCCctgcaaaagcagcagcagcaacagcagcaacaacaataacaacaacaacaaccacattaTGAATGCATATGGCACGGGTGCAGGAGCGTATTATGGCTCAACGGGAGCGGGTGGCGTTGGGGTTGGCTATAACCTTGAGGCCAATACTGTGGCCTATGCGCACAACCAGCTGCtgcaataccaacaacaacagcagcaacaacaacagcatcagcaacaacatcagcagcagcaagagcagcagctcagCCAGCGCTCGTATATGCCACCACATATAATGCACAGCTCGTATCCGTATATTAAGAGCGAACCATTGGAGCCACTGCCCGAAcgccatcagcagcagcaacagcaactcttTCAGAATCCTATGGCACCGCCGCCAGCACCCGCCATTGCAAATCGTCATTCGCTCGATGCTAGTGGCgaaatgataattaaatCGGAACCCATTGACGAACATGCTTTCAAGTCCAACTATATCGATGATAATACTCCCTTTGCCGATTTTAGTAAATATCCCGAATTCAGCGACGATATGCTTAGTCCTAAGCTAGAGTTAAACGTCAAGGATGAGGCCTATGGAAACCAAAAAaacCCGCTGAACTACCCACGTCGTAAGCTCCAAACGGATCGCTCCGCGGAGAGTATGCCCATTTGTCAGCGCTGCAAAGAGGTGTTCTTCAAGAAGCACATTTACCTGCGGCATGTGGCCGAGAGCAGTTGCACGATACACGAGTATGAGTTCAAGTGCAACATCTGTCCCATGTCCTTTATGGGCGTCGAGGAGCTGCAGAAGCACAAGCATCTGCATCGAACGGACAAGTTCTTCTGCCACAAATACTGTGGCAAGCATTACGACTCGATTGCAGAGTGCGAATCGCACGAGTACATGGAGCACGAGTACGATAGCTTTGTGTGCAATATGTGCTCTGTTACGTTCCCCACACGTGAACAGCTGTATGCCCATTTGCCGCAACACAAGTTCCAACAGCGTTACGATTGCCCCATTTGCCGGTTGTGGTACCAAACGGCATTAGAGCTGCACGAGCATCGACTGGCGGCGCCCTACTTTTGCGGCAAGTATTACGCTGCAgcacaccagcagcagcagcaacagcagcaacaacaacagcaacaacaacaacaacaacagcagcagcagcagcatacacaacaacatcagcaacagggCAACTACAAACTGCAGGATTGTCACATGGGCACCATTGAAAtgaCTCCACCGCAGCACAAGGCGAATGCGGCATTACCGGCAACGGCGGCGCTCAATTCGCTGTTGCAGCAACGCCAGGCGAACGCTGATGGTGCCGCTTTATATGCCTCGGCGCTGAAGAGTGAGACGAATGTGAAACTGGAGCGCAGCTATAGCAACTCCACCAGCGAGTCTGGTTACAGTATGCACGAGAGCAGCTATAACAATGCCTACACCAGCGACAATTCTCTGCATGGTGGGGGCGGGGCAATTGGTGGTCCGCAGGCGCATTCCTCGACGCTGGACGATTCGGAGGATGCGCTGTGCTGTGTGCCACTTTGCGGGGTGCGCAAGAGCACAAGCCCCACCCTGCAATTCTTTACGTTTCCCAAAGATGACAAGTACTTGCATCAGTGGCTGCACAACCTCAAGATGTTCCACATTCCGGCGTCGAGCTATGCCAGCTTTCGCATCTGCAGCATGCACTTCCCTAAGCGTTGCATCAATCGTTACTCTCTATGCTATTGGGCGGTGCCCACATTTAATCTGGGGCACGACGATGTGGCCAATCTCTATCAGAATCGTGAGCTAACCAACACATTCACCACCGGCGAGGTGGCCCGCTGCAGTATGCCAAACTGCACTAGCCAGCGTGGCGAGAGTAATCTGAAGTTCTACAACTTTCCCAAGGACATCAAGAGTTTGATTAAGTGGTGCCAAAACGCTCGCTTGCCCGTCCAGGCCAAAGAGCCGCGCCACTTCTGTAGTCGCCACTTCGAGGAGCGTTGCATTGGCAAGTTCCGGCTGAAGCCATGGGCAGTGCCCACGTTACACCTTGGCGCCCAGTACGGCAAGATTCatgacaatcccaaaaatctGTACGTGGAGGAGAAGCGCTGCTGCCTCAACTTTTGTCGTCGCAGTCGCTCCTCCGACTTCAACATGTCGCTGTATCGCTTCCCCAGGGATGAGGTGCTACTGCGTCGTTGGTGCTACAATCTACGCCTTGATCCGGCTGTCTATCGTGGGAAGAATCACAAAATTTGTAGCGCTCACTTTATCAAGGAAGCGTTGGGATTACGCAAACTATCTCCGGgCGCTGTGCCCACGCTGCATCTGGGTCATAATGACACCTTTAACATCTACGAGAACGAACTGTGGCCACCGCCAACGCCCTCCACGCCCACCCAcaatcatcagcagcagctgcagcaacaccagttgcagcagcagccgcaacaagtGCATCATAAATATCAGCGGCACTCGGCTGCATCCACATCCTCGTCGGCCTCGTCGACATCGCATTATGTGGATCCGGAGCTAAGTGCATCCTACATGAGCATGGGCGCTGGAGGCTCATCGTCTGGCCTTAATGTCAGCGACAGCATGGATGTCTGCTGTGTGCCCAGCTGCGAGAGCAAGCGTCACAACAATGAGAACATCACATTCCACACAATACCCAGGCGGCCAGAGCAGATGCGCAAGTGGTGTCACAATCTTAAGATACCCGAGGACAAGATGCACAAGGGCATGCGGATATGTAGCTTGCACTTTGAGCCCTACTGCATTGGCGGCTGCATGCGTCCGTTTGCGGTGCCGACATTGCATCTGGGCCACGACGACGAGGACATTCACCGCAATCCGGATGTGATCAAGAAGCTCAACATACGCGAAACTTGCTGCGTGGCTGTTTGCAAACGCAATCGTGACCGGGACCATGCCAATCTGCATCGCTTTCCCAGCAATGTGCCGCTGTTGACCAAATGGTGCGCAAATCTGCAGCGTCCTGTGCCGGATGGCAGTAAACTCTTCAACGATGCCATCTGTGAGGTGCACTTTGAGGATCGATGCCTGCGCAACAAACGACTGGAAAAGTGGGCAGTGCCCACACTCATCCTTGGGCATGAGAATATACCCTATCCGCTGCCCACGCCGGAGCAAGTTGCCGAGTTCTATGCGCGTCCCACTGCGCCTAACAATGGCGAGGAGCAGGGCGAGTGCTGTGTGGAGACGTGTAAGCGTAATCCCAGTGTTGATGATATCAAGCTATATCGCCCGCCCGAGGAGTCGCAGGTGCTGGTAAAGTGGGCGCACAATCTCCAACTGGAGATTGCCCAGCTGCCCAATATGAGAATATGCAATCTGCATTTCGAATCCCACTGCATTGGCAAGCGGATGCGTCCCTGGGCAATACCCACGCTCAATCTGGCAACCAACATAGAGAATCTCTACGAGAATCCCGAACACCAGATGCTCTACAAGCGGCGCACACATCTCAAGCCGGGCAGAGTAGCGCGAGGCTCTGAAGCAAGCGCTGGTGGTGTGAAGCCCACCTGGGTGCCacgctgctgcttgccacactgCCGCAAGGTGCGTGCCACGCACAATGTCCAGCTGTATCGCTTCCCCAAACTCAATCGCTCCACGCTGGCCAAGTGGGCGCATAATCTGCAGGTACCGCTCGTGGGCAGCGCTCAGCGTCGCCTCTGCTCCGCACACTTTGAGCCGCATGTGCTCAGCAAGAAATGCCCGGTGCCCATGGCGGTGCCCACACTGGACCTCAATACACCATCCGGCTACAAGATCTATCAGAATCCGGCCAAGCTCAAGGCGAATAAGCTGTGCTTGCAGCGTGTCTGTATTGTGGAGAGCTGCCGGCGTCAGCGGGCGCAGGGGGTACAGCTCTTCCGTCTGCCTCACAGCCCCACCCAGCTGCGTAAGTGGATGCACAACATCCGCATGCGTCCCCGAGGAGCTATGCGACAACAGTATCGCATCTGCTCGAAGCACTTCGAGACGCACTCGTTCAATGGGAAGAGACTCAGTGCGGGTGCAATTCCAACGCTTGAGTTGGGCCATGAGGACGAAGACATATTTCCGAATGAGGCGCAGTCTTTCGTGGAGGAGCACTGCACCGTCGAGGGCTGCGATGCCGTCAAGGAGCAACCGGATGTGCGTCTATTCCGCTTCCCCAACGACGATGAGGATCTGCTCTGGAAGTGGTGCAACAATCTGAAAATGAGTCCGGTCGACTGCATCGGCGTTCGCATCTGCAACAGACACTTCGAGACTGATTGCATTGGACCAAAGCACCTGTTCAAGTGGGCCATTCCCACGCTCTCCCTCGGccacgatgatgatgacatcGAGCTGATGCTGAATCCCAAGCCGGAGGAGCGCTATATTGATCCGGTCTTCAAGTGCTGTGTGCCCTCGTGCGGCAAGACGCGTAAATTCGATGAAGTGCAGATGAACAGTTTTCCCAAAGATCTGGAGCTCTTCCAGCGCTGGCGCCACAATCTCCGCCTCGATCATCTCAACTTCAAGGAGCGCGAACGCTATAAGATCTGCAACGCCCACTTCGAGGACATTTGCATTGGTAAGACGCGCTTGAACATTGGCTCCATACCGACACTGGAGCTTGGCCATGACGAGACTGATGACTTGTTCCAAGTCAACCCCGAGGAGCTGCAGAGCAATCTCTTTGGACGCCAGAGACGCGTGCAAGATTCCACGAGGATCAACATTAAGCAGGAGGCGCACTCCGACCTCGATGAAGACACTAAACCGGACATTAACATGTCGGTGGCCACAGATTCAATTACAACACAAGTGGTTAAAATCAAGAAATCTATGACCGATTTCAAGTGCTGTGTGCCGAGCTGTAGTCGCAGTCACCTGGAGCATGGTGCCCGCCTCTTTCCGTTTCCGAACgggaaacagcagcagagcaagTGGCGCCACAATCTCCGGCTGCCTGCTGCCGACGTAGACAAGACGACGCGCATCTGCAGCGCTCATTTCAATCGCCGTTGCATCGATGGCAATCAGCTAAGGGGCTGGGCAATGCCCACACAGCAGCTGGGCCATCAGGAGCTGCCGATCTATGAGAATCCAAAGAATATACCGGGCTTCTTTACGCCCACCTGTGCGCTGGCGCACTGCCGCAAGCGGCGGAGCATTGACAACGATCTGCGTACCTATCGCTATCCACGCAGCGAGGAGCTGCTCGAGAAGTGGCGTGTCAATCTGCGCTTGTCGCCGGATCAATGCCGCGGACGCATTTGTGCGGATCATTTCGAGCCACTGGTGCGTGgcaagctgaagctgaagacTGGAGCAGTGCCTACGCTCAAATTGGGACACGACGAGGGCGTAGTCTTTGATAATGAGGGCATTAAAGCGGGTctgcagcaggaggaggagggggcgGAGGAAGAAGAGGGCGATACTAGCTTGAAGTCGTTGGTCAAAGTAAAGACTGAGCAGGAGGATGAGCAGCAGCTAGAGAATGAAGACGaagagcagcaggagcaggagcaggatcTGGAGCAGGATCAAGATATGGACGAGGATGGGGAAGAGCATCGGGACTCTGAGGAACATGGTTATTTTGATCCCTTGGAACTTGTGGAAACCTACGCTGAGCACCACAGCGATGATAACTCTGCCGGACATGATAATctcgacgatgatgatgacgaagaTGAGGACATTCCCGGCAATGACGATGAGCTGCTTCTGCCTGATACACGGTCACTTCGAATGACAACGGCTCCGCGGCGCGAGAAGGCTGTGAATAATGTGACGCCCATTTGCTGTCTGAAGCACTGTCGAAAGGAGCGCACTGCCATCCATCATCTGAGCACCTTTGGCTTTCCCAAGCatccgcagctgctgctcaagtgGAGCGCCAATCTGCAGCTGCCATTGGAGTCGTGCATGGGTCGTGTATGCGTCGAGCACTTTGAGCCCTCGATGCTGGGCACGCGCAAGCTGAAGCAGAATGCGGTGCCCACCTTGAAACTGGGCCATGCCACACCGCTCACCTACAGCTGCAATGGCCGGATGCTGTCAGGCATTTACGACGAACAGCCGCAGCATTCGGTTTTTCGGCTTTGGAGCCTGAAACACTGCCGCAAACGGAAACCGGATCTGGCGGAGATTAAGCCCGGTCGTCGCTGTTGCCTGCCAAGTTGCGGCAAGCAGTCGGAGTTGCATGGCGTCCAGCTGCAGCGTCTGCCCAAGGATCGTCTGATGCTGCGCAAATGGTTGCACAACCTGAAGCTGCCTCCAACGATGGACTGCACCCAAATGTTCCTCTGCAGCGATCACTTTGAGCTGAATGCGCCGTGTCCCACTTTGAAACTGGGCCACTCGGATACCAATATTTATCGCCACAATGTGGCTAGCACCAGTGGCAGCTGCCTGGTGCCCAAATGTACTTGTGCTCGTCTCAATCTCTATCGCGGCTATGATCTGCCTGCGCATCCGCAGGTGCAACAGGCCTGGCTACACTGGCTGCAGCTGCCCCATCCGCAGCCGTCGCCCAGGCACGCACAGCTGTGTGTGATGCATTTTATGCAGCTCTACGAACTGGTGCCGCTGCCCGAATCGGTGCCAGATGTTGTGCGCAGGCAGCTGCGTGAGACTTACGAACTGATATCCAGCTCCAGCATGGCAATGAAGCTGCGTTGCGCTGTGCCCGGCTGCTACTCGAAGTATACGGACAATGTGCGTCTGACCAAGCTGCCCGTTTACCCCGACACCTGCGCCAAGTGGGTGCACAACACCAAGATTCAATATGACCCGGCCCGACATTATGTCTATCGCATCTGCATGTTGCACTTTGAGCCAGGCTGCCTGGGCCCAGTGCGTCCCAAAGTGTGGGCAATGCCAacgctgcagctgcaccaCAAGGATGCCAACATCTATTTAAATCCAAAGCTGGATGGCAGCCAAACACAGCCGGCCGTGCCGCTGGACCTGCCGCTGCGCATTAAAACTGAGCTGCCGATGAGCAACAGTCCCAGCTTTAGTGCGAGTGCCAGTCCCAGTCCGCGTGGCAAGCTGCGCACTTGCTGCATTCCCAGCTGCGGTCAGCAGGCTTCGGCCCTGACGCGTCTCTTTCGCTTTCCCAGCGCAGAGACGTCGATGCTGAAGTGGCTGGTGAAtacccagcagcagccgcgCTTTGTCGATGCACAACGGCTGTTCGTCTGCCAGGATCACTTCGAGGCGGAGGCCATTTGCAAGAATCAGCTGCGCAGCTGGGCGGTGCCAACAGTGAATCTAGGACACGATGGACACGTCATACCGAATGCCAAGCACAATGGCAACATTGCCGACAGCCAGGAGAACAAGCAGACGCTGCAGTTTATCTGGGCCAACTACTGTTCGGTGCTGACCTGCTTCCAGCAAAGTAGCGAGCAGCTGCGTCTCTACCAATACCCCACGGATCGGCCAACCATCCGCAAGTGGGCCGCCAATTGTAAGCATCGCTCCATGCAGGCCAGCAGTGATGGATTCCAGGTGTGTCAGTCGCATTTTACGCAGGATTGCTTTGATCCTGATACCGGGGAGCTGAAGGAGGACGCAGTGCCCACACTGGCGCTGAGCCGGTCTGTCACTGAGGTGCGCTGTGTGGTCAATGGTTGCGTTAAGGACGAAGATGCATCGCGTCGCCGTCTGTTCAAGATGCCCAAGCGTAACCCACAGATATTGGATTGGTGCCACAATTTACGACTGGATCAGGCGGCCATGAGCGGCTCGGAACAGCACGTTTGTGAACGCCACTTCGAGGCAAACTGCTTCAATGCATCTAGAGTGCTGCGTCCAGGTGCACGACCCACACTTCATTTAGGCCATGAGGACCTAGACGATGTGATACCCAATCCGGCGAACTGGGAAGAGGATGTGATCGTGTGTTGTGTGCCCCACTGCGAAAGCTCCAAGGATGCGGATGAAGTCCAGCTGTTTGGGCTGCCAAAGGTGCGCCAGTTGGCGGACAAGTGGCTTCAAAATGTGCGCCTCGATCCGAGCAAAGAACAACTGGCCAGCCTGAAGATCTGCAGTGTGCACTTTGAGGCGAGCTGCATGGAGAATGGACGACCCACCTATGGTGCAATGCCCACACTCCATCTCGGTCACGATGAGCTCGACAATATACACCCAAGCGTAGAGTCGGTGCCGACGCAGCAGAAGCGCTACTGCAATAGAGATGGCGCCAGTCACGACTGCTGCTATCCGCAGTGCGTGGAGCTGCAGAAGAGCTATCTGCGGGTCACCTACGAGCTGCCCCAGGAGCAGGAGCTCCGTCAGCAGTGGCTCTCCTATATGGGCCTGGAAGCGCAGCAGCTCGATAAGCAGCATCTGCCCAAGCTCTGTCCACTCCACCTAATCTTGCTCTACGATCACAGTGCGGATCACTTTTCGGCACACGCCGCTGAGGAGCTGTTGGACTCCAATTATGAGGCTGCGCGCAGCAGCGTTCGCATACGCGTTGTCAGCTGTGCTGTGCGCGGCTGCAGAACGCTCAAACCACGCGACGGTGGTCGGCTGCATGGCTTGCCCACGCGGCGAGATCTGCTGGAGATGTGGCTGCACAACATGCAGCTGGTTTTTTACGAGCAGCAGCGTTATATGTACAAGATTTGCAGCAAGCACTTTGAGTCCACATGCTTCACGGAGACAACCAAGCGCCTGAAGCCGTGGAGCATGCCTACGCTGGAGTTGCCGGAGCGCGAACCGGGCGAGATGCCTGCCTATCAGAATCCCACTGAGTTGGAGTGGCAACACATGAATGAGCTGCAGGTCAGCGAGAAAGTTGTTGAGGCTCAGCCGGAGCCATTACTCAAGCTGGAGCCGTTGCCCAAGAAggagccaccaccaccgcagGTTATGGAATATGAAGAGGATTGCGACAATAACTCACAGCAGCCACTGGAAATGCAGGCGCTGGAGGTGCTGCTCGAGGTGGGCCATGTCGAGAAGTGCACCACCTACGAGCAAATGGATACCGAGGCAAATCTCAGCTATGCTGAACAGTTCTTGCACAATCCCCTCAGTCCAGGTCCACCCCAATGCCGTATCCCCGTTGTCCAGAATGGACTCCACTACAGTGCACGCCACTGCAGCGTGCATGGCTGCAATATCACCTCCAATAAtctgagcagcagcatcaagcTACACAAGTTCCCCGTCTCGCTGGATGCCATGCAAAAGTGGATGCACAACACCCAGGTGCTCGTGGACGTCAAATTCGCTTGGCGTTTTCGCATCTGCAGTCATCATTTCATCGAGGATTGCTTTCACGGCTCGCGCATCAGACGTGGGGCGATGCCCACGTTGCGACTGGGCTCACGTCGACCGAAGCATATCTATGATAATGAGTTCAACGcccaactgcaactggaacaGTCCAAAGAAGAGGCCAAGGAGGCTCTCGCTGCACCGCTGGAGTctcagcaacagttgctctCTGCGAATGTAGGTCTTCGCCTGCCGCGTCCAGCCCCGCCCTGCAAATCCAGCAAATACTGTCAGATCGAGGGCTGCTCCAATCATTTGACCAGCGAAAATGTGACGTTGCACAAGTTCCCCCATTCGTCGGATATGTGCGCCAAGTGGCAGCACAACACTCAGGTGCCCTTCGATCCCGAGTTCCGTTGGCGCTATCGCATCTGCAGCGCACACTTTGAGCCCAGCTGTCTAGGCAATGTGCGACTGATGCACGGCAGTGTGCCCACCTTGAATCTGGGACCGCTTGCGCCCAAGAAACTGTTTGACAATGAATTCTTGCGTCTGGACAAGCCAATGAGCGGTTCGGAGCTGGGTATGACCGTCAAACAGGAAGAAATGGAGCAATTTGATCAACTGGAGCTGGAAGATGGCAACCAGGAGCAGGATGATTTCAGTCTCCTGGAGCCCGAGCTGCAGTTGCACGAGGGTAGCGAGGATGAGCAACAATATGACAATCATTTCAGCCAAACCGATTCCTATAACTGGTCCGATCAGCAGCTGCGTCTGCCCAGCATTAATCAGGAGAAGTGCACCACCAGCTACAATCCAGTCAAGTCCGGCTATGATAAGTGCTCACTGGTGCACTGCCAACGACAGCGTTCCCAGCACGGCGTGCACATCTACAAGTTTCCGCGCTCGCGTCAGCTACAGCAACGATGGATGCATAATTTGCGCATCCAATACGATGAGCGACGGCCGTGGAAGACAATGATATGCAGTGTCCATTTCGAGCCGCACTGCATCCGTCTGCGCAAGTTGCGTCCCTGGGCGGTGCCCACGCTAGAGCTGGGGGACAATGTGCCGCTGGAGATCTTTACGAATGAGCAGAGCCAGCAGCTGTTTGCTCAGTCCGAAGCAGGCAGCGAGTGTGATGAGGTTGAAATGGATGTTGAGGACACCATGCTGGAGGACTTGGAAGATGACTATGATGACAATGATGCtgatgtgaatgtgaatgctgATGATCAAATGCGAACAGCTCCATATGTCAAAAGAGAGCGTCGCTCTCGATTTGATCCTCTGCCACCGGGTCAGCTGCCACCGTGGAAGATCAAATGCTGCTGTTTGCCCTATTGCCGCAGTCCTCGCGGTGATGGCATCAAGCTCTTTCGACTGCCCAACAACATCAGCTCCATACGTAAATGGGAGCAGGCCACAGGCATGCGCTTCTATGAGTCCCAGCGCAACACAAAGCTCATCTGCAGTCGACACTTTGATCCGCAGCTTATAGGCGTGCGTCGCCTCATGTCTAATGCGGTACCCAGCCTCCATTTGGGCCCAGACAGCGCAGAGCCCGAGCTGCCTCCTGTGGGACCACGTTGCTGCATGTCCGATTGCTCTGAGGATGACAATGTCCAGCTGCACAAGTTTCCCAAAgATCCCATGCTGCTGCATCAATGGTGTCAGGCGCTCAATCTACCGGATGTTCAAAGCTACTCCGGCAAACTCATTTGTGCGGCACATCTGCCCTCCAACGCGATGAGCTGTCTAATTTGTGGCGTGGACGATGTACAGCTGCCAATGCTGGACTTTCCCCAGAATCGCAATCAGCGCACTAAGTGGTGCtacaatttgaaaatcgaGCCTCTGCCCAAGTGGGACAACTCAAAGCAAATTTGCTGCAAACACTTTGAGAGCTTTTGCTTTATCCAGCCTGGTCAACTTCTTGCGGAGGCATTGCCCACGCTGCACTTGGAGCACGGCGATAGCAACATATTCCTAAACGATGAGGCCATGGATAACAGCAAGTTGTTGCGCATCAAGGACGAGCCCATGGAGAGTGAAGATCTGATGCTGTAA
Protein Sequence: MSQQQHNPPPHHQHQHHYYQQQQQQQQQHHLQQQHLQHKQIQQQQHSWYSHVASYPPPHAAAFASPCKSSSSNSSNNNNNNNNHIMNAYGTGAGAYYGSTGAGGVGVGYNLEANTVAYAHNQLLQYQQQQQQQQQHQQQHQQQQEQQLSQRSYMPPHIMHSSYPYIKSEPLEPLPERHQQQQQQLFQNPMAPPPAPAIANRHSLDASGEMIIKSEPIDEHAFKSNYIDDNTPFADFSKYPEFSDDMLSPKLELNVKDEAYGNQKNPLNYPRRKLQTDRSAESMPICQRCKEVFFKKHIYLRHVAESSCTIHEYEFKCNICPMSFMGVEELQKHKHLHRTDKFFCHKYCGKHYDSIAECESHEYMEHEYDSFVCNMCSVTFPTREQLYAHLPQHKFQQRYDCPICRLWYQTALELHEHRLAAPYFCGKYYAAAHQQQQQQQQQQQQQQQQQQQQQQHTQQHQQQGNYKLQDCHMGTIEMTPPQHKANAALPATAALNSLLQQRQANADGAALYASALKSETNVKLERSYSNSTSESGYSMHESSYNNAYTSDNSLHGGGGAIGGPQAHSSTLDDSEDALCCVPLCGVRKSTSPTLQFFTFPKDDKYLHQWLHNLKMFHIPASSYASFRICSMHFPKRCINRYSLCYWAVPTFNLGHDDVANLYQNRELTNTFTTGEVARCSMPNCTSQRGESNLKFYNFPKDIKSLIKWCQNARLPVQAKEPRHFCSRHFEERCIGKFRLKPWAVPTLHLGAQYGKIHDNPKNLYVEEKRCCLNFCRRSRSSDFNMSLYRFPRDEVLLRRWCYNLRLDPAVYRGKNHKICSAHFIKEALGLRKLSPGAVPTLHLGHNDTFNIYENELWPPPTPSTPTHNHQQQLQQHQLQQQPQQVHHKYQRHSAASTSSSASSTSHYVDPELSASYMSMGAGGSSSGLNVSDSMDVCCVPSCESKRHNNENITFHTIPRRPEQMRKWCHNLKIPEDKMHKGMRICSLHFEPYCIGGCMRPFAVPTLHLGHDDEDIHRNPDVIKKLNIRETCCVAVCKRNRDRDHANLHRFPSNVPLLTKWCANLQRPVPDGSKLFNDAICEVHFEDRCLRNKRLEKWAVPTLILGHENIPYPLPTPEQVAEFYARPTAPNNGEEQGECCVETCKRNPSVDDIKLYRPPEESQVLVKWAHNLQLEIAQLPNMRICNLHFESHCIGKRMRPWAIPTLNLATNIENLYENPEHQMLYKRRTHLKPGRVARGSEASAGGVKPTWVPRCCLPHCRKVRATHNVQLYRFPKLNRSTLAKWAHNLQVPLVGSAQRRLCSAHFEPHVLSKKCPVPMAVPTLDLNTPSGYKIYQNPAKLKANKLCLQRVCIVESCRRQRAQGVQLFRLPHSPTQLRKWMHNIRMRPRGAMRQQYRICSKHFETHSFNGKRLSAGAIPTLELGHEDEDIFPNEAQSFVEEHCTVEGCDAVKEQPDVRLFRFPNDDEDLLWKWCNNLKMSPVDCIGVRICNRHFETDCIGPKHLFKWAIPTLSLGHDDDDIELMLNPKPEERYIDPVFKCCVPSCGKTRKFDEVQMNSFPKDLELFQRWRHNLRLDHLNFKERERYKICNAHFEDICIGKTRLNIGSIPTLELGHDETDDLFQVNPEELQSNLFGRQRRVQDSTRINIKQEAHSDLDEDTKPDINMSVATDSITTQVVKIKKSMTDFKCCVPSCSRSHLEHGARLFPFPNGKQQQSKWRHNLRLPAADVDKTTRICSAHFNRRCIDGNQLRGWAMPTQQLGHQELPIYENPKNIPGFFTPTCALAHCRKRRSIDNDLRTYRYPRSEELLEKWRVNLRLSPDQCRGRICADHFEPLVRGKLKLKTGAVPTLKLGHDEGVVFDNEGIKAGLQQEEEGAEEEEGDTSLKSLVKVKTEQEDEQQLENEDEEQQEQEQDLEQDQDMDEDGEEHRDSEEHGYFDPLELVETYAEHHSDDNSAGHDNLDDDDDEDEDIPGNDDELLLPDTRSLRMTTAPRREKAVNNVTPICCLKHCRKERTAIHHLSTFGFPKHPQLLLKWSANLQLPLESCMGRVCVEHFEPSMLGTRKLKQNAVPTLKLGHATPLTYSCNGRMLSGIYDEQPQHSVFRLWSLKHCRKRKPDLAEIKPGRRCCLPSCGKQSELHGVQLQRLPKDRLMLRKWLHNLKLPPTMDCTQMFLCSDHFELNAPCPTLKLGHSDTNIYRHNVASTSGSCLVPKCTCARLNLYRGYDLPAHPQVQQAWLHWLQLPHPQPSPRHAQLCVMHFMQLYELVPLPESVPDVVRRQLRETYELISSSSMAMKLRCAVPGCYSKYTDNVRLTKLPVYPDTCAKWVHNTKIQYDPARHYVYRICMLHFEPGCLGPVRPKVWAMPTLQLHHKDANIYLNPKLDGSQTQPAVPLDLPLRIKTELPMSNSPSFSASASPSPRGKLRTCCIPSCGQQASALTRLFRFPSAETSMLKWLVNTQQQPRFVDAQRLFVCQDHFEAEAICKNQLRSWAVPTVNLGHDGHVIPNAKHNGNIADSQENKQTLQFIWANYCSVLTCFQQSSEQLRLYQYPTDRPTIRKWAANCKHRSMQASSDGFQVCQSHFTQDCFDPDTGELKEDAVPTLALSRSVTEVRCVVNGCVKDEDASRRRLFKMPKRNPQILDWCHNLRLDQAAMSGSEQHVCERHFEANCFNASRVLRPGARPTLHLGHEDLDDVIPNPANWEEDVIVCCVPHCESSKDADEVQLFGLPKVRQLADKWLQNVRLDPSKEQLASLKICSVHFEASCMENGRPTYGAMPTLHLGHDELDNIHPSVESVPTQQKRYCNRDGASHDCCYPQCVELQKSYLRVTYELPQEQELRQQWLSYMGLEAQQLDKQHLPKLCPLHLILLYDHSADHFSAHAAEELLDSNYEAARSSVRIRVVSCAVRGCRTLKPRDGGRLHGLPTRRDLLEMWLHNMQLVFYEQQRYMYKICSKHFESTCFTETTKRLKPWSMPTLELPEREPGEMPAYQNPTELEWQHMNELQVSEKVVEAQPEPLLKLEPLPKKEPPPPQVMEYEEDCDNNSQQPLEMQALEVLLEVGHVEKCTTYEQMDTEANLSYAEQFLHNPLSPGPPQCRIPVVQNGLHYSARHCSVHGCNITSNNLSSSIKLHKFPVSLDAMQKWMHNTQVLVDVKFAWRFRICSHHFIEDCFHGSRIRRGAMPTLRLGSRRPKHIYDNEFNAQLQLEQSKEEAKEALAAPLESQQQLLSANVGLRLPRPAPPCKSSKYCQIEGCSNHLTSENVTLHKFPHSSDMCAKWQHNTQVPFDPEFRWRYRICSAHFEPSCLGNVRLMHGSVPTLNLGPLAPKKLFDNEFLRLDKPMSGSELGMTVKQEEMEQFDQLELEDGNQEQDDFSLLEPELQLHEGSEDEQQYDNHFSQTDSYNWSDQQLRLPSINQEKCTTSYNPVKSGYDKCSLVHCQRQRSQHGVHIYKFPRSRQLQQRWMHNLRIQYDERRPWKTMICSVHFEPHCIRLRKLRPWAVPTLELGDNVPLEIFTNEQSQQLFAQSEAGSECDEVEMDVEDTMLEDLEDDYDDNDADVNVNADDQMRTAPYVKRERRSRFDPLPPGQLPPWKIKCCCLPYCRSPRGDGIKLFRLPNNISSIRKWEQATGMRFYESQRNTKLICSRHFDPQLIGVRRLMSNAVPSLHLGPDSAEPELPPVGPRCCMSDCSEDDNVQLHKFPKDPMLLHQWCQALNLPDVQSYSGKLICAAHLPSNAMSCLICGVDDVQLPMLDFPQNRNQRTKWCYNLKIEPLPKWDNSKQICCKHFESFCFIQPGQLLAEALPTLHLEHGDSNIFLNDEAMDNSKLLRIKDEPMESEDLML

Similar Transcription Factors

Sequence clustering based on sequence similarity using MMseqs2

100% Identity: iTF_00595971;
90% Identity: iTF_00553068;
80% Identity: -