Basic Information

Insect: Drosophila engyochracea
Gene Symbol: -
Assembly: GCA_035042385.1
Location: JAWNLK010000113.1:1440385-1454553[+]

Transcription Factor Domain

TF Family: THAP
Domain: THAP domain
PFAM: PF05485
TF Group: Zinc-Coordinating Group
Description: The THAP domain is a putative DNA-binding domain (DBD) and probably also binds a zinc ion. It features the conserved C2CH architecture (consensus sequence: Cys - 2-4 residues - Cys - 35-50 residues - Cys - 2 residues - His). Other universal features include the location of the domain at the N-termini of proteins, its size of about 90 residues, a C-terminal AVPTIF box and several other conserved residues. Orthologues of the human THAP domain have been identified in other vertebrates and probably worms and flies, but not in other eukaryotes or any prokaryotes [1].
Hmmscan Out: # of c-Evalue i-Evalue score bias hmm coord from hmm coord to ali coord from ali coord to env coord from env coord to acc

1 28 4.2e-15 8.7e-12 45.5 4.4 1 86 579 651 579 652 0.85

2 28 2.5e-15 5.1e-12 46.3 4.6 1 87 679 748 679 748 0.83

3 28 6.1e-16 1.2e-12 48.2 0.4 1 87 770 842 770 842 0.85

4 28 6.8e-16 1.4e-12 48.1 5.9 1 87 937 1007 937 1007 0.81

5 28 7.4e-15 1.5e-11 44.7 3.4 1 86 1031 1102 1031 1103 0.81

6 28 1.2e-12 2.5e-09 37.7 1.0 1 87 1138 1206 1138 1206 0.81

7 28 2.6e-11 5.3e-08 33.4 1.9 1 86 1254 1323 1254 1324 0.77

8 28 5.4e-17 1.1e-13 51.6 0.3 1 86 1351 1420 1351 1421 0.82

9 28 3e-12 6.1e-09 36.4 1.3 1 86 1442 1511 1442 1512 0.80

10 28 1.2e-15 2.4e-12 47.3 1.7 1 86 1539 1610 1539 1611 0.85

11 28 5.9e-14 1.2e-10 41.9 1.6 1 85 1687 1755 1687 1757 0.82

12 28 2.7e-12 5.5e-09 36.5 0.1 1 86 1780 1848 1780 1849 0.82

13 28 4.4e-14 9e-11 42.3 0.9 1 86 1998 2066 1998 2067 0.82

14 28 8.1e-12 1.7e-08 35.0 0.7 1 61 2120 2174 2120 2195 0.80

15 28 2.3e-05 0.047 14.3 0.1 1 58 2201 2252 2201 2276 0.79

16 28 2.2e-11 4.6e-08 33.6 0.1 1 86 2291 2360 2291 2361 0.83

17 28 2.4e-14 4.9e-11 43.1 1.3 1 87 2419 2489 2419 2489 0.81

18 28 3e-14 6.3e-11 42.8 0.9 1 86 2524 2595 2524 2596 0.83

19 28 2e-13 4.1e-10 40.2 0.8 1 87 2606 2678 2606 2678 0.81

20 28 7.3e-14 1.5e-10 41.6 0.1 1 87 2701 2772 2701 2772 0.77

21 28 2.3e-05 0.047 14.3 0.1 1 58 2805 2858 2805 2877 0.84

22 28 4.5e-15 9.2e-12 45.4 0.2 1 86 2896 2968 2896 2969 0.80

23 28 4e-14 8.2e-11 42.4 1.4 1 86 3103 3175 3103 3176 0.81

24 28 1.3e-14 2.7e-11 43.9 2.4 1 87 3239 3310 3239 3310 0.83

25 28 7.4e-15 1.5e-11 44.7 4.0 1 86 3423 3493 3423 3494 0.85

26 28 1.8e-13 3.8e-10 40.3 0.1 1 87 3586 3656 3586 3656 0.85

27 28 4.1e-09 8.5e-06 26.3 0.3 1 58 3673 3721 3673 3735 0.85

28 28 8.1e-09 1.7e-05 25.4 2.5 18 87 3738 3796 3727 3796 0.75

#	of	c-Evalue	i-Evalue	score	bias	hmm coord from	hmm coord to	ali coord from	ali coord to	env coord from	env coord to	acc
1	28	4.2e-15	8.7e-12	45.5	4.4	1	86	579	651	579	652	0.85
2	28	2.5e-15	5.1e-12	46.3	4.6	1	87	679	748	679	748	0.83
3	28	6.1e-16	1.2e-12	48.2	0.4	1	87	770	842	770	842	0.85
4	28	6.8e-16	1.4e-12	48.1	5.9	1	87	937	1007	937	1007	0.81
5	28	7.4e-15	1.5e-11	44.7	3.4	1	86	1031	1102	1031	1103	0.81
6	28	1.2e-12	2.5e-09	37.7	1.0	1	87	1138	1206	1138	1206	0.81
7	28	2.6e-11	5.3e-08	33.4	1.9	1	86	1254	1323	1254	1324	0.77
8	28	5.4e-17	1.1e-13	51.6	0.3	1	86	1351	1420	1351	1421	0.82
9	28	3e-12	6.1e-09	36.4	1.3	1	86	1442	1511	1442	1512	0.80
10	28	1.2e-15	2.4e-12	47.3	1.7	1	86	1539	1610	1539	1611	0.85
11	28	5.9e-14	1.2e-10	41.9	1.6	1	85	1687	1755	1687	1757	0.82
12	28	2.7e-12	5.5e-09	36.5	0.1	1	86	1780	1848	1780	1849	0.82
13	28	4.4e-14	9e-11	42.3	0.9	1	86	1998	2066	1998	2067	0.82
14	28	8.1e-12	1.7e-08	35.0	0.7	1	61	2120	2174	2120	2195	0.80
15	28	2.3e-05	0.047	14.3	0.1	1	58	2201	2252	2201	2276	0.79
16	28	2.2e-11	4.6e-08	33.6	0.1	1	86	2291	2360	2291	2361	0.83
17	28	2.4e-14	4.9e-11	43.1	1.3	1	87	2419	2489	2419	2489	0.81
18	28	3e-14	6.3e-11	42.8	0.9	1	86	2524	2595	2524	2596	0.83
19	28	2e-13	4.1e-10	40.2	0.8	1	87	2606	2678	2606	2678	0.81
20	28	7.3e-14	1.5e-10	41.6	0.1	1	87	2701	2772	2701	2772	0.77
21	28	2.3e-05	0.047	14.3	0.1	1	58	2805	2858	2805	2877	0.84
22	28	4.5e-15	9.2e-12	45.4	0.2	1	86	2896	2968	2896	2969	0.80
23	28	4e-14	8.2e-11	42.4	1.4	1	86	3103	3175	3103	3176	0.81
24	28	1.3e-14	2.7e-11	43.9	2.4	1	87	3239	3310	3239	3310	0.83
25	28	7.4e-15	1.5e-11	44.7	4.0	1	86	3423	3493	3423	3494	0.85
26	28	1.8e-13	3.8e-10	40.3	0.1	1	87	3586	3656	3586	3656	0.85
27	28	4.1e-09	8.5e-06	26.3	0.3	1	58	3673	3721	3673	3735	0.85
28	28	8.1e-09	1.7e-05	25.4	2.5	18	87	3738	3796	3727	3796	0.75

Sequence Information

Coding Sequence: atgtcacaacaacaacacaatccCCCTCCACAtcaccaacatcaacatcactactatcagcaacagcagcaacagcaacaacaacaacatctgcagcagcagcagcatttgcagcataaacaaatacaacaacaacagcacagtTGGTACTCACATGTTGCTTCCTATCCGCCCCCGCATGCCGCTGCCTTTGCGTCGCCctgcaagagcagcagcagcaacaacaataataataacaacaaccacattaTGAATGCATACGGCACGGGTGCAGGAGCGTATTATGGCTCAACGGGAGCGGGTGGCGTTGGAGTTGGCTATAACCTTGAGGCCAATACTGTGGCCTATGCGCACAACCAGCTGCTGcagtaccaacaacaacaacagcagcaacaacaacagcagcatcagcaacaacaacaacaacaacatcagcagcagcaacagcagcagcagctcagccaGCGCTCGTATATGCCACCACATATAATGCACAGCTCGTATCCGTACATTAAGAGCGAACCTTTGGAGCCACTGCCCGAAcgccatcagcagcaacagcaacagcaactcttTCAGAATCCTATGGCTCCGCCGCCAGCACCCGCCATTGCTAATCGTCATTCGCTCGATGCTAGTGGCgaaatgataattaaatCGGAACCCATTGACGAACATGCTTTCAAGTCCAACTATATCGATGATAATACTCCTTTTGCcgattttagtaaatatccCGAATTCGGCGACGATATGCTAAGTCCCAAACTAGAGCTAAACGTCAAGGATGAGGCCTATGGAAACCAAAAAaATCCGCTGAACTACCCACGTCGTAAGCTCCAAACGGATCGCTCCGCGGAGAGTATGCCCATTTGTCAGCGCTGCAAAGAGGTGTTCTTCAAGAAGCACATTTACCTGCAGCATGTGGCCGAGAGCAGTTGCAGCATACACGAGTATGAGTTCAAGTGCAACATCTGTCCCATGTCCTTTATGGGCGGCGAGGAGCTGCAGAAGCACAAACATCTGCATCGAACCGACAAGTTCTTCTGCCACAAATACTGTGGCAAGCACTACGACTCGATTGCAGAATGCGAATCGCACGAGTACATGGAGCACGAGTACGATAGCTTTGTGTGCAATATGTGCTCTGTTACGTTCCCCACACGGGAACAGCTGTATGCCCATTTGCCGCAACACAAGTTCCAACAGCGTTACGATTGCCCCATTTGCCGGTTGTGGTACCAAACGGCATTAGAGCTGCACGAGCATCGACTGGCGGCGCCCTACTTTTGTGGCAAGTATTACGCTGCGgcacaccagcaacagcagcagcagcaacaacaacaacaacaacagcatcagcagcatacacaacaacatcagcaacagggCAACTACAAACTGCAGGATTGTCACATGGGCACCATTGAAAtgaCTCCACCGCAGCACAAGGCGACTGCAGCATTACCGGCAACGGCGGCGCTCAATTCGCTGTTGCAGCAACGCCAGGCGAACGCTGATGGCGCCGCTTTATATGCCTCGGCGCTGAAGAGCGAGACGAACGTGAAACTGGAGCGCAGCTATAGCAACTCCACCAGCGAGTCTGGTTACAGTATGCACGAGAGCAGCTATAACAATGCCTACGCCAGCGACAATTCTCTGCATGGCGGGGGCGGGGCAATTGGTGGTCCGCAGGCGCATTCCTCGACGCTGGACGATTCGGAGGATGCGCTGTGCTGTGTGCCACTTTGCGGAGTGCGTAAGAGCACAAGCCCGACGCTGCAATTCTTTACGTTTCCCAAAGATGACAAGTACTTGCATCAGTGGCTGCACAACCTCAAGATGTTCCACATTCCGTCGTCGAGCTATGCCAGCTTTCGCATCTGCAGCATGCACTTCCCTAAGCGTTGCATCAATCGTTACTCTCTGTGCTATTGGGCGGTGCCCACATTTAATCTGGGCCACGACGATGTGGCCAATCTCTATCAGAATCGTGAGCTGACCAACACATTCACCACAGGCGAGGTGGCCCGCTGCAGTATGCCAAACTGTACTAGTCAGCGTGGTGAGAGTAATCTGAAGTTCTACAACTTTCCCAAGGACATCAAGAGTTTGATTAAGTGGTGCCAAAACGCTCGCCTGCCCGTCCAGGCCAAGGAGCCGCGTCACTTCTGCAGTCGCCACTTCGAGGAGCGTTGCATCGGCAAGTTCCGGCTGAAGCCTTGGGCAGTGCCCACCTTACATCTTGGCGCCCAGTACGGCAAGATTCATGACAATCCCAAAAATCTGTATGTGGAGGAGAAGCGCTGCTGCCTCAACTTTTGTCGTCGCAGTCGCTCCTCCGACTTCAACATGTCGCTGTATCGCTTCCCCAGGGATGAGGTGCTACTGCGTCGTTGGTGCTACAATCTACGCCTTGATCCGGCTGTCTATCGTGGCAAGAATCACAAAATTTGTAGCGCTCACTTTATCAAAGAAGCATTGGGATTACGCAAACTATCTCCGGgCGCTGTGCCCACGCTGCATCTGGGTCATAATGACACCTTTAACATCTACGAGAACGAACTGTGGCCACCGCCAACGCCCTCCACGCCCACCcacaatcatcatcagcagctgcagcaacaccagttgcagcagcagccgcaacaagtGCATCATAAATATCAGCGGCACTCGGCTGCGTCCACATCCTCGTCGGCCTCGTCGACATCGCATTATGTGGATCCGGAGCTAAGTGCATCCTACATGAGCATGGGCGCTGGAGGCTCATCCTCTGGCCTTAATGTCAGCGACAGCATGGATGTCTGCTGTGTGCCCAGCTGCGAGAGCAAGCGCCACAACAATGAGAACATCACATTCCACACAATACCCAGGCGGCCAGAGCAGATGCGCAAGTGGTGTCACAATCTTAAGATACCCGAGGACAAGATGCACAAAGGCATGCGGATATGTAGCTTGCACTTTGAGTCCTATTGCATTGGCGGCTGCATGCGTCCGTTTGCGGTGCCGACATTGCATCTGGGCCACGACGACGAGGACATTCACCGCAATCCGGATGTGATCAAGAAGCTCAACATACGCGAAACTTGCTGCGTGGCTGTTTGCAAACGCAATCGTGACCGGGACCATGCCAATCTGCATCGCTTTCCCAGCAATGTGCCGCTGTTGACCAAATGGTGCGCAAATCTACAGCGTCCAGTGCCGGATGGCAGTAAACTCTTTAACGATGCCATCTGTGAGGTGCACTTTGAGGATCGATGCCTGCGCAACAAACGGCTGGAAAAGTGGGCAGTGCCCACACTCATCCTTGGGCATGAGAATATACCCTATCCGCTGCCCACGCCGGAGCAAGTTGCCGAGTTCTATGCGCGTCCCACTGCGCCTAACAATGGCGAGGAGCAGGGCGAGTGCTGTGTGGAGACGTGCAAGCGTAATCCCAGTGTTGATGACATCAAGCTATATCGTCCGCCTGAGGAGTCGCAGGTGCTGGTAAAGTGGGCGCACAATCTCCAACTGGAGATTGCCCAGCTGCCCAATATGAGAATATGCAATCTGCATTTCGAAGCCCACTGCATTGGCAAGCGGATGCGTCCCTGGGCAATACCCACGCTCAATCTGGCAACTAACATAGAGAATCTCTACGAGAATCCCGAACACCAGATGCTCTACAAGCGGCGCACGCATCTCAAGCCGGGCAGAGCAGCGCGAGGCTCTGAAGCAAGCGCTGGTGGTGTGAAGCCCACCTGGGTGCCacgctgctgcttgccacactgCCGCAAGGTGCGTGCCACACACAATGTCCAGCTGTATCGCTTCCCCAAACTCAATCGCTCCACGCTGGCCAAGTGGGCGCATAATCTGCAGGTGCCGCTCGTGGGGAGCGCTCAGCGTCGCCTCTGCTCCGCACACTTTGAGCCGCATGTGCTCAGCAAGAAATGCCCGGTGCCCATGGCGGTGCCCACACTGGACCTCAATACACCATCGGGCTACAAGATCTATCAGAATCCGGCTAAGCTCAAGGCGAATAAGCTGTGCTTGCAGCGTGTCTGCATTGTGGAGAGCTGCCGGCGTCAGCGGGCGCAGGGGGTGCAGCTCTTCCGCCTGCCTCACAGCCCCACCCAGCTGCGTAAGTGGATGCACAACATCCGGATGCGGCCCCGTGGAGCTATGCGACAACAGTATCGCATCTGCTCGAAGCACTTCGAGACGCACTCGTTCAATGGGAAGAGACTCAGTGCGGGTGCAATTCCAACGCTTGAGTTGGGCCATGAGGACGAAGACATATTTCCGAATGAGGCGCAGTCTTTCGTGGAGGAGCACTGCACCGTCGAGGGCTGCGATGCCGTCAAGGAGCAACCGGATGTGCGTCTCTTCCGCTTCCCCAACGACGATGAGGATCTGCTCTGGAAGTGGTGCAACAATCTGAAAATGAGTCCGGTCGACTGCATCGGCGTTCGCATCTGCAACAGACACTTCGAGACTGATTGCATTGGACCAAAGCACCTGTTCAAGTGGGCCATTCCCACGCTCTCCCTCGGccacgatgatgatgacatcGAGTTGATGCTAAATCCCAAGCCGGAGGAGCGCTATATTGATCCGGTCTTCAAGTGCTGTGTGCCCTCGTGCGGCAAGACGCGTAAATTCGATGAAGTACAGATGAACAGTTTTCCCAAAGATCCGGAGCTCTTCCAGCGCTGGCGCCACAATCTCCGCCTCGAGCATCTCAACTTCAAGGAGCGCGAACGCTATAAGATCTGCAACGCCCACTTCGAGGACATTTGTATTGGTAAGACGCGCTTGAACATTGGCTCCATACCGACACTGGAGCTTGGCCATGACGAGACTGATGACTTGTTCCAAGTCAACCCCGAGGAGCTGCAGAGCAATCTCTTTGGACGCCAGAGACGCGTGCAGGATTCCATGAGGATCAACATTAAGCAGGAGGCGCACTCCGACCTCGATGAAGACACTAAACCGGACATTAACATGTCGGAGGCCACAGCTTCAAATACAACACAGgctaaaatcaaaaaatctaTGACCGATTTCAAGTGCTGTGTGCCGAACTGTGGTCGCAGTCGCCTGGAGCATGGTGCCCGCCTCTTTCCGTTTCCGAATgggaaacagcagcagagtaAGTGGCGCCACAATCTTCGGCTGCCTGCTGCCGACGTGGACAAGACGACGCGCATCTGCAGCGCCCACTTCAATCGCCGTTGCATCGATGGCAATCAGCTGAGGGGCTGGGCAATGCCCACACAGCAGCTGGGACATCAGGAGCTGCCGATCTATGAGAATCCAAAGAATATACCGGGCTTCTTTACGCCCACCTGTGCGCTGGCGCACTGCCGCAAGCGGCGCAGCATTGACAACGATCTGCGTACCTATCGCTATCCACGCAGCGAGGAGCTGCTCGAGAAGTGGCGTGTCAATCTGCGCTTGTCGCCGGACCAATGCCGCGGACGCATCTGTGCGGATCATTTCGAGCCACTGGTGCGTggcaagctgaagctgaagacTGGAGCAGTGCCTACGCTCAAATTGGGACACGACGAGGGCGTAGTCTTTGATAACGAGGGCATTAAGGCGGGTctgcagctggaggaggaggcggaggaaGAAGAGGGCAGTGCCAGCTTGAAGTCATTGGTCAAAGTAAAGACTGAGCAGGAGGATGAGCAGGAGCTAGAGAATGAAGATGAAgcgcagctggagcaggagcaggatcAAGATATGGACGAGGATGGAGAAGAGCACCGAGACTCTGAAGAACATGGCTATTTTGATCCCTTGGAACTTGTGGAAACCTACGCTGAGCACCATAGCGATGATAACTCTGCCGGACATGATAATctcgacgatgatgatgacgaagaTGAGGACATTCCCGGCAATGACGATGAGCTGCTTCTGCCTGATACGCGACCACTTCGAATGACAATGGCGCCGCGGCGCGAGAAGGCTGTGAATAATGTGACGCCTATTTGCTGTCTGAAGCACTGTCGCAAGGAGCGCACCGCCATCCATCATCTGAGCACCTTTGGCTTTCCCAAGGatccgcagctgctgctcaagtgGAGCGCCAATCTGCAGCTACCATTGGAGTCTTGCATGGGTCGTGTATGCGTCGAGCACTTTGAGCCCTCGATGCTGGGCACGCGCAAGCTGAAGCAGAATGCGGTGCCCACCTTGAAACTGGGCCATGCCACACCGCTCACCTATAGCTGCAATGGCCGGATGCTGTCGGGCATTTACGATGAGCAGCCACAGCATTCGGTTTTTCGGCTTTGGAGCCTGAAACACTGCCGCAAACGGAAACCGGATCTGGCGGAGATTAAGCCCGGTCGTCGCTGTTGCCTGCCAAGTTGCGGCAAGCAGTCGGAGTCGCACGGCGTCCAGCTGCAGCGTCTGCCCAAGGATCGTCTGATGCTGCGCAAATGGTTGCACAACCTTAAGCTGCCTCCAACGATGGACTGCACCCAAATGTTCCTCTGCAGCGATCACTTTGAGCTGAATGCGCCGTGTCCCACTTTGAAACTGGGCCACTCGGATACCAATATTTATCGCCACAGTGTGGCCAGCACCAGTGGCAGCTGCCTGGTGCCCAAATGTACTTGTGCTCGTCTCAATCTCTATCGCGGCTATGATCTGCCTGCGCATCCGCAGGTGCAACAGGCCTGGCTGCACTGGCTGCAGCTGCCCCATCCGCAGCCGTCGCCCAGGCACGCCCAGCTATGTGTGATGCACTTTATGCAGCTCTACGAACTGGTGCCGCTGCCCGAATCGGTGCCAGATGTTGTGCGCAGGCAGCTGCGGGAGACTTACGAACTGATATCCAGCTCCAGCATGGCCATGAAGCTGCGTTGCGCTGTGCCCGGCTGTTACTCGAAGTATACCGACAATGTGCGTCTGACCAAGCTGCCCGTTTACCCCGACACCTGCGCCAAGTGGGTGCACAACACCAAGATTCAATATGATCCGGCCCGACATTATGTCTATCGCATCTGCATGTTGCACTTTGAGCCAGGTTGCCTGGGCCCAGTGCGTCCTAAAATGTGGGCAATGCCAacgctgcagctgcaccaCAAGGATGCCAACATCTATTTAAATCCCAAGCTGGATGGCAGCCAAACACAGCCGGCCGTGCCGCTGGACCTGCCACTGCGCATTAAAACTGAGCTGCCGATGTGCAACAGTCCCAGCTTTAGTGCGAGTGCCAGTCCCAGTCCGCGTGGTAAGCTGCGCACTTGCTGCATTCCCAGCTGCGGTCAGCAGGCTTCGGCCCTGACGCGTCTCTTTCGCTTTCCCAGCGCAGAGACATCGATGCTGAAGTGGCTGGTGAAtacccagcagcagccgcgCTTTGTCGATGCACAACGGCTGTTCGTCTGCCAGGATCACTTCGAGGCGGAGGCCATTTGCAAGAATCAGCTGCGCAGCTGGGCGGTACCAACACTGAATCTAGGACACGATGGACACATCATACCGAATGCCAAGCACAATGGCAACATTGCCGACAGCCAGGAGAACAAGCAGACGCTGCAGTTCATCTGGGCCAACTACTGTTCAGTGCTGAACTGCTTCCAGAAAAGTAGCGAGCAGCTGCGTCTCTACCAATACCCCACCGATCGGCCAACCATCCGCAAGTGGGCCGCCAATTGTAAGCATCGCTCCATGCAGGCCAGCAGTGATGGATTCCAGgtGTGTCAGTCGCATTTTACGCCGGATTGCTTTGATTCTGATACCGGGGAGCTGAAGGAGGACGCTGTGCCCACACTGGCGCTGAGCCGGTCTGTCACTGAGGTGCGCTGTGTGGTCAATGGTTGCGTTAAGGACGAAGATGCATCGCGTCGCCGTCTGTTCAAGATGCCCAAGCGTAACCCACAGATATTGGATTGGTGCCACAATTTGCGACTGGGTCAGGCGGCTATGAGCGGCTCGGAACAGCACGTTTGTGAACGCCACTTCGAGGCGAACTGCTTCAATACGTCTAGAGTGCTGCGTCCAGGAGCACGACCCACACTTAATTTAGGTCATGAGGACCTAGACGATGTGATACCCAATCCAGCGAACTGGGAAGAGGATGTGATCGTGTGCTGTGTGCCCCACTGCGAAAGCTCCAAGGATGCGGATGAAGTCCAACTGTTTGGGCTGCCAAAGGTGCGCCAGTTGGCGGACAAGTGGCTGCAAAATGTGCACCTCGATCCGAGCAAAGAACAACTGGCCGGCCTGAAGATCTGCAGTGTGCACTTTGAGGCGAGCTGCATGGAGAATGGACGACCCACCTATGGTGCAATGCCCACACTCCATCTCGGTCACGATGAGCTCGACAATATACACCCAAGCGTAGAGTCGGTGCCGACGCAGCAGAAGCGCTACTGCAATAGAGATGGCGCCAGTCACGATTGCTGCTATCCGCAGTGCGTGGAGCTGCAGAAGAGCTATCTGCGGGTCACCTACGAACTGCCCCAGGAGCAGGAGTTCCGTCAGCAGTGGCTTTCCTATATGGGCCTGGAAGCGCAGCAGCTCGATAGACAGCAGCTGCCCAAGCTCTGTCCACTCCACCTAATCTTGCTCTACGATCACAGTGCGGATCACTTTTCGGCACACGCCGCTGAGGAGCTGTTGGACTCTAATTATGAGGCAGCGCGCAGCAGCGTTCGAATACGTGTTGTCAGCTGTGCTGTGCGCGGCTGCAAAACGCTCAAACCACGCGACGGTGGTCGGCTGCATGGTTTGCCCACGCGGCGAGATCTGCTGGAGATGTGGCTGCACAACATGCAGCTGGTGTTTTACGAGCAACAGCGTTATATGTACAAGATTTGCAGCAAGCACTTTGAGTCCACATGCTTCACGGAGACAACCAAGCGGCTGAAGCCGTGGAGCATGCCTACGCTCGAGTTGCCGGAGCGCCAACCGGGCGAGATGCCTGCCTATCAGAATCCCACAGAGTTGGAGTGGCAACACATGAATGAGCTGCAGGTCAGCGAGAAAGTTGTTGAGGCTCAGCCGGAGCCATTACTCAAGCTGGAGCCGTTGCCCAAGAAggagccaccaccaccgcagGTTGTGGAATATGAAGAGGATTGCGACAATAACTCACAGCAGCCACTGGAAATGCAGGCGCTGGAGGTGCTGCTCGAGGTGGGCCATGTCGAGAAGTGCACCACCTACGAGCAAATGGATACCGAGGCAAATCTCAACTATGCCGAGCAGTTCTCGCACAATCCCCTCAGTCCAGGTCCACCTCAATGCCGTATCCCCGTTGTACAGAATGGACTCCACTACAGTGCACGCCACTGCAGCGTGCATGGCTGCAATGTCACCTCCAATAAtctgagcagcagcatcaagcTACACAAGTTCCCCGTCTCGCTGGATGCCATGCAAAAGTGGATGCACAACACCCAGGTGCTCGTGGACGTCAAATTCGCTTGGCGTTTTCGCATCTGCAGTCATCATTTCATCGAGGATTGCTTTCACGGCTCGCGCATCAGACGTGGGGCGATGCCCACGTTGCGACTGGGCAAACATCGACCGAAGCATATCTATGATAATGAGTTCAACgcccaactgcaactggaacaGTCCAAAGAAGAGGCCAGGGAGGCTCTCGCTGCCCCGCTGGAGTctcagcaacagttgctctcTGCGAATGTAGGTCTGCGTCTGCCGCGTCCAGCCCCGCCCTGCAAATCCAGCAAATACTGTCAGATCGAGGGCTGCTCCAATCATTTGACCAGCGAGAATGTGACGCTGCACAAGTTCCCCCATTCGTCGGATATGTGCGCCAAGTGGCAGCATAACACTCAGGTGCCCTTCGATCCCGAGTTCCGCTGGCGCTATCGCATCTGCAGCGCACACTTTGAGCCCATTTGTCTAGGCAATGTGCGACTGATGCACGGCAGTGTGCCCACCCTGAATCTGGGGCCTCTTGCGCCCAAGAAACTGTTTGACAATGAATTCTTGCGTCTGGACAAGCCAATGAGCAGTTCGGAGCTGGGTATGACCGTCAAACAAGAACAAATGGAGCAATTTGATCAAATGGAGCTGGAAGATGGCAACCAGGAGCAGGATGATTTCAGTCTGCTGGAGCCCGAGCTGCAGTTGCACGAGGATAGCGAGGATGAGCAACAATATGACAATCATTTCAGCCAAAACGATTCCTATAACTGGTCCGATCAGCAGCTGCGTCTCCCCAGCATTAATCACGAGAAGTGCACCACCATCTACAATCCAGTCAAGTCCGGCTATGATAAGTGCTCACTGGTCCACTGCCAACGACAACGTTCGCAGCACGGCGTGCACATCTACAAGTTTCCACGCTCGCGTCAGCTACAGCAACGATGGATGCATAATTTGCGCATCCAATACGATGAGCGACGGCCGTGGAAGACAATGATATGCAGTGTCCATTTCGAGCCGCACTGCATCCGTCTGCGCAAGTTGCGTCCCTGGGCGGTGCCCACGCTGGAACTTGGGGACAATGTGCCGCTGGAGATCTTTACGAATGAGCAGAGCCAGCAGCTGTTTGCTCAGTCCGAAGCAGGCAGCGAGTGTGATGACGTTGAAGTGGATGTTGAGGACACCATACTGGAGGACATGGATGATGACTATGATGACAATGACACtgatgtgaatgtgaatgctgATGATCAAATGCGAACAGCTCCATATGTCAAAAGAGAGCGTCGCTCTCGATTTGATCCTCTGCCACCGGGTCAGCTGCCACCGTGGAAGATCAAATGCTGCTGTTTACCCTATTGCCGCAGTCCTCGCGGTGATGGCATCAAGCTCTTTCGACTGCCCAACAACATCAGCTCCATACGTAAATGGGAGCAGGCCACAGGCATGCGCTTCTATGAGTCCCAGCGAAACACAAAGCTCATCTGCAGTCGACACTTTGATCCGCAGCTTATAGGCGTGCGTCGCCTCATGTCCAATGCGGTACCCAGCCTCCATTTGGGCCCAGACAGCGCAGAGCCCGAGCCGCCTCCTGTGGGACCACGTTGCTGCATGCTCGATTGCTCTGAGGATGTCAATGCCCAGCTGCACAAGTTTCCCAAAgATCCCATGTTGCTGCATCAATGGTGTCAGGCGCTCAATCTACCGGATGTTCAAAGCTACTCCGGCAAATTCATTTGTGCGGCACATCTACCTTCCAACGCGATGAGCTGTCTAATTTGTGGCGTGGACGATGTACAGCTGCCAATGCTGGACTTTCCCCAGAATCGCAATCAGCGCACCAAGTGGTGCCACAATCTGAAAATCGAGCCTCTGCCCAAATGGGACAACTCAAAGCAAATTTGCTGCAAACACTTTGAGAACTTTTGCTTTATCCAGCCGGGTCAACTTCTGGCGGAAGCATTGCCCACTCTACACTTGGAGCACGGGGATAGCAACATATTCCTAAACGACGAGACCATGGATAACAGCAAGTTGTTGCGCATCAAGGACGAGCCCATGGAGAGCGAGGATCTGATGCTGTAA
Protein Sequence: MSQQQHNPPPHHQHQHHYYQQQQQQQQQQHLQQQQHLQHKQIQQQQHSWYSHVASYPPPHAAAFASPCKSSSSNNNNNNNNHIMNAYGTGAGAYYGSTGAGGVGVGYNLEANTVAYAHNQLLQYQQQQQQQQQQQHQQQQQQQHQQQQQQQQLSQRSYMPPHIMHSSYPYIKSEPLEPLPERHQQQQQQQLFQNPMAPPPAPAIANRHSLDASGEMIIKSEPIDEHAFKSNYIDDNTPFADFSKYPEFGDDMLSPKLELNVKDEAYGNQKNPLNYPRRKLQTDRSAESMPICQRCKEVFFKKHIYLQHVAESSCSIHEYEFKCNICPMSFMGGEELQKHKHLHRTDKFFCHKYCGKHYDSIAECESHEYMEHEYDSFVCNMCSVTFPTREQLYAHLPQHKFQQRYDCPICRLWYQTALELHEHRLAAPYFCGKYYAAAHQQQQQQQQQQQQQHQQHTQQHQQQGNYKLQDCHMGTIEMTPPQHKATAALPATAALNSLLQQRQANADGAALYASALKSETNVKLERSYSNSTSESGYSMHESSYNNAYASDNSLHGGGGAIGGPQAHSSTLDDSEDALCCVPLCGVRKSTSPTLQFFTFPKDDKYLHQWLHNLKMFHIPSSSYASFRICSMHFPKRCINRYSLCYWAVPTFNLGHDDVANLYQNRELTNTFTTGEVARCSMPNCTSQRGESNLKFYNFPKDIKSLIKWCQNARLPVQAKEPRHFCSRHFEERCIGKFRLKPWAVPTLHLGAQYGKIHDNPKNLYVEEKRCCLNFCRRSRSSDFNMSLYRFPRDEVLLRRWCYNLRLDPAVYRGKNHKICSAHFIKEALGLRKLSPGAVPTLHLGHNDTFNIYENELWPPPTPSTPTHNHHQQLQQHQLQQQPQQVHHKYQRHSAASTSSSASSTSHYVDPELSASYMSMGAGGSSSGLNVSDSMDVCCVPSCESKRHNNENITFHTIPRRPEQMRKWCHNLKIPEDKMHKGMRICSLHFESYCIGGCMRPFAVPTLHLGHDDEDIHRNPDVIKKLNIRETCCVAVCKRNRDRDHANLHRFPSNVPLLTKWCANLQRPVPDGSKLFNDAICEVHFEDRCLRNKRLEKWAVPTLILGHENIPYPLPTPEQVAEFYARPTAPNNGEEQGECCVETCKRNPSVDDIKLYRPPEESQVLVKWAHNLQLEIAQLPNMRICNLHFEAHCIGKRMRPWAIPTLNLATNIENLYENPEHQMLYKRRTHLKPGRAARGSEASAGGVKPTWVPRCCLPHCRKVRATHNVQLYRFPKLNRSTLAKWAHNLQVPLVGSAQRRLCSAHFEPHVLSKKCPVPMAVPTLDLNTPSGYKIYQNPAKLKANKLCLQRVCIVESCRRQRAQGVQLFRLPHSPTQLRKWMHNIRMRPRGAMRQQYRICSKHFETHSFNGKRLSAGAIPTLELGHEDEDIFPNEAQSFVEEHCTVEGCDAVKEQPDVRLFRFPNDDEDLLWKWCNNLKMSPVDCIGVRICNRHFETDCIGPKHLFKWAIPTLSLGHDDDDIELMLNPKPEERYIDPVFKCCVPSCGKTRKFDEVQMNSFPKDPELFQRWRHNLRLEHLNFKERERYKICNAHFEDICIGKTRLNIGSIPTLELGHDETDDLFQVNPEELQSNLFGRQRRVQDSMRINIKQEAHSDLDEDTKPDINMSEATASNTTQAKIKKSMTDFKCCVPNCGRSRLEHGARLFPFPNGKQQQSKWRHNLRLPAADVDKTTRICSAHFNRRCIDGNQLRGWAMPTQQLGHQELPIYENPKNIPGFFTPTCALAHCRKRRSIDNDLRTYRYPRSEELLEKWRVNLRLSPDQCRGRICADHFEPLVRGKLKLKTGAVPTLKLGHDEGVVFDNEGIKAGLQLEEEAEEEEGSASLKSLVKVKTEQEDEQELENEDEAQLEQEQDQDMDEDGEEHRDSEEHGYFDPLELVETYAEHHSDDNSAGHDNLDDDDDEDEDIPGNDDELLLPDTRPLRMTMAPRREKAVNNVTPICCLKHCRKERTAIHHLSTFGFPKDPQLLLKWSANLQLPLESCMGRVCVEHFEPSMLGTRKLKQNAVPTLKLGHATPLTYSCNGRMLSGIYDEQPQHSVFRLWSLKHCRKRKPDLAEIKPGRRCCLPSCGKQSESHGVQLQRLPKDRLMLRKWLHNLKLPPTMDCTQMFLCSDHFELNAPCPTLKLGHSDTNIYRHSVASTSGSCLVPKCTCARLNLYRGYDLPAHPQVQQAWLHWLQLPHPQPSPRHAQLCVMHFMQLYELVPLPESVPDVVRRQLRETYELISSSSMAMKLRCAVPGCYSKYTDNVRLTKLPVYPDTCAKWVHNTKIQYDPARHYVYRICMLHFEPGCLGPVRPKMWAMPTLQLHHKDANIYLNPKLDGSQTQPAVPLDLPLRIKTELPMCNSPSFSASASPSPRGKLRTCCIPSCGQQASALTRLFRFPSAETSMLKWLVNTQQQPRFVDAQRLFVCQDHFEAEAICKNQLRSWAVPTLNLGHDGHIIPNAKHNGNIADSQENKQTLQFIWANYCSVLNCFQKSSEQLRLYQYPTDRPTIRKWAANCKHRSMQASSDGFQVCQSHFTPDCFDSDTGELKEDAVPTLALSRSVTEVRCVVNGCVKDEDASRRRLFKMPKRNPQILDWCHNLRLGQAAMSGSEQHVCERHFEANCFNTSRVLRPGARPTLNLGHEDLDDVIPNPANWEEDVIVCCVPHCESSKDADEVQLFGLPKVRQLADKWLQNVHLDPSKEQLAGLKICSVHFEASCMENGRPTYGAMPTLHLGHDELDNIHPSVESVPTQQKRYCNRDGASHDCCYPQCVELQKSYLRVTYELPQEQEFRQQWLSYMGLEAQQLDRQQLPKLCPLHLILLYDHSADHFSAHAAEELLDSNYEAARSSVRIRVVSCAVRGCKTLKPRDGGRLHGLPTRRDLLEMWLHNMQLVFYEQQRYMYKICSKHFESTCFTETTKRLKPWSMPTLELPERQPGEMPAYQNPTELEWQHMNELQVSEKVVEAQPEPLLKLEPLPKKEPPPPQVVEYEEDCDNNSQQPLEMQALEVLLEVGHVEKCTTYEQMDTEANLNYAEQFSHNPLSPGPPQCRIPVVQNGLHYSARHCSVHGCNVTSNNLSSSIKLHKFPVSLDAMQKWMHNTQVLVDVKFAWRFRICSHHFIEDCFHGSRIRRGAMPTLRLGKHRPKHIYDNEFNAQLQLEQSKEEAREALAAPLESQQQLLSANVGLRLPRPAPPCKSSKYCQIEGCSNHLTSENVTLHKFPHSSDMCAKWQHNTQVPFDPEFRWRYRICSAHFEPICLGNVRLMHGSVPTLNLGPLAPKKLFDNEFLRLDKPMSSSELGMTVKQEQMEQFDQMELEDGNQEQDDFSLLEPELQLHEDSEDEQQYDNHFSQNDSYNWSDQQLRLPSINHEKCTTIYNPVKSGYDKCSLVHCQRQRSQHGVHIYKFPRSRQLQQRWMHNLRIQYDERRPWKTMICSVHFEPHCIRLRKLRPWAVPTLELGDNVPLEIFTNEQSQQLFAQSEAGSECDDVEVDVEDTILEDMDDDYDDNDTDVNVNADDQMRTAPYVKRERRSRFDPLPPGQLPPWKIKCCCLPYCRSPRGDGIKLFRLPNNISSIRKWEQATGMRFYESQRNTKLICSRHFDPQLIGVRRLMSNAVPSLHLGPDSAEPEPPPVGPRCCMLDCSEDVNAQLHKFPKDPMLLHQWCQALNLPDVQSYSGKFICAAHLPSNAMSCLICGVDDVQLPMLDFPQNRNQRTKWCHNLKIEPLPKWDNSKQICCKHFENFCFIQPGQLLAEALPTLHLEHGDSNIFLNDETMDNSKLLRIKDEPMESEDLML

Similar Transcription Factors

Sequence clustering based on sequence similarity using MMseqs2

100% Identity: iTF_00595971;
90% Identity: iTF_00553068;
80% Identity: -