Basic Information

Insect: Drosophila eugracilis
Gene Symbol: -
Assembly: GCA_018153835.1
Location: NW:583464-597832[-]

Transcription Factor Domain

TF Family: THAP
Domain: THAP domain
PFAM: PF05485
TF Group: Zinc-Coordinating Group
Description: The THAP domain is a putative DNA-binding domain (DBD) and probably also binds a zinc ion. It features the conserved C2CH architecture (consensus sequence: Cys - 2-4 residues - Cys - 35-50 residues - Cys - 2 residues - His). Other universal features include the location of the domain at the N-termini of proteins, its size of about 90 residues, a C-terminal AVPTIF box and several other conserved residues. Orthologues of the human THAP domain have been identified in other vertebrates and probably worms and flies, but not in other eukaryotes or any prokaryotes [1].
Hmmscan Out: # of c-Evalue i-Evalue score bias hmm coord from hmm coord to ali coord from ali coord to env coord from env coord to acc

1 29 8 1.2e+04 -3.3 3.9 38 62 319 346 310 361 0.60

2 29 4.1e-15 6.4e-12 45.7 3.7 1 86 554 626 554 627 0.85

3 29 1.1e-14 1.8e-11 44.3 5.0 1 87 654 723 654 723 0.83

4 29 1e-15 1.6e-12 47.6 0.2 1 87 745 817 745 817 0.85

5 29 6.1e-16 9.5e-13 48.4 5.6 1 87 916 986 916 986 0.81

6 29 1.4e-14 2.1e-11 44.0 2.8 1 86 1010 1081 1010 1082 0.82

7 29 4.8e-13 7.4e-10 39.1 1.1 1 87 1117 1185 1117 1185 0.80

8 29 9.3e-11 1.4e-07 31.8 1.4 1 86 1225 1294 1225 1295 0.76

9 29 4e-17 6.2e-14 52.2 0.5 1 86 1322 1391 1322 1392 0.82

10 29 4.9e-13 7.7e-10 39.1 1.7 1 85 1413 1481 1413 1483 0.82

11 29 1.9e-13 2.9e-10 40.4 0.6 1 86 1510 1581 1510 1582 0.85

12 29 7.6e-13 1.2e-09 38.5 3.0 1 85 1658 1726 1658 1728 0.83

13 29 2.3e-12 3.6e-09 36.9 0.1 1 86 1751 1819 1751 1820 0.81

14 29 4.1e-13 6.4e-10 39.3 2.4 1 87 1953 2022 1953 2022 0.80

15 29 4.9e-09 7.6e-06 26.3 0.2 1 86 2124 2190 2124 2191 0.77

16 29 8.1e-05 0.13 12.7 0.0 1 59 2206 2253 2206 2267 0.80

17 29 8.1e-12 1.3e-08 35.2 0.8 1 87 2282 2352 2282 2352 0.83

18 29 1.1e-13 1.7e-10 41.2 0.7 1 87 2415 2485 2415 2485 0.83

19 29 2.3e-10 3.6e-07 30.5 0.2 1 86 2520 2591 2520 2592 0.81

20 29 1.7e-11 2.7e-08 34.1 0.0 1 86 2602 2673 2602 2674 0.77

21 29 5.2e-13 8.1e-10 39.0 0.0 1 86 2698 2768 2698 2769 0.80

22 29 0.00015 0.23 11.9 0.7 1 58 2802 2849 2802 2868 0.82

23 29 3.5e-14 5.4e-11 42.8 0.5 1 87 2887 2960 2887 2960 0.84

24 29 5.3e-16 8.2e-13 48.6 0.6 1 86 3072 3144 3072 3145 0.82

25 29 1.9e-12 3e-09 37.2 2.8 1 86 3204 3274 3204 3275 0.80

26 29 5.4e-14 8.3e-11 42.2 4.3 1 86 3375 3445 3375 3446 0.85

27 29 1.3e-11 2.1e-08 34.5 0.1 1 86 3525 3594 3525 3595 0.84

28 29 4.2e-10 6.5e-07 29.7 1.9 1 58 3618 3666 3618 3682 0.84

29 29 1.2e-10 1.8e-07 31.5 1.9 17 87 3683 3742 3673 3742 0.75

#	of	c-Evalue	i-Evalue	score	bias	hmm coord from	hmm coord to	ali coord from	ali coord to	env coord from	env coord to	acc
1	29	8	1.2e+04	-3.3	3.9	38	62	319	346	310	361	0.60
2	29	4.1e-15	6.4e-12	45.7	3.7	1	86	554	626	554	627	0.85
3	29	1.1e-14	1.8e-11	44.3	5.0	1	87	654	723	654	723	0.83
4	29	1e-15	1.6e-12	47.6	0.2	1	87	745	817	745	817	0.85
5	29	6.1e-16	9.5e-13	48.4	5.6	1	87	916	986	916	986	0.81
6	29	1.4e-14	2.1e-11	44.0	2.8	1	86	1010	1081	1010	1082	0.82
7	29	4.8e-13	7.4e-10	39.1	1.1	1	87	1117	1185	1117	1185	0.80
8	29	9.3e-11	1.4e-07	31.8	1.4	1	86	1225	1294	1225	1295	0.76
9	29	4e-17	6.2e-14	52.2	0.5	1	86	1322	1391	1322	1392	0.82
10	29	4.9e-13	7.7e-10	39.1	1.7	1	85	1413	1481	1413	1483	0.82
11	29	1.9e-13	2.9e-10	40.4	0.6	1	86	1510	1581	1510	1582	0.85
12	29	7.6e-13	1.2e-09	38.5	3.0	1	85	1658	1726	1658	1728	0.83
13	29	2.3e-12	3.6e-09	36.9	0.1	1	86	1751	1819	1751	1820	0.81
14	29	4.1e-13	6.4e-10	39.3	2.4	1	87	1953	2022	1953	2022	0.80
15	29	4.9e-09	7.6e-06	26.3	0.2	1	86	2124	2190	2124	2191	0.77
16	29	8.1e-05	0.13	12.7	0.0	1	59	2206	2253	2206	2267	0.80
17	29	8.1e-12	1.3e-08	35.2	0.8	1	87	2282	2352	2282	2352	0.83
18	29	1.1e-13	1.7e-10	41.2	0.7	1	87	2415	2485	2415	2485	0.83
19	29	2.3e-10	3.6e-07	30.5	0.2	1	86	2520	2591	2520	2592	0.81
20	29	1.7e-11	2.7e-08	34.1	0.0	1	86	2602	2673	2602	2674	0.77
21	29	5.2e-13	8.1e-10	39.0	0.0	1	86	2698	2768	2698	2769	0.80
22	29	0.00015	0.23	11.9	0.7	1	58	2802	2849	2802	2868	0.82
23	29	3.5e-14	5.4e-11	42.8	0.5	1	87	2887	2960	2887	2960	0.84
24	29	5.3e-16	8.2e-13	48.6	0.6	1	86	3072	3144	3072	3145	0.82
25	29	1.9e-12	3e-09	37.2	2.8	1	86	3204	3274	3204	3275	0.80
26	29	5.4e-14	8.3e-11	42.2	4.3	1	86	3375	3445	3375	3446	0.85
27	29	1.3e-11	2.1e-08	34.5	0.1	1	86	3525	3594	3525	3595	0.84
28	29	4.2e-10	6.5e-07	29.7	1.9	1	58	3618	3666	3618	3682	0.84
29	29	1.2e-10	1.8e-07	31.5	1.9	17	87	3683	3742	3673	3742	0.75

Sequence Information

Coding Sequence: ATGTCACAACAACACCCCCATCACGCCCACCCCCACCACTACGCCCACCACTATCCGCCTCCTGCAACGCCCATGTCCCttcagcaacatcaacagcagacGCAGCAGCcgcatcaacagcagcagcagcaacagcagcagcacgcCAATTGGTACTCACATGTTGCTTCCTACCCCACACCCCACTCGGCTTTCGGCCCCGCCCCCTCCTGCAAGGCCACcaacagtagcagcagcaacaacaacatcatgGGTGGCGGAAGCTATGGGCcggggggtggtggtggcgcGCAGGGCTATTATGGCGCCGCTGGCGGTGGCCTCAATGTCAGTGGGAcgatggtgggtggtgggcAGAGTTACGGCCTTGGGGCCAATACTGTGGCATATGCCCACAACCAACTGCTGCAgtaccaacagcagcagcagcaacaacaacaacaacaacaacatcagcaacttCCACAGCATCTAAACCAGCAAAGGTCCTATATGGGCCACGATATCATGACCGGCAGCTATCCCTATATAAAAAGCGAACCGCTGGAGGCTTTCCAGCAGCCTCCTAATCCCATGGCCCCACCCCCGGCACCAGAAGTACTAATAAAATCGGAACCCATTGACGAACATTCCTACAAGTCCAACTTTATTGATGATAATACGCCATTCGCTGACTTTAGTAAGTTCAACGAATTTAGCGAGGATATGTTGAGTCCCAAAGTGGAGCTAACAGTAAAAGATGAGTCATATGGAAGGAACACTGACAGCTTTCTGCGCCGCAAACAACAATCGGATCGGAGCGCCGAAAGTCTGCCTATTTGTCAACGTTGCAAAGAGGTCTTCTTCAAGAAGCAGGTCTACCTTCGACATGTGGCCGAGAGCAATTGTGGCATACAAGAGTACGACTTTAAGTGCAGCACGTGTCCCATGTCCTTCATGACCACCGATGAGCTGCAGAGGCACAAGCATCACCATCGTTCAGACAGGTTCTTCTGCCACAAGTACTGCGGGAAGCACTTTGACACGATCGCAGAATGTGAGGCGCATGAGTACATGCAACACGAGTACGACAGTTTTGTTTGCAACATGTGTTCCGGAACCTTTGCCACCCGAGAGCAGCTATACGCCCACCTTCCGCAGCACAAGTTCCAGCAGCGCTTCGACTGTCCCATCTGCCGCTTATGGTATCAGACGGCTCTCGAACTCCACGAGCACCGTCTTGCCGCTCCCTACTTCTGTGGCAAGTATTACACGGGTGGACAATCATCGTCTGCCTCCCAGTCGcagacgcagcagcagcaccaagcGAACTACAAGCTACAGGATTGCCATATGGCTACCATGGAAGTGCCCACCGCCCCGCACCATAAAACGAACTCATCCTGCTCGTCCTTGCCCGCTACGGCTGCTCTGAAttcgctgctgcagcagcgacaAGCAAATGCCGATGGAGCTGCTATGTTTGCCGCATCTGCAATGAAGAACGAGGTGAATGTTAAGCTGGAACGAAGCTATAGCAATTCGACCAGTGAATCATCCTACAGCGTTCAGGAGAGTGGCTACAATAATGCCTATGGAAGCGACAGTTCAATCCACGGAGGAGCGATCGCTGGCCCACAAGCACACTCTTCAACGCTGGACGACTCCGAGGACGCATTGTGTTGTGTGCCGTTGTGCGGAGTGCGAAAGAGCACAAGCCCCACGCTGCAGTTTTTCACGTTCCCCAAGGACGATAAGTACCTTAATCAGTGGCTGCATAATCTTAAAATGTTCCACATACCCGCCGCCAGCTACGCTAATTTCCGGATCTGCAGTATGCACTTCCCGAAGCGCTGCATTAACCGCTACTCATTGTGTTATTGGGCGGTACCTACGTTCAACCTGGGCCATGACGACGTAGCTAATCTGTACCAAAACCGGGAATTGACCAACACCTTTACTACCGGCGAAGTAGCACGTTGCAGTATGCCCCACTGCACCAGTCAACGGGGTGAGAGCAACTTAAAGTTCTACAATTTTCCCAAGGACATAAAAAGCCTGATCAAATGGTGTCAGAATGCACGACTTCCGGTGCAGGCGAAGGAGCCGCGTCATTTCTGCAGTCGCCACTTTGAGGAACGCTGCATCGGCAAATTTCGACTGAAGCCCTGGGCGGTACCCACTTTACATTTGGGTGCCCAGTATGGCAAGATACACGATAATCCCAAGAATCTTTACGTCGAGGAGAAACGGTGCTGCCTCAACTTCTGCCGCCGGAGTCGATCCTCTGATTTCAATATGTCGTTATATCGATTTCCCAGAGATGAGGTCCTCCTGCGACGTTGGTGCTACAATCTTCGCCTTGATCCAGGAGTGTATCGCGGAAAGAATCACAAAATATGCAGCGCTCACTTTATTAAAGAGGCGTTAGGCCTACGGAAGCTATCACCGGgTGCGGTACCCACGCTTCACCTGGGCCATACGGACACCTTTAACATTTACGAAAACGAGCTGTGGCCGCCGCCAACGGCTTCCAATAGTCACAGTAGTGGCCTCCAGCAGCACCAGCCGCAACATCATACTTCGCAACACTCACTGCAGCAACAGCTCCACAGCAAAGCTTACCAGCGTCACTCGGCGGCCTCTACGTCGTCCTCGGCCAGTTCGGCTACTTCTCACTACGTGGATCCGGAAATGAGTTCTTCTTACCTCTCAATGGGTGTAGGTGGATCCTCGGCATTGAACGCCACCGACACCATGGACATCTGCTGTGTTCCTAGTTGCGAGAGCAAGCGGCACAACAACGAGAACATTACATTCCATACTATACCGCGCCGACCAGAGCAGATGCGGAAGTGGTGTCACAACTTGAAAATACCAGAGGAAAAAATGCACAAGGGCATGCGGATCTGCAGTCTGCATTTCGAGTCTTACTGCATCGGCGGTTGTATGCGTCCGTTTGCTGTGCCTACCCTTAACTTGGGTCATGATGATGAAGACATTCATCGAAATCCGGATGTGATTAAGAAGCTGAATATCCGAGAAACGTGCTGCGTCGCCGTATGCAAACGGAATCGGGACAGGGACCATGCCAACCTGCACCGTTTCCCAAGCAATGTGTCGCTGTTGACCAAATGGTGTGGCAATCTCCAGCGCCCTGTTCCTGATGGCAGTAAGCTTTTTAACGACGCTATCTGTGAAGTGCACTTCGAGGATCGATGTTTGCGCAACAAAAGGCTAGAGAAATGGGCAGTGCCTACTTTGATTCTAGGACATGAAAACATCGCCTATCCTCTGCCAACACCGGAACAGGTGGCTGAATTTTACTCTCGACCCACTGCGCCCAATAATGGCGAGGAGCAGGGCGAGTGCTGTGTAGAGACTTGCAAGAGAAATCCCAGTGTAGACGACATCAAGCTTTACCGGCCGCCAGAGGAGGCTTCAGTGTTAGCAAAATGGGCGCACAACCTGCAGACGGAGGCTAGTCAACTGACGAGTATGAGGATCTGTAATCTCCACTTTGAGGCGCACTGCATCGGCAAGCGGATGAGACCTTGGGCGATACCCACTCTAAATCTGGCTGGCAACATAGAAAATCTCTATGAGAATCCAGAGCATTCGATGCTGTATAAACGACGAACGCacacaaaaactaaactacCTACTTTGGTTAAACCAACTTGGGTGCCCAGGTGCTGTCTTCCACATTGTCGCAAAGTTCGAGCTCTACACAATGTCCAGCTTTATCGCTTCCCTAAGCTCAATCGCTCTACACTTGCCAAGTGGGCGCATAATCTGCAGGTTCCCATGGTTGGCAGTGCTCAACGCCGGCTGTGCTCTGCTCATTTTGAGCCACATGTTCTAAGCAAAAAGTGTCCTGTGCCGCTGGCGGTACCCACACTGGACTTGAACCCACCACCTGGCTTAAAGATTTACCAGAATCCCGCAAAGCTAAAGGCCAGTAAGCTGTGCCTGCAGCGCGTGTGCATAGTGGAGAGCTGTCGAAAGACGCGGGCGCAGGGAGTTCAGCTCTTCCGGCTGCCACATAGTCCCACGCAACTGCGCAAGTGGATGCACAACATTAAGACGCGTCCTAGGGCGGCGATGAGGTCTCAATACCGAGTTTGTTCTCGTCACTTTGAGACGCACTCGTTCAATGGCAGGAGACTAAGTGCTGGCGCCATTCCCACCCTGGAATTGGGTCATGAAGACGAGGACATCTATCCCAACGAAGCGCAGGCCTTTGTCGACGAGCACTGTGTTGTGGAGGGCTGCGAGGCATCTAAGGAACAGGCGGAGGTTCGACTGTTCCGCTTTCCCACAGAAGACGACGATATGCTGTGGAAGTGGTGCAATAACCTTAAGATGAACCCGGTGGATTGTACAGGAGTGCGTATCTGCAACAAGCACTTTGAGGCAGATTGTATAGGGCCTAAGCACTTGTACAAGTGGGCTATTCCCACCCAAGAACTGGGCCACGACGACGCCCAAATCGAACTAGTACCGAATCCCAAGCCAGAGGACAGATATGTGGATCCGGTGTTTAAGTGCATTGTGCCCACCTGCGGGAAGACGCGTCGTTTTGACGAGGTCCAGATGAACAGTTTTCCCAAGGACCCGAATCTCTTCCATCGCTGGCAGCACAACCTGCGTCTGGATCATCTTAACTTCCTGGAACGCGAACGGTACAAGATATGCAACTCTCACTTCGAGGACATATGTATTGGCAAGACTCGGCTCAACATTGGCTCTATTCCTACTCTTGAACTTGGACATGACGAGACGGAGGATCTATTTCAAGTAAATCCGGCGGAATTGCAGAGCAATCTTTTCGGACGGCAGCGAAGATTACACGACGAGTCGAGTGGGGTAAGTATCAAGCAGGAGTTTTCTGAATCCGAAGACGTAAAGCCGGATGTGACCACCATGCGCGATGCCTCAAATTCGAGTACTAGACAGATTAAGTTCAAGAAAACTATGTCTGATCTAAAGTGTTGTGTGCATAGTTGTGGACGGAGTCGATTGGAGCACGGAGCAAGGCTCTTTCCATTTCCTAACGGCAAACAGCAACACCTCAAGTGGCGCCATAACCTCCGCCTTGAGCCCGACGAGGTGGACCGGACAACGCGGATTTGCAGCGCCCATTTTAATCGGCGATGCATTGATGGCAAGCAACTAAGAAGCTGGGCAATGCCCACGCAGCAACTGGGTCATCAGGAGCAGCCAATTTACGAGAATCCAAAGAATATTCCAGGATTCTTCACACCCACCTGTGCTCTAGGTCACTGCCGCAAGCGTAGAAGCATCGACAATGATCTACGCACCTACCGATACCCAAGAAGTGAGGACCTGCTTGAGAAATGGCGGGCAAATTTGCGTTTGGCCCCGGATCAGTGTCGCGGAAGAATTTGTGCGGATCATTTTGAGGCCCAAGTGAGAGGAAAACTAAAGCTGAAGACGGGAGCGGTGCCGACTTTAAAACTGGGTCACGATGAAGGCTTAATCTATGACAATGAGGCTATCAAGGTGGGCATGACTGACGAAGAAGAAGGCAGCTCGGAATTGCCACGGCTGAAACTCAAAAGAGAGCCGATTGacgaagaggaagaagaagggGAGGCTGAAGAGGAGCGAAATGACCAGGACAATGAGGATGAAGATGAAAAAGACGACCACTATTTTGATCCTCTCGAATTGGTTGAGACCTTTGCAGAACATCAAAGCGATGATGAAGTAGAATACCACGaggatgatgaggatgatCGAGACGACGAAGAGGATTTGGAGGAGGGTGACCACTTTCTTCCGGATTTGCCGCCCACTCCTCCGATCGTTCCTATGCGTCGCGAAAAGCCTGCCAACAATGTAACGCCCATTTGCTGCCTGAAGCATTGCAGAAAAGAACGCACTGCCTTTCACCTACTCAGCACCTTCGGTTTTCCTAAAGACCGCCAACTGCTGCTCAAGTGGTGCGCCAATCTCCATCTGAATCCTGATGACTGCATCGGCAGGGTTTGCATAGAGCACTTCCAGCCGGAGGTACTCGGTACTCGAAAGCTTAAGCAAAACGCGGTGCCCACTGTTAATGTCGGGCATAATGAACCACTCAGGTACTCATGCAATGGAGTGGATCAAGACCAGGAGCATTCACAGCCACAACATTCGGTTTTTCGGCTTTGGAGCCTAAAACACTGTCGCAAGAGGAAGCTCACAGAACCTCCGGACATTCGCCCAAGCAAGTGGAGGACTGCGAATGTGCAGATGATGCAGAGGTTGAGGATGGAGATGcaaatagagagagagatcaAATTGGAGATCCAGCCGGAGAGAGCATTAAAGACGGAGGTGACGACTCGAACGAAGCATCCGAGGGAGAGTAAGCTGGAAAGATGTTGGATCAGCATCTGCACAAACGAGGATGTTAACCAGTTACTTCCCATGCctgaaaatcaaaatctttTAAGAAAATGGCAACATAACCTGAAACTGCCTATGGACACCGTTTTTAGTGAGATTCGTGTATGCCTGGAGCATTTTGAGGAGCAAGTTGTGGAAAACGGAAACCCCTTGGAGCATGCAGTACCCACCTTAAAGCTGGACCAAAACAGTTGGAATATCTACAGAAACAACGGCTCGTGTCTAGTACCTGGCTGCGGAGCTACCTCGGAACTTTTGAGCTTTGTTGATTTGCCTGAAAATATGGTAATAAAAACCACCTGGTTGTCTTACCTAAGTTTGCCGTTCAGCAGCGATGGTCTTCTTTGTGGTGACCACTTTATGGAGCTGTATGAAAAGGTTGAACTACCCAAAGTTCTGGCCTTGCAAGATTTGGAGAATTTGCAATGGACAGTTGATGAATTTAAATGCGCCGTTCCTGGCTGCTCATCACAAAAAGGGCATGATCTTAATCTTACCCAGCTTCCAGACAAGGAGGTGACGCTTTTTAAGTGGCTACATAACACAAAAATATCGTACGACCAACTGAAACATAGAAGTTATCGCATATGTCTGCTTCATTTTGAGCCATCGTGTATAGAAGAGAATTTCCCGAAGTCTTGGGCTATACCCACTTTGCATTTAAACCATGAGGACAAGATTCATTTGAATCCCAGACAGTCTCAAGGACAGGAATGTTCGGAATCACGTAGTGAAACTCCTAATAGTAATTCCAGGCTAACTCCTCTTAGAATAAAGACGGACCTCTCCTCCTTGGGCAGTCCGTGCGCAAGTGCAAGTCCAAGTCCCCGTGGCAAGATCCGGATATGTTGCATTCCTACATGTGGACAATTTGCAAACAGTCAAATACGGCTCTATCGCTTCCCCACCGAAGAGCATGCCTTGCTTCGGTGGCTGGTAAACACACAGCAACAACCTCGCCTTGCGGATCCTTTGGAGCTTTATGTGTGCCAGGCACACTTTGAGCCCGATGCTATTTGCAAGAAGCAACTTCGCAGCTGGGCTGCTCCAACTTTAAACTTGGGCCACAACGATTATGTTATCCCAAATGCCAAGCACAATGGGAACATCGCTGACGGCCAGGACACAGAGCAGGCGATGATGTTTATCCGAGAGCGATATTGCTCCGTGCTGACTTGTTTCCAAGTTGAAGGTAACGGAATAAGGCTCTACGAATATCCAAAGGAAATGACAACGATAAGAAAGTGGGCATCGGCGTGTAGACATCGATCCATGCAGGCCAGTAGCCATGGATTCAAAGTATGCCAGTCTCATTTTGCGCCGGAGTGCTTTAGTCCTGACACTTTAGACTTGATTGACGGATCGGTTCCCACCCTGGAGTTGAGCAAAGATGATATTGAAAGGCACTGCCTAGTGCCTGGATGTGTTAAGGATGCGTCGGGAGACCGTCTTCGCTACTATAAGGTGCCAAAGACCACTGGTCAGCTGAAAGCTTGGAGCAACAACCTGAAGATCAATGCCATGGACCTCGGACTGGGAGAGCAGCTAATCTGCGAGCGTCATTTTGAATCCTTTTGCTTTGGTGCCAACAAGGGATTGCGTCCTGGGGCACTTCCTACTCTGTTACTCGGTCATGACGAGGAAGTGGAAATGTTGCCCAATCCGGAAAATCTCTGGCAGCGCAAAGCGGAGGTTTGTTGCGCGCCAGGTTGCGGACGCATACGACAGCTTGGAGAGGCTCAGTTTAGTGGATTTCCCAAAGCGTTACCATTGGCCGATAAATGGATATATAATCTCCGACTAAGGGTAACCAAAGATCAGATAGGTAAACTGAAAGTGTGTAGTGCGCACTTCGAGACATCTCTCTTCAATAAAACCGGATTACTTTCGGGGGCTATACCCACCGTGGAGCTTGGCCATTCCTCTCCGGATATTTTTCCAACGGACACGCAAAATCTTGGAAAAAGTCCAAAGTTTTCTAAGAGAACCTTGATGACGGGGGTCGATTGCTGTTATCCGGAGTGCAAGGAATTGtctaaaaacttttcttaCAATCTGCCCGATGAGGAGAATCTTAGGAGAGCTTGGCTACGTCATTTAAACATCGAAGAGCAAACGAATTGCATCGGAAAACTTTGCCCGCTGCACTACGTCATTCTTTATGAGCTCAGTGTCAAAAGTTTTCCAGAGCACGAATCAAATGGATTCCTTGAGGATAATTACCATTCTGCTCGAAGCAACAGGCGCGTTCGGATCGTTAGCTGTGCAGTTAAAGGTTGTGAAATGATTAGACCCCGGGATAAGGTTCAACTGCACGGGTTGCCTCAAAGGAAAGACATCCTCAAAATGTGGGTAGAAAATGGCCAACTAGAGATAACTGAGCCGCAGCAGCAATACATGCTCAAAGTGTGTCGGAATCACTTTGAGCCTCGCTGCTCTTTTGACGAGAGGCGGTTGCATCCCTGGAGCGTTCCTACCCTGCATTTACCATCAAATCCGGTACATGAGATTCCAACCAAAGAGATGTGGCTGGAGATGACAGCCAAACTGACCGAGGATGCTGAGACAAACATGGATTATGAGAGAGAGCAGGAGCTGGAGGAGCAGATGGAGGATGATAGCTCTTTATTAGAGCCCATTGTAAAAATGGAGCACATGGAGTCCGAGGAGGAGAACTCGGAGATGCAGGCCTTGGAGGTGCTTCTGGAGGTTGGCCACGTTGAGCGAATGGACAGCTATGAGAAAATGGACAAATCTTACACGGAACATTCCATCTATCAATCTACTGGAATTCGTAACCAGTACAATGCCAATCATTGCGCCGTTGAGGGATGTCAGGTGACCGCTGAGGACGTAGACGGGACCATTAAGTTGCACAAATTTCCTGCCTCTTCGGAAGCCGCCAGAAAATGGATGCACAATACCCAAGTTAACATGAACGAAAAATTCTGGTGGCGCTATCGCATTTGCAGTTACCATTTCGACCAGGAGTGCTTCCAGAGTGCAAGGATAAGGAAGGGTGCGATGCCCACGCTCCTATTGGGACCTAAACGACCCGACAATCTGTATGAAAATGAGTTCGCATTACAGGAGACGGAAGAGCTTTCTTTGTCAGCAGATGTTAACTTACCGGAGCAGAAGATGCCATCAGTACTGGAGGTGACGAAactgtgcctgccgccgccaGCCCCACCTCGTAAGTCTAGCAAGTTTTGTCAAATTGAGGGATGTATGAATCACCTGACCACTGAAAACATGACGTTGCACAAGTTTCCGCATTCTGAGGATATGTGCCTCAAATGGCAGCACAATACACAAGTGTCATTCGATCCCTTTTACCGATGGCGTTATCGGATCTGCAGTGCCCACTTCCATCCGGTGTGCCTGCTCAATATGCGACTTGTCCACGGTAGTGTGCCCACCTTGAAACTGGGAAGCAAGGCACCCAAAGAACTTTTTGACAACGACTTCGAGGCCATAAACCTAAGGCTGGACAAAAAGGCGGGACCAGAGACCAAACGCAGTGCATATCAAAGAGAAAAGGAAGAGGATGAAAATTCTGTACCATTTCTAGAACCAGAACTGCAGCTCCAAGAAGACCAAGAGAAGGAGGACCCAACTACTAGGCAAATATCCTTATaccaatcgaattggaaaAGCCAACTTCGACTTCCCGTGAAGCAAGAGAAGGTAACCTACAACCAGGTCAAGTCGGGTTATGATAAGTGCTCGTTGGGTCATTGTCAGCGGCAGAGATCCCAACACGGCGTCCACATTTACAAGTTTCCCAAGTCAAGGCACCAACAGGAGCGTTGGATGCACAACCTCCGCATTCGCTACGATGAGCGACGTCCCTGGAAGTTTATGATCTGCAGCGTTCACTTTGAGCCACATTGCATTAGTTTGAGGAAACTGCGTCCCTGGGCAGTTCCCACCCTTGAACTGGGTGACAATGTCCCGGAGAAGATCTTTACAAACGAACAGTGCCAAGAGCTTTCAACTGATCGGAGCGAGGCTGAGAGCGATGGCGAAGAAGAGGATGGCCTGCAGGAAGACGAGGACgaagaggatgaggatgacgaGGGAATAGAACCGGAGGTTCGCATTAAGCGAGAACGACGACCCAAGCTAGATCCTTGGCCTCCTGGCCAGATTCCGCCGTGGAAAGTCAAGCAGTGCTGCCTCCCCTACTGTCGTGCTTTCCGTGGAGATGGCATCAAACTATTCCGGTTACCCAACAATCGCACCTCTATCCGCAACTGGGAGCTGGCAACGGGCATGGTGTTTAAGGAGTCTCAGCGAAACACTCGTCTCATCTGCAGTCGGCATTTCGAACCAGATTTGATTGGGGTAAGGCGTCTTATGCGGAACGCCATTCCCACAAGACATTTAAATCCCCAAGAAATCTCGAAAGAAGCCACAAGAAAGCCGGATCCTCCAGCTCCCATTGCAATGTGCTGCATGGCTGATTGTCATCACAATGGAAATATCAAGTTACACAAGTTTCCCAGTgATCCCTCGCTGCTAAGACAGTGGTGCCAAGCTTTAAGGCTAACGGATACACAGAGATACCGTGGCAAACATATCTGCTCGTTCCACTTGCCCACCGACAAGACGATAAGCTGCATTATCTGCGGTGTGGAAAAGGTTCAGCTCCCGATGCTTAACTTTCCGGACCAGCGTAATCAGCGCGCAAAGTGGTGCTACAATCTCAAGATCGAGGCCATACCAAAGTGGGATCATTCTAAGCACATATGCTGTCGTCATTTTGAATCCCATTGCTTTGTCCAGGAAGGTGAACTACGTCCAGGAGCGATTCCGACGCTGCATCTTAACCATGATGACACGAACATATTCCTCAGCGACTATACAGATGGTCCGACGATCAATCGCATAAAGGACGAGCTCTTGGACAATGACGATATGCTGCTGGTTTAG
Protein Sequence: MSQQHPHHAHPHHYAHHYPPPATPMSLQQHQQQTQQPHQQQQQQQQQHANWYSHVASYPTPHSAFGPAPSCKATNSSSSNNNIMGGGSYGPGGGGGAQGYYGAAGGGLNVSGTMVGGGQSYGLGANTVAYAHNQLLQYQQQQQQQQQQQQHQQLPQHLNQQRSYMGHDIMTGSYPYIKSEPLEAFQQPPNPMAPPPAPEVLIKSEPIDEHSYKSNFIDDNTPFADFSKFNEFSEDMLSPKVELTVKDESYGRNTDSFLRRKQQSDRSAESLPICQRCKEVFFKKQVYLRHVAESNCGIQEYDFKCSTCPMSFMTTDELQRHKHHHRSDRFFCHKYCGKHFDTIAECEAHEYMQHEYDSFVCNMCSGTFATREQLYAHLPQHKFQQRFDCPICRLWYQTALELHEHRLAAPYFCGKYYTGGQSSSASQSQTQQQHQANYKLQDCHMATMEVPTAPHHKTNSSCSSLPATAALNSLLQQRQANADGAAMFAASAMKNEVNVKLERSYSNSTSESSYSVQESGYNNAYGSDSSIHGGAIAGPQAHSSTLDDSEDALCCVPLCGVRKSTSPTLQFFTFPKDDKYLNQWLHNLKMFHIPAASYANFRICSMHFPKRCINRYSLCYWAVPTFNLGHDDVANLYQNRELTNTFTTGEVARCSMPHCTSQRGESNLKFYNFPKDIKSLIKWCQNARLPVQAKEPRHFCSRHFEERCIGKFRLKPWAVPTLHLGAQYGKIHDNPKNLYVEEKRCCLNFCRRSRSSDFNMSLYRFPRDEVLLRRWCYNLRLDPGVYRGKNHKICSAHFIKEALGLRKLSPGAVPTLHLGHTDTFNIYENELWPPPTASNSHSSGLQQHQPQHHTSQHSLQQQLHSKAYQRHSAASTSSSASSATSHYVDPEMSSSYLSMGVGGSSALNATDTMDICCVPSCESKRHNNENITFHTIPRRPEQMRKWCHNLKIPEEKMHKGMRICSLHFESYCIGGCMRPFAVPTLNLGHDDEDIHRNPDVIKKLNIRETCCVAVCKRNRDRDHANLHRFPSNVSLLTKWCGNLQRPVPDGSKLFNDAICEVHFEDRCLRNKRLEKWAVPTLILGHENIAYPLPTPEQVAEFYSRPTAPNNGEEQGECCVETCKRNPSVDDIKLYRPPEEASVLAKWAHNLQTEASQLTSMRICNLHFEAHCIGKRMRPWAIPTLNLAGNIENLYENPEHSMLYKRRTHTKTKLPTLVKPTWVPRCCLPHCRKVRALHNVQLYRFPKLNRSTLAKWAHNLQVPMVGSAQRRLCSAHFEPHVLSKKCPVPLAVPTLDLNPPPGLKIYQNPAKLKASKLCLQRVCIVESCRKTRAQGVQLFRLPHSPTQLRKWMHNIKTRPRAAMRSQYRVCSRHFETHSFNGRRLSAGAIPTLELGHEDEDIYPNEAQAFVDEHCVVEGCEASKEQAEVRLFRFPTEDDDMLWKWCNNLKMNPVDCTGVRICNKHFEADCIGPKHLYKWAIPTQELGHDDAQIELVPNPKPEDRYVDPVFKCIVPTCGKTRRFDEVQMNSFPKDPNLFHRWQHNLRLDHLNFLERERYKICNSHFEDICIGKTRLNIGSIPTLELGHDETEDLFQVNPAELQSNLFGRQRRLHDESSGVSIKQEFSESEDVKPDVTTMRDASNSSTRQIKFKKTMSDLKCCVHSCGRSRLEHGARLFPFPNGKQQHLKWRHNLRLEPDEVDRTTRICSAHFNRRCIDGKQLRSWAMPTQQLGHQEQPIYENPKNIPGFFTPTCALGHCRKRRSIDNDLRTYRYPRSEDLLEKWRANLRLAPDQCRGRICADHFEAQVRGKLKLKTGAVPTLKLGHDEGLIYDNEAIKVGMTDEEEGSSELPRLKLKREPIDEEEEEGEAEEERNDQDNEDEDEKDDHYFDPLELVETFAEHQSDDEVEYHEDDEDDRDDEEDLEEGDHFLPDLPPTPPIVPMRREKPANNVTPICCLKHCRKERTAFHLLSTFGFPKDRQLLLKWCANLHLNPDDCIGRVCIEHFQPEVLGTRKLKQNAVPTVNVGHNEPLRYSCNGVDQDQEHSQPQHSVFRLWSLKHCRKRKLTEPPDIRPSKWRTANVQMMQRLRMEMQIEREIKLEIQPERALKTEVTTRTKHPRESKLERCWISICTNEDVNQLLPMPENQNLLRKWQHNLKLPMDTVFSEIRVCLEHFEEQVVENGNPLEHAVPTLKLDQNSWNIYRNNGSCLVPGCGATSELLSFVDLPENMVIKTTWLSYLSLPFSSDGLLCGDHFMELYEKVELPKVLALQDLENLQWTVDEFKCAVPGCSSQKGHDLNLTQLPDKEVTLFKWLHNTKISYDQLKHRSYRICLLHFEPSCIEENFPKSWAIPTLHLNHEDKIHLNPRQSQGQECSESRSETPNSNSRLTPLRIKTDLSSLGSPCASASPSPRGKIRICCIPTCGQFANSQIRLYRFPTEEHALLRWLVNTQQQPRLADPLELYVCQAHFEPDAICKKQLRSWAAPTLNLGHNDYVIPNAKHNGNIADGQDTEQAMMFIRERYCSVLTCFQVEGNGIRLYEYPKEMTTIRKWASACRHRSMQASSHGFKVCQSHFAPECFSPDTLDLIDGSVPTLELSKDDIERHCLVPGCVKDASGDRLRYYKVPKTTGQLKAWSNNLKINAMDLGLGEQLICERHFESFCFGANKGLRPGALPTLLLGHDEEVEMLPNPENLWQRKAEVCCAPGCGRIRQLGEAQFSGFPKALPLADKWIYNLRLRVTKDQIGKLKVCSAHFETSLFNKTGLLSGAIPTVELGHSSPDIFPTDTQNLGKSPKFSKRTLMTGVDCCYPECKELSKNFSYNLPDEENLRRAWLRHLNIEEQTNCIGKLCPLHYVILYELSVKSFPEHESNGFLEDNYHSARSNRRVRIVSCAVKGCEMIRPRDKVQLHGLPQRKDILKMWVENGQLEITEPQQQYMLKVCRNHFEPRCSFDERRLHPWSVPTLHLPSNPVHEIPTKEMWLEMTAKLTEDAETNMDYEREQELEEQMEDDSSLLEPIVKMEHMESEEENSEMQALEVLLEVGHVERMDSYEKMDKSYTEHSIYQSTGIRNQYNANHCAVEGCQVTAEDVDGTIKLHKFPASSEAARKWMHNTQVNMNEKFWWRYRICSYHFDQECFQSARIRKGAMPTLLLGPKRPDNLYENEFALQETEELSLSADVNLPEQKMPSVLEVTKLCLPPPAPPRKSSKFCQIEGCMNHLTTENMTLHKFPHSEDMCLKWQHNTQVSFDPFYRWRYRICSAHFHPVCLLNMRLVHGSVPTLKLGSKAPKELFDNDFEAINLRLDKKAGPETKRSAYQREKEEDENSVPFLEPELQLQEDQEKEDPTTRQISLYQSNWKSQLRLPVKQEKVTYNQVKSGYDKCSLGHCQRQRSQHGVHIYKFPKSRHQQERWMHNLRIRYDERRPWKFMICSVHFEPHCISLRKLRPWAVPTLELGDNVPEKIFTNEQCQELSTDRSEAESDGEEEDGLQEDEDEEDEDDEGIEPEVRIKRERRPKLDPWPPGQIPPWKVKQCCLPYCRAFRGDGIKLFRLPNNRTSIRNWELATGMVFKESQRNTRLICSRHFEPDLIGVRRLMRNAIPTRHLNPQEISKEATRKPDPPAPIAMCCMADCHHNGNIKLHKFPSDPSLLRQWCQALRLTDTQRYRGKHICSFHLPTDKTISCIICGVEKVQLPMLNFPDQRNQRAKWCYNLKIEAIPKWDHSKHICCRHFESHCFVQEGELRPGAIPTLHLNHDDTNIFLSDYTDGPTINRIKDELLDNDDMLLV

Similar Transcription Factors

Sequence clustering based on sequence similarity using MMseqs2

100% Identity: iTF_00605601;
90% Identity: -
80% Identity: -