Basic Information

Insect: Drosophila anomelani
Gene Symbol: -
Assembly: GCA_035045905.1
Location: JAWNOO010000019.1:18278748-18292324[+]

Transcription Factor Domain

TF Family: THAP
Domain: THAP domain
PFAM: PF05485
TF Group: Zinc-Coordinating Group
Description: The THAP domain is a putative DNA-binding domain (DBD) and probably also binds a zinc ion. It features the conserved C2CH architecture (consensus sequence: Cys - 2-4 residues - Cys - 35-50 residues - Cys - 2 residues - His). Other universal features include the location of the domain at the N-termini of proteins, its size of about 90 residues, a C-terminal AVPTIF box and several other conserved residues. Orthologues of the human THAP domain have been identified in other vertebrates and probably worms and flies, but not in other eukaryotes or any prokaryotes [1].
Hmmscan Out: # of c-Evalue i-Evalue score bias hmm coord from hmm coord to ali coord from ali coord to env coord from env coord to acc

1 29 8 2e+04 -3.3 2.2 49 60 324 337 306 354 0.57

2 29 3e-15 7.4e-12 46.1 4.0 1 86 550 622 550 623 0.85

3 29 1.2e-14 2.8e-11 44.3 5.0 1 87 650 719 650 719 0.83

4 29 1e-15 2.6e-12 47.6 0.2 1 87 741 813 741 813 0.85

5 29 6.4e-16 1.6e-12 48.3 5.0 1 86 911 980 911 981 0.82

6 29 2.5e-15 6e-12 46.4 3.6 1 86 1005 1076 1005 1077 0.82

7 29 1.3e-12 3.2e-09 37.7 1.5 1 87 1112 1180 1112 1180 0.81

8 29 9.3e-11 2.3e-07 31.8 1.4 1 86 1222 1291 1222 1292 0.76

9 29 5.7e-17 1.4e-13 51.7 0.4 1 86 1319 1388 1319 1389 0.82

10 29 1.5e-12 3.7e-09 37.5 1.6 1 85 1410 1478 1410 1480 0.79

11 29 1.1e-14 2.7e-11 44.3 0.4 1 86 1507 1578 1507 1579 0.85

12 29 8.4e-13 2e-09 38.3 3.3 1 85 1653 1721 1653 1723 0.82

13 29 2e-12 4.8e-09 37.1 0.1 1 86 1746 1814 1746 1815 0.83

14 29 2.4e-13 5.8e-10 40.1 2.2 1 87 1962 2031 1962 2031 0.80

15 29 1.9e-12 4.7e-09 37.2 0.1 1 87 2128 2202 2128 2202 0.79

16 29 0.0025 6 8.0 1.5 1 61 2217 2269 2217 2287 0.67

17 29 2.5e-13 6.1e-10 40.0 0.1 1 87 2296 2367 2296 2367 0.80

18 29 5e-13 1.2e-09 39.0 0.1 1 87 2419 2489 2419 2489 0.81

19 29 3.4e-12 8.4e-09 36.4 0.1 1 86 2524 2598 2524 2599 0.80

20 29 4.7e-13 1.1e-09 39.1 0.0 1 86 2609 2682 2609 2683 0.80

21 29 1e-10 2.5e-07 31.6 0.0 1 61 2708 2763 2708 2780 0.77

22 29 2.4e-05 0.059 14.4 0.2 1 58 2809 2859 2809 2880 0.84

23 29 4.3e-11 1.1e-07 32.8 1.1 1 87 2899 2971 2899 2971 0.81

24 29 4.2e-16 1e-12 48.9 0.3 1 86 3083 3155 3083 3156 0.80

25 29 3.7e-12 9e-09 36.3 3.5 1 86 3216 3286 3216 3287 0.80

26 29 2.8e-14 6.9e-11 43.0 4.4 1 86 3379 3449 3379 3450 0.84

27 29 4.9e-12 1.2e-08 35.9 0.2 1 86 3531 3600 3531 3601 0.85

28 29 1.8e-10 4.3e-07 30.9 0.6 1 58 3627 3675 3627 3690 0.83

29 29 4e-10 9.6e-07 29.8 1.8 18 87 3693 3751 3682 3751 0.75

#	of	c-Evalue	i-Evalue	score	bias	hmm coord from	hmm coord to	ali coord from	ali coord to	env coord from	env coord to	acc
1	29	8	2e+04	-3.3	2.2	49	60	324	337	306	354	0.57
2	29	3e-15	7.4e-12	46.1	4.0	1	86	550	622	550	623	0.85
3	29	1.2e-14	2.8e-11	44.3	5.0	1	87	650	719	650	719	0.83
4	29	1e-15	2.6e-12	47.6	0.2	1	87	741	813	741	813	0.85
5	29	6.4e-16	1.6e-12	48.3	5.0	1	86	911	980	911	981	0.82
6	29	2.5e-15	6e-12	46.4	3.6	1	86	1005	1076	1005	1077	0.82
7	29	1.3e-12	3.2e-09	37.7	1.5	1	87	1112	1180	1112	1180	0.81
8	29	9.3e-11	2.3e-07	31.8	1.4	1	86	1222	1291	1222	1292	0.76
9	29	5.7e-17	1.4e-13	51.7	0.4	1	86	1319	1388	1319	1389	0.82
10	29	1.5e-12	3.7e-09	37.5	1.6	1	85	1410	1478	1410	1480	0.79
11	29	1.1e-14	2.7e-11	44.3	0.4	1	86	1507	1578	1507	1579	0.85
12	29	8.4e-13	2e-09	38.3	3.3	1	85	1653	1721	1653	1723	0.82
13	29	2e-12	4.8e-09	37.1	0.1	1	86	1746	1814	1746	1815	0.83
14	29	2.4e-13	5.8e-10	40.1	2.2	1	87	1962	2031	1962	2031	0.80
15	29	1.9e-12	4.7e-09	37.2	0.1	1	87	2128	2202	2128	2202	0.79
16	29	0.0025	6	8.0	1.5	1	61	2217	2269	2217	2287	0.67
17	29	2.5e-13	6.1e-10	40.0	0.1	1	87	2296	2367	2296	2367	0.80
18	29	5e-13	1.2e-09	39.0	0.1	1	87	2419	2489	2419	2489	0.81
19	29	3.4e-12	8.4e-09	36.4	0.1	1	86	2524	2598	2524	2599	0.80
20	29	4.7e-13	1.1e-09	39.1	0.0	1	86	2609	2682	2609	2683	0.80
21	29	1e-10	2.5e-07	31.6	0.0	1	61	2708	2763	2708	2780	0.77
22	29	2.4e-05	0.059	14.4	0.2	1	58	2809	2859	2809	2880	0.84
23	29	4.3e-11	1.1e-07	32.8	1.1	1	87	2899	2971	2899	2971	0.81
24	29	4.2e-16	1e-12	48.9	0.3	1	86	3083	3155	3083	3156	0.80
25	29	3.7e-12	9e-09	36.3	3.5	1	86	3216	3286	3216	3287	0.80
26	29	2.8e-14	6.9e-11	43.0	4.4	1	86	3379	3449	3379	3450	0.84
27	29	4.9e-12	1.2e-08	35.9	0.2	1	86	3531	3600	3531	3601	0.85
28	29	1.8e-10	4.3e-07	30.9	0.6	1	58	3627	3675	3627	3690	0.83
29	29	4e-10	9.6e-07	29.8	1.8	18	87	3693	3751	3682	3751	0.75

Sequence Information

Coding Sequence: ATGTCACAACACAACCCCAATCACGCCCACCCACACTACCACTACCCGTCCCATACGACGCCGCTGGCTCTgcagcaacaccagcaccagcagcagcagcatcaacagcagcagcagcagcacggcaGTAGTTGGTACTCACATGTTGCTTCCTACCCAGCGGCCACCCACTCCCACCCCCTCTCTCACTCGGGCTTTGGCCCTGCGCCCCCTTGCAAGGCCAGCataagcaacaacaacagtatGGGCGCCTATGGGGGAGGAGTGGGAGGGGGTGGAGGCTCGCATGGATATTTCGGCGCCGCTGGCGGTGGCCTCAATGTCAGCGGGGCGGGGGGTGGTGCTGGGTCGTCCTACGGCCTTGGGGCCAACACAGTGGCATATGCTCACAACCAACTGCTCCAGTaccagcatcatcatcagcaacaccagcagcagcagcagcagcatctggGCCTGGGCCAACGATCCTATATGGGCCACGATGTCATGGCCGGGAACTATCCTTATATCAAGAGCGAACCATTGGAGGGGTTCCAGCAGCCGCCCAATCCAATGGCCCCACCCCCGGCCCCagaaatgataataaaatCGGAACCTATTGACGACCTGGCCTACAAATCAAACTACATAGACGACAATACGCCATTTGCGGACTTCAGCAAGTTTAGCGAATTCAGCGAGGACATGCTGAGTCCCAAAGTCGAGCTGACAGTTAAGGATGAGTCCTTCGTTAGGAACCCCAATAGCTTTTTACGCCGTAAGCAACAATCGGATCTGACGACATCAGAGAGCCTGCCGGTTTGCCAGCGATGCAAGGAGGTGTTCTTCAAGAAGCAGACTTACCTGCGTCACGTTGCCGAGAGTAACTGCGGCATCCAAGAGTATGACTTCAAGTGCACCATATGCCCCATGTCCTTCATGACCGCCGAGGAGCTACACCAGCATAAGCAACAGCATCGAGCGGACAGATTCTTTTGCCACAAGTACTGCGGAAAACACTTTGGCACGATCACAGAGTGCGAGGCGCATGAGTACATGCAACATGAATACGAAAGCATTGTGTGCAACATGTGCTCGGGATCCTTCGCCACGCGGGAACAACTGTATGCTCATTTGCCGCAGCACAAGTTCCAGCAGCGCTTTGACTGCCCCGTATGCCGCCTATGGTACCAAACGGCTCTGGAGCTGCACGAGCACCGGCTGGCTGCACCCTACTTCTGCGGTAAATACTACACGGGCGGAcagtctccgtctccgtcctcccaacagcaacagcaccagAGTCAGGCGAACTACAAGCTGCAGGACTGTCATATGGCCACCATGGAAATGCCAAACGCACCGCTCCTTAAGGCAAACTCAACCAACTCGCCTGCCTTGCCAGCGACAGCAGCGCTTAACTCACTGTTGCAACAGCGCCAGGCCAATGCCGATGGAGCGGCTATTTTTGCCGCATCTTCGATGAAGAACGAGGTCGCTGTGAAACTGGAGCGCAGCTACAGTAACTCGACCAACGAATCGTCTTACAGCGTCCAGGAGAGCGGCTACAATAATGTGTATGGCAGCAGTGACAGCTCTGTCCACGGTGCCATCGCCGGACCACAGGCACACTCTTCGACGCTGGACGACTCCGAAGATGCGCTGTGCTGTGTGCCGCTGTGCGGCGTGCGGAAGAGTACAAGTCCCACCTTGCAGTTCTTCACGTTCCCAAAGGACGAAAAATATCTCAACCAGTGGCTGCATAACCTCAAGATGTTCCACATACCCGCTTCTAGCTACGTAAGCTTTCGGATCTGCAGTATGCACTTCCCCAAGCGATGCATCAACCGCTATTCGCTGTGCTACTGGGCGGTGCCGACGTTTAACCTCGGCCACGATGACGTAGCCAATCTCTACCAGAACCGGGAGCTGACCAACACGTTTACCACTGGCGAAGTGGCGCGATGCAGCATGCCACACTGTACCAGTCAGCGAGGTGAGAGCAATCTCAAGTTTTACAACTTCCCAAAGGATATCAAAAGCCTGATTAAGTGGTGCCAAAACGCCCGACTTCCGGTGCAGGCAAAGGAGCCGCGACATTTCTGCAGTCGCCACTTTGAAGAGCGGTGCATTGGCAAATTCCGACTGAAACCTTGGGCAGTGCCCACCTTGCACCTGGGCGCCCAGTACGGCAAGATCCATGACAATCCAAAGAATCTATACGTGGAAGAGAAACGCTGTTGCCTCAACTTTTGCCGCCGGAGCCGCTCTTCCGATTTCAATATGTCGCTATATCGATTTCCTAGAGACGAAGTCCTGCTACGTCGCTGGTGCTACAATCTTCGCCTCGATCCAGGAGTGTACCGTGGAAAGAATCACAAAATATGCAGCGCTCACTTTATAAAAGAGGCGTTGGGTCTTCGGAAACTATCTCCTGGCGCCGTGCCCACACTTCATCTGGGCCACAATGATACCTTCAACATCTACGAGAACGAACTGTGGCCGCCGCCAACACCGACACCCTCCTCTTGTCATctccaacagcaacagcagtcgTCCCTTCATTCGCTTCAACAGCAGATGCACAGCAAGTCCTACCATCGCCGTTCAGCGGCATCTACATCTTCATCGGCAAGCTCGGCAGCCTCGCATTACGTGGACCCAGAGATGAGTGCGTCTTACCATCTAGCCATGTCCACCTCCGCCGGTGGCTCTGCGATGATAAACGCCAGCGACAGCATGGATGTTTGTTGCGTGCCAAGTTGCGAGAGCAAGCGACACAATAGCGAGAACATTACATTCCACACGATTCCGCGACGGCCCGAGCAGATGCGCAAATGGTGTCACAATCTTAAGATTCCCGAGGACAAGATGCACAAGGGCATGCGAATCTGTAGCCTTCACTTCGAGCCCTACTGCATCGGCGGCTGTATGCGACCGTTTGCTGTGCCCACTCTTCAATTGGGCCACGACGATGAGGATATCCACCGCAATCCTGACGTAATAAAGAAACTGAACATCCGCGAGACATGCTGTGTGGCTGTGTGCAAGCGGAATAGGGACAGGGATCATGCGAACCTGCATCGTTTCCCTAGCAACGTGGCTTTGCTGAAGAAATGGTGTGCCAATTTGCAGCGCAGCGTGCCGGATGGCAGTAAACTTTTCAATGATGCCATCTGTGAGGTGCACTTTGAGGATCGTTGTTTGCGCAACAAGAGGCTCGAGAAGTGGGCAGTGCCTACTCTGATCCTGGGACACGATGACATTGCCTATCCGCTGCCCACGCCAGAGCAAGTAACCGAGTTCTATGCCCGGCCTACGGCTCCCAACAATGGTGAGGAACAGGGCGAGTGCTGTGTGGAAACCTGCAAGAGGAATCCGAGCGTGGACGATATAAAGCTATACCGCCCACCGGAGGAGGCCGCCGTACTGGCCAAGTGGGCTCACAACCTGCAAACGGAGGCCAACCAACTGACAAGCATGAGGATCTGCAACCTTCACTTTGAGGCGCATTGCATTGGCAAGAGGATGCGCCATTGGGCCATACCGACTTTGAATCTAGCCGGCAACATTGAGAATCTTTATGAGAATCCAGAGCAATCGCTGCTGTACAGGCGTCGCACTACTCACTTGAAGACGAAGCTGACGCCATCCTCCGTAAAACCCACCTGGGTGCCCAGGTGCTGTCTTCCGCACTGTCGCAAGGTCAGAGCCCTGCACAATGTCCAGCTCTATCGCTTCCCCAAGCTCAATCGCTCCACATTGGCAAAGTGGGCTCATAATCTCCAGGTTCCAATGGTGGGCAGTGCCCAGCGCAGGCTATGCTCGGCCCATTTCGAGCCACATGTGCTGAGTAAAAAGTGTCCGGTGCCGCTGGCGGTGCCTACGCTCGACCTAAATTCACCACCCGGCTTGAAAATCTACCAGAATCCGGCCAAGCTAAAGGCTAACAAACTGTGCCTGCAGCGGGTTTGCATCGTCGAAAGCTGCCGCAAGACGCGGGCGCAGGGCGTTCAGCTCTTCCGGCTGCCGCACAGTCCCACGCAGCTGCGGAAGTGGATGCACAACATAAGGACACGGCCACGAGCAGCTATGCGGGCTCAGTACCGGGTTTGTTCCCGTCACTTTGAGACGCACTCCTTCAATGGCCGAAGACTGAGTGCAGGTGCCATTCCGACTCTAGAACTGGGCCACGATGGCGACGATATCTATCCCAATGAAGCGCAGGCATTTGTGGACGAGCATTGTGCTGTCGAAGGCTGCGAGGCATCCAAGGAGCAGCCGGAGGTGCGACTGTTCCGCTTCCCCACCGACGACGACGATATGTTGTGGAAGTGGTGCAACAACCTGAAAATGAATCCTGTGGACTGCATTGGGGTACGCATCTGCAACAAGCACTTCGAGACCGATTGCATCGGTCCCAAGCATCTGTACAAGTGGGCTATTCCCACGCAGGAGCTGGGCCACGACGACGCACAGATCGAGCTTATTCCGAATCCCAAGCCAGAGGATAGGTATGTGGATCCCGTTTTCAAGTGCATCGTTCCCACCTGCGGCAAGACGCGACGGTTTGACGAGGTGCAAATGAACAGCTTCCCCAAGGACCCGGATCTATTCCAGCGATGGCGGCACAACCTCCGCCTCGATCATCTCAGTTTCCAGGAGCGTGACCGCTACAAGATCTGCAACGCACACTTTGAGGAGATTTGCATTGGAAAGACACGGCTAAACATCGGATCCGTTCCAACCTTGGAACTTGGTCATGACGATGAGGAGGATATTTTCCAAGTGAATCCAGCGGAGCTGCAGAGCAATTTATTCGGACGGCAGCGTCGACTGCTGCTCGACGGATCCGGCGAACAGAGTGTCAAGCAAGAGCTGTCCGAGACGGAGGACAACAACAAAGAGGATGTGACGGCCACATGCTCTAATTCCAAACAGATCAAGATCAAGAGATCTTCTTCAGATCTAAAGTGCTGTGTGCACAGTTGTGGAAGAAGTCGCTTGGAACACGGGGCACGCCTGTTTCCCTTTCCTACGGGCAAGCAGCAACACCTAAAGTGGCGTCACAATCTACGCCTGGAACCGGAGGAGGTGGACCGTTCGACGCGCGTTTGCAGTGCTCACTTTAATCGACGTTGCATCGAGGGCAAACAACTGAGGAGCTGGGCGATGCCCACCCAACAGTTAGGACACAACGACCAACCGATCTACGAGAACCCAAAGAACATACCTGGATTCTTCACACCTACCTGTGCCCTGGGACACTGTCGGAAACGGAGGAGTATTGACAACGATCTGCGTACCTATCGGTATCCCAGGAGCGAAGATCTTCTAGAAAAATGGCGAGCTAATCTGCGGCTGGCTCCCGATCAGTGTCGTGGTCGGATCTGTGCCAATCACTTCGAACCACAGGTGCGGGGCAAGCTAAAGTTGAAGACGGGAGCCGTTCCCACACTACAACTGGGACACGATGAGGAACTAATCTATGACAATGAAGCTATTAAGGCGGGCATGACCGAGGAAGAGGAGGCCATAACCACGGAGTTCCCGCGATTGAAACCAAAAAAGGAGTTGttcgaagaggaggaggaggagtgcgAAGGGAATGATAGCGAGCAGCAGCACACAGATGACCTGGATGATAATGCAGATGAAGAAGACAAAGATGATCAATACTTTGATCCTCTTGAGCTGGTCGAGACTTTTGCTGAACATCGCAGTGATGACGAAGCCCAAGACTATGAGGATGAAGAAGACGAGGAACGAGTTAAGGAATCCCCCTCCGGTTATGATGTCAAGGAGGAGATAGAACCGCCTCCGAGCTCCCCACCTTCTCCGCTTCGCCGACGGCACCATGTTCCGCGTCGAGACAAACCGGCCAACAATGTGACTCCCATCTGCTGCCTGAAGCACTGCAGAAAGGAACGCACTGCCTTCCATCTGCTGAGCACTTTCGGCTTCCCAAAGGATCGCCAGTTGTTGCTGAAATGGTGTGCCAATCTGCATTTAAACCCGGACGACTGCATCGGTAGGGTTTGCATCGAGCACTTTCAGCCGGAGGTACTCGGCACCCGCAAGCTCAAGCAGAATGCAGTGCCCACTCTTAATGTGGGACATGAAGAACCGCTCAGGTACTCGTGCCATGGCGTGGACCAGAATCTCGAGGAGCGGGAGCCCCAGCCCCAGCATTCGGTTTTTCGGCTTTGGAGCCTGAAACACTGCagaaaaaggaagctaacGGAGCCCCCGGATATTCCCCTAGCCAAGAGGAGAGTGCTGGAGATGCCGATGATGAAGCGGGAGTGGGAGATGGAGATGCCGacgcagatgcagatgcagatggaGCAGAAGAAGGAGGCAAAGAAGATGACTCAAACTGAAAGTAATTCACTTATATGCTGTATAAGCAGTTGCGGCAACCAGGAAGTTAGCCAATTGCAGGCATTTCCTGAAGAAAAGTCCTTGTTAAGAAAGTGGATCCATAATTTAAGGCTGCCCACTGAGATTGAGCCCACTTCTCTAAGCCTGAAAAGAGTTTGTTTGGCGCATTTCGAATCGCAGCTGTTGGAGAATGGAAAGCTCACAAAGGATGCAGAAGCAGAGGCCATGCCGACCTTAAACCTGGGCCATAGCAGCTGGAATCTATACAGGAGCAATGGGATCTGCCTAGTGCCCGACTGCACCTTTAATAACTCCAGAAACATTAGCTTTATCGACCTGCCGGACAACAGTATTATTAAGGACGCTTGCTTCTCCTGCCTCAACCTACCTGAATCTTGCGAGGAGCAGGCGAGACTGTGTTGTATCCACTTTATGGAGGCTTACAAAAAGTTTGATCTTCCTAATGTTCTACACCCTAAAGTCATGACGGCGCTACAAAGTGTTTTGGCCGAGCTGCAATGCGCGGTGCCCGGCTGCAATTTCGAAGATGCTGATCCGGACTTTCAACTTATCCAGTTTCCCGATAACAAGGAGGGGCTGTCACAGTGGCTGCACAACACCAAGGTCCCTTATGATCCTTCTAGCCACCATAGATATCGCATCTGCACACGCCACTTTGAATCTGAGTATTTAGAAACAAATTTCCCGCTAAAAGGGGCTATTCCGACGCTCCATCTAAATCATGAAGATGAGATTCACTTGAATACTAGCTCTTTGCCAGAGGATCAGAACTCTATATTGACTCCACTGCGTATAAAGACGGATCCTGCCTTCTTGGGCAGTCCCTGTGCAAGTGCGAGCCCCAGTCCCCGAGGCAAGATCCGGATTTGCTGTATTCCCTCATGCGGACAGTTTGGCAGCAGTCAAGTGAGGCTGTTTCGTTTTCCCACCGAGGAGCAGGCGTTGCTTCGGTGGCTGGTGaacacacagcagcagccgcggcTGGTAGATCCCATGGACTTGTATGTGTGCCAGTCGCATTTTGAGCCCGAGGCCATGTATATGAAGCAACTTCGAAACTGGGCTGAGCCCACCCTAAACTTGGGACACGACGGCCATATAATCCCGAATGCCAAACATAATGGAAATATTTCCGACAGCCAAGATACTGAGCAAGCCATGAGGTTTATTCGCGAACGATTCTGCTCCGTAATTTCTTGCTTTCAGGCAGGCGGACAGGAAGAGGAGGGAGTGAGGTTATTTGATTATCCGGAGGATATGGCAACTACTCGAAAGTGGGCAGCCGCATGCAGGCATCGCTCCATGCAGGCCAGAAGCCATGGGTTCAAGGTGTGCCAGTTGCATTTCGCCAAGGAATGCTTTGACCCAAATACTGGAGCATTGATTGAGGGCGCTGTGCCCACTTTGGAGTTGAGCAGAGATGAAATGGAGAGGCAATGTCTGGTGGCTGGGTGTGTAAAAAATGATGCCAATGGAACCCGCCTTCGCTACTTTAAGATACCAAAACTTGCTGCCCAATTGGAAGCGTGGAGCAACAACCTTAAAGTCCACCCAACGGATCTCATGCAAGGGGAACAGCAATACATTTGCGAGAAACACTTTGAGTCGTTCTGCTTTGGGGCCAACAAGGGACTGCGTTCTGGTGCTCTTCCAACCCTCTTGCTGGGCCATGATGATGAGGTTGATATGCTTCCAAATCCGGAAAGCTTTAcctgccagaataaggcagaTAAGTGCTGCGTACCGGGATGCGGGCGTGTCTGGCAGGCTGGCGATCGTAAATTTCGTGGATTTCCCAAATTGTTGGCCATGGCCAATAAATGGAGGCATAATCTTCGTTTGGAAGAGCCCGTGGAACAACTCGGCAAGCTGAAGGTCTGCAGTGTTCACTTTGAGGCCACCTCACCCAACCTGGGTACAAATGGACTAAGTGTCTCGATACCAACCCTGGAATTGGGCCACTCTTCTCCGGATATTTTCCCAGCGGAAATCAGCTTAAAGTTCCAAAAGCGCTCCGGAATGCCGACGAAAATTTATTGCTGTTATCCCAAATGCGAGGAAGCCTGTTTGTCCAAGAATTTTTCATACGGCCTTCCCCAGGAGGAGCATCTGAGGAATGCCTGGCTAAGCCACATGGATATAGAAGATCCAAAAGATGAAGAAGTCGCACAGGTTTGTCCGCTGCACTATGTCATTCTCTACCAGCAAAGTGCCGCACTCTATCCGGAGCTTCATGCTTCAAGCCGACAGCTTCTTGACGACAATTACAAGGAGGCGTGGAACAACAGGCGCGTAAAGATAGTGAGTTGCACGATCAAGGGCTGCGACATGGTTAAGCCCCGAGATGGGGTACCGCTGCACGGGATGCCGCAAAGCAATGAAATCCTGCAGATGTGGATAGACAATGGCCAGTTTGAGTTCTTAGAGCAACAGCGGTATATGTTCAAAGTGTGTCACAATCATTTTGAGCCATGCTGTTTCTTCGACGACAGACGTTTGCACTCATGGAGCGTGCCCACTCTGCATCTACCTGGAGACATAATACACCAAAATCCCACCCCCGAGCAGTGGCAGAACATGATCAACaagcaagcagcagcaaaaacataCGCTGAAGAGAACGAGGAGCCAGATCCATATGAGGATGTGGTTAAAACCGAACCCATTGTAAAGATGGAGCATATCGAATCGGAATATGAAGATGAGAACCCTGAGATGCAGGCCCTAGAGGTCCTCCTAGAAGTTGGCCATGTCGAGCGAATGGAGAGCTATGAGAAAATGGATAAATCACCAGCGATATACACCGATAATGCGCCCTTTCGATCTTCACCCATACGTTGCCAATATAATGCTAATCACTGTGCCGTAGAAGGATGCCAGGTGACTGTCGAGGATGTGGACGGCACGATTAAGCTGCATAAATTCCCCGCGTCACAGGAAGCCGCACAGAAGTGGATGCACAACACCCAAGTTGATATGGACGAAAAGTACTGGTGGCGTTATCGCATATGCAGTTACCACTTCGATCAAGAATGCTTTCAGAGTGCCAGAATTCGTAAAGGTGCGATGCCTACGCTTTTGCTAGGACCACGGCGACCGGACGAGGTGTACGATAATGAGTTTTCACTACCAGAGGCGGAGGAGCCTTTTCCAGAGCCACCGGAGGAGGAAAGTTCGACTGTGGCGTCCAGAGTTCAAAAGGAGGTAACCAATTTATGCCTGCCGCCACGGGCGCCGCCTCGAAAGTCAAGCAAGTTTTGCCAGATTGATTCCTGCACAAACCACCTGACCACTGAGAATATGACACTTCACAAGTTTCCACACTCGGAGGACATGTGCCTCAAGTGGCAGCACAACACGCAAGTGCCATTTGATCCCTACTACCGCTGGCGTTACCGCATTTGCAGTGCGCATTTTCATCCGGTGTGCTTGGTCAACATGCGTCTGGTCCATGGAAGCGTTCCCACTTTAAAGCTGGGTCCCAAGGCTCCTTCCGAGCTGTTTGACAACGATTTCGAAGCCATCAACCTAAGATTGGATAAAAGGTTGACAGAGTCCAATGCTAATGTTTACATCAAGCATGAAAaaagggaggaggaggaggattcGATGATGTTCCTGGAGCCCGAGCTTCAGTTACACGAGGACCAAGACGATAAGGTATCAATCTGGAACAGCAAACTGCAATTACCACCTGTAAAGCAagagaaaattatatacaGCCAGATCAAGTCTGGCTATGATAAGTGTTCGCTGGCTCACTGCCAGCGCCAGAGGTCCCAGCATGGCGTCCACATTTATAAGTTTCCCAGATCGAAGCGTCAGCAAGAGCGTTGGATGCACAACCTACGCATCCGGTATGATGATCGGACACCGTGGAAATTCATGATCTGCAGCGTTCACTTCGAGCCACACTGCGTCAGCCTAAGGAAGCTGCGACCATGGGCGGTGCCCACACTGGAACTGGGTGACAATGTACCAGAGACAATCTTTACGAACGAACAGTGCGAGAAGGATCTGGTGACCGAGCGCAGTGATCCGGATAGCGACGCGGATGAAGAAGACGGCTTGcaggaggacgacgacgatgatgacgacgaggacgatgtAAAGCCCGATGTGATTGGCATAAAAAGGAGGAAACGTTCCAAAATAGATTCCACCTGCCCTCCTAGCCAGATTCCACCCTGGAAAGTCAAGCAGTGCTGCCTCCCCTATTGTCGTGCCTTTCGAGGCGATGGCATCAAGCTGTTTCGGCTTCCGAACAACCGAAACTCCATTAGCAACTGGGAACGGGCCACCGGAATGGTATTCAAGGAGTCGCAACGGAACACTCGGCTGATCTGCAGCCGTCACTTTGAGCCAGAGCTGATTGGCGTCAGGCGTCTAATGCGTAACGCCATTCCCACGAAACACTTGAGCCCCCAAGCGGTGGGCCAGATCCGTACTAAAAAGGAGAAGAATCCTCCTGCGGCCACTATTACACCCATCTGCTGCATGGCGGATTGCCACTACAACGGAAATGTGAAGCTGCACAAGTTTCCAAGTGATCCCACTCTTCTCAAACAGTGGTGCCAGGCTCTCCGGCTCACTGATACGCAGCGGTATTTGGGCAAGCACATTTGCTCCATGCACCTGCCAATGAACAAGACGATGAGCTGTGTCATCTGCGGTGGAGACAACGTAGAGCTGCCGATGCTTGGGTTTCCGGAAAACCGCAATCAGCGCGCCAAATGGTGTTACAATCTCAAAATTGAGACAATACCAAAGTGGGACCACTCAAAGCATATTTGCTGCCGGCACTTTGAGTCCCATTGCTTTGACAAGCCGGGTGAGCTACGTCCAGGAGCGACTCCCACGCTCCATCTCAACCATGATGACACAAACATATTCTTCAGCGACTATGCCACTGGTCTTCCGTCCTCGCCACTAGGCAATCGAATTAAAGACGAGCCCCTGGAATCGGAGTCCGACGAGACACTGCTGGTGTAG
Protein Sequence: MSQHNPNHAHPHYHYPSHTTPLALQQHQHQQQQHQQQQQQHGSSWYSHVASYPAATHSHPLSHSGFGPAPPCKASISNNNSMGAYGGGVGGGGGSHGYFGAAGGGLNVSGAGGGAGSSYGLGANTVAYAHNQLLQYQHHHQQHQQQQQQHLGLGQRSYMGHDVMAGNYPYIKSEPLEGFQQPPNPMAPPPAPEMIIKSEPIDDLAYKSNYIDDNTPFADFSKFSEFSEDMLSPKVELTVKDESFVRNPNSFLRRKQQSDLTTSESLPVCQRCKEVFFKKQTYLRHVAESNCGIQEYDFKCTICPMSFMTAEELHQHKQQHRADRFFCHKYCGKHFGTITECEAHEYMQHEYESIVCNMCSGSFATREQLYAHLPQHKFQQRFDCPVCRLWYQTALELHEHRLAAPYFCGKYYTGGQSPSPSSQQQQHQSQANYKLQDCHMATMEMPNAPLLKANSTNSPALPATAALNSLLQQRQANADGAAIFAASSMKNEVAVKLERSYSNSTNESSYSVQESGYNNVYGSSDSSVHGAIAGPQAHSSTLDDSEDALCCVPLCGVRKSTSPTLQFFTFPKDEKYLNQWLHNLKMFHIPASSYVSFRICSMHFPKRCINRYSLCYWAVPTFNLGHDDVANLYQNRELTNTFTTGEVARCSMPHCTSQRGESNLKFYNFPKDIKSLIKWCQNARLPVQAKEPRHFCSRHFEERCIGKFRLKPWAVPTLHLGAQYGKIHDNPKNLYVEEKRCCLNFCRRSRSSDFNMSLYRFPRDEVLLRRWCYNLRLDPGVYRGKNHKICSAHFIKEALGLRKLSPGAVPTLHLGHNDTFNIYENELWPPPTPTPSSCHLQQQQQSSLHSLQQQMHSKSYHRRSAASTSSSASSAASHYVDPEMSASYHLAMSTSAGGSAMINASDSMDVCCVPSCESKRHNSENITFHTIPRRPEQMRKWCHNLKIPEDKMHKGMRICSLHFEPYCIGGCMRPFAVPTLQLGHDDEDIHRNPDVIKKLNIRETCCVAVCKRNRDRDHANLHRFPSNVALLKKWCANLQRSVPDGSKLFNDAICEVHFEDRCLRNKRLEKWAVPTLILGHDDIAYPLPTPEQVTEFYARPTAPNNGEEQGECCVETCKRNPSVDDIKLYRPPEEAAVLAKWAHNLQTEANQLTSMRICNLHFEAHCIGKRMRHWAIPTLNLAGNIENLYENPEQSLLYRRRTTHLKTKLTPSSVKPTWVPRCCLPHCRKVRALHNVQLYRFPKLNRSTLAKWAHNLQVPMVGSAQRRLCSAHFEPHVLSKKCPVPLAVPTLDLNSPPGLKIYQNPAKLKANKLCLQRVCIVESCRKTRAQGVQLFRLPHSPTQLRKWMHNIRTRPRAAMRAQYRVCSRHFETHSFNGRRLSAGAIPTLELGHDGDDIYPNEAQAFVDEHCAVEGCEASKEQPEVRLFRFPTDDDDMLWKWCNNLKMNPVDCIGVRICNKHFETDCIGPKHLYKWAIPTQELGHDDAQIELIPNPKPEDRYVDPVFKCIVPTCGKTRRFDEVQMNSFPKDPDLFQRWRHNLRLDHLSFQERDRYKICNAHFEEICIGKTRLNIGSVPTLELGHDDEEDIFQVNPAELQSNLFGRQRRLLLDGSGEQSVKQELSETEDNNKEDVTATCSNSKQIKIKRSSSDLKCCVHSCGRSRLEHGARLFPFPTGKQQHLKWRHNLRLEPEEVDRSTRVCSAHFNRRCIEGKQLRSWAMPTQQLGHNDQPIYENPKNIPGFFTPTCALGHCRKRRSIDNDLRTYRYPRSEDLLEKWRANLRLAPDQCRGRICANHFEPQVRGKLKLKTGAVPTLQLGHDEELIYDNEAIKAGMTEEEEAITTEFPRLKPKKELFEEEEEECEGNDSEQQHTDDLDDNADEEDKDDQYFDPLELVETFAEHRSDDEAQDYEDEEDEERVKESPSGYDVKEEIEPPPSSPPSPLRRRHHVPRRDKPANNVTPICCLKHCRKERTAFHLLSTFGFPKDRQLLLKWCANLHLNPDDCIGRVCIEHFQPEVLGTRKLKQNAVPTLNVGHEEPLRYSCHGVDQNLEEREPQPQHSVFRLWSLKHCRKRKLTEPPDIPLAKRRVLEMPMMKREWEMEMPTQMQMQMEQKKEAKKMTQTESNSLICCISSCGNQEVSQLQAFPEEKSLLRKWIHNLRLPTEIEPTSLSLKRVCLAHFESQLLENGKLTKDAEAEAMPTLNLGHSSWNLYRSNGICLVPDCTFNNSRNISFIDLPDNSIIKDACFSCLNLPESCEEQARLCCIHFMEAYKKFDLPNVLHPKVMTALQSVLAELQCAVPGCNFEDADPDFQLIQFPDNKEGLSQWLHNTKVPYDPSSHHRYRICTRHFESEYLETNFPLKGAIPTLHLNHEDEIHLNTSSLPEDQNSILTPLRIKTDPAFLGSPCASASPSPRGKIRICCIPSCGQFGSSQVRLFRFPTEEQALLRWLVNTQQQPRLVDPMDLYVCQSHFEPEAMYMKQLRNWAEPTLNLGHDGHIIPNAKHNGNISDSQDTEQAMRFIRERFCSVISCFQAGGQEEEGVRLFDYPEDMATTRKWAAACRHRSMQARSHGFKVCQLHFAKECFDPNTGALIEGAVPTLELSRDEMERQCLVAGCVKNDANGTRLRYFKIPKLAAQLEAWSNNLKVHPTDLMQGEQQYICEKHFESFCFGANKGLRSGALPTLLLGHDDEVDMLPNPESFTCQNKADKCCVPGCGRVWQAGDRKFRGFPKLLAMANKWRHNLRLEEPVEQLGKLKVCSVHFEATSPNLGTNGLSVSIPTLELGHSSPDIFPAEISLKFQKRSGMPTKIYCCYPKCEEACLSKNFSYGLPQEEHLRNAWLSHMDIEDPKDEEVAQVCPLHYVILYQQSAALYPELHASSRQLLDDNYKEAWNNRRVKIVSCTIKGCDMVKPRDGVPLHGMPQSNEILQMWIDNGQFEFLEQQRYMFKVCHNHFEPCCFFDDRRLHSWSVPTLHLPGDIIHQNPTPEQWQNMINKQAAAKTYAEENEEPDPYEDVVKTEPIVKMEHIESEYEDENPEMQALEVLLEVGHVERMESYEKMDKSPAIYTDNAPFRSSPIRCQYNANHCAVEGCQVTVEDVDGTIKLHKFPASQEAAQKWMHNTQVDMDEKYWWRYRICSYHFDQECFQSARIRKGAMPTLLLGPRRPDEVYDNEFSLPEAEEPFPEPPEEESSTVASRVQKEVTNLCLPPRAPPRKSSKFCQIDSCTNHLTTENMTLHKFPHSEDMCLKWQHNTQVPFDPYYRWRYRICSAHFHPVCLVNMRLVHGSVPTLKLGPKAPSELFDNDFEAINLRLDKRLTESNANVYIKHEKREEEEDSMMFLEPELQLHEDQDDKVSIWNSKLQLPPVKQEKIIYSQIKSGYDKCSLAHCQRQRSQHGVHIYKFPRSKRQQERWMHNLRIRYDDRTPWKFMICSVHFEPHCVSLRKLRPWAVPTLELGDNVPETIFTNEQCEKDLVTERSDPDSDADEEDGLQEDDDDDDDEDDVKPDVIGIKRRKRSKIDSTCPPSQIPPWKVKQCCLPYCRAFRGDGIKLFRLPNNRNSISNWERATGMVFKESQRNTRLICSRHFEPELIGVRRLMRNAIPTKHLSPQAVGQIRTKKEKNPPAATITPICCMADCHYNGNVKLHKFPSDPTLLKQWCQALRLTDTQRYLGKHICSMHLPMNKTMSCVICGGDNVELPMLGFPENRNQRAKWCYNLKIETIPKWDHSKHICCRHFESHCFDKPGELRPGATPTLHLNHDDTNIFFSDYATGLPSSPLGNRIKDEPLESESDETLLV

Similar Transcription Factors

Sequence clustering based on sequence similarity using MMseqs2

100% Identity: iTF_00525910;
90% Identity: iTF_00594581;
80% Identity: -