Basic Information

Insect: Drosophila monieri
Gene Symbol: -
Assembly: GCA_035047585.1
Location: JAWNPJ010000011.1:2203711-2216689[+]

Transcription Factor Domain

TF Family: THAP
Domain: THAP domain
PFAM: PF05485
TF Group: Zinc-Coordinating Group
Description: The THAP domain is a putative DNA-binding domain (DBD) and probably also binds a zinc ion. It features the conserved C2CH architecture (consensus sequence: Cys - 2-4 residues - Cys - 35-50 residues - Cys - 2 residues - His). Other universal features include the location of the domain at the N-termini of proteins, its size of about 90 residues, a C-terminal AVPTIF box and several other conserved residues. Orthologues of the human THAP domain have been identified in other vertebrates and probably worms and flies, but not in other eukaryotes or any prokaryotes [1].
Hmmscan Out: # of c-Evalue i-Evalue score bias hmm coord from hmm coord to ali coord from ali coord to env coord from env coord to acc

1 29 2 5.4e+03 -1.7 2.9 38 62 315 342 306 358 0.59

2 29 2.4e-15 6.5e-12 46.2 4.1 1 86 550 622 550 623 0.85

3 29 8.8e-15 2.4e-11 44.3 5.0 1 87 650 719 650 719 0.83

4 29 8e-16 2.2e-12 47.7 0.2 1 87 741 813 741 813 0.85

5 29 2.6e-16 7.1e-13 49.2 6.3 1 87 912 982 912 982 0.82

6 29 5.1e-15 1.4e-11 45.1 3.5 1 86 1006 1077 1006 1078 0.81

7 29 8.3e-13 2.3e-09 38.0 1.2 1 87 1113 1181 1113 1181 0.81

8 29 2.8e-11 7.7e-08 33.1 2.5 1 86 1221 1290 1221 1291 0.77

9 29 2e-17 5.5e-14 52.8 0.3 1 86 1318 1387 1318 1388 0.82

10 29 7.3e-13 2e-09 38.2 1.5 1 85 1409 1477 1409 1479 0.79

11 29 1.2e-14 3.3e-11 43.9 1.0 1 86 1506 1577 1506 1578 0.85

12 29 4e-14 1.1e-10 42.2 2.0 1 86 1660 1729 1660 1730 0.82

13 29 5.1e-13 1.4e-09 38.7 0.1 1 86 1753 1821 1753 1822 0.82

14 29 5.7e-14 1.6e-10 41.7 1.4 1 87 1951 2020 1951 2020 0.81

15 29 4.1e-08 0.00011 22.9 0.0 1 86 2112 2177 2112 2178 0.76

16 29 6.9e-06 0.019 15.8 0.0 1 58 2193 2240 2193 2256 0.80

17 29 1.7e-13 4.7e-10 40.2 0.2 1 87 2270 2342 2270 2342 0.81

18 29 1.4e-13 3.8e-10 40.5 0.1 1 87 2402 2472 2402 2472 0.81

19 29 9.6e-11 2.6e-07 31.4 0.0 1 86 2507 2578 2507 2579 0.79

20 29 1.1e-13 3e-10 40.8 0.0 1 86 2589 2660 2589 2661 0.80

21 29 2.9e-14 8.1e-11 42.6 0.2 1 85 2685 2751 2685 2753 0.79

22 29 7.3e-06 0.02 15.7 0.1 1 58 2783 2830 2783 2861 0.80

23 29 3e-12 8.2e-09 36.2 0.1 1 87 2868 2940 2868 2940 0.82

24 29 5.6e-16 1.5e-12 48.2 0.2 1 86 3047 3119 3047 3120 0.81

25 29 1.3e-12 3.7e-09 37.3 3.2 1 86 3180 3250 3180 3251 0.82

26 29 5.8e-14 1.6e-10 41.7 3.6 1 86 3321 3391 3321 3392 0.85

27 29 5.9e-12 1.6e-08 35.3 0.1 1 87 3475 3545 3475 3545 0.84

28 29 2.9e-10 7.9e-07 29.9 1.7 1 58 3573 3621 3573 3630 0.85

29 29 1e-09 2.8e-06 28.1 1.3 18 86 3639 3696 3627 3697 0.75

#	of	c-Evalue	i-Evalue	score	bias	hmm coord from	hmm coord to	ali coord from	ali coord to	env coord from	env coord to	acc
1	29	2	5.4e+03	-1.7	2.9	38	62	315	342	306	358	0.59
2	29	2.4e-15	6.5e-12	46.2	4.1	1	86	550	622	550	623	0.85
3	29	8.8e-15	2.4e-11	44.3	5.0	1	87	650	719	650	719	0.83
4	29	8e-16	2.2e-12	47.7	0.2	1	87	741	813	741	813	0.85
5	29	2.6e-16	7.1e-13	49.2	6.3	1	87	912	982	912	982	0.82
6	29	5.1e-15	1.4e-11	45.1	3.5	1	86	1006	1077	1006	1078	0.81
7	29	8.3e-13	2.3e-09	38.0	1.2	1	87	1113	1181	1113	1181	0.81
8	29	2.8e-11	7.7e-08	33.1	2.5	1	86	1221	1290	1221	1291	0.77
9	29	2e-17	5.5e-14	52.8	0.3	1	86	1318	1387	1318	1388	0.82
10	29	7.3e-13	2e-09	38.2	1.5	1	85	1409	1477	1409	1479	0.79
11	29	1.2e-14	3.3e-11	43.9	1.0	1	86	1506	1577	1506	1578	0.85
12	29	4e-14	1.1e-10	42.2	2.0	1	86	1660	1729	1660	1730	0.82
13	29	5.1e-13	1.4e-09	38.7	0.1	1	86	1753	1821	1753	1822	0.82
14	29	5.7e-14	1.6e-10	41.7	1.4	1	87	1951	2020	1951	2020	0.81
15	29	4.1e-08	0.00011	22.9	0.0	1	86	2112	2177	2112	2178	0.76
16	29	6.9e-06	0.019	15.8	0.0	1	58	2193	2240	2193	2256	0.80
17	29	1.7e-13	4.7e-10	40.2	0.2	1	87	2270	2342	2270	2342	0.81
18	29	1.4e-13	3.8e-10	40.5	0.1	1	87	2402	2472	2402	2472	0.81
19	29	9.6e-11	2.6e-07	31.4	0.0	1	86	2507	2578	2507	2579	0.79
20	29	1.1e-13	3e-10	40.8	0.0	1	86	2589	2660	2589	2661	0.80
21	29	2.9e-14	8.1e-11	42.6	0.2	1	85	2685	2751	2685	2753	0.79
22	29	7.3e-06	0.02	15.7	0.1	1	58	2783	2830	2783	2861	0.80
23	29	3e-12	8.2e-09	36.2	0.1	1	87	2868	2940	2868	2940	0.82
24	29	5.6e-16	1.5e-12	48.2	0.2	1	86	3047	3119	3047	3120	0.81
25	29	1.3e-12	3.7e-09	37.3	3.2	1	86	3180	3250	3180	3251	0.82
26	29	5.8e-14	1.6e-10	41.7	3.6	1	86	3321	3391	3321	3392	0.85
27	29	5.9e-12	1.6e-08	35.3	0.1	1	87	3475	3545	3475	3545	0.84
28	29	2.9e-10	7.9e-07	29.9	1.7	1	58	3573	3621	3573	3630	0.85
29	29	1e-09	2.8e-06	28.1	1.3	18	86	3639	3696	3627	3697	0.75

Sequence Information

Coding Sequence: ATGTCACAACATAACCAACCCCACCAAGTTCCCCCGCATCCGCACTATCCTTACCACCACGCCTCTGCGTCGCTGCccctgcaacagcagcagcagcaacatgccAGCAATTGGTACTCACATGTTGCTTCCTTCCCACCCTCCCATACGGCCTTCAACCCCTCACTCCCCTGCAAGGccgccagcaacagcaacaccagcaccaacaacaactcCAACATGGGCGCCTACGGAGGGGGTGGTGGCACGCATGGCTATTACGGCAATGTCAGCGGCGGAGTTGGTGTTGGAGCGGTGGGTGGGGGCTCCGGTGGCGGAGGAGGCGCAGTAGGCTCGACCTACGGCCTTGGGGCCAACACTGTGGCCTATGCCCACAACCAGCTGCTCCAATACCAGcaacaccaccagcagcagcaggagcaacactcgcagcagtcgCACCTGGGCCAGCGGTCCTCCTACATGGGCCACGATGTCATGGCCGGCAGCTATCCGTATATCAAGAGCGAACCCATGGATGCCTACCAGCAGCCGCCAAACCCCATGGCTCCGCCACCGCCCCTGCCTCCCGCCCAGGAAATGATCATAAAATCGGAGCTCATGGACGAGCAGGCCTACAAGTCCAACTACATCGATGACAACACCCCGTTTGCGGACTTTAGCAAGTTCAACGAGTTCAGCGAGGACATGCTGAGTCCCAAAGTGGAGCTAACCGTCAAGGACGACTCCTTCGGCAAGAACCATAATAGTTTTCCGCGCCGCAAGCCACACAATGATCGACCCGCCGGCAATGAAAGCCTGCCGATCTGCCAGCGCTGCAAGGAGGTGTTCTTCAAGAAGCAGACCTACCTGCGCCACGTTGCCGAGAGCAGCTGCAGCATCCAGGAGTACGACTTCAAGTGCAACATCTGCCCCATGTCCTTCGTGGGCGCCGAGGAGCTGCAGCGCCACAAAAACCATCACCGGGCCGACCGATTCTTCTGCCACAAGTACTGCGGCAAGCACTTCGAATCGATCGCCGAGTGTGAGGCGCACGAGTACATGCAGCATGAGTACGACAGCTTCGTCTGCAACATGTGCTCGGCCACTTTTGCGACCCGGGATCAGCTCTACTCCCACTTGCCGCAGCACAAGTTTCAGCAGCGCTTCGACTGCCCCATATGCCGCCTGTGGTACCAGACCGCTCTCCAGCTGCACGAGCATCGCATAGCGGAGCCCTATTACTGCGGAAAGTACTACGGGGCCGGGCTGAACACGGCGACACctcagcagcaacaccaccaccagagcCAGACAAACTACAAGCTACAGGATTGCCACATGGCCACCATGGAGATGCCCAACACATCGCAACACAAGCCGAATCCCTCCAACTCTACCTTGCCGGCCACTGCGGCTCTTAGTTCCTTGCTGCAGCAGCGGCAAGCGAATGCCGATGGCGCCGCCATGTTCGCTGCCTCCGCGGTCAAGGCGGAGATGAACGTCAAGCTGGAGCGGAGCTACAGCAACTCGACCAGCGAGTCATCCTACGGAGTACAGGATGGCGGCTACAACAACTCGTTTGCCGGAGAAACTGCTATGCACAGCGGTGCCATCGCCGGACCACAGGCCAACTCCTCGACGCTGGACGACTCCGAGGATGCGCTGTGCTGTGTGCCATTGTGCGGGGTGCGCAAGAGCACCAGCCCCACGCTGCAGTTCTTCACGTTCCCCAAAGACGAAAAATACCTCAACCAGTGGCTGCACAACCTCAAGATGTTCCACGTGCCGGCCTCCAGCTACGCCAGCTTCCGCATCTGCAGCATGCACTTCCCCAAGCGCTGCATTAACCGCTACTCGCTGTGCTATTGGGCAGTTCCGACCTTCAACCTGGGCCACGACGACGTGGCCAATCTCTACCAGAACCGCGAGCTCACCAACACGTTCACCGTCGGCGAGGTGGCCAGGTGCAGCATGCCCCACTGCACCAGCCAGCGGGGCGAGAGCAACCTCAAGTTCTACAACTTTCCCAAGGACATCAAGAGCCTGATCAAGTGGTGTCAGAACGCCCGTCTGCCCGTCCAGGCCAAGGAGCCACGGCACTTCTGCAGCCGTCACTTCGAGGAGCGGTGTATCGGCAAGTTCCGCCTCAAGCCCTGGGCTGTGCCCACCCTTCATCTGGGCGCGCAGTACGGAAAAATCCACGACAATCCCAAGAACTTGTATGTGGAGGAGAAGCGTTGTTGCCTCAACTTCTGTCGCAGGAGCAGGTCCTCCGACTTCAATATGTCGCTATATCGTTTTCCCAGAGACGAGGTGCTCCTCCGCCGTTGGTGCTACAATCTTCGCCTGGATCCCGGAGTTTATCGCGGCAAGAATCACAAAATATGCAGTGCCCACTTCATCAAGGAGGCGCTGGGCTTGCGGAAGCTATCACCAGGAGCGGTGCCCACCTTGCATTTGGGCCACAACGACACCTTCAACATCTACGAAAACGAGCTGTGGCCGCCGCCAACTCCCTCCACCAGCCACGGCAGTGGCCAGGTGCATttgcaacaccagcaacataTCCCGTCGCACCACCCGCTCCAGCACCAGCTGCATGCTGGTCAGAGCAAATCCTATCAACGGCACTCGGCAGCATCCACCTCATCCTCAGCGAGCTCCACCTCGCACTACGTGGACCCGGAGGTGAGTGCCTCGTACCTTGCGATGGGCGGATCCTCGGTGAACGCCAGCGATAGCATGGATGTCTGCTGTGTGCCCAGCTGCGAGAGCAAGCGGCACAACTCCGAGAACATCACCTTCCATACGATCCCCCGAAGACCCGAACAGATGCGCAAGTGGTGCCACAACCTGAAGATACCCGAGGACAAGATGCACAAGGGCATGCGGATCTGCAGCCGGCACTTCGAGCCCTACTGCATCGGCGGATGCATGCGTCCGTTCGCAGTGCCCACCCTGCACCTGGGTCACGACGACGAGGACATCCACCGCAATCCGGACGTAATCAAGAAGCTTAACATCCGCGAGACCTGCTGCGTAGCTGTGTGCAAGAGAAACCGGGACAGGGATCATGCCAACCTGCACCGCTTCCCCAGCAACGTGGCACTGCTGACCAAGTGGTGTGCCAATCTGCAGCGCCCCGTGCCGGACGGCAGCAAGCTCTTCAACGACGCCATTTGCGAGGTGCACTTCGAGGACCGCTGTCTGCGAAACAAGCGCCTGGAGAAGTGGGCGGTGCCTACCCTGACCCTGGGCCACGAGGACATTGCCTATCCTCTGCCCACGCCGGAGCAGGTTGCCGAGTTCCACTCCCGGCCCTCGGCGCCCAACAATGGCGAGGAGCAGGGCGAGTGCTGCGTTGAGACCTGCAAGCGAAACCCCAGCGTGGACGACATTAAGCTGTACCGTCCTCCGGAGGAGGCGTCCGTGCTAGCCAAGTGGGCGCACAACCTGCAGACAGAGGCCGCCCAGCTGGTGAGCCAGCGAATCTGCAATCTGCACTTCGAGGCCCACTGCATCGGCAAGCGAATGCGCCCATGGGCCATACCCACCCTCAACCTGGCCGGCAACATTGAGAATCTCTACGAGAACCCCGAGCCCTCGATGCTCTACAAGCGGCGGATGCACACGAAGGCGAAACTGTCCGCCTCCGCGAAACCTACCTGGGTGCCGCGATGCTGCCTGCCGCATTGCCGCAAGGTGCGCGCCCTCCACAATGTCCAGCTCTACCGCTTCCCCAAGCACAACCGCTCCACGCTGGCCAAGTGGGCCCACAACCTGCAGGTGCCCATGGTGGGCAGTGCCCAACGCCGCGTCTGCTCGGCTCACTTCGAGCCTCATGTGCTGAGCAAGAAGTGTCCGGTTCCGTTGGCGGTGCCCACATTGGACCTGAACGCTCCGGCAGGGCATATGGTGTACCAGAATCCGGCCAAGCTGAGGGCTAGCAAGCTGTGCCTGCAGCGCGTGTGCATCGTGGAGAGCTGTCGTAAGACCCGGGCACAAGGCGTGCAACTCTTCCGGCTCCCGCACAATCCATCCCAGCTGCGGAAGTGGATGCACAACATCCGGACACGTCCACGGGGTTCCATGCGGTCCCAATACCGGATCTGTTCCCGCCACTTTGAGACGCACTCGTTCAACGGGCGAAGGCTCAGTGCAGGTGCCATTCCCACGCTGGAGCTGGGccacgacgacgacgacatcTACCCCAATGAGGCACAGGCTTTTGTGGACGAGCACTGTGCCGTGGAGGGATGTGGGGCGTCCAAAGAACAGCCGGAAGTGCGACTATTCCGCTTCCCCACCGACGACGATGACATGTTGTGGAAGTGGTGCAACAACCTCAAGATGAACCCCGCCGACTGCACGGGCGTGCGCATCTGCAACAAGCATTTCGAGGCGGACTGCATTGGACCTAAGCATCTATTTAAGTGGGCCATTCCCACCCAGGAGCTGGGCCACGACGACGCCCAGATAGAACTCATTCCGAACCCGAAGCCGGAGGATCGGTACGTCGACCCGGTGTTTAAGTGCGTGGTTCCCACCTGCGGCAAGACGCGGCGTTTCGACGAAGTCCAGATGAACAGCTTCCCCAAGGACCCGGAGCTCTTCCAGCGCTGGCGCCACAACCTCCGCTTGGACCACTTGCACTTCCACGAGCGGGAACGCTACAAGATCTGCAACGCCCACTTCGAGGACGTCTGTATTGGCAAGACCCGCTTGAATATCGGCTCCATACCCACTCTAGAGCTGGGCCACGAGGAGACAGATGACCTGTTCCAAGTCAATCCCGCGGAGTTGCAGAGCAACTTGTTTGGCCGTCaacggcggctgcttgacggAACGGATTCCGGCGAGGTGGTGGTCAAGCAGGAGCTTCCGGATGGGGATGGTGACTCCGAGCCCGAGGACATAAAACCGGATATAAGACAAATTCTAATATCCAGACCCAGACAGGTGAAGGGCAAGAAAGGAACTCTGGGGAATCTGAAGTGCTGCGTCCGAAGTTGCGGAAGGAGCCGGCTGCAGCATGGGGCTCGTCTGTTTGCCTTTCCCACGGGCAAGCAGCAGCACCTTAAGTGGCGCCACAACCTCCGCCTGGAGCCTGAGGACGTGGATAGGACCACCCGGGTGTGCAGCGCTCACTTCAATCGCCGCTGCATAGACGGCAAGCAGCTGAGGAGCTGGGCCATGCCCACGCTGCAGCTGGGGCATCGGGAGCAGCCCATCTACGAGAACCCGAAGAACATACCGGGCTTCTTCACGCCCACCTGCGCCCTGAGTCACTGTCGTCAGAGAAGGAGCATCGACAACGACCTAAGGACATATCGGTACCCCCGGACGGAAGACCTCCTGGAAAAGTGGCGGGCGAATCTACGCCTCACTCCGGATCAGTGCCGCGGTCGTATCTGTGCCGATCATTTCGAGCCCATGGTGCGCGGCAAGTTGAAGCTGAAAACCGGAGCGGTGCCCACTTTGAAGCTCGGCCACGATGAGGGACTGATCTACGACAATGAGGCAATCAAGGCTGGCatggcggaggaggaggaggtcacCTGCAAGCAGGAGATCatggacgaggaggaggagggcgaaGGCGAGGAGTCGCGTGAAGGGGTTCCCGCTGTCCAGGACGATGAAGACGACAAAGACGACAGCTACTTCGATCCTTTGGAACTGGTGGAAACATTCGCAGAGCGGgccagcgacgacgacgacgaagcGGAAGACCACGAAATGGAGGAGAAaaatgatctggatgaggggGATGAGGAGGAGGCAGAGGAGCTCCTGCCCGACCTGCCTCCCACACCGCCACCTGTGCCCCAGCGTCGCGAGAAACCCGCCAACAATGTGACCCCCATCTGCTGCCTGAAGCACTGTCGCAAGGAGCGCACGGCCTTCCATCTGCTGAGCACCTTCGGCTTTCCCAAGGACCGTAAGCTTCTACTGAAGTGGTGCGACAATCTCCACCTGCACCCGGATGACATTGTCGGACGGGTCTGCATCGAGCACTTCGAGCCGGAGGTCCTCGGCACTCGCAAGCTGAAACAGAATGCAGTGCCCACCGTGAACTTGGGCCACGACGATCCGTTGAGGTACACCTGCCACGGCGTGGAACTAGATGCGGACTTGGAGCACGGCCAGCCACAGCACTCGGTTTTTCGGCTTTGGAGCCTGAAACACTGCCGGAAGAGGAAGCTCTCGGATCCGCCGGACATTCGCCCCAGCCACTGGAAGGAGCTGAAGGTGCACATGCAGAAGCAGAGGGAGATGGAGATGGCGATGGAGACCGACATAGTGATGAGCACTCCTCCCCAGACGCCGGTGAAGATTAAGCCGAAGAGATGCTGCGTTATCAGCTGCGGAAGCGAGGATGCCAAAAAGCTGGTAACCATGCCGGATGAGCGCAGTCTTCTCCGCCGGTGGCAGCACAACCTTAAGCTGCCAGTGTTGACGGATCCCAGTCTTGGCTTGTGCCTGGACCACTTCGAAGCGTCTCTGGTGCAATTTGGAAAGCCTCTGGAGAGGGCAGTGCCCACACTGAAGCTGGGTCACAACGGCGGCAATCTCTACCGAAACAACGCCACCTGCTTAGTTCCCAGTTGTCCTAGTTCTGGCTCCGAGGTTACTAGTTTTGTGGGTCTCCCCGTGAATCCAGTGATGAAAAGGGCCTGGCTCTCCTACCTTCAACTGCCATTCCCGAGCGAAGGACTTCTATGTGGCAACCACTTCGTAGAACTGTACGAGCAGGTGGACTTGCCGGAGGACTTACCCGTCCAGGATCTGGAGGAGCTGGAACGAACTGTCGACGAACTGCAGTGCGCTGTGCCCGGCTGCGAGTCAAAGAACGCCCGCGAGATTCCAGTCCAGCTGGTCCAGTTACCCCAAAACGAGGAGGAACTGTCCAAGTGGCTGCACAACACAAAGATCACTTACGACTATTCGCGACACGGTAGCTATCGGATCTGCTTGCTCCACTTTGACCCCAACTGCCTGGAAGAAGACTTTCCACAGAGCTGGGCAGTGCCTACTCTGAACCTGGGACACGAGGACGAGATCCACCTGAACCCCGTGCAGAATCAGCTTCCTGAGGCTCCCAACGGAACCACCAACAGCAATCCCTGGCTGACGCCTCTGAGGATCAAGACGGAACTGGCTTCCGTAAGCAGCCCCAGTGTGAGCGCCAGTCCCAGTCCGAGGGGAAAGATCCGGATTTGCTGCATCCCCACCTGCGGCCAGTTTGGCAATAGCCAGGTGCGACTGTATCGTTTTCCCAGCGAGGAGCAGTTCCTCCTCCAGTGGCTGATCAAcacgcagcagcagccccgACTCGTGGACCCCATGGAGCTCTACGTCTGCCAGGCACACTTTGAAGCCGACGCCATCTACAAGAAGCATCTTCGCAGCTGGGCATTGCCGACCCTAAATCTTGGCCATGACGGGCATGTCTTTCCAAATTCCAGGCACAACGGAAACACGGCCAATGTCTTGGATATCGAGGAGACCACTAAGTTCATCCGGGAGCGCTACTGCGCGGTGCTGAGTTGCTTTCAGCCCGGGGGAGAGGGAGTACGGCTCTTCGAGTACCCCGAGGACATGGCTATGATCCGAAAGTGGGCAGTGGCCTGCAAACATCGTTCCATGCACGCCAGAAGCCATGGTCTCCGGGTGTGTCAGGCGCACTTTGCTGCCGAGTGTTTTGATTCCGGCACTGGAGACCTACTAGAGGGGTCTATACCCACGCTGGAACTCAGCCGAGACGACATCGAGAGACACTGCTTGGTGCGAGGATGTGAGCGGGACGAGTCTGGTCCTCGATTGCGGTTTTATAAGCTGCCCAAGACCGGTGACCAGCTCCAGGCGTGGAGCAACAATATGAAAATTCCGCCCACCGAACTGATGCAGGGAGACCAGCGGATCTGCGAGCGCCACTTCGAGGCGTACTGCTTCGGACCCAGCCGGGGTCTGCGCCAGGGCGCTTTACCCACTTTGTCCCTGGGGCATGAGGAGGAGGTGGACTTGCTTCCTAATCCCGAGAAGTTGCGCCTGGGCAAGCAGGAGAGATGTTGCGTACCGGGCTGCGGACGAGTCCGGCAGCCAGATGACATCCCTTTCCACAGCTTCCCGAAGTATTGGCCCATGGCCAGGAAGTGGCTGCACAATCTCCGCCTGGAAAAGTCGAGCAAGGACCTTAGGGTGTGCCCGGCGCACTTTGACGCTGATGTGCGTGACAATGATGGACTCCTGCCAGAAGCCATGCCCACCAAGCAGCTGGGGCACTCCTCCGAAGGCATTTTCCTAACCAACAAACAGGACAGGATCTTTCAGAATAACAAGAAGTCCTTTTCGGAGGTGGTTTGCTGGTATCCGAACTGTACCGATGCGTCCAGGATCCAGTTGATAGATTTTCCCGACGCGGCAGAGCTTCGCAATGCTTGGTTGGATCACTTGGAGATCAAGGAGACACATGACAATGCCCCACAACTCTGTCCCCTCCATTATGTGATTGTATATGAGCACAGTGCCAAGGAGTTTCCGGAGCACGCTCCAGACCAGGTAATGGAGGAGAACTACCAAATCGCCCGCGGCAACCGGCGCGTGAAGATCGTGAGTTGCGCCATCAAGGGATGCAGTATGGTGAAGCCCAGAGATGGAGTGATGCTGCACGGAATGCCCATGTACAAGGACATCTTGCAGATGTGGGTGGACAACGGACAGATAGACTTCTCCGAACAGCAGCGTTACATGCTCAAGGTGTGCCACAGGCACTTTGAGCCAAGTTGCTTCGTCGAGGAACGGCGGCTCACCTCCTGGAGTGTTCCTACTCTGCATCTTCCCGGTGAGACCATCCACCAGAATCCCAGCAAAGAAGAGTGGCTGGCCATTAAGCAGGAAAAGGAGGAGCCAGAGATTAAGGCAGAACCTCTAGAGACGGAGATGGAAACGGAAAACTCGCTACtggagcccattgtgaagatGGAGCATATGGACTCCGAGGAAGACGACTCCCAAACGCAGGCGTTGGAGGTGCTGCTGGAGGTGGGACATGTGGAGCGGCTGGACAGCTATGAGAAGATTGACAAATCCCCCATTGCCTACCCGGAGCACGTCATATACAAATCCAATCGAAGTCAATACAACGCCAACCGGTGCGCCGTGGAGGGATGTGAGGTCACAGCCGAGGACGTAGACGGCACTATCAGGCTGCACAAGTTTCCCGCCTCAGCGGACGCCGCCCAGAAGTGGATGCACAACACACAGGTGGACATGGAGGAGAAGTTCTGGTGGCGCTATCGCATTTGCAGCTATCACTTCCACCAGGAATGCTTTCAGGGCTCCAGAATCCGGAAAGGAGCCATGCCCACGCTACTCCTGGGACCTCGGAGACCGGATGAGGTTTACGACAATGAGTTTGCTTCGCAGCCGGAGGCGGAGGACCCGCCTCTGCCGGTCGAGATATGCCAGGCCAGTGGGACAGAGCGGACTGCTCCCGACGTTACCAATCTCTGCCTCCCTCCGCCGGCTGCGCCGCGAAAGTCCAGCAAGTTCTGCCAAATAGAAGGCTGCTCGAATCATCTGACCAGCGAGAACATAACCCTCCACAAGTTTCCCCACTCTGAGGACATGTGCGTCCGATGGCAGCACAACAGTCAGGTTCCATTCGATCCGAATCATCGCTGGCGCTACAGGATCTGTACCGCCCACTTCGAGCCCGTGTGCTTGGCCAACTTGCGCCTGCTCCACGGAAGTGTGCCCACCCTGAAGCTCGGACCCAAAGCTCCCGCGGAGCTCTTCGACAACGATTTTGAGGCCATCAACCAGCGGCTGGACAAGAGATCGGCGGCAGAGATAAAACAGGAACGTGTGGACATGGAGGACGAGCTGCACGAGGACCAAATGGAGGTGCCTAGCTGGAAGCCTGTGAAACAGGAGAAGATATCCTTCAACCAGATCAAATCTGGCTACGACAAGTGCTCGCTGGCCCACTGCCAGCGCCAAAGGTCTCTGCACGGCGTCCACATCTACAAGTTCCCCAGGTCGCAGCGCCAGCAGGAGCGGTGGATGCACAACCTCCGCATCCGCTACGATGAGCGCCGTCCCTGGCGCTTCATGATCTGCAGCGTCCACTTCGAGCCCCACTGCATCAGCCTTAGAAAGCTGCGTCCCTGGGCAGTTCCTACGCTGGAGCTGGGCACGAACGTGCCGGAGAAAATCTTCACCAACGAGCAGTGTCAGGAACTGGAAATGGAACAGCCCAGCGATCGCAGCGAGGCGGACAGCGAAGAGGAGGGTGGCCTGGAAGAAGACGACGATGGGGAGGAGGACGAGGTGGAGGAAGAAGGACAAGAGTCCAGTGTCCGCATTAAGAAGGAACGGCGTTCGAAGCTGGATCCTTATCCCCCTGGTCAGGTTCCGCCGTGGAAGGTGAAGCAGTGCTGCCTGCCCTACTGTCGTGCCTTCCGAGGAGATGGCATCAAGCTCTTCCGACTCCCCAACAACCGATCCTCCATTCGCAATTGGGAGCTGGCCACGGGCATGGTGTTCAAAGAGTCGCAGCGGAACACGCGACTCATTTGCAGTCGGCACTTTGACCCGGAGCTTATCGGCGTGCGTCGTCTCATGCGCAACGCTATTCCCACTCTGCATCTGAATCCCCAGGCCGTTCCGGCCAAGGAGAAAAAGATATCGCCGGGCAAGCCCAAGGATACCCCCTCCTCCATGCCCACCTGCTGCATGGCGGATTGCCATCACAACGGAAATGCGAAGCTGCATAAATTTCCCAGTGACTCCACACACCTGCGGCAGTGGTGCCAGGCCCTCAGACTCACGGATACCCAACGGTATCGCGGCAAGTATATCTGTTCGGCCCACCTGCCCACCAATATGACAGTAGGCTGCGTCGTCTGCGGGGTGGATGGCGTTCAGCTGCCGATGCTGGACTTTCCAGAGAACCGCAACCAGCGGGCCAAATGGTGCTACAACCTGAAAATCGAGACCATACCCAAGTGGGATCGCTCCAAGCACATCTGCTGCCGGCACTTCGAGGAGCACTGCTTTGCCCGGCCTGGTGAGCTTCGTCCAGGAGCGACCCCAACAGTGGCTTTGAACCACAGCGACACAAACATATTCCTTAGCGACTACGCCACCGATCCGACGACCTCCTACGCGGGTAATCAGATCAAGGACGAGCCCATGGACGGCGACGAGACGCTCCTGGTCTAG
Protein Sequence: MSQHNQPHQVPPHPHYPYHHASASLPLQQQQQQHASNWYSHVASFPPSHTAFNPSLPCKAASNSNTSTNNNSNMGAYGGGGGTHGYYGNVSGGVGVGAVGGGSGGGGGAVGSTYGLGANTVAYAHNQLLQYQQHHQQQQEQHSQQSHLGQRSSYMGHDVMAGSYPYIKSEPMDAYQQPPNPMAPPPPLPPAQEMIIKSELMDEQAYKSNYIDDNTPFADFSKFNEFSEDMLSPKVELTVKDDSFGKNHNSFPRRKPHNDRPAGNESLPICQRCKEVFFKKQTYLRHVAESSCSIQEYDFKCNICPMSFVGAEELQRHKNHHRADRFFCHKYCGKHFESIAECEAHEYMQHEYDSFVCNMCSATFATRDQLYSHLPQHKFQQRFDCPICRLWYQTALQLHEHRIAEPYYCGKYYGAGLNTATPQQQHHHQSQTNYKLQDCHMATMEMPNTSQHKPNPSNSTLPATAALSSLLQQRQANADGAAMFAASAVKAEMNVKLERSYSNSTSESSYGVQDGGYNNSFAGETAMHSGAIAGPQANSSTLDDSEDALCCVPLCGVRKSTSPTLQFFTFPKDEKYLNQWLHNLKMFHVPASSYASFRICSMHFPKRCINRYSLCYWAVPTFNLGHDDVANLYQNRELTNTFTVGEVARCSMPHCTSQRGESNLKFYNFPKDIKSLIKWCQNARLPVQAKEPRHFCSRHFEERCIGKFRLKPWAVPTLHLGAQYGKIHDNPKNLYVEEKRCCLNFCRRSRSSDFNMSLYRFPRDEVLLRRWCYNLRLDPGVYRGKNHKICSAHFIKEALGLRKLSPGAVPTLHLGHNDTFNIYENELWPPPTPSTSHGSGQVHLQHQQHIPSHHPLQHQLHAGQSKSYQRHSAASTSSSASSTSHYVDPEVSASYLAMGGSSVNASDSMDVCCVPSCESKRHNSENITFHTIPRRPEQMRKWCHNLKIPEDKMHKGMRICSRHFEPYCIGGCMRPFAVPTLHLGHDDEDIHRNPDVIKKLNIRETCCVAVCKRNRDRDHANLHRFPSNVALLTKWCANLQRPVPDGSKLFNDAICEVHFEDRCLRNKRLEKWAVPTLTLGHEDIAYPLPTPEQVAEFHSRPSAPNNGEEQGECCVETCKRNPSVDDIKLYRPPEEASVLAKWAHNLQTEAAQLVSQRICNLHFEAHCIGKRMRPWAIPTLNLAGNIENLYENPEPSMLYKRRMHTKAKLSASAKPTWVPRCCLPHCRKVRALHNVQLYRFPKHNRSTLAKWAHNLQVPMVGSAQRRVCSAHFEPHVLSKKCPVPLAVPTLDLNAPAGHMVYQNPAKLRASKLCLQRVCIVESCRKTRAQGVQLFRLPHNPSQLRKWMHNIRTRPRGSMRSQYRICSRHFETHSFNGRRLSAGAIPTLELGHDDDDIYPNEAQAFVDEHCAVEGCGASKEQPEVRLFRFPTDDDDMLWKWCNNLKMNPADCTGVRICNKHFEADCIGPKHLFKWAIPTQELGHDDAQIELIPNPKPEDRYVDPVFKCVVPTCGKTRRFDEVQMNSFPKDPELFQRWRHNLRLDHLHFHERERYKICNAHFEDVCIGKTRLNIGSIPTLELGHEETDDLFQVNPAELQSNLFGRQRRLLDGTDSGEVVVKQELPDGDGDSEPEDIKPDIRQILISRPRQVKGKKGTLGNLKCCVRSCGRSRLQHGARLFAFPTGKQQHLKWRHNLRLEPEDVDRTTRVCSAHFNRRCIDGKQLRSWAMPTLQLGHREQPIYENPKNIPGFFTPTCALSHCRQRRSIDNDLRTYRYPRTEDLLEKWRANLRLTPDQCRGRICADHFEPMVRGKLKLKTGAVPTLKLGHDEGLIYDNEAIKAGMAEEEEVTCKQEIMDEEEEGEGEESREGVPAVQDDEDDKDDSYFDPLELVETFAERASDDDDEAEDHEMEEKNDLDEGDEEEAEELLPDLPPTPPPVPQRREKPANNVTPICCLKHCRKERTAFHLLSTFGFPKDRKLLLKWCDNLHLHPDDIVGRVCIEHFEPEVLGTRKLKQNAVPTVNLGHDDPLRYTCHGVELDADLEHGQPQHSVFRLWSLKHCRKRKLSDPPDIRPSHWKELKVHMQKQREMEMAMETDIVMSTPPQTPVKIKPKRCCVISCGSEDAKKLVTMPDERSLLRRWQHNLKLPVLTDPSLGLCLDHFEASLVQFGKPLERAVPTLKLGHNGGNLYRNNATCLVPSCPSSGSEVTSFVGLPVNPVMKRAWLSYLQLPFPSEGLLCGNHFVELYEQVDLPEDLPVQDLEELERTVDELQCAVPGCESKNAREIPVQLVQLPQNEEELSKWLHNTKITYDYSRHGSYRICLLHFDPNCLEEDFPQSWAVPTLNLGHEDEIHLNPVQNQLPEAPNGTTNSNPWLTPLRIKTELASVSSPSVSASPSPRGKIRICCIPTCGQFGNSQVRLYRFPSEEQFLLQWLINTQQQPRLVDPMELYVCQAHFEADAIYKKHLRSWALPTLNLGHDGHVFPNSRHNGNTANVLDIEETTKFIRERYCAVLSCFQPGGEGVRLFEYPEDMAMIRKWAVACKHRSMHARSHGLRVCQAHFAAECFDSGTGDLLEGSIPTLELSRDDIERHCLVRGCERDESGPRLRFYKLPKTGDQLQAWSNNMKIPPTELMQGDQRICERHFEAYCFGPSRGLRQGALPTLSLGHEEEVDLLPNPEKLRLGKQERCCVPGCGRVRQPDDIPFHSFPKYWPMARKWLHNLRLEKSSKDLRVCPAHFDADVRDNDGLLPEAMPTKQLGHSSEGIFLTNKQDRIFQNNKKSFSEVVCWYPNCTDASRIQLIDFPDAAELRNAWLDHLEIKETHDNAPQLCPLHYVIVYEHSAKEFPEHAPDQVMEENYQIARGNRRVKIVSCAIKGCSMVKPRDGVMLHGMPMYKDILQMWVDNGQIDFSEQQRYMLKVCHRHFEPSCFVEERRLTSWSVPTLHLPGETIHQNPSKEEWLAIKQEKEEPEIKAEPLETEMETENSLLEPIVKMEHMDSEEDDSQTQALEVLLEVGHVERLDSYEKIDKSPIAYPEHVIYKSNRSQYNANRCAVEGCEVTAEDVDGTIRLHKFPASADAAQKWMHNTQVDMEEKFWWRYRICSYHFHQECFQGSRIRKGAMPTLLLGPRRPDEVYDNEFASQPEAEDPPLPVEICQASGTERTAPDVTNLCLPPPAAPRKSSKFCQIEGCSNHLTSENITLHKFPHSEDMCVRWQHNSQVPFDPNHRWRYRICTAHFEPVCLANLRLLHGSVPTLKLGPKAPAELFDNDFEAINQRLDKRSAAEIKQERVDMEDELHEDQMEVPSWKPVKQEKISFNQIKSGYDKCSLAHCQRQRSLHGVHIYKFPRSQRQQERWMHNLRIRYDERRPWRFMICSVHFEPHCISLRKLRPWAVPTLELGTNVPEKIFTNEQCQELEMEQPSDRSEADSEEEGGLEEDDDGEEDEVEEEGQESSVRIKKERRSKLDPYPPGQVPPWKVKQCCLPYCRAFRGDGIKLFRLPNNRSSIRNWELATGMVFKESQRNTRLICSRHFDPELIGVRRLMRNAIPTLHLNPQAVPAKEKKISPGKPKDTPSSMPTCCMADCHHNGNAKLHKFPSDSTHLRQWCQALRLTDTQRYRGKYICSAHLPTNMTVGCVVCGVDGVQLPMLDFPENRNQRAKWCYNLKIETIPKWDRSKHICCRHFEEHCFARPGELRPGATPTVALNHSDTNIFLSDYATDPTTSYAGNQIKDEPMDGDETLLV

Similar Transcription Factors

Sequence clustering based on sequence similarity using MMseqs2

100% Identity: iTF_00481571;
90% Identity: iTF_00538995;
80% Identity: -