Basic Information

Insect: Drosophila bunnanda
Gene Symbol: -
Assembly: GCA_008042815.1
Location: VNKE01005306.1:122306-135658[-]

Transcription Factor Domain

TF Family: THAP
Domain: THAP domain
PFAM: PF05485
TF Group: Zinc-Coordinating Group
Description: The THAP domain is a putative DNA-binding domain (DBD) and probably also binds a zinc ion. It features the conserved C2CH architecture (consensus sequence: Cys - 2-4 residues - Cys - 35-50 residues - Cys - 2 residues - His). Other universal features include the location of the domain at the N-termini of proteins, its size of about 90 residues, a C-terminal AVPTIF box and several other conserved residues. Orthologues of the human THAP domain have been identified in other vertebrates and probably worms and flies, but not in other eukaryotes or any prokaryotes [1].
Hmmscan Out: # of c-Evalue i-Evalue score bias hmm coord from hmm coord to ali coord from ali coord to env coord from env coord to acc

1 29 4.6 1.3e+04 -3.1 1.2 49 60 325 338 307 355 0.58

2 29 2e-15 5.6e-12 46.1 4.0 1 86 551 623 551 624 0.85

3 29 7.7e-15 2.1e-11 44.3 5.0 1 87 651 720 651 720 0.83

4 29 7e-16 1.9e-12 47.6 0.2 1 87 742 814 742 814 0.85

5 29 3.1e-16 8.6e-13 48.8 5.1 1 87 912 982 912 982 0.82

6 29 1.7e-15 4.6e-12 46.4 3.6 1 86 1006 1077 1006 1078 0.82

7 29 6e-13 1.6e-09 38.2 1.1 1 87 1113 1181 1113 1181 0.80

8 29 7.4e-11 2e-07 31.5 1.4 1 86 1223 1292 1223 1293 0.76

9 29 3.8e-17 1e-13 51.7 0.4 1 86 1320 1389 1320 1390 0.82

10 29 2e-13 5.5e-10 39.8 1.0 1 86 1411 1480 1411 1481 0.80

11 29 6.8e-15 1.9e-11 44.5 0.5 1 86 1508 1579 1508 1580 0.85

12 29 3e-12 8.3e-09 36.0 3.5 1 85 1654 1722 1654 1724 0.82

13 29 1.3e-12 3.6e-09 37.1 0.1 1 86 1747 1815 1747 1816 0.83

14 29 3.4e-13 9.3e-10 39.0 2.2 1 87 1963 2032 1963 2032 0.80

15 29 1.5e-12 4.1e-09 37.0 0.1 1 87 2129 2201 2129 2201 0.77

16 29 5.8e-05 0.16 12.6 0.6 1 72 2216 2272 2216 2286 0.69

17 29 4.3e-12 1.2e-08 35.5 0.1 1 87 2295 2366 2295 2366 0.79

18 29 2.2e-12 6e-09 36.4 0.3 1 87 2418 2488 2418 2488 0.81

19 29 9.7e-13 2.7e-09 37.6 0.1 1 86 2523 2597 2523 2598 0.80

20 29 3.8e-13 1.1e-09 38.8 0.0 1 86 2608 2681 2608 2682 0.80

21 29 7.1e-11 1.9e-07 31.6 0.0 1 85 2707 2779 2707 2781 0.69

22 29 0.00013 0.35 11.5 0.2 1 58 2810 2860 2810 2885 0.78

23 29 3.7e-11 1e-07 32.5 0.9 1 86 2900 2971 2900 2972 0.79

24 29 3.4e-16 9.3e-13 48.6 0.2 1 86 3084 3156 3084 3157 0.81

25 29 2.5e-12 6.8e-09 36.3 3.5 1 86 3220 3290 3220 3291 0.80

26 29 1.6e-14 4.5e-11 43.2 4.6 1 86 3383 3453 3383 3454 0.84

27 29 3.2e-12 8.9e-09 35.9 0.2 1 86 3535 3604 3535 3605 0.85

28 29 2.3e-10 6.3e-07 29.9 0.5 1 58 3630 3678 3630 3686 0.83

29 29 1.3e-10 3.5e-07 30.8 2.0 17 87 3695 3754 3685 3754 0.74

#	of	c-Evalue	i-Evalue	score	bias	hmm coord from	hmm coord to	ali coord from	ali coord to	env coord from	env coord to	acc
1	29	4.6	1.3e+04	-3.1	1.2	49	60	325	338	307	355	0.58
2	29	2e-15	5.6e-12	46.1	4.0	1	86	551	623	551	624	0.85
3	29	7.7e-15	2.1e-11	44.3	5.0	1	87	651	720	651	720	0.83
4	29	7e-16	1.9e-12	47.6	0.2	1	87	742	814	742	814	0.85
5	29	3.1e-16	8.6e-13	48.8	5.1	1	87	912	982	912	982	0.82
6	29	1.7e-15	4.6e-12	46.4	3.6	1	86	1006	1077	1006	1078	0.82
7	29	6e-13	1.6e-09	38.2	1.1	1	87	1113	1181	1113	1181	0.80
8	29	7.4e-11	2e-07	31.5	1.4	1	86	1223	1292	1223	1293	0.76
9	29	3.8e-17	1e-13	51.7	0.4	1	86	1320	1389	1320	1390	0.82
10	29	2e-13	5.5e-10	39.8	1.0	1	86	1411	1480	1411	1481	0.80
11	29	6.8e-15	1.9e-11	44.5	0.5	1	86	1508	1579	1508	1580	0.85
12	29	3e-12	8.3e-09	36.0	3.5	1	85	1654	1722	1654	1724	0.82
13	29	1.3e-12	3.6e-09	37.1	0.1	1	86	1747	1815	1747	1816	0.83
14	29	3.4e-13	9.3e-10	39.0	2.2	1	87	1963	2032	1963	2032	0.80
15	29	1.5e-12	4.1e-09	37.0	0.1	1	87	2129	2201	2129	2201	0.77
16	29	5.8e-05	0.16	12.6	0.6	1	72	2216	2272	2216	2286	0.69
17	29	4.3e-12	1.2e-08	35.5	0.1	1	87	2295	2366	2295	2366	0.79
18	29	2.2e-12	6e-09	36.4	0.3	1	87	2418	2488	2418	2488	0.81
19	29	9.7e-13	2.7e-09	37.6	0.1	1	86	2523	2597	2523	2598	0.80
20	29	3.8e-13	1.1e-09	38.8	0.0	1	86	2608	2681	2608	2682	0.80
21	29	7.1e-11	1.9e-07	31.6	0.0	1	85	2707	2779	2707	2781	0.69
22	29	0.00013	0.35	11.5	0.2	1	58	2810	2860	2810	2885	0.78
23	29	3.7e-11	1e-07	32.5	0.9	1	86	2900	2971	2900	2972	0.79
24	29	3.4e-16	9.3e-13	48.6	0.2	1	86	3084	3156	3084	3157	0.81
25	29	2.5e-12	6.8e-09	36.3	3.5	1	86	3220	3290	3220	3291	0.80
26	29	1.6e-14	4.5e-11	43.2	4.6	1	86	3383	3453	3383	3454	0.84
27	29	3.2e-12	8.9e-09	35.9	0.2	1	86	3535	3604	3535	3605	0.85
28	29	2.3e-10	6.3e-07	29.9	0.5	1	58	3630	3678	3630	3686	0.83
29	29	1.3e-10	3.5e-07	30.8	2.0	17	87	3695	3754	3685	3754	0.74

Sequence Information

Coding Sequence: ATGTCACAACACAACCCCAATCACGCCCACCCACACTACCACTACCCGTCCCATACGACGCCGCTggctctgcagcagcagcagcatcaacagcagcagcagccgcagcacgGCAGTAGTTGGTACTCACATGTTGCTTCCTACCCAGCAGCCTCGGCCTCCCACTCCCACCCCCTCTCACACTCGGCCTTTGGCCCTGCGCCCCCTTGCAAGgccagcatcagcaacaacaactccaACAACATTATGGGCACCTACGGAGGAGGAGTGGGAGGGGGTGGAGGCTCGCATGGATATTTCGGCGCCGCTGGCGGTGGCCTCAATGTCAGCGGGGCGGGGGGTGCTGCTGGGTCGTCCTACGGCCTTGGGGCCAACACGGTGGCATATGCTCACAACCAACTGCTACAGTaccagcatcatcatcagcaaaaccagcagcagcagcagcagcacctgggCCTAGGCCACCGATCCTATATGGGCCACGATGTCATGGCCGGAAGCTATCCCTATATCAAAAGCGAACCCTTGGAGGGGTTCCAACAGCCGCCGAATCCAATGGCTCCACCCCCGGCCCCAGAAATGATGATAAAATcGGAGCCCATTGACGACCTGGCCTACAAGTCAAACTACATAGACGACAATACGCCATTTGCGGACTTCAGCAAGTTTAGCGAATTCAGCGAGGACATGCTGAGTCCCAAAGTCGAGCTGACTGTTAAGGATGAGTCCTTTGTCAGGAACCCTAATAGCTTTTTACGCCGCAAGCAACAATCGGATCTGGCGACAGCTGAGAGCCTACCCGTCTGCCAGCGATGCAAGGAGGTGTTTTTCAAAAAGCAGACTTACCTGCGGCACGTCGCGGAGAGCAACTGCGGCATCCAGGAGTACGACTTCAAGTGCACCATATGCCCCATGTCCTTCATGACCGCCGAGGAATTACAACAGCATAAGCAACTGCATCGAGCGGACAGGTTCTTCTGTCACAAGTACTGTGGAAAGCACTTCGGTACGATCGCTGAGTGCGAGGCGCACGAGTACATGCAGCACGAATACGAAAACATTGTGTGCAACATGTGCTCGGGATCTTTTGCCACGCGGGAACAACTGTATGCCCACTTGCCACAGCACAAGTTCCAGCAGCGCTTCGACTGCCCCGTATGCCGCCTGTGGTACCAAACGGCTCTGGAGCTGCACGAGCACCGCCTAGCTGCACCCTACTTCTGCGGTAAATACTACACGGTTGGACAATCCCCGTCCCCGTCctcacagcagcaacaacatcagaGCCAGACGAACTACAAGCTGCAGGACTGTCATATGGCCACCATGGAAATGCCAAACGCACCGCTCCTTAAGGCGAACTCATCTAACACGCCTGCCTTGCCTGCGACAGCAGCACTTAATTCACTGCTTCAGCAGCGTCAGGCCAATGCTGATGGAGCGGCTATTTTTGCCGCGTCTTCGCTGAAGAACGATGTCGCTGTGAAACTGGAGCGCAGCTACAGTAACTCGACCAATGAATCGTCTTATAGCGTCCAGGAGAGCGGCTACAATAATGTGTAtggcagcagcgacagctCAGTCCACGGTGCCATCGCCGGACCACAGGCACACTCCTCGACGCTGGACGACTCCGAGGATGCGTTGTGCTGTGTGCCGCTGTGCGGCGTGCGGAAGAGCACGAGTCCCACCTTACAGTTTTTTACGTTCCCGAAGGATGAAAAGTATCTCAACCAATGGTTGCATAACCTCAAGATGTTCCACATACCCGCTTCCAGCTACGTTAGTTTCCGGATCTGCAGCATGCACTTCCCCAAGAGATGCATCAACCGCTACTCGCTGTGCTACTGGGCGGTGCCGACGTTTAACCTCGGACATGATGATGTTGCCAATCTCTACCAGAACCGGGAGCTTACCAACACCTTTACAACAGGCGAAGTGGCGCGCTGCAGCATGCCCCACTGTACCAGCCAGCGGGGTGAGAGCAACCTCAAGTTTTACAACTTCCCAAAGGACATCAAAAGCTTGATTAAGTGGTGTCAAAACGCTCGACTCCCGGTGCAGGCGAAGGAGCCGCGACACTTCTGCAGCCGCCACTTCGAGGAGCGGTGTATTGGCAAATTCCGCCTCAAGCCTTGGGCGGTGCCCACATTGCACTTGGGCGCCCAGTACGGCAAGATCCACGACAATCCGAAGAACCTATACGTGGAAGAGAAACGCTGTTGCCTCAACTTTTGCCGTCGAAGCCGCTCGTCTGATTTCAATATGTCGCTATATCGATTTCCTAGAGACGAAGTCCTGCTACGTCGCTGGTGCTACAATCTTCGCTTAGATCCGGGAGTTTATCGCGGGAAGAATCACAAAATATGCAGCGCCCACTTTATAAAGGAGGCGTTGGGTCTCCGTAAGCTATCTCCTGGTGCCGTACCCACACTTCATCTGGGCCATAATGATACCTTCAATATCTACGAGAACGAACTGTGGCCACCGCCAACACCGACACCCTCCTCCTGTCAactccaacagcagcaacagtcttCTTTGCATTCGCTACAACAGCAGATGCACAGCAAGTCCTACCATCGCCGTTCGGTGGCTTCCACATCGTCATCGGCAAGCTCCGCAGCTTCGCATTATGTGGACCCAGAAATGAGCGCCTCTTATCATCTTGCCATGTCCGCCTCCGCAGGTGGCTCTGCGACTATAAACGCTAGCGACAGCATGGACGTCTGTTGCGTGCCCAGTTGTGAGAGCAAGCGACACAACAGCGAGAACATTACATTCCACACGATTCCGCGACGGCCCGAGCAGATGCGCAAATGGTGTCACAATCTTAAGATTCCCGAGGACAAGATGCACAAGGGTATGCGAATCTGTAGCCTTCATTTCGAGCCATACTGCATCGGCGGCTGTATGCGACCGTTTGCTGTGCCAACTCTTAACTTGGGCCACGACGACGAGGACATCCACCGCAATCCGGATGTGATCAAGAAGCTGAACATCCGGGAGACGTGCTGTGTAGCTGTGTGTAAGCGGAATAGGGACAGGGACCATGCCAACCTGCATCGTTTCCCTAGCAACGTGGCGTTACTGAAGAAATGGTGCGCCAATTTGCAGCGGAGCGTGCCTGATGGCAGTAAACTTTTCAATGATGCCATTTGTGAGGTGCACTTTGAGGATCGTTGCCTACGCAACAAGAGGCTGGAGAAGTGGGCAGTGCCTACTCTGATCCTGGGACACGACGACATCGCCTATCCGCTGCCCACACCAGAACAGGTGACCGAATTCTATGCTCGGCCCACAGCTCCCAATAATGGTGAGGAACAGGGCGAGTGCTGTGTGGAGACCTGCAAGAGGAATCCCAGCGTCGACGATATCAAGCTTTACCGCCCTCCAGAGGAGGCCGCCGTGCTAGCCAAGTGGGCGCATAACCTTCAAACGGACGCCAACCAACTGACAAGCATGAGGATCTGCAACCTTCACTTCGAAGCACATTGCATCGGAAAGAGAATGCGGCAGTGGGCCATACCGACTTTGAATCTAGCCGGCAACATTGAAAATCTTTACGAGAACCCAGAGCAATCGTTGCTGTACAGGCGACGCACGACTCACTTGAAGGCGAAGCTGCCGCCAGCCTCTGTGAAACCCACCTGGGTGCCCAGGTGCTGTCTTCCACACTGTCGCAAAGTCAGAGCCCTGCACAATGTCCAGCTTTATCGCTTCCCCAAGCTCAATCGCTCCACATTGGCCAAGTGGGCGCATAATCTCCAAGTTCCAATAGTGGGCAGTGCACAGCGTAGGCTATGTTCGGCCCATTTCGAACCGCATGTGCTTAGCAAAAAGTGTCCGGTGCCGCTGGCGGTGCCTACGCTCGATCTAAATTCACCACCCGGCTTGAAAATCTACCAGAATCCAGCCAAGCTAAAGGCCAGCAAACTCTGCCTGCAACGGGTTTGCATCGTCGAAAGCTGCCGGAAGACGCGGGCACAGGGCGTTCAGCTTTTCCGGCTGCCGCATAGCCCCACACAGCTGCGGAAGTGGATGCACAACATAAGGACACGGCCCAGAGCAGCTATGCGGGCTCAGTACCGGGTCTGTTCCCGCCATTTCGAGACGCACTCATTCAATGGCCGAAGACTGAGTGCAGGTGCCATTCCGACTCTAGAACTGGGCCACGATGATGACGATATCTATCCCAATGAAGCGCAGGCATTTGTGGACGAGCATTGTGCTGTCGAGGGCTGCGAAGCATCCAAGGAGCAGCCGGAGGTGCGACTGTTCCGCTTCCccaccgacgacgacgataTGTTGTGGAAGTGGTGCAACAACCTCAAAATGAATCCTGTGGATTGCATTGGGGTACGTATCTGCAACAAGCACTTCGAGGCTGATTGCATCGGTCCTAAACACCTGTACAAGTGGGCCATTCCTACGCTGGAGCTGGGCCACGACGACGCGCAGATCGAGCTGATCCCAAATCCGAAACCAGAGGAGAGATATGTGGATCCCGTCTTCAAGTGCATCGTACCCACCTGCGGCAAGACTCGACGGTTTGACGAGGTGCAAATGAACAGCTTCCCCAAGGACCCGGATCTATTTCAGAGATGGCGGCACAATCTGCGTCTGGATCATCTCAGTTTTCAGGAGCGTGAGCGCTACAAGATCTGCAATGCCCACTTTGAGGAGATCTGTATTGGAAAGACACGCTTAAACATCGGATCCGTTCCAACCTTGGAACTTGGTCATGACGATGAGGATGATATTTTCCAAGTGAATCCAGCTGAGCTGCAGAGCAATTTATTCGGGCGGCAGCGTCGCCTGCTGCTCGAGGGATCCGGCGAGCTGAGTGTTAAGCAAGAGCTGTCCGAGACAgaggacaacaacaaagcgGATGTGGAGGCCACAGGCTCCCATTCCAAGCAGGTGAAAATCAAGAGATCTACTTCGGATCTAAAGTGTTGTGTGCACAGTTGTGGAAGAAGTCGCTTGGAGCACGGGGCCCGCCTCTTTCCCTTTCCCACGGGCAAACAGCAGCACCTTAGGTGGCGTCACAATCTGCACCTGGAACCAGAGGAGGTGGACCGATCGACGCGCGTTTGCAGCGCTCACTTTAATCGACGTTGCATCGAGGGTAAACAACTGAGGAGCTGGGCGATGCCCACCCAACAGTTAGGGCACAACGACCAACCGATCTACGAGAACCCAAAGAACATACCCGGTTTCTTCACACCTACCTGTGCCCTGGGACACTGTCGCAAGCGAAGGAGTATTGACAACGATCTGCGTACCTATCGGTATCCTAGGAGCGAAGATCTCCTGGAAAAATGGCGAGCTAACCTACGACTGGCTCCGGATCAGTGTCGTGGTAGGATCTGTGCAAACCACTTCGAACCGCAAGTACGGGGCAAGCTAAAGTTGAAGACGGGAGCGGTTCCCACACTACAACTGGGACACGATGAGGGATTAATCTATGACAATGAAGCTATTAAGGCGGGCATGGCCGAAGAAGAGGAAGGCATAACCACAGAGTTCCCGCGactgaaaccaaaaaaagaggtgttcgaagaggaggaggaggcgggcgAAGGGAATGATGGCGAGCAGATGCACCCAGATGACCTGGACGATAATGCCGATGAAGAAGACAAAGATGAACATTATTTTGATCCTCTTGAACTAGTAGAGACTTTTGCTGAGCATCGCAGCGATGACGAAGCCCAAGAATATGAGGATGAAGAAGACGAGGGTCGAGTTGAAGAATTTCCCTCCGGGTACGATGTCAAGGAGGAGATAGAACAGCTTCCGAGTTCCCCACCTTCACCTCTTCGCCGACGGCAACCAGTTCCGCGTCGAGACAAGCCGGCTAACAATGTTACGCCCATTTGCTGCTTGAAGCACTGCAGGAAGGAACGCACTGCTTTCCACCTGTTGAGCACTTTCGGCTTCCCAAAGGATCGCCAGTTGCTGCTAAAGTGGTGTGTCAATTTGCACCTAAACCCGGACGACTGTATCGGTAGGGTTTGCATTGAGCACTTCCAGCCGGAGGTACTCGGCACCCGTAAGCTCAAGCAGAATGCAGTGCCCACTCTTAATGTGGGACATGAGGAACCGCTTAGGTACTCGTGCCATGGCGTGGACCAGAATGTCGAGGAGCGGGACCCCCAGCCACAGCATTCGGTTTTTCGGCTTTGGAGCCTGAAACACTGCCGGAAAAGGAAGCTAACGGAGCCACCGGATATTCCCCTAGCCAAGAGGAGAGTGCTGGAGATGCCGATGATGAAGCGGGAGTGGGAGATGGAGATGCCGATACCGATGCCGATGGTGATGAAGGGGAAGAAGGGGGCAAAGAATATGACTCAAACTGAAAGTGAGTCACATATATGCTGTATCAGCAAGTGCGGAAACCAAGAAGTTAGCCAATTGCTGGCTTTTCCCGAAGATAAATCGCTTCTAAAAAAGTGGAGCCATAATTTAAGGCTGCCCACTGAGACTGACCTCACTTCTCTAAGCCTGAAAAGAGTTTGCTTGTCACACTTCGAATCGCAGCTGTTGGAGAATGGAAAGCTCACTAAGGAAGCAGAGGCTGTGCCCACTTTGAACCTTGGCCACGGCAGCTGGAACCTATACAGGAGCAATGGGATCTGTCTAGTGCCTGAATGCAGCCACAATACCTTCGGACGCTTAAGCTTCATCGACCTACCAAATAACAGCATAATTAGGGACTCTTGCTTCTCCAGCCTCAACCTACCTGAACCCTGCGAAGATCAGGCAAGACTATGTAGTAGCCACTTTATGGAGGCATACAAGAAGTGTAATCTTCCTAAAGTTCTGCATCCGCAAGTCATAATGGCGTTACAAGGTGCTGTGGACGAGTTGCAATGTGCAGTGCCCGGCTGTTGTTATAAAGATGCTGATCCGGATTGTTACCTAATCCAGCTTCCCAATAACAAGGAGGTGCTGTCGAAGTGGCTGCATAACATCAAGGTCTCCTATGATCTTTCTAGGCACCAAAGCTATCGCATCTGCACGATCCACTTTGAATCAGAGTTCTTAGATACGAATGGTCCGCTAAAAGGGGCTATGCCAACGCTCCATCTAAACCATGAAGATGAGATTCACTTGAATACTAGGTCTTTGCCAGAAGAGCAGGACTCTATATTGACTCCACTGCGGATTAAGACGGACCTGGCCTTCCTGGGCAGTCCCTGTGCAAGTGCAAGTCCCAGTCCCCGGGGCAGGATCCGGATATGCTGCATTCCCACATGTGGACAGTTTGGAAGCAGTCAAGTGAGGCTGTATCGTTTTCCCACCGAGGAGCAGGCGTTGCTTCGGTGGCTTGTGAACACACAACAGCAGCCAAGACTGGTAGATCCCATGGACTTGTATGTGTGTCAGTCGCATTTTGAGCCCGAGGCCATTTGCATGAAGCAACTTCGAAGCTGGGCTGAGCCCACCGTAAACCTGGGACACGACGGTTATGTAATTCCAAATGCCAAACACAATGGAAATATTTCCGACAGCCAAGAAACTGAAGAAGCAATGAGGTTTATTCGCGAACGTTTCTGTTCCGTCATCTCTTGCTTTCAGGCAGGAGGACAAGAGGAGGAGGGAGTGAGGCTATTTGATTATCCCGAGGATATGGCGACTACTCGAAAGTGGGCAGCCGCATGCAGACATCGCTCCATGCAGGCCAGGAGCCATGGGTTCAAGGTGTGCCAGTTGCACTTCGATAAGGAATGCTTTGACCCCAATACTGGAGAATTGATTGAGGGCGCTGTGCCCACTCTGGAGTTGAGCAGAGATGAAATGGAGAGGCAATGTCTTGTAACTGGAtgtgtaaaaaataatgccaATGGAACCCGCCTTCGCTACTTTAAGATACCAAAGGTTGCTGCCCAATTGGAAGCGTGGAGCAACAACCTTAAAGTCCATCCAACGGATCTCATGCAAGGAGAGCACCAGTACATCTGCGAGAAACACTTTGAGGCGTTCTGCTTCGGGGCCAATAAAGGACTGCGTTCTGGTGCTCTTCCAACACTCCTGCTAGGCCATGAAGAAGATGTGGATATGCTTCCAAATCCGGAAAGCCTCTTGTGCCAGAATAAGATGGATAAGTGCTGCGTACCAGGCTGCGGGCGTGTCTGGCAAACTGGGGACCGTAAGTTTCGCGGATTTCCCAAATTATTGGCCATGGCCAAAAAATGGAGGCATAACCTTCGCTTGGTAGTGCCCGTGGATCAGCTCGGCAAGCTGAAGGTCTGCAGTGCTCACTTTGAAGCCACCTCACCTAACCTGGGTACAAATGGACTAAGTTCTAGTACCTCGATACCAACCCTGGAATTGGGTCACTCTTCTCCGGATATTTACCCAGCGGACATCAGCCTTAAGTTCCAAAAACGGTCCGGAATGCCGGcgaaaatttattgttgttatccCAAGTGCGAGGAAACGTGTTTGCCCAAGAATCTTTCTTACGGGCTTCCCCAGGAGGAGCACCTGAGGAATGACTGGCTAAGCCATATGGACATAGAAGATCCAAAAGACGAAGGAGTCGCACTGCTTTGCCCGCTGCACTATGTTATCCTATACCAGCATAGTGCCACCCACTATCCGGAGCATCATGCCTCAAGCCGAATGCTTCTGGATGACAATTACAAGGAAGCACGGAACAACAGGCGTGTGAAGATTGTGAGTTGTACGATCAAGGGCTGCGACATGGTTAAGCCCCGGGATGGGGTACCACTGCACGGGATGCCGCAAAGCAAAGACATTCTGCAGATGTGGATTGTCAATGGCCAGATTGAGTTCTCAGAGCAACAGCGGTATATGTTCAAGGTGTGTCACAATCACTTTGAGACATGCTGCTTCTTCGACGACAGACGTTTGCACTCCTGGAGTGTGCCTACTTTGCGTCTACCTGGCGAGGTAATTCATCAAAATCCAACCGCCGAGCAGTGGCAGAACATAATCATCAAGCAGGGAGCAGCGAAAACATACGCAGAAGAGAGCGAGGAGCCAGATCCATATGGGGATGTGGTTAAAACTGAGCCCATAATAAAGATGGAGCATATCGAATCTGAGTATGAAGATGAAAACCCCGAGATGCAGGCCCTAGAGGTCCTCCTAGAAGTTGGCCATGTCGAGCGAATGGAGAGCTATGAAAAAATGGATAAATCACCGTTGATCTACACCGATAATGCACCTTTTCGATCTTCACCCATACGTTGCCAATACAATGCTAATCACTGTGCCGTAGAAGGCTGCGAGGTCACTGTCGAAGATGTGGATGGAACGATTAAGCTACACAAATTCCCCGCGTCGCCGGATGCCGCACAGAAGTGGATGCACAACACCCAAGTTGACATGGACGAAAAGTTCTGGTGGCGCTACCGCATATGCAGTTACCACTTTGATCAAGAGTGCTTTCAGAGTGCTAGAATTCGAAAAGGCGCAATGCCAACGCTTTTGCTAGGACCTCGGCGACCGGACAAGGTGTACGATAATGAGTTTTCACTACCAGATGGGGAAGAGCCTTTTCCAGAGCCACCGGAGACTCAGCTTGAGGAAAGTACGACTGTAGCGTCCAGAGTTCGAAAGGAGGTGTCCAATTTATGCCTGCCCCCACGGGCGCCGCCTCGAAAGTCAAGCAAGTTTTGCCAGATTGATTCCTGCACGAACCACCTGACTACCGAGAACATGACTCTTCACAAGTTTCCCCACTCGGAGGACATGTGCCTCAAGTGGCAGCACAACACACAAGTCCCATTCGACCCCTACTACCGTTGGCGTTACCGCATTTGCAGTGCGCACTTTCATCCGGTGTGTTTGGTCAACATGCGTCTAGTCCATGGAAGCGTTCCCACTTTGAAGCTGGGTCCCAAGGCTCCGTCCGAGCTGTTTGACAACGATTTCGAAGCCATTAACCTAAGGTTGGATAAAAGGTTGACCGAGTCCAATGCTAATGTGTATATCAAGCatgaaaaaagggaggaggaTGAAGATTCAATAATGTTCCTGGAGCCCGAGCTCCAGTTAAACGAGGATCAAGACGATAAGACGTCAAGTTGGAACAGTAAACTGCAATTACCACATGTGAAGCAagagaaaattatatacagCCAGATTAAGTCTGGCTATGATAAGTGTTCCCTGGCTCACTGCCAGCGCCAAAGGTCCCAGCATGGCGTCCACATTTATAAGTTTCCCAAATCGAGGCGTCAACAGGAGCGTTGGATGCACAATCTACGCATCCGCTATGATGAGCGGACACCGTGGAAATTCATGATCTGCAGCGTTCATTTCGAGCCGCACTGTGTCAGCCTGAGAAAGCTGCGACCTTGGGCCGTACCCACACTGGAACTGGGTGACAATGTACCAGAGACAATATTTTCGAACGAACAGTGCGAGAAGGAGCTGGTGACCGATCGCAGTGATCTGGATAGCGACGCAGAGGAAGAAGACGGCTTACaggaggacgacgatgatgaggacGAAGACGAAGATATGAAGCCAGATGTTATTGGCATAAAAAGGAGGAGTCGTTTTAAGATGGATTCAACCTGTCCTTCTAGCCAGATTCCACCCTGGAAAGTGAAACAATGCTGCCTCCCCTATTGCCGTGCCTTTCGAGGGGATGGCATCAAGCTGTTTCGGCTTCCAAACAACCGAAACTCCATTAGCAACTGGGAACGGGCCACCGGAATGGTATTCAAAGAGTCGCAACGGAACACTCGTCTGATCTGCAGCCGTCACTTCGAGCCAGAGCTGATTGGAGTCAGGCGTCTAATGCGTAACGCCATTCCCACGAAGCACTTGAGCCCTCAATCAGTTGACCAGATTCGTACTAAAAGGGAGAAAAATCCTCCAGCCACTATTATACccatctgctgcatggcggaCTGCCACTACAACGGAAATGTGAAGCTGCACAAGTTTCCAAGTGATCCTACCCTTCTCAGACAGTGGTGCCAGGCTCTCCGGCTCACTGATACGCAACGGTATTTGGGCAAGCACATTTGCTCCATGCACCTGCCAATGAACAAGACCTTGAGCTGTGTCGTCTGCGGTGGGGACAGCGTAGAGTTGCCGATGCTAAAGTTTCCGGAAAACCGCAACCAGCGCGCCAAATGGTGTTACAATCTCAAAATTGATACAATACCAAAGTGGGACCACTCCAAGCACATTTGCTGCCGGCACTTTGAGTCCCATTGCTTTGACAAGCCGGGTGAGCTACGTCCAGGAGCGGCTCCCACGCTCCATCTCAACCACGATGACACAAACATATTCTTCAGCGACTATGCCACTGGTCTTCCGTCCTCGCCACTAGGCAATCGAATCAAAGACGAGCCCCTGGAATCGGAGTCAGACGAGATGCTGCTGGTGTAG
Protein Sequence: MSQHNPNHAHPHYHYPSHTTPLALQQQQHQQQQQPQHGSSWYSHVASYPAASASHSHPLSHSAFGPAPPCKASISNNNSNNIMGTYGGGVGGGGGSHGYFGAAGGGLNVSGAGGAAGSSYGLGANTVAYAHNQLLQYQHHHQQNQQQQQQHLGLGHRSYMGHDVMAGSYPYIKSEPLEGFQQPPNPMAPPPAPEMMIKSEPIDDLAYKSNYIDDNTPFADFSKFSEFSEDMLSPKVELTVKDESFVRNPNSFLRRKQQSDLATAESLPVCQRCKEVFFKKQTYLRHVAESNCGIQEYDFKCTICPMSFMTAEELQQHKQLHRADRFFCHKYCGKHFGTIAECEAHEYMQHEYENIVCNMCSGSFATREQLYAHLPQHKFQQRFDCPVCRLWYQTALELHEHRLAAPYFCGKYYTVGQSPSPSSQQQQHQSQTNYKLQDCHMATMEMPNAPLLKANSSNTPALPATAALNSLLQQRQANADGAAIFAASSLKNDVAVKLERSYSNSTNESSYSVQESGYNNVYGSSDSSVHGAIAGPQAHSSTLDDSEDALCCVPLCGVRKSTSPTLQFFTFPKDEKYLNQWLHNLKMFHIPASSYVSFRICSMHFPKRCINRYSLCYWAVPTFNLGHDDVANLYQNRELTNTFTTGEVARCSMPHCTSQRGESNLKFYNFPKDIKSLIKWCQNARLPVQAKEPRHFCSRHFEERCIGKFRLKPWAVPTLHLGAQYGKIHDNPKNLYVEEKRCCLNFCRRSRSSDFNMSLYRFPRDEVLLRRWCYNLRLDPGVYRGKNHKICSAHFIKEALGLRKLSPGAVPTLHLGHNDTFNIYENELWPPPTPTPSSCQLQQQQQSSLHSLQQQMHSKSYHRRSVASTSSSASSAASHYVDPEMSASYHLAMSASAGGSATINASDSMDVCCVPSCESKRHNSENITFHTIPRRPEQMRKWCHNLKIPEDKMHKGMRICSLHFEPYCIGGCMRPFAVPTLNLGHDDEDIHRNPDVIKKLNIRETCCVAVCKRNRDRDHANLHRFPSNVALLKKWCANLQRSVPDGSKLFNDAICEVHFEDRCLRNKRLEKWAVPTLILGHDDIAYPLPTPEQVTEFYARPTAPNNGEEQGECCVETCKRNPSVDDIKLYRPPEEAAVLAKWAHNLQTDANQLTSMRICNLHFEAHCIGKRMRQWAIPTLNLAGNIENLYENPEQSLLYRRRTTHLKAKLPPASVKPTWVPRCCLPHCRKVRALHNVQLYRFPKLNRSTLAKWAHNLQVPIVGSAQRRLCSAHFEPHVLSKKCPVPLAVPTLDLNSPPGLKIYQNPAKLKASKLCLQRVCIVESCRKTRAQGVQLFRLPHSPTQLRKWMHNIRTRPRAAMRAQYRVCSRHFETHSFNGRRLSAGAIPTLELGHDDDDIYPNEAQAFVDEHCAVEGCEASKEQPEVRLFRFPTDDDDMLWKWCNNLKMNPVDCIGVRICNKHFEADCIGPKHLYKWAIPTLELGHDDAQIELIPNPKPEERYVDPVFKCIVPTCGKTRRFDEVQMNSFPKDPDLFQRWRHNLRLDHLSFQERERYKICNAHFEEICIGKTRLNIGSVPTLELGHDDEDDIFQVNPAELQSNLFGRQRRLLLEGSGELSVKQELSETEDNNKADVEATGSHSKQVKIKRSTSDLKCCVHSCGRSRLEHGARLFPFPTGKQQHLRWRHNLHLEPEEVDRSTRVCSAHFNRRCIEGKQLRSWAMPTQQLGHNDQPIYENPKNIPGFFTPTCALGHCRKRRSIDNDLRTYRYPRSEDLLEKWRANLRLAPDQCRGRICANHFEPQVRGKLKLKTGAVPTLQLGHDEGLIYDNEAIKAGMAEEEEGITTEFPRLKPKKEVFEEEEEAGEGNDGEQMHPDDLDDNADEEDKDEHYFDPLELVETFAEHRSDDEAQEYEDEEDEGRVEEFPSGYDVKEEIEQLPSSPPSPLRRRQPVPRRDKPANNVTPICCLKHCRKERTAFHLLSTFGFPKDRQLLLKWCVNLHLNPDDCIGRVCIEHFQPEVLGTRKLKQNAVPTLNVGHEEPLRYSCHGVDQNVEERDPQPQHSVFRLWSLKHCRKRKLTEPPDIPLAKRRVLEMPMMKREWEMEMPIPMPMVMKGKKGAKNMTQTESESHICCISKCGNQEVSQLLAFPEDKSLLKKWSHNLRLPTETDLTSLSLKRVCLSHFESQLLENGKLTKEAEAVPTLNLGHGSWNLYRSNGICLVPECSHNTFGRLSFIDLPNNSIIRDSCFSSLNLPEPCEDQARLCSSHFMEAYKKCNLPKVLHPQVIMALQGAVDELQCAVPGCCYKDADPDCYLIQLPNNKEVLSKWLHNIKVSYDLSRHQSYRICTIHFESEFLDTNGPLKGAMPTLHLNHEDEIHLNTRSLPEEQDSILTPLRIKTDLAFLGSPCASASPSPRGRIRICCIPTCGQFGSSQVRLYRFPTEEQALLRWLVNTQQQPRLVDPMDLYVCQSHFEPEAICMKQLRSWAEPTVNLGHDGYVIPNAKHNGNISDSQETEEAMRFIRERFCSVISCFQAGGQEEEGVRLFDYPEDMATTRKWAAACRHRSMQARSHGFKVCQLHFDKECFDPNTGELIEGAVPTLELSRDEMERQCLVTGCVKNNANGTRLRYFKIPKVAAQLEAWSNNLKVHPTDLMQGEHQYICEKHFEAFCFGANKGLRSGALPTLLLGHEEDVDMLPNPESLLCQNKMDKCCVPGCGRVWQTGDRKFRGFPKLLAMAKKWRHNLRLVVPVDQLGKLKVCSAHFEATSPNLGTNGLSSSTSIPTLELGHSSPDIYPADISLKFQKRSGMPAKIYCCYPKCEETCLPKNLSYGLPQEEHLRNDWLSHMDIEDPKDEGVALLCPLHYVILYQHSATHYPEHHASSRMLLDDNYKEARNNRRVKIVSCTIKGCDMVKPRDGVPLHGMPQSKDILQMWIVNGQIEFSEQQRYMFKVCHNHFETCCFFDDRRLHSWSVPTLRLPGEVIHQNPTAEQWQNIIIKQGAAKTYAEESEEPDPYGDVVKTEPIIKMEHIESEYEDENPEMQALEVLLEVGHVERMESYEKMDKSPLIYTDNAPFRSSPIRCQYNANHCAVEGCEVTVEDVDGTIKLHKFPASPDAAQKWMHNTQVDMDEKFWWRYRICSYHFDQECFQSARIRKGAMPTLLLGPRRPDKVYDNEFSLPDGEEPFPEPPETQLEESTTVASRVRKEVSNLCLPPRAPPRKSSKFCQIDSCTNHLTTENMTLHKFPHSEDMCLKWQHNTQVPFDPYYRWRYRICSAHFHPVCLVNMRLVHGSVPTLKLGPKAPSELFDNDFEAINLRLDKRLTESNANVYIKHEKREEDEDSIMFLEPELQLNEDQDDKTSSWNSKLQLPHVKQEKIIYSQIKSGYDKCSLAHCQRQRSQHGVHIYKFPKSRRQQERWMHNLRIRYDERTPWKFMICSVHFEPHCVSLRKLRPWAVPTLELGDNVPETIFSNEQCEKELVTDRSDLDSDAEEEDGLQEDDDDEDEDEDMKPDVIGIKRRSRFKMDSTCPSSQIPPWKVKQCCLPYCRAFRGDGIKLFRLPNNRNSISNWERATGMVFKESQRNTRLICSRHFEPELIGVRRLMRNAIPTKHLSPQSVDQIRTKREKNPPATIIPICCMADCHYNGNVKLHKFPSDPTLLRQWCQALRLTDTQRYLGKHICSMHLPMNKTLSCVVCGGDSVELPMLKFPENRNQRAKWCYNLKIDTIPKWDHSKHICCRHFESHCFDKPGELRPGAAPTLHLNHDDTNIFFSDYATGLPSSPLGNRIKDEPLESESDEMLLV

Similar Transcription Factors

Sequence clustering based on sequence similarity using MMseqs2

100% Identity: iTF_00525910;
90% Identity: iTF_00594581;
80% Identity: -