Basic Information

Insect: Drosophila suzukii
Gene Symbol: -
Assembly: GCA_013340165.1
Location: WWNF01000001.1:14187969-14204773[-]

Transcription Factor Domain

TF Family: THAP
Domain: THAP domain
PFAM: PF05485
TF Group: Zinc-Coordinating Group
Description: The THAP domain is a putative DNA-binding domain (DBD) and probably also binds a zinc ion. It features the conserved C2CH architecture (consensus sequence: Cys - 2-4 residues - Cys - 35-50 residues - Cys - 2 residues - His). Other universal features include the location of the domain at the N-termini of proteins, its size of about 90 residues, a C-terminal AVPTIF box and several other conserved residues. Orthologues of the human THAP domain have been identified in other vertebrates and probably worms and flies, but not in other eukaryotes or any prokaryotes [1].
Hmmscan Out: # of c-Evalue i-Evalue score bias hmm coord from hmm coord to ali coord from ali coord to env coord from env coord to acc

1 29 4.9 7.2e+03 -2.3 2.2 44 62 324 345 305 359 0.59

2 29 3.4e-15 5e-12 46.3 3.9 1 86 552 624 552 625 0.85

3 29 1.4e-14 2.1e-11 44.3 5.0 1 87 652 721 652 721 0.83

4 29 1.3e-15 1.9e-12 47.6 0.2 1 87 743 815 743 815 0.85

5 29 5.8e-16 8.6e-13 48.7 5.5 1 87 913 983 913 983 0.82

6 29 1.7e-14 2.5e-11 44.0 2.8 1 86 1007 1078 1007 1079 0.82

7 29 4.4e-13 6.4e-10 39.5 1.1 1 87 1114 1182 1114 1182 0.80

8 29 1.1e-10 1.7e-07 31.8 1.4 1 86 1222 1291 1222 1292 0.76

9 29 6.2e-17 9.1e-14 51.8 0.4 1 86 1319 1388 1319 1389 0.83

10 29 2.5e-13 3.7e-10 40.3 1.7 1 85 1410 1478 1410 1480 0.80

11 29 3.9e-14 5.8e-11 42.9 0.4 1 86 1507 1578 1507 1579 0.85

12 29 6.8e-13 1e-09 38.9 3.1 1 85 1655 1723 1655 1725 0.82

13 29 2.2e-12 3.2e-09 37.3 0.1 1 86 1748 1816 1748 1817 0.81

14 29 3.5e-13 5.2e-10 39.8 2.2 1 87 1950 2019 1950 2019 0.79

15 29 6.6e-10 9.7e-07 29.3 0.1 1 86 2121 2187 2121 2188 0.77

16 29 0.00036 0.53 10.9 0.0 1 59 2203 2248 2203 2264 0.80

17 29 2.4e-14 3.5e-11 43.6 1.4 1 87 2277 2347 2277 2347 0.84

18 29 4.4e-13 6.4e-10 39.5 0.6 1 87 2406 2476 2406 2476 0.83

19 29 3.3e-11 4.8e-08 33.5 0.2 1 86 2511 2582 2511 2583 0.81

20 29 5.3e-13 7.8e-10 39.2 0.0 1 86 2593 2664 2593 2665 0.80

21 29 6.1e-12 8.9e-09 35.8 0.0 1 86 2689 2759 2689 2760 0.79

22 29 0.0011 1.6 9.4 0.0 1 58 2793 2840 2793 2860 0.79

23 29 2.1e-13 3e-10 40.5 0.5 1 87 2878 2951 2878 2951 0.82

24 29 8.2e-16 1.2e-12 48.2 0.3 1 86 3063 3135 3063 3136 0.81

25 29 2.4e-12 3.5e-09 37.1 2.8 1 86 3197 3267 3197 3268 0.80

26 29 4.5e-14 6.6e-11 42.7 4.4 1 86 3368 3438 3368 3439 0.85

27 29 2.8e-11 4.1e-08 33.7 0.1 1 86 3521 3590 3521 3591 0.83

28 29 1.8e-10 2.7e-07 31.1 2.0 1 58 3615 3663 3615 3678 0.83

29 29 3.3e-10 4.8e-07 30.3 1.9 17 87 3680 3739 3670 3739 0.74

#	of	c-Evalue	i-Evalue	score	bias	hmm coord from	hmm coord to	ali coord from	ali coord to	env coord from	env coord to	acc
1	29	4.9	7.2e+03	-2.3	2.2	44	62	324	345	305	359	0.59
2	29	3.4e-15	5e-12	46.3	3.9	1	86	552	624	552	625	0.85
3	29	1.4e-14	2.1e-11	44.3	5.0	1	87	652	721	652	721	0.83
4	29	1.3e-15	1.9e-12	47.6	0.2	1	87	743	815	743	815	0.85
5	29	5.8e-16	8.6e-13	48.7	5.5	1	87	913	983	913	983	0.82
6	29	1.7e-14	2.5e-11	44.0	2.8	1	86	1007	1078	1007	1079	0.82
7	29	4.4e-13	6.4e-10	39.5	1.1	1	87	1114	1182	1114	1182	0.80
8	29	1.1e-10	1.7e-07	31.8	1.4	1	86	1222	1291	1222	1292	0.76
9	29	6.2e-17	9.1e-14	51.8	0.4	1	86	1319	1388	1319	1389	0.83
10	29	2.5e-13	3.7e-10	40.3	1.7	1	85	1410	1478	1410	1480	0.80
11	29	3.9e-14	5.8e-11	42.9	0.4	1	86	1507	1578	1507	1579	0.85
12	29	6.8e-13	1e-09	38.9	3.1	1	85	1655	1723	1655	1725	0.82
13	29	2.2e-12	3.2e-09	37.3	0.1	1	86	1748	1816	1748	1817	0.81
14	29	3.5e-13	5.2e-10	39.8	2.2	1	87	1950	2019	1950	2019	0.79
15	29	6.6e-10	9.7e-07	29.3	0.1	1	86	2121	2187	2121	2188	0.77
16	29	0.00036	0.53	10.9	0.0	1	59	2203	2248	2203	2264	0.80
17	29	2.4e-14	3.5e-11	43.6	1.4	1	87	2277	2347	2277	2347	0.84
18	29	4.4e-13	6.4e-10	39.5	0.6	1	87	2406	2476	2406	2476	0.83
19	29	3.3e-11	4.8e-08	33.5	0.2	1	86	2511	2582	2511	2583	0.81
20	29	5.3e-13	7.8e-10	39.2	0.0	1	86	2593	2664	2593	2665	0.80
21	29	6.1e-12	8.9e-09	35.8	0.0	1	86	2689	2759	2689	2760	0.79
22	29	0.0011	1.6	9.4	0.0	1	58	2793	2840	2793	2860	0.79
23	29	2.1e-13	3e-10	40.5	0.5	1	87	2878	2951	2878	2951	0.82
24	29	8.2e-16	1.2e-12	48.2	0.3	1	86	3063	3135	3063	3136	0.81
25	29	2.4e-12	3.5e-09	37.1	2.8	1	86	3197	3267	3197	3268	0.80
26	29	4.5e-14	6.6e-11	42.7	4.4	1	86	3368	3438	3368	3439	0.85
27	29	2.8e-11	4.1e-08	33.7	0.1	1	86	3521	3590	3521	3591	0.83
28	29	1.8e-10	2.7e-07	31.1	2.0	1	58	3615	3663	3615	3678	0.83
29	29	3.3e-10	4.8e-07	30.3	1.9	17	87	3680	3739	3670	3739	0.74

Sequence Information

Coding Sequence: ATGTCACAACAACACCCCCATCACGCCCACCCCCACCACTACGCCCACCACTACCCGCCCCCTGCTACGCCCATGTCcctgcagcaacagcagcagctgcagcaaaCGCAGCAGacgccgcagcagcagcagcagcagcacgcCAATTGGTACTCACATGTTGCTTCCTACCCCACACCCCACTCGGCCTTCGGCCCCGCCCCCGACCCATCCTGCAAggccaccagcaacagcaacaacaacatcatgggtgggggaggaggaggaggctaTGGGCCACAAGGGGGTGGTGGCACGCAGGGTTATTATGGCGCCGCTGGCGGTGGCCTCAATGTCAGTGGGgcggtggtgggtggtggtgggccGAGCTACGGCCTTGGGGCCAACACAGTGGCATATGCCCACAACCAACTGCTGCAgtaccaacagcaacagcagcagcagcaacatcagcaacttCCACAGCATCTAAGCCAACAAAGGTCCTATATGGGCCACAATATCATGACCGGCAGCTATCCCTATATCAAAAGCGAACCCATGGAGGCGTTTCAGCAGCCTCCCAATCCCATGGCCCCGCCCCCGGCACCAGAAATATTGATAAAATCGGAACCCATTGACGAACATTCCTACAAGTCAAACTACATAGACGACAACACTCCATTTGCGGACTTTAACAAGTTCAGCGAATTTAGCGAGGACATGTTGAGTCCCAAAGTGGAACTGACCGTCAAGAATGAGTCCTACGGAAGGAATACCAGCAGCTTTCTGCGCCGCAAACAGCAATTGGATCGGAGTTCCGAGAGCCTGCCCATTTGCCAGCGCTGCAAGGAGGTCTTCTTCAAGAAGCAGGCCTATCTGCGCCACGTGGCCGAGAGCAACTGCGGGATGCAGGAGTACGACTTCAAGTGCAGCACCTGCCCCATGTCCTTCATGACCACCGAGGAGCTGCAGCGGCACAAGCACCTTCACCGGGCAGACAAGTTCTTCTGCCACAAGTATTGCGGCAAGCACTTCGACACGATCGCAGAGTGCGAGGCGCATGAGTACATGCAGCACGAATACGATAGCTTTGTCTGCAACATGTGCTCTGGAACTTTCGCTAGCCGTGAGCAGCTATACGCCCACCTGCCGCAACATAAGTTCCAGCAGCGCTTCGACTGTCCCATCTGCCGCCTGTGGTATCAGACGGCTCTCGAACTCCACGAGCATCGATTGGCCGCACCCTACTTCTGCGGCAAGTATTATACGGGGGTTCAGGCAACTTCTGGATCGCACTCGCAGGCGCAGCAGCATCAGACGAACTACAAGCTGCAGGATTGCCACATGGCCACTATGGAAATGCCCACCGCCCCGCACCACAAATCGAACCCATCCACCTCGTCCTTGCCGGCCACGGCTGCTCTAAATTCGCTGCTGCAGCAGCGTCAGGCAAATGCCGATGGAGCAGCCATGTTCGCAGCTTCTGCGCTTAAGAACGATGTGAATGTGAAGCTGGAGCGCAGCTATAGCAACTCGACCAGCGAGTCATCCTACAGCGTTCAGGAGAGTAGCTACAATAATGCCTATGGAAGCGACAGTTCAATCCATGGAGGAGCGATCGCTGGACCCCAGGCACACTCATCGACGCTGGACGACTCCGAGGACGCATTGTGCTGTGTGCCACTGTGTGGAGTGCGAAAGAGCACCAGCCCAACGCTTCAGTTTTTCACGTTCCCCAAGGACGAAAAGTACCTCAACCAATGGCTGCACAATCTCAAGATGTTCCACATACCCGCCGCAAGCTACGCCAATTTCCGCATCTGCAGTATGCACTTCCCGAAGCGCTGCATCAACCGCTATTCGCTGTGCTATTGGGCGGTGCCCACGTTTAACCTGGGTCACGACGACGTGGCCAATCTCTACCAGAACCGGGAACTGACCAACACCTTCACCACCGGCGAAGTAGCGCGATGCAGCATGCCGCACTGCACCAGTCAGAGGGGAGAGAGCAACTTAAAGTTCTACAATTTCCCCAAGGACATCAAGAGCCTCATCAAGTGGTGCCAGAACGCACGACTTCCCGTTCAGGCGAAGGAGCCGCGTCACTTCTGTAGTCGCCACTTTGAGGAGCGCTGCATTGGCAAGTTCCGGCTGAAGCCATGGGCGGTGCCCACCTTACATCTGGGTGCCCAATATGGCAAGATCCACGACAACCCCAAAAATCTGTACGTGGAGGAAAAACGCTGCTGCCTCAACTTCTGCCGCCGAAGCCGATCCTCTGATTTCAATATGTCGCTATATCGTTTTCCCAGAGATGAGGTGCTCCTGCGGCGCTGGTGCTACAATCTTCGCCTGGATCCGGGAGTCTATCGTGGCAAGAATCACAAAATCTGTAGCGCCCACTTTATCAAAGAGGCTTTGGGTCTGCGGAAACTATCACCGGGTGCCGTTCCCACGCTTCACCTGGGTCACACCGACACCTTTAACATCTACGAGAACGAGCTGTGGCCACCGCCAACGGCTTCCAACAGTCACAGCAATGTCCTCCAGCAGCACCAGGCGCAACATCACCATTCGCAACACTCACTGCAACAGCACCTGCACAGCAAATCATACCAGCGTCACTCAGCGGCGTCTACGTCATCCTCGGCCAGTTCGACTTCTCACTACGTTGATCCTGAGCTGACGTCCTCTTACCTGGCCATGGGTGCCGGTGGATCCTCAGCGATGAACGCCAGCGACAGCATGGACATCTGTTGTGTGCCTAGTTGCGAGAGCAAGCGACACAACAACGAAAACATCACATTCCACACTATACCGCGCCGACCGGAGCAGATGCGCAAGTGGTGCCACAACCTAAAGATACCAGAGGAAAAGATGCACAAAGGTATGCGGATCTGTAGTCTGCACTTCGAGCCTTACTGCATCGGCGGCTGTATGCGTCCATTTGCGGTGCCCACCCTCAATTTGGGTCACGACGAGGAAGATATTCATCGGAATCCGGACGTGATTAAGAAGCTTAATATCCGGGAAACATGCTGCGTCGCCGTATGCAAGCGAAATCGAGACAGGGATCATGCGAACCTGCACCGATTCCCAAGTAATGTGTCGCTGCTGACTAAGTGGTGTGGCAATCTACAACGGCCCGTTCCGGATGGCAGTAAACTTTTTAACGACGCTATCTGTGAGGTGCACTTCGAGGATCGGTGCCTGCGCAACAAAAGGCtggaaaagtgggcggtgCCTACACTGATCCTTGGCCACGAAAACATCCCATATCCACTTCCAACACCGGAACAGGTCACTGAGTTCTATTCTCGACCCACTGCTCCCAACAATGGCGAGGAACAGGGCGAGTGCTGTGTGGAGAGCTGCAAGAGAAATCCCAGTGTGGACGACATTAAGCTATACCGGCCTCCGGAGGAGGCTTCCGTGTTGGCCAAATGGGCGCACAACCTGCAAACAGAGGCTAGTCAGCTTACGAGCATGAGAATCTGTAATCTTCACTTCGAGGCACACTGCATCGGCAAGCGGATGCGACCTTGGGCGATACCGACATTAAACCTGGCCGGCAATATAGAGAATCTCTATGAGAATCCAGAGCACTTGATGCTGTACAAGCGGCGAACTCACACGAAAACCAAGCTTCCGGCTTCCGTAAAGCCCACTTGGGTGCCCAGGTGCTGTCTTCCACACTGCCGCAAAGTTCGAGCTCTGCACAACGTTCAACTCTATCGGTTCCCCAAGCTCAATCGCTCCACTCTGGCCAAGTGGGCGCATAATCTGCAGGTCCCCATGGTTGGCAGTGCCCAACGCCGACTGTGCTCGGCTCATTTTGAGCCACACGTGCTGAGCAAGAAGTGTCCGGTGCCGCTGGCGGTACCTACGCTGGACTTGAACTCGCCGCCCGGCTTGAAGATCTACCAAAATCCGGCCAAGCTGAAGGCAAGCAAGCTGTGTCTGCAGCGCGTGTGCATAGTAGAAAGTTGCCGCAAGACGCGGGCGCAGGGCGTCCAACTCTTCCGGCTCCCACATAGTCCCACGCAGCTCCGCAAGTGGATGCACAACATCAAAACGCGTCCTAGGGCGGCTATGAGGGCTCAATACCGGGTATGCTCCCGCCATTTTGAGACACACTCATTCAATGGCAGGAGATTAAGCGCTGGCGCCATTCCTACCCTGGAATTGGGTCATGACGACGAGGACATCTATCCCAACGAAGCACAGGCCTTTGCGGACGAGCACTGCGTGGTGGAGGGATGCGAGTCATCCAAGGAACAGGCGGAGGTGCGACTCTTTCGGTTTCCCACGGATGACGACGATATGCTATGGAAGTGGTGCAACAATCTTAAGATGAACCCAGTGGACTGCACCGGAGTACGCATATGTAACAAACACTTCGAGGCGGATTGCATCGGACCCAAGCACCTGTACAAGTGGGCTATCCCCACTCAGGAACTCGGTCACGACGATGCCGAGATCGAATTGATACCGAATCCCAAGCCAGAGGACAGGTATGTGGACCCGGTGTTCAAGTGCATCGTGCCCACCTGCGGAAAGACGCGCCGATTCGACGAGGTGCAGATGAACAGCTTCCCCAAGGACCCGAATCTCTTCCAGCGCTGGCAGCACAATCTGCGACTGGAGCATCTTAACTTCCTGGAACGCGAACGCTACAAGATCTGCAATGCGCACTTTGAGGACATCTGTATTGGCAAGACACGGCTGAACATAGGCTCGATCCCTACCCTCGAGCTGGGTCACGACGAGACGGAGGATCTGTTCCAGGTTAATCCGGCGGAGTTGCAGAGCAACCTTTTCGGACGACAGCGGCGAGTACACGAAGAATCTGGTGGGATAGCCATCAAGCAGGAGTTTTCCGAGTCGGAAGACATCAAACCGGATGTGACAGCCATGACCGATGCCACAGGTTCGAGAACTAGACAGGTAAAGTTCAAGAAAACGCTTTCCGATCTGAAGTGTTGTGTGCACAGTTGTGGACGCAGTCGTATGGAGCACGGAGCACGGCTGTTTCCATTTCCCACCGGCAAGCAGCAACACCTCAAGTGGCGACACAACCTGCGTCTAGAGCCCGACGAGGTGGACCGATCGACGCGGGTTTGCAGTGCTCACTTTAACCGGCGCTGCATTGATGGCAAGCAACTGAGGAGTTGGGCAATGCCCACGCAGCAACTGGGCCACCATGAGCAGCCGATCTACGAGAATCCGAAGAACATCCCGGGATTCTTCACGCCCACCTGTGCCCTGGGGCACTGCCGCAAGCGTCGGAGCATCGACAATGACCTGCGCACCTACCGGTATCCAAGAAGTGAAGATATGCTTGAGAAGTGGCGGGCGAATCTGCGTCTGACCCCGGATCAGTGCCGCGGCAGGATTTGTGCGGATCACTTTGAGGCACAGGTTCGGGGCAAACTAAAGCTGAAGACGGGAGCAGTGCCCACTTTGAAACTGGGTCACGATGAGGGGTTAATCTACGACAATGAGGCTATAAAGGTTGGACTGACCGAGGATGAGGAAGGCAGCTCTGAGTTGCCGCAACTGAAACCTAAAAAGGAGCTAATCGATGAGGAAGAGGGAGACATGGAGGCTGAGGAGGAGCACAATGACCAGGATAATGAAGATGAAGATGAGAAAGACGACCACTACTTTGATCCGCTTGAACTGGTCGAGACCTTTGCCGAACATCCAAGCGATGATGAAGCCGAATATCGTCGGGATGAAGAGGATGATCGAGACGAAGAAGAGGACTTGGAAGAAATGGATCACTTCCTGCCAGACACGCCGCCGACTCCTCCAATCGTCCCACTGCGTCGAGAAAAGCCCGCCAACAATGTGACGCCCATTTGCTGCCTGAAGCACTGTAGGAAGGAACGTACTGCCTTTCACCTTCTCAGCACCTTTGGTTTTCCCAAGGATCGCCAGCTGCTGCTCAAGTGGTGTGCCAATCTTCATCTGAATCCGGATGACTGCATCGGCCGGGTTTGCATAGAGCACTTCCAGTCTGAGGTACTCGGAACTCGAAAGCTTAAGCAGAATGCGGTGCCCACACTTAATGTGGGACATAATGAGCCACTTAGATACTCGTGTAATGGAatggatctggatctggagCAATCACAGCCACAGCACTCGGTTTTTCGGCTTTGGAGCCTGAAACACTGCCGCAAGAGGAAGCTAACAGAGCCGCCGGATATTCGACCAAGCAAATGGAAGACAGCGGAAGTTCAGATGATGCAGAGATTGAAGATGGAGATTCAGGTAGAGAGGAAGATCAAGATGGAGATGCAGATGGAGAGGGAAATAAAGACGGAAGCGAAGACTCTAACGAAGAATCAGAGGGAGAGTAAACCGAAAAAATGTTGCATCAGCACCTGCGCAAAAGAGGAGGATAAGCAATTATTGCCACTGCCTGAGGAGCGAAATCTTTTGAGAAAGTGGCAACACAACCTAAAGCTCTCTATGGACACGAAATTCAGCGATGTTCGAGTATGTCTGGATCATTTTGAGGATGGAGTTGTGCAAAATGGAATGCAGTTGGAGCAGGCAATTCCCACCTTAAAGCTTCACCAAAACAGTTGGAACATCTACAGAAACAACGGAGCTTGTCTGGTCGCAGACTGTGAAAATTCTTCCTCAAGCTTAGTGGATTTGCCTGAAAATATGGTAATAAGAACCGCCTGGATGTCCCACCTTAATCTGCCTCTCGGCAGTGATGGTCTCCTATGCGGCTCCCACTTCATGGAACTGTATGAACAAGTGGAATTGGTCAAGGTTCTCGCAGCAAAGGATTTGGAGGATTTGCAGTGGATTGCTGACGAACTCAAATGCGCTGTGCCTGGTTGCTCCTCCAAAAATGTCAAGGACCTTCAGCTCACTCAGCTTCCAGATAAGGAGGAGACGCTTTTCAAGTGGCTACATAATACTAAGATATCTTACGATCATTCGAGGCATAAAAGCTATCGCATCTGTGTGCGCCACTTTGAGCCAGCGTGCTTAGAAGCGGATTTTCTAAAACCTTGGGCTATACCAACCTTGCATCTGAATCATGAGGGCAAGATTCACTTAAATCCCTGTCAGCAAGATCTTGAGTCACGCAGTATGACTCCCAATAGCAATGCAAGGCTAACTCCACTAAGAATTAAGACAGATCTCGCATCTCTGAGCAGTCCCTGCGCGAGTGCAAGTCCCAGTCCTCGAGGCAGGATGAGGATATGTTGTATTCCCACATGTGGACAGTTTGGAAACAGCCAAATACGGCTCTACCGCTTCCCCACCGAAGAGCAGGCCTTGCTCCGGTGGCTGGTGAACACGCAACAGCAACCCCGCCTTGTGGATCCCCAGGAGCTTTACGTGTGCCAGTCCCACTTCGAACCCGATGCCATTTGTAAGAAGCAACTTCGCAGCTGGGCGGAGCCCACATTAAACTTGGGCCACGATGGCTATGTTATCCCCAATGCCAAGCACAACGGAAACATCGCTGGAGGGCAGGACACTGAGCAGGCGATGAGGTTTATCCGCGAACGCTTTTGTTCCGTGCTGTCTTGTTTCCAGGCTGAAGATAGTGGAATAAGGCTTTATGAGTATCCAAAGGATATGGCAACGATACGAAAGTGGGCAGCCGCCTGCAGACATCGCTCGATGCAGGCCAGCAGCCATGGGTTCAAGGTGTGCCAGTCTCATTTTGCCCCGGAATGCTTTCATCCGGACACTTTGGATTTGATTGACGGATCAGTTCCCACTCTGGAGTTGAGCAGAGATGACATTGAAAAACACTGTTTGGTGCCCGGATGTGTGAAGGACGCAACTGGCGACCGACTCCGCTTCTACAAGGTGCCAAAGAACGCTGCTCATCTGGAAGCTTGGAGCAACAACCTGAAGATCAATTCCCTGGACCTCGGTCAGGGAGAGCAGCTCATCTGCGAGCGCCACTTTGAGTCCTTTTGCTTTGGTGCCAACAGGGGATTACGTCCTGGAGCGCTTCCGACTCTTTTGCTTGGTCATGACGAGCAGGTGGAGATGTTACCCAATCCCGAAAATCTCTGTCAAAGTAAACCTGAGGTGTGCTGTGCCCCTGGATGCGGACGTGTACGGCAGCTCGGAGACGCTCAGTTCAGTGGATTTCCGAAAGTATTGGCGTTGGCCGAGAAGTGGATGTATAATCTTCGTCTGAGAGTTACTAAGGATCAGCTAGGCAGGCTGAAAGTCTGCAGTGCGCACTTTGAGTCCTCTCTCTTTGACAAAAGTGGATTAATCTCGGGTTCGATACCCACCCTGGAACTGGGACATTCCTCTCCGGACATTTTCCAGACTGATCTACAAAATCTGGGCAAATGCTTAAAGCTTTCCAAGCGAGCCTTGATGCCGGATGTCAATTGCTGTTATCCTGAGTGCAAAGAATTCTCTAGGAACCTGTCTTACACTCTGCCCCCTGAGGAGAACCTCCGAAGAGCTTGGCTACGATATTTGGACATCGAAGAGCCGGCTAATGGTGTCGGCCAGCTTTGTCCGCTGCATTATGTGATTCTCTATGAACTCAGTGTTAAAAGCTTTCCAGAGCACGTTCCAAATAGATTCCTCGAAGATAATTACCATTCTGCTCGAAGCAATCGGCGCGTAAAAATAGTTAGTTGCGCAGTCAAAGGTTGTGAGATGATCAGGCCCCGGGATAAAGTTCTGTTGCACGGATTGCCGCAAAGAAAAGACATCCTGAAGatgtgggtggaaaatggccAATTGGAAATGACGGAACAGCAGCATCAATACATGCTCAAGGTATGTCGCAACCACTTTGAGTCACGCTGTTCGTTTGATGACCGCAGGCTGCATCCCTGGAGCGTACCCACTCTGCACTTGCCAGCAGATCCCGTGCATCAGATTCCCACCAAAGAGGAGTGGCTCGAGATGACGGCCAAAGTGACCCAGGAAGCCGGGACAATCAAGCAAGAAAGGGTGGAGGAATTTCAGGAGGAGGACGAGTGTGACAACTCTCTGTTAGAACCCATTGTAAGAATGGAGCATATCGAGTCCGATGAGGAAGACTCGGAGATGCAGGCTCTGGAGGTGCTCCTGGAGGTTGGTCATGTTGAGCGGATGGACAGCTACGAGAAGGTGGACAAATCCTATAACGAACTCGCCTCCATTTACCAACCTTCTGGCATTCGGAACCAGTACAATGCCAACCACTGTGCCGTTGAGGGATGCGAGGTGACTGTTGAGGACGTGGATGGGACCATAAAGCTTCACAAATTCCCCGCCTCGTCGGAGGCTGCTAGGAAGTGGATGCACAACACCCAAGTTGACATGGACGAGAAGTTCTGGTGGCGCTATCGCATTTGCAGTTATCATTTCGATCAGGAGTGCTTCCAAAGCGCCAGGATAAAAAAGGGGGCGATGCCCACTCTACTCTTGGGACCTAAGAGACCGGACAAGCTGTTCGAGAATGAGTTTGCCATACAGGATATGGAAGAGCTTATTTTGCCTTTGCCACAAGTGACTCTGCCAAGTGAGCATAAGGAGGAGACCGTTCGAGAGGTCACCAAGTTATGCCTGCCGACGCCGGCTCCGCCTCAAAAGTCCAGCAAATTTTGTCAGATTGAGGGATGTATGAATCACCTGACCACTGAGAACATGACGCTGCACAAGTTCCCTCATTCCGAGGACATGTGCCTCAAGTGGCAGCATAACACACAGGTGCCATTCGATCCCTTTTACCGGTGGCGCTATCGCATCTGCAGTGCCCACTTTCATCCGGTGTGCCTGCTCAATATGCGACTAGTCCACGGCAGTGTGCCCACGCTGAAACTGGGAAGCAAGGCTCCCAGCGAGCTCTTTGACAACGACTTTGAGGCCATCAACCTTAGGCTGGACAAGAGGTCGGGAGCGGAGTCAGGCACCGTACAGATCAAGGAGGAAAGGGATGATGACGAAGACTCTATGCTGTTCTTAGAGCCAGAGTTGCAGCTGCACGAGGACCAAGAGGAGGAGGATGCGGCACCTGTACAAGTATCGTTTAGCCAGTCAAACTGGAAAAGCCATCTTCGTCTTCCTGTTAAGCAAGAGAAAATTACTTACAACCAGGTGAAGTCCGGATACGATAAGTGCTCGTTGGCTCATTGCCAGCGGCAGAGATCTCAGCATGGCGTCCACATCTATAAGTTTCCTAAGTCGAGGCGACAGCAAGACCGTTGGATGCACAACCTCCGCATCCGTTACGATGAGCGGCGTCCCTGGAAGTTCATGATCTGCAGCGTTCACTTCGAGCCGCACTGCATCAGCCTGAGGAAGCTGCGCCCCTGGGCAGTGCCCACGCTGGAGCTGGGCGACAATGTGCCGGAGAAGATTTTCACGAACGAACAATGCCAGGAGCTCACAACTGATCGCAGTGAGGCCGAAAGCGACGGcggcgaggaggaggatggCCTACAGGAGGACGAGGAAGAGGAGGATGGCCTACAGGAGGACGAGGAAATGGAGCCGGAGGTTCGCATCAAGCGAGAGCGACGTTCCAAGTTCGACCCTTGGCCTCCTGGCACGGTTCCGCCGTGGAAGGTCAAGCAGTGCTGCCTCCCGTACTGCCGCGCCTTCCGTGGCGAAGGCATCAAGCTGTTCCGGCTGCCCAATAACCGCACCTCCGTCCGCAACTGGGAGCTGGCAACGGGCATGGTCTTCAAGGAGACTCAGCGAAATACGCGACTGATCTGCAGCCGTCACTTCGAGCCCGAGTTAATTGGCGTAAGGCGTCTCATGCGCAACGCCATCCCCACGCGGCATTTGAATCCCCAAGAAGGAGCCTCTGCCGAAGTTAAGAAAAAGCCAAATCCTCCTGTCCCCATTGCAACGTGTTGCATGGCTGACTGCCATCACAATGGAAATGTCAAGCTCCACAAGTTTCCCAGTGatccCTCGCTGCTTAGACAGTGGTGCCAAGCACTCAGGCTCACGGATACTCAGAGATACCGGGGTAAACATATCTGCTCGGTCCACCTGCCCACCGACAAGACGATAAGATGCGTTATCTGCGAGGTGGACAACGTTCAGCTGCCGATGCTGGATTTTCCGGAGCAGCGCAATCAGCGCGCCAAGTGGTGCTACAATCTCAAGATCGAGGCCATACCAAAGTGGGACCGCTCCAAACACATCTGCTGTCGTCACTTCGAGTCGCATTGTTTTGCACAGCCTGGTGAATTGCGTCCAGGTGCGATTCCCACGCTGCATTTGAACCACGACGACACGAACATATTCCTCAGCGACTACGCCACTGGTCCGACCAGCAATCGGATCAAGGACGAGCCCATGGACAACGACGACATGCTGCTGGTTTAG
Protein Sequence: MSQQHPHHAHPHHYAHHYPPPATPMSLQQQQQLQQTQQTPQQQQQQHANWYSHVASYPTPHSAFGPAPDPSCKATSNSNNNIMGGGGGGGYGPQGGGGTQGYYGAAGGGLNVSGAVVGGGGPSYGLGANTVAYAHNQLLQYQQQQQQQQHQQLPQHLSQQRSYMGHNIMTGSYPYIKSEPMEAFQQPPNPMAPPPAPEILIKSEPIDEHSYKSNYIDDNTPFADFNKFSEFSEDMLSPKVELTVKNESYGRNTSSFLRRKQQLDRSSESLPICQRCKEVFFKKQAYLRHVAESNCGMQEYDFKCSTCPMSFMTTEELQRHKHLHRADKFFCHKYCGKHFDTIAECEAHEYMQHEYDSFVCNMCSGTFASREQLYAHLPQHKFQQRFDCPICRLWYQTALELHEHRLAAPYFCGKYYTGVQATSGSHSQAQQHQTNYKLQDCHMATMEMPTAPHHKSNPSTSSLPATAALNSLLQQRQANADGAAMFAASALKNDVNVKLERSYSNSTSESSYSVQESSYNNAYGSDSSIHGGAIAGPQAHSSTLDDSEDALCCVPLCGVRKSTSPTLQFFTFPKDEKYLNQWLHNLKMFHIPAASYANFRICSMHFPKRCINRYSLCYWAVPTFNLGHDDVANLYQNRELTNTFTTGEVARCSMPHCTSQRGESNLKFYNFPKDIKSLIKWCQNARLPVQAKEPRHFCSRHFEERCIGKFRLKPWAVPTLHLGAQYGKIHDNPKNLYVEEKRCCLNFCRRSRSSDFNMSLYRFPRDEVLLRRWCYNLRLDPGVYRGKNHKICSAHFIKEALGLRKLSPGAVPTLHLGHTDTFNIYENELWPPPTASNSHSNVLQQHQAQHHHSQHSLQQHLHSKSYQRHSAASTSSSASSTSHYVDPELTSSYLAMGAGGSSAMNASDSMDICCVPSCESKRHNNENITFHTIPRRPEQMRKWCHNLKIPEEKMHKGMRICSLHFEPYCIGGCMRPFAVPTLNLGHDEEDIHRNPDVIKKLNIRETCCVAVCKRNRDRDHANLHRFPSNVSLLTKWCGNLQRPVPDGSKLFNDAICEVHFEDRCLRNKRLEKWAVPTLILGHENIPYPLPTPEQVTEFYSRPTAPNNGEEQGECCVESCKRNPSVDDIKLYRPPEEASVLAKWAHNLQTEASQLTSMRICNLHFEAHCIGKRMRPWAIPTLNLAGNIENLYENPEHLMLYKRRTHTKTKLPASVKPTWVPRCCLPHCRKVRALHNVQLYRFPKLNRSTLAKWAHNLQVPMVGSAQRRLCSAHFEPHVLSKKCPVPLAVPTLDLNSPPGLKIYQNPAKLKASKLCLQRVCIVESCRKTRAQGVQLFRLPHSPTQLRKWMHNIKTRPRAAMRAQYRVCSRHFETHSFNGRRLSAGAIPTLELGHDDEDIYPNEAQAFADEHCVVEGCESSKEQAEVRLFRFPTDDDDMLWKWCNNLKMNPVDCTGVRICNKHFEADCIGPKHLYKWAIPTQELGHDDAEIELIPNPKPEDRYVDPVFKCIVPTCGKTRRFDEVQMNSFPKDPNLFQRWQHNLRLEHLNFLERERYKICNAHFEDICIGKTRLNIGSIPTLELGHDETEDLFQVNPAELQSNLFGRQRRVHEESGGIAIKQEFSESEDIKPDVTAMTDATGSRTRQVKFKKTLSDLKCCVHSCGRSRMEHGARLFPFPTGKQQHLKWRHNLRLEPDEVDRSTRVCSAHFNRRCIDGKQLRSWAMPTQQLGHHEQPIYENPKNIPGFFTPTCALGHCRKRRSIDNDLRTYRYPRSEDMLEKWRANLRLTPDQCRGRICADHFEAQVRGKLKLKTGAVPTLKLGHDEGLIYDNEAIKVGLTEDEEGSSELPQLKPKKELIDEEEGDMEAEEEHNDQDNEDEDEKDDHYFDPLELVETFAEHPSDDEAEYRRDEEDDRDEEEDLEEMDHFLPDTPPTPPIVPLRREKPANNVTPICCLKHCRKERTAFHLLSTFGFPKDRQLLLKWCANLHLNPDDCIGRVCIEHFQSEVLGTRKLKQNAVPTLNVGHNEPLRYSCNGMDLDLEQSQPQHSVFRLWSLKHCRKRKLTEPPDIRPSKWKTAEVQMMQRLKMEIQVERKIKMEMQMEREIKTEAKTLTKNQRESKPKKCCISTCAKEEDKQLLPLPEERNLLRKWQHNLKLSMDTKFSDVRVCLDHFEDGVVQNGMQLEQAIPTLKLHQNSWNIYRNNGACLVADCENSSSSLVDLPENMVIRTAWMSHLNLPLGSDGLLCGSHFMELYEQVELVKVLAAKDLEDLQWIADELKCAVPGCSSKNVKDLQLTQLPDKEETLFKWLHNTKISYDHSRHKSYRICVRHFEPACLEADFLKPWAIPTLHLNHEGKIHLNPCQQDLESRSMTPNSNARLTPLRIKTDLASLSSPCASASPSPRGRMRICCIPTCGQFGNSQIRLYRFPTEEQALLRWLVNTQQQPRLVDPQELYVCQSHFEPDAICKKQLRSWAEPTLNLGHDGYVIPNAKHNGNIAGGQDTEQAMRFIRERFCSVLSCFQAEDSGIRLYEYPKDMATIRKWAAACRHRSMQASSHGFKVCQSHFAPECFHPDTLDLIDGSVPTLELSRDDIEKHCLVPGCVKDATGDRLRFYKVPKNAAHLEAWSNNLKINSLDLGQGEQLICERHFESFCFGANRGLRPGALPTLLLGHDEQVEMLPNPENLCQSKPEVCCAPGCGRVRQLGDAQFSGFPKVLALAEKWMYNLRLRVTKDQLGRLKVCSAHFESSLFDKSGLISGSIPTLELGHSSPDIFQTDLQNLGKCLKLSKRALMPDVNCCYPECKEFSRNLSYTLPPEENLRRAWLRYLDIEEPANGVGQLCPLHYVILYELSVKSFPEHVPNRFLEDNYHSARSNRRVKIVSCAVKGCEMIRPRDKVLLHGLPQRKDILKMWVENGQLEMTEQQHQYMLKVCRNHFESRCSFDDRRLHPWSVPTLHLPADPVHQIPTKEEWLEMTAKVTQEAGTIKQERVEEFQEEDECDNSLLEPIVRMEHIESDEEDSEMQALEVLLEVGHVERMDSYEKVDKSYNELASIYQPSGIRNQYNANHCAVEGCEVTVEDVDGTIKLHKFPASSEAARKWMHNTQVDMDEKFWWRYRICSYHFDQECFQSARIKKGAMPTLLLGPKRPDKLFENEFAIQDMEELILPLPQVTLPSEHKEETVREVTKLCLPTPAPPQKSSKFCQIEGCMNHLTTENMTLHKFPHSEDMCLKWQHNTQVPFDPFYRWRYRICSAHFHPVCLLNMRLVHGSVPTLKLGSKAPSELFDNDFEAINLRLDKRSGAESGTVQIKEERDDDEDSMLFLEPELQLHEDQEEEDAAPVQVSFSQSNWKSHLRLPVKQEKITYNQVKSGYDKCSLAHCQRQRSQHGVHIYKFPKSRRQQDRWMHNLRIRYDERRPWKFMICSVHFEPHCISLRKLRPWAVPTLELGDNVPEKIFTNEQCQELTTDRSEAESDGGEEEDGLQEDEEEEDGLQEDEEMEPEVRIKRERRSKFDPWPPGTVPPWKVKQCCLPYCRAFRGEGIKLFRLPNNRTSVRNWELATGMVFKETQRNTRLICSRHFEPELIGVRRLMRNAIPTRHLNPQEGASAEVKKKPNPPVPIATCCMADCHHNGNVKLHKFPSDPSLLRQWCQALRLTDTQRYRGKHICSVHLPTDKTIRCVICEVDNVQLPMLDFPEQRNQRAKWCYNLKIEAIPKWDRSKHICCRHFESHCFAQPGELRPGAIPTLHLNHDDTNIFLSDYATGPTSNRIKDEPMDNDDMLLV

Similar Transcription Factors

Sequence clustering based on sequence similarity using MMseqs2

100% Identity: iTF_00605601;
90% Identity: iTF_00548096;
80% Identity: -