Basic Information

Insect: Drosophila acutilabella
Gene Symbol: -
Assembly: GCA_035046005.1
Location: JAWNOK010000068.1:8432696-8447106[+]

Transcription Factor Domain

TF Family: THAP
Domain: THAP domain
PFAM: PF05485
TF Group: Zinc-Coordinating Group
Description: The THAP domain is a putative DNA-binding domain (DBD) and probably also binds a zinc ion. It features the conserved C2CH architecture (consensus sequence: Cys - 2-4 residues - Cys - 35-50 residues - Cys - 2 residues - His). Other universal features include the location of the domain at the N-termini of proteins, its size of about 90 residues, a C-terminal AVPTIF box and several other conserved residues. Orthologues of the human THAP domain have been identified in other vertebrates and probably worms and flies, but not in other eukaryotes or any prokaryotes [1].
Hmmscan Out: # of c-Evalue i-Evalue score bias hmm coord from hmm coord to ali coord from ali coord to env coord from env coord to acc

1 28 3.6e-15 7.5e-12 46.1 5.1 1 86 579 651 579 652 0.86

2 28 3.2e-15 6.7e-12 46.2 4.6 1 87 679 748 679 748 0.83

3 28 6.9e-16 1.4e-12 48.4 0.4 1 87 770 842 770 842 0.84

4 28 1.1e-15 2.3e-12 47.7 4.9 1 86 946 1015 946 1016 0.82

5 28 6.3e-15 1.3e-11 45.3 3.0 1 86 1040 1111 1040 1112 0.82

6 28 9.1e-13 1.9e-09 38.4 1.3 1 87 1147 1215 1147 1215 0.80

7 28 1.1e-10 2.3e-07 31.7 1.4 1 86 1261 1330 1261 1331 0.76

8 28 6.8e-16 1.4e-12 48.4 0.1 1 86 1358 1427 1358 1428 0.83

9 28 3.7e-13 7.8e-10 39.6 1.4 1 86 1449 1518 1449 1519 0.81

10 28 1.6e-14 3.4e-11 44.0 1.8 1 86 1546 1617 1546 1618 0.85

11 28 2.3e-14 4.7e-11 43.5 1.7 1 86 1701 1770 1701 1771 0.82

12 28 3.6e-12 7.6e-09 36.4 0.1 1 86 1794 1862 1794 1863 0.81

13 28 4.9e-14 1e-10 42.4 0.7 1 87 2007 2076 2007 2076 0.81

14 28 1.9e-13 4.1e-10 40.5 0.2 1 86 2132 2197 2132 2205 0.79

15 28 0.018 38 5.3 0.0 1 58 2227 2277 2227 2289 0.78

16 28 8.7e-13 1.8e-09 38.4 1.2 1 86 2316 2385 2316 2386 0.85

17 28 4.2e-14 8.8e-11 42.6 1.7 1 86 2467 2536 2467 2537 0.82

18 28 1.7e-12 3.5e-09 37.5 0.8 1 86 2572 2643 2572 2644 0.80

19 28 1.4e-11 2.9e-08 34.6 0.9 1 87 2654 2728 2654 2728 0.81

20 28 8.2e-16 1.7e-12 48.1 0.1 1 86 2756 2826 2756 2827 0.82

21 28 4.6e-06 0.0097 16.9 0.1 1 58 2860 2910 2860 2940 0.76

22 28 1.2e-12 2.5e-09 38.0 0.0 1 86 2948 3020 2948 3021 0.79

23 28 2.9e-14 6.2e-11 43.1 0.4 1 86 3198 3270 3198 3271 0.83

24 28 2e-13 4.1e-10 40.5 1.6 1 86 3338 3408 3338 3409 0.82

25 28 1.5e-14 3.2e-11 44.0 3.0 1 86 3504 3574 3504 3575 0.84

26 28 8.9e-13 1.9e-09 38.4 0.1 1 87 3659 3729 3659 3729 0.85

27 28 3.3e-07 0.0007 20.5 0.5 1 57 3748 3793 3748 3797 0.85

28 28 5.1e-12 1.1e-08 36.0 1.8 1 87 3800 3871 3800 3871 0.76

#	of	c-Evalue	i-Evalue	score	bias	hmm coord from	hmm coord to	ali coord from	ali coord to	env coord from	env coord to	acc
1	28	3.6e-15	7.5e-12	46.1	5.1	1	86	579	651	579	652	0.86
2	28	3.2e-15	6.7e-12	46.2	4.6	1	87	679	748	679	748	0.83
3	28	6.9e-16	1.4e-12	48.4	0.4	1	87	770	842	770	842	0.84
4	28	1.1e-15	2.3e-12	47.7	4.9	1	86	946	1015	946	1016	0.82
5	28	6.3e-15	1.3e-11	45.3	3.0	1	86	1040	1111	1040	1112	0.82
6	28	9.1e-13	1.9e-09	38.4	1.3	1	87	1147	1215	1147	1215	0.80
7	28	1.1e-10	2.3e-07	31.7	1.4	1	86	1261	1330	1261	1331	0.76
8	28	6.8e-16	1.4e-12	48.4	0.1	1	86	1358	1427	1358	1428	0.83
9	28	3.7e-13	7.8e-10	39.6	1.4	1	86	1449	1518	1449	1519	0.81
10	28	1.6e-14	3.4e-11	44.0	1.8	1	86	1546	1617	1546	1618	0.85
11	28	2.3e-14	4.7e-11	43.5	1.7	1	86	1701	1770	1701	1771	0.82
12	28	3.6e-12	7.6e-09	36.4	0.1	1	86	1794	1862	1794	1863	0.81
13	28	4.9e-14	1e-10	42.4	0.7	1	87	2007	2076	2007	2076	0.81
14	28	1.9e-13	4.1e-10	40.5	0.2	1	86	2132	2197	2132	2205	0.79
15	28	0.018	38	5.3	0.0	1	58	2227	2277	2227	2289	0.78
16	28	8.7e-13	1.8e-09	38.4	1.2	1	86	2316	2385	2316	2386	0.85
17	28	4.2e-14	8.8e-11	42.6	1.7	1	86	2467	2536	2467	2537	0.82
18	28	1.7e-12	3.5e-09	37.5	0.8	1	86	2572	2643	2572	2644	0.80
19	28	1.4e-11	2.9e-08	34.6	0.9	1	87	2654	2728	2654	2728	0.81
20	28	8.2e-16	1.7e-12	48.1	0.1	1	86	2756	2826	2756	2827	0.82
21	28	4.6e-06	0.0097	16.9	0.1	1	58	2860	2910	2860	2940	0.76
22	28	1.2e-12	2.5e-09	38.0	0.0	1	86	2948	3020	2948	3021	0.79
23	28	2.9e-14	6.2e-11	43.1	0.4	1	86	3198	3270	3198	3271	0.83
24	28	2e-13	4.1e-10	40.5	1.6	1	86	3338	3408	3338	3409	0.82
25	28	1.5e-14	3.2e-11	44.0	3.0	1	86	3504	3574	3504	3575	0.84
26	28	8.9e-13	1.9e-09	38.4	0.1	1	87	3659	3729	3659	3729	0.85
27	28	3.3e-07	0.0007	20.5	0.5	1	57	3748	3793	3748	3797	0.85
28	28	5.1e-12	1.1e-08	36.0	1.8	1	87	3800	3871	3800	3871	0.76

Sequence Information

Coding Sequence: ATGTCACAACACAACAACCACCCCccgcatcatcatcatcatcactactaccaacagcagcagcaacaacaacaacagcaacatcataatcatcatcaacagcaacagcagcagcagcagctacaacataaacaaatacagcAGCACAGTTGGTACTCACATGTTGCTTCCTACCCTCCCCACCATCCGCACGCCGCAGCCTTTGCGGCGCCCTGCAAaaccaataataacaacaacaacaatattatgAATGCATACGGTACGGGAGCTGGTGGAGCGCATGCAGCATATTATGGCTCTGGTGGGGTGGGGGGCTATAACCTTGAGGGCAATACTGTGGCCTATGCGCACAACCAGCTGCtgcaataccaacaacaacaacaacaacagcagcagcaacaacaacaacagcatcatcaACTCAGTCAACGCTCTTATATGGCGCACAGTTTAATGCATGGTTCGTATCCCTATATCAAGAGCGAGCCACTGGAGCTGTCTGATGATagacaacggcaacaacaacaacaaccgctgcaccaccagcaacagcagcagcagcaacaacaacaacagcacttcCAGAATCCTATGGCACCGCCGCCAGCTCCCGCGAATCGTCACAGTCTCGATGCCAGCGGCgaaatgataataaaatcGGAACCAGTTGATGAACATGCCTTCAAGTCCAACTATATCGATGATAACACGCCCTTCGCAGATTTCAGCAAATATCCGGAATTCGGTGACGATATGTTAAGTCCCAAGGTTGAGCTATCGGTCAAGGACGAGGGCTATGGCAATCACAAAGTTCCCaaTCCCCTGAGCTATCCCAGACGCAAGCTGCAGTCGGAGCGCTCATCGGAAGTGCTTCCAATTTGTCAGCGCTGCAAGGAGGTGTTCTTCAAGAAGCAAATCTACGTGCGGCATGTGGCAGAGAGCAGTTGCACCATACAGGAGTATGACTTCAAGTGCAACATTTGCCCCATGTCCTTTATGAGCACCGATGAATTGCAGAAGCACAAGCATCTACACAGAGCAGACAAGTTCTTTTGCCACAAATACTGTGGCAAGTACTATGATACAATTGCTGACTGTGAGTCGCATGAGTATATGCATCATGAGTACGATAGCTTTGTCTGCAATaTGTGTTCCGTTACGTTTGCCACACGGGAGCAGCTCTATGCCCACTTGCCGCAGCACAAATTCCAACAGCGCTACGATTGCCCCATTTGTCGCTTGTGGTACCAGACGGCACACGAGCTGCACGAGCATCGTCTAGCTGCACCCTATTTCTGTGGCAAGTACTACGTTGGCTCACAGTCAGCAGCggcacatcaacaacaacagcatccacaacatcagcaacaggTCGGCTACAAGCTGCAGGACTGTCACATGGGCACCATGGAAATGGCCACTCCGCATCACAAGTCCAATGCAGCTGCCACCTCGTTGCCAGCAACTGCAGCGCTCAGTTCGTTGTTGCAGCAACGACAGGCGAATGCCGATGGTGCCGCGCTGTTCGCCTCCAACCTTAAGAACGAATCGAATGTGAAGCTGGAACGAAGTTATAGCAACTCCACAAGCGAATCGGGCTACAGTTTGCATGACAGCAGCTATAACAATGCCTATGGCAGCGATAACTCGCTGCACGCTGGTGGTGCAGGTGGCGGTGCACTTGGCGGTCCACAGGCGCACTCCTCGACGCTGGACGATTCGGAGGATGCATTGTGTTGTGTGCCGCTGTGTGGAGTGCGTAAGAGCACCAGTCCAACGCTACAGTTCTTTACGTTCCCCAAGGATGAGAAGTACTTGCATCAGTGGCTGCATAATCTGAAAATGTTTCATATACCGCAATCCAGTTACTCGACCTTTCGCATCTGTAGCATGCACTTCCCGAAGCGTTGCATTAATCGTTATTCCCTGTGCTATTGGGCGGTGCCTACGTTTAATCTTGGTCACGATGATGTGGCCAATTTGTATCAGAATCGTGAACTGACCAATACCTTCACCACCGGCGAGGTGGCACGCTGCAGCATGCCCAACTGCACCAGTCAGCGGGGCGAGAGTAACCTCAAGTTCTATAACTTTCCCAAGGATATTAAGAGTCTGATCAAATGGTGCCAGAATGCACGTCTGCCCGTCCAGGCCAAGGAGCCGCGACATTTCTGCAGTCGTCACTTTGAGGAGCGCTGCATTGGCAAGTTTCGTCTGAAGCCCTGGGCTGTGCCCACATTACATTTGGGTGCACAGTACGGCAAGATCCATGACAATCCGAAGAACTTGTATGTGGAGGAGAAACGCTGTTGTCTGAACTTCTGTCGTCGCAGTCGATCCTCCGACTTTAATATGTCCCTCTATCGCTTTCCTCGGGATGAGGTGCTGCTACGTCGCTGGTGCTACAATCTACGATTGGATCCTTCTGTTTATCGCGGCAAGAATCACAAAATATGCAGTGCTCACTTTATCAAAGAGGCTTTGGGACTACGCAAGTTATCGCCAGGAGCTGTGCCCACGTTGCACTTGGGACACAACGACACGTTCAACATCTACGAGAATGAATTGTGGCCACCACCAGCGCCGACTACGCCCACcaatcatcagcagcagctgcagcagcatcagttgcagcagcaccaacaacagcagcagcatcaatcGCATCACGGTCATCATGGCAACAAATATCAGCGTCATTCGGCCGCATCGACCTCTTCGTCGGCCAGCTCAGCATCGCATTATGTGGATCCGGAGATGAGTGGCTCGTATATGGGAGTGGGCAACTCGGGAGGATCGGCATCAGGCATGAATGTAAGCGACAGCATGGATGTGTGTTGTGTGCCCAGCTGTGAGAGTAAGCGGCACAACAGTGAGAACATTACATTCCATACGATACCCAGGCGACCGGAGCAGATGAGCAAATGGTGTCACAATCTCAAGATACCCGAGGACAAGATGCACAAAGGTATGCGCATCTGTAGCCTGCACTTTGAGCCCTATTGTATTGGTGGTTGTATGCGTCCATTTGCGGTGCCCACACTGCAACTGGGCCACGACGATGAGGACATTCATCGCAATCCGGATGTGATCAAGAAGCTCAACATACGCGAGACCTGCTGTGTGGCTGTCTGCAAACGCAATCGAGATCGTGATCATGCCAATCTCCATCGCTTTCCCAGCAATATCGCCCTGCTGACCAAATGGTGTGCCAATCTGCAACGTCCAGTGCCGGATGGCACTAAGCTCTTCAACGATGCCATCTGTGAGGTGCACTTCGAGGATCGTTGTCTGCGCAACAAACGGTTGGAGAAATGGGCTGTGCCCACTTTGATACTGGGTCATGAGAACATAGCGTATCCACTGCCCACGGCGGAGCAGGTGGCCGAGTTCTATGCTCGTCCCAGTGCACCCAACAATGGCGAGGAGCAGGGTGAGTGCTGTGTGGAGACTTGTAAGCGTAATCCCAGCGTGGATGACATCAAGCTCTATCGTCCGCCCGAGGAGTCACAAGTGCTGGCCAAGTGGGCACACAATCTGCAGGTGGATGTTGCCAAATTGACCAATCTGAGGATCTGTAATCTCCACTTTGAATCCCATTGCATTGGCAAACGCATGCGTCCTTGGGCCATACCCACGCTCAACCTCGCCACGAATATTGAGAATCTCTACGAGAATCCGGAGCATCAAATGCTCTACAAACGTCGCAAGCATCTCAATACTGGACGCAGTGCGGGCTCTCATGACGGTGGCATGGTGAAACCGACGTGGGTGCCACGCTGCTGTTTGCCACATTGCCGTAAGGTGCGTGCCCTGCACAATGTCCAGCTCTATCGGTTCCCCAAGCTCAACCGTTCCACGCTGGCCAAGTGGGCGCACAATCTGCAGGTGCCGCTAGTGGGCAGTGCCCAGAGGCGGCTCTGTTCCGCCCACTTTGAGCCACATGTGCTGAGTAAGAAGTGCCCCGTGCCACTGGCAGTGCCCACACTGGATCTGAACTCACCACCCGGCTACAAGATCTACCAAAACCCCGCCAAGCTCAAGGCCAACAAGCTGTGCCTGCAGCGTGTCTGCATTGTGGAAAGCTGTCGTCGCCAACGTGGTCAGGGTGTGCAGCTCTTCCGGCTGCCGCATAATCCCACCCAGCTGCGCAAGTGGATGCATAACATAAGGATGCGACCCAGAGGCGCTATGCGGCAACAGTATCGCATGTGTTCCATACACTTTGAGACGCACTCCTTCAATGGCAAGCGATTGAGTGCAGGTGCGATACCTACGCTGGAGCTGGGACATGACGATGATGATATCTATCCCAATGAGGCGCAATCCTTTGTCGAGGAACACTGCACCGTCGAGGGTTGTGAGGCGTCCAAGGAGCAGCCGGATGTACGGCTCTTCCGCTTCCCTACTGACGATGAGGATCTGCTCTGGAAGTGGTGCAATAACCTCAAGATGAATCCTGTCgattgtgtgggtgtgcgcaTTTGTAACAAACACTTCGAGCCCGACTGCATTGGGCCCAAGCATTTGTATAAGTGGGCGATACCCACCATGGAGCTGGGACACGATGATGACCAAATCGAGCTCATCGACAATCCAAAGCCAGAGGATCGCTACGTGGATCCGGTGTTCAAGTGCTGTGTGCCCACCTGCGGCAAGACGCGCAAGTTCGATGAGGTACAAATGAATAGCTTCCCCAAGGATCCCGTTGTCTTCCAGCGCTGGCGACACAATCTTCGTCTCGAGCATCTGAATTTCAAGGAGCGGGAACGCTATAAGATCTGCAATGCTCACTTCGAGGACATCTGCATTGGTAAGACACGTCTTAACATTGGTTCTATACCCACACTGGAACTAGGACACGACGAGACCGAAGATCTTTACCAGGTGAATCCAGAGGAGTTGCAGAGCAATCTCTTTGGACGTCAGCGACGTGTGCACGAAGCGTTGGGCATGGCCATCAAGCAGGAGGAGGGTGAGGAAGAGGAAGTGGAAGAGGAGGAACACTCTGAGCTGGATGAGGACATCAAGCCGGACATTAATCTGCTACAAGCGAAGGCATCACAGGTAAAAATGAAGAGATCTGCGTCGGATCTGAAGTGCTGTGTGCCCAGTTGTGGTCGCAGCCGTTTGGAACATGGCGCACGTCTCTTTCCCTTCCCCAGTGGCAAGCAACAGCAGACCAAATGGCGTCATAATCTTCGCCTAACGCCCCACGATGTGGATCGCAGCACACGTGTCTGCAGCGCGCACTTCAATCGTCGTTGCATCGATGGCAAGCAGCTGAGAGGCTGGGCCATGCCCACTCTACAGTTGGGACACCAGGAGCAGCCTATCTATGAGAATCCCAAGAATATACCTGGCTTCTTTACGCCCACCTGTGCACTAGCCCATTGCCGTAAACGTCGTAGCATTGACAATGATCTGCGCACCTATCGCTATCCCCGCAGCGaagatctgctcgagaaatgGCGTGTGAATCTGCGCCTGGCGCCGGATCAGTGCCGTGGACGCATTTGTGCCGATCACTTTGAGCCGATGGTGCGTGGCAAGCTGAAACTGAAGACGGGAGCGGTGCCCACATTGAAACTGGGCCATGATGAAGGTGTTGTCTTTGACAACGAGGTCATTAAGGCGGGTCTGCAGCAGGAGGCGGACGAAAATGAGGCAAGCATGGACTCGCTAGTTAGGGTCAAGCAGGAAAAGATCGAAGCAGAGGATGATGAGGACGAGGAGACGGTAGAGAAGCAACATCAGGAGGAGGATCATGGCTACTTTGATCCCCTGGAGTTAGTGGAAACCTTTGCGGAGCAGCACAGCGAGGAAAACACAGCTGGCGATGAGCTCaacgatgatgaggatgatgaAGATGACGATGTGAATGACGATGAGGATGACGACGAGGATGAGGCtggcgatgatgatgagctgctgctgccggaTACGCCGCCAATTCGTATGCCGCTGCCTCCCATGCCAGCAAGACGCGAGAAGGCCGTGAACAATGTCACGCCCATTTGTTGTCTCAAGCATTGTCGCAAGGAGCGCACAGCCACGCATCCGTTGAGCACTTTTGGCTTTCCCAAGGATCGCCAGCAGCTGCTCAAGTGGAGCGCTAATCTGCAGCTGCCGCTGGAGGATTGCATGGGACGCGTCTGCATCGAACACTTTGATCCCGAGATGCTGGGCACCCGTAAGCTGAAGCAGAATGCGGTGCCCACTCTGAATCTGGGACATGCAACACCGCTGCAGTACAGCTGCAATGGTCAATCTGTGGCCGTCTATGGGGAACAGCCGGAGCATTCGGTTTTTCGGCTTTGGAGCCTGAAACATTGTCGCAAACGGAAGCTTCCAATGGAGCCACCGAATCAGACAGCGACTAAGCGACGACGCTGCTGCCTGCCCAGCTGTGGCAAGCAGCCGGATCTTCATGGTGTGCAGTTGCATCGATTGCCCACCAATCGCATACAGTTGCGCAAGTGGCTGCATAATCTTAAGCTATCACCCATGGTGGACAGCAGTCAGGCGCGGATTTGTAGCGAACACTTTGAGACGCAGCTGGAGACGCTCGAGGATTCTGTGCCCACGTTGCGTCTGGGCCATGACGACACACATATCTATAGGAATCGTGGTAATGCCAGTGGTAGTGCTAGTGGTATCTCGTCCTCATCCAGTGCCTGCATGGTGCCCAGTTGTCCATGTGCGCGTCTCAATCTGTATCGCTGCTATGATCTGCCCGAGAATCGTCTGGTGCAACAGGCCTGGCTAAAGTGGCTAGAGCAACCCATGCCCCAGTTGGCCAGTGATGGCAAGCTCTGTGTGATGCACTACATGCAGCTCTACGAGCAGGTTCCACTGCCACCAGAGTTGCCCCAGTTGGTGTTACGTCGTCTGCAGGAAACCTATGATTTAATCGCCGGCTCCACAATGGCCATGAAGCTACGCTGTGCCGTGCCAGGCTGTTACTCCAAGTACACGGATAACATACGGCTCACCAAGCTGCCTACGTGCCCGGAGACCTGTGCTAAGTGGGTGCACAACACCAAGATTAGCTATGAACCATCCCGTCACTACATTTATCGCATTTGTATGCTGCACTTTGAGCCACGCTGCCTGGGTCCAGTGCGTCCCAAGCAGTGGGCGGTGCCGACGCTGCTCTTGAATCACCAGGATGCCAAGATCTATCGTAATCCCAAGCTGGACACCAGCGCTGATAACCAGTCAGGCTCTGCCTTGTCCCTGTCGGATCCCATAGCCATTTCCACGCCTGTGCCCATAGCCATGTCTGCTTCCGTACCCGTGGAGCTACCGCTGCGCATTAAAACGGAGCTCGCCTTCAGTGGCAGTCCCTGTGCCAGCGCCAGTGCAAGTCCCAGTCCACGTGGCAGGCTACGCATCTGCTGCATTCCAAGCTGTGCCCAGCAAGCCTCCAGTCAGACCCGTCTCTATCGTTTTCCCACCGCCGAGACGCCGCTGCTCAAGTGGCTGGTGaacacacagcagcagcccAGATTGGTGGACACCACACAGTTGTTTGTGTGCCAGGATCACTTCGAGACGGAGGCCATTTGCAAGAATCAGCTGCGTAGCTGGGCTGTGCCCACGCTTAAGCTGGGACACGATGGTCATGTCATACCCAATGCCAGGCACAATGGCAACATTGCGGACAGCCAGGAGAACAAAACGACGCTGCAGTTCATCTGGGAGAACTATTGCTCGGTGCTCAGCTGCTTCCAGCCACGTTCGGAGCAACTGCGTCTCTATGCCTACCCCAAAGATCGGCCCACCATACGCAAGTGGGCCACCAACTGCAAGCATCGTTCTATGCAGGCCAGCAGTGATGGCTTCCAGGTTTGTCAATCGCATTTTGGTCCGCATTGCTTTGACCCGGACACGGGTGAGCTGCGGGAGGATGCTGTGCCCACGTTGGAGCTCAGTCGTTGCCTCAATGAGATGCGTTGTGTGGTGGCTAATTGTCATCCTGTGCACACAGAGGATGCACCACGTCGTCGCTACTACAAATTGCCCAAACGCTACGCTCAGCTAAACATTTGGTGTCACAATCTTGGCCTGGACGCCGCTGCTTTGGGCTCTAGTGAGCATCACGTCTGCGATCGTCACTTTGAGATGCAGTGCTTCAATCCACAGAAGCTACTACGTCCCGGCGCACGTCCCACGTTGCATTTGGCACATGAGCAGCCAATAGAACTGTTACCCAATCCGGAGAATTTGGGCAGCTACGTTGAAGTGCCCGAGTCCATGGTCTGTTGTGCGCCCAACTGTGGACAAACCAAGGAGGATCCAGATGTGCAGCTCTTTAGCTTCCCCAAGATGCGTACACTGGCAGAGAAGTGGCTGCAGAACCTACGCCTGGAAGCGGGCAGGGAACAGTTGCTGAAAATGAAGATCTGCGGCGCACACTTTGAGCCCAGTTGTGTGGAGAACAAGCGTCTTCAGCTGGGTGCCATGCCCACATTACAATTGGGACACGAGGAGCATCACAATATACATCGCAGTGCTGAGCCGAATGTGGGCAAGGTCAAGAAATATTGTAATCGCAGTGGTTCCAGCTATGAGTGCTGTTATCCCAACTGTGTGGAGCTGCAGAAAACATATCTGAGAATCAGCTACGATCTGCCCGAGGACGAGGCACTGCGTCAAAAGTGGCTGGAGCATATGGACATAGTGGATGCGGAACAGAAGCCACTGAAGCTTTGTCCGATGCACTTGGTCATACTCTATGATCACAGTGATGAGCACTTTGCAGAGCATATCAAGGAGGAACTGCTGTACTCCAACTATGAGGATGCAAGGAACAGTGTGCGCATACGGGTCATCAGCTGTGCGGTGCGTGGTTGTCGTACCCTCAAACCAAGAGACGGTGGACGATTGCATGGTCTGCCTCAGCGTCGGGATGTGCTCGAGATGTGGCTATATAACATGCAGCTGGTGTTCTATGAGCACCAGCGATATTTGTACAAAATCTGTAGTCGACACTTTGAGCCCATTTGCTTTATGGACACCACGCGACGCATGAAGCCCTGGACTATGCCAACGCTGGAGCTGCCAGAGCGTGAGCCAGGCGAGGCACCTCCTTATCAGAATCCCACCGAGGAGGAGTGGCAGCGCATGAATGAACTGTTTGCCGTAGAGCAGCAGGAAATgcagctggaactggaacaggagcagcagcagcaggaacaactAAAACAGGAGCCATACCAGGAAGAGCAGTACGAGGAAGATTGTGATTTGCTGGAACCGATTGTGAAGATTGAGCACATGGGAAATGAAGATCAATTCGATGAGGAGCCTGAGTATCagcaggaggagcagcagcgagAAGAGTTCGAGGAGGATGACtatgacaacgacaactcaCAGCAGCCACTGGAGGTGCTACTTGAGGTGGGACACGTTGAGAAGTGCACCACCTATGAGCAAATGGACGCCGAGGCCGATCAAAGCTATGCCGCCGCCGCAGCCGAGAAGCAACTGAGCAGTTttaatgcagcagcagcatcaacgcCGCAACATGGTAGTGGCCACATGGTCAACAATGGCCAAATTGTCAAGTACAATGCTCGGCACTGCAGCGTGCGTGGATGTGATGTGACGGCCAATGATGTCAATGGCACCATCAAGCTGCACAAGTTCCCTACATCGCTGGATGCCATGAAGAAGTGGATGCACAACACCCAGGTGGATGTGGACATCAATTTCGCTTGGCGTTTTCGCATTTGTAGCTACCATTTCACCAATGAATGCTTCAATGGCTCACGCATTCGACGTGGCTCAATGCCCACCTTAAGCCTCGGTCCACGTTGTCCACGCAAAATCTACTACAATGAGTTCAATACAACGCTGCAGTTGGAACAGGATCAGTCCAATGATGTGGACAACGAGGAGCAGCCACAAACGAAACTGGACACGAAGCATGGCAGCACAAAGGGTGGAAAGATCAGTCTGCGGCTGCCACATCCTGCGCCGCCACGTAAATCTAGTAAATACTGTCAGATCGATGGTTGTCCCAATCACTTGACCAGCGAGAATCTCACACTGCATAAGTTCCCGCATTCGGTGGACATGTGCGCCAAGTGGCAGCACAATACACAGGTGCCATTTGATCCAGAGTTCCGTTGGCGTTATCGCATCTGCAGTGCCCACTTTGAGCCCATCTGTCTGATGAACATGCGCCTGATGCACGGCAGTGTGCCCACCCTGCTGCTGGGACCACGTGCGCCTCGTCAGCTCTTCGATAGTGACTTTGAGGCCATAAGCCTGCGACTGGACAAACAGAAGAGTGGATCAGAGCAGCCGGAGCACATGCTGCTGGAGCCAGAGGATGGGGATGAAATGGGCTATCTTGAGCCGGAGATGGAGCTGTTGGAGGATGCCGAAGCGGAGCTATCGGATAATCCCAATGATAGCTGGAAGGATCAGCCTTTGCCTGGTATTAAGATGGAGACGGGTACCAGCTATAATCCTGTGAAGTCTGGCTATGACAAGTGCTCCTTGGTGCACTGCCAGCGTCAGCGTTCCATGCACGGTGTCCACATCTATAAGTTTCCACGCTCacggcaactgcagcaacgTTGGATGCACAATCTACGCATTCGCTATGATGAACGTCGTCCCTGGAAGACCATGATATGCAGTGTACACTTTGAAGCCAATTGCATACGTCTGCGTAAGCTGCGTCCCTGGGCGGTGCCTACGCTGGAGTTGGGCGATAATGTACCCGATCAGATCTATACGAATGAGCAGTGCCGCCAGCAGCTGGAGGCGGGCAGTAGTGACAATGAGGAACTCGGTCTGGATGCGTCCATGGAGGAGGATCTGGCTTTGGAAGACGATGACTATGCGGATGAAGACGATGACGTGCTGGCCACGGAGCCATTGGTAAAGAGAGAGCGTCGCTCTAAGTTTGATGCATATCCACCGGGTCAGTTGCCGCCTTGGAAACTTAAGTTCTGCTCCTTGCCCTATTGCCGTCACCCACGTGGCGATGGCATCAAGCTCTTCCGGCTGCCCAATAACATCAGTTCCATACGCAAATGGGAACACGCGACGGGCATTAAATTCACAGAGTCCCAACGCAACACGAAGCTCATTTGCAGTCGTCACTTTGATCCGCAACTGATTGGAGTGCGTCGTCTGATGTACAATGCGGTGCCCACATTGCATTTGGGGCCAATGAGTGATTTGGTTGAGCCAGCGCCAACTACTCCTGCTCCACGTTGCTATATGCCCAATTGCCGGGAGGACGAGAAGCTGCACAAGTTTCCTAGTGATCCCGGGCTGCTGCAGCAGTGGTGTCACTCACTGAATCTCTCGTATACTGCAAACTATAGCGGCAAACACATCTGTGCCTTCCATATGCCCGATCTGGGACCGTGCTGCGTAGTCTGTGGCACGGAGGACATGCAGTTGCCATTGCTAAACTTCCCGGAGAATCGCAATCAACGCGCCAAATGGTGCTATAATCTCAAAATCGAATCCATAGCCAAGTGGGATACCTCTAAGCAGATATGCAGCAAGCATTTTGAGAGCTACTGCTTCGCACAGCCGCAGGGTCAACAGCTGCTACCTGAGGCAGCGCCCACGTTACACCTGCGACACAACGATAGCAACATATTCCTTAACGATTACGAGGTCACCGAACAAGATCCAAGCAGAATGTTGGCCATAAAGGATGAGCCCTTGGACAGTAGCGATGATCTGATGctgtaa
Protein Sequence: MSQHNNHPPHHHHHHYYQQQQQQQQQQHHNHHQQQQQQQQLQHKQIQQHSWYSHVASYPPHHPHAAAFAAPCKTNNNNNNNIMNAYGTGAGGAHAAYYGSGGVGGYNLEGNTVAYAHNQLLQYQQQQQQQQQQQQQQHHQLSQRSYMAHSLMHGSYPYIKSEPLELSDDRQRQQQQQPLHHQQQQQQQQQQQHFQNPMAPPPAPANRHSLDASGEMIIKSEPVDEHAFKSNYIDDNTPFADFSKYPEFGDDMLSPKVELSVKDEGYGNHKVPNPLSYPRRKLQSERSSEVLPICQRCKEVFFKKQIYVRHVAESSCTIQEYDFKCNICPMSFMSTDELQKHKHLHRADKFFCHKYCGKYYDTIADCESHEYMHHEYDSFVCNMCSVTFATREQLYAHLPQHKFQQRYDCPICRLWYQTAHELHEHRLAAPYFCGKYYVGSQSAAAHQQQQHPQHQQQVGYKLQDCHMGTMEMATPHHKSNAAATSLPATAALSSLLQQRQANADGAALFASNLKNESNVKLERSYSNSTSESGYSLHDSSYNNAYGSDNSLHAGGAGGGALGGPQAHSSTLDDSEDALCCVPLCGVRKSTSPTLQFFTFPKDEKYLHQWLHNLKMFHIPQSSYSTFRICSMHFPKRCINRYSLCYWAVPTFNLGHDDVANLYQNRELTNTFTTGEVARCSMPNCTSQRGESNLKFYNFPKDIKSLIKWCQNARLPVQAKEPRHFCSRHFEERCIGKFRLKPWAVPTLHLGAQYGKIHDNPKNLYVEEKRCCLNFCRRSRSSDFNMSLYRFPRDEVLLRRWCYNLRLDPSVYRGKNHKICSAHFIKEALGLRKLSPGAVPTLHLGHNDTFNIYENELWPPPAPTTPTNHQQQLQQHQLQQHQQQQQHQSHHGHHGNKYQRHSAASTSSSASSASHYVDPEMSGSYMGVGNSGGSASGMNVSDSMDVCCVPSCESKRHNSENITFHTIPRRPEQMSKWCHNLKIPEDKMHKGMRICSLHFEPYCIGGCMRPFAVPTLQLGHDDEDIHRNPDVIKKLNIRETCCVAVCKRNRDRDHANLHRFPSNIALLTKWCANLQRPVPDGTKLFNDAICEVHFEDRCLRNKRLEKWAVPTLILGHENIAYPLPTAEQVAEFYARPSAPNNGEEQGECCVETCKRNPSVDDIKLYRPPEESQVLAKWAHNLQVDVAKLTNLRICNLHFESHCIGKRMRPWAIPTLNLATNIENLYENPEHQMLYKRRKHLNTGRSAGSHDGGMVKPTWVPRCCLPHCRKVRALHNVQLYRFPKLNRSTLAKWAHNLQVPLVGSAQRRLCSAHFEPHVLSKKCPVPLAVPTLDLNSPPGYKIYQNPAKLKANKLCLQRVCIVESCRRQRGQGVQLFRLPHNPTQLRKWMHNIRMRPRGAMRQQYRMCSIHFETHSFNGKRLSAGAIPTLELGHDDDDIYPNEAQSFVEEHCTVEGCEASKEQPDVRLFRFPTDDEDLLWKWCNNLKMNPVDCVGVRICNKHFEPDCIGPKHLYKWAIPTMELGHDDDQIELIDNPKPEDRYVDPVFKCCVPTCGKTRKFDEVQMNSFPKDPVVFQRWRHNLRLEHLNFKERERYKICNAHFEDICIGKTRLNIGSIPTLELGHDETEDLYQVNPEELQSNLFGRQRRVHEALGMAIKQEEGEEEEVEEEEHSELDEDIKPDINLLQAKASQVKMKRSASDLKCCVPSCGRSRLEHGARLFPFPSGKQQQTKWRHNLRLTPHDVDRSTRVCSAHFNRRCIDGKQLRGWAMPTLQLGHQEQPIYENPKNIPGFFTPTCALAHCRKRRSIDNDLRTYRYPRSEDLLEKWRVNLRLAPDQCRGRICADHFEPMVRGKLKLKTGAVPTLKLGHDEGVVFDNEVIKAGLQQEADENEASMDSLVRVKQEKIEAEDDEDEETVEKQHQEEDHGYFDPLELVETFAEQHSEENTAGDELNDDEDDEDDDVNDDEDDDEDEAGDDDELLLPDTPPIRMPLPPMPARREKAVNNVTPICCLKHCRKERTATHPLSTFGFPKDRQQLLKWSANLQLPLEDCMGRVCIEHFDPEMLGTRKLKQNAVPTLNLGHATPLQYSCNGQSVAVYGEQPEHSVFRLWSLKHCRKRKLPMEPPNQTATKRRRCCLPSCGKQPDLHGVQLHRLPTNRIQLRKWLHNLKLSPMVDSSQARICSEHFETQLETLEDSVPTLRLGHDDTHIYRNRGNASGSASGISSSSSACMVPSCPCARLNLYRCYDLPENRLVQQAWLKWLEQPMPQLASDGKLCVMHYMQLYEQVPLPPELPQLVLRRLQETYDLIAGSTMAMKLRCAVPGCYSKYTDNIRLTKLPTCPETCAKWVHNTKISYEPSRHYIYRICMLHFEPRCLGPVRPKQWAVPTLLLNHQDAKIYRNPKLDTSADNQSGSALSLSDPIAISTPVPIAMSASVPVELPLRIKTELAFSGSPCASASASPSPRGRLRICCIPSCAQQASSQTRLYRFPTAETPLLKWLVNTQQQPRLVDTTQLFVCQDHFETEAICKNQLRSWAVPTLKLGHDGHVIPNARHNGNIADSQENKTTLQFIWENYCSVLSCFQPRSEQLRLYAYPKDRPTIRKWATNCKHRSMQASSDGFQVCQSHFGPHCFDPDTGELREDAVPTLELSRCLNEMRCVVANCHPVHTEDAPRRRYYKLPKRYAQLNIWCHNLGLDAAALGSSEHHVCDRHFEMQCFNPQKLLRPGARPTLHLAHEQPIELLPNPENLGSYVEVPESMVCCAPNCGQTKEDPDVQLFSFPKMRTLAEKWLQNLRLEAGREQLLKMKICGAHFEPSCVENKRLQLGAMPTLQLGHEEHHNIHRSAEPNVGKVKKYCNRSGSSYECCYPNCVELQKTYLRISYDLPEDEALRQKWLEHMDIVDAEQKPLKLCPMHLVILYDHSDEHFAEHIKEELLYSNYEDARNSVRIRVISCAVRGCRTLKPRDGGRLHGLPQRRDVLEMWLYNMQLVFYEHQRYLYKICSRHFEPICFMDTTRRMKPWTMPTLELPEREPGEAPPYQNPTEEEWQRMNELFAVEQQEMQLELEQEQQQQEQLKQEPYQEEQYEEDCDLLEPIVKIEHMGNEDQFDEEPEYQQEEQQREEFEEDDYDNDNSQQPLEVLLEVGHVEKCTTYEQMDAEADQSYAAAAAEKQLSSFNAAAASTPQHGSGHMVNNGQIVKYNARHCSVRGCDVTANDVNGTIKLHKFPTSLDAMKKWMHNTQVDVDINFAWRFRICSYHFTNECFNGSRIRRGSMPTLSLGPRCPRKIYYNEFNTTLQLEQDQSNDVDNEEQPQTKLDTKHGSTKGGKISLRLPHPAPPRKSSKYCQIDGCPNHLTSENLTLHKFPHSVDMCAKWQHNTQVPFDPEFRWRYRICSAHFEPICLMNMRLMHGSVPTLLLGPRAPRQLFDSDFEAISLRLDKQKSGSEQPEHMLLEPEDGDEMGYLEPEMELLEDAEAELSDNPNDSWKDQPLPGIKMETGTSYNPVKSGYDKCSLVHCQRQRSMHGVHIYKFPRSRQLQQRWMHNLRIRYDERRPWKTMICSVHFEANCIRLRKLRPWAVPTLELGDNVPDQIYTNEQCRQQLEAGSSDNEELGLDASMEEDLALEDDDYADEDDDVLATEPLVKRERRSKFDAYPPGQLPPWKLKFCSLPYCRHPRGDGIKLFRLPNNISSIRKWEHATGIKFTESQRNTKLICSRHFDPQLIGVRRLMYNAVPTLHLGPMSDLVEPAPTTPAPRCYMPNCREDEKLHKFPSDPGLLQQWCHSLNLSYTANYSGKHICAFHMPDLGPCCVVCGTEDMQLPLLNFPENRNQRAKWCYNLKIESIAKWDTSKQICSKHFESYCFAQPQGQQLLPEAAPTLHLRHNDSNIFLNDYEVTEQDPSRMLAIKDEPLDSSDDLML

Similar Transcription Factors

Sequence clustering based on sequence similarity using MMseqs2

100% Identity: iTF_00478760;
90% Identity: iTF_00478760; iTF_00569010;
80% Identity: -