Basic Information

Insect: Drosophila mauritiana
Gene Symbol: -
Assembly: GCA_004382145.1
Location: NC:19242503-19256573[-]

Transcription Factor Domain

TF Family: THAP
Domain: THAP domain
PFAM: PF05485
TF Group: Zinc-Coordinating Group
Description: The THAP domain is a putative DNA-binding domain (DBD) and probably also binds a zinc ion. It features the conserved C2CH architecture (consensus sequence: Cys - 2-4 residues - Cys - 35-50 residues - Cys - 2 residues - His). Other universal features include the location of the domain at the N-termini of proteins, its size of about 90 residues, a C-terminal AVPTIF box and several other conserved residues. Orthologues of the human THAP domain have been identified in other vertebrates and probably worms and flies, but not in other eukaryotes or any prokaryotes [1].
Hmmscan Out: # of c-Evalue i-Evalue score bias hmm coord from hmm coord to ali coord from ali coord to env coord from env coord to acc

1 29 7.1 1.1e+04 -3.1 3.0 38 62 331 358 324 374 0.60

2 29 2.8e-15 4.2e-12 46.3 3.9 1 86 565 637 565 638 0.85

3 29 1.1e-14 1.7e-11 44.3 5.0 1 87 665 734 665 734 0.83

4 29 1e-15 1.6e-12 47.6 0.2 1 87 756 828 756 828 0.85

5 29 4.8e-16 7.3e-13 48.7 5.5 1 87 926 996 926 996 0.82

6 29 1.5e-14 2.2e-11 43.9 3.4 1 86 1020 1091 1020 1092 0.82

7 29 3.7e-13 5.6e-10 39.5 1.3 1 87 1127 1195 1127 1195 0.80

8 29 9.3e-11 1.4e-07 31.8 1.4 1 86 1235 1304 1235 1305 0.76

9 29 5.1e-17 7.7e-14 51.8 0.4 1 86 1332 1401 1332 1402 0.83

10 29 1.6e-12 2.5e-09 37.4 1.5 1 85 1423 1491 1423 1493 0.80

11 29 2.5e-13 3.8e-10 40.0 0.7 1 86 1520 1591 1520 1592 0.84

12 29 4.5e-13 6.9e-10 39.2 3.0 1 85 1665 1733 1665 1735 0.82

13 29 5.4e-13 8.2e-10 38.9 0.1 1 87 1758 1827 1758 1827 0.81

14 29 3e-13 4.6e-10 39.7 2.4 1 87 1960 2029 1960 2029 0.80

15 29 3.6e-10 5.4e-07 29.9 0.3 1 86 2132 2198 2132 2199 0.79

16 29 5.7e-06 0.0086 16.4 0.0 1 59 2214 2262 2214 2277 0.79

17 29 4.1e-12 6.2e-09 36.1 0.5 1 87 2291 2361 2291 2361 0.82

18 29 2e-12 3e-09 37.1 0.7 1 87 2417 2487 2417 2487 0.83

19 29 1.8e-11 2.7e-08 34.1 0.2 1 86 2522 2593 2522 2594 0.81

20 29 1.8e-11 2.8e-08 34.0 0.0 1 86 2604 2675 2604 2676 0.78

21 29 9.6e-12 1.5e-08 34.9 0.1 1 86 2700 2770 2700 2771 0.77

22 29 0.00034 0.51 10.7 0.1 1 58 2798 2845 2798 2869 0.79

23 29 1.2e-13 1.8e-10 41.1 0.2 1 87 2883 2956 2883 2956 0.83

24 29 5.4e-16 8.2e-13 48.5 0.4 1 86 3078 3150 3078 3151 0.81

25 29 2.4e-12 3.6e-09 36.9 3.7 1 86 3209 3279 3209 3280 0.81

26 29 6.8e-14 1e-10 41.8 4.4 1 86 3377 3447 3377 3448 0.84

27 29 1.5e-11 2.3e-08 34.3 0.1 1 86 3525 3594 3525 3595 0.84

28 29 1.3e-10 1.9e-07 31.4 1.4 1 58 3618 3666 3618 3674 0.85

29 29 2.9e-10 4.4e-07 30.2 1.4 6 86 3677 3741 3673 3742 0.74

#	of	c-Evalue	i-Evalue	score	bias	hmm coord from	hmm coord to	ali coord from	ali coord to	env coord from	env coord to	acc
1	29	7.1	1.1e+04	-3.1	3.0	38	62	331	358	324	374	0.60
2	29	2.8e-15	4.2e-12	46.3	3.9	1	86	565	637	565	638	0.85
3	29	1.1e-14	1.7e-11	44.3	5.0	1	87	665	734	665	734	0.83
4	29	1e-15	1.6e-12	47.6	0.2	1	87	756	828	756	828	0.85
5	29	4.8e-16	7.3e-13	48.7	5.5	1	87	926	996	926	996	0.82
6	29	1.5e-14	2.2e-11	43.9	3.4	1	86	1020	1091	1020	1092	0.82
7	29	3.7e-13	5.6e-10	39.5	1.3	1	87	1127	1195	1127	1195	0.80
8	29	9.3e-11	1.4e-07	31.8	1.4	1	86	1235	1304	1235	1305	0.76
9	29	5.1e-17	7.7e-14	51.8	0.4	1	86	1332	1401	1332	1402	0.83
10	29	1.6e-12	2.5e-09	37.4	1.5	1	85	1423	1491	1423	1493	0.80
11	29	2.5e-13	3.8e-10	40.0	0.7	1	86	1520	1591	1520	1592	0.84
12	29	4.5e-13	6.9e-10	39.2	3.0	1	85	1665	1733	1665	1735	0.82
13	29	5.4e-13	8.2e-10	38.9	0.1	1	87	1758	1827	1758	1827	0.81
14	29	3e-13	4.6e-10	39.7	2.4	1	87	1960	2029	1960	2029	0.80
15	29	3.6e-10	5.4e-07	29.9	0.3	1	86	2132	2198	2132	2199	0.79
16	29	5.7e-06	0.0086	16.4	0.0	1	59	2214	2262	2214	2277	0.79
17	29	4.1e-12	6.2e-09	36.1	0.5	1	87	2291	2361	2291	2361	0.82
18	29	2e-12	3e-09	37.1	0.7	1	87	2417	2487	2417	2487	0.83
19	29	1.8e-11	2.7e-08	34.1	0.2	1	86	2522	2593	2522	2594	0.81
20	29	1.8e-11	2.8e-08	34.0	0.0	1	86	2604	2675	2604	2676	0.78
21	29	9.6e-12	1.5e-08	34.9	0.1	1	86	2700	2770	2700	2771	0.77
22	29	0.00034	0.51	10.7	0.1	1	58	2798	2845	2798	2869	0.79
23	29	1.2e-13	1.8e-10	41.1	0.2	1	87	2883	2956	2883	2956	0.83
24	29	5.4e-16	8.2e-13	48.5	0.4	1	86	3078	3150	3078	3151	0.81
25	29	2.4e-12	3.6e-09	36.9	3.7	1	86	3209	3279	3209	3280	0.81
26	29	6.8e-14	1e-10	41.8	4.4	1	86	3377	3447	3377	3448	0.84
27	29	1.5e-11	2.3e-08	34.3	0.1	1	86	3525	3594	3525	3595	0.84
28	29	1.3e-10	1.9e-07	31.4	1.4	1	58	3618	3666	3618	3674	0.85
29	29	2.9e-10	4.4e-07	30.2	1.4	6	86	3677	3741	3673	3742	0.74

Sequence Information

Coding Sequence: ATGTCACAACAACACCCCCATAACGCCCACCCCCACCACTACGCCCACCACTACCCGCCCCCCGTGACGCCCATGTCCatgcagcagccgcaacagcagcatcagcaggcGCAGCTGTCgcctcagcagcagcagcagcagcacaccAATTGGTACTCACATGTTGCTTCCTACCCCACACCCCACTCGGCCTTCGGCCCCGCCCCCGCCCCCTCATGCAAGGCCGCCAACAACAGTgtcagcggcaacaacaacaacaacattatGGGCGGCGGGGGATACGGGCCGGGGGGTGGTGGCGCGCAGGGCTATTATGGCGCCGCTGGCGGTGGCCTCAATGTCAGTGGGgcggtggtgggtggtggtgggccGAGCTACGGCCTTGGGGCCAACACAGTGGCATATGCCCACAACCAACTGCTGCAgtatcaacaacaacaacaacagcagcagcagcagcaacaacagcagcagcaacagcagcaccaccagcatcTTCCGCAGCACATAAGCCAACAAAGACCCTATATGGGCCACAATATCATGACCGGCAGCTATCCTTATATCAAAAGCGAACCCATGGAGGCCTACCAGCAGCCCCCGAATCCCATGGCCCCGCCCCCGGCACCAGAAGTATTAATAAAATCGGAACCCATTGACGAGCATTCCTACAAGTCCAACTATATAGACGACAATACGCCATTTGCTGACTTCAGCAAGTTCAGCGAATTCAGCGAGGACATGCTGAGTCCGAAAGTGGAGCTGACCGTAAAGGATGAGTCCTACGGAAGGACCACTAGCAGTTTCCTGCGCCGCAAACAACAATCGGATCGGGGCACCGAAAGTCTGCCCATCTGCCAGCGCTGCAAGGAGGTCTTCTTTAAGAAGCAGGTCTATCTCCGCCATGTGGCCGAGAGCAACTGCGGCATCCAGGAGTACGACTTTAAGTGCAGCACCTGCCCCATGTCCTTTATGACCACCGAGGAGCTGCAGCGGCACAAGCTTCACCACCGGGCCGACAGGTTTTTCTGCCACAAATACTGCGGCAAGCACTTCGACACGATCGCTGAGTGCGAGGCGCACGAGTACATGCAGCACGAATACGATAGCTTTGTCTGCAACATGTGCTCCAGCACCTTCGCTACGCGGGAACAACTGTACGCCCACCTGCCGCAGCACAAGTTCCAGCAGCGCTTCGACTGTCCCATCTGCCGCCTGTGGTATCAGACGGCTCTAGAGCTTCACGAACATCGTCTGGCTGCTCCATATTTTTGCGGCAAGTACTACACGGGCGGACAGTCATCTTCTGCCTCCCAATCGCAATCGCAGCAGCACCAGACCAACTACAAGCTGCAGGACTGTCATATGGCAACCATGGAGATGCCCACAACCCCGCACCACAAAACCACTCCATCCGGCTCGTCTTTGCCGGCGACGGCTGCGCTGAATTCTCTACTGCAGCAGCGTCAGGCAAATGCCGACGGAGCTGCCATGTTCGCAGCATCCGCAATGAAGAACGAAGTGAATGTTAAGATGGAGCGAAGCTACAGCAACTCTACCAGCGAGTCATCCTACAGCGTTCAGGACAGTGGCTACAATAATGCCTATGGAAGCGACAGTTCAATGCACGCAGGAGCGATCGCCGGGCCACAGGCGCATTCCTCTACGCTGGACGACTCCGAGGACGCCTTGTGCTGTGTTCCTCTGTGTGGAGTGCGCAAGAGCACGAGCCCCACGCTTCAGTTTTTCACGTTCCCCAAGGACGAGAAGTACCTCAATCAGTGGCTGCACAACCTCAAGATGTTTCACATACCCGCCGCCAGCTACGCCAATTTCCGCATCTGTAGCATGCATTTTCCGAAGCGCTGCATTAACCGCTACTCTCTGTGCTACTGGGCCGTTCCCACGTTCAACCTGGGCCACGACGACGTGGCCAATCTATACCAGAACAGGGAGCTCACCAACACGTTCACCACCGGCGAGGTAGCGCGCTGCAGCATGCCTCACTGTACAAGTCAGCGGGGTGAGAGCAATTTGAAGTTCTACAACTTTCCCAAGGACATCAAAAGCTTGATCAAGTGGTGCCAGAATGCACGACTTCCCGTTCAGGCAAAGGAGCCGCGTCATTTTTGCAGTCGCCACTTCGAGGAGCGCTGTATTGGCAAGTTCCGTCTGAAGCCGTGGGCGGTGCCTACTTTACACCTAGGTGCCCAGTATGGCAAGATCCACGATAACCCAAAGAATTTGTACGTTGAAGAAAAACGCTGCTGCCTCAACTTCTGCCGCCGGAGCCGATCCTCTGACTTCAATATGTCGCTATATCGATTTCCCAGAGATGAAGTTCTCCTGCGACGCTGGTGCTACAATCTCCGCTTGGATCCCGGAGTGTATCGTGGGAAAAATCACAAAATATGCAGCGCCCACTTTATCAAAGAGGCGTTGGGTCTGCGCAAACTATCACCAGGGGCCGTTCCGACGCTTCACCTGGGTCACACTGACACCTTCAACATCTACGAAAACGAACTGTGGCCACCGCCAACGGCACCCAACAGTCACAGCGGTGGTCTCCAGCACCAGACGCAACATCATTCCTCACAACACTCACTGCAACAGCAATTGCACAGCAAATCATACCACCGGCAATCGGCGGCCTCCACGTCCTCCTCCGCCAGCTCGGCAAACTCTCACTACGTGGATCCTGATCTAAGCGCCTCCTACCTTGGCTTAGGTGCCAGTGGATCTTCTGCAATGAATGCCAGCGACAGCATGGACGTGTGTTGTGTGCCCAGTTGCGAGAGCAAGCGGCACAATAATGAGAACATTACATTCCACACCATACCACGCCGACCGGAGCAGATGCGCAAGTGGTGCCATAATCTGAAAATACCCGAAGAAAAGATGCACAAGGGTATGAGGATCTGCAGCCTGCACTTCGAGCCGTATTGCATTGGAGGTTGCATGCGTCCATTTGCGGTGCCTACGCTTAACTTGGGTCACGATGACGACGATATTCATAGAAATCCGGATGTGATCAAGAAGTTAAACATCCGTGAAACGTGCTGTGTCGCAGTGTGCAAACGAAATCGGGACAGGGACCACGCGAATCTGCATCGTTTCCCAAGCAATGTGTCCTTATTGACCAAATGGTGTGGCAACCTCCAGCGGCCTGTTCCGGATGGAAGTAAACTTTTCAACGACGCCATTTGTGAAGTACACTTCGAGGAACGATGTCTGCGCAACAAAAGGCTAGAGAAATGGGCAGTGCCCACACTATCGTTAGGCCACGAAAACATCCCATATCCGCTGCCAACGCCGGAACAGGTTACGGAGTTCTACGCTCGACCCACTGCGCCCAATAATGGCGAGGAACAGGGAGAGTGCTGTGTGGAGACGTGCAAGAGAAATCCCAGTGTGGACGACATCAAGCTCTATCGGCCGCCGGAGGAAGCTTCCGTGTTGGCCAAATGGGCGCACAACCTGCAGACGGAGAGTAGTCAACTGACAAGCATGAGGATTTGTAATCTTCACTTTGAGGCGCACTGCATCGGCAAGCGGATGAGACCTTGGGCTATTCCAACACTAAATCTGGCAGGCAATATAGAGAATCTCTACGAGAATCCGGAGCATTCCATGCTGTACAAGCGGCGGACTCACATGAAAGCCAAGCAGTCGGCTTCCGTGAAGCCCACTTGGGTGCCCAGGTGCTGTCTTCCGCATTGCCGCAAAGTTCGGGCTCTCCACAACGTTCAGCTGTATCGCTTCCCCAAGCTCAATCGCTCCACTCTGGCTAAGTGGGCGCACAATCTGCAGGTTCCTATGGTTGGCAGTGCCCAGCGCCGTCTATGCTCGGCTCATTTCGAGCCGCACGTGCTGAGCAAGAAGTGCCCGGTGCCGCTGGCGGTGCCCACATTGGACTTGAATGCGCCCCCCGGCTTGAAGATTTACCAGAATCCAGCCAAGCTCAAGGCTAGCAAGCTGTGTCTGCAGCGCGTGTGCATTGTCGAGAGTTGTCGTAAGACGCGGGCGCAGGGCGTCCAGCTCTTCCGACTGCCACATAGTCCAACGCAGCTGCGCAAGTGGATGCACAACATCAAAACGCGACCCAGAGCGGCGATGAGGGCCCAATACCGTGTGTGTTCCCGCCACTTTGAGACACACTCTTTCAATGGCCGGAGACTGAGCGCTGGCGCCATTCCCACCCTGGAACTGGGTCATGACGACGAGGACATCTATCCCAACGAAGCGCAGGCCTTTGCGGACGAGCACTGCGTGGTGGAGGGCTGCGAGGCATCCAAGGAACAGCCTGACGTGCGACTCTTCCGCTTTCCCACAGAGGATGACGATATGCTATGGAAGTGGTGCAACAATCTCAAAATGAACCCGGTGGATTGCACCGGCGTGCGCATATGCAATAAACACTTCGAGGTAGATTGCATTGGGCCCAAGCACTTATACAAGTGGGCTATTCCCACCGAGGAACTGGGTCACGACGACGCCGACATCGAGCTAGTGCTAAATCCCAAGCCGGAGGACAGGTATGTGGATCCTGTGTTCAAGTGTATCGTACCGACCTGCGGAAAGACGCGTCGCTTCGACGAAGTCCAGATGAACAGTTTTCCCAAGGACGCGAATCTCTTCGAGCGGTGGAAACACAACTTGCGGCTGGAACACCTCAGCTTCCACGAACGCGATCGGTACAAGATATGCAACTCTCACTTTGAGGATATATGTATTGGAAAGACGCGGCTAAACATAGGTTCGATCCCGACTCTAGAATTGGGTCACGACGAGACGGACGATCTGTTCCAGGTAAATCCGGCGGAGCTGCAGAGCAACCTTTTCGGACGACAGCGGCGAGTACACGACGAGTCGGGCGGAATTATCATCAAGCAGGAGTTTTCCGAGTCGGAGGACGTCAAAACGGACGTGTCTGATACCAAAGATTTCAATACGAGACAGGTTAAGCTCAGAAAGACCATGTCCGATCTGAAGTGTTGTGTGCGCAGTTGTGGGCGCAGTCGACTGGAGCACGGAGCACGCCTCTTTCCATTTCCCACCGGTAAGCAGCAGCACCTGAAGTGGCGCCATAACCTGCGCCTGGAGCCCGACGAGGTGGACCGATCGACCCGGATTTGCAGTGCCCACTTCAACCGGCGCTGCATTGATGACAAACAGCTGAGAAGCTGGGCAATGCCCACGCAACAATTGGGCCACCAGGAGCAGCCGATCTACGAGAATCCGAAAAACATACCAGGATTCTTTACGCCCACCTGTGCTCTGAGTCATTGCCGCAAGCGTAGGAGCATTGACAACGATCTCCGCACCTATCGATATCCGAGGAGTGAGGATCTTCTGGAGAAATGGCGGGCGAATCTGCGTCTGGCGCCGGATCAGTGTCGCGGCAGGATATGTGCTGACCATTTTGAGTCACAGGTGCGTGGAAAGTTGAAGCTGAAAACGGGAGCGGTGCCTACTCTAAATCTGGGCCATGATGAGGGCTTAATCTACGACAATGAGGCTATAAAGGTGGGCATGACCGAAGAAGAGGAAGGCAGCTCGGAGATGCCACGACTGAAACCCAAAAGAGAGCTGATTgatgaagaggaagaagaacTAGAGGCTGAGGAGGAGCCCCATGAGCACGATATGTACGATGAAGATGAGAAGGACGGCCACTACTTCGATCCTCTCGAACTGGTCGAGACCTTTGCCGAACATCCAAGTGACGATGAAGGTGAGTATCGTGGAGATGAGGAGGATGAGCGCGACGAGGATGAGGACCTGGACGAGGCGGAGCACTTTCATCCGGAAAACCCACCCACTCCCCCAACTATCCCTCTGCGTCGCGAAAAGCCCGCTAATAATGTGACGCCCATCTGCTGTCTAAAGCACTGCAGAAAGGAACGCACTGCTTTTCATCTACTGAGCACCTTTGGCTTTCCCAAGGATCGCCAGCTGCTGCTCAAATGGTGCTCCAATCTACACCTGAATCCGGATGACTGCATCGGCCGCGTTTGCATAGAGCACTTTCAGCCGGAGGTACTGGGAACCCGAAAGCTAAAGCAAAATGCGGTGCCCACTCTCAATGTGGGCCACGATGAGCCACTTAGATACTCTTGTAATGGAATAGATCTTGACCAGGAGCAATTGCAGCCACAGCACTCGGTTTTTCGGCTTTGGAGCCTAAAACACTGCCGCAAGAGGAAACTGACGGAGCCGCCGGACATCCGCCAAAGCAAGTGGAGTGCGGAGGTGCGGAAGATGCAGAGATTGAGGATGGAGATGAAAATGAAGATAGGGAGAGAGATCAAGCTGGAGGTGCAGACGGAGAGGGAAATGAAGACCAAGGAAAAGACTCCAATGACGAATCAAGGGAAGATTAAGTTGGTAAGATGTTGCATCAGCTCCTGTGCGAATGAGGACGTTAACCAACTACTTCCGCTGCCTGAGGAGCCAAATCTCTTAAGAAAGTGGCAGCATAACCTAATGTTATCCGTAGACACGGACTTCAAGAAAATCCAAGTGTGTCTAAAGCACTTTGAGGAGCAAGTGGTGCAAAACGGAAAGCCCTTGGAGCAGGCAGTACCCACCTTACAGCTAGATCAAAACAGTTGGAACATCAACAGAAACAGCGGAAGTTGTCTGTTTCCAGAGTGCAGAAAATCTTCATCGGATCGGTTAAGCCTTGTTGATTTACCTGGAAATGCGGTCATAAGAGATGCCTGGATGAGCCACCTTAATTTGCCACCCAGCACTGATGGTCTTCTTTGTAGTGACCACTTTATGCAACTCTTTGAACAGGTGGAATTCCCCAAGGTATTGGCCGCACAAGATTTGGAGGACTTGCAGTGGATTGTTGACGAACTTAAATGCGCTGTTCCCAGTTGTTCGTCCAAATCTGATGGGGATCTTCAGCTCATCCCGCTTCCGGAAAAGGATGCTACCCTTTTGAAGTGGCTACATAACACAAAGATATCTTACGATCATTCAAAGCACAAAAGCTATCGCATATGTGTTCTTCATTTCGAGCCGACTTGCTTAGAGGCGAATTTTCCGAAAGCTTGGGCTATACCCACCTTGCATTTAAGCCACGATGACGAGCTTCATTTGAATCTCAGGCCTGAATCTCGCAGTGGTACTCCAAACAGCAACTCCAGGCTAACTCCATTGAGAATTAAAACAGATCTGGCCTCCTTGGGAAGTCCATGCTCGAGTGCAAGTCCTAGTCCTCGAGGCAGGATCAGGATATGTTGCATTTCCACATGTGGACAGATTGGAAGTAGTCAAGTTCGACTCTACCGCTTTCCCACCGACGAGCAAGCCCTACTGCGGTGGCTGGTGAACACGCAGCAGCAACCTCGCCTTGTGGATCCTGCGGAGCTCTATGTGTGCCAATCTCACTTTGAACCAGATGCCATTTGCAAAAAACAACTTCGTTGCTGGGCAGAACCCACCTTAAACCTAGGCCACGACGGGTTTGTTATCCCCAATGCCAAACACAATGGAAACATTGCTGGGGGTCAGGATACTGAGGAGGCGATGAGGCTTATCCGGGAGCGCTATTGCTCCGTACTGACTTGTTTCCAGGCTGAAGCCAGCGGTGTAAGGCTCTATGAGTATCCCAAGGATATGCCAACTATACGAAAGTGGGCAGCCGCGTGTAGACATCGCTCCATGCAGGCCAGCAGCAATGGATTCAAGGTATGCCAGACTCACTTTGCACCGGAATGCTTCGAGCCGGACACTTTAAATTTGATTGAGGGATCCGTTCCCACTTTGGAGTTAAGTAGAGGCGACATCGAAAGACACTGCCTAGTGTCTGGATGTGAAAAGGATGCAACTGGAGGACGTATGCGCTATTACAAGGTGCCAAAGACCGCTGCTCAACTGAATGCTTGGAGCAACAACCTGAAGATGAGTTCCGTGGACCTCGGATTGGGGGAGCAGCTCATCTGCGAGCGTCACTTTGAGCCCTTTTGCTTCGGTGCCCACAAAGGATTACGACCTGGCGCGCTTCCCACTCTCATGCTAGGGCACGACGAAGAGGTGGAGATGTTACCGAACCCAGAAAGTCTCTGGCAGAAAAAAGATGAGGTTTGCTGTGCCACTGAATGTGGTCGAATTTGGCAGCCTGGAGACACTAAGTTTAGTGGATTTCCTAAATCATTGGCGTTGGCTAAGAAATGGGTTCATAATCTTCAACTGAGCGTAGAAAATGACCAACTGAGCAGTCTGAAAGTCTGCAGTGTGCATTTCGAAGCCTCTCTCTTCAATAAAAGTGGCTTAATATCGGGTTCCATACCCACACTAGAGCTGGGCCATTCCTCTCAGGATATATTTCAGTCGGACACCCAACACATGGGTAAAAGAACCATAATATCGGATCTTGATTGCATTTATCCTGAGTGCAAGGAAATGTGCAAAACCGTGTCATTCAATCTGCCCCAAGAAGAGGACCTACGGACAGCGTGGCTCCGTCACTTGAAGCTCGAAGAGCCGTCGAGTGGTGTCGGTCAGCTATGCCCACTACACTACGTTATTCTTTACGAGCTAAGTATCAAAAGTTTTCCGGAGCACGTTTCAAACCGATTTCTTGAAGAAAACTACTATTCTGCTCGGAACAACAGGCGCGTCAAAATCGTTAGCTGTGCGGTTAAAGGTTGTGAAATGATCAGGCCGCGGGATAAGGTGCTCCTGCACGGGTTGCCGCAAAGGAAGGACATACTGAGAATGTGGGTTGAGAATGGCCAACTGGAGATTACggagccgcagcagcaatatATGCTTAGGGTATGCCGCAATCACTTTGAGTCCCGATGTTCGTTTGACGACAGGCGGCTGCATCCGTGGAGCGTTCCCACTCTGAACTTACCTGGAAATCCGGTGCATCAAATTCCCACTAAGGAGGAGTGGCAGGAAATGACGATAAAATTGACCCAGGAAGCCGATACAATTAAATTGGAGAGAGAGGAGGAACAGGAGGAGGAAGAGCTGCCCGAGGAGGAAGAGCTGCTCGAGGAGGAAGTGGGAGACTGTTCTCTTCTAGAGCCTATTGTAAGAATGGAACACATCGAGTCCGATGAAGAAGACTCAGAGATGCAGGCTCTGGAGGTCCTTCTGGAGGTTGGTCATGTTGAGCGGATGGACAGCTACGAAAGAGTGGATGAGTCCTATACCGAACAAGCCGTCTACCAATCTAATGGCATTAGAAACCAGTACAATGCCAACCACTGCGCCGTTGAAGGATGCGAAGTGACCGTTGAGGACGTAGGCGGGACCATCAAGCTGCACAAGTTCCCCGCATCTTCGGAGGCCGCTAGGAAGTGGATGCACAACACCCAAGTCGACATGGATGAGAAGTTCTGGTGGCGGTATCGAATTTGCAGTTACCATTTCGAGCAGGAGTGCTTTCAGAGCGCCAGGATAAAGAAGGGAGCGATGCCCACTCTTCGCCTGGGACCTAAGAGACCAGACAAGGTGTACGACAACGAATTCGCATTGCAGGAGACTGAGGAGCTCATTGTGCCTGAAGACCTTCATTTTGAGGATCCCAAAAAGCCGAAAAGGGAGGTAATAAAACTGTGTCTGCCAATGCCGGCTCCGCCTCAAAAGTCCAGTAAGTTTTGTCAGATCGAGGGATGTATGAATCACCTGACCACTGAAAACATAACCTTGCACAAATTTCCCCATTCGGAGGACATATGCCTCAAGTGGCAGCACAACACGCAGGTGCCTTTCGATCCTTTCCACCGATGGCGATACCGGATATGTAGTGTCCATTTTCATCCGGTGTGCTTGCTTAACATGAGACTAGTCCATGGCAGTGTGCCCACCTTAAAACTAGGTAGCAAGGCTCCCACCGAACTGTTCGACAACGACTTCGAAGCCATTAACCTCAGGCTGGACAAGAAGTGGGGGACGGACCAAAGTACCGTGCAGATAAAGGAGGAGGATGAAGATTCTATGCCGTCCCTGGAACAAGAACTGCAGCTTCGCGAAGACCAAGAGGTGGAGGAATCAGAAGCTACGCAAGTACCCTTTAACCAGACAAATTGGAAGGGCCAATTGCGATTGCCTGTGAAGCAGGAAAAGGTCACCTACAACCAGGTGAAGTCAGGATACGATAAGTGCTCCTTAAGTCATTGCCAGCGGCAGAGATCTAAGCATGGCGTCCACATCTACAAGTTTCCCAAATCGAGGCTCCAACAGGAGCGTTGGATGCACAACCTCCGCATCCGCTACGATGAGCGAAGGCCATGGAAGTTTATGATCTGCAGCGTGCATTTCGAGCCCCACTGCATCAGCCTGAGGAAGCTGCGCCCCTGGGCGGTTCCCACCCTAGAGCTGGGCGATAATGTGCCGGAGAAGATCTTTACGAACGAACAGTGCCATGAACTCTCCACCGATCGCAGCGAGGCGGAGAGCGATGCCGATGAGGAGGACGGTCTgcaggaggacgaggaggatgaGTACGAAGAGGAAATGGGCCCGGAGGTGCGTATCAAACGGGAACGGCGTTCCAAGCTTGATCCTTGGCCACCCGGTCAGGTTCCTCCGTGGAAAGTTAAGCAGTGTTGTCTTCCTTACTGCCGTGCCTTCCGTGGCGATGGCATCAAACTGTTCCGGCTGCCCAACAACCGCACCTCCATACGCAACTGGGAGCTGGCGACGGGCATGGTGTTCAAGGAGTCTCAACGAAACACTCGTCTGATTTGCAGCCGGCACTTTGAGCCCGAGCTGATTGGCGTAAGGCGTCTCATGCGGAACGCCATTCCCACGAGGCACTTAAGTCCGCAGGAACCGTCCGAGGAAGTAAAGAGAAAGCCGGATCCTCCACTCCCAATCGCAACCTGTTGCATGGCTGACTGTCATCATAATGGAAATGTTAAGCTGCACAAGTTTCCTAGTGACCCGGCGCTACTTAGGCAGTGGTGCCAGGCACTCAGGCTCACGGATACCCAGAGGTACCGGGGCAAACATATCTGCTCGGTCCACCTGCCCACCGACAGGACGGTCAGCTGCGTCATCTGCGGAGTGGAAAACGCCCAGTTGCCGATGCTGGACTTTCCAGAGCAGCGCAATCAGCGCGCCAAGTGGTGCTACAATCTCAAGATCGAGGCCATACCCAAGTGGGACCACTCCAAGCACATCTGCTGTCGTCACTTTGAGTCGCATTGCTTCCTCCAGCCGGGTGAACTGCGCCCAGGTGCAATACCCACACTGCAGCTGAACCACGACGACACGAATATATTCCTCAGCGACTTCGCCACTAGTCCGACAGGCAATCGGATCAAGGACGAGCCGCTGGACAACGACGACATGCTGCTGGTTTAG
Protein Sequence: MSQQHPHNAHPHHYAHHYPPPVTPMSMQQPQQQHQQAQLSPQQQQQQHTNWYSHVASYPTPHSAFGPAPAPSCKAANNSVSGNNNNNIMGGGGYGPGGGGAQGYYGAAGGGLNVSGAVVGGGGPSYGLGANTVAYAHNQLLQYQQQQQQQQQQQQQQQQQQHHQHLPQHISQQRPYMGHNIMTGSYPYIKSEPMEAYQQPPNPMAPPPAPEVLIKSEPIDEHSYKSNYIDDNTPFADFSKFSEFSEDMLSPKVELTVKDESYGRTTSSFLRRKQQSDRGTESLPICQRCKEVFFKKQVYLRHVAESNCGIQEYDFKCSTCPMSFMTTEELQRHKLHHRADRFFCHKYCGKHFDTIAECEAHEYMQHEYDSFVCNMCSSTFATREQLYAHLPQHKFQQRFDCPICRLWYQTALELHEHRLAAPYFCGKYYTGGQSSSASQSQSQQHQTNYKLQDCHMATMEMPTTPHHKTTPSGSSLPATAALNSLLQQRQANADGAAMFAASAMKNEVNVKMERSYSNSTSESSYSVQDSGYNNAYGSDSSMHAGAIAGPQAHSSTLDDSEDALCCVPLCGVRKSTSPTLQFFTFPKDEKYLNQWLHNLKMFHIPAASYANFRICSMHFPKRCINRYSLCYWAVPTFNLGHDDVANLYQNRELTNTFTTGEVARCSMPHCTSQRGESNLKFYNFPKDIKSLIKWCQNARLPVQAKEPRHFCSRHFEERCIGKFRLKPWAVPTLHLGAQYGKIHDNPKNLYVEEKRCCLNFCRRSRSSDFNMSLYRFPRDEVLLRRWCYNLRLDPGVYRGKNHKICSAHFIKEALGLRKLSPGAVPTLHLGHTDTFNIYENELWPPPTAPNSHSGGLQHQTQHHSSQHSLQQQLHSKSYHRQSAASTSSSASSANSHYVDPDLSASYLGLGASGSSAMNASDSMDVCCVPSCESKRHNNENITFHTIPRRPEQMRKWCHNLKIPEEKMHKGMRICSLHFEPYCIGGCMRPFAVPTLNLGHDDDDIHRNPDVIKKLNIRETCCVAVCKRNRDRDHANLHRFPSNVSLLTKWCGNLQRPVPDGSKLFNDAICEVHFEERCLRNKRLEKWAVPTLSLGHENIPYPLPTPEQVTEFYARPTAPNNGEEQGECCVETCKRNPSVDDIKLYRPPEEASVLAKWAHNLQTESSQLTSMRICNLHFEAHCIGKRMRPWAIPTLNLAGNIENLYENPEHSMLYKRRTHMKAKQSASVKPTWVPRCCLPHCRKVRALHNVQLYRFPKLNRSTLAKWAHNLQVPMVGSAQRRLCSAHFEPHVLSKKCPVPLAVPTLDLNAPPGLKIYQNPAKLKASKLCLQRVCIVESCRKTRAQGVQLFRLPHSPTQLRKWMHNIKTRPRAAMRAQYRVCSRHFETHSFNGRRLSAGAIPTLELGHDDEDIYPNEAQAFADEHCVVEGCEASKEQPDVRLFRFPTEDDDMLWKWCNNLKMNPVDCTGVRICNKHFEVDCIGPKHLYKWAIPTEELGHDDADIELVLNPKPEDRYVDPVFKCIVPTCGKTRRFDEVQMNSFPKDANLFERWKHNLRLEHLSFHERDRYKICNSHFEDICIGKTRLNIGSIPTLELGHDETDDLFQVNPAELQSNLFGRQRRVHDESGGIIIKQEFSESEDVKTDVSDTKDFNTRQVKLRKTMSDLKCCVRSCGRSRLEHGARLFPFPTGKQQHLKWRHNLRLEPDEVDRSTRICSAHFNRRCIDDKQLRSWAMPTQQLGHQEQPIYENPKNIPGFFTPTCALSHCRKRRSIDNDLRTYRYPRSEDLLEKWRANLRLAPDQCRGRICADHFESQVRGKLKLKTGAVPTLNLGHDEGLIYDNEAIKVGMTEEEEGSSEMPRLKPKRELIDEEEEELEAEEEPHEHDMYDEDEKDGHYFDPLELVETFAEHPSDDEGEYRGDEEDERDEDEDLDEAEHFHPENPPTPPTIPLRREKPANNVTPICCLKHCRKERTAFHLLSTFGFPKDRQLLLKWCSNLHLNPDDCIGRVCIEHFQPEVLGTRKLKQNAVPTLNVGHDEPLRYSCNGIDLDQEQLQPQHSVFRLWSLKHCRKRKLTEPPDIRQSKWSAEVRKMQRLRMEMKMKIGREIKLEVQTEREMKTKEKTPMTNQGKIKLVRCCISSCANEDVNQLLPLPEEPNLLRKWQHNLMLSVDTDFKKIQVCLKHFEEQVVQNGKPLEQAVPTLQLDQNSWNINRNSGSCLFPECRKSSSDRLSLVDLPGNAVIRDAWMSHLNLPPSTDGLLCSDHFMQLFEQVEFPKVLAAQDLEDLQWIVDELKCAVPSCSSKSDGDLQLIPLPEKDATLLKWLHNTKISYDHSKHKSYRICVLHFEPTCLEANFPKAWAIPTLHLSHDDELHLNLRPESRSGTPNSNSRLTPLRIKTDLASLGSPCSSASPSPRGRIRICCISTCGQIGSSQVRLYRFPTDEQALLRWLVNTQQQPRLVDPAELYVCQSHFEPDAICKKQLRCWAEPTLNLGHDGFVIPNAKHNGNIAGGQDTEEAMRLIRERYCSVLTCFQAEASGVRLYEYPKDMPTIRKWAAACRHRSMQASSNGFKVCQTHFAPECFEPDTLNLIEGSVPTLELSRGDIERHCLVSGCEKDATGGRMRYYKVPKTAAQLNAWSNNLKMSSVDLGLGEQLICERHFEPFCFGAHKGLRPGALPTLMLGHDEEVEMLPNPESLWQKKDEVCCATECGRIWQPGDTKFSGFPKSLALAKKWVHNLQLSVENDQLSSLKVCSVHFEASLFNKSGLISGSIPTLELGHSSQDIFQSDTQHMGKRTIISDLDCIYPECKEMCKTVSFNLPQEEDLRTAWLRHLKLEEPSSGVGQLCPLHYVILYELSIKSFPEHVSNRFLEENYYSARNNRRVKIVSCAVKGCEMIRPRDKVLLHGLPQRKDILRMWVENGQLEITEPQQQYMLRVCRNHFESRCSFDDRRLHPWSVPTLNLPGNPVHQIPTKEEWQEMTIKLTQEADTIKLEREEEQEEEELPEEEELLEEEVGDCSLLEPIVRMEHIESDEEDSEMQALEVLLEVGHVERMDSYERVDESYTEQAVYQSNGIRNQYNANHCAVEGCEVTVEDVGGTIKLHKFPASSEAARKWMHNTQVDMDEKFWWRYRICSYHFEQECFQSARIKKGAMPTLRLGPKRPDKVYDNEFALQETEELIVPEDLHFEDPKKPKREVIKLCLPMPAPPQKSSKFCQIEGCMNHLTTENITLHKFPHSEDICLKWQHNTQVPFDPFHRWRYRICSVHFHPVCLLNMRLVHGSVPTLKLGSKAPTELFDNDFEAINLRLDKKWGTDQSTVQIKEEDEDSMPSLEQELQLREDQEVEESEATQVPFNQTNWKGQLRLPVKQEKVTYNQVKSGYDKCSLSHCQRQRSKHGVHIYKFPKSRLQQERWMHNLRIRYDERRPWKFMICSVHFEPHCISLRKLRPWAVPTLELGDNVPEKIFTNEQCHELSTDRSEAESDADEEDGLQEDEEDEYEEEMGPEVRIKRERRSKLDPWPPGQVPPWKVKQCCLPYCRAFRGDGIKLFRLPNNRTSIRNWELATGMVFKESQRNTRLICSRHFEPELIGVRRLMRNAIPTRHLSPQEPSEEVKRKPDPPLPIATCCMADCHHNGNVKLHKFPSDPALLRQWCQALRLTDTQRYRGKHICSVHLPTDRTVSCVICGVENAQLPMLDFPEQRNQRAKWCYNLKIEAIPKWDHSKHICCRHFESHCFLQPGELRPGAIPTLQLNHDDTNIFLSDFATSPTGNRIKDEPLDNDDMLLV

Similar Transcription Factors

Sequence clustering based on sequence similarity using MMseqs2

100% Identity: iTF_00605601;
90% Identity: iTF_00592421;
80% Identity: -