Basic Information

Insect: Drosophila pullipes
Gene Symbol: -
Assembly: GCA_035043795.1
Location: JAWNMT010000457.1:5561-19733[-]

Transcription Factor Domain

TF Family: THAP
Domain: THAP domain
PFAM: PF05485
TF Group: Zinc-Coordinating Group
Description: The THAP domain is a putative DNA-binding domain (DBD) and probably also binds a zinc ion. It features the conserved C2CH architecture (consensus sequence: Cys - 2-4 residues - Cys - 35-50 residues - Cys - 2 residues - His). Other universal features include the location of the domain at the N-termini of proteins, its size of about 90 residues, a C-terminal AVPTIF box and several other conserved residues. Orthologues of the human THAP domain have been identified in other vertebrates and probably worms and flies, but not in other eukaryotes or any prokaryotes [1].
Hmmscan Out: # of c-Evalue i-Evalue score bias hmm coord from hmm coord to ali coord from ali coord to env coord from env coord to acc

1 28 8.1e-15 1.2e-11 45.1 4.2 1 86 575 647 575 648 0.85

2 28 3.4e-15 5.1e-12 46.3 4.6 1 87 675 744 675 744 0.83

3 28 8.3e-16 1.2e-12 48.2 0.4 1 87 766 838 766 838 0.85

4 28 7.3e-16 1.1e-12 48.4 5.7 1 87 933 1003 933 1003 0.83

5 28 1e-14 1.5e-11 44.7 3.4 1 86 1027 1098 1027 1099 0.81

6 28 1.6e-12 2.4e-09 37.7 1.2 1 87 1134 1202 1134 1202 0.80

7 28 3.6e-11 5.3e-08 33.4 1.9 1 86 1250 1319 1250 1320 0.77

8 28 5.7e-17 8.5e-14 52.0 0.3 1 86 1347 1416 1347 1417 0.82

9 28 4.1e-12 6e-09 36.4 1.3 1 86 1438 1507 1438 1508 0.80

10 28 1.6e-15 2.4e-12 47.3 1.7 1 86 1535 1606 1535 1607 0.85

11 28 7.7e-13 1.1e-09 38.7 0.9 1 85 1683 1751 1683 1753 0.82

12 28 3.7e-12 5.4e-09 36.5 0.1 1 86 1776 1844 1776 1845 0.82

13 28 6e-14 8.9e-11 42.3 0.9 1 86 1998 2066 1998 2067 0.82

14 28 9.8e-12 1.5e-08 35.2 0.7 1 61 2120 2174 2120 2195 0.81

15 28 3.1e-05 0.046 14.3 0.1 1 58 2201 2252 2201 2276 0.79

16 28 3.9e-11 5.7e-08 33.3 0.1 1 86 2291 2360 2291 2361 0.83

17 28 3.3e-14 4.8e-11 43.1 1.3 1 87 2419 2489 2419 2489 0.81

18 28 5.7e-13 8.4e-10 39.1 0.9 1 86 2524 2595 2524 2596 0.82

19 28 1e-13 1.5e-10 41.5 0.6 1 87 2606 2678 2606 2678 0.81

20 28 9e-14 1.3e-10 41.7 0.1 1 87 2701 2772 2701 2772 0.77

21 28 6.6e-06 0.0097 16.5 0.1 1 58 2805 2858 2805 2877 0.84

22 28 8.9e-15 1.3e-11 44.9 0.1 1 86 2896 2968 2896 2969 0.80

23 28 5e-14 7.5e-11 42.5 1.4 1 86 3103 3175 3103 3176 0.80

24 28 1.8e-14 2.7e-11 43.9 2.4 1 87 3239 3310 3239 3310 0.83

25 28 1.8e-14 2.7e-11 43.9 4.5 1 86 3423 3493 3423 3494 0.84

26 28 2.5e-13 3.7e-10 40.3 0.1 1 87 3586 3656 3586 3656 0.85

27 28 4.9e-10 7.3e-07 29.7 0.4 1 58 3673 3721 3673 3735 0.87

28 28 4.4e-08 6.5e-05 23.5 1.3 18 86 3738 3795 3727 3796 0.74

#	of	c-Evalue	i-Evalue	score	bias	hmm coord from	hmm coord to	ali coord from	ali coord to	env coord from	env coord to	acc
1	28	8.1e-15	1.2e-11	45.1	4.2	1	86	575	647	575	648	0.85
2	28	3.4e-15	5.1e-12	46.3	4.6	1	87	675	744	675	744	0.83
3	28	8.3e-16	1.2e-12	48.2	0.4	1	87	766	838	766	838	0.85
4	28	7.3e-16	1.1e-12	48.4	5.7	1	87	933	1003	933	1003	0.83
5	28	1e-14	1.5e-11	44.7	3.4	1	86	1027	1098	1027	1099	0.81
6	28	1.6e-12	2.4e-09	37.7	1.2	1	87	1134	1202	1134	1202	0.80
7	28	3.6e-11	5.3e-08	33.4	1.9	1	86	1250	1319	1250	1320	0.77
8	28	5.7e-17	8.5e-14	52.0	0.3	1	86	1347	1416	1347	1417	0.82
9	28	4.1e-12	6e-09	36.4	1.3	1	86	1438	1507	1438	1508	0.80
10	28	1.6e-15	2.4e-12	47.3	1.7	1	86	1535	1606	1535	1607	0.85
11	28	7.7e-13	1.1e-09	38.7	0.9	1	85	1683	1751	1683	1753	0.82
12	28	3.7e-12	5.4e-09	36.5	0.1	1	86	1776	1844	1776	1845	0.82
13	28	6e-14	8.9e-11	42.3	0.9	1	86	1998	2066	1998	2067	0.82
14	28	9.8e-12	1.5e-08	35.2	0.7	1	61	2120	2174	2120	2195	0.81
15	28	3.1e-05	0.046	14.3	0.1	1	58	2201	2252	2201	2276	0.79
16	28	3.9e-11	5.7e-08	33.3	0.1	1	86	2291	2360	2291	2361	0.83
17	28	3.3e-14	4.8e-11	43.1	1.3	1	87	2419	2489	2419	2489	0.81
18	28	5.7e-13	8.4e-10	39.1	0.9	1	86	2524	2595	2524	2596	0.82
19	28	1e-13	1.5e-10	41.5	0.6	1	87	2606	2678	2606	2678	0.81
20	28	9e-14	1.3e-10	41.7	0.1	1	87	2701	2772	2701	2772	0.77
21	28	6.6e-06	0.0097	16.5	0.1	1	58	2805	2858	2805	2877	0.84
22	28	8.9e-15	1.3e-11	44.9	0.1	1	86	2896	2968	2896	2969	0.80
23	28	5e-14	7.5e-11	42.5	1.4	1	86	3103	3175	3103	3176	0.80
24	28	1.8e-14	2.7e-11	43.9	2.4	1	87	3239	3310	3239	3310	0.83
25	28	1.8e-14	2.7e-11	43.9	4.5	1	86	3423	3493	3423	3494	0.84
26	28	2.5e-13	3.7e-10	40.3	0.1	1	87	3586	3656	3586	3656	0.85
27	28	4.9e-10	7.3e-07	29.7	0.4	1	58	3673	3721	3673	3735	0.87
28	28	4.4e-08	6.5e-05	23.5	1.3	18	86	3738	3795	3727	3796	0.74

Sequence Information

Coding Sequence: atgtcacaacaacaacacaatccCCCTCCACAtcaccaacatcaacatcactactatcagcaacagcagcaacagcaacaacaacaacaacaacatctgcagcagcagcatttgcagcataaacaaatacaacaacaacagcacagtTGGTACTCACATGTTGCTTCCTATCCGCCCCCGCATGCCGCTGCCTTTGCGTCGCcctgcaaaagcagcagcagcaacaacaataacaacaacaaccacattaTGAATGCATACGGCACAGGTGCAGGAGCGTATTATGGCTCAACGGGAGCGGGTGGCGTTGGGGTTGGCTATAACCTTGAGGCCAATACTGTGGCCTATGCGCACAACCAGCTGCtgcaatatcaacaacaacagcagcaacaacaacagcagcagcatcagcaacaacaacaacaacatcagcagcagcagctcagccaGCGCTCGTATATGCCACCACATATAATGCACAGCTCGTATCCGTACATTAAGAGCGAACCTTTGGAGCCACTGCCCGAAcgccatcagcagcagcagcagcagcaacagcaactcttTCAGAATCCTATGGCACCGCCGCCAGCACCCGCCATTGCTAATCGTCATTCGCTCGATGCTAGTGGCGAaatgataattaaatCGGAACCCATTGACGAACATGCTTTCAAGTCCAACTATATCGATGATAATACTCCCTTTGCCGATTTTAGTAAATATCCCGAATTCGGCGACGATATGCTAAGTCCCAAGCTAGAGCTAAACGTCAAGGATGAGGCCTATGGAAACCAAAAAaACCCGCTGAACTACCCACGTCGTAAGCTCCAAACGGATCGCTCCGCGGAGAGTATGCCCATTTGTCAGCGCTGCAAAGAGGTGTTCTTCAAGAAGCACATTTACCTGCGGCATGTGGCCGAGAGCAGTTGTAGCATACACGAGTATGAGTTCAAATGCAACATCTGTCCCATGTCCTTTATGGGCGGCGAGGAGCTGCAGAAGCACAAGCATCTGCATCGAACCGACACGTTCTTCTGCCACAAATACTGTGGCAAGCACTACGACTCGATTGCAGAGTGCGAATCGCACGAGTACATGGAGCACGAGTACGATAGCTTTGTGTGCAATATGTGCTCTGTTACGTTCCCCACACGGGAACAGCTGTATGCCCATTTGCCGCAACACAAGTTCCAACAGCGTTACGATTGCCCCATTTGCCGGTTGTGGTACCAAACGGCATTAGAGCTGCACGAGCATCGACTGGCGGCGCCCTACTTTTGTGGCAAGTATTACGCTGCagcacaccagcaacaacaacaacaacaacaacaacaacaacagcatcagcagcatacacaacaacatcagcaacagggCAACTACAAACTGCAGGATTGTCACATGGGCACCATTGAAAtgaCGCCACCGCAGCACAAGGCGAATGCGGCATTACCGGCAACGGCGGCGCTCAATTCGCTGTTGCAGCAACGCCAGGCGAACGCTGATGGCGCCGCTTTATATGCCTCGGCGCTGAAGAGCGAGACGAACGTGAAACTGGAGCGCAGCTATAGCAACTCCACCAGCGAGTCTGGTTACAGTATGCACGAGAACAGCTATAACAATGCCTACGCCAGCGACAATTCTCTGCATGGCGGGGGCGGGGCAATTGGTGGTCCGCAGGCGCATTCCTCGACGCTGGACGATTCGGAGGATGCGCTGTGCTGTGTGCCACTTTGCGGGGTGCGCAAGAGCACAAGCCCGACGCTGCAATTCTTTACGTTTCCCAAAGATGACAAGTACTTGCATCAGTGGCTGCACAATCTCAAGATGTTCCACATTCCGGCGTCGAGCTATGCCAGCTTTCGCATCTGCAGCATGCACTTCCCTAAGCGTTGCATCAATCGTTACTCTCTGTGCTATTGGGCGGTGCCCACATTTAATCTGGGCCACGACGATGTGGCCAATCTCTATCAGAATCGTGAGCTGACCAACACATTCACCACCGGCGAGGTGGCCCGCTGCAGTATGCCAAACTGTACTAGTCAGCGTGGTGAGAGTAATCTGAAGTTCTACAACTTTCCCAAGGACATCAAGAGTTTGATTAAGTGGTGCCAAAACGCTCGCCTGCCCGTCCAGGCCAAGGAGCCGCGTCACTTCTGCAGTCGCCACTTCGAGGAGCGTTGCATCGGCAAGTTTCGGCTGAAGCCTTGGGCAGTGCCCACGTTACACCTTGGTGCCCAGTACGGCAAGATTCATGACAATCCCAAAAATCTGTATGTGGAGGAGAAGCGCTGCTGCCTCAACTTTTGTCGTCGCAGTCGCTCCTCCGACTTCAACATGTCGCTGTATCGCTTCCCCAGGGATGAGGTGCTACTGCGTCGTTGGTGCTACAATCTACGCCTTGATCCGGCTGTCTATCGTGGAAAGAATCACAAAATTTGTAGCGCTCACTTTATTAAAGAAGCATTGGGATTACGCAAACTATCTCCGGgCGCTGTGCCCACGCTGCATCTGGGTCATAATGACACTTTTAACATCTACGAGAACGAACTGTGGCCACCGCCAACGCCCTCCACGCCCACCCAcaatcatcagcagcagctgcagcaacatcagttgcagcagcagccgcaacaagtGCATCATAAATATCAGCGGCACTCGGCTGCATCCACATCGTCGTCGGCCTCGTCGACATCGCATTATGTGGATCCGGAGCTAAGTGCATCCTACATGAGCATGGGCGCTGGAGGCTCATCGTCTGGCCTTAATGTCAGCGACAGCATGGATGTCTGCTGTGTGCCCAGCTGCGAGAGCAAGCGCCACAACAATGAGAACATCACATTCCACACAATACCCAGGCGGCCAGAGCAGATGCGCAAGTGGTGTCACAATCTTAAGATACCCGAGGACAAGATGCACAAGGGCATGCGGATATGTAGCTTGCACTTTGAGCCCTACTGCATTGGCGGCTGCATGCGTCCGTTTGCGGTGCCAACATTGCATCTGGGCCACGACGACGAGGACATTCACCGCAATCCGGATGTGATCAAGAAGCTCAACATACGCGAAACTTGCTGCGTGGCTGTTTGCAAACGCAATCGTGACCGGGACCATGCCAATCTGCATCGCTTTCCCAGCAATGTGCCGCTGTTGACCAAATGGTGCGCAAATCTGCAGCGTCCTGTGCCGGATGGCAGTAAACTCTTCAACGATGCCATCTGTGAGGTGCACTTTGAGGATCGATGCCTGCGCAACAAACGGCTTGAGAAGTGGGCAGTACCCACACTCATCCTTGGGCATGAGAATATACCCTATCCGCTGCCCACGCCGGAGCAAGTTGCCGAGTTCTATGCGCGTCCCACTGCACCTAACAATGGCGAGGAGCAGGGCGAGTGTTGTGTGGAGACGTGCAAGCGTAATCCCAGTGTTGATGACATTAAGCTATATCGCCCGCCCGAGGAGTCGCAGGTGCTGGTAAAGTGGGCGCACAATCTCCAGCTGGAGATTGCCCAGCTGCCCAATATGAGAATATGCAATCTGCATTTCGAAACCCACTGCATTGGCAAGCGGATGCGTCCCTGGGCAATACCCACGCTCAATCTGGCAACTAACATAGACAATCTCTACGAGAATCCCGAACACCAGATGCTCTACAAGCGGCGCACGCATCTCAAGCCGGGCAGAGCAGCGCGAGGCTCTGAAGCAAGCGCTGGTGGTGTGAAGCCTACCTGGGTGCCacgctgctgcttgccacactgCCGCAAGGTGCGTGCCACACACAATGTCCAGCTGTATCGCTTCCCCAAACTCAATCGCTCCACGCTGGCCAAGTGGGCGCATAATTTGCAGGTGCCGCTCGTGGGCAGCGCTCAGCGTCGCCTCTGCTCCGCACACTTTGAGCCGCATGTGCTCAGCAAGAAATGCCCGGTGCCCATGGCGGTGCCCACACTGGACCTCAATACACCATCCGGCTACAAGATCTATCAGAATCCGGCCAAGCTCAAGGCGAATAAGCTTTGCTTGCAGCGTGTCTGCATTGTGGAGAGCTGCCGGCGTCAGCGGGCGCAGGGGGTACAGCTCTTCCGTCTGCCTCACAGCCCCACTCAGCTGCGTAAGTGGATACACAACATCCGGATGCGGCCCCGAGGAGCTATGCGACAACAGTATCGCATCTGCTCGAAGCACTTCGAGACGCACTCGTTCAATGGGAAGAGACTCAGTGCGGGCGCAATTCCAACGCTTGAGTTGGGTCATGAGGACGAAGACATATTTCCGAATGAGGCGCAGTCTTTCGTGGAGGAGCACTGCACAGTCGAGGGCTGCGATGCCGTCAAGGAACAACCGGATGTGCGTCTCTTCCGCTTCCCCAACGACGATGAGGATCTGCTCTGGAAGTGGTGCAACAATCTGAAAATGAGTCCGGTCGACTGCATCGGCGTTCGCATCTGTAACAGACACTTCGAGACTGATTGCATTGGACCAAAGCACCTGTTCAAGTGGGCCATACCCACGCTCTCCCTCGGccacgatgatgatgacatcGAGCTGATGCTAAATCCCAAGCCGGAGGAGCGCTATATCGATCCGGTCTTCAAGTGCTGTGTGCCCTCGTGTGGCAAGACGCGTAAATTCGATGAAGTACAGATGAACAGTTTTCCCAAAGATCCGGAGCTCTTCCAGCGCTGGCGCCACAATCTCCGTCTCGAGCATCTCAACTTCAAGGAGCGCGAACGCTATAAGATCTGCAACGCCCACTTCGAGGACATTTGCATTGGTAAGACGCGCTTGAACATAGGCTCCATACCGACCCTGGAGCTTGGCCATGACGAGACTGATGACTTGTTCCAAGTCAACCCCGAAGAGCTGCAGAGCAATCTCTTTGGACGGCAGAGACGCGTGCAGGATTCCATGAGGATCAACATTAAGCAGGAGGCGCACTCCGACCTCGATGAAGACACTAAACCGGTCATTAACATGTCGGAGGCCACAGATCCAAATACAACACAGGTTAAAATCAAGAAATCTATGACCGATTTCAAGTGCTGTGTGCCGAGCTGTGGTCACAATCGCCTGGAGCATGGTGCCCGCCTCTTTCCGTTTCCGAACgggaaacagcagcagagcaagTGGCGCTACAATCTCCGGCTGCCTGCTGCCGGCGTGGACAAGACGACGCGCATCTGCAGCGCCCACTTCAATCGCCGTTGCATTGATGGTAATCAGCTGAGGGGCTGGGCAATGCCCACACAGCAGCTGGGCCATCAGGAGCTGCCGATCTATGAGAATCCAAAGAATATACCGGGCTTCTTTACGCCCACCTGTGCGCTGGCGCACTGCCGCAAGCGGCGCAGCATTGACAACGATCTGCGTACCTATCGTTATCCACGCAGCGAGGAGCTGCTCGAAAAGTGGCGTGTCAATCTGCGCTTGTCGCCGGACCAATGCCGCGGACGCATCTGTGCGGATCATTTCGAGCCACTGGTGCGTGgcaagctgaagctgaagacGGGAGCAGTGCCTACGCTCAAATTGGGACACGACGAGGGTGTAGTCTTCGATAATGAGGGCATTAAGGCGGGTctgcagctggaggaggaggcggaggaaGAAGAGGGCAATGCCAGCTTGAAGTCGTTGGTCAAAGTAAAGACTGAGCAGGAGGATGAGCAGGAGCTAGAGAATGAAGATGAAGagctgcaggagcaggagcaggatcTGGAGCAGGATCAAGATATGGACGAGGATGGGGAAGAGCATCGAGACTCTGAGGAACATGGCTATTTTGATCCCTTGGAACTTGTGGAAACCTACGCTGAGCACCACAGCGATGATAACTCTGCCGGACATGATAACctcgacgatgatgatgacgaagaTGAGGACATTCCCGGCAATGACGATGAGCTGCTTCTGCCTGATACGCGGCCACTTCGAATGACAATGCCTCCGCGGCGCGAGAAGGCTGTGAATAATGTGACGCCTATTTGCTGTCTGAAGCACTGTCGCAAGGAGCGCACTGCCATCCATCATCTGAGCACCTTTGGCTTTCCAAAGGatccgcagctgctgctcaagtgGAGCGCCAATCTGCAGCTGCCATTGGAATCGTGCATGGGTCGTGTATGCGTCGAGCACTTTGAGCCCTCGATGCTGGGCACGCGCAAGCTGAAGCAGAATGCGGTGCCCACCTTGAAACTGGGTCATGCCACACCGCTCACCTACAGCTGCAATGGCCGGATGCTGTCGGGCATTTACGATGAACAGCCGCAGCATTCGGTTTTTCGGCTTTGGAGCCTGAAACACTGCCGCAAACGGAAACCGGATCTGGCGGAGATTAAGCCCGGTCGTCGCTGTTGTCTGCCAAGTTGCGGCAAGCAGTCGGAGTCGCACGGCGTCCAGCTGCAGCGTCTGCCCAAGGACCGTCTGATGCTGCGCAAATGGTTGCACAACCTGAAGCTGCCTCCAACGGTGGACTGCACCCAAATGTTCCTCTGCAGCGATCACTTTGAGCTGAATGCGCCGTGTCCCACTTTGAAACTGGGGCACTCGGATACCAATATTTATCGCCACAGTGTGGCTAGCACCAGTGGCAGCTGCCTGGTGCCCAAATGTACTTGTGCTCGTCTCAATCTCTATCGCGGCTATGATCTGCCTGCGCATCCGCAGGTGCAACAGGCCTGGCTACACTGGCTGCAGCTGCCCCATCCACAGCCGTCGCCCCGGCACGCCCAGCTATGTGTGATGCACTTTATGCAGCTCTACGAACTGGTGCCGCTGCCCGAATCGGTGCCAGATGTTGTGCGCAGGCAGCTGCGTGAGACTTACGAACTGATATCCAGCTCCAGCATGGCCATGAAGCTGCGTTGCGCTGTGCCCGGCTGCTACTCGAAGTATACGGACAATGTGCGTCTGACCAAGCTGCCCGTTTACCCCGACACCTGCGCCAAGTGGGTGCACAACACCAAGATTCAATATGATCCGGCCCGACATTATGTCTATCGTATCTGCATGTTGCACTTTGAGCCAGGCTGCCTGGGCCCAGTGCGTCCTAAAGTGTGGGCAATGCCaacgctgcagctgcaccacAAGGATGCCAACATCTACTTAAATCCCAAGCTGGATGGCAGCCAAACACAGCCGGTCGTGCCGCTGGACCTGCCACTGCGCATTAAAACTGAGCTGCCGATGTGCAACAGTCCCAGCTTTAGTGCGAGTGCCAGTCCCAGTCCGCGTGGCAAACTGCGCACTTGCTGCATTCCCAGCTGCGGTCAGCAGGCTTCGGCCCTGACGCGTCTCTTTCGCTTTCCCAGCGCAGAGACGTCGATGCTGAAGTGGCTGGTGAAtacccagcagcagccgcgCTTTGTCGATGCACAACGGCTGTTCGTCTGCCAGGATCACTTCGAGGCGGAGGCCATTTGCAAGAATCAGCTGCGCAGCTGGGCGGTGCCAACACTGAATCTAGGACACGATGGACACATCATACCGAATGCCAAGCACAATGGCAACATTGCCGACAGCCAGGAGAACAAGCAGACGCTGCAGTTCATCTGGGCCAACTACTGTTCGGTGCTGACCTGCTTCCAGCAAAGTAGCGAGCAGCTACGTCTCTACCAATACCCCACGGATCGGCCAACCAGCCGCAAGTGGGCCGCCAATTGTAAGCATCGCTCCATGCAGGCCAGCAGTGATGGATTCCAGGTGTGTCAGTCGCATTTTACGCCGGATTGCTTTGATCCTGATACCGGGGAGCTGAAGGAGGACGCTGTGCCCACACTGGCGCTGAGCCGTTCTGTCACTGAAGTGCGCTGTGTGGTCAATGGTTGCGTTAAGGACGAAGACGCATCGCGTCGCCGTCTGTTCAAGATGCCCAAGCGTAACCCACAGATATTGGATTGGTGCCACAATTTGCGACTCGATCAGACGGCTATGAGCGGCTCGGAACAGCACGTTTGTGAACGTCACTTCGAGGCGAACTCTTTCAATGCGTCTAGAGTGCTGCGTCCAGGAGCACGACCCACACTTCATTTAGGTCATGAGGACCCAGACGATGTGATACCCAATCCGGCGAACTGGGAAGAGGATGTGATCGTGTGCTGTGTGCCCCACTGCGAAAGCTCCAAGGATGCGGATGAAGTCCAATTGTTTGGGCTGCCAAAGGTGCGCCAGTTGGCGGACAAGTGGCTGCAAAATGTCCATCTCGATCCGAGCAAAGAACAACTGGCCGGCCTGAAGATCTGCAGTGTACACTTTGAGGCAAGCTGCATGGAGAATGGACGACCCAGCTATGGTGCAATGCCCACACTCCATCTCGGTCACGATAAGCTCGATAATATACACCCAAGCGTAGAGTCGGTGCCGACGCAGCAGAAGCGCTACTGCAATAGAGATGGCGCCAGTCACGATTGTTGCTATCCGCAGTGCGTGGAGCTGCAGAAGAGCTATCTGCGTGTCACCTATGAGCTGCCCCAGGAGCAAGAGCTCCGTCAGCAATGGCTCTCCTATATGGGCCTGGAAGCGCAGCAGCTCgataagcagcagctgcccaagCTCTGTCCACTCCACCTAATCTTGCTCTACGATCACAGTGCGGATCACTTTTCGGCACACGCCGCTGAGGAGCTGTTGGATTCCAATTATGAGGCAGCGCGCAGCAGCGTTCGCATACGCGTTGTCAGCTGTGCTGTGCGCGGCTGCAGAACGCTCAAACCACGCGACGGTGGTCGGCTGCACGGTTTGCCCACGCGGCGAGATCTGCTGGAGATGTGGCTGCACAACATGCAGCTGGTGTTTTACGAGCAACAGCGTTATATGTACAAGATTTGCAGCAAGCACTTTGAGTCCACATGCTTCACGGAGACAACCAAGCGCCTGAAGCCGTGGAGCATGCCTACGCTGGAGTTGCCGGAGCGCCAACCGGGCGAGATGCCCGCCTATCAGAATCCCACAGAGTTGGAGTGGCAACACATGAATGAGCTGCAGGTCAGCGAGAAAGTTGTTGAGGCTCAGCCGGAGCCATTACTCAAGCTGGAGCCGTTGCCCAAGAAGGAGCCACCACCAGCGCAGGTTGTGGAATGTGAAGAGGATTGCGACAATAACTTACAGCAGCCACTGGAAATGCAGGCTCTGGAGGTGCTGCTCGAGGTGGGCCATGTCGAGAAGTGCACCACCTACGAGCAAATGGATACCGAGGCAAATCTCAACTATGCCGAGCAGTTCTCGCACAATCCCCTCAGTCCAGGTCCACCCCAATGCCGTATCCCCGTTGTCCAGAATGGACTCCACTACAGTGCACGCCACTGCAGCGTGCATGGCTGCAATGTCAGCTCCAATAAtctgagcagcagcatcaagcTACACAAGTTCCCCGTCTCGCTGGATGCCATGCAAAAGTGGATGCACAACACCCAGGTGCTCGTGGACGTCAAATTCGCTTGGCGTTTTCGCATCTGCAGTCATCATTTCATCGAGGATTGCTTTCACGGCTCGCGCATCAGACGTGGGGCGATGCCCACGTTGCGACTGGGCTCACGTCGCCCGAAGCATATCTATGATAATGAGTTCAACGCCCAATTGCAACTGGAACAGTCCAAAGAAGAGGCCAGGGAGGCTCTCTCTGCCCCGCTGGAGTctcagcaacagttgctttCTGCGAATGTTGGTCTTCGCCTGCCGCGTCCAGCCCCGCCCTGCAAATCCAGCAAATACTGTCAGATCGAGGGCTGCTCCAATCATTTGACCAGCGAGAATGTGACGCTGCACAAGTTCCCCCATTCGTCGGATATGTGCGCCAAGTGGCAACACAACACTCAGGTGCCCTTCGATCCCGAGTTCCGCTGGCGCTATCGCATCTGCAGCGCACACTTTGAGCCCATCTGTCTAGGCAATGTGCGACTGATGCACGGCAGTGTGCCCACCCTGAATCTGGGACCGCTTGCGCCTAAGAAACTGTTTGACAATGAATTCTTGCGTCTGGACAAGCCAATGAGCAGTTCGGAGCTGGGTATGACCGtcaaacaagaacaaatgGAGCAATTTGATCAAATGGAGCTGGAAGATGGCAACCAGGAGCAGGATGATTTCAGTCTGCTAGAGCCCGAGCTGCAGTTGCACGAGGATAGCGAGGATGAGCAACAATATGACAATCATTTCAGCCAAAACGATTCTTATAACTGGTCCGATCAGCAGCTGCGTCTGCCCAGCAGTAATCAGGAGAAGTGCACCACCATCTACAATCCGGTCAAGTCCGGGTATGATAAGTGCTCACTGGTCCACTGCCAACGACAGCGTTCCCAGCACGGCGTGCACATCTACAAGTTTCCACGCTCGCGTCAGCTACAGCAACGATGGATGCATAATTTGCGCATCCAATACGATGAGCGACGGCCGTGGAAGACAATGATATGCAGTGTCCATTTCAAGCCGCACTGCATACGTCTGCGCAAGTTGCGTCCATGGGCAGTGCCCACGCTGGAACTGGGGGACAATGTGCCGCTGGAGATCTTTACGAATGAGCAGAGCCAGCAGCTGTTTGCTCAGTCCGAAGCAGGCAGCGAGTGTGATGACGTTGAAGTGGATGTTGAGGACACCATACTAGAGGACTTGGATGATGACTATGATGACAATGATGCtgatgtgaatgtgaatgctgATGATCAAATGCGAACAGCTCCATATGTCAAAAGAGAGCGTCGCTCTCGATTTGATCCTCTGCCACCGGGTCAGCTGCCACCGTGGAAGATCAAATGCTGCTGTTTGCCCTATTGCCGCAGTCCTCGCGGTGATGGCATCAAGCTCTTTCGACTGCCCAACAACATTAGCTCCATACGTAAATGGGAGCAGGCCACAGGCATGCGCTTCTATGAGTCCCAGCGAAACACAAAGCTCATCTGCAGTCGACACTTTGATCCGCAGCTTATAGGCGTACGTCGCCTCATGTCCAATGCGGTACCCAGCCTCCATTTGGGCCCAGACAGCGCAGAACCCGAGCTGCCTCCTGTGGGACCACGTTGCTGCATGCCCGATTGCTCTGAGGATGTCAATGTCCAGCTGCACAAGTTTCCCAAAgATCCCATGCTGCTGCATCAATGGTGTCAGGCGCTCAATCTACCGGATGTTCAAAGCTACTCCGGCAAATTCATTTGTGCGGCACATCTGCCCTCCAACGCGATGAGCTGTCTAATTTGTGGCGTGGACGATGTACAGCTGCCGATGCTGGACTTTCCCCAGAATCGCAATCAGCGCACCAAGTGGTGCTACAATCTGAAAATCGAGCCTCTGCCCAAGTGGGACAACTCAAAGCAAATTTGCTGCAAACACTTTGAGAGCTTTTGCTTTATCCAGCCGGGTCAACTTCTAGCGGAGGCATTGCCCACTCTACTCTTGGAGCACGGGGATAGCAACATATTCCTAAACGATGAGGCCATGGATAACAGCAAGTTGTTGCGCGTCAAGGACGAGCCCATGGAGAGCGACGATCTGATGCTGTAA
Protein Sequence: MSQQQHNPPPHHQHQHHYYQQQQQQQQQQQQHLQQQHLQHKQIQQQQHSWYSHVASYPPPHAAAFASPCKSSSSNNNNNNNHIMNAYGTGAGAYYGSTGAGGVGVGYNLEANTVAYAHNQLLQYQQQQQQQQQQQHQQQQQQHQQQQLSQRSYMPPHIMHSSYPYIKSEPLEPLPERHQQQQQQQQQLFQNPMAPPPAPAIANRHSLDASGEMIIKSEPIDEHAFKSNYIDDNTPFADFSKYPEFGDDMLSPKLELNVKDEAYGNQKNPLNYPRRKLQTDRSAESMPICQRCKEVFFKKHIYLRHVAESSCSIHEYEFKCNICPMSFMGGEELQKHKHLHRTDTFFCHKYCGKHYDSIAECESHEYMEHEYDSFVCNMCSVTFPTREQLYAHLPQHKFQQRYDCPICRLWYQTALELHEHRLAAPYFCGKYYAAAHQQQQQQQQQQQQHQQHTQQHQQQGNYKLQDCHMGTIEMTPPQHKANAALPATAALNSLLQQRQANADGAALYASALKSETNVKLERSYSNSTSESGYSMHENSYNNAYASDNSLHGGGGAIGGPQAHSSTLDDSEDALCCVPLCGVRKSTSPTLQFFTFPKDDKYLHQWLHNLKMFHIPASSYASFRICSMHFPKRCINRYSLCYWAVPTFNLGHDDVANLYQNRELTNTFTTGEVARCSMPNCTSQRGESNLKFYNFPKDIKSLIKWCQNARLPVQAKEPRHFCSRHFEERCIGKFRLKPWAVPTLHLGAQYGKIHDNPKNLYVEEKRCCLNFCRRSRSSDFNMSLYRFPRDEVLLRRWCYNLRLDPAVYRGKNHKICSAHFIKEALGLRKLSPGAVPTLHLGHNDTFNIYENELWPPPTPSTPTHNHQQQLQQHQLQQQPQQVHHKYQRHSAASTSSSASSTSHYVDPELSASYMSMGAGGSSSGLNVSDSMDVCCVPSCESKRHNNENITFHTIPRRPEQMRKWCHNLKIPEDKMHKGMRICSLHFEPYCIGGCMRPFAVPTLHLGHDDEDIHRNPDVIKKLNIRETCCVAVCKRNRDRDHANLHRFPSNVPLLTKWCANLQRPVPDGSKLFNDAICEVHFEDRCLRNKRLEKWAVPTLILGHENIPYPLPTPEQVAEFYARPTAPNNGEEQGECCVETCKRNPSVDDIKLYRPPEESQVLVKWAHNLQLEIAQLPNMRICNLHFETHCIGKRMRPWAIPTLNLATNIDNLYENPEHQMLYKRRTHLKPGRAARGSEASAGGVKPTWVPRCCLPHCRKVRATHNVQLYRFPKLNRSTLAKWAHNLQVPLVGSAQRRLCSAHFEPHVLSKKCPVPMAVPTLDLNTPSGYKIYQNPAKLKANKLCLQRVCIVESCRRQRAQGVQLFRLPHSPTQLRKWIHNIRMRPRGAMRQQYRICSKHFETHSFNGKRLSAGAIPTLELGHEDEDIFPNEAQSFVEEHCTVEGCDAVKEQPDVRLFRFPNDDEDLLWKWCNNLKMSPVDCIGVRICNRHFETDCIGPKHLFKWAIPTLSLGHDDDDIELMLNPKPEERYIDPVFKCCVPSCGKTRKFDEVQMNSFPKDPELFQRWRHNLRLEHLNFKERERYKICNAHFEDICIGKTRLNIGSIPTLELGHDETDDLFQVNPEELQSNLFGRQRRVQDSMRINIKQEAHSDLDEDTKPVINMSEATDPNTTQVKIKKSMTDFKCCVPSCGHNRLEHGARLFPFPNGKQQQSKWRYNLRLPAAGVDKTTRICSAHFNRRCIDGNQLRGWAMPTQQLGHQELPIYENPKNIPGFFTPTCALAHCRKRRSIDNDLRTYRYPRSEELLEKWRVNLRLSPDQCRGRICADHFEPLVRGKLKLKTGAVPTLKLGHDEGVVFDNEGIKAGLQLEEEAEEEEGNASLKSLVKVKTEQEDEQELENEDEELQEQEQDLEQDQDMDEDGEEHRDSEEHGYFDPLELVETYAEHHSDDNSAGHDNLDDDDDEDEDIPGNDDELLLPDTRPLRMTMPPRREKAVNNVTPICCLKHCRKERTAIHHLSTFGFPKDPQLLLKWSANLQLPLESCMGRVCVEHFEPSMLGTRKLKQNAVPTLKLGHATPLTYSCNGRMLSGIYDEQPQHSVFRLWSLKHCRKRKPDLAEIKPGRRCCLPSCGKQSESHGVQLQRLPKDRLMLRKWLHNLKLPPTVDCTQMFLCSDHFELNAPCPTLKLGHSDTNIYRHSVASTSGSCLVPKCTCARLNLYRGYDLPAHPQVQQAWLHWLQLPHPQPSPRHAQLCVMHFMQLYELVPLPESVPDVVRRQLRETYELISSSSMAMKLRCAVPGCYSKYTDNVRLTKLPVYPDTCAKWVHNTKIQYDPARHYVYRICMLHFEPGCLGPVRPKVWAMPTLQLHHKDANIYLNPKLDGSQTQPVVPLDLPLRIKTELPMCNSPSFSASASPSPRGKLRTCCIPSCGQQASALTRLFRFPSAETSMLKWLVNTQQQPRFVDAQRLFVCQDHFEAEAICKNQLRSWAVPTLNLGHDGHIIPNAKHNGNIADSQENKQTLQFIWANYCSVLTCFQQSSEQLRLYQYPTDRPTSRKWAANCKHRSMQASSDGFQVCQSHFTPDCFDPDTGELKEDAVPTLALSRSVTEVRCVVNGCVKDEDASRRRLFKMPKRNPQILDWCHNLRLDQTAMSGSEQHVCERHFEANSFNASRVLRPGARPTLHLGHEDPDDVIPNPANWEEDVIVCCVPHCESSKDADEVQLFGLPKVRQLADKWLQNVHLDPSKEQLAGLKICSVHFEASCMENGRPSYGAMPTLHLGHDKLDNIHPSVESVPTQQKRYCNRDGASHDCCYPQCVELQKSYLRVTYELPQEQELRQQWLSYMGLEAQQLDKQQLPKLCPLHLILLYDHSADHFSAHAAEELLDSNYEAARSSVRIRVVSCAVRGCRTLKPRDGGRLHGLPTRRDLLEMWLHNMQLVFYEQQRYMYKICSKHFESTCFTETTKRLKPWSMPTLELPERQPGEMPAYQNPTELEWQHMNELQVSEKVVEAQPEPLLKLEPLPKKEPPPAQVVECEEDCDNNLQQPLEMQALEVLLEVGHVEKCTTYEQMDTEANLNYAEQFSHNPLSPGPPQCRIPVVQNGLHYSARHCSVHGCNVSSNNLSSSIKLHKFPVSLDAMQKWMHNTQVLVDVKFAWRFRICSHHFIEDCFHGSRIRRGAMPTLRLGSRRPKHIYDNEFNAQLQLEQSKEEAREALSAPLESQQQLLSANVGLRLPRPAPPCKSSKYCQIEGCSNHLTSENVTLHKFPHSSDMCAKWQHNTQVPFDPEFRWRYRICSAHFEPICLGNVRLMHGSVPTLNLGPLAPKKLFDNEFLRLDKPMSSSELGMTVKQEQMEQFDQMELEDGNQEQDDFSLLEPELQLHEDSEDEQQYDNHFSQNDSYNWSDQQLRLPSSNQEKCTTIYNPVKSGYDKCSLVHCQRQRSQHGVHIYKFPRSRQLQQRWMHNLRIQYDERRPWKTMICSVHFKPHCIRLRKLRPWAVPTLELGDNVPLEIFTNEQSQQLFAQSEAGSECDDVEVDVEDTILEDLDDDYDDNDADVNVNADDQMRTAPYVKRERRSRFDPLPPGQLPPWKIKCCCLPYCRSPRGDGIKLFRLPNNISSIRKWEQATGMRFYESQRNTKLICSRHFDPQLIGVRRLMSNAVPSLHLGPDSAEPELPPVGPRCCMPDCSEDVNVQLHKFPKDPMLLHQWCQALNLPDVQSYSGKFICAAHLPSNAMSCLICGVDDVQLPMLDFPQNRNQRTKWCYNLKIEPLPKWDNSKQICCKHFESFCFIQPGQLLAEALPTLLLEHGDSNIFLNDEAMDNSKLLRVKDEPMESDDLML

Similar Transcription Factors

Sequence clustering based on sequence similarity using MMseqs2

100% Identity: iTF_00595971;
90% Identity: iTF_00553068;
80% Identity: -