Basic Information

Insect: Drosophila tanythrix
Gene Symbol: -
Assembly: GCA_035043275.1
Location: JAWNNC010000506.1:4217208-4231204[-]

Transcription Factor Domain

TF Family: THAP
Domain: THAP domain
PFAM: PF05485
TF Group: Zinc-Coordinating Group
Description: The THAP domain is a putative DNA-binding domain (DBD) and probably also binds a zinc ion. It features the conserved C2CH architecture (consensus sequence: Cys - 2-4 residues - Cys - 35-50 residues - Cys - 2 residues - His). Other universal features include the location of the domain at the N-termini of proteins, its size of about 90 residues, a C-terminal AVPTIF box and several other conserved residues. Orthologues of the human THAP domain have been identified in other vertebrates and probably worms and flies, but not in other eukaryotes or any prokaryotes [1].
Hmmscan Out: # of c-Evalue i-Evalue score bias hmm coord from hmm coord to ali coord from ali coord to env coord from env coord to acc

1 28 6.6e-15 1.5e-11 45.1 4.2 1 86 566 638 566 639 0.85

2 28 2.8e-15 6.1e-12 46.3 4.6 1 87 666 735 666 735 0.83

3 28 6.8e-16 1.5e-12 48.2 0.4 1 87 757 829 757 829 0.85

4 28 5.9e-16 1.3e-12 48.4 5.7 1 87 924 994 924 994 0.83

5 28 8.3e-15 1.8e-11 44.7 3.4 1 86 1018 1089 1018 1090 0.81

6 28 3.5e-13 7.7e-10 39.5 1.5 1 87 1125 1193 1125 1193 0.80

7 28 1.7e-11 3.7e-08 34.2 2.3 1 86 1241 1310 1241 1311 0.78

8 28 6.3e-17 1.4e-13 51.5 0.3 1 86 1338 1407 1338 1408 0.82

9 28 2.7e-12 6e-09 36.7 0.8 1 86 1429 1498 1429 1499 0.80

10 28 6.9e-15 1.5e-11 45.0 1.5 1 86 1525 1596 1525 1597 0.85

11 28 2e-13 4.4e-10 40.3 2.5 1 85 1673 1741 1673 1743 0.82

12 28 3e-12 6.5e-09 36.6 0.1 1 86 1766 1834 1766 1835 0.82

13 28 2.1e-14 4.6e-11 43.4 1.1 1 86 1990 2058 1990 2059 0.82

14 28 4e-10 8.7e-07 29.8 0.3 1 61 2112 2166 2112 2188 0.79

15 28 2.8e-05 0.062 14.2 0.1 1 58 2195 2246 2195 2270 0.80

16 28 3.1e-11 6.9e-08 33.3 0.1 1 86 2285 2354 2285 2355 0.83

17 28 6.2e-14 1.4e-10 41.9 1.1 1 87 2413 2483 2413 2483 0.81

18 28 2.3e-13 5e-10 40.1 0.6 1 86 2518 2589 2518 2590 0.82

19 28 1.1e-13 2.3e-10 41.2 1.5 1 87 2600 2672 2600 2672 0.81

20 28 4.5e-14 9.8e-11 42.4 0.1 1 87 2695 2766 2695 2766 0.79

21 28 1.7e-05 0.038 14.9 0.1 1 57 2799 2851 2799 2867 0.83

22 28 1.6e-06 0.0035 18.2 0.1 50 86 2917 2945 2909 2946 0.71

23 28 3.2e-14 7.1e-11 42.9 0.9 1 86 3080 3152 3080 3153 0.81

24 28 1.9e-14 4.1e-11 43.6 2.2 1 87 3216 3287 3216 3287 0.83

25 28 1e-14 2.3e-11 44.4 4.4 1 86 3400 3470 3400 3471 0.85

26 28 7.8e-14 1.7e-10 41.6 0.1 1 87 3563 3633 3563 3633 0.85

27 28 3.7e-10 8.2e-07 29.8 0.5 1 58 3650 3698 3650 3712 0.88

28 28 3.1e-09 6.8e-06 26.9 1.1 18 87 3715 3773 3704 3773 0.76

#	of	c-Evalue	i-Evalue	score	bias	hmm coord from	hmm coord to	ali coord from	ali coord to	env coord from	env coord to	acc
1	28	6.6e-15	1.5e-11	45.1	4.2	1	86	566	638	566	639	0.85
2	28	2.8e-15	6.1e-12	46.3	4.6	1	87	666	735	666	735	0.83
3	28	6.8e-16	1.5e-12	48.2	0.4	1	87	757	829	757	829	0.85
4	28	5.9e-16	1.3e-12	48.4	5.7	1	87	924	994	924	994	0.83
5	28	8.3e-15	1.8e-11	44.7	3.4	1	86	1018	1089	1018	1090	0.81
6	28	3.5e-13	7.7e-10	39.5	1.5	1	87	1125	1193	1125	1193	0.80
7	28	1.7e-11	3.7e-08	34.2	2.3	1	86	1241	1310	1241	1311	0.78
8	28	6.3e-17	1.4e-13	51.5	0.3	1	86	1338	1407	1338	1408	0.82
9	28	2.7e-12	6e-09	36.7	0.8	1	86	1429	1498	1429	1499	0.80
10	28	6.9e-15	1.5e-11	45.0	1.5	1	86	1525	1596	1525	1597	0.85
11	28	2e-13	4.4e-10	40.3	2.5	1	85	1673	1741	1673	1743	0.82
12	28	3e-12	6.5e-09	36.6	0.1	1	86	1766	1834	1766	1835	0.82
13	28	2.1e-14	4.6e-11	43.4	1.1	1	86	1990	2058	1990	2059	0.82
14	28	4e-10	8.7e-07	29.8	0.3	1	61	2112	2166	2112	2188	0.79
15	28	2.8e-05	0.062	14.2	0.1	1	58	2195	2246	2195	2270	0.80
16	28	3.1e-11	6.9e-08	33.3	0.1	1	86	2285	2354	2285	2355	0.83
17	28	6.2e-14	1.4e-10	41.9	1.1	1	87	2413	2483	2413	2483	0.81
18	28	2.3e-13	5e-10	40.1	0.6	1	86	2518	2589	2518	2590	0.82
19	28	1.1e-13	2.3e-10	41.2	1.5	1	87	2600	2672	2600	2672	0.81
20	28	4.5e-14	9.8e-11	42.4	0.1	1	87	2695	2766	2695	2766	0.79
21	28	1.7e-05	0.038	14.9	0.1	1	57	2799	2851	2799	2867	0.83
22	28	1.6e-06	0.0035	18.2	0.1	50	86	2917	2945	2909	2946	0.71
23	28	3.2e-14	7.1e-11	42.9	0.9	1	86	3080	3152	3080	3153	0.81
24	28	1.9e-14	4.1e-11	43.6	2.2	1	87	3216	3287	3216	3287	0.83
25	28	1e-14	2.3e-11	44.4	4.4	1	86	3400	3470	3400	3471	0.85
26	28	7.8e-14	1.7e-10	41.6	0.1	1	87	3563	3633	3563	3633	0.85
27	28	3.7e-10	8.2e-07	29.8	0.5	1	58	3650	3698	3650	3712	0.88
28	28	3.1e-09	6.8e-06	26.9	1.1	18	87	3715	3773	3704	3773	0.76

Sequence Information

Coding Sequence: atgtcacaacaacaacacaatccCCCTCCACAtcaccaacatcaacatcactactatcagcaacagcagcaacagcaacaacaacaacaacatcatctgcagcagcagcagcatttgcagcataaacaaatacaacaacagcacagtTGGTACTCACATGTTGCTTCCTATCCGCCCCCGCATGCCGCTGCCTTTGCGTCGCCctgcaaaagcagcagcagcaacaacaataacaacaaccacattaTGAATGCATACGGCACGGGTGCAGGAACGTATTATGGCTCAACGGGAGCGGGTGGCGTTGGGGTTGGCTATAACCTTGAGGCCAATACTGTGGCCTATGCGCACAACCAGCTGCTGCagtaccaacaacaacaacagcagcaacaacagcatcagcaacaacagcatcagcagcagcacagccaGCGCTCGTATATGCCACCACATTTAATGCACAGCTCGTATCCGTACATTAAGAGCGAACCATTGGAGCCACTGCCCGAAcgccatcagcagcagcagcagcaacaactcttTCAGAATCCTATGGCACCGCCGCCAGCACCCGCCATTGCAAATCGTCATTCGCTCGATGCTAGTGGCGAAATGATAATTAAATCGGAACCCATTGACGAACATGCTTTCAAGTCCAACTATATCGATGATAATACTCCCTTTGCCGATTTTAGTAAATATCCCGAATTCGGCGACGATATGCTAAGTCCCAAGCTTGAGCTGAATGTCAAGGATGAGACCTATGGAAACCAAAAAaACCCGCTAAACTACCCGCGTCGGAAGCTGCAAACGGATCGCTCCGCGGAGAGTATGCCCATTTGTCAGCGCTGCAAAGAGGTGTTCTTCAAGAAGCACATTTACCTCCGGCATGTCGCTGAGAGCAGTTGCAACATACACGAGTATGAGTTCAAGTGCAACATCTGTCCCATGTCTTTTATGGGCGCCGAGGAGCTGCAGAAGCACAAGCACCTGCATCGAACCGACAAGTTCTTCTGCCATAAATACTGTGGGAAGCACTACGACTCTATTGCAGAGTGCGAATCGCACGAGTACATGGAGCACGAGTACGATAGTTTTGTGTGCAATATGTGCTCTGTTACGTTCCCCACACGGGAACAGCTGTATGCCCATTTGCCGCAACACAAGTTCCAACAGCGTTACGATTGCCCCATTTGCCGGTTGTGGTACCAAACGGCATTAGAGCTGCACGAGCATCGACTGGCGGCGCCCTACTTCTGTGGCAAGTATTACGCTGCagcacaccaacaacagcagcagcaacaacaacaacaacagcagcaacagcatacacagcaacatcaacaacagggCAACTACAAACTGCAGGATTGTCACATGGGTACCATTGAAAtgaCTCCACCGCAGCACAAGGCGAATGCGGCATTACCGGCAACGGCGGCGCTCAATTcgctgttgcagcagcgccAGGCGAACGCTGACGGCGCCGCATTATATGCCTCGACGCTGAAGAGCGAGACGAACGTGAAACTGGAGCGCAGCTATAGCAACTCCACCAGCGAGTCCGGCTACAGTATGCACGAGAGCAGCTATAACAATGCGTACGCCAGCGACAATTCTCTGCATGGCGGGGGTGGGGCAATTGGTGGTCCGCAGGCGCATTCCTCGACGCTGGACGATTCGGAGGATGCGCTGTGCTGTGTGCCACTGTGCGGAGTGCGCAAGAGCACCAGCCCGACGCTGCAATTCTTTACATTTCCCAAAGATGACAAGTACTTGCATCAGTGGCTGCATAACCTCAAGATGTTCCACATTCCGGCGTCGAGCTATGCGAGCTTTCGCATTTGCAGCATGCACTTCCCTAAGCGTTGCATCAATCGTTACTCTCTGTGCTATTGGGCGGTGCCCACATTTAATCTGGGCCACGACGATGTGGCCAATCTCTATCAGAATCGTGAGCTGACCAACACATTCACCACCGGCGAGGTTGCCCGCTGCAGTATGCCAAACTGTACTAGTCAGCGTGGCGAGAGTAATCTGAAGTTCTACAACTTTCCCAAAGACATCAAGAGTTTGATTAAGTGGTGCCAAAACGCTCGTCTGCCCGTCCAGGCCAAGGAGCCACGTCATTTCTGCAGTCGCCACTTCGAGGAGCGCTGCATCGGCAAGTTCCGGCTGAAGCCCTGGGCAGTGCCCACGTTACATCTGGGCGCCCAGTATGGCAAAATTCATGACAATCCCAAAAATCTGTATGTGGAGGAGAAGCGCTGCTGCCTCAACTTTTGTCGTCGCAGTCGCTCCTCCGACTTTAACATGTCGCTGTATCGCTTTCCCAGGGATGAGGTGCTGCTGCGTCGTTGGTGCTACAATCTACGCCTTGATCCGGCTGTCTATCGTGGCAAGAATCACAAAATTTGCAGCGCTCACTTTATTAAGGAAGCTTTGGGATTACGCAAACTATCTCCGGGTGCTGTGCCCACGCTACATCTGGGTCATAATGACACCTTTAACATATACGAGAACGAACTATGGCCACCGCCAACGCCCTCTACGCCCACCCAcaatcatcagcagcagctgcagcaacaccagttacagcagcagccgcaacaagTGCATCATAAATATCAGCGGCATTCGGCTGCATCCACATCCTCGTCGGCCTCATCGACATCGCATTATGTGGATCCGGAGTTAAGTGCATCCTACATGAGCATGGGCGCTGGAGGCTCATCCTCTGGCCTTAATGTCAGCGACAGCATGGACGTCTGCTGTGTGCCCAGCTGCGAGAGCAAGCGTCACAACAATGAGAACATCACATTCCACACAATACCCAGGCGGCCAGAGCAAATGCGCAAATGGTGTCACAATCTTAAGATTCCCGAGGATAAGATGCACAAGGGCATGCGGATTTGTAGCTTGCACTTTGAGCCCTACTGCATTGGCGGCTGCATGCGTCCATTTGCGGTGCCCACATTGCATCTGGGCCACGACGACGAGGACATTCACCGCAATCCGGATGTGATCAAGAAGCTCAACATACGCGAAACCTGCTGCGTGGCTGTTTGCAAGCGGAATCGTGACCGGGATCACGCCAATCTGCATCGCTTTCCCAGCAATGTGCCGCTGCTGACCAAATGGTGCGCAAATCTGCAGCGTCCTGTGCCGGATGGCAGCAAACTCTTTAATGATGCCATCTGTGAGGTGCACTTTGAGGATCGATGCCTGCGCAACAAACGGCTGGAGAAGTGGGCAGTGCCGACACTCATCCTTGGGCATGAGAATATACCCTATCCGCTGCCCACGCCGGAGCAAATTGCCGAGTTCTATGCGCGTCCCAGTGCGCCTAACAATGGTGAGGAGCAGGGCGAGTGCTGTGTGGATACGTGCAAGCGTAATCCCAGCGTGGATGACATCAAACTATATCGCCCGCCCGAGGAGTCACAGGTGCTGGCCAAGTGGGCACACAATCTCCAACAGGAGATAGCCCAGCTGCCCAATATGAGAATATGCAATCTTCATTTCGAATCCCACTGCATTGGCAAGCGGATGCGCCCCTGGGCAGTACCCACGCTCAATCTAGCAACCAACATAGAGAATCTCTACGAGAATCCCGAACACCAGATGCTCTACAAGCGGCGCACGCATCTCAAGCCGGGCAGAGCAGTTCGAGGCTCGGAAGCAAGCGCTGGTGGTGTGAAGCCCACCTGGGTGCCACGCTGCTGCTTGCCGCACTGTCGTAAGGTGCGTGCCACGCACAATGTTCAGCTGTATCGCTTCCCCAAACTCAATCGCTCCACGCTGGCCAAGTGGGCGCATAATCTACAGGTGCCGCCTGTGGGCAGTGCCCAGCGTCGCCTCTGCTCCGCACACTTTGAGCCGCATGTGCTCAGCAAGAAATGCCCGGTGCCCATGGCGGTGCCCACACTGGACCTCAATACACCATCTGGCTACAAGATCTATCAGAATCCGGCCAAGCTCAAGGCCAACAAGCTCTGTTTGCAGCGCGTCTGCATTGTGGAGAGCTGCCGGCGTCAGCGTTCGCAGGGGGTGCAACTCTTCCGTCTGCCTCATAGCCCCACCCAGCTGCGTAAGTGGATGCACAACATCCGGATGCGTCCCCGAGGCGCTATGCGACAACAGTATCGCATTTGCTCGCAGCACTTCGAGACGCACTCGTTCAATGGGAAGAGACTCAGTGCCGGAGCAATTCCAACACTTGAGTTGGGCCATGAAGACGAAGACATATTTCCGAATGAGGCGCAGTCTTTCGTGGAGGAGCACTGCACCGTCGAGGGCTGCGGTGCCATCAAGGAGCAACCGGATGTGCGTCTCTTCCGCTTCCCCAACGACGATGAGGATCTGCTGTGGAAGTGGTGCAACAATCTGAAAATAAGTCCAGTCGACTGTATCGGCGTTCGCATCTGCAACAGACATTTCGAGCCGGATTGCATTGGACCGAAGCATCTGTTCAAGTGGGCCATTCCCACTCTCTCCCTTGGCCACGATGATGATATCGAGCTGATGCTAAATCCCAAGCCGGAGGAGCGCTATATTGATCCTGTCTTCAAGTGCTGTTTGCCCTCTTGCGGAAAGACGCGTAAATTCGATGAAGTGCAGATGAACAGTTTTCCCAAAGATCCGGAGCTCTTCCAGCGCTGGCGCCACAATCTCCGCCTCGAGCATCTCAACTTCAAGGAGCGCGAACGCTATAAGATCTGCAACGCCCATTTCGAGGACATTTGCATTGGTAAGACGCGCCTAAACATTGGGTCCATACCAACACTGGAGCTTGGTCATGACGAGACTGATGACTTGTTCCAAGTCAATCCCGAGGAGCTGCAGAGCAATCTCTTTGGACGCCAGCGACGCGTCCAAGATTCCATGAGGATCAACATTAAGCAGGAGGCGCACTCAGACCTGGATGAAGACACCAAACCGGACATTAACATATCGGAGGCCACAGATTCAAGTACAACACAGGTTAAAATCAAGAAATCTTTGACTGATTTCAAGTGCTGTGTGCCGAGCTGTAGTCGCAGCCGCCTGGAGCATGGTGCCCGCCTCTTTCCGTTTCCGAATgggaaacagcagcagagcaagTGGCGCCACAATCTGCGGCTGCCTGCTGCCAACGTGGACAAGACGACGCGCATCTGCAGCGCCCACTTCAATCGCCGTTGCATCGATGGCAATCAGTTGAGGGGCTGGGCAATGCCCACACAGCAGCTGGGCCATCAGGAGTTGCCGATCTATGAGAATCCAAAGAATATACCGGGCTTCTTTACGCCCACCTGTGCACTGGCGCACTGCCGCAAGAGGCGCAGCATTGACAACGATCTGCGTACCTATCGGTATCCACGCAGCGAGGAGCTGCTCGAGAAGTGGCGCGTCAATCTACGCTTGTCGCCGGATCAATGCCGCGGACGAATCTGTGCGGATCATTTCGAGCCGCTGGTGCGCGGCAAGTTGAAGCTGAAGACGGGAGCAGTGCCAACGCTCAAATTGGGACACGACGAGGGCGTGGTCTTTGATAACGAAGGCATTAAGGCGGGTCTGCAGCAGGAGGACGAGGCGGAGGAAGAAGAGGGCGATGCCAGCTTAAAGTCGTTGGTCAAAGTAAAGACTGAACAGGAGGACGAACAGGAGCTAGAGAATGAAGATGAAGAGCAGCAAGAGCAGGAGCAAGATCTGGAGCAGGACCACCATCAAAATatggacgaggatgaggaagGGCATCGGGACTCTGAGGAACATGGCTATTTTGATCCCTTGGAACTTGTGGAAACCTACGCTGAGCACCACAGCGATGATACCTCTGCCGGACATGATAAtctcgatgatgatgaggatgatgatgaagacATTCCCGGCAATGACGATGAGCTGCTTCTGCCAGATACGCGGCCACTTCGAATGACAATGGCTCCGCGGCGCGAGAAGGCTGTGAATAATGTGACGCCCATTTGCTGTCTGAAGCACTGTCGCAAGGAGCGCACCGCCACCCATCATCTCAGCACCTTTGGCTTTCCCAAGGATCCACAACTGCTGCTGAAGTGGAGCGCCAATCTGCAGCTGCCGTTGGAGTCCTGCATGGGTCGTGTGTGCGTCGAGCACTTTGAGCCCTCGATGCTGGGCACGCGCAAGCTGAAGCAGAATGCTGTGCCCACCTTGAAGCTGGGCCATGCCACACCGCTCACCTACAGCTGTAATGGCCGGATGCTGTCGGGTATATATGATGAACAGCCGCAGCATTCGGTTTTTCGGCTTTGGAGCCTAAAACACTGCCGAAAACGGAAGCCGGATCTGGCGGAGATTAAGCCCGGTCGTCGCTGTTGCCTGCCAAGTTGCGGCAAGCTGTCGGAGTTGCATGGCGTTCAGCTGCAGCGCCTGCCCAAGGATCGTCTGATGCTGCGCAAATGGTTGCACAACCTGATGCTGCCTCCAACGATGGACTGCACTCAAATGTTCCTCTGCAGCGATCACTTTGAACTGAATGCGCCGTGTCCCACTTTGAAACTGGGCCACTCGGATACCAATATTTATCGCCACAATGTGGCTAGCACCAGTGGTACCAGTGGCTGTCTGGTGCCCAAATGTACTTGTGCTCGTCTCAATCTCTATCGCGGCTATGATCTGCCCGCGCATCCGCAGGTGCAACAGGCCTGGCTGCACTGGCTGCAGCTGCCCCATCCTCAGCCGTCGCCCCGGCACGCCCAGCTGTGTGTGATGCACTTTATGCAGCTCTACGAACTGGTGCCGCTGCCCGAGTCGTTGCCAGATGTTGTGCGTCGCCAGCTGCGTGAGACTTACGAACTGATATCCAGCTCCAGCATGGCCATGAAGCTACGTTGCGCTGTGCCCGGCTGCTACTCAAAGTATACGGACAATGTGCGTCTGACCAAGCTGCCCGTTTACCCCGACACCTGCGCCAAGTGGGTGCACAACACCAAGATTCAATATGATCCGGCCCGACATTATGTCTATCGCATCTGCATGTTGCACTTTGAGCCAGGCTGCCTGGGCCCAGTACGTCCCAAAGTATGGGCAATGCCaacgctgcagctgcaccacGAGGAtgccaacatttatttaaatcccAAGCTGGGTGGCAGCCAACCACAACCCGCCGTGCCGTTGGAGCTGCCGCTGCGCATTAAAACTGAGCTGCCGATGTGCAACAGTCCCAGCAttagtgcgagtgcgagtccCAGTCCGCTTAGCAAGCTGCGCACCTGCTGTATTCCCAGCTGCGGTCAGCAGGCTTCCGCCCTGACGCGTCTCTTTCGCTTTCCCAGCGCGGAGACGTCGATGCTAAAGTGGCTGGTGAatacacagcagcagccgcgcTTTGTCGATGCACAACGGCTGTTCGTCTGCCAGGATCACTTCGAGGCGGAGGCCATTTGCAAGAATCAGCTGCGCATCTGGGCAGTGCCCACACTAAATCTAGGACACGATGGACACATCATACCGAATGCCAAGCATAATGGCAACATTGCCGACAGCCAGGAGAACAAGCAGACGCTGCAGTTCATCTGGGCCAACTACTGCTCGGTGCTGACCTGCTTCCAGCAGAGTAGCGAGCAGCTGCGTCTCTACCAATATCCCACGGATCGGCCAACCATTCGCAAGTGGGCCGCCAATTGTAAGCATCGCTCCATGCAGGCCAGTAGCGATGGATTTCAGGTGTGCCAGTCGCATTTTGCGCCGGATTGCTTTGATACTGATACCGGGGAGCTGAAGGAGGACGCTGTGCCAACTCTGGCGCTGAGCCGGGCTGTGACTGAGGTGCGCTGTGTGGTCAATGGTTGCGTTAAGGACGAAGATGCATCGCGTCGCCGTCTGTTCAAGATGCCCAAGCGTACCCCACAGATATTGGATTGGTGCCATAATTTGCGCATGGATCAGGCGGCAACAAGCGGCTCGGAACAGCACGTTTGTGAACGCCACTTCGAGTCAAACTGCTTTAATGCGTCTCGAGTGCTGCGTCCTGGAGCACGACCCACACTTCATTTAGGTCACGAGGACCTAGACGATGTGATACCCAATCCGGCGAACTGGGAAGAGGATGTGATCGTGTGCTGTGTGCCCCACTGCGAGAGCTCCAAGGATGCGGATGAGGTTCAACTGTTTGGGCTGCCAAAGGTCCGCCAGTTGGCGGACAAGTGGCTGCAAAATGTGCGCCTTGATCCGATCAAAGAACAACTGGCCAGCCTGAAGATCTGCAGTGTGCATTTTGAGGCTAGCTGCTTGGAGAATGGACGACCCACCTATGGTGCAATGCCCACACTCCATCTGGGTCACGATGAGCTCGACAATATACACCCAAGCGTAGAGTCGGTGCCGACGCAGCAGAAGCGCTACTGCAATAGAGACGGCGCCCGTCACGACTGCTGCTATCCGCAATGCGTGGAGCTGCAGAAGAGCTATCTGCGGGTCACCTACGAGCTGCCCCAGAAGCAGGAGCTCCGTCAGCAGTGGCTCTCTTATATGGACCTGGAGGCGCCGCAGCTCgataagcagcagctgcccaagCTCTGTCCACTCCACCTAATCTTGCTTTACGATCATAGTGCGGATCACTTTTCAGCACACGTAGCTGAAGAGCTGCTGGACTCCAATTATGAGGCAGCACGTGCAGCGTTCGCATACGCGCTGTCAGCTGTGCGGTGCGTGGCTGCAGAACACTCAAGCCACGTGACGGCGGACGGCTTCATGTTGGTGTTTTACGAGCAACAGCGTTATATGTACAAGATATGCAGCAAGCACTTTGAGCCCAGATGCTTCACGGAGACAACCAAGCGCTTGAAGCCGTGGAGCATGCCTACGCTGGAGTTGCCGGAGCTTCAACAGGGCGAGATGCCAGCCTATCAGAATCCCACAGAGTTGGAGTGGCAACACATGAATGAGCTGCAGGTCAGCGAGAAAGTTGTTGAGGCTCAGCCGGAGCCATTGCTCATGCTGGAGCCGTTGCCCAAGAAGGAGTCACCAGCACCGCAGGTTATGGAATATGAAGAGGATTGCGACAATAACTCACAGCAGCCTTTGGAAATGCAGGCGCTGGAGGTGCTGCTCGAGGTGGGTCATGTCGAGAAGTGCACTACCTACGAACAAATGGATACCGAGGCAAATCTCAGCTATGCCGAGCAGTTTTCGCACAATCCTCTCAGTCCAGGTCCACCCCAAAGCCGTATCCCCGTGGTCCAGAATGGACTCCACTACAGCGCACGCCACTGCAGCGTGCATGGCTGCAATGTCACCTCGAATAATCTGGGCAGCAGCATCAAGCTGCACAAGTTCCCCGTCTCGCTGGATGCCATGAAAAAGTGGATGCACAACACCCAGGTGGTCGTGGACGTCAAATTCGATTGGCGTTTTCGCATCTGCAGTCATCATTTCATCGAGGATTGCTTTCAAGGTTCGCGCATCAGACGTGGAGCGATGCCCACGTTGCGACTGGGCTCACGTCGACCGAAGCACATCTATGATAATGAGTTCAAAGCCATACTGCAACTGGAACATACTAAAGAAGAGACCAGGCAGTCGCTCGCTGTTCCGCTGGAGTctcagcaacagttgctctCTGCGAATGTAGGTCTTCGCCTGCCACGCCCTGCACCGCCCTGCAAATCCAGCAAATACTGTCAGATCGATGGCTGCTCCAATCATTTGACCAGCGAGAATGTGACGCTGCACAAGTTCCCCCATTCGTCGGACATGTGCGCCAAGTGGCAGCATAACACTCAGGTGCCCTTCGATCCCGAGTTCCGCTGGCGCTATCGCATCTGCAGCGCACACTTTGAGCCCATCTGTCTAGGCAATGTGCGACTGATGCACGGCAGTGTGCCCACCCTGAATCTGGGACCGCTTGCACCCAAGAAACTGTTTGATAATGAATTCTTGCGTCTGGACAAGCCAACGAGCAGCTCGGTGGTGGGCATGACAGTCAAACAGGAGCGAATGGAGCAATTTGATCAACTGGAGCTGGAAGATGGCAACCAGGAGCAGGATGATTTTAGTCTGCTGGAGCCCGAGCTGGAGCTGCACGAGGGTAGCGAGGATGAGCAACAATATGACAATCATTTCAGCCAAAACGATTCCTATAACTGGTCCGATCAGCAACTGCGTCTGTCAAGCAATAATCAGGAGAAGTGCACCATCAGCTACAATCCGGTCAAGTCAGGCTATGATAAGTGCTCACTGGTCCACTGCCAACGACAGCGTTCCCAGCACGGCGTGCACATCTACAAGTTTCCGCGCTCGCGTCAGTTGCAGCAACGATGGATGCATAATTTGCGCATCCATTACGATGAGCGACGGCCGTGGAAGACAATGATATGTAGTGTTCATTTCGAGCCGCACTGCATCCGTCTGCGCAAGTTGCGTCCCTGGGCAGTGCCCACGCTGGAACTGGGGGACAATGTGCCCCTGGAGATCTTTACGAATGAGCAGAGTCAGCAGCTGTTTACTCAGTCCGAAACAGGCAGCGAGTGTGATGAGGTTGAAGTGGATGTTGAGGACACCATATTGGAGGACTTGGATGATGACTATGATGACAATGATGTTGATGGGAATGTAGATGCTGATGATCAAATGCAAACGGCTCCGTATGTGAAAAGGGAGCGTCGCTCTCGATTTGATCCTCTGCCACCGGGTCAGCTGCCACCGTGGAAGATCAAATGCTGTTGTTTGCCCTATTGCCGCAATCCCCGCGGTGATGGCATCAAGCTCTTTCGACTGCCCAACAACATCAGCTCCATACGCAAATGGGAGCAGGCCACAGGCATGCGCTTCTATGAGTCGCAGCGCAACACAAAGCTCATCTGCAGTCGGCACTTTGATCCGCAGCTAATAGGCGTGCGTCGTCTCATGTCCAATGCGGTGCCCAGTCTACATTTGGGCCCAGACAGCGCAGAGCCCGAGCAGACTCCAGTGGGACCACGTTGCTGCATGCCCGATTGCTCTGAGGATGTCAATGTACAGCTGCACAAGTTTCCCAGAGATCCCATGCTGCTGCATCAATGGTGTCAGGCGCTCAATCTACCGGATGTTCAAAGTTACTCTGACAAATTCATTTGTGCCGCACATCTGCCCGCCAACGCGATGAGCTGTCTAATTTGCGGCGTGGACGATGTACAGCTGCCAATGCTGGACTTTCCCCAGAATCGCAATCAGCGCACAAAGTGGTGCTACAATCTGAAAATCGAGCCTCTGCCCAAGTGGGACAACTCTAAGAAAATTtgctgcaaacattttgagaGCTACTGCTTTATCCAGCCGGGGCAACTTCTGGCGGAGGCAATGCCCACGCTACACTTGGAGCATGGGGATAGCAACATATTCCTAAACGATGAGGCCATGGATAATAGCAAGTTGTTGCGCATCAAGGACGAGCCCATGGAGAGCGATGATCTGATGCTGTAA
Protein Sequence: MSQQQHNPPPHHQHQHHYYQQQQQQQQQQQHHLQQQQHLQHKQIQQQHSWYSHVASYPPPHAAAFASPCKSSSSNNNNNNHIMNAYGTGAGTYYGSTGAGGVGVGYNLEANTVAYAHNQLLQYQQQQQQQQQHQQQQHQQQHSQRSYMPPHLMHSSYPYIKSEPLEPLPERHQQQQQQQLFQNPMAPPPAPAIANRHSLDASGEMIIKSEPIDEHAFKSNYIDDNTPFADFSKYPEFGDDMLSPKLELNVKDETYGNQKNPLNYPRRKLQTDRSAESMPICQRCKEVFFKKHIYLRHVAESSCNIHEYEFKCNICPMSFMGAEELQKHKHLHRTDKFFCHKYCGKHYDSIAECESHEYMEHEYDSFVCNMCSVTFPTREQLYAHLPQHKFQQRYDCPICRLWYQTALELHEHRLAAPYFCGKYYAAAHQQQQQQQQQQQQQQHTQQHQQQGNYKLQDCHMGTIEMTPPQHKANAALPATAALNSLLQQRQANADGAALYASTLKSETNVKLERSYSNSTSESGYSMHESSYNNAYASDNSLHGGGGAIGGPQAHSSTLDDSEDALCCVPLCGVRKSTSPTLQFFTFPKDDKYLHQWLHNLKMFHIPASSYASFRICSMHFPKRCINRYSLCYWAVPTFNLGHDDVANLYQNRELTNTFTTGEVARCSMPNCTSQRGESNLKFYNFPKDIKSLIKWCQNARLPVQAKEPRHFCSRHFEERCIGKFRLKPWAVPTLHLGAQYGKIHDNPKNLYVEEKRCCLNFCRRSRSSDFNMSLYRFPRDEVLLRRWCYNLRLDPAVYRGKNHKICSAHFIKEALGLRKLSPGAVPTLHLGHNDTFNIYENELWPPPTPSTPTHNHQQQLQQHQLQQQPQQVHHKYQRHSAASTSSSASSTSHYVDPELSASYMSMGAGGSSSGLNVSDSMDVCCVPSCESKRHNNENITFHTIPRRPEQMRKWCHNLKIPEDKMHKGMRICSLHFEPYCIGGCMRPFAVPTLHLGHDDEDIHRNPDVIKKLNIRETCCVAVCKRNRDRDHANLHRFPSNVPLLTKWCANLQRPVPDGSKLFNDAICEVHFEDRCLRNKRLEKWAVPTLILGHENIPYPLPTPEQIAEFYARPSAPNNGEEQGECCVDTCKRNPSVDDIKLYRPPEESQVLAKWAHNLQQEIAQLPNMRICNLHFESHCIGKRMRPWAVPTLNLATNIENLYENPEHQMLYKRRTHLKPGRAVRGSEASAGGVKPTWVPRCCLPHCRKVRATHNVQLYRFPKLNRSTLAKWAHNLQVPPVGSAQRRLCSAHFEPHVLSKKCPVPMAVPTLDLNTPSGYKIYQNPAKLKANKLCLQRVCIVESCRRQRSQGVQLFRLPHSPTQLRKWMHNIRMRPRGAMRQQYRICSQHFETHSFNGKRLSAGAIPTLELGHEDEDIFPNEAQSFVEEHCTVEGCGAIKEQPDVRLFRFPNDDEDLLWKWCNNLKISPVDCIGVRICNRHFEPDCIGPKHLFKWAIPTLSLGHDDDIELMLNPKPEERYIDPVFKCCLPSCGKTRKFDEVQMNSFPKDPELFQRWRHNLRLEHLNFKERERYKICNAHFEDICIGKTRLNIGSIPTLELGHDETDDLFQVNPEELQSNLFGRQRRVQDSMRINIKQEAHSDLDEDTKPDINISEATDSSTTQVKIKKSLTDFKCCVPSCSRSRLEHGARLFPFPNGKQQQSKWRHNLRLPAANVDKTTRICSAHFNRRCIDGNQLRGWAMPTQQLGHQELPIYENPKNIPGFFTPTCALAHCRKRRSIDNDLRTYRYPRSEELLEKWRVNLRLSPDQCRGRICADHFEPLVRGKLKLKTGAVPTLKLGHDEGVVFDNEGIKAGLQQEDEAEEEEGDASLKSLVKVKTEQEDEQELENEDEEQQEQEQDLEQDHHQNMDEDEEGHRDSEEHGYFDPLELVETYAEHHSDDTSAGHDNLDDDEDDDEDIPGNDDELLLPDTRPLRMTMAPRREKAVNNVTPICCLKHCRKERTATHHLSTFGFPKDPQLLLKWSANLQLPLESCMGRVCVEHFEPSMLGTRKLKQNAVPTLKLGHATPLTYSCNGRMLSGIYDEQPQHSVFRLWSLKHCRKRKPDLAEIKPGRRCCLPSCGKLSELHGVQLQRLPKDRLMLRKWLHNLMLPPTMDCTQMFLCSDHFELNAPCPTLKLGHSDTNIYRHNVASTSGTSGCLVPKCTCARLNLYRGYDLPAHPQVQQAWLHWLQLPHPQPSPRHAQLCVMHFMQLYELVPLPESLPDVVRRQLRETYELISSSSMAMKLRCAVPGCYSKYTDNVRLTKLPVYPDTCAKWVHNTKIQYDPARHYVYRICMLHFEPGCLGPVRPKVWAMPTLQLHHEDANIYLNPKLGGSQPQPAVPLELPLRIKTELPMCNSPSISASASPSPLSKLRTCCIPSCGQQASALTRLFRFPSAETSMLKWLVNTQQQPRFVDAQRLFVCQDHFEAEAICKNQLRIWAVPTLNLGHDGHIIPNAKHNGNIADSQENKQTLQFIWANYCSVLTCFQQSSEQLRLYQYPTDRPTIRKWAANCKHRSMQASSDGFQVCQSHFAPDCFDTDTGELKEDAVPTLALSRAVTEVRCVVNGCVKDEDASRRRLFKMPKRTPQILDWCHNLRMDQAATSGSEQHVCERHFESNCFNASRVLRPGARPTLHLGHEDLDDVIPNPANWEEDVIVCCVPHCESSKDADEVQLFGLPKVRQLADKWLQNVRLDPIKEQLASLKICSVHFEASCLENGRPTYGAMPTLHLGHDELDNIHPSVESVPTQQKRYCNRDGARHDCCYPQCVELQKSYLRVTYELPQKQELRQQWLSYMDLEAPQLDKQQLPKLCPLHLILLYDHSADHFSAHVAEELLDSNYEAARAAFAYALSAVRCVAAEHSSHVTADGFMLVFYEQQRYMYKICSKHFEPRCFTETTKRLKPWSMPTLELPELQQGEMPAYQNPTELEWQHMNELQVSEKVVEAQPEPLLMLEPLPKKESPAPQVMEYEEDCDNNSQQPLEMQALEVLLEVGHVEKCTTYEQMDTEANLSYAEQFSHNPLSPGPPQSRIPVVQNGLHYSARHCSVHGCNVTSNNLGSSIKLHKFPVSLDAMKKWMHNTQVVVDVKFDWRFRICSHHFIEDCFQGSRIRRGAMPTLRLGSRRPKHIYDNEFKAILQLEHTKEETRQSLAVPLESQQQLLSANVGLRLPRPAPPCKSSKYCQIDGCSNHLTSENVTLHKFPHSSDMCAKWQHNTQVPFDPEFRWRYRICSAHFEPICLGNVRLMHGSVPTLNLGPLAPKKLFDNEFLRLDKPTSSSVVGMTVKQERMEQFDQLELEDGNQEQDDFSLLEPELELHEGSEDEQQYDNHFSQNDSYNWSDQQLRLSSNNQEKCTISYNPVKSGYDKCSLVHCQRQRSQHGVHIYKFPRSRQLQQRWMHNLRIHYDERRPWKTMICSVHFEPHCIRLRKLRPWAVPTLELGDNVPLEIFTNEQSQQLFTQSETGSECDEVEVDVEDTILEDLDDDYDDNDVDGNVDADDQMQTAPYVKRERRSRFDPLPPGQLPPWKIKCCCLPYCRNPRGDGIKLFRLPNNISSIRKWEQATGMRFYESQRNTKLICSRHFDPQLIGVRRLMSNAVPSLHLGPDSAEPEQTPVGPRCCMPDCSEDVNVQLHKFPRDPMLLHQWCQALNLPDVQSYSDKFICAAHLPANAMSCLICGVDDVQLPMLDFPQNRNQRTKWCYNLKIEPLPKWDNSKKICCKHFESYCFIQPGQLLAEAMPTLHLEHGDSNIFLNDEAMDNSKLLRIKDEPMESDDLML

Similar Transcription Factors

Sequence clustering based on sequence similarity using MMseqs2

100% Identity: iTF_00595971;
90% Identity: iTF_00500343;
80% Identity: -