Basic Information

Insect: Drosophila athabasca
Gene Symbol: -
Assembly: GCA_008121215.1
Location: CM017794.1:50923953-50937639[-]

Transcription Factor Domain

TF Family: THAP
Domain: THAP domain
PFAM: PF05485
TF Group: Zinc-Coordinating Group
Description: The THAP domain is a putative DNA-binding domain (DBD) and probably also binds a zinc ion. It features the conserved C2CH architecture (consensus sequence: Cys - 2-4 residues - Cys - 35-50 residues - Cys - 2 residues - His). Other universal features include the location of the domain at the N-termini of proteins, its size of about 90 residues, a C-terminal AVPTIF box and several other conserved residues. Orthologues of the human THAP domain have been identified in other vertebrates and probably worms and flies, but not in other eukaryotes or any prokaryotes [1].
Hmmscan Out: # of c-Evalue i-Evalue score bias hmm coord from hmm coord to ali coord from ali coord to env coord from env coord to acc

1 29 9.7 1.1e+04 -3.0 3.3 44 63 337 359 322 374 0.56

2 29 5.7e-15 6.5e-12 45.8 3.6 1 86 570 642 570 643 0.85

3 29 1.9e-14 2.1e-11 44.1 4.8 1 87 670 739 670 739 0.82

4 29 1.6e-15 1.8e-12 47.6 0.2 1 87 761 833 761 833 0.85

5 29 9.3e-16 1.1e-12 48.3 5.5 1 87 941 1011 941 1011 0.82

6 29 8.6e-15 9.8e-12 45.2 3.2 1 86 1035 1106 1035 1107 0.82

7 29 5.3e-13 6.1e-10 39.5 0.8 1 87 1139 1207 1139 1207 0.81

8 29 3e-11 3.4e-08 33.9 2.0 1 86 1246 1315 1246 1316 0.77

9 29 6.6e-17 7.6e-14 52.0 0.4 1 86 1343 1412 1343 1413 0.82

10 29 6.1e-13 7e-10 39.3 0.9 1 86 1434 1503 1434 1504 0.79

11 29 1.3e-13 1.4e-10 41.5 1.1 1 86 1531 1602 1531 1603 0.85

12 29 3e-12 3.4e-09 37.1 2.7 1 85 1674 1742 1674 1744 0.82

13 29 3.4e-12 3.9e-09 36.9 0.1 1 86 1767 1835 1767 1836 0.82

14 29 4.3e-14 4.9e-11 43.0 1.0 1 87 2009 2078 2009 2078 0.78

15 29 3.4e-10 3.8e-07 30.5 0.0 1 86 2169 2242 2169 2243 0.79

16 29 0.0025 2.8 8.5 0.0 1 58 2262 2306 2262 2322 0.80

17 29 1.1e-12 1.3e-09 38.4 0.1 1 86 2342 2411 2342 2412 0.81

18 29 1.6e-13 1.9e-10 41.1 0.1 1 86 2491 2559 2491 2560 0.82

19 29 3.6e-10 4.1e-07 30.4 0.1 1 85 2595 2665 2595 2667 0.79

20 29 1.8e-11 2.1e-08 34.5 0.3 1 87 2681 2751 2681 2751 0.80

21 29 1.1e-15 1.3e-12 48.0 0.4 1 86 2776 2848 2776 2849 0.81

22 29 4.2e-05 0.048 14.2 0.1 1 58 2876 2931 2876 2950 0.79

23 29 2.5e-11 2.8e-08 34.1 0.6 1 87 2969 3041 2969 3041 0.79

24 29 1.9e-12 2.2e-09 37.7 0.0 1 86 3173 3243 3173 3244 0.78

25 29 2.8e-12 3.3e-09 37.1 4.2 1 86 3299 3369 3299 3370 0.81

26 29 2.6e-14 3e-11 43.7 5.5 1 86 3494 3564 3494 3565 0.84

27 29 5.2e-12 6e-09 36.3 0.2 1 86 3656 3725 3656 3726 0.84

28 29 3.7e-09 4.2e-06 27.2 0.7 1 58 3746 3795 3746 3810 0.86

29 29 1.3e-09 1.5e-06 28.6 0.5 18 87 3814 3872 3799 3872 0.76

#	of	c-Evalue	i-Evalue	score	bias	hmm coord from	hmm coord to	ali coord from	ali coord to	env coord from	env coord to	acc
1	29	9.7	1.1e+04	-3.0	3.3	44	63	337	359	322	374	0.56
2	29	5.7e-15	6.5e-12	45.8	3.6	1	86	570	642	570	643	0.85
3	29	1.9e-14	2.1e-11	44.1	4.8	1	87	670	739	670	739	0.82
4	29	1.6e-15	1.8e-12	47.6	0.2	1	87	761	833	761	833	0.85
5	29	9.3e-16	1.1e-12	48.3	5.5	1	87	941	1011	941	1011	0.82
6	29	8.6e-15	9.8e-12	45.2	3.2	1	86	1035	1106	1035	1107	0.82
7	29	5.3e-13	6.1e-10	39.5	0.8	1	87	1139	1207	1139	1207	0.81
8	29	3e-11	3.4e-08	33.9	2.0	1	86	1246	1315	1246	1316	0.77
9	29	6.6e-17	7.6e-14	52.0	0.4	1	86	1343	1412	1343	1413	0.82
10	29	6.1e-13	7e-10	39.3	0.9	1	86	1434	1503	1434	1504	0.79
11	29	1.3e-13	1.4e-10	41.5	1.1	1	86	1531	1602	1531	1603	0.85
12	29	3e-12	3.4e-09	37.1	2.7	1	85	1674	1742	1674	1744	0.82
13	29	3.4e-12	3.9e-09	36.9	0.1	1	86	1767	1835	1767	1836	0.82
14	29	4.3e-14	4.9e-11	43.0	1.0	1	87	2009	2078	2009	2078	0.78
15	29	3.4e-10	3.8e-07	30.5	0.0	1	86	2169	2242	2169	2243	0.79
16	29	0.0025	2.8	8.5	0.0	1	58	2262	2306	2262	2322	0.80
17	29	1.1e-12	1.3e-09	38.4	0.1	1	86	2342	2411	2342	2412	0.81
18	29	1.6e-13	1.9e-10	41.1	0.1	1	86	2491	2559	2491	2560	0.82
19	29	3.6e-10	4.1e-07	30.4	0.1	1	85	2595	2665	2595	2667	0.79
20	29	1.8e-11	2.1e-08	34.5	0.3	1	87	2681	2751	2681	2751	0.80
21	29	1.1e-15	1.3e-12	48.0	0.4	1	86	2776	2848	2776	2849	0.81
22	29	4.2e-05	0.048	14.2	0.1	1	58	2876	2931	2876	2950	0.79
23	29	2.5e-11	2.8e-08	34.1	0.6	1	87	2969	3041	2969	3041	0.79
24	29	1.9e-12	2.2e-09	37.7	0.0	1	86	3173	3243	3173	3244	0.78
25	29	2.8e-12	3.3e-09	37.1	4.2	1	86	3299	3369	3299	3370	0.81
26	29	2.6e-14	3e-11	43.7	5.5	1	86	3494	3564	3494	3565	0.84
27	29	5.2e-12	6e-09	36.3	0.2	1	86	3656	3725	3656	3726	0.84
28	29	3.7e-09	4.2e-06	27.2	0.7	1	58	3746	3795	3746	3810	0.86
29	29	1.3e-09	1.5e-06	28.6	0.5	18	87	3814	3872	3799	3872	0.76

Sequence Information

Coding Sequence: ATGTCACAGCATAATCCACATGCCCATCCGCACTACCATCACCACCCACTGCACCACCATCAGAcgcaacaccaccaccagcagcagcagttgcagcagcagcaacagcaacagcaacaacaggcgCAAATGCCACAACACAGCAATTGGTACTCACATGTTGCTTCCTacccgccaccgccaccccaCCACCATGCGACGAGTACCTCCGCATTTGCCGCCACCTCCACACCTTGCAAGGGCACTGACTACGGAGCAGGCAGCACGCATGGATAttatgctgctgccgccgccgccgctggcGGTGGGCTCAATGTCAATGCTgtaggtgtgggtgtgggtgtgggtgttggTGGGGGTGGGTCAGTGTCAGCCGCAACGGCAGCCTATAACCTTGAGGCCAACACAGTGGCATATGCCCACAACCAGCTGCTACAGTatcaacagcaccagcagcagcaacaccatcagcagcagcaccatctTAGCCATCGTTCCTATATGGGGCATGATATAATGTCGGGCACATATCCGTACATCAAAAGCGAACCCATGGAGTCCGCATATCAGCAGCCACCCATTCCGATGGCCCCACCCCCAGCGCCAGATATGATAATAAAATCGGAACCCATTGATGAGCATCCCTACAAGTCAAACTATATTGATGACAATACGCCCTTTGCTGATTTCAATAAGTTCAACGAATTCAGCGGCGATATGCTAAGCCCCAAAGTCGAGCTAACCGTCAAAGATGAGACCTACGGAAAGACTTCTAGCAGCAGCTTTGCACGCCGCAAAgcccagcaacaacagcaacagcagacgACAGATCATTCGGCGGAGAGTCTGCCCATCTGCCAGCGCTGCAAGGAGGTCTTCTTCAAGAAGCAATCCTATCTGAGGCATGTGGCCGAGAGCAGTTGTGGCATCCAGGAGTACGACTTCAAGTGCAACATATGCCCCATGTCCTTCATGAGCACCGAAGAACTGCAGCGGCACAAGCATCTGCATCGTGCGGACAAGTTCTTTTGCCACAAATACTGCGGCAAGCATTTCGACACGATAGCCGAGTGCGAATCGCACGAGTACATGCAGCACGAGTATGAGAGTTTTGTTTGTAATATGTGCTCTGGAACCTTTGCCACGCGGGAGCAGCTGTATGCCCACTTGCCGCAGCACAAGTTCCAGCAGCGTTACGACTGTCCCATCTGCCGTCTGTGGTATCAGACGGCCGTCGAATTGCACGAGCATCGACTGGCGGCACCATACTTTTGCGGCAAGTACTATACcaatcaacagcagcagcagcagcagcttgcgACGAATCAGGGGAACTACAAGCTGCAGGACTGCCATATGGCCACCATGGAAATGCCTACAGCACCACTCCATAAGGCTACGCCTTCTAATGCCTCAGCCCTGCCAGCCACAGCTGCTTTGAGCTCTCTGTTGCAACAGCGCCAGGCAAATGCCGATGGGGCAGCGGCcatgtttgctgctgcttcctccACTTCCGCCTCGCTGAAGAGGGAGGTGAGCGTGAAGCTGGAGCGTAGCTACAGCAACTCCACCAGCGAGTCCTCGTACAGCCATCAGGACAACAGCAGCTACAACAATGCCTATGGCAGCGACAGCTCCATCCACGGCGGAGCACTGGCCGGACCACAGGCGCACTCCTCAACGCTGGACGACTCCGAGGATGCCCTGTGCTGTGTGCCTCTGTGCGGCGTCAGAAAGAGCACCAGTCCAACGCTGCAGTTCTTCACGTTCCCAAAGGATGAGAAATATCTGAATCAGTGGCTGCACAACCTCAAGATGTTCCACATACCAGCCGCCAGCTATGCAACATTTCGCATCTGCAGCATGCACTTCCCGAAGCGTTGCATCAATCGGTATTCGCTGTGCTATTGGGCGGTGCCCACCTTCAATCTGGGGCACGACGATGTGGCCAATCTGTACCAGAACCGGGAGCTAACCAACACCTTTACCACTGGAGAGGTGGCACGCTGCAGCATGCCGCACTGCACTAGCCAGCGGGGGGAGAGCAACCTGAAGTTCTACAATTTCCCCAAGGACATCAAGAGCCTGATCAAGTGGTGCCAGAACGCCCGCCTGCCGGTGCAGGCCAAGGAGCCGCGTCACTTTTGCAGCCGCCACTTTGAGGATCGCTGCATTGGCAAGTTCCGACTGAAGCCCTGGGCCGTGCCCACCCTCCATCTGGGGGCGCAGTACGGCAAAATCCATGACAATCCCAAGAACCTGTATGTGGAGGAGAAGCGCTGCTGCCTGAACTTTTGTCGTCGCAGCCGGTCCTCGGACTTTAACATGTCGCTGTATCGATTCCCCCGCGATGAGGTGCTCCTGCGACGCTGGTGCTATAATTTAAGGCTGGACCCGGGCGTGTATCGCGGCAAGAATCATAAAATATGCAGTGCGCATTTCATCAAGGAAGCACTGGGTCTCAGAAAGCTATCGCCAGGGGCCGTTCCCACATTGCATTTGGGTCACAATGACACCTTTAATATCTACGAAAACGAGCTGTGGCCACCGCCATCGCCCACTGGACAACATGGCGGCAATCACCAGCTcctccaacagcagcagacgTCACAGCAGCTGTCGCATCACCACTCgtcgctgcagcagcagcagcatcagccaATGCATAGCAAATCCTATCAACGCCATTCGGCGGCCTCCACTTCCTCCTCAGCCAGTTCGGCCTCGCATTACGTGGACCCCGAGATGAGTGCGTCGTATCTGAGCCTGTCGGCGGGTGGCTCCTCTGGCGGGATGAATGCCAGCGACTGCTTGgatgtgtgctgtgtgccCAGCTGCGAGAGCAAGCGGCACAACAGCGAGAACATCACATTCCACACGATACCGCGCAGGCCGGAGCAGATGCGCAAGTGGTGCCACAATCTGAAGATACCCGAGGACAAGATGCACAAGGGCATGAGGATTTGCAGCCTGCACTTCGAGCCCTACTGCATTGGGGGCTGCATGCGACCGTTTGCCGTGCCCACCCTCCATTTGGGGCACGAGGATGAGGACATACACCGCAATCCGGATGTGATCAAGAAGCTGAACATCCGCGAGACCTGCTGTGTGGCCGTGTGCAAGCGGAATCGCGACAGAGACCATGCCAATCTCCATCGCTTCCCCAGCAATGTGGCGCTGCTCACGAAGTGGTGTGCGAATCTGCAGCGGTCGGTGCCCGATGGCAGCAAACTGTTCAACGATGCCATCTGTGAGGTGCACTTTGAGGACCGTTGTCTGCGCAACAAGAGGCTGGAGAAGTGGGCTGTGCCCACACTGATCCTCGGTCACGAGGACATTGCCTATCCGCTGCCAACGCCCGAGCAGTTCTATGCTCGGCCCACGGCCCCCAACAATGGCGAGGAGCAGGGCGAGTGCTGTGTGGAGACGTGCAAACGGAACCCGAGCGTGGACGACATCAAATTGTATCGTCCGCCGGAGGATGCTTCGGTGCTGGCCAAATGGGCGCACAATCTGCAAACGGAGGCCGCTGTCCTCACGAACATGCGGATATGCAATCTGCACTTTGAGGCCCACTGCATTGGCAAGCGAATGCGTCCGTGGGCCATACCCACGCTCAATCTGGCTGGAAACATTGAGAATCTGTTCGAGAATCCCGAGCATTCGATGCTGTACAAGCGAAGGACGCACCTCAAACAGAAGGTGCCAGTGACGAAGCCCACGTGGGTGCCCCGCTGCTGTCTGCCGCACTGCCGCAAGGTGCGTGCCCTGCACAATGTCCAGCTGTATCGCTTCCCCAAGCTGAATCGCTCGACGCTGGCGAAGTGGGCGCACAATCTGCAGGTGCCGCAGGTGGGCAGTGCCCAGCGGCGGGTCTGTTCCGCACACTTTGAGCCGCATGTTCTGAGCAAAAAGTGCCCGGTGCCGCTGGCGGTGCCCACACTGGACTTGAACTCACCCGCTGGCCACAAGATCTACCAGAATCCGGCCAAGCTGAAGGCCAACAAGCTGTGCCTGCAGCGCGTCTGCATTGTGGAGAGCTGCCGGAAGACCAGGGCCCAGGGCGTGCAGCTCTTCCGGCTGCCCCACAGCCCCACGCAGCTGAGGAAATGGATGCACAATATACGGACACGCCCGAGGGCGGCCATGAGGAGCCAGTATCGCGTCTGTTCGCGACACTTCGAGACGCACTCCTTCAACGGCCGCAGGCTGAGCGCCGGGGCCATTCCCACCTTGGAGTTGGGCCATGACGATGATGATATCTTCCCGAATGAGGCGCAGGCCTTTGCGGATGAGCACTGCGCTGTGGAGGGCTGTGAATCGTCGAAGGAACAGCCGGAAGTGCGGCTTTTCCGCTTCCCCACGGACGACGACGACATGCTGTGGAAGTGGTGCAACAATCTGAAGATGAATCCCGTCGACTGCATCGGTGTGCGGATCTGCAACAAGCATTTCGATGCCGATTGCATTGGACCCAAGCATCTCTATAAATGGGCCATACCCACGATGCTGCTCGGCCACGACGACTCTCAGATCGAGCTCATACTCAACCCCAAGCCGGAGGAGCGCTATGTGGACCCCGTGTTCAAGTGCATTGTCCCCACCTGCGGCAAGACTCGCCGCTTCGATGAGGTGCAAATGAACAGCTTCCCCAAGGATGCGGATCTCTTCCAGCGCTGGCGCCACAACCTCCGCCTGGAGCATCTCTGCTTCAAGGAGCGCGAGAAGTACAAGATCTGCAATGCCCATTTCGAGGACATTTGCATTGGGAAGACGCGTCTCAATATTGGTTCGATACCCACTCTGGAGCTGGGCCACGAGGAAACGGAGGATCTGTTCAAGGTGAATCCGGAAGATCTGCAGAGCAATCTGTTCGGACGTCCCCGGCGGCTGCTAAGAGGACTCAACAACGTGACCATCAAGCAGGAGGTGCCAGAGACGGAGGGGCAGGACATAAAGCCCGATATAGGAGCCAATTTTACACAGGTAAAGGTTAAGAAATCTCTGGGGGATATCAAGTGCTGTGTGCACACGTGTGGACGCAGTCGCTTGGAGCATGGGGCACGtctctttccctttcccaCGGGCAAGCAACAGCACCTCAAGTGGCGCCACAATCTGCGCCTGGAGCCCGACGAAGTGGACAAGACCACGCGCGTCTGCAGCGCACACTTCAACAGGCGCTGCATCGATGGCAAGCATCTTAGGGGCTGGGCCATGCCCACACAGCAGTTGGGACACCAGGAGCAGCCGATCTACGAGAATCCCAAGAATATACCCGGCTTCTTTACGCCCACCTGTGCGCTGGGGCACTGCCGCAAGCGTCGGAGCATCGACAATGATTTGCGCACATATCGGTATCCGCGTAGCGAGGATCTCCTCGAGAAGTGGCGTGCGAATCTCAGACTATCGCTGGACCAGTGCCGCGGGAGGATCTGTGCGGATCACTTTGAGCCGCAGGTGAGAGGgaaactgaagctgaagaCTGGGGCAGTACCCACGCTGAAACTGGGCCATGAGGAGGCTTTGATGTACGACAATGAGGCTATAAAGGCTGGAGTGGCCGAAGAGGAGGCTGGCAGTCCGGCGCCATCGCCTCTGGTGACACCCAAAACGGAAGTGCTGGACGAAGAGGAGCGCGAGgaagatgaggaggaggaggagaaccCCGAAGAAGAGCAACAGGAAACCCACGATGAGGAGAAGGATGAACACGAAGATGACACGCCcgaaggagcagagcagttGGGAGATGAGGATGACGACGAGGATCAAAGCAACTATTTTGATCCCTTGGAACTGGTGGAGACGTATGCGGAGCATCCCAGCGACGATGACAACAGTCACGAGGCAGCAGACGATGCCAAAGAGCAGGATGAggatgacgaggaggagccAGAAACGCTCCTCCCTGATACGCCACcccaaccagcagcagccgttcTTCGCGTGCCCAAACCGTGGGAAAGACCTGTCGCCGTAGTGCCTCGCCGAGAGAAGCGTCCGAATAACGTGGACCCCATCTGCTGCCTCAAGCACTGCCGCAAGGAGCGCTCCGCCATGTATCTGCTGAGCACATTTGGCTTCCCCAAGgaccagcagctgctgctgaagtGGTGCGCCAACCTCCAAATGGATCCCTCGAGCTGCATTGGCCGCGTCTGCGTCGAGCACTTCCAGTCGGAGGTTCTGGGCACGCGAAAACTCAAACAGAATGCAGTGCCAACCCTCAATGTGGGGCACGATGTGCCACTGCGCTACACCTGTAACGGCCAGGAAATGCctcaggcagcagcagcggcggcagcggcggcggcggcggtcgCCACCGGCAGCTTCCCCGACGAAATGCCACAGCATTCGGTTTTTCGGCTTTGGAGCCTGAAACACTGCCGCAAGAGGAAGCTGTCGGAGagtccagctccagctccagcagcgatcaaggaggaggagcagatgCAGATTCCGATTCAGATGGAGATGATGGAGACCAAGCCTAAGATATGCTGCCTCCCCACTTGTGGCAATGTGGAGGGTTACGGCCCGGGCGGGCACTTTCAGCCGCTGCCCCACGACCAAAGAGTGCTGAAAAAGTGGCAGCACAACCTGAGGCTACCATCCATTAATCCCGACTCGGATCTTCGTGGCTTGCGCCTCTGCATGGAGCACTTTGAGCCGAATCAAATCGAGAACGGAGCGCCAGTGCGGATGGCAGTGCCGACCCTCAAGCTAGGTCACTCCAGTCCGAACATCTTTAAGAACAGCGAGAGCACGCTGCCGGGATGCCTGTGGCCCTCGTGTCCGCCCAATCGCAAGATCTGCTACGATCTGCCTGACAATGAGGCCGTTCGAGCGGCCTGGCTGTCGTATGTGCGGCTGCCGCTGGACAGCCCGGGGCGTCTATGTGGCCTGCACTTTCTGCAGCTGTACGAGGAGGTGGATCTACCAGGAGATGTACCCGAAACGGTACTCGAGCGTCTGCAGGATACCTACGATCAGGCCTCCATCTCGCTCAAGTTTCAGTGCTCGGTGCAGGGCTGTGGCTCCAAGTACAAGCAGGACACCCATTTGGCGAAGCTTCCACGCGACCCGGAGCTGCTCGCCAAGTGGCTGCACAACACCAGGATCTCCTACGATCGCTCGTTGCATTTCAGCTACCGCATTTGTCTCCTGCACTTTGAGGCGTTCTGCTTGAATGGCGTCCGCCCACAGACCTGGGCCATACCCACACTCCAGCTGAATCACGACGAGGAGATCTACCAGAATACCGTCAAGCAGGAGATCCTCGAGAGTCCCGTGAAGCAGGAGAAACCCCACTGTAGCAGCCTCCCCAGTCTGAATCTCTCCATCCCCCTGCACATCAAGACGGAGCAGGGTCCTGTCCAGCGACCCCGAGGCACTTGGGGCACATCTTCTCAGAGCAGTCCCTGCCTGAGCGCCAGCTCCAGTCCACGCACGAAGAACAGGATTTGCTGCATTCCCGATTGCGGGGAGAATGCCAGATCCCAGCGGCTCTTCCGCTTTCCCACCGCCGAGCCGGCGCTGCTCAAGTGGCTGGTAAATACCCAGCAAAAACCGGGACTGGTGGACATCCAGAGCCTGTTTGTGTGCCAGCTACACTTCGAGGCGGACGCCATCAACCAGACGCAGCTCAGCAGCTGGGCCGTGCCCACACTGAGGCTGGGCCACGACGGCCATGTCATACCGAATGCCAAACACAATGGGAACATAGCCAACAGCCAGGAGACGGAGCAGGCCATGGAGTTCATTCGGGCCAACTACTGCTCCGTGCTGAGCTGCTTCCAGCCGAAGGGCGACGGTGTGCGCTTCTACAAGTATCCCAGCGACATAGCCATGGTGCGCAGGTGGGCCACGAACCTCAAGCATCGCTCCATGCAGGCCAGCAGCCATGGCTTCCTGGTGTGCCAGTCCCACTTCGCCGCCGACTGTTTTGATCCGGAGACGGGAGACCTGCGCGAGGACGCCGTGCCCGTGGCCACAATCGCGGGAAGCGTGAAAACAGAgggcctgctgctgcgttgTCTGGTAAGGGGTTGCTCTACGGATAACTCTGGAAAAGGACTGCTGTTCAAGGTGCCAAAGAAGAATCGTGAGCGGGACGAGTGGGCCCACAATCTGTGGATGCATCCGATAGAGCTGATGGGAGAGCACTACATCTGTGATCGACATTTCGAGGCGCACTGCGTGAACGACCACAAACTGCTGCACGCGGGATCAGTGCCAACCCTCCACCTGGGACACAATGAACCGCTGGAACTGCTGCCCAATCCCCAGACCTTCCAGGAGTGCCCCGAGGAGTGCGAGTGCTGTGTGCCCGGCTGTGGACGCACCAACCGGAAGGAGGAGGATCTGCAGTTTAGCAAATTTCCCAAGTGGCGTGTGCTGTATGACAAGTGGCTGCACAACTTCCGCCTCGAAGTGCCCAAGGAGCAGCGCATTGGGGCGCTGCGAGTGTGCCACATGCACTTCGAGGAGAGCTGCTTTGATGGCCGGAGCGTGCGCAGGGGAGCCATGCCCACCCTGGGGCTGGGACACTCGCATCCAGACATTTATCACACGGACAAGGGAGCGCTGTGGAAGAAGGTTCACAAGAGATTCACTGACTGCTGCTATCCCGATTGCTACGAGGAGTGCCACAAGGCCAACACCAATCGCATGGTGTACGATCTGCCCAGCGATGGGCCACTGCGAGAGTCCtggcagcagcacatgggCATCCCTGCCAGCGGTGAGGATAGTTCCTCAATGCTGAAGCTCTGTGCCCTGCACTACATCATGCTCTACGAGCACAGCGAACAGAGCTTCCCCGAGCACGGACCCAATCTGCTGCTGGACAGGAACTACGAGCACGCCCGTCAGTTGGCGTATCTGCGACGCTTCATGTGTGCCGTGCAGGGGTGTCGTCATCTGCAGCCGCGGGATGGGGGTCCAATGCACGGCATACCCAGGCGGAGGGAGATCCTGCGGATGTGGGTGGAGAATGCCCAGCTGCGGCTGAACGAGCACGAAGTTTACATGACCAAGCTGTGCAGCAAACACTTTGAGGCCCACTGCCTGTTCGAGGGCAAAAAATGCTATCCCTGGAGTGTGCCAACGCTCCATCTGCCAGAGCTGCAGCCCGGCCAGGTGCTCCACCAGAATCCCACCAAGGAGGAGTGGCAGCAAATGAAACAGAGAATGAAAATGGACGAGCAGACGCTGGAGGCGGAGCAGCAGGCAGATGGATTGCTAGTGGAACCCTACGTCAAGATGGAACCCCACGACGACGAGTCACAAACGGAATCGGAATTGCTGATAAATGAGAGCACGCTGGACTCTCAGGAACAGGACTCTCCAGCCCACGAGCCCATGGAAATGCCCGCCCTGGAGGTGCTCCTTGAGGTGGGCCATGTCGAGCGGCTGGATAGCTACGAGAAGAAGGAATGCTCTTCGGATACTCCGGCCATCACGTATGCTCCCCCCAAACGTTTCCGCCATCAGTACACTGCGCACAAGTGCAGTGTCGAGGGCTGTGGCGTGTCGCTCGAGGACCTTGACGGGAATCTGAAGCTGCACAAGCTACCCAGCGCCACGGAGGCGACCAGGAAGTGGCTGTACAACATTCAGGTGGATATAGAGGATAAATGGCGGATACGCGTCTGCAGCCATCACTTCGACAGGCAATGCCTCAATGGTTCGAGGCTCAGGAGGGGATCGATGCCcactctgctgctggggcCGCGTGTTCCAGAGATTATCCATCAGAATGAGTTTGCGCAGCTGCAATTGGACGATGCGCCAGCACAGAATGGCCATCCAGCGGAGCGAACCATTGGAAAGGTTGTGCAGCTATGCGTGCCACGTCCCTCGCCGCCGCGCAAATCCAGCAAGTTCTGCCAGATCGAGGGATGTCCAAATCATTTGACCAGCGAGAATATGACACTCCACAAGTTCCCGCACTCGTCGTGGATCTGCACCAAGTGGCAGCACAACACACAGGTGCCATTCGATCCGGAGTACCGCTGGCGCTATCGCATCTGCAGCGCCCACTTCCACCCCGTGTGCATGGCCAATATGCGGCTGCTGCATGGCAGCGTGCCCACCCTGAAGCTGGGTCCACGGGCACCCGCCGAGCTCTTTGACAGCGACTTTGAGGCCATAAACATAAAGATTGAGAAAATGGAGAAGATGGAGAGGAAATCTGAGGCTCAGCGAAGCACCGCTGGAGATAGGTATCCCACCATGCAGGTCATGGGGGAGAGGAAGTTCAAGACTGAGGagaagatggaagatggaatggaggaggaggatgacatGCTCTACCTGGAACCAGAGATGCAGCTATACGAGGATCAGGaagaacagcaacagaagccaAAGGTCAATCTGGGAATCCCCAATGGCGGCTGGAAAACGGAACTCCGTTTGCCATCGAAGGGCAGGGTGGCCTTCAATCCGGTGAGATCTGGCTACGACAAGTGCTCGCTGATGCATTGTCAGCGCCAGAGGTCGAAGCACGGCGTCCACATCTACAAGTTCCCCCGATCgcaggagcaccagcagcgATGGATGCACAACCTGCGCATCCGCTACGACGAGAAGCGGCCCTGGAAGTTTATGGTCTGCAGCGTGCACTTTGAACCGCACTGCATACGGCTGCGGAAGCTGCGGCCCTGGGCAGTGCCCACGCTGGAGTTGGGAGACAATGTCCCCGAGGACATCTATACGAACGAGCAGTGCCAGATGTTTGCCAGTGGACAGGGAGGGGAGATCAATGGCCTCGATAGCGacgaggcggaggcagaggcagaggcggagaGCGATGGGAATGATGAGGAGGATGGCTTgcaggaggatgaggatgaggagacAGACGACCAGGAGCCCACCGTTAAGAAGCGTCGTCGCTCGCGGCTGGATGCCGTCTGGCCTCCCGGCCAAGTGCCGCCGTGGAAGGTGAAGCAATGCTGTCTGCCCTACTGCCGCAGTCCTCGTGGCGAGGGCATCAAGCTGTTTCGACTGCCCAACAAAGTCACCTCCATCCGCAACTGGGAGCTGGCCACGGGCATGAAGTTCAAGGAGTCGCAGCGCAACACGAGACTCATCTGCAGCCGCCACTTTGAGCCGGAGCTGATCGGAGTGCGTCGTCTCATGCGCAATGCCATTCCCACCAGGCATCTGGGACCCACGGGCGATGTTAAGCCACTGGTGGCTCCAACGACAGCTGGACCCAAGTGCTGCATGGCAGATTGTGCCTATGATGTGGCGGATGTAAAGCTGCACAAGTTTCCCAGCAATCCCAAACTCCTGAGGGAGTGGTGCCAGGCATTGAGGGTCACGGATATGCAAAGGTATCGCGGAAAGCACATTTGCTCCGCCCATCTGCCCGTCCACAAGGCCGTGCAATGCATTGTTTGTGGCGCGGACAAGGCCCCCCTGCTGCCGATGCTTAATTTTCCCGCTAACCGGAATCAGCGCGCCAAATGGTGCTACAACCTGAAGATAGAAACGATACCCAAATGGGACATATCCAAGCACATTTGCTGCAAACACTTTGAGCCATATTGCTTTGGAGAGGCGGGTCTCCTAAAGCCAGAGGCGGCGCCCACACTGCATTTGAATCACAATGATACAAACATATTCCTTAACGATTGTGCCATAAATCCTGCCTTCAGTGGAGGAGCAATGCAGGTGAAGGATGAGCCCATGGACAATCAGGTCCTGTCGTTGATGTAG
Protein Sequence: MSQHNPHAHPHYHHHPLHHHQTQHHHQQQQLQQQQQQQQQQAQMPQHSNWYSHVASYPPPPPHHHATSTSAFAATSTPCKGTDYGAGSTHGYYAAAAAAAGGGLNVNAVGVGVGVGVGGGGSVSAATAAYNLEANTVAYAHNQLLQYQQHQQQQHHQQQHHLSHRSYMGHDIMSGTYPYIKSEPMESAYQQPPIPMAPPPAPDMIIKSEPIDEHPYKSNYIDDNTPFADFNKFNEFSGDMLSPKVELTVKDETYGKTSSSSFARRKAQQQQQQQTTDHSAESLPICQRCKEVFFKKQSYLRHVAESSCGIQEYDFKCNICPMSFMSTEELQRHKHLHRADKFFCHKYCGKHFDTIAECESHEYMQHEYESFVCNMCSGTFATREQLYAHLPQHKFQQRYDCPICRLWYQTAVELHEHRLAAPYFCGKYYTNQQQQQQQLATNQGNYKLQDCHMATMEMPTAPLHKATPSNASALPATAALSSLLQQRQANADGAAAMFAAASSTSASLKREVSVKLERSYSNSTSESSYSHQDNSSYNNAYGSDSSIHGGALAGPQAHSSTLDDSEDALCCVPLCGVRKSTSPTLQFFTFPKDEKYLNQWLHNLKMFHIPAASYATFRICSMHFPKRCINRYSLCYWAVPTFNLGHDDVANLYQNRELTNTFTTGEVARCSMPHCTSQRGESNLKFYNFPKDIKSLIKWCQNARLPVQAKEPRHFCSRHFEDRCIGKFRLKPWAVPTLHLGAQYGKIHDNPKNLYVEEKRCCLNFCRRSRSSDFNMSLYRFPRDEVLLRRWCYNLRLDPGVYRGKNHKICSAHFIKEALGLRKLSPGAVPTLHLGHNDTFNIYENELWPPPSPTGQHGGNHQLLQQQQTSQQLSHHHSSLQQQQHQPMHSKSYQRHSAASTSSSASSASHYVDPEMSASYLSLSAGGSSGGMNASDCLDVCCVPSCESKRHNSENITFHTIPRRPEQMRKWCHNLKIPEDKMHKGMRICSLHFEPYCIGGCMRPFAVPTLHLGHEDEDIHRNPDVIKKLNIRETCCVAVCKRNRDRDHANLHRFPSNVALLTKWCANLQRSVPDGSKLFNDAICEVHFEDRCLRNKRLEKWAVPTLILGHEDIAYPLPTPEQFYARPTAPNNGEEQGECCVETCKRNPSVDDIKLYRPPEDASVLAKWAHNLQTEAAVLTNMRICNLHFEAHCIGKRMRPWAIPTLNLAGNIENLFENPEHSMLYKRRTHLKQKVPVTKPTWVPRCCLPHCRKVRALHNVQLYRFPKLNRSTLAKWAHNLQVPQVGSAQRRVCSAHFEPHVLSKKCPVPLAVPTLDLNSPAGHKIYQNPAKLKANKLCLQRVCIVESCRKTRAQGVQLFRLPHSPTQLRKWMHNIRTRPRAAMRSQYRVCSRHFETHSFNGRRLSAGAIPTLELGHDDDDIFPNEAQAFADEHCAVEGCESSKEQPEVRLFRFPTDDDDMLWKWCNNLKMNPVDCIGVRICNKHFDADCIGPKHLYKWAIPTMLLGHDDSQIELILNPKPEERYVDPVFKCIVPTCGKTRRFDEVQMNSFPKDADLFQRWRHNLRLEHLCFKEREKYKICNAHFEDICIGKTRLNIGSIPTLELGHEETEDLFKVNPEDLQSNLFGRPRRLLRGLNNVTIKQEVPETEGQDIKPDIGANFTQVKVKKSLGDIKCCVHTCGRSRLEHGARLFPFPTGKQQHLKWRHNLRLEPDEVDKTTRVCSAHFNRRCIDGKHLRGWAMPTQQLGHQEQPIYENPKNIPGFFTPTCALGHCRKRRSIDNDLRTYRYPRSEDLLEKWRANLRLSLDQCRGRICADHFEPQVRGKLKLKTGAVPTLKLGHEEALMYDNEAIKAGVAEEEAGSPAPSPLVTPKTEVLDEEEREEDEEEEENPEEEQQETHDEEKDEHEDDTPEGAEQLGDEDDDEDQSNYFDPLELVETYAEHPSDDDNSHEAADDAKEQDEDDEEEPETLLPDTPPQPAAAVLRVPKPWERPVAVVPRREKRPNNVDPICCLKHCRKERSAMYLLSTFGFPKDQQLLLKWCANLQMDPSSCIGRVCVEHFQSEVLGTRKLKQNAVPTLNVGHDVPLRYTCNGQEMPQAAAAAAAAAAAVATGSFPDEMPQHSVFRLWSLKHCRKRKLSESPAPAPAAIKEEEQMQIPIQMEMMETKPKICCLPTCGNVEGYGPGGHFQPLPHDQRVLKKWQHNLRLPSINPDSDLRGLRLCMEHFEPNQIENGAPVRMAVPTLKLGHSSPNIFKNSESTLPGCLWPSCPPNRKICYDLPDNEAVRAAWLSYVRLPLDSPGRLCGLHFLQLYEEVDLPGDVPETVLERLQDTYDQASISLKFQCSVQGCGSKYKQDTHLAKLPRDPELLAKWLHNTRISYDRSLHFSYRICLLHFEAFCLNGVRPQTWAIPTLQLNHDEEIYQNTVKQEILESPVKQEKPHCSSLPSLNLSIPLHIKTEQGPVQRPRGTWGTSSQSSPCLSASSSPRTKNRICCIPDCGENARSQRLFRFPTAEPALLKWLVNTQQKPGLVDIQSLFVCQLHFEADAINQTQLSSWAVPTLRLGHDGHVIPNAKHNGNIANSQETEQAMEFIRANYCSVLSCFQPKGDGVRFYKYPSDIAMVRRWATNLKHRSMQASSHGFLVCQSHFAADCFDPETGDLREDAVPVATIAGSVKTEGLLLRCLVRGCSTDNSGKGLLFKVPKKNRERDEWAHNLWMHPIELMGEHYICDRHFEAHCVNDHKLLHAGSVPTLHLGHNEPLELLPNPQTFQECPEECECCVPGCGRTNRKEEDLQFSKFPKWRVLYDKWLHNFRLEVPKEQRIGALRVCHMHFEESCFDGRSVRRGAMPTLGLGHSHPDIYHTDKGALWKKVHKRFTDCCYPDCYEECHKANTNRMVYDLPSDGPLRESWQQHMGIPASGEDSSSMLKLCALHYIMLYEHSEQSFPEHGPNLLLDRNYEHARQLAYLRRFMCAVQGCRHLQPRDGGPMHGIPRRREILRMWVENAQLRLNEHEVYMTKLCSKHFEAHCLFEGKKCYPWSVPTLHLPELQPGQVLHQNPTKEEWQQMKQRMKMDEQTLEAEQQADGLLVEPYVKMEPHDDESQTESELLINESTLDSQEQDSPAHEPMEMPALEVLLEVGHVERLDSYEKKECSSDTPAITYAPPKRFRHQYTAHKCSVEGCGVSLEDLDGNLKLHKLPSATEATRKWLYNIQVDIEDKWRIRVCSHHFDRQCLNGSRLRRGSMPTLLLGPRVPEIIHQNEFAQLQLDDAPAQNGHPAERTIGKVVQLCVPRPSPPRKSSKFCQIEGCPNHLTSENMTLHKFPHSSWICTKWQHNTQVPFDPEYRWRYRICSAHFHPVCMANMRLLHGSVPTLKLGPRAPAELFDSDFEAINIKIEKMEKMERKSEAQRSTAGDRYPTMQVMGERKFKTEEKMEDGMEEEDDMLYLEPEMQLYEDQEEQQQKPKVNLGIPNGGWKTELRLPSKGRVAFNPVRSGYDKCSLMHCQRQRSKHGVHIYKFPRSQEHQQRWMHNLRIRYDEKRPWKFMVCSVHFEPHCIRLRKLRPWAVPTLELGDNVPEDIYTNEQCQMFASGQGGEINGLDSDEAEAEAEAESDGNDEEDGLQEDEDEETDDQEPTVKKRRRSRLDAVWPPGQVPPWKVKQCCLPYCRSPRGEGIKLFRLPNKVTSIRNWELATGMKFKESQRNTRLICSRHFEPELIGVRRLMRNAIPTRHLGPTGDVKPLVAPTTAGPKCCMADCAYDVADVKLHKFPSNPKLLREWCQALRVTDMQRYRGKHICSAHLPVHKAVQCIVCGADKAPLLPMLNFPANRNQRAKWCYNLKIETIPKWDISKHICCKHFEPYCFGEAGLLKPEAAPTLHLNHNDTNIFLNDCAINPAFSGGAMQVKDEPMDNQVLSLM

Similar Transcription Factors

Sequence clustering based on sequence similarity using MMseqs2

100% Identity: iTF_00536072;
90% Identity: iTF_00484466;
80% Identity: -