Basic Information

Insect: Drosophila formosana
Gene Symbol: -
Assembly: GCA_035045625.1
Location: JAWNOW010000311.1:4803132-4818734[+]

Transcription Factor Domain

TF Family: THAP
Domain: THAP domain
PFAM: PF05485
TF Group: Zinc-Coordinating Group
Description: The THAP domain is a putative DNA-binding domain (DBD) and probably also binds a zinc ion. It features the conserved C2CH architecture (consensus sequence: Cys - 2-4 residues - Cys - 35-50 residues - Cys - 2 residues - His). Other universal features include the location of the domain at the N-termini of proteins, its size of about 90 residues, a C-terminal AVPTIF box and several other conserved residues. Orthologues of the human THAP domain have been identified in other vertebrates and probably worms and flies, but not in other eukaryotes or any prokaryotes [1].
Hmmscan Out: # of c-Evalue i-Evalue score bias hmm coord from hmm coord to ali coord from ali coord to env coord from env coord to acc

1 29 8 1.7e+04 -8.4 4.9 52 74 23 39 11 53 0.39

2 29 6.1e-15 1.3e-11 45.0 4.2 1 86 607 679 607 680 0.85

3 29 2.5e-15 5.5e-12 46.2 4.6 1 87 707 776 707 776 0.83

4 29 5.5e-16 1.2e-12 48.4 0.4 1 87 798 870 798 870 0.84

5 29 5.5e-16 1.2e-12 48.4 5.2 1 86 969 1038 969 1039 0.82

6 29 5.4e-15 1.2e-11 45.2 3.2 1 86 1063 1134 1063 1135 0.82

7 29 3.6e-13 7.8e-10 39.3 0.9 1 87 1170 1238 1170 1238 0.81

8 29 2.7e-10 5.8e-07 30.1 1.4 1 86 1283 1352 1283 1353 0.76

9 29 5.4e-16 1.2e-12 48.4 0.1 1 86 1380 1449 1380 1450 0.83

10 29 1.2e-12 2.5e-09 37.7 1.0 1 86 1471 1540 1471 1541 0.79

11 29 2.2e-14 4.7e-11 43.3 1.4 1 86 1568 1639 1568 1640 0.85

12 29 4.4e-14 9.4e-11 42.3 2.8 1 85 1715 1783 1715 1785 0.82

13 29 2.9e-12 6.3e-09 36.4 0.1 1 86 1808 1876 1808 1877 0.81

14 29 5.9e-14 1.3e-10 41.9 1.6 1 87 2020 2089 2020 2089 0.80

15 29 1.8e-11 3.8e-08 33.9 0.2 1 85 2162 2228 2162 2237 0.78

16 29 0.053 1.1e+02 3.6 0.0 1 58 2258 2308 2258 2322 0.75

17 29 7.5e-12 1.6e-08 35.1 0.7 1 86 2347 2416 2347 2417 0.83

18 29 2.2e-14 4.7e-11 43.2 1.5 1 86 2484 2553 2484 2554 0.81

19 29 2e-12 4.4e-09 36.9 0.8 1 86 2589 2660 2589 2661 0.81

20 29 3.2e-13 6.9e-10 39.5 0.8 1 87 2671 2743 2671 2743 0.80

21 29 2.9e-15 6.2e-12 46.1 0.0 1 86 2772 2845 2772 2846 0.78

22 29 4.2e-05 0.09 13.5 0.0 1 58 2879 2930 2879 2959 0.82

23 29 1.1e-14 2.4e-11 44.2 0.1 1 86 2969 3041 2969 3042 0.80

24 29 1.3e-14 2.9e-11 43.9 0.5 1 86 3196 3268 3196 3269 0.86

25 29 1.7e-13 3.7e-10 40.4 3.0 1 86 3337 3407 3337 3408 0.81

26 29 3.4e-13 7.4e-10 39.4 5.5 1 86 3514 3584 3514 3585 0.85

27 29 6.1e-13 1.3e-09 38.6 0.0 1 87 3662 3732 3662 3732 0.85

28 29 7.7e-09 1.7e-05 25.5 0.4 1 58 3751 3800 3751 3811 0.85

29 29 3.3e-10 7.2e-07 29.8 0.4 18 87 3817 3875 3805 3875 0.75

#	of	c-Evalue	i-Evalue	score	bias	hmm coord from	hmm coord to	ali coord from	ali coord to	env coord from	env coord to	acc
1	29	8	1.7e+04	-8.4	4.9	52	74	23	39	11	53	0.39
2	29	6.1e-15	1.3e-11	45.0	4.2	1	86	607	679	607	680	0.85
3	29	2.5e-15	5.5e-12	46.2	4.6	1	87	707	776	707	776	0.83
4	29	5.5e-16	1.2e-12	48.4	0.4	1	87	798	870	798	870	0.84
5	29	5.5e-16	1.2e-12	48.4	5.2	1	86	969	1038	969	1039	0.82
6	29	5.4e-15	1.2e-11	45.2	3.2	1	86	1063	1134	1063	1135	0.82
7	29	3.6e-13	7.8e-10	39.3	0.9	1	87	1170	1238	1170	1238	0.81
8	29	2.7e-10	5.8e-07	30.1	1.4	1	86	1283	1352	1283	1353	0.76
9	29	5.4e-16	1.2e-12	48.4	0.1	1	86	1380	1449	1380	1450	0.83
10	29	1.2e-12	2.5e-09	37.7	1.0	1	86	1471	1540	1471	1541	0.79
11	29	2.2e-14	4.7e-11	43.3	1.4	1	86	1568	1639	1568	1640	0.85
12	29	4.4e-14	9.4e-11	42.3	2.8	1	85	1715	1783	1715	1785	0.82
13	29	2.9e-12	6.3e-09	36.4	0.1	1	86	1808	1876	1808	1877	0.81
14	29	5.9e-14	1.3e-10	41.9	1.6	1	87	2020	2089	2020	2089	0.80
15	29	1.8e-11	3.8e-08	33.9	0.2	1	85	2162	2228	2162	2237	0.78
16	29	0.053	1.1e+02	3.6	0.0	1	58	2258	2308	2258	2322	0.75
17	29	7.5e-12	1.6e-08	35.1	0.7	1	86	2347	2416	2347	2417	0.83
18	29	2.2e-14	4.7e-11	43.2	1.5	1	86	2484	2553	2484	2554	0.81
19	29	2e-12	4.4e-09	36.9	0.8	1	86	2589	2660	2589	2661	0.81
20	29	3.2e-13	6.9e-10	39.5	0.8	1	87	2671	2743	2671	2743	0.80
21	29	2.9e-15	6.2e-12	46.1	0.0	1	86	2772	2845	2772	2846	0.78
22	29	4.2e-05	0.09	13.5	0.0	1	58	2879	2930	2879	2959	0.82
23	29	1.1e-14	2.4e-11	44.2	0.1	1	86	2969	3041	2969	3042	0.80
24	29	1.3e-14	2.9e-11	43.9	0.5	1	86	3196	3268	3196	3269	0.86
25	29	1.7e-13	3.7e-10	40.4	3.0	1	86	3337	3407	3337	3408	0.81
26	29	3.4e-13	7.4e-10	39.4	5.5	1	86	3514	3584	3514	3585	0.85
27	29	6.1e-13	1.3e-09	38.6	0.0	1	87	3662	3732	3662	3732	0.85
28	29	7.7e-09	1.7e-05	25.5	0.4	1	58	3751	3800	3751	3811	0.85
29	29	3.3e-10	7.2e-07	29.8	0.4	18	87	3817	3875	3805	3875	0.75

Sequence Information

Coding Sequence: ATGTCACAACACAACAATCTCCCCCCGCACCATCATCACTActaccagcaacagcagcagcagcagcaactacaacaacatcatcaccaacagcaacaacatcagcagcagcagcaacaacatcagctacaacataaacaaatacagCAGCACAGTTGGTACTCACATGTTGCTTCCTACCCTCCCCACCATCCGCATGtcgccgcagccgcagcctaTGCGGCGCCCTGCAaagccaccaacaacaacaacaataacaacaacatcaacaacaacattatgaATGCATACGGTTCGCAGGCAACATATTAtggtggagcagcagctgctggtggGGGGGTGGGATATAACCTTGAGGCCAATACTGTTGCCTATGCGCACAACCAGCTGCTGCagtaccagcaacaacaacaacaccagcaacaacaacagcatcaacaccagcagcagcaacaacaacatcagcacaGTCAACGTTCTTCTTATATGTCGCATGGTTTAATGCACAGCTCTTATCCCTATATCAAGAGCGAGCCTTTGGAGTTGCCCGACGATAGACgtcagccacaacaacaacaactacaacagcagcatcaccaacaacaacatcaccaacagcaacatttcCAAAATCCAATGGCTCCGCCGCCAGCTCCCGCCAATCGTCATAGTCTCGATGCCAGCGGcgaaatgataataaaatCGGAACCTATTGACGAACATGCCTACAAGTCCAACTATATCGACGATAATACGCCCTTTGTCGACTTCAGTAAATATCCCGAATTCGGCGACGATATGCTGAGCCCCAAGGTGGAATTAACCGTTAAGGATGAGGCCTATGGCAGTCAAAAAGTTCCCaATCCGCTTAGCTATCAGCGGCGCAAGCTGCAAACGGATCGTTCTGCGGAAAGTCTTCCCATTTGCCAGCGGTGCAAGGAGGTGTTCTTCAAAAGACCCGTCTACTTGCGCCATGTGGCCGAGAGCAGTTGCAACATACAGGAGTATGACTTCAAGTGCAACCTCTGCACCATGTCCTTCATGACTAGCGATGATTTGCAGAAGCACAAGCATCTGCACAGAGCGGAGAAGTTCTTTTGCCACAAATACTGCGGCAAGTACTTTGACACGATTGCCGAATGCGAATCGCATGAATACATGCAACATGAATATGAAAACTTTGTGTGCAACATGTGTTCGATGACATTTGCCAATCGAGAACAACTGTATGCTCATTTGCCGCAGCACAAATTCCAGCAGCGTTTCGATTGTCCTATTTGCCGATTGTGGTATCAAACCGCATTGGAGTTGCACGAGCATCGTCTAGCGGCGCCGTACTTCTGCGGCAAGTATTACGCACCGGCTCAATCGGCAgtacatcagcaacagcagcagcaacagcagcagcaacaacatccacagcatcaacaacaggcCAATTACAAACTGCAGGACTGTCACATGGGCACCATGGAAATGCCAACGCCGCAGCACAAGACAAATGCACCCGCAGCTAGCGCATTGCCGGCAACGGCAGCGCTTAGTTCGTTGTTGCAACAACGTCAAGCCAATGCGGACGGAGCTGCATTGTTTGCCTCAACACTGAAGAACGAGGCGAATGTGAAGCTGGAGCGCAGCTACAGCAACTCAACGAGCGAATCTGGTTACAGTCTGCACGACAGCAGCTTCAACAATGCATATGGAAGTGACCCCTCGATACATGCCTCTGCTGGTGGCGGTGGTGGAGGGGGCGCTGGAGGAGCAATCGGCGGTCCGCAGGCGCACTCCTCGACGCTGGACGATTCGGAGGATGCACTCTGCTGTGTGCCGTTGTGCGGCGTGCGGAAGAGCACCAGTCCAACGCTGCAGTTCTTCACGTTTCCCAAGGATGACAAGTATCTGCATCAGTGGCTGCATAACCTCAAGATGTTCCACATTCCGGCATCGAGCTACGCGAGCTTTCGCATCTGCAGCATGCACTTCCCGAAGCGTTGCATCAATCGCTATTCGTTGTGCTATTGGGCAGTGCCCACATTCAATCTGGGCCACGATGATGTGGCCAATTTGTATCAGAATCGGGAGCTGACCAACACATTTACCACCGGCGAGGTGGCACGCTGCAGCATGCCCAACTGCACCAGCCAGCGGGGCGAGAGCAATCTCAAGTTCTACAATTTTCCCAAGGATATCAAGAGTCTGATCAAATGGTGTCAGAATGCCCGTCTGCCCGTCCAGGCCAAGGAGCCACGTCACTTTTGCAGTCGCCACTTTGAGGAGCGCTGCATTGGCAAGTTCCGGCTGAAACCGTGGGCAGTGCCTACCTTACATTTGGGCGCCCAGTATGGCAAGATCCACGACAATCCCAAGAATCTGTATGTGGAGGAGAAGCGTTGCTGCCTCAACTTCTGCCGTCGAAGTCGTTCGTCCGACTTTAATATGTCGCTGTATCGCTTTCCGCGGGATGAGGTGCTTCTTCGCCGCTGGTGCTATAACCTAAGACTCGATCCTTCGGTCTATCGCGGCAAGAATCACAAAATATGCAGTGCTCACTTTATCAAAGAGGCTTTGGGACTGCGCAAACTGTCACCGGGTGCTGTTCCCACGCTACATTTGGGTCACAACGACACCTTCAACATCTACGAGAATGAGCTGTGGCCACCGCCGACGCCCTCCACGCCCACTAatcaccaacaacagcagcagctgcagttgcaacagcagcaacaacaacatcagcagcatcatgCACATCACAAGTATCAACGTCACTCGGTGGCATCAACATCCTCCTCGGCCAGCTCATCGCACTACGTGGATGCTGGAGACATGAGTGGATCCTACATGGGCATGGGCAACTCGGGCGGCTCCTCGTCCGGCCTGAATGTGAGCGACAGCATGGACGTGTGCTGTGTGCCCAGTTGCGAGAGCAAGCGGCACAACAATGAGAACATCACATTCCACACGATACCCAGGCGACCCGAGCAGATGCGCAAATGGTGTCACAATCTTAAGATACCCGAGGATAAGATGCACAAAGGTATGCGCATCTGCAGCCTGCACTTTGAGCCCTACTGTATTGGTGGTTGCATGCGTCCCTTTGCTGTGCCCACACTGCAGCTGGGTCATGAGGACGAGGACATTCATCGCAATCCGGATGTTATCAAGAAGCTGAACATAAGGGAAACCTGCTGTGTGGCTGTCTGCAAGCGTAATCGCGATCGCGATCATGCTAATCTGCATCGTTTCCCCAGCAATGTGGCGCTGCTAACCAAGTGGTGCGCCAATCTGCAGCGACCGGTGCCGGATGGCAGCAAGCTCTTCAACGACGCCATCTGCGAGGTGCACTTCGAAGACCGCTGTCTGCGCAACAAGCGGCTGGAGAAGTGGGCAGTGCCCACCTTGATACTCGGCCACGAGAACATTGCCTATCCGCTGCCCACAGCGGAGCAGGTGGCCGAGTTCTATGCGCGACCCAGTGCACCCAACAATGGCGAGGAGCAGGGCGAGTGCTGTGTGGATACGTGCAAACGTAATCCCAGCGTAGACGACATTAAACTCTATCGGCCGCCAGAGGAGTCGCAAGTGCTGGCGAAATGGGCGCACAATCTGCAGCTGGATGCGGCCAAGTTGTCCAGCATGCGGATCTGCAATCTGCACTTTGAGGCGCATTGCATTGGCAAGCGCATGCGTCCCTGGGCGATACCAACGCTCAATCTCGCGACGAACGTTGAGAATATGTACGAGAATCCCGAGCATCAAATGCTCTACAAGCGACGTACGCATCTCAATACGAATCGTTGCGCTGGCCGCGAGACGGGTGGCGTAAAGCCCACGTGGGTGCCACGCTGCTGCCTGACACATTGCCGCAAGGTGCGTGCGCTGCACAATGTGCAGCTGTATCGCTTCCCCAAGCTCAATCGCTCTACGCTGGCCAAGTGGGCACACAATCTGCAAGTGCCGCTCGTGGGCAGTGCCCAGCGACGTCTTTGCTCGGCGCACTTTGAGCCGCACGTTTTGAGCAAGAAGTGTCCGGTGCCGTTGGCTGTGCCTACGCTCGATCTGAACTCGCCACCGGGCTACAAGATCTACCAGAATCCCGCAAAGCTCAAGGCCAACAAGCTGTGCCTGCAACGCGTCTGCATCGTGGAGAGCTGCCGCCGCCAACGTGGCCAGGGTGTGCAGCTCTTCCGGCTGCCACACAATCCCACGCAGCTGCGTAAGTGGATGCACAACATTAGGATGCGTCCCAGAGGCGCCATGCGGCAACAGTATCGCATGTGCTCCATTCACTTTGAGACACACTCCTTCAATGGGAAGCGGTTGAGTGCGGGCGCGATACCAACTCTGGAGTTGGGccacgatgacgacgacatcTATCCGAATGAGGCGCAATCGTTTGTCGAGGAGCACTGCACTGTCGAGGGCTGCGAGGCGTCCAAGGAGCAGCCCGATGTGCGTCTCTTCCGATTCCCAACCGACGACGAGGATCTGCTGTGGAAGTGGTGCAACAATCTGAAGATGAATCCCGTGGATTGCATTGGTGTGCGCATCTGCAACAAGCACTTCGATCTGGACTGCATTGGACCCAAGCATCTCTACAAATGGGCGATACCCACGCTGCAGCTTGGCCACGACGACGAGCAGATCGAGCTGATTGACAATCCCAAGCCCGAGGATCGCTATGTGGATCCCGTGTTCAAGTGCTGTGTGCCCACGTGCGGCAAGACGCGCAAGTTTGACGAGGTGCAGATGAACAGTTTTCCTAAGGATTTGAGCATGTTTCAGCGCTGGCGACACAATCTTCGATTGGAGCATCTCGATTTCAAGGAGCGCGAACGCTACAAGATTTGCAATGCGCACTTTGAGGACATTTGCATAGGGAAGACGAGACTCAACATTGGCTCGATACCCACGCTGCAGTTGGGCCACGAGGAGACGGAGGATCTGTTCCAGGTCAACCCCGAGGAGCTGCAGAGCAATCTTTTTGGAAGACAGCGACGCGTAAACTCTGCGCTGGGCATCAGCATTAAGCAGGAGGAGAACTCGGAGCTGGATGAGGACATAAAGCCGGACCTCAGCATGGCGGAAGCCACTGACAATACCAACCAGGTGAAGATTAAGCGTTCGCTGGTCGACTGCAAGTGTTGTGTGCCCGGCTGCGGACGCAGTCGCCTCGAGCATGGCGCCCGCTTGTTCCCCTTCCCCAACGGCAAGCAACAGCAGAGCAAGTGGCGCCACAATCTGCGCCTGCAGCCGCACCAAGTGGAGCGCAGCACACGCGTCTGCAGCGCACATTTCAATCGTCGCTGCATCGATGGCAAGCACCTCAGGGGCTGGGCCATGCCCACCCAGCAGCTGGGCCATCAGGAGCTGCCCATCTATGAGAATCCAAAGAATATACCGGGCTTCTTTACGCCCACGTGTGCGCTGGCCCATTGTCGCAAGCGACGCAGCATTGACAACGACCTGCGCACTTATCGCTATCCCCGCAGCGAGGATCTGCTTGAGAAGTGGCGCGTTAATCTGCGATTGGCGCCGGATCAGTGTCGAGGGCGCATCTGCGCCGATCACTTTGAGCCCATGGTGCGTggcaagctgaagctgaagacGGGTGCGGTGCCCACGCTAAAGTTGGGCCACGACGAAGACGTCGTGTTTGACAACGAGGCTATCAAGGCGGGACTGCAGCAGGAGGCGGAGGAGACCAGCATGGAATCACTGGTCAAAGTGAAACAGGAGCAACTTGATCCGGATGAAGAGCCTACTGATGATGCggaacagcagcaccaggcAGACGTCGACGAGGACCAGACGGAACATGGCTACTTTGATCCGCTGGAGCTGGTCGAGACCTTTGCGGAGCAGCACAGCGCCGAAGATGACGATGAAGCGATTCAACACGACAattacgacgacgacgacgatgaggatgaAGATGAGGATGAACCCGGCGACGATGATGAACTGCTGCTCCCGGATACGCCGCCGGTGAAGCGGCTGCCGCCTGCGGTGTTGCCGCCACGACGCGAGAAGCCCGTGAACAATGTGACGCCCATCTGCTGCCTGAAGCACTGTCGCAAAGAGCGCACGGCCAGCCATCAGCTGAGCACCTTTGGCTTCCCCAAAGATCGCCAGCAGTTGCTCAAGTGGAGCGCCAATCTGCAGCTCTCGCTGGAAAATTGCGTGGGACGCGTTTGCATCGAGCACTTTGAGTCCGAGATGCTGGGCACACGCAAACTGAAGCAGCATGCGGTACCCACATTGAATCTGGGTCACGGCACGCCGCTCAGCTACAGTTGCAATGGCCAGACGTTGAGCATTTATGATGCACAGCCGCAGCATTCGGTTTTTCGGCTTTGGAGCCTGAAACATTGCCGCAAACGGAAGCACCCAACGGAACCGCCAGatcagaagcagcagcatcagcagcagcaggagctgaATCAGGCAGCGACAATGGCAACGATGACGACTAAGCGACGCTGCTGTTTGCCCAGTTGTGGCAAACAGCCGGCGTTGCATGGCGTAGAGCTGCAGCGCCTGCCCAGCAATCGCATCCAGCTGCGCAAGTGGCTGCATAATCTCAAGCTATCCCCCATGCTGGACAGCAGCCAAGCGCGTCTCTGCAGCGAACACTTTgagccgcagctgctgcagcaccaCGTTGAGGATGTGGTGCCCACTCTCCGCCTTGGTCACGACGACACACACATCTatcgcaacagcagcagcagcagcagcatcactgCTCCGTCGTCCACGTCTAGCGACTGCTTGGTGGCCAGTTGTCCGTGTGCTCGCCTCAATCTCTATCGCTGCTATGATCTACCCGATCATCGCCTGGTGCAGCAGGCCTGGCTGGAatggctgcagctgccactgccacaggAGGCCAGCGATGGCAAGCTTTGCGTCATGCACTACATGCAGCTGTATGAACAGGTGCCGCTGCCTCCCGAGTTGCCGGATTCGGTGCTGCGTCAGCTGCAGGAGACCTATGATCTGATTGCCAGCTCCACGATGGCCATGaagctgcgctgcgctgtgcCCGGCTGCTACTCCAAGTACACGGACAACATACGGTTGACCAAGCTGCCCATGTGCAGCGCGATGTGCGCCAAGTGGGTGCACAACACCAAGATCAGCTACGATCCCACGCGTCACTATGTCTATCGCATCTGCATGCTACACTTTGAGTCGCGCTGCTTGGGCCCTGTGCGTCCCAAGCTGTGGGCAGTGCCCACTCTGCAGTTACACCATCACGATGCGAATATCTATCACAATCCAAAGATGGAAGCGCAATCCTCGCCAGCATCAGGTCCGGTGCCCATTGCCATTACCCCCGCGTCGGTGCCTGTGGAACTGCCGTTGCGCATCAAGACTGAGCTGGCGTTTAGTGGCAGTCCCAGCGCCAGTGCAAGTCCCAGTCCGCGTGCCAAGCTGCGCTTCTGTTGCATTCCCAGCTGCTTGCAACAGGCCACAGCGCAGACGCGTCTATTTCGCTTTCCCACCGCCGAGACGGCGTTGCTCAAGTGGCTAGTGAACACGCAGCAACAGCCGAGATTGGTGGACATCCAGCAGCTGTTCATTTGCCAGGATCACTTCGAGGAGGAGGCCATCTGCAAGAAGCAGCTGCGCAGCTGGGCGGTGCCCACCTTGAAGCTGGGACACGACGGGCATGTCATACCGAATGCAAGGCACAATGGAAACATTGCCGACAGCCAGGAGAACAAGCAGACGCTGCAGTACATCTGGGAGAACTATTGCTCGGTGCTGAGCTGCTTCCAGCCGCGCAGCGAGGAACTGCGCCTCTACGCCTATCCCACGGACCGACCCACCATTCGCAAGTGGGCGGCCAACTGCAAGCATCGCTCCATGCAGGCCAGCAGCGACGGTTTCCAGGTCTGCCAGTTGCACTTTGCGCCGCATTGCTTTGATAAGGAGACGGGCGAGTTGAAGGATGAGGCGGTGCCTACGCTGGAGCTGAGTCGCTGCATCAACGAGGTGCGCTGCGTGGTTGTTGGCTGTGTCAGGGACGAGGATGCGCCGCGTCAACGCTTCTACAAGATGCCCAAGCGCAGTGCACAACTGCTCACTTGGTGTCACAATCTGCGCTTGGATGTGACGGCCATGAGCAGCGGCGAGCATCACGTCTGCGATCGCCACTTTGAGACGCAGTGCATCAATCAGCAAAAACTACTCCGACCTGGAGCTCGTCCTACGCTCCATCTGGGCCACGATGAACCCGTCGAATTGATGCCCAATCCTGCGAAATGGGATGCAGTAGATGCGACGCCCACTGTCGGCGTCGTGTGCTGTGTGCCCAACTGCGGTCTGGCCAAGGACGAGGAGGATGACGTGCAGCTGTTTGCCTTCCCAAAGCTGCGCGTGCTTGCCGAGAAGTGGCTGCAGAACATACGCCTCGAGCAGCACAGTCGGGAGCAGCTGATGCGCTTAAGGATCTGCAGCGTACACTTCGATGCCGGCTGCCTGGAAAGCAATGGCCGCCCTCAACTGGGCGCTATGCCCACGCTGCAGCTGGGTCACGAGCAGCGCCACAACATTCATCGCAGCACCGATCCCGCCACTGTGAAAGCGAAGAAGTTCTGCAATCGCAGTGGGTCCAGCTACGACTGCTGCTATCCGCAATGCGTGGAGCTGCAGAAAAGCTATTTGCGGATAAGCTACGATCTGCCACAAGCGGCGGAGCTGCGTCTCAAGTGGCTGGAATACATGGGCCTGGAGGACACTGAGGAAACGAAGCTGCTCAAGCTGTGCCCGCTGCACTTGGTACTGCTCTACGATCACAGCGTAGAACACTTTACGGCGGAACACACGCCCGAGGAGCAGCTGGATGCCAACTATGAGGATGCCAGGAATAGTGTGCGCCTGCGTATCATCAGCTGTGCGGTGCCCGGCTGCCGCACGCTGAAGCCACGCGATGGTGGCATTCTGCATGGCTTGCCGCAGCGTCGCGATGTGCTCGAGATGTGGCTGCACAACATGCAGCTGGTGTTCTACGAGCAGCAGCGTTACATGTACAAGATCTGCAGCAAGCACTTTGAGCCTAGCTGCTTTATGGACACCACACGTCGTCTGAAGCCTTGGACTATGCCGACGCTGGAGCTGCCGCCGCGTGCTGCAGACGAGGCGCCCATTTATGCGAATCCCAGCGAGCAGGATTGGCAACGCATGAACGAGCTGCTTGCAGcagagcagcgacagcaagagcaacaacagcagcagccgctagAGGACTTGGGCGAGTTGCTGGAGCCCATTGTGAAGATGGAGCGCATTGACAGGGACGAAGAGGAGGCAGAGTATCAAGAGCAAGAACTGGATCCGgaggacgacgacaacaattCACAGCAGCCGTTGGCTCTGGAAGTGCTACTCGAGGTGGGTCACGTGGAGAATTGCGCTACCTATGAGCAGATGGACAACGAGGCCAATCTGGGCTacgccgagcagcagcagcagcaacaactgctgcaCGAAGCACAGCCACGTGCAGCGTATAGCGGAGCATCAGTAGCAGGCGGCCAGCTAGCCAACAATGGCTTCAAGTACACGGCACGTCATTGCAGCGTGCGTGGCTGCGATGTGACTGCAAACGATGTGAACGGCAGCATAAAGCTGCACAAGTTTCCAACCTCACTCGATGCCATGGAGAAGTGGAAGCACAACACACAAGTGGATGTGGACATTAATTTCTCGTGGCGCTTTCGCATCTGCAGCTATCACTTTACCGAGGAATGTTTCCACGGCGCGCGCATCAAGCGCGGTGCGATGCCTACGCTGAGTTTAGGGCCTCAACGACCGCCCAAGATCTATGACAATGAATTTAGCAcaatgctgccgctgccggagcaggagcaggagcagcaaccCAACGAGGACCACTTGCCCATGGAGCAGCAGTTGCCCAAGCAAACTAAGGTCGGCGGCGCCGAGATTAGTCTGCGTCTGCCGCAGGCGGCGCCGCCGCGCAAGTCCAGCAAATTCTGTCAGGTCGATGGCTGTCCCAATCACTTGACCAGCGAGAATCTGACGCTGCACAAGTTTCCGCATTGTGTGGACATGTGCGCCAAGTGGCAGCACAATACGCAGGTGCCCTTCGATCCCGACTATCGTTGGCGTTATCGCATCTGCAGCGCCCATTTTGAGCCCATCTGTCTTATGAATATGCGGCTGATGCACGGCAGTGTTCCCACCTTGAAGCTGGGACCGCGTGCACCTCGTCAGCTCTTTGATAGCGACTTTGAGGCCATCAGCTTGCGACTGGACAAGCAGAAGAGCAGCGTCGAGCAGCAGTACTCCATTAAGCAGGAACAGCATGGCggggcggaggaggaggagcaggatgAGGCGGAGCTGAGCTATTTGGTGCCCGAGATGCAGCTGCATGAGGAGACGGAGCGATCGCTGGACACGTCGAGCAACTGGAAGGAACTGCGTCTGCCCAGCATCAAGCAGGAGGAGCCGGACGAGGCATCGGTGACCAGCTACAATCCGGTCAAATCGGGCTACGACAAGTGCTCCTTGGTGCATTGTCAGCGCCAGCGTTCGCACCACGGCGTGCACATCTACAAGTTTCCACGCTcccgccagctgcagcagcgctgGATGCACAATCTGCGCATCAAGTACGACGAGCGACGGCCCTGGAAAACGATGATCTGCAGCGTGCACTTCGAACCCAACTGCATCAGGCTGCGCAAGTTGTGTTCGTGGGCAGTGCCCACGTTGGAGCTGGGCGACAATGTTCCGCTGGAGATATTCACGAATGAGCAGAGTCGACAGCAGCTGGAGGCGGGCAGCGATTGCGAAGATATGCCGCTGGAGGATGCCTATGAGGATGAGGATTACGATGATGACATGGCCGAGCATCTGGCTAATGAGCCATTGGTGAAGCGCGAGCGTCGCTCACGTTTCGATCCCTTGCCGCCGGGTCAGCTGCCGCCTTGGAAGATCAAGGCGTGCTCGCTGCCTTATTGTCGCAGTCCTCGCGGTGATGGCATCAAGCTCTTTAGACTCCCCAACAACATCAGCGCCATACGCAAGTGGGAGCGAGCGACGGGCATGCGTTTCACCGAATCCCAGCGCAATACGAAGCTCATCTGCAGCCGGCACTTTGATCCGCAGCTGATTGGAGTGCGTCGTCTCATGTACAATGCGGTGCCCACCCTGAATCTGGGTCCCATGAGTGCAGAGAGTCCGACTGTACTGCCTGCAGCTGGACCACGCTGCTGTCTGGGCGATTGCCAGGCGGATGGCAAGTCTGCCAAGCTGCACAAGTTTCCCAGTGATCCCATGCTGTTGCATCAGTGGTGTCATGCGCTGAATCTCACGGACATTCAAAGCTATCGTGGCAAGCACATCTGCGCACAGCATCTGCCCGCCAAGACGCCCAGCTGCATTGTGTGCGGCATGGAGCATTtgcagttgccgctgctcgATTTTCCGGAGAATCGAAATCTGCGTGCCAAGTGGTGTTATAATCTCAAAATTGAACCCATCGCCAAGTGGGACAATTCAAAGCAGATCTGTAGCAAGCACTTTGAGGGCTATTGCTTCACACAGCCGGGTCAACTGCAGCCAGAGGCGGCACCAACGTTACATTTGCAACACAACGATAGCAATATATTTCTAAACGATTATGCCATAATAGATCAGAGCAAGATGCTGCGCATCAAGGATGAGCCGCTGGACAGCGACGATTTGATGCTGTAA
Protein Sequence: MSQHNNLPPHHHHYYQQQQQQQQLQQHHHQQQQHQQQQQQHQLQHKQIQQHSWYSHVASYPPHHPHVAAAAAYAAPCKATNNNNNNNNINNNIMNAYGSQATYYGGAAAAGGGVGYNLEANTVAYAHNQLLQYQQQQQHQQQQQHQHQQQQQQHQHSQRSSYMSHGLMHSSYPYIKSEPLELPDDRRQPQQQQLQQQHHQQQHHQQQHFQNPMAPPPAPANRHSLDASGEMIIKSEPIDEHAYKSNYIDDNTPFVDFSKYPEFGDDMLSPKVELTVKDEAYGSQKVPNPLSYQRRKLQTDRSAESLPICQRCKEVFFKRPVYLRHVAESSCNIQEYDFKCNLCTMSFMTSDDLQKHKHLHRAEKFFCHKYCGKYFDTIAECESHEYMQHEYENFVCNMCSMTFANREQLYAHLPQHKFQQRFDCPICRLWYQTALELHEHRLAAPYFCGKYYAPAQSAVHQQQQQQQQQQQHPQHQQQANYKLQDCHMGTMEMPTPQHKTNAPAASALPATAALSSLLQQRQANADGAALFASTLKNEANVKLERSYSNSTSESGYSLHDSSFNNAYGSDPSIHASAGGGGGGGAGGAIGGPQAHSSTLDDSEDALCCVPLCGVRKSTSPTLQFFTFPKDDKYLHQWLHNLKMFHIPASSYASFRICSMHFPKRCINRYSLCYWAVPTFNLGHDDVANLYQNRELTNTFTTGEVARCSMPNCTSQRGESNLKFYNFPKDIKSLIKWCQNARLPVQAKEPRHFCSRHFEERCIGKFRLKPWAVPTLHLGAQYGKIHDNPKNLYVEEKRCCLNFCRRSRSSDFNMSLYRFPRDEVLLRRWCYNLRLDPSVYRGKNHKICSAHFIKEALGLRKLSPGAVPTLHLGHNDTFNIYENELWPPPTPSTPTNHQQQQQLQLQQQQQQHQQHHAHHKYQRHSVASTSSSASSSHYVDAGDMSGSYMGMGNSGGSSSGLNVSDSMDVCCVPSCESKRHNNENITFHTIPRRPEQMRKWCHNLKIPEDKMHKGMRICSLHFEPYCIGGCMRPFAVPTLQLGHEDEDIHRNPDVIKKLNIRETCCVAVCKRNRDRDHANLHRFPSNVALLTKWCANLQRPVPDGSKLFNDAICEVHFEDRCLRNKRLEKWAVPTLILGHENIAYPLPTAEQVAEFYARPSAPNNGEEQGECCVDTCKRNPSVDDIKLYRPPEESQVLAKWAHNLQLDAAKLSSMRICNLHFEAHCIGKRMRPWAIPTLNLATNVENMYENPEHQMLYKRRTHLNTNRCAGRETGGVKPTWVPRCCLTHCRKVRALHNVQLYRFPKLNRSTLAKWAHNLQVPLVGSAQRRLCSAHFEPHVLSKKCPVPLAVPTLDLNSPPGYKIYQNPAKLKANKLCLQRVCIVESCRRQRGQGVQLFRLPHNPTQLRKWMHNIRMRPRGAMRQQYRMCSIHFETHSFNGKRLSAGAIPTLELGHDDDDIYPNEAQSFVEEHCTVEGCEASKEQPDVRLFRFPTDDEDLLWKWCNNLKMNPVDCIGVRICNKHFDLDCIGPKHLYKWAIPTLQLGHDDEQIELIDNPKPEDRYVDPVFKCCVPTCGKTRKFDEVQMNSFPKDLSMFQRWRHNLRLEHLDFKERERYKICNAHFEDICIGKTRLNIGSIPTLQLGHEETEDLFQVNPEELQSNLFGRQRRVNSALGISIKQEENSELDEDIKPDLSMAEATDNTNQVKIKRSLVDCKCCVPGCGRSRLEHGARLFPFPNGKQQQSKWRHNLRLQPHQVERSTRVCSAHFNRRCIDGKHLRGWAMPTQQLGHQELPIYENPKNIPGFFTPTCALAHCRKRRSIDNDLRTYRYPRSEDLLEKWRVNLRLAPDQCRGRICADHFEPMVRGKLKLKTGAVPTLKLGHDEDVVFDNEAIKAGLQQEAEETSMESLVKVKQEQLDPDEEPTDDAEQQHQADVDEDQTEHGYFDPLELVETFAEQHSAEDDDEAIQHDNYDDDDDEDEDEDEPGDDDELLLPDTPPVKRLPPAVLPPRREKPVNNVTPICCLKHCRKERTASHQLSTFGFPKDRQQLLKWSANLQLSLENCVGRVCIEHFESEMLGTRKLKQHAVPTLNLGHGTPLSYSCNGQTLSIYDAQPQHSVFRLWSLKHCRKRKHPTEPPDQKQQHQQQQELNQAATMATMTTKRRCCLPSCGKQPALHGVELQRLPSNRIQLRKWLHNLKLSPMLDSSQARLCSEHFEPQLLQHHVEDVVPTLRLGHDDTHIYRNSSSSSSITAPSSTSSDCLVASCPCARLNLYRCYDLPDHRLVQQAWLEWLQLPLPQEASDGKLCVMHYMQLYEQVPLPPELPDSVLRQLQETYDLIASSTMAMKLRCAVPGCYSKYTDNIRLTKLPMCSAMCAKWVHNTKISYDPTRHYVYRICMLHFESRCLGPVRPKLWAVPTLQLHHHDANIYHNPKMEAQSSPASGPVPIAITPASVPVELPLRIKTELAFSGSPSASASPSPRAKLRFCCIPSCLQQATAQTRLFRFPTAETALLKWLVNTQQQPRLVDIQQLFICQDHFEEEAICKKQLRSWAVPTLKLGHDGHVIPNARHNGNIADSQENKQTLQYIWENYCSVLSCFQPRSEELRLYAYPTDRPTIRKWAANCKHRSMQASSDGFQVCQLHFAPHCFDKETGELKDEAVPTLELSRCINEVRCVVVGCVRDEDAPRQRFYKMPKRSAQLLTWCHNLRLDVTAMSSGEHHVCDRHFETQCINQQKLLRPGARPTLHLGHDEPVELMPNPAKWDAVDATPTVGVVCCVPNCGLAKDEEDDVQLFAFPKLRVLAEKWLQNIRLEQHSREQLMRLRICSVHFDAGCLESNGRPQLGAMPTLQLGHEQRHNIHRSTDPATVKAKKFCNRSGSSYDCCYPQCVELQKSYLRISYDLPQAAELRLKWLEYMGLEDTEETKLLKLCPLHLVLLYDHSVEHFTAEHTPEEQLDANYEDARNSVRLRIISCAVPGCRTLKPRDGGILHGLPQRRDVLEMWLHNMQLVFYEQQRYMYKICSKHFEPSCFMDTTRRLKPWTMPTLELPPRAADEAPIYANPSEQDWQRMNELLAAEQRQQEQQQQQPLEDLGELLEPIVKMERIDRDEEEAEYQEQELDPEDDDNNSQQPLALEVLLEVGHVENCATYEQMDNEANLGYAEQQQQQQLLHEAQPRAAYSGASVAGGQLANNGFKYTARHCSVRGCDVTANDVNGSIKLHKFPTSLDAMEKWKHNTQVDVDINFSWRFRICSYHFTEECFHGARIKRGAMPTLSLGPQRPPKIYDNEFSTMLPLPEQEQEQQPNEDHLPMEQQLPKQTKVGGAEISLRLPQAAPPRKSSKFCQVDGCPNHLTSENLTLHKFPHCVDMCAKWQHNTQVPFDPDYRWRYRICSAHFEPICLMNMRLMHGSVPTLKLGPRAPRQLFDSDFEAISLRLDKQKSSVEQQYSIKQEQHGGAEEEEQDEAELSYLVPEMQLHEETERSLDTSSNWKELRLPSIKQEEPDEASVTSYNPVKSGYDKCSLVHCQRQRSHHGVHIYKFPRSRQLQQRWMHNLRIKYDERRPWKTMICSVHFEPNCIRLRKLCSWAVPTLELGDNVPLEIFTNEQSRQQLEAGSDCEDMPLEDAYEDEDYDDDMAEHLANEPLVKRERRSRFDPLPPGQLPPWKIKACSLPYCRSPRGDGIKLFRLPNNISAIRKWERATGMRFTESQRNTKLICSRHFDPQLIGVRRLMYNAVPTLNLGPMSAESPTVLPAAGPRCCLGDCQADGKSAKLHKFPSDPMLLHQWCHALNLTDIQSYRGKHICAQHLPAKTPSCIVCGMEHLQLPLLDFPENRNLRAKWCYNLKIEPIAKWDNSKQICSKHFEGYCFTQPGQLQPEAAPTLHLQHNDSNIFLNDYAIIDQSKMLRIKDEPLDSDDLML

Similar Transcription Factors

Sequence clustering based on sequence similarity using MMseqs2

100% Identity: iTF_00601834;
90% Identity: -
80% Identity: -