Basic Information

Insect: Drosophila histrio
Gene Symbol: -
Assembly: GCA_958299025.2
Location: OY282580.2:22674344-22690792[-]

Transcription Factor Domain

TF Family: THAP
Domain: THAP domain
PFAM: PF05485
TF Group: Zinc-Coordinating Group
Description: The THAP domain is a putative DNA-binding domain (DBD) and probably also binds a zinc ion. It features the conserved C2CH architecture (consensus sequence: Cys - 2-4 residues - Cys - 35-50 residues - Cys - 2 residues - His). Other universal features include the location of the domain at the N-termini of proteins, its size of about 90 residues, a C-terminal AVPTIF box and several other conserved residues. Orthologues of the human THAP domain have been identified in other vertebrates and probably worms and flies, but not in other eukaryotes or any prokaryotes [1].
Hmmscan Out: # of c-Evalue i-Evalue score bias hmm coord from hmm coord to ali coord from ali coord to env coord from env coord to acc

1 28 6e-15 1.2e-11 45.5 4.3 1 86 580 652 580 653 0.85

2 28 3.4e-15 6.7e-12 46.3 4.6 1 87 680 749 680 749 0.83

3 28 7.4e-16 1.5e-12 48.4 0.4 1 87 771 843 771 843 0.84

4 28 7.4e-16 1.5e-12 48.4 5.2 1 86 946 1015 946 1016 0.82

5 28 8.1e-15 1.6e-11 45.1 2.9 1 86 1040 1111 1040 1112 0.82

6 28 5.3e-13 1e-09 39.2 1.1 1 87 1147 1215 1147 1215 0.80

7 28 4.1e-10 8.2e-07 30.0 1.3 1 86 1258 1327 1258 1328 0.75

8 28 3.7e-16 7.2e-13 49.4 0.1 1 86 1355 1424 1355 1425 0.82

9 28 1.4e-12 2.9e-09 37.8 1.0 1 86 1446 1515 1446 1516 0.80

10 28 9.9e-15 2e-11 44.8 1.5 1 86 1543 1614 1543 1615 0.85

11 28 9.2e-14 1.8e-10 41.7 0.7 1 86 1691 1760 1691 1761 0.81

12 28 5e-12 1e-08 36.1 0.1 1 86 1784 1852 1784 1853 0.81

13 28 9.4e-14 1.9e-10 41.7 1.2 1 86 1981 2049 1981 2050 0.79

14 28 6.5e-12 1.3e-08 35.8 0.1 1 62 2100 2159 2100 2177 0.78

15 28 0.0048 9.6 7.3 0.0 1 58 2183 2233 2183 2250 0.78

16 28 2.7e-12 5.4e-09 37.0 1.2 1 86 2272 2341 2272 2342 0.83

17 28 1.2e-14 2.3e-11 44.6 2.3 1 86 2424 2493 2424 2494 0.81

18 28 6.9e-12 1.4e-08 35.7 0.6 1 86 2529 2600 2529 2601 0.81

19 28 4.2e-14 8.3e-11 42.8 1.1 1 87 2611 2683 2611 2683 0.82

20 28 8.5e-15 1.7e-11 45.0 0.1 1 86 2710 2781 2710 2782 0.78

21 28 8.4e-05 0.17 13.0 0.0 1 58 2815 2865 2815 2894 0.73

22 28 1.9e-14 3.8e-11 43.9 0.9 1 86 2903 2975 2903 2976 0.80

23 28 4.9e-15 9.7e-12 45.8 0.1 1 86 3121 3193 3121 3194 0.82

24 28 2.2e-13 4.3e-10 40.5 3.1 1 87 3248 3319 3248 3319 0.82

25 28 4.8e-15 9.5e-12 45.8 3.6 1 86 3427 3497 3427 3498 0.85

26 28 5.1e-13 1e-09 39.3 0.1 1 87 3577 3647 3577 3647 0.84

27 28 7.4e-09 1.5e-05 26.0 1.7 1 58 3666 3712 3666 3725 0.88

28 28 8.5e-10 1.7e-06 29.0 0.3 16 87 3727 3787 3716 3787 0.73

#	of	c-Evalue	i-Evalue	score	bias	hmm coord from	hmm coord to	ali coord from	ali coord to	env coord from	env coord to	acc
1	28	6e-15	1.2e-11	45.5	4.3	1	86	580	652	580	653	0.85
2	28	3.4e-15	6.7e-12	46.3	4.6	1	87	680	749	680	749	0.83
3	28	7.4e-16	1.5e-12	48.4	0.4	1	87	771	843	771	843	0.84
4	28	7.4e-16	1.5e-12	48.4	5.2	1	86	946	1015	946	1016	0.82
5	28	8.1e-15	1.6e-11	45.1	2.9	1	86	1040	1111	1040	1112	0.82
6	28	5.3e-13	1e-09	39.2	1.1	1	87	1147	1215	1147	1215	0.80
7	28	4.1e-10	8.2e-07	30.0	1.3	1	86	1258	1327	1258	1328	0.75
8	28	3.7e-16	7.2e-13	49.4	0.1	1	86	1355	1424	1355	1425	0.82
9	28	1.4e-12	2.9e-09	37.8	1.0	1	86	1446	1515	1446	1516	0.80
10	28	9.9e-15	2e-11	44.8	1.5	1	86	1543	1614	1543	1615	0.85
11	28	9.2e-14	1.8e-10	41.7	0.7	1	86	1691	1760	1691	1761	0.81
12	28	5e-12	1e-08	36.1	0.1	1	86	1784	1852	1784	1853	0.81
13	28	9.4e-14	1.9e-10	41.7	1.2	1	86	1981	2049	1981	2050	0.79
14	28	6.5e-12	1.3e-08	35.8	0.1	1	62	2100	2159	2100	2177	0.78
15	28	0.0048	9.6	7.3	0.0	1	58	2183	2233	2183	2250	0.78
16	28	2.7e-12	5.4e-09	37.0	1.2	1	86	2272	2341	2272	2342	0.83
17	28	1.2e-14	2.3e-11	44.6	2.3	1	86	2424	2493	2424	2494	0.81
18	28	6.9e-12	1.4e-08	35.7	0.6	1	86	2529	2600	2529	2601	0.81
19	28	4.2e-14	8.3e-11	42.8	1.1	1	87	2611	2683	2611	2683	0.82
20	28	8.5e-15	1.7e-11	45.0	0.1	1	86	2710	2781	2710	2782	0.78
21	28	8.4e-05	0.17	13.0	0.0	1	58	2815	2865	2815	2894	0.73
22	28	1.9e-14	3.8e-11	43.9	0.9	1	86	2903	2975	2903	2976	0.80
23	28	4.9e-15	9.7e-12	45.8	0.1	1	86	3121	3193	3121	3194	0.82
24	28	2.2e-13	4.3e-10	40.5	3.1	1	87	3248	3319	3248	3319	0.82
25	28	4.8e-15	9.5e-12	45.8	3.6	1	86	3427	3497	3427	3498	0.85
26	28	5.1e-13	1e-09	39.3	0.1	1	87	3577	3647	3577	3647	0.84
27	28	7.4e-09	1.5e-05	26.0	1.7	1	58	3666	3712	3666	3725	0.88
28	28	8.5e-10	1.7e-06	29.0	0.3	16	87	3727	3787	3716	3787	0.73

Sequence Information

Coding Sequence: ATGTCACAACACAACAATCCcccgcatcatcatcatcatcactattaccagcagcagcagcaacaaatacaacaacaacaccatcagcaccagcagcagcagcagcaacaacaacagctacaacataaacaaatacagCAGCACAGTTGGTACTCACATGTTGCTTCCTACCCTCCCCACCATCCGCACGCCGCAGCCTTTGCGGCGCCCTGCaagagcaataacaacaacaatagcaacaacattaTGAATGCATACGGTGCGGGAGCTGGAAGCACGCATGCATCATATTATGGCTCTGCTGGGGTGGGCTATAACCTTGAGGGCAACACTGTGGCCTATGCGCACAACCAGCTGCTGcaataccaacaacagcaacaacaacagcagcaacaacaacaacaacagcagcagcagcaacaacatcagctcAGTCAACGCTCGTATATGCCGCACAGTTTAATGCATAGCTCGTATCCCTATATCAAAAGCGAGCCATTGGAACTACCTGATGATAGACAGCgccaacaacatcaacaacaacatcagcaacaacaccagcagcagcagcaacaacaacattttcagAATCCTATGGCACCGCCGCCAGCTCCCGCCAATCGGCACAGTCTCGATGCCAGCGGtgaaatgataataaaatCGGAACCCATTGACGAACATGCCTACAAGTCCAACTATATCGATGATAACACGCCGTTTGCCGATTTTAGCAAGTTCCCCGAATTCGGCGATGACATGTTAAGTCCCAAGGTAGAGTTAACGGTCAAGGATGAGGGCTATGGCAGTCAAAAAGTGCCCAATCCACTCAGCTATCCGCGACGCAAACTGCAATCGGAACGCTCGTCGGAAAGTCTTCCCATTTGCCAGCGTTGCAAGGAGGTGTTCTTCAAGAAGCAAATCTACTTGCGTCATGTGGCCGAGAGCAGTTGCAGCATTCAGGAGTATGACTTCAAGTGCAACATATGCCCTATGTCCTTTATGAGCACCGAGGAGTTGCAGAAACACAAGCATCTGCACAGAGCGGACAGATTCTTTTGCCACAAATACTGTGGCAAGTACTTTGACACGATTGCCGAATGCGAGTCGCATGAGTATATGCAGCACGAGTATGATAGCTATGTTTGCAACATGTGTTCCGTTACGTTTGCCACGCGGGAACAGCTCTATGCTCATTTGCCGCAACACAAATTCCAGCAGCGTTACGATTGTCCCATTTGCCGGTTGTGGTACCAAACTGCTCTAGAGCTGCACGAACATCGTCTGGCTGCTCCATATTTTTGTGGCAAGTATTACGCAGCCGCACAATCGACTTcacaccaacagcagcagcagcagcaacaacaacatccacagcatcagcaacaggcCAACTACAAACTGCAGGACTGTCACATGGCCACCATGGAGATGCCAACGCCGCATCACAAGGCAAATGCAGCTGCCACCGCATTGCCGGCAACGGCAGCGCTGAGTTCATTGTTGCAACAACGTCAGGCGAATGCCGATGGCGCCGCCATGTTTGCCTCAACGCTTAAGAATGAGGCGAATGTGAAGCTGGAGAGAAGCTACAGCAATTCCACAAGCGAGTCGGGCTACAGTATGCACGATAGCAGCTACAACAATGCCTATGGCAGCGACACCTCGTTGCAAGCTGGTGGTGCAATTGGTGGTCCACAGGCGCACTCCTCGACGCTGGACGATTCGGAGGATGCGCTGTGTTGTGTGCCGCTGTGCGGCGTCCGCAAGAGCACCAGTCCGACGCTCCAGTTCTTTACCTTCCCCAAGGATGAGAAGTATTTGCATCAGTGGTTGCATAACCTGAAGATGTTTCATATTCCGGCATCGAGCTATGCAACTTTTCGTATCTGCAGCATGCATTTTCCGAAGCGTTGCATCAACCGTTATTCCCTGTGTTATTGGGCGGTGCCGACGTTTAATTTAGGCCACGATGACGTTGCCAACTTGTATCAGAATCGAGAGCTGACCAACACCTTCACCACCGGCGAGGTGGCACGTTGCAGCATGCCCAATTGCACCAGTCAGCGGGGCGAGAGCAACCTGAAGTTCTACAACTTTCCCAAGGACATCAAGAGTCTGATTAAGTGGTGCCAGAACGCTCGTCTGCCCGTCCAGGCCAAGGAGCCGCGTCACTTCTGCAGTCGACACTTCGAGGAGCGTTGTATTGGCAAGTTCCGCCTGAAGCCCTGGGCCGTGCCTACATTACATCTGGGCGCCCAGTACGGCAAGATCCATGACAATCCGAAGAATTTGTATGTGGAGGAGAAACGCTGCTGCCTGAACTTCTGTCGTCGCAGTCGTTCCTCCGACTTTAACATGTCACTGTATCGCTTTCCCCGAGACGAGGTCCTTCTCCGACGCTGGTGCTACAATCTACGACTTGATCCTTCTGTATATCGCGGCAAGAATCATAAAATATGCAGCGCTCACTTTATCAAAGAGGCTTTGGGACTTCGCAAATTATCACCAGGAGCTGTTCCCACGTTGCATTTGGGCCACAACGACACTTTCAACATATACGAGAATGAACTGTGGCCCCCACCAACACCAACCACGCCCAccaaccaacagcagcagcagcttcagcagcaacagttgcagcagcaccagcatcaacaacattCTCACCACGGCCATCACAGCCACAAATATCAGCGTCATTCGGCGGCATCGACTTCATCGTCGGCTAGCTCGGCGTCGCATTATGTGGATGGTGAGATGAGTGGATCGTATGGGGGAATGGGTCAGTCGGGAGGCTCGTCATCGGGGCTGAATGTGAGCGACAGCATGGACGTCTGCTGTGTGCCCAGCTGTGAGAGTAAACGGCACAACAATGAGAACATCACGTTCCACACGATTCCAAGAAGGCCCGAGCAGATGCGCAAATGGTGTCACAATCTGAAGATTCCCGAGGACAAGATGCACAAGGGAATGCGCATCTGTAGTCTGCACTTTGAGCCCTACTGCATTGGCGGCTGTATGCGTCCGTTTGCGGTGCCCACGTTGCAACTGGGCCACGACGACGAGGATATTCACCGCAATCCGGATGTGATCAAGAAGCTGAACATACGGGAAACCTGCTGTGTGGCTGTCTGCAAACGCAATCGGGATCGGGATCACGCCAATCTGCATCGTTTCCCCAGCAACGTCGCCCTGCTGACCAAGTGGTGTGCAAACCTGCAGCGTGCTGTGCCTGATGGAACGAAGCTCTTCAACGATGCCATTTGCGAGGTGCACTTCGAGGATCGTTGTTTGCGTAACAAGCGGCTGGAGAAGTGGGCGGTGCCGACGCTGATACTGGGCCACGAGAATATCGCATATCCGCTGCCGACGTCAGAGCAAGTTGCTGAGTTCCATGCCCGTCCCAGTGCACCCAACAACGGCGAGGAGCAGGGCGAGTGTTGTGTGGAGACGTGCAAGCGCAATCCCAGCGTGGACGACATCAAACTCTATCGTCCGCCCGAGGAGTCGCAGGTGCTGGCCAAGTGGGCGCACAATCTGCAGCTGGATGTCGCTCAGCTGCCCAACATGCGAATCTGCAATCTGCACTTTGAGTCCCATTGCATTGGCAAACGGATGCGTCCCTGGGCCATTCCCACCCTCAATCTGGCCGCCAGCATTGAGAATCTCTTTGAGAATCCCGAACATCAAATGCTCTACAAGCGTCGCACGCATCTCAATTCAAGTTCGAGTCGAGGCACTGGCATTGTGAAGCCCACGTGGGTACCACGCTGTTGCCTGTCGCATTGCCGCAAGGTGCGCGCCTTGCACAATGTGCAGCTGTATCGTTTCCCCAAGCTCAATCGTTCCACGCTCGCCAAGTGGGCGCACAATCTGCAGGTGCCGCTGATGGGCAGCGCCCAGAGACGGCTCTGCTCTGCGCACTTTGAGCCACACGTGCTGAGCAAGAAGTGCCCGGTGCCGCTGGCGGTGCCCACGCTGGATCTCAACACTCCGCCCGGCTACAAGATCTATCAGAATCCCGCCAAGCTAAAGGCCAACAAGTTGTGTCTGCAACGCGTCTGCATCGTTGAGAGTTGTCGCCGACAGCGTGGAGCGGGTGTGCAGCTCTTCCGGCTGCCCCATAATCCGACGCAGTTGCGCAAGTGGATGCACAACATCAGGATGAGGCCGAGAGGCGCCATGCGGCAACAATATCGCATGTGTTCTGCGCACTTTGAGACACACTCGTTTAACGGAAAGCGACTGAGTGCTGGGGCGATTCCCACCCTGGAGCTGGGACACAACGACGAGGATATCTATCCGAACGAGGCACAGTCGTTTGTCGAGGAACACTGCACGGTCGAGGGCTGTGAGGCGGTTAAGGAGCAGCCGGACGTGCGTCTCTTCCGCTTCCCCACCGACGACGAAGATCTGCTTTGGAAGTGGTGCAACAACCTCAAGATGAATCCCGTGGACTGTGTTGGCGTTCGCATCTGCAACAGGCATTTCGAGATGGACTGCATTGGACCGAAGCATCTATACAAGTGGGCGATTCCCACACTGCAACTGGGACACGACGATGCTCAGATCGAGCTCATAAACAATCCCAGGCCAGAGGAGCGCTACGTGGATCCCGTGTTCAAGTGCTGTGTTCCCACCTGCGGCAAGACGCGCAAGTTTGACGAGGTGCAGATGAACAGTTTCCCCAAGGATCCCATCCTCTTTCAACGCTGGCAACACAATCTTCGACTCGAGCATCTCAATTTCAAAGAACGCGAACGATACAAGATTTGCAATGCCCACTTTGAGGATATTTGCATTGGAAAGACGCGGCTCAATATTGGCTCCATTCCTACTCTGGAGCTGGGCCACGAGGAGACCGAGGATATCTATCAGGTGAATCCCGAGGAACTGCAGAGCAATCTCTTCGGCCGTCAGCGACGTGTCCACGAATCCATGGGCATCTCTATCAAGCAGGAGGAGCACTCGGAGCTGGACGAGGACATTAAGCCGGATATTAGCATGACGGAGGCGACGGACTTAAACACTTCCCAGGTTAAAATCAAGAGATCCCTGGTGGATTCCAAGTGCTGCGTGCCGAGCTGTGGGCGCAGTCGACTGGAGCACGGCGCCCGTCTCTTCCCCTTCCCGAgtggcaagcagcagcagagcaaGTGGCGCCACAATCTTCAACTGGCGCTCGTCGACGTGGACAGATCGACACGTGTGTGCAGCGCGCACTTCAATCGTCGCTGCATTGATGGGAAGCAGCTAAGGGGATGGGCTATGCCCACCCTGCAACTGGGACACCAGGTTCAGCCCATCTATGAGAATCCCAAAAATATACCTGGCTTCTTTACACCAACCTGTGCGTTGGCACACTGCCGCAAGCGGCGCAGCATTGACAATGATCTGCGCACCTATCGCTATCCGCGCAGCGAGGATCTGCTCGAGAAATGGCGCGTCAATCTGAGATTGTCGCCGGATCAGTGTCGCGGACGCATTTGTGCCGACCACTTTGAGGTTATGGTGCGTGgcaagctgaagctgaagacGGGCGCGGTGCCGACGCTAAAGCTGGGGCACAATGAAGGCGTTGTCTTTGATAACGAGGTGATTAAGGCGGGACTTCAACAGGAGGTGGAAGaagagcaggaggaggaggaagttAGCAGGGAGTCGCTGGTCAAAGTAAAGCAGGAACAGCTTGAAACAGAAGAGGATAACGAGGATGATAATGAGGAGCATCAGACTAATGATGATGAGCAGGAGGATCATGGTTACTTTGATCCCTTGGAGCTGGTGGAAACCTTTGCGGAGCagcacgacgacgacgatcaCGATGAGaacgacgaggacgaggatgaagctggcgatgatgatgagttgctgttgccgccaGTTCAAGTGGTATTGCCGCCACGCCGCGAGAAGCCCGTTAATAATGTGACGCCCATTTGCTGCCTCAAGCATTGTCGCAAGGAACGCACGGCAACGCATCCGCTGAGCACCTTTGGCTTTCCCAAGGATCGACAGCAGCTGCTCAAGTGGAGCGCCAATCTGCAGCTGAGTGTCGAAGACTGTGTGGGACGCGTCTGCATCGAGCACTTCGAGTCCGAGATGCTGGGCACGCGCAAGCTGAAGCAGAACGCGGTACCCACATTGAAACTGGGACATGGTTCGCCACTCGGTTACACTTGCAATGGCCAAGTGTCGGGCATCTATGATGCACAGCCGCAACATTCGGTTTTTCGGCTTTGGAGCCTGAAACATTGCCGCAAACGGATGTCGGATCAGGCGACGACTAGACGACGCTGCTGTCTGCCCAGCTGTGGCAAGCAGGCGGATCTTGATGGCGTCCAATTGCAGCGGCTGCCCAGCGATCGCAACCTGCTTCGGAAGTGGCTGCACAATCTGAAGCTGCCGGCCACGCTGGACTTCAGTCAGGCGCGTCTCTGCAGTGAGCACTTTGAGACGCAGTCGGATTGTGTGCCCACATTGCGTCTGGGCCACGACGATACCCACATTTATCGCAATCGTGGCGTTCCATCTGCCTCTGGGGACTGCATGGTGCCCAGTTGTCCCTGTGCCCGCCTCAATCTCTATCGCTGCTACGATCTGCCCACGAACTCACTGGTGCAGCAGCGCTGGCTGCAGTTCCTTCGATTGCCGCTGCCTCGACTAGCCAGCGACGGCAAGCTCTGTGTCATGCACTACATGCAGCTCTTCGAGCAGGTGCCGCTACCACGGGAGTTGCCAGGCTCTGTGCTACGTCAGCTGCAGCAGACCTACGATCTAATCTCCAGCTCCTCGATGGCCATGAAGCTGCGCTGTGCCGTGCCCGGCTGCTACTCGAAGTACACGGACAACATACGGCTGACCAAGTTGCCCATGTGCCCAGAAACCTGTGCCAAGTGGGTGCACAACACCAAGATTAGCTATGAGCCTGCTCGTCACTATATCTATCGCATTTGCATGCTGCACTTTGAGACACGCTGTCTGGGTCCAGTGCGTCCGAAGCAGTGGGCGGTGCCGACGTTGCAGTTGAACCACAGCGATCCGAAGATCTATCTGAATCCCCAGCAGGATGGCAGTCCTGTTCCCGTGTCCATCTCCACTCCCATTCCTGTTGCTATCTCAACGCCCGTTCCTGTTGCTATTTCTAAGCCCATTCCTGTTGCTATCTCCACTTCCGTTCCCGTCGAGCAGCCGCTTCGCATTAAAACGGAGCTACCCTTCACCCTCAGTCCCAGCGCCAGTCCGAGTCCACGTGCCAAACTACGCATCTGTTGCATTCCCAGCTGTGCCCAACAGTCCACATCGCAGACGCGTCTCTTTCGCTTTCCCAGCGCCGAGACATCGCTGCTCAAGTGGCTGGTGAATACACAGCAACAGCCACGATTGGTGGACGCAATGCATCTGTTCGTCTGCCAGGATCACTTTGAGGAGGAGGCCATCTGTAAGAAGCAGCTGCAAAGTTGGGCGGTGCCCACATTGAAGCTGGGACACGATGGCCATGTCATACCGAATGCCCGGCACAATGGCAACATTGCCGACAGTCAGGAGAACAGGCAGGCACTGCAGTTCATCTGGCAGAACTATTGCTCCGTCCTCAGCTGCTTCCAGCCGCGCAGCGAGCAGCTGCGTCTCTATGCTTATCCCACAGATCGTCCCACCATCCGCAAATGGGCGGCCAACTGCAAGCATCGATCCATGCAGGCCAGCAGCGACGGATTCCAGGTCTGTCAATCGCATTTTGCGCCGCATTGTTTCGACCCGGAGACGGGGGAATTGCAAGAGGGCGCGGTGCCCACGCTGGAGCTGAGTCGCTGCATCAACGAGGTACGCTGCGTGGTGCCCGGCTGTGTAAAGGACGAGGATGCAGTGCGTCAGCGCTTCTTCAAGATGCCAAAGCGCAACTCGCACCTGCTGATCTGGTGTCACAATCTTCGCCTGGACGCCGCTGCCATCAGTAGCAGTGAGAATTATGTGTGCGATCGTCACTTCGAGACGCAATGCTTAAACTACCAGAAACAACTGCGTCCTGGGGCGCGTCCAACGCTGCACTTGGGGCATGAGGACAAGGATGTGCTGCCCAATCCGGCTGACTGGGATGATCCCGATGCGCTGACTTCAATCAGTGTATGCTGTGTGCCCAACTGCGGAAACTCCAAGGAGGAAGACGATGTGCTGCTTTTTAGCTTTCCCAAGCTGCGATTGCTGGCGGAGAAGTGGCTGCAGAACATACGCCTGGAACTGTCAAAGGAGGTCAGCCTGGCCAAGCTGAAGATCTGCAATGCACACTTTCGTCCCAGCTGCCTGGAGAACGGGCGACCGCAGTTGGGAGCGATGCCCACTTTACGGCTGGGACACGAGGAACAGGAGGGAATACATCGTAGTGCAGAGGCGACACCGGGCAAGGCGAAGAAGTACTGCAATCGGAGTGGCTCCAGTTACGACTGCTGCTATCCACAGTGCGTGGAACTGCAGAAGACCTATCTGAGGATCAGTTACGACCTACCCGGCGAACAGGCATTGCGTCAAAAGTGGCTGGATTACATGGAAGTGGAAGAGGAGGCGGAGAAGCCGGTAAAGCTCTGTCCGCTGCACTTGATAATGCTCTACGATTACAGTCTCGAGCATTTTGAGGAGCACACGACGGAGCAGCGGCTGGAAAGCGACTATGAGGATGCCAGGAGCAGTGTGCGCATTCGTGTCATCAGCTGTGCGGTGCGCGGTTGCCGGACATTGAAGCCGCGGGATGGCGGCTGCCTGCACGGATTGCCGCAGCGTCGAGATGTGTTGGAAAAGTGGCTGCACAACATGAAGCTGGTTTTTCACGAACATCAACGGTACTTGTACAAGATCTGCAGTCGACACTTTGAGGCAAACTGCTTTATGGACACGACGCGACGCCTAAAGCCCTGGACAATGCCCACATTGGAGCTGCCAGCGCGTGCGGAGGGCGAGGCGCCTGTATATCAGAATCCCACGGAAGCCGAATGGCAGCTTATGAacgaacagcagcagcaagaacagCAAGAGCAGGAAGAGCTGCAGCAGGAGCAGTCGGGCGAGCAGAGTGAACTCCTGGAGCCTGTAGTAAAGATGGAGCGTCACGAGGAGGAAGAACAGGAGCAGGAGGATGAAGAGGAACAGCTGCTACCCCAGAAGGAGGACGAGGAAGAATACGATAACTCACAGCAGCCGCTGGAAGTGCTGCTCGAGGTGGGACACGTGGAAAACTGCGCCACCTACGAACAAATGGACGCCGAGGCCAATCTCAACTATGCCGCCGAGCAGCAGATACACCTCAGCAGTTGTAATCCCTCCCAACAGAACGGCGTCAGCAATGGCTTCAAATACAATGCACGTCACTGCAGCGTGCGCGGATGCGATGTGACCGCCAATGATGTGAGTGGCAGCATTAAGTTGCACAAGTTTCCCACCTCGCTGGACGCCATGCAGAAATGGATGCACAACACCCAGGTGGATGTGGACACGAACTACGGCTGGCGCTTTCGCATCTGCAGTTATCACTTTTCCGACGAATGCTTTAATGGAGCGCGCATAAGACGTGGCGCCATGCCGACACTGAGTCTGGGACCGTGTCGTCCGTCAAAGATCTACGACAATGAGTTCAACACGCAGGAAcagcaggaacaggagcagCCGATCCACTTGGAAATGCAGCCAACGGGTGGCGATATAGCTTTGCGTCTGCCACAAGCGGCGCCTCCGCGTAAATCCAGCAAATTCTGCCAAATCGAGAACTGTCCCAATCATCTGACCAGCGAGAATTTGACTCTGCACAAATTCCCGCACTCCGTGGacatgtgtgccaagtggCAGCACAACACGCAGGTGCCCTTCGATCCAGATTACCGTTGGCGTTATCGCATCTGTAGCGCACACTTTGAGCCCGTCTGCCTGATGAATATGCGTCTGTTGCACGGCAGCGTGCCAACACTTCATCTGGGACCACGTGCGCCTCGCCAGCTGTTTGAAAATGACTTTGAGGCGATCAGCATGCGACTGGATAAACAGAAGAACAGTGTGGAGCAGCTGGACAAGCGGGAGCGGCAGcttgaggaggaggagaaagacgaacaggaggaggaggaggagctgaGTTTCTTGGTGCCAGAGATGCAGCTGCATGAAGATGCTgatgctgaagctgaagcGGAAGCAGAAGCGTCTGCAGATTACAGCAGCTGGAAGCAGCTACGTCTGCCCAGCATCAAGCAGGAGCAGCAGACCAGCTATAATCCCGTCAAGTCCGGATACGACAAGTGTTCCCTGGTGCATTGTCAGCGTCAGCGTTCACAGCACGGTGTTCATATCTACAAGTTTCCACGGTCGCGACAATTGCAGCAGCGCTGGATGCACAATCTGAGGATAAGGTATGACGAACGACGTCCCTGGAAGACAATGATATGCAGCGCACACTTCGAGCCAAGATGCATTCGACTGCGCAAGCTTCGTCCCTGGGCGGTACCCACATTGGAGCTGGGCGAGAATGTGCCGCAAGATGTCTACACGAATCAGCAGGGCAGCGACAACGAGGAGTGGGAGGAACCGGGCAGGGATATGTCCCTGTCCCTGGAGGGTGGCTATGAGGACGACGATTGTATGGAGGAAGAGGATGACTTTCTGGCCACGGAGCCACTGGTGAAGCGCGAGCGTCGTTCGCGTTTCGACCCCCTGCCCCCGGGTCAGTTGCCGCCCTGGAAGATTAAGATCTGCTCGTTGCCCTATTGTCGCAGTCCACGCGGTGACGGCATTAAGCTCTTCAGGCTGCCCAACAACACGTCTGCCATTCGCAAATGGGAAGCAGCGACAGGCATGCGATTCACTGAATCCCAGCGCAATACGAAGCTCATCTGCAGTCGCCACTTCGATCCGCAGCTCATTGGAGTGCGTCGGCTCATGTGCAATGCCGTGCCCACGCTGCATCTGGGACCCATGAGTGCAGTGGATCAAGTGGAGCAATCTTCCGCAGCTCCAAGCTGCTGCATGCCCGATTGCCAGCAGGATGTCAAGCTGCACAGGTTTCCCAGTGATCCCGTGCTGCTGCATCAATGGTGTCACGCGCTGAATCTCTCAGATGTTCAGCGATATCGTGGCAAGCACATTTGTGCCACACATCTGCCCGCCAAAGCGCCGAGTTGCATTGTCTGTGGCGTGGAAAACATAAAGTTGCCCCTGCTGGACTTCCCGGAGAACCGCAATCAGCGTGCCAAATGGACCTACAATCTCAAAATCGAATCCATTGCCAAGTGGGATAACACAAAGCAGATTTGCAGCAAGCACTTCGAGAACTACTGCTTCCTTCAACCCGGTCAACTGCTGCCCGAGGCGGCTCCCACGTTGCATTTGAGGCACGAGGACAGCAACATATTCCTAAACGACTATACCATAGATCACAGCAAGATGCTGCGTATTAAAGACGAGCCCTTGGACAGCGAGGACCTGATGCtgtaa
Protein Sequence: MSQHNNPPHHHHHHYYQQQQQQIQQQHHQHQQQQQQQQQLQHKQIQQHSWYSHVASYPPHHPHAAAFAAPCKSNNNNNSNNIMNAYGAGAGSTHASYYGSAGVGYNLEGNTVAYAHNQLLQYQQQQQQQQQQQQQQQQQQQHQLSQRSYMPHSLMHSSYPYIKSEPLELPDDRQRQQHQQQHQQQHQQQQQQQHFQNPMAPPPAPANRHSLDASGEMIIKSEPIDEHAYKSNYIDDNTPFADFSKFPEFGDDMLSPKVELTVKDEGYGSQKVPNPLSYPRRKLQSERSSESLPICQRCKEVFFKKQIYLRHVAESSCSIQEYDFKCNICPMSFMSTEELQKHKHLHRADRFFCHKYCGKYFDTIAECESHEYMQHEYDSYVCNMCSVTFATREQLYAHLPQHKFQQRYDCPICRLWYQTALELHEHRLAAPYFCGKYYAAAQSTSHQQQQQQQQQHPQHQQQANYKLQDCHMATMEMPTPHHKANAAATALPATAALSSLLQQRQANADGAAMFASTLKNEANVKLERSYSNSTSESGYSMHDSSYNNAYGSDTSLQAGGAIGGPQAHSSTLDDSEDALCCVPLCGVRKSTSPTLQFFTFPKDEKYLHQWLHNLKMFHIPASSYATFRICSMHFPKRCINRYSLCYWAVPTFNLGHDDVANLYQNRELTNTFTTGEVARCSMPNCTSQRGESNLKFYNFPKDIKSLIKWCQNARLPVQAKEPRHFCSRHFEERCIGKFRLKPWAVPTLHLGAQYGKIHDNPKNLYVEEKRCCLNFCRRSRSSDFNMSLYRFPRDEVLLRRWCYNLRLDPSVYRGKNHKICSAHFIKEALGLRKLSPGAVPTLHLGHNDTFNIYENELWPPPTPTTPTNQQQQQLQQQQLQQHQHQQHSHHGHHSHKYQRHSAASTSSSASSASHYVDGEMSGSYGGMGQSGGSSSGLNVSDSMDVCCVPSCESKRHNNENITFHTIPRRPEQMRKWCHNLKIPEDKMHKGMRICSLHFEPYCIGGCMRPFAVPTLQLGHDDEDIHRNPDVIKKLNIRETCCVAVCKRNRDRDHANLHRFPSNVALLTKWCANLQRAVPDGTKLFNDAICEVHFEDRCLRNKRLEKWAVPTLILGHENIAYPLPTSEQVAEFHARPSAPNNGEEQGECCVETCKRNPSVDDIKLYRPPEESQVLAKWAHNLQLDVAQLPNMRICNLHFESHCIGKRMRPWAIPTLNLAASIENLFENPEHQMLYKRRTHLNSSSSRGTGIVKPTWVPRCCLSHCRKVRALHNVQLYRFPKLNRSTLAKWAHNLQVPLMGSAQRRLCSAHFEPHVLSKKCPVPLAVPTLDLNTPPGYKIYQNPAKLKANKLCLQRVCIVESCRRQRGAGVQLFRLPHNPTQLRKWMHNIRMRPRGAMRQQYRMCSAHFETHSFNGKRLSAGAIPTLELGHNDEDIYPNEAQSFVEEHCTVEGCEAVKEQPDVRLFRFPTDDEDLLWKWCNNLKMNPVDCVGVRICNRHFEMDCIGPKHLYKWAIPTLQLGHDDAQIELINNPRPEERYVDPVFKCCVPTCGKTRKFDEVQMNSFPKDPILFQRWQHNLRLEHLNFKERERYKICNAHFEDICIGKTRLNIGSIPTLELGHEETEDIYQVNPEELQSNLFGRQRRVHESMGISIKQEEHSELDEDIKPDISMTEATDLNTSQVKIKRSLVDSKCCVPSCGRSRLEHGARLFPFPSGKQQQSKWRHNLQLALVDVDRSTRVCSAHFNRRCIDGKQLRGWAMPTLQLGHQVQPIYENPKNIPGFFTPTCALAHCRKRRSIDNDLRTYRYPRSEDLLEKWRVNLRLSPDQCRGRICADHFEVMVRGKLKLKTGAVPTLKLGHNEGVVFDNEVIKAGLQQEVEEEQEEEEVSRESLVKVKQEQLETEEDNEDDNEEHQTNDDEQEDHGYFDPLELVETFAEQHDDDDHDENDEDEDEAGDDDELLLPPVQVVLPPRREKPVNNVTPICCLKHCRKERTATHPLSTFGFPKDRQQLLKWSANLQLSVEDCVGRVCIEHFESEMLGTRKLKQNAVPTLKLGHGSPLGYTCNGQVSGIYDAQPQHSVFRLWSLKHCRKRMSDQATTRRRCCLPSCGKQADLDGVQLQRLPSDRNLLRKWLHNLKLPATLDFSQARLCSEHFETQSDCVPTLRLGHDDTHIYRNRGVPSASGDCMVPSCPCARLNLYRCYDLPTNSLVQQRWLQFLRLPLPRLASDGKLCVMHYMQLFEQVPLPRELPGSVLRQLQQTYDLISSSSMAMKLRCAVPGCYSKYTDNIRLTKLPMCPETCAKWVHNTKISYEPARHYIYRICMLHFETRCLGPVRPKQWAVPTLQLNHSDPKIYLNPQQDGSPVPVSISTPIPVAISTPVPVAISKPIPVAISTSVPVEQPLRIKTELPFTLSPSASPSPRAKLRICCIPSCAQQSTSQTRLFRFPSAETSLLKWLVNTQQQPRLVDAMHLFVCQDHFEEEAICKKQLQSWAVPTLKLGHDGHVIPNARHNGNIADSQENRQALQFIWQNYCSVLSCFQPRSEQLRLYAYPTDRPTIRKWAANCKHRSMQASSDGFQVCQSHFAPHCFDPETGELQEGAVPTLELSRCINEVRCVVPGCVKDEDAVRQRFFKMPKRNSHLLIWCHNLRLDAAAISSSENYVCDRHFETQCLNYQKQLRPGARPTLHLGHEDKDVLPNPADWDDPDALTSISVCCVPNCGNSKEEDDVLLFSFPKLRLLAEKWLQNIRLELSKEVSLAKLKICNAHFRPSCLENGRPQLGAMPTLRLGHEEQEGIHRSAEATPGKAKKYCNRSGSSYDCCYPQCVELQKTYLRISYDLPGEQALRQKWLDYMEVEEEAEKPVKLCPLHLIMLYDYSLEHFEEHTTEQRLESDYEDARSSVRIRVISCAVRGCRTLKPRDGGCLHGLPQRRDVLEKWLHNMKLVFHEHQRYLYKICSRHFEANCFMDTTRRLKPWTMPTLELPARAEGEAPVYQNPTEAEWQLMNEQQQQEQQEQEELQQEQSGEQSELLEPVVKMERHEEEEQEQEDEEEQLLPQKEDEEEYDNSQQPLEVLLEVGHVENCATYEQMDAEANLNYAAEQQIHLSSCNPSQQNGVSNGFKYNARHCSVRGCDVTANDVSGSIKLHKFPTSLDAMQKWMHNTQVDVDTNYGWRFRICSYHFSDECFNGARIRRGAMPTLSLGPCRPSKIYDNEFNTQEQQEQEQPIHLEMQPTGGDIALRLPQAAPPRKSSKFCQIENCPNHLTSENLTLHKFPHSVDMCAKWQHNTQVPFDPDYRWRYRICSAHFEPVCLMNMRLLHGSVPTLHLGPRAPRQLFENDFEAISMRLDKQKNSVEQLDKRERQLEEEEKDEQEEEEELSFLVPEMQLHEDADAEAEAEAEASADYSSWKQLRLPSIKQEQQTSYNPVKSGYDKCSLVHCQRQRSQHGVHIYKFPRSRQLQQRWMHNLRIRYDERRPWKTMICSAHFEPRCIRLRKLRPWAVPTLELGENVPQDVYTNQQGSDNEEWEEPGRDMSLSLEGGYEDDDCMEEEDDFLATEPLVKRERRSRFDPLPPGQLPPWKIKICSLPYCRSPRGDGIKLFRLPNNTSAIRKWEAATGMRFTESQRNTKLICSRHFDPQLIGVRRLMCNAVPTLHLGPMSAVDQVEQSSAAPSCCMPDCQQDVKLHRFPSDPVLLHQWCHALNLSDVQRYRGKHICATHLPAKAPSCIVCGVENIKLPLLDFPENRNQRAKWTYNLKIESIAKWDNTKQICSKHFENYCFLQPGQLLPEAAPTLHLRHEDSNIFLNDYTIDHSKMLRIKDEPLDSEDLML

Similar Transcription Factors

Sequence clustering based on sequence similarity using MMseqs2

100% Identity: iTF_00601834;
90% Identity: -
80% Identity: -