Basic Information

Insect: Drosophila mettleri
Gene Symbol: -
Assembly: GCA_035047625.1
Location: JAWNPI010000018.1:2128090-2142817[-]

Transcription Factor Domain

TF Family: THAP
Domain: THAP domain
PFAM: PF05485
TF Group: Zinc-Coordinating Group
Description: The THAP domain is a putative DNA-binding domain (DBD) and probably also binds a zinc ion. It features the conserved C2CH architecture (consensus sequence: Cys - 2-4 residues - Cys - 35-50 residues - Cys - 2 residues - His). Other universal features include the location of the domain at the N-termini of proteins, its size of about 90 residues, a C-terminal AVPTIF box and several other conserved residues. Orthologues of the human THAP domain have been identified in other vertebrates and probably worms and flies, but not in other eukaryotes or any prokaryotes [1].
Hmmscan Out: # of c-Evalue i-Evalue score bias hmm coord from hmm coord to ali coord from ali coord to env coord from env coord to acc

1 29 2.1 3.7e+03 -1.3 1.9 49 63 342 360 322 375 0.56

2 29 4e-15 7e-12 45.9 4.6 1 86 560 632 560 633 0.86

3 29 3e-15 5.3e-12 46.3 4.6 1 87 660 729 660 729 0.83

4 29 7.4e-16 1.3e-12 48.3 0.4 1 87 751 823 751 823 0.85

5 29 6.6e-16 1.2e-12 48.4 5.6 1 87 922 992 922 992 0.83

6 29 1.1e-14 1.9e-11 44.5 3.4 1 86 1016 1087 1016 1088 0.82

7 29 1.7e-12 3e-09 37.5 1.0 1 87 1123 1191 1123 1191 0.80

8 29 6e-11 1e-07 32.5 1.3 1 86 1236 1305 1236 1306 0.76

9 29 1.2e-16 2.1e-13 50.8 0.2 1 86 1333 1402 1333 1403 0.82

10 29 7.2e-14 1.3e-10 41.9 0.4 1 86 1424 1493 1424 1494 0.81

11 29 1e-13 1.8e-10 41.4 2.5 1 86 1521 1592 1521 1593 0.86

12 29 1.6e-12 2.8e-09 37.6 1.9 1 85 1646 1714 1646 1716 0.80

13 29 4.7e-12 8.1e-09 36.1 0.1 1 86 1739 1807 1739 1808 0.82

14 29 2.2e-14 3.8e-11 43.5 1.1 1 87 1960 2029 1960 2029 0.80

15 29 1.8e-12 3.2e-09 37.4 0.1 1 62 2088 2149 2088 2165 0.78

16 29 0.00043 0.75 10.6 0.0 1 58 2170 2222 2170 2240 0.79

17 29 3.1e-14 5.3e-11 43.1 1.2 1 87 2261 2331 2261 2331 0.86

18 29 8e-14 1.4e-10 41.7 0.8 1 86 2393 2462 2393 2463 0.81

19 29 7.8e-13 1.4e-09 38.6 1.6 1 86 2498 2569 2498 2570 0.82

20 29 4.4e-12 7.7e-09 36.2 1.9 1 87 2580 2652 2580 2652 0.81

21 29 1e-14 1.8e-11 44.6 0.3 1 87 2675 2746 2675 2746 0.82

22 29 6.5e-05 0.11 13.2 0.0 1 58 2775 2825 2775 2846 0.84

23 29 5.8e-15 1e-11 45.4 0.0 1 86 2860 2932 2860 2933 0.81

24 29 3.8e-12 6.5e-09 36.4 0.1 3 86 3045 3115 3043 3116 0.81

25 29 2.9e-14 5e-11 43.2 1.5 1 86 3173 3243 3173 3244 0.82

26 29 1.2e-14 2e-11 44.4 4.2 1 86 3353 3423 3353 3424 0.85

27 29 1.1e-12 1.9e-09 38.1 0.3 1 86 3508 3577 3508 3578 0.84

28 29 8.7e-07 0.0015 19.2 1.1 1 58 3595 3643 3595 3656 0.83

29 29 8.5e-10 1.5e-06 28.8 1.8 19 87 3661 3718 3647 3718 0.77

#	of	c-Evalue	i-Evalue	score	bias	hmm coord from	hmm coord to	ali coord from	ali coord to	env coord from	env coord to	acc
1	29	2.1	3.7e+03	-1.3	1.9	49	63	342	360	322	375	0.56
2	29	4e-15	7e-12	45.9	4.6	1	86	560	632	560	633	0.86
3	29	3e-15	5.3e-12	46.3	4.6	1	87	660	729	660	729	0.83
4	29	7.4e-16	1.3e-12	48.3	0.4	1	87	751	823	751	823	0.85
5	29	6.6e-16	1.2e-12	48.4	5.6	1	87	922	992	922	992	0.83
6	29	1.1e-14	1.9e-11	44.5	3.4	1	86	1016	1087	1016	1088	0.82
7	29	1.7e-12	3e-09	37.5	1.0	1	87	1123	1191	1123	1191	0.80
8	29	6e-11	1e-07	32.5	1.3	1	86	1236	1305	1236	1306	0.76
9	29	1.2e-16	2.1e-13	50.8	0.2	1	86	1333	1402	1333	1403	0.82
10	29	7.2e-14	1.3e-10	41.9	0.4	1	86	1424	1493	1424	1494	0.81
11	29	1e-13	1.8e-10	41.4	2.5	1	86	1521	1592	1521	1593	0.86
12	29	1.6e-12	2.8e-09	37.6	1.9	1	85	1646	1714	1646	1716	0.80
13	29	4.7e-12	8.1e-09	36.1	0.1	1	86	1739	1807	1739	1808	0.82
14	29	2.2e-14	3.8e-11	43.5	1.1	1	87	1960	2029	1960	2029	0.80
15	29	1.8e-12	3.2e-09	37.4	0.1	1	62	2088	2149	2088	2165	0.78
16	29	0.00043	0.75	10.6	0.0	1	58	2170	2222	2170	2240	0.79
17	29	3.1e-14	5.3e-11	43.1	1.2	1	87	2261	2331	2261	2331	0.86
18	29	8e-14	1.4e-10	41.7	0.8	1	86	2393	2462	2393	2463	0.81
19	29	7.8e-13	1.4e-09	38.6	1.6	1	86	2498	2569	2498	2570	0.82
20	29	4.4e-12	7.7e-09	36.2	1.9	1	87	2580	2652	2580	2652	0.81
21	29	1e-14	1.8e-11	44.6	0.3	1	87	2675	2746	2675	2746	0.82
22	29	6.5e-05	0.11	13.2	0.0	1	58	2775	2825	2775	2846	0.84
23	29	5.8e-15	1e-11	45.4	0.0	1	86	2860	2932	2860	2933	0.81
24	29	3.8e-12	6.5e-09	36.4	0.1	3	86	3045	3115	3043	3116	0.81
25	29	2.9e-14	5e-11	43.2	1.5	1	86	3173	3243	3173	3244	0.82
26	29	1.2e-14	2e-11	44.4	4.2	1	86	3353	3423	3353	3424	0.85
27	29	1.1e-12	1.9e-09	38.1	0.3	1	86	3508	3577	3508	3578	0.84
28	29	8.7e-07	0.0015	19.2	1.1	1	58	3595	3643	3595	3656	0.83
29	29	8.5e-10	1.5e-06	28.8	1.8	19	87	3661	3718	3647	3718	0.77

Sequence Information

Coding Sequence: ATGTCACAACACAATCAaccgcattcgcattcgcatcagcatcagcaacaacatcttCACTActaccagcaacagcagcagcaacatcacctacagcaacaacaacaccagcagcatcagcatttacaacataaacaaatacaacagcagcacagttGGTACTCACATGTTGCTTCCTACCCGCCCCAACAGCCGCACCCCTATGCGACACCCTGCAAGagtagcaacaataacaatcacaacagcaacaacattatgAATTCATACGGAACGGGCGGGACGCACTATTACGGTggtgctactgctactgctgctgcgggGGTAGGATATAACCTTGAAGCTAATACTGTAGCTTATGCGCACAACCAGCTACtgcaataccaacaacaacagcagcagcagcagcagccgcaagaGCTCAATGAACGGTCCTATGTTCCGCACAATATAATGCACAACTCCTATCCATATATTAAAAGCGAGCCATTGGAGATGCCTGATGATAGACATCGCCATCAGCAACACCAGTCCCAGCAACCGCAGCCGCATATACAAAACCATTTCCAAAATCCGATGGCACCACCGCCAGCACCCGCCTCCAATCACCATACACTTGATGCCAGTGGcgaaatgataataaaatcGGAACCCATTGACGAACATGCGTATAAGTCCAACTATATTGATGATAATACACCCTTTGCCGATTTTAGCAAATTTCCCGAATTCGGCGATGAAATGATGAGCCCCAAGGTGGAGCTAACTGAAAAGGATGATGCCTATGGCAGCCAAAAAAGCCTGCTCAGCTTTCCGCGCCGTAAGCTGCAAATGGAACGGTCCTCAGAGAGTCTGCCCATATGTCAGCGCTGCAAGGAGGTGTTTTTTAAGAAACAAATCTATCTTCGTCATGTGGCCGAGAGCAGCTGTTCGATACATGAGTACGACTACAAGTGCAACATCTGTCCAATGTCCTTCATGGGCGTCGAGGAGCTTCAGAAGCACAAACAACTGCATCGGGCTGATAAGTTCTTCTGCCACAAGTACTGTGGTAAGCACTTTGACAACATTGCTGATTGCGAATCGCACGAGTATATGCAACATGACTACGACAGCTTTGTGTGCAACATGTGCTCAGTATCATTTTCCACGCGTGATCAGCTGTATGCTCATTTGCCTCAGCACAAGTTTCAACAACGCTACGATTGTCCTATATGCCGCTTGTGGTATCAAACTGCGCTGGAGTTGCACGAGCATCGTCTAGCGGCGCCCTATTTTTGTGGCAAGTACTATGCAACAACACAGCAATTGCAGCCCCAGCAATTGTCGGAGCACAGCAACTACAAGTTGCAGGACTGCCACATGGGCATAATAGAGATGACTGCGCCGCAGCATAAAACAAATTCGTTGCCTGCGACAGCGGCGCTTAGTTCCTtactacaacaacatcaaGTGAATGCTGATGGTGGTACCTCTCTCTTTGCATCTTCGTTAAAGAACGAGCCGAGTGTGAAGCTCGAGCGAAGCTACAGCAACTCAACAAGTGAGTCGGGATATAGCATGCACGAGAGCAGTGGCTACAATAATGCATTTGGGAGTGATAATTCAATGCATGGCAGCGTTGTAATGGGTGGACCACAGGCACATTCTTCGACACTGGATGATTCGGAAGATGCCCTGTGCTGTGTGCCCTTGTGTGGTGTACGCAAAAGCACCAGCCCCACTCTGCAGTTCTTTACGTTTCCAAAGGATGAGAAGTATCTACATCAATGGCTGCATAATCTCAAAATGTTTCATATACCCGCGTCGAGTTATAGCAGCTTTCGCATCTGTAGCATGCATTTCCCCAAGCGTTGCATAAATCGGTATTCCCTGTGCTATTGGGCAGTGCCCACATTCAACCTGGGGCACGATGATGTCGCCAATCTATATCAGAATCGCGAGTTAACCAACACCTTTACCACCGGTGAGGTAGCACGATGTAGTATGCCCAATTGCACTAGCCAGCGTGGTGAAAGTAATCTTAAGTTTTACAATTTCCCGAAGGACATCAAGAGCCTAATCAAATGGTGCCAGAATGCACGCCTGCCCGTCCAGGCCAAAGAGCCACGTCATTTTTGCAGCCGTCACTTTGAGGAGCGTTGCATTGGCAAATTTCGGCTGAAACCCTGGGCTGTACCCACGCTGCATTTGGGTGCTCAGTATGGCAAAATTCATGACAATCCTAAGAATCTCTATGTAGAGGAAAAGCGTTGCTGTCTAAATTTCTGTCGGCGCAGTCGCTCTTCCGACTTCAACATGTCCCTTTATCGTTTTCCTAGAGATGAAGTACTTCTGCGGCGCTGGTGCTATAATTTGAGACTCGATCCAGCCGTATATCGTGGAAAGAATCACAAAATATGCAGCGCTCACTTCATTAAAGAAGCTCTCGGCTTGCGAAAATTGTCCCCAGGCGCAGTACCAACTCTGCACCTAGGTCACAATGACACTTTCAATATTTACGAGAATGAACTGTGGCCACCTCCAACGCCTTCGACGCCTACCCATCATAATaatcatcagcaacaacaactacaacagcatcAAGTGCAACAACAGCTTGTTCATCACAAATATCCCAGGCACTCGGCTGCATCCACTTCCTCGTCAGCCAGCTCTACATCCCACTATGTAGATCCCGAAGTCAGTGCCTCTTACATGGCCATGGGTATGGGCGCTGGCGCCTCATCTTCTGGGCTGCTGAATGTGAGCGATAGCATGGATGTCTGCTGTGTGCCGAGTTGCGAAAGCAAGCGACACAACAATGAGAACATCACATTCCATACAATTCCCAGACGACCGGAGCAAATGCGCAAGTGGTGTCACAATCTCCGTATACCCGAGGACAAGATGCATAAAGGTATGCGTATATGTAGTCTACATTTCGAGCCCTATTGCATTGGCGGCTGCATGCGTCCGTTTGCGGTGCCCACGCTACACTTGGGCCATGACGAAGAGGACATTCATCGGAATCCGGATGTAATCAAAAAGTTGAACATTCGCGAAACCTGCTGTGTCTCTGTTTGCAAACGCAATAGAGATCGTGATCATGCCAATCTGCACCGCTTTCCTAGCAATGTGACCTTGCTAACAAAATGGTGTGCAAATTTGCAGCGAACTGTTCCGGATGGGATTAAGCTCTTTAATGATGCCATCTGTGAGGTGCATTTCGAAGAAAGGTGCTTGCGCAACAAGCGGTTAGAGAAGTGGGCAGTGCCTACTCTTTTGCTTGGCCACGAAAACATTCCTTACCCGCTGCCCACACCAGAGCAGGTGGCCGAATTCTATGCTCGACCGTGCGCTCCAAACAATGGCGAAGAGCAGGGTGAATGCTGTGTGGAGACTTGTAAGCGTAATCCCAGCGTAGATGACATCAAGCTATACCGACCGCCGGAGGAGTCGCAAGTGCTGACCAAATGGGCGCACAATCTGCAGATAGATATCGCTCAGCTACCTGCCATGCGTATTTGCAATCTACATTTTGAGTCCCATTGCATAGGCAAGCGAATGCGGCCATGGGCCATACCCACACTTAATCTGGCCAGCAATATAGAGAATCTTCATGAGAATCCCGAGCAGCAAATGTTATACAAGCGGCGTACCTCGCATCTCAGCATGCAAAGGGATGGAACTGATGGAAGCGTTATCAAACCCACATGGGTGCCACGCTGCTGTCTGCCGCACTGCCGCAAGGTGCGCGCACTGCACAACGTTCAATTGTATCGTTTCCCAAAACTTAATCGTGCCACGTTGGCAAAGTGGGCGCATAATCTGCAAGTGCCGATGGCTGGAAGTGCTCAGAGGCGTCTCTGCTCCGCGCATTTTGAGCCACATGTGCTTAGCAAAAAGTGCCCAGTTCCGTTGGCGGTGCCGACGCTCGATCTCAATACTCCGCCAGGTTACAAGATTTACCAGAACCCAGCCAAGATAAAAGCAAACAAGCTGTGCATGCAGCGCGTTTGTATTGTGGAGAGCTGTCGTCGGCAGCGTGGCCAGGGTGTCCAGCTCTTCCGTCTACCCCACAATCCAACGCAGCTGCGCAAGTGGATGCACAATATACGAACACGACCACGCTTTGGGATGCGCCAACAATACCGCATCTGCTCTCTCCACTTTGAGACTCACTCGTTCAATGGCAGGCGGTTAAGCACTGGAGCGATTCCCACTCTCGAGCTGGGCCATCAGGACGACGACATTTATCCAAATGAGGCACAGGCGTTTGTCGAGGAGCGTTGTGCAATCGAGGGCTGCGATGCTTCCAAAGAGCAGGCTGATGTGCGTCTCTTCCGCTTTCCAAACGATGACGAGGACCTGTTATGGAAGTGGTGTAACAATCTCAAAATGAATCCCGTTGATTGCATCGGCATGCGCATCTGCAACAGGCACTTCGATCCGGATTGTATCGGTGCCAAGCAGCTCTATAAGTGGGCCATACCCACGCTGATGCTTGGGCACGATGATGTCGAGATTGAGTTGATATTGAATCCTAAGCCAGAGGATCGCAACGTGGATCCGGTGTTTAAGTGTTGTGTTCCTACCTGTGGCAAGACTCGCAAATTCGATGAGGCGCAAATGAACAGCTTCCCAAAAGATCCGATACTCTTCCAGTGCTGGCGCCATAATCTCCGCCTCGAGCATCTTAATTTCAAGGAGCGCGAAcgctataaaatttgtaatgcgCATTTCGAAGAGATTTGCATTGGCAAAACGCGCCTCAACATAGGCTCCATACCCACATTAGAGCTCGGTCACGACGAGACGAAAGATCTGTATCGAGTCAATCCGTATGAGCTTCAGACGAATCTGTTTGGACGACAGCGACGGGTGAGCATCAAACAAGATTCGAATGAGCACTTCACTAGACAGGTTAAATTAAACCGATCTCAGCCAGCCCTCAAGTGTTGCGTCGCCAGCTGTGTACGCAGTCGACTGGATAATGGCGCTCGTCTATTTCCATTTCCCAcgggcaaacaacaaaaaaacaagtgGCGCCACAATCTTCGACTCAAAGCTTCCGAAATTAATGTGATGACACGTATTTGCAGCGCACATTTCAATCGACGTTGCATCAATGGAAAACAATTGAGAGGGTGGGCTATGCCTACCCAGGAACTGGGTCACGAGGACACAAATATCCATGACAATCCAAAGAATATTCCGGGCTTTTTTACTCCTACATGTGCATTGGCCCATTGTCGCAAAAGGCGGAGCATTGATAATGATTTGCGCACTTATCGTTATCCGCGCAGCGAAGAGTTGCTGGAAAAATGGCGTGTGAATCTTCGTCTTGCACCTGATCAATGCCGCGGGCGAATTTGTGCGGATCACTTTGAGCCTTTGGTACGTGGAAAGCTGAAGCTAAAGACAGGTGCAGTGCCTACGCTAAAACTAGGTCACGATGAGGGTGTAGTCTATGATAATGAGGCTATCAAGGCGGGCATGCAGCAGGAGGAAGAGGAGCAAGATGTTGGAGAGGCCGCGAATAGCTTGGAATCGAGGGCTATAAGGGATAATGAGCACAAAGAAGAGGATCAGTATATGGAAAATGAGCAGACAGAACAACAAGAAGATGAGGAGGAGGATCAGGACAAAGACGAGGACGACCATCAAGATCAAGGCTTTTTTGATCCCCTAGAGCTCGTGGAAACCTTTGCCGAACAGCACAGCGAAGATGAACAACTCTATAATGACGAAGATGACGATGTTGATGATAATGAGGATGAGGAGGATATACCTGGCGATGATGatgagctgctgttgcccgaTACTCTGCCTGTACAGCTACCCTTTCCACCGAGGCGtgagaaaaaagagaaagccGTGAATAATGTGACGCCGATATGTTGCCTCAAGCATTGCCGCAAGGAACGCACTGCTACACATCAACTGAGCACCTTTGGCTTTCCCAAGGATCAGAAGCAACTGGTCAAATGGAGCGCGAATTTACAACTAGAACTATCTGACTGTGTTGGACGTGTTTGCATTGAACATTTTGAAGCTGAGATGTTGGGTACACGCAAGCTAAAGCAAAACGCGGTGCCCACTTTGAATCTGGGACATACAAAACCCCTCAGTTATCGCTGTAATGGACAAGTCGCGGGAGTCCTTGAtgcgcagccacagcagcagtcgGTTTTTCGGCTTTGGAGCCTAAAACACTGCCGGAAAAGGAAAACGCTGCCAACGAATACGCAGAGTGTAACAGCGATGATGACTAAGCGTGGCTGCTGCCTACCTAGTTGTGGCAAGCAACGGGAGTTGCATGGCGTTCAGCTAAGACGCATGCCACGGGAACGTTTGCTACTACGCAAGTGGCTGCACAATCTTAAGCTGCCGTCGAACATTAACACCAGcaatgcgtatgtgtgcgagGAGCATTTCGAGGAACAAGCTATGTTACCTACCTTGCAACTAGGTCATACGGATGTTAATATTTATCGTAACAGTAACAACTTAATTGTAGCTAACGGCTGTCTCGTGCCCAGCTGTTCATGTGCGCGTCTTAATCTCTATCGAAGCTACGCACTCCCTGAGCATCCGCAAGTGCAAGAAGCCTGGTTGAAGTGGCTTCAACTGCCGCCTCGTTCACCCAATTTATCGAGCCATACCCAATTATGTGTCATGCACTACATGCAACTGTTTGAGCAGGTACCGTTGCCTGAACAGCTGCCCGAAATGGTGCTCTGCGAGCTTAGAGAAACTTATGACCATATCGCCAATTCTACCAGAGCCTTAGCGCTGCGGTGCGCAGTGCCCGGCTGCCAAACCAAATACACCGACAATGTGCGTCTAACTAGGTTTCCCATTTGTCAGCGTACTCGCGACCAATGGTTGCATAATACAAAAATCGAATACGATCCGGAACGCGATTACCTCTATCGTATTTGTATGCGGCATTTCGAGCCCCATTGCCTGGGTGCTGTGCGCCCAAGGCAATGGGCGGTGCCTACACTACACCTTAACCACAACGACCAGGATATTTATAAGAATGTCAAGTTGGAGGACAACGCTCTTGGCATAGCAACTCAGCAGGGTGTACCTCTTGAAATGCCGCTACGCATTAAGACAGAGTTGCCGCATCTCCTTTCTCTTAGTCCGACGGCCAGCGCAAGTCCTAGTCCTCGGGGCAAACTCCGCACCTGTTGCATTCCTAGCTGTGGCCAGCAGGCCAATTCTGTCACCCGTCTCTTTCGCTTCCCTAGTGACGAGACTATGCTGCTCAAATGGTTGGTGAAtacacagcagcaaccgcGTTTCGTGGATGCACAATATCTGTTTATTTGCCTGGAACACTTCGAGCGGAAGGTCATTATAAAGAATCATGTGCGCAGCTGGGCGGTGCCAACGCTAAAACTGGGTCACAAAGGTCGTATCATACCCAATGCTCGCCACAATGGAAATATTGCTGACGTGCAGAGGCATAAGAGAGCTATGAAATACATTAGGGCCAACTTCTGCTccgttcttacttgtttccaACAGCGCAGCGCAAATTTACGTCTCTTCGCCTACCCCAGAGATCGACTTAACATTCGTCGGTGGGCTGCCAATTGCAAGCACCGCTCTATGCAGGCCATAAATGATGGATTCCAGATCTGCCAGTCGCATTTCGCGCCAGATTGCTTCGACCCTGAGAGCCGACAACTGAAGGAGAATGCTGTACCCACGCTTGAGCTGAGTCGACCTTTCTATCAGATGCGTTGCCTGGTCAATGGCTGCGTTAAGGATGAGGACGCATTGCGCCGTCGCCTATTTAAAATGCCAAAGCGTACATCACAGTTAGAGGATTGGTGTCACAATTTACGCATTGATCCGTCGTCTATAACTGGCCAGGAGCCGCATGTATGTGAACGGCATTTTGAAGCGCACTGTTTTAATGCGTCCAAGTTTTTACGTCAAGGTGCGCGACCCACACTACATTTGGGCCATGAAAACCAGTTTGATGTACTGCCGAATCCTGTTAAGTGGGAGGAGGATGCTCACGCATGCTTTGTGCCCAGCTGTGGACGATCAAAGGATGCCGACAATGTACAGTTATTCGGCCTACCTAAGCTTAAGGTTCTGCGAGAGAAATGGTTGCAAAATTTCCGTCTCGATCCGAGCAAGGAGCTCCTGCATGCCCAGCGCATATGTAGCGTACACTTCGAGCCCACTTGCATAGATAATGAACGTTTATGCGTGGGCGCCATGCCCACACTCCATCTGGGTCACGATGAAACAGATAATATACACAGAAGCTTCGAAGAAGTACCGACCCCGTTACGGTGCAAGCGTATCAATTTCGATTGTTGCTATCCAAATTGTGTGGAACTGCAAAAGGGCTATCAAAAAATTACCTACGAATTGCCTCACCAATTGCCACTGCGTGAAATGTGGCTGTCGTATATGGGGTTAGACCAATTAAATCAACAGCCGCTTAAGCTTTGTCCATTGCATTTGGTAATGCTGTACGAGCAGTTCCCTGGGCATTCAGCGGAAGACCAGCTGCTAACGTCTAACTATAAGGATTGTCGCAACAGCTTGCGCATACGCCTAGTTACCTGTGCTGTGCAAGGCTGCACGACTCTAAGACCAAGAGACGAATATCGCTTGCATGCACTGCCCTCACGTCTAGACTTGCTCGAGCTGTGGCTAGACAACTTGCAGCTAGCTTACTACAACAATCAGCGTTATATGTACCGAGTGTGCAGCAAACACTTCGAAGCCGATTGCATAATGGAGTCGACACGACGTCTAAAGCCTTGGAGCTTGCCTACATTGGAGCTGCCAAAGCCCCCATTACATCAGAATCCCACAGAGGAGCAGTGGCAACGTATGAATGAGCAGATATCCACATTGCAGCTATTGGCATCAAATTTCAAACTGGAACAGGTGAATGATAAGGTTCAGTTGAAGGTGCAGAAGCATGAATTGCAGGAACAGGAGGATTCACAGCTCAAACAGGAATCACAACAGCTCAAGCAGGAGTTAGAGCTTAAACAGGAGGTGCTGCTGAAGCAGGAATCACAGCCTGTTTACGACGGTGATCATGATGAACAGCAGCCATATGAAATGCAAGAGTTGGAAGTGCTCCTCGAGGTAGGGCATGTAGAGAACGTGCGAGGCTGCGATGTGACAGCGCTAGATGTGGATGACAATCTAAAGTTGCACAAGTTTCCCACAGCGATAGATGCTATGCAGAAGTGGATGCACAATACCCAAGTAGATGTAGATATTAACTTCGCTTGGCGCTTCCGCATTTGTAGCAATCATTTTGGTCCTGAATGCTTCAATGGATCGCGAATCCGACGGGGAGCCATGCCTACGTTTCACTTGGGCTCCCGACGTCCCGCGCATATTTACGATAATGAATTCAATGTTAAGCAAGAACAGGCGACAGCGAATGCCGTGGAAGAGCAGCTAGTAGAGGCTGCAGAGTCACCATCTGATATAAATCTACGGCTGCCCAGAGCGGGTCCGCCACGCAAATCCAGTAAATTCTGTCAGATCGATGGATGCTCGAATCATTTAACGAGCGAAAACTTGACACTTCACAAGTTCCCCCATTCGGCAGACATGTGCGCGAAGTGGCAACACAACACACAGGTGCCGTTTGACCCGGAGTATCGTTGGCGCTATCGTATCTGCAGCGCACACTTTGAACCCATTTGCCTAGGCAACATGCGTCTGATGCATGGAAGTGTACCCACATTAAAGCTGGGTCCGCGAGCTCCCAAACAGCTCTTTGACAATGACTTTGCAACTATTAACTTGAGGTTAGATAAAGAGAAGCGTTCCGATCTTAATTTCACTCTAAAAGAGGAACAAGTAGTACAGCAATtcgaagaggaagaggagtTAAGTATGCTTGTGCCagagttgcagttgcatgAACGTGAGgaggacgaggaggaggaagaggaaAGGGAAGATCAAGAAAATTACTTAAACTGCAATAACAATTGGACTGGGCCGAGCATTAAGCAAGAAAAGTCCAGCGACAACAGCTACTATAACCCGGTCAAATCGGGCTATGACAAGTGCTCTCTTATCCATTGTCAGCGCCAGCGTTCACAGCATGGTGTGCACATCTATAAGTTTCCACGTTCCCGTCAGCTTCAGCAACACTGGATGCATAATTTGCGTATTCAATACGACGAACGGCGTCCATGGAAGACTATGATATGCAGCGTGCACTTTGAGCCGCAGTGCATACGACTACGGAAGCTTCGTCCCTGGGCAGTACCTACTATACAGCTCGGCGACAACGTGCCTGAGCAACTCTACACGAACGAGCAGAGCCAGCAACAGATGGAAGTGGGCAGCGAATATGAGGGCGACGGAGACGATTGTGATGTGGAGAATGCTATATTGGAAGACAACGCTGATTGCAACGAAGACAATGAGCCGGAGTTGTTGCCTACAGATCCGCATTTCAAAAGTGAGCGCCGTTCACGCTGCGATCCTTTGCCTCCTGGACAATTACCACcatggaaaataaaacaatgttgTTTACCCTACTGCCGCCGACCACGAGGCGATGGCATTAAACTTTTCCGATTGCCTAACAATGTTTGTGCCATACGCAAATGGGAGCAAGCGACAGGCATGCGCTTCTATGAATCACAGCGTAACACAAAGCTTATCTGTAGTCGTCACTTTGATCCGCAGCTAATTGGTGTACGTCGACTAATGTCCAATGCGGTGCCGACAAGGAATCTTAGTCCAATTAGTCAAGAGCCGGAGCTGCCTGCAAATAGTCCTCGATGCTGCATCGCGGATTGCCAACACAATGGATTAGCCAAGCTGCACAAGTTTCCCAGTGACCCGTTGCTATTCCATCAATGGTGTCAAGCGCTAGATCTGCCGGAAGTGCAATGCTATTCTGGTGATCACATTTGTGACATTCATTTACCGGCTAATGCTTTTAATTGTCTCATCTGTGGTGTGGAAGATGTGCAGTTGCCCATGCAAGATTTCCCTGAGAATCGCAATCAGCGTGTCAAATGGTGCTATAATCTTAAAATCGAACCAATTGCCAAGTGGGACAACACTAAGCACATCTGCTCTAAACATTTTGAGAGTCATTGCTTTATACAACCGGGTCACCTGCTCCCGGATGCAATGCCCACGTTGCATTTGACGCACAATGATAACAATATATTTGTCAATGAGAATTTTATAAACAAGAGTAAGATGCTCCGTATAAAAGATGAGCCCGTGGAGAGTGATGATCTGATGCTATAA
Protein Sequence: MSQHNQPHSHSHQHQQQHLHYYQQQQQQHHLQQQQHQQHQHLQHKQIQQQHSWYSHVASYPPQQPHPYATPCKSSNNNNHNSNNIMNSYGTGGTHYYGGATATAAAGVGYNLEANTVAYAHNQLLQYQQQQQQQQQPQELNERSYVPHNIMHNSYPYIKSEPLEMPDDRHRHQQHQSQQPQPHIQNHFQNPMAPPPAPASNHHTLDASGEMIIKSEPIDEHAYKSNYIDDNTPFADFSKFPEFGDEMMSPKVELTEKDDAYGSQKSLLSFPRRKLQMERSSESLPICQRCKEVFFKKQIYLRHVAESSCSIHEYDYKCNICPMSFMGVEELQKHKQLHRADKFFCHKYCGKHFDNIADCESHEYMQHDYDSFVCNMCSVSFSTRDQLYAHLPQHKFQQRYDCPICRLWYQTALELHEHRLAAPYFCGKYYATTQQLQPQQLSEHSNYKLQDCHMGIIEMTAPQHKTNSLPATAALSSLLQQHQVNADGGTSLFASSLKNEPSVKLERSYSNSTSESGYSMHESSGYNNAFGSDNSMHGSVVMGGPQAHSSTLDDSEDALCCVPLCGVRKSTSPTLQFFTFPKDEKYLHQWLHNLKMFHIPASSYSSFRICSMHFPKRCINRYSLCYWAVPTFNLGHDDVANLYQNRELTNTFTTGEVARCSMPNCTSQRGESNLKFYNFPKDIKSLIKWCQNARLPVQAKEPRHFCSRHFEERCIGKFRLKPWAVPTLHLGAQYGKIHDNPKNLYVEEKRCCLNFCRRSRSSDFNMSLYRFPRDEVLLRRWCYNLRLDPAVYRGKNHKICSAHFIKEALGLRKLSPGAVPTLHLGHNDTFNIYENELWPPPTPSTPTHHNNHQQQQLQQHQVQQQLVHHKYPRHSAASTSSSASSTSHYVDPEVSASYMAMGMGAGASSSGLLNVSDSMDVCCVPSCESKRHNNENITFHTIPRRPEQMRKWCHNLRIPEDKMHKGMRICSLHFEPYCIGGCMRPFAVPTLHLGHDEEDIHRNPDVIKKLNIRETCCVSVCKRNRDRDHANLHRFPSNVTLLTKWCANLQRTVPDGIKLFNDAICEVHFEERCLRNKRLEKWAVPTLLLGHENIPYPLPTPEQVAEFYARPCAPNNGEEQGECCVETCKRNPSVDDIKLYRPPEESQVLTKWAHNLQIDIAQLPAMRICNLHFESHCIGKRMRPWAIPTLNLASNIENLHENPEQQMLYKRRTSHLSMQRDGTDGSVIKPTWVPRCCLPHCRKVRALHNVQLYRFPKLNRATLAKWAHNLQVPMAGSAQRRLCSAHFEPHVLSKKCPVPLAVPTLDLNTPPGYKIYQNPAKIKANKLCMQRVCIVESCRRQRGQGVQLFRLPHNPTQLRKWMHNIRTRPRFGMRQQYRICSLHFETHSFNGRRLSTGAIPTLELGHQDDDIYPNEAQAFVEERCAIEGCDASKEQADVRLFRFPNDDEDLLWKWCNNLKMNPVDCIGMRICNRHFDPDCIGAKQLYKWAIPTLMLGHDDVEIELILNPKPEDRNVDPVFKCCVPTCGKTRKFDEAQMNSFPKDPILFQCWRHNLRLEHLNFKERERYKICNAHFEEICIGKTRLNIGSIPTLELGHDETKDLYRVNPYELQTNLFGRQRRVSIKQDSNEHFTRQVKLNRSQPALKCCVASCVRSRLDNGARLFPFPTGKQQKNKWRHNLRLKASEINVMTRICSAHFNRRCINGKQLRGWAMPTQELGHEDTNIHDNPKNIPGFFTPTCALAHCRKRRSIDNDLRTYRYPRSEELLEKWRVNLRLAPDQCRGRICADHFEPLVRGKLKLKTGAVPTLKLGHDEGVVYDNEAIKAGMQQEEEEQDVGEAANSLESRAIRDNEHKEEDQYMENEQTEQQEDEEEDQDKDEDDHQDQGFFDPLELVETFAEQHSEDEQLYNDEDDDVDDNEDEEDIPGDDDELLLPDTLPVQLPFPPRREKKEKAVNNVTPICCLKHCRKERTATHQLSTFGFPKDQKQLVKWSANLQLELSDCVGRVCIEHFEAEMLGTRKLKQNAVPTLNLGHTKPLSYRCNGQVAGVLDAQPQQQSVFRLWSLKHCRKRKTLPTNTQSVTAMMTKRGCCLPSCGKQRELHGVQLRRMPRERLLLRKWLHNLKLPSNINTSNAYVCEEHFEEQAMLPTLQLGHTDVNIYRNSNNLIVANGCLVPSCSCARLNLYRSYALPEHPQVQEAWLKWLQLPPRSPNLSSHTQLCVMHYMQLFEQVPLPEQLPEMVLCELRETYDHIANSTRALALRCAVPGCQTKYTDNVRLTRFPICQRTRDQWLHNTKIEYDPERDYLYRICMRHFEPHCLGAVRPRQWAVPTLHLNHNDQDIYKNVKLEDNALGIATQQGVPLEMPLRIKTELPHLLSLSPTASASPSPRGKLRTCCIPSCGQQANSVTRLFRFPSDETMLLKWLVNTQQQPRFVDAQYLFICLEHFERKVIIKNHVRSWAVPTLKLGHKGRIIPNARHNGNIADVQRHKRAMKYIRANFCSVLTCFQQRSANLRLFAYPRDRLNIRRWAANCKHRSMQAINDGFQICQSHFAPDCFDPESRQLKENAVPTLELSRPFYQMRCLVNGCVKDEDALRRRLFKMPKRTSQLEDWCHNLRIDPSSITGQEPHVCERHFEAHCFNASKFLRQGARPTLHLGHENQFDVLPNPVKWEEDAHACFVPSCGRSKDADNVQLFGLPKLKVLREKWLQNFRLDPSKELLHAQRICSVHFEPTCIDNERLCVGAMPTLHLGHDETDNIHRSFEEVPTPLRCKRINFDCCYPNCVELQKGYQKITYELPHQLPLREMWLSYMGLDQLNQQPLKLCPLHLVMLYEQFPGHSAEDQLLTSNYKDCRNSLRIRLVTCAVQGCTTLRPRDEYRLHALPSRLDLLELWLDNLQLAYYNNQRYMYRVCSKHFEADCIMESTRRLKPWSLPTLELPKPPLHQNPTEEQWQRMNEQISTLQLLASNFKLEQVNDKVQLKVQKHELQEQEDSQLKQESQQLKQELELKQEVLLKQESQPVYDGDHDEQQPYEMQELEVLLEVGHVENVRGCDVTALDVDDNLKLHKFPTAIDAMQKWMHNTQVDVDINFAWRFRICSNHFGPECFNGSRIRRGAMPTFHLGSRRPAHIYDNEFNVKQEQATANAVEEQLVEAAESPSDINLRLPRAGPPRKSSKFCQIDGCSNHLTSENLTLHKFPHSADMCAKWQHNTQVPFDPEYRWRYRICSAHFEPICLGNMRLMHGSVPTLKLGPRAPKQLFDNDFATINLRLDKEKRSDLNFTLKEEQVVQQFEEEEELSMLVPELQLHEREEDEEEEEEREDQENYLNCNNNWTGPSIKQEKSSDNSYYNPVKSGYDKCSLIHCQRQRSQHGVHIYKFPRSRQLQQHWMHNLRIQYDERRPWKTMICSVHFEPQCIRLRKLRPWAVPTIQLGDNVPEQLYTNEQSQQQMEVGSEYEGDGDDCDVENAILEDNADCNEDNEPELLPTDPHFKSERRSRCDPLPPGQLPPWKIKQCCLPYCRRPRGDGIKLFRLPNNVCAIRKWEQATGMRFYESQRNTKLICSRHFDPQLIGVRRLMSNAVPTRNLSPISQEPELPANSPRCCIADCQHNGLAKLHKFPSDPLLFHQWCQALDLPEVQCYSGDHICDIHLPANAFNCLICGVEDVQLPMQDFPENRNQRVKWCYNLKIEPIAKWDNTKHICSKHFESHCFIQPGHLLPDAMPTLHLTHNDNNIFVNENFINKSKMLRIKDEPVESDDLML

Similar Transcription Factors

Sequence clustering based on sequence similarity using MMseqs2

100% Identity: iTF_00519952;
90% Identity: -
80% Identity: -