Basic Information

Insect: Drosophila rubida
Gene Symbol: -
Assembly: GCA_035046165.1
Location: JAWNOF010000014.1:13216841-13231392[-]

Transcription Factor Domain

TF Family: THAP
Domain: THAP domain
PFAM: PF05485
TF Group: Zinc-Coordinating Group
Description: The THAP domain is a putative DNA-binding domain (DBD) and probably also binds a zinc ion. It features the conserved C2CH architecture (consensus sequence: Cys - 2-4 residues - Cys - 35-50 residues - Cys - 2 residues - His). Other universal features include the location of the domain at the N-termini of proteins, its size of about 90 residues, a C-terminal AVPTIF box and several other conserved residues. Orthologues of the human THAP domain have been identified in other vertebrates and probably worms and flies, but not in other eukaryotes or any prokaryotes [1].
Hmmscan Out: # of c-Evalue i-Evalue score bias hmm coord from hmm coord to ali coord from ali coord to env coord from env coord to acc

1 30 8 1.5e+04 -10.1 6.5 55 75 26 42 11 54 0.39

2 30 8 1.5e+04 -6.2 3.6 24 58 186 214 179 228 0.50

3 30 4.1e-15 7.9e-12 45.6 4.3 1 86 603 675 603 676 0.85

4 30 2.5e-15 4.9e-12 46.2 4.6 1 87 703 772 703 772 0.83

5 30 5.5e-16 1.1e-12 48.4 0.4 1 87 794 866 794 866 0.84

6 30 5.5e-16 1.1e-12 48.4 5.2 1 86 969 1038 969 1039 0.82

7 30 5.4e-15 1e-11 45.2 3.2 1 86 1063 1134 1063 1135 0.82

8 30 8.3e-13 1.6e-09 38.2 0.8 1 87 1170 1238 1170 1238 0.81

9 30 8.7e-11 1.7e-07 31.7 1.4 1 86 1283 1352 1283 1353 0.76

10 30 2.8e-16 5.4e-13 49.3 0.1 1 86 1380 1449 1380 1450 0.83

11 30 1.1e-12 2.1e-09 37.8 1.8 1 87 1471 1541 1471 1541 0.81

12 30 5.7e-15 1.1e-11 45.1 1.9 1 86 1568 1639 1568 1640 0.85

13 30 4.1e-13 7.9e-10 39.2 2.8 1 85 1707 1775 1707 1777 0.81

14 30 2.1e-12 4e-09 36.9 0.1 1 86 1800 1868 1800 1869 0.81

15 30 6.8e-14 1.3e-10 41.7 1.2 1 87 2018 2087 2018 2087 0.80

16 30 1.5e-12 2.9e-09 37.3 0.1 1 86 2162 2227 2162 2230 0.79

17 30 0.032 61 4.2 0.0 1 58 2256 2306 2256 2321 0.75

18 30 5.9e-12 1.1e-08 35.5 0.6 1 86 2345 2414 2345 2415 0.83

19 30 3.1e-15 6e-12 45.9 2.2 1 86 2481 2550 2481 2551 0.83

20 30 1.5e-12 2.9e-09 37.4 1.0 1 86 2586 2657 2586 2658 0.81

21 30 2.7e-13 5.2e-10 39.7 0.5 1 87 2668 2740 2668 2740 0.82

22 30 1.9e-14 3.7e-11 43.4 0.0 1 86 2769 2842 2769 2843 0.79

23 30 0.00021 0.41 11.2 0.0 1 58 2876 2926 2876 2946 0.81

24 30 1.1e-14 2.1e-11 44.2 0.1 1 86 2965 3037 2965 3038 0.80

25 30 1.7e-14 3.3e-11 43.6 0.4 1 86 3204 3276 3204 3277 0.85

26 30 1.4e-13 2.6e-10 40.7 1.7 1 86 3334 3404 3334 3405 0.81

27 30 5.6e-13 1.1e-09 38.7 5.2 1 86 3506 3576 3506 3577 0.85

28 30 4.5e-13 8.6e-10 39.0 0.0 1 87 3654 3724 3654 3724 0.85

29 30 6.1e-10 1.2e-06 29.0 1.1 1 58 3743 3792 3743 3807 0.82

30 30 2.2e-10 4.2e-07 30.4 0.6 18 87 3809 3867 3799 3867 0.74

#	of	c-Evalue	i-Evalue	score	bias	hmm coord from	hmm coord to	ali coord from	ali coord to	env coord from	env coord to	acc
1	30	8	1.5e+04	-10.1	6.5	55	75	26	42	11	54	0.39
2	30	8	1.5e+04	-6.2	3.6	24	58	186	214	179	228	0.50
3	30	4.1e-15	7.9e-12	45.6	4.3	1	86	603	675	603	676	0.85
4	30	2.5e-15	4.9e-12	46.2	4.6	1	87	703	772	703	772	0.83
5	30	5.5e-16	1.1e-12	48.4	0.4	1	87	794	866	794	866	0.84
6	30	5.5e-16	1.1e-12	48.4	5.2	1	86	969	1038	969	1039	0.82
7	30	5.4e-15	1e-11	45.2	3.2	1	86	1063	1134	1063	1135	0.82
8	30	8.3e-13	1.6e-09	38.2	0.8	1	87	1170	1238	1170	1238	0.81
9	30	8.7e-11	1.7e-07	31.7	1.4	1	86	1283	1352	1283	1353	0.76
10	30	2.8e-16	5.4e-13	49.3	0.1	1	86	1380	1449	1380	1450	0.83
11	30	1.1e-12	2.1e-09	37.8	1.8	1	87	1471	1541	1471	1541	0.81
12	30	5.7e-15	1.1e-11	45.1	1.9	1	86	1568	1639	1568	1640	0.85
13	30	4.1e-13	7.9e-10	39.2	2.8	1	85	1707	1775	1707	1777	0.81
14	30	2.1e-12	4e-09	36.9	0.1	1	86	1800	1868	1800	1869	0.81
15	30	6.8e-14	1.3e-10	41.7	1.2	1	87	2018	2087	2018	2087	0.80
16	30	1.5e-12	2.9e-09	37.3	0.1	1	86	2162	2227	2162	2230	0.79
17	30	0.032	61	4.2	0.0	1	58	2256	2306	2256	2321	0.75
18	30	5.9e-12	1.1e-08	35.5	0.6	1	86	2345	2414	2345	2415	0.83
19	30	3.1e-15	6e-12	45.9	2.2	1	86	2481	2550	2481	2551	0.83
20	30	1.5e-12	2.9e-09	37.4	1.0	1	86	2586	2657	2586	2658	0.81
21	30	2.7e-13	5.2e-10	39.7	0.5	1	87	2668	2740	2668	2740	0.82
22	30	1.9e-14	3.7e-11	43.4	0.0	1	86	2769	2842	2769	2843	0.79
23	30	0.00021	0.41	11.2	0.0	1	58	2876	2926	2876	2946	0.81
24	30	1.1e-14	2.1e-11	44.2	0.1	1	86	2965	3037	2965	3038	0.80
25	30	1.7e-14	3.3e-11	43.6	0.4	1	86	3204	3276	3204	3277	0.85
26	30	1.4e-13	2.6e-10	40.7	1.7	1	86	3334	3404	3334	3405	0.81
27	30	5.6e-13	1.1e-09	38.7	5.2	1	86	3506	3576	3506	3577	0.85
28	30	4.5e-13	8.6e-10	39.0	0.0	1	87	3654	3724	3654	3724	0.85
29	30	6.1e-10	1.2e-06	29.0	1.1	1	58	3743	3792	3743	3807	0.82
30	30	2.2e-10	4.2e-07	30.4	0.6	18	87	3809	3867	3799	3867	0.74

Sequence Information

Coding Sequence: ATGTCACAACATAACAATCCCCCTCCGCATCATCATCACTactaccagcaacagcagcagcaacagcaactacaacaacatcaccaccaccatcaacaacaacaacaacatcaccagcagcagcagcagcagctacaacataaacaaatacagcagcaacacagtTGGTACTCACATGTTGCTTCCTACCCGCCCCACCATCCGCATGCCGCCGCAGCGTTTGCGACGCCCTGCAaagccaccaacaacaacaataacaacaacaacagcattatGAATGCATACGGCACAGGAGTTGTTGCAAGTGGCACGCAGGCAACATATTATGGggctgcagctggtggtggGGTGGGATATAACCTTGAGGCCAATACTGTTGCCTATGCGCAcaaccagctgctgcagtaccagcaacaacaacagcagcatcatcagcagcaacaacaacaacaccagctcAGTCAGCGCTCTTATATGTCGCATGGAGTAATGCACAGCTCTTATCCCTACATCAAGAGCGAGCCTTTGGAGTTACCGGATGATAGACAACgtcagccacaacaacaacagcagcagcagcatcatcaacaacaacaacaacaccaccagcaacaacagcagcagcagcaacaacaacatttccAAAATCCTatggcgccgccgccagctCCCGCCAATCGTCACAGTCTCGATGCCAGCGGCGAGatgataataaaatCGGAACCTATTGACGAACATGCCTACAAGTCCAACTATATCGATGATAATACACCCTTTGTCGACTTTAGTAAATATCCGGAATTCGGCGACGATATGTTGAGTCCCAAGGTGGAGCTAACCGTCAAGGATGAGGCCTATGGCAGTCAGAAAAACCCGCTTAGTTATCCGCGGCGCAAGCTGCAGTCGGATCGTTCATCGGAAAGTCTTCCCATTTGCCAGCGTTGCAAGGAGGTGTTCTTCAAAAGACCCATCTACTTGCGGCATGTGGCTGAGAGCAGTTGCAACATACAGGAGTATGACTTCAAGTGCAACCTCTGCACCATGTCTTTCATGACCAACGATGAGCTGCAGAAGCACAAGCATCTACACAGAGCGGACAAGTTCTTCTGCCACAAATACTGTGGCAAGTACTTTGACACGATTGCCGAATGCGAATCGCATGAATACATGCaacatgaatatgaaaatttcGTGTGCAACATGTGTTCCATGACATTTGCCACACGGGAACAACTCTATGCTCATTTGCCGCAGCACAAATTCCAGCAGCGTTACGATTGTCCCATTTGCCGCTTGTGGTATCAAACAGCTTTGGAGTTGCACGAACATCGTCTAGCGGCGCCGTACTTCTGTGGCAAGTATTATGCACCCGCTCAATCGGCAactcaccagcagcagcagcagcagcaacattcacagcatcaacatcaggCCAACTACAAACTGCAGGACTGTCATATGGGCACCATGGAAATGCCAACGTCGCAGCACAAGGcaaatacagcagcagcagtcaacgTATtaccggcaacagcagcgctcAGTTCGTTGTTGCACCAACGTCAAGCGAATGCCGATGGTGCCGCATTGTTCGCCTCAACGCTGAAGAACGAGGCGAACGTGAAGCTGGAGCGGAGCTATAGCAATTCAACGAGCGAGTCTGGTTACAGTCTGCAcgacagcagctacaacaatgcCTACGGCAGCGATACCTCGATACATGCGTCAGCTGGAGGAGGAACTGGTGGCGCGATTGGCGGTCCGCAGGCGCACTCCTCGACGCTGGACGATTCTGAGGATGCACTCTGCTGTGTGCCGTTGTGTGGCGTGCGCAAGAGCACTAGCCCAACGCTGCAGTTCTTCACGTTCCCCAAGGATGAGAAGTATCTGCATCAGTGGCTGCATAACCTCAAGATGTTTCACATTCCGGCATCGAGTTATGCGAGCTTTCGCATCTGCAGCATGCACTTTCCGAAGCGTTGCATCAACCGCTATTCGTTGTGCTATTGGGCCGTGCCCACATTCAATCTGGGCCACGACGATGTCGCCAATTTGTATCAGAATCGCGAGCTGACCAACACCTTTACCACCGGCGAAGTGGCACGCTGCAGCATGCCCAACTGCACCAGCCAGCGGGGCGAGAGCAATCTCAAGTTCTACAATTTTCCCAAGGACATCAAGAGCCTGATCAAATGGTGCCAGAATGCCCGTCTCCCCGTCCAGGCCAAGGAGCCGCGTCACTTCTGCAGTCGTCACTTTGAGGAGCGCTGCATTGGCAAGTTCCGACTGAAACCCTGGGCAGTGCCCACTTTACATTTGGGCGCACAGTACGGCAAGATCCATGACAATCCCAAGAATCTGTATGTGGAGGAGAAGCGTTGCTGCCTTAACTTttgtcgtcgcagtcgctcgTCCGACTTCAATATGTCGCTGTATCGCTTTCCGCGGGATGAGGTGCTCCTTCGACGCTGGTGCTATAATCTGCGACTCGATCCATCCGTCTACCGTGGCAAGAACCACAAAATATGCAGCGCTCACTTTATCAAAGAGGCTTTGGGACTGCGCAAACTCTCGCCGGGTGCTGTTCCCACGTTGCACCTGGGACACAACGACACATTCAACATCTACGAGAATGAGCTGTGGCCACCGCCGACGCCCTCCACGCCCGCCAatcaccaccagcagcagctgcagcagcaccagctgcaacaacaccagcaacagcagccacatcaacaGCATCACAGCCACCACAAATACCAGCGTCACTCGGCGGCATCGACGTCTTCTTCAGCCAGCTCATCGCACTATGTGGATGCTGGCGACATGAGTGGATCGTACATGGGCATGGGCAACTCGGGCGGCTCCTCGTCCGGCCTGAATGTGAGCGACAGCATGGACGTGTGCTGTGTGCCCAGCTGCGAGAGCAAGCGgcacaacaacgagaacatcACATTCCACACGATACCCAGGCGGCCCGAGCAGATGCGCAAGTGGTGCCATAATCTGAAGATACCCGAGGACAAGATGCACAAGGGCATGCGCATCTGCAGCCTGCACTTTGAGCCCTATTGCATTGGCGGCTGCATGCGTCCGTTTGCCGTGCCCACGCTGCAGCTGGGCCACGACGACGAGGACATTCATCGCAATCCGGATGTAATCAAGAAGCTAAACATCAGGGAGACCTGCTGTGTGGCTGTCTGCAAACGCAATCGCGATCGGGATCACGCCAATCTGCATCGCTTCCCCAGCAATGTGGCGCTGCTGACCAAGTGGTGTGCCAACCTGCAGCGTCCAGTGCCAGATGGCAGCAAGCTCTTCAACGACGCCATCTGCGAGGTGCACTTCGAGGACCGCTGTCTGCGCAACAAGCGGCTGGAAAAGTGGGCAGTGCCCACCTTGATACTCGGCCACGAGAACATCGCCTATCCGCTGCCCACGCCCGAGCAGGTGGCCGAGTTCTATGCTCGACCCAGCGCACCCAACAATGGCGAGGAGCAGGGCGAGTGCTGTGTGGAGACCTGCAAGCGTAATCCCAGCGTCGACGACATTAAACTCTATCGGCCGCCCGAGGAGTCGCAGATGCTGGCCAAGTGGGCGCACAACCTGGAGGTGGATGCGGCCAAGTTGACTAGTTTGCGGATCTGCAATCTGCACTTCGAGGCGCACTGCATCGGCAAGCGCATGCGGCCCTGGGCCATACCCACGCTTAATCTGGCCACGACCGTTGAGAATCTCTATGAGAATCCCGAGCATCAGATGCTCTACAAGCGACGCACGCATCTCAATGCGAATCGTGGCGCAGCACACGAGGCGGGCGGCGTGAAGCCAACCTGGGTGCCGCGCTGTTGCCTGCCGCATTGCCGCAAGGTGCGTGCGCTGCACAATGTGCAGCTGTATCGCTTCCCCAAGCTCAATCGCTCCACGCTGGCCAAGTGGGCGCACAATCTGCAAGTGCCGCTGGTGGGCAGCGCTCAGCGACGCCTCTGCTCCGCGCACTTTGAGCCACACGTGCTCAGCAAGAAGTGCCCGGTGCCGTTGGCCGTGCCTACGTTGGACCTGAACTCGCCACCCGGCTACAAGATCTACCAGAATCCCGCCAAGCTCAAGGCCAACAAACTCTGCCTGCAGCGCGTCTGCATCGTGGAGAGTTGTCGCCGCCAACGCGGCCAGGGCGTGCAGCTCTTCCGGCTGCCACACAATCCCACGCAGCTGCGCAAGTGGATGCACAACATAAGGATGCGACCCAGAGGCGCCATGCGGCAGCAGTATCGCATGTGCTCTGTGCACTTCGAGACGCACTCCTTCAATGGCAAGCGGCTGAGTGCGGGCGCAATTCCAACGCTGGAGCTGGGTCACGATGATGACGACATCTATCCGAACGAGGCGCAGTCGTTTGTCGAGGAGCACTGCACCGTCGAGGGCTGTGAGGCGTCCAAGGAGCAGCCCGAGGTGCGTCTCTTCCGCTTCCCCACCGACGACGAGGACCTGCTGTGGAAGTGGTGCAACAACCTCAAGATGAATCCCGTGGACTGCATTGGTGTGCGCATCTGCAACAAGCACTTCGAGCCGGACTGCATCGGGCCCAAGCATCTGTACAAATGGGCGCTGCCCACAATGCATCTGGGCCACGACGATGAGGAGATCGAGCTAATCGACAACCCCAAGCCCGAGGAACGCTATGTGGACCCGGTGTTCAAGTGCTGTGTGCCGACGTGCGGCAAGACGCGCAAGTTCGATGAAGTGCAGATGAACAGCTTTCCCAAGGATCCCAGCATGTTTCAGCGCTGGCGTCACAATCTGCGGCTGGAGCATCTCAACTTCAAGGAGCGCGAACGCTACAAGATTTGCAATGCCCACTTCGAGGACATTTGCATTGGGAAGACACGGCTCAACATTGGCTCGATACCCACGCTGGAGCTGGGGCATGAGGAGACGGAGGATCTGTTCCAGGTGAATCCCGAGGAGCTGCAAAGCAATCTCTTTGGACGCCAACGACGTGTAAACTCAGCGCTGGGCATCAGCATCAAGCAGGAGAACTCGGAGCTCGACGATGACATGAAGCCGGACAACAATACCTCGTTGGTGAAGAAGAAACGCCCGCTGCCGGATTACAAGTGCTGTGTGCCCGACTGTGGCCGCAGCCGCCTCGAGCACGGCGCCCGCCTGTTTCCCTTCCCTaacggcaagcagcagcagagcaagtGGCGCCACAATCTGCGCCTGCAGCCGCATGAGGTGGATCGCAGCACACGCGTCTGCAGCGCACACTTCAATCGTCGATGCATCGACGGCAAGCAGCTGCGCGGCTGGTCCATGCCCACCCAGCAGCTGGGCCACCAGGAGCTGCCCATCTATGAGAATCCAAAGAATATACCGGGCTTCTTCACGCCCACCTGTGCACTGGCGCATTGTCGTCGGCGACGCAGCATTGACAACGATCTGCGCACTTATCGCTATCCGCGCAGCGAGGAGCTGCTCGAGAAGTGGCGCGTCAATCTGCGCTTGGCACCGGATCAGTGTCGCGGTCGCATTTGCGCCGATCACTTTGAGCCCATGGTGCGCggcaagctgaagctgaagacAGGCGCAGTGCCCACATTGAAGCTGGGCCACAGTGAAGGTGTGGTGTTTGACAACGAGGCTATCAAGGCGGGCCTGCAGCAGGAGGCAGAGGAGGGCGGAGATCACGAGACCAGCATGGAATCGCTGGTGAAAGTGAAGCAGGAGAAGCTTGATCCGGACGAAGAGCCAGCTGACCATGCGGAGCAGGAGCCAGAacaggacgaggacgatgagCAGGCGGATCATGGCTACTTTGATCCGCTGGAGCTAGTCGAGACCTTTGCGGAGCAGCACAGCGCCGAAGAAGACGAGGAAGACAATGAACACGGTctcgacgacaacgacgacgacgatgaggacgaaGATGAGGATGAAcccggcgacgacgacgagctgctgctgccggacaCGCCGCCGGTGAAGCGGCGTGCGCCTCTGGTGTTGCGGACGCGACGCGAGAAGGCCGTGAACAACGTGACGCCCATATGCTGCCTGAAGCACTGTCGCAAGGAGCGCACAGCCAGCCACCAGCTGAGCACCTTTGGCTTTCCCAAGgatcgccagcagctgctcaaatgGAGCGCCAATCTGCAGCTCTCGCTCGACGATTGCGTGGGACGCGTCTGCATCGAGCACTTCGAGTCGGAGATGCTGGGCACCCGCAAGCTGAAGCAGCACGCGGTGCCCACGCTGAATCTGGGACATGCGACGCCGCTCAGCTACAGCTGCAATGGCCAGACGTTGAGCATCTACGATGCGCAGCCGCAGCATTCGGTTTTTCGGCTTTGGAGCCTGAAACATTGCCGCAAACGGAAGCATCCAACGGAGCCGCCGGACCAGCAGAAGAAACAGCTGGATCAAGCAGCGACAGTGAtagcgacgacggcgacagcgacaccgaCGACGACTAAGCGACGCTGCTGCCTGCCCAGCTGCGGCAAGCAGCCGGAGCTGCACGGcgtccagctgcagcgtctgccCAGCAATCGCATACAGCTGCGTAAGTGGCTGCACAACCTAAAGTTATCACCGATGCTGGACAGCAGCCAGGCACGTATCTGCAGCGAACACTTCGagccggagcagcagcacgtCGAGGAGGCGGTGCCCACTCTGCGACTCGGCCACGACGACCCGCACATCTATCGCAATCGTGGCAGTGcgaacagcggcagcattgcCGCCTCCACGTCGAGCGCCTGCTTGGTGGCCAGCTGTCCCTGCGCGCGCCTCAATCTCTATCGCTGCTACGACCTGCCCGAGCACCGGCTGGTGCAGCAGGCGTGGCTgcagtggctgcagctgccgctgccgcagcaggCCAGCGACGGCAAGCTGTGCGTCATGCACTACATGCAGCTGTACGAGCAGGTGCCGCTGCCCGAGGAGCTGCCGGGCTCagtgctgcggcagctgcaggagACTTATGATCTCATTGCCGGCTCCACGATGGCCATGAAGCTGCGCTGCGCGGTGCCCGGCTGCTACTCGAAGTACACGGACAACATACGGCTGACGAAGCTGCCCATGTGCGCTGAGATGTGCGCCAAGTGGGTGCACAACACCAAGATCAGCTACGATGCCACGCGTCACTACGTCTACCGCATCTGCATGCTGCACTTCGAGTCGCGCTGCCTCGGCCCCGTGCGTCCCAAACTGTGGGCGGTGCCCACGCTGCAGTTGAACCACCAGGACGCGAGCATCTATCAGAATCCCAAGCTGGACGGGCAGTCCACGCCGACGTCCGCCCCGGTGCCCGTGGCCATGTCCGCCTCGGTGCCCGtggagctgccgctgcgcatCAAGACGGAGCTGGTGTGCAGCGGCAGCCCCAGCGCCAGTGCGAGTCCCAGTCCGCGCGGCAAGCTGCGCTTCTGCTGCATTCCCAATTGCCTGCAGCAGGCCACGTCGCAGACGCGACTGTTTCGCTTCCCCAGCGCCGAGACGACGCTGCTCAAGTGGCTGGtgaacacacaacaacagccgcgACTGGTGGACACGCAGCAGCTCTTCATTTGCCAGGATCACTTCGAGGCGGAGGCCATCTGCAAGAAACAGCTGCGCAGCTGGGCGGTGCCCACGCTGAAGCTGGGCCACGACGGCCACGTCATACCGAATGCCAGGCACAACGGCAACATTGCCGACAGCCAGGAGAACAGACAGACGCTGCAGTACATCTGGGAGAACTACTGCTCCGTGCTGAGCTGCTTCCAGCcgcgcagcgagcagctgcgtcTCTACGCCTATCCCACGGACCGACCCACCATTCGCAAGTGGGCGGCCAACTGCAAGCATCGCTCCATGCAGGCCAGCAGCGATGGCTTCCAGGTCTGCCAGTCGCACTTTGCGCCGCACTGCTTTGACCAGGAGACTGGCGAGTTGCGGGAGGATGCGGTGCCGACGCTGGAGCTGAGTCGCTGTCTCAACGACATGCgttgcgtcgtcgtcggctgcgTGAAGGACGAGGATGGGCCGCGTCAACGCTTCTACAAGATGCCCAAGCGCAGTGCTCAGCTGCTCAGCTGGTGCCACAATCTGCGCCTGGATGCGGCCGCCATGAGCAGTGGGGAGCATCACGTCTGCGATCGTCACTTCGAGGCGCAGTGCATCAATCAGCAGAAACTGCTGCGACCCGGCGCACGTCCCACGCTTCACTTGGGTCACGACACAGCCATTGACCTGATGCCCAATCCAGCCGAGTGGGATGCGCCAGACACGACGCCCGCTGTCGACCTGGTGTGCTGTGTGCCCAAGTGCGCACTAAGCCGCGATGAGGACGAGGATGTGCAGCTGTTTGCCTTCCCCAAGCTGCGAATGCTCGCGGAGAAGTGGCTGCAGAACATACGCCTCGAGCATCTCGGTCGCGAGCAACTGCTGCGCCTGCGCATCTGCAGTGCACACTTCGATCCCGGCTGCCTGGAGAGCAACGGGCGTCCGCAGCTGGGCGCTATGCCCACGCTGCAGCTGGGCCACGAGGAGCGCGCCAACTTACATCGCAGCACCGATGCTGCCGCCGTCAAGGCGAAGAAGTTCTGCAATCGCAGTGGCTCCAGCTACGACTGCTGCTATCCACAGTGCGTGGAGCTGCAGAAGAGCTACCTGCGAATTAGCTACGAGCTGCCGCAGTCGGAGGCGCTGCGTCTCAGGTGGCTGGAGTACATGGGCGTTGCGGAGAAGGAGGAGAAGCCGCTCAAGCTGTGCCCGCTGCACTTGGTGCTGCTCTACGACCACAGCGTGGAGCACTTTGCAGCGGAACACACgcccgagcagctgctggacgcCAACTACGAGGACGCCCGCAACAGTGTGCGCTTGCGTGTCATCAGCTGTGCCGTGCCCGGCTGCCGCACACTGAAGCCGCGCGATGGCGGCATACTGCATGGTCTGCCGCAGCGTCGCGATGTGCTCGAGATGTGGCTGCACAACATGCAGCTGGTATtctacgagcagcagcgctaCATGTACAAGATCTGCAGCAAACACTTTGAGCCCAGCTGCTTCATGGACACCACGCGGCGCCTAAAGCCCTGGACTATGCCGACGCTGGAGCTGCCGGCGCGTGCGGCAGACGAGGCGCCCATTTACCCCAATCCCAGCGAGTCGGAGTGGCAGCGCATGAACGAGCTGCTGGCCgcagagcaactgcagctgcagcagcagcaacagcagctggaacaGCAGGAGGAACAGCCAGAGGATTTGTGTAACTTGTTGGAGCCCATTGTGAAGATGGAGCACATCGAgcgcgacgaggaggaggaggagtatGCAGAACAGCAAGAGCACGAGCTGCAGCCCGACATCGACCgcgactacgacaacgacaactcaCAGCAACCGCTGGCGCTGGAGGTGCTGCTCGAGGTGGGCCATGTGGAGAAGTGCACCACGTACGAGCAGATGGACAACGAGGCGAACCTGGGCtacgccgagcagcagcaacagcagctgctgcacagcaaCGAAGCACAGCCACGTCCTGCGTACAACGCAGCTGGCAGTGGCCAGCTGGCAAGCAACGGTTTCAAGTACACGGCGCGCCACTGCAGCGTGCGTGGCTGCGATGTGACGGCCAACGATGTGAATGGCAGCATTAAGCTGCACAAGTTCCCCACCTCGCTGGACGCCATGGAGAAGTGGAAGCACAACACGCAGGTGGATGTGGACGTGAATTTCTCGTGGCGCTTTCGCATCTGCAGCTATCACTTCACCGACGAATGCTTTCACGGGGCGCGCATCAAGCGTGGTGCGATGCCAACGCTGAGCTTGGGCCCACGACGGCCGGCCAAGATCTACGACAATGAGTTCAacgcgtcgctgccgctggaACAGGAACCGGAGGCGAGTGACGAGCAGCTGCCGAAGCATACGAAAGGCGGCGAGATTAGTCTGCGTTTGCCGGAGCCAGCGCCGCCGCGCAAGTCGAGCAAGTTCTGTCAGATTGATGGCTGCCCGAACCATCTGACTAGTGAGAACCTGACGCTGCACAAGTTTCCGCATTCCGTGGACATGTGCGCCAAGTGGCAGCACAACACGCAGGTGCCCTTCGATCCGGACTATCGCTGGCGTTATCGCATCTGCAGCGCCCACTTTGAGCCCATCTGTCTGATGAATATGCGGCTGATGCATGGCAGTGTGCCCACCTTGAAGCTGGGACCGCGTGCGCCGCGCCAGCTCTTCGATAGTGACTTTGAGGCCATCAACTTGCGCCTGGACAAGCATAAGAGCAGCtctgagcagcagctgtccaTCAAGCAGGAGCacgacgaggatgaggacgaCGAGGCGGAGCTGAGCTATCTGGTGCCCGAGATGCAGCTGCACGAGGACACACACCAGCTGCAGGAGACGCCGAGCAGCTGGAAGGAACAGCGCCTGCCCAACATcaagcaggaggagcaggacCAGTCGCAGACCACCTACAATCCGGTCAAGTCGGGCTACGACAAGTGCTCGCTGGTGCACTGCCAGCGTCAGCGTTCGCAGCACGGCGTGCACATCTACAAGTTTCCACGCTcccgccagctgcagcagcactgGATGCACAATCTACGCATCAAGTACGACGAGCGCCGGCCCTGGAAGACAATGATCTGCAGCGTGCACTTCGAGCCCAGCTGCATCAGGCTGCGCAAGCTGTGCTCGTGGGCGGTGCCCACCTTGGAGTTGGGCGACAATGTGCCGCTGGACATCTACTCGAATGAGCAGagtcgccagcagctggaggcgggCAGCGATTGCGAGGATATGCCCTTGGAGGACGCCTACGAGGACGACGATTACGATGATGACTTGgccgagcagctggccaatgAGCCGCTGGTGAAGCGCGAGCGTCGCTCACGTTTCGACCCCTTGCCGCCGGGTCAGCTTCCGCCCTGGAAGATCAAGGTGTGCTCCTTGCCCTACTGCCGCAGTCCACGTGGCGACGGCATCAAGCTCTTTAGGTTGCCCAACAACATCAGCTCCATTCGCAAATGGGAACAAGCGACCGGCATGCGCTTTACTGAATCCCAGCGCAACACGAAGCTCATCTGCAGCCGGCACTTTGATCCGCAGCTGATTGGAGTGCGTCGCCTCATGTACAACGCTGTGCCCACACTGAACCTAGGTCCCATGAGTGCGGAGAgtgctgctgtgctgcctCCGGCTGGACCTCGCTGCTGTATGCCGAATTGCCAGGCGGAGGGCAAGGCTGCCAAGCTGCACAAGTTTCCCAGTGATCCCATGCTGCTGCATCAGTGGTGTCATGCGCTGAATCTCTCGGACATTCAACGCTACCGCGGCAAGCACATCTGTGCTCAGCATTTGCCCGAAAAGACGCCCAGCTGCATTGTGTGCGGCATggagcagttgcagttgccgatGATCGACTTTCCGGAGAATCGCAATCTGCGTGCCAAGTGGTGTTACAATCTCAAAATCGAGCCCATTGCCAAGTGGGACAACTCAAAGCAGATCTGCAGCAAGCACTTCGAGAGCTATTGCTTCACGCAACCGGGGGAACTGCAGCCGGAGGCAGCGCCAACGTTGCATTTGAGGCACAACGATAGCAATATATTCCTAAACGACTATGCCATAACAGATCAGAGCAAGATGCTGCGCATCAAGGATGAGCCGCTGGACAGCGACGATCTGATGCTgtaa
Protein Sequence: MSQHNNPPPHHHHYYQQQQQQQQLQQHHHHHQQQQQHHQQQQQQLQHKQIQQQHSWYSHVASYPPHHPHAAAAFATPCKATNNNNNNNNSIMNAYGTGVVASGTQATYYGAAAGGGVGYNLEANTVAYAHNQLLQYQQQQQQHHQQQQQQHQLSQRSYMSHGVMHSSYPYIKSEPLELPDDRQRQPQQQQQQQHHQQQQQHHQQQQQQQQQQHFQNPMAPPPAPANRHSLDASGEMIIKSEPIDEHAYKSNYIDDNTPFVDFSKYPEFGDDMLSPKVELTVKDEAYGSQKNPLSYPRRKLQSDRSSESLPICQRCKEVFFKRPIYLRHVAESSCNIQEYDFKCNLCTMSFMTNDELQKHKHLHRADKFFCHKYCGKYFDTIAECESHEYMQHEYENFVCNMCSMTFATREQLYAHLPQHKFQQRYDCPICRLWYQTALELHEHRLAAPYFCGKYYAPAQSATHQQQQQQQHSQHQHQANYKLQDCHMGTMEMPTSQHKANTAAAVNVLPATAALSSLLHQRQANADGAALFASTLKNEANVKLERSYSNSTSESGYSLHDSSYNNAYGSDTSIHASAGGGTGGAIGGPQAHSSTLDDSEDALCCVPLCGVRKSTSPTLQFFTFPKDEKYLHQWLHNLKMFHIPASSYASFRICSMHFPKRCINRYSLCYWAVPTFNLGHDDVANLYQNRELTNTFTTGEVARCSMPNCTSQRGESNLKFYNFPKDIKSLIKWCQNARLPVQAKEPRHFCSRHFEERCIGKFRLKPWAVPTLHLGAQYGKIHDNPKNLYVEEKRCCLNFCRRSRSSDFNMSLYRFPRDEVLLRRWCYNLRLDPSVYRGKNHKICSAHFIKEALGLRKLSPGAVPTLHLGHNDTFNIYENELWPPPTPSTPANHHQQQLQQHQLQQHQQQQPHQQHHSHHKYQRHSAASTSSSASSSHYVDAGDMSGSYMGMGNSGGSSSGLNVSDSMDVCCVPSCESKRHNNENITFHTIPRRPEQMRKWCHNLKIPEDKMHKGMRICSLHFEPYCIGGCMRPFAVPTLQLGHDDEDIHRNPDVIKKLNIRETCCVAVCKRNRDRDHANLHRFPSNVALLTKWCANLQRPVPDGSKLFNDAICEVHFEDRCLRNKRLEKWAVPTLILGHENIAYPLPTPEQVAEFYARPSAPNNGEEQGECCVETCKRNPSVDDIKLYRPPEESQMLAKWAHNLEVDAAKLTSLRICNLHFEAHCIGKRMRPWAIPTLNLATTVENLYENPEHQMLYKRRTHLNANRGAAHEAGGVKPTWVPRCCLPHCRKVRALHNVQLYRFPKLNRSTLAKWAHNLQVPLVGSAQRRLCSAHFEPHVLSKKCPVPLAVPTLDLNSPPGYKIYQNPAKLKANKLCLQRVCIVESCRRQRGQGVQLFRLPHNPTQLRKWMHNIRMRPRGAMRQQYRMCSVHFETHSFNGKRLSAGAIPTLELGHDDDDIYPNEAQSFVEEHCTVEGCEASKEQPEVRLFRFPTDDEDLLWKWCNNLKMNPVDCIGVRICNKHFEPDCIGPKHLYKWALPTMHLGHDDEEIELIDNPKPEERYVDPVFKCCVPTCGKTRKFDEVQMNSFPKDPSMFQRWRHNLRLEHLNFKERERYKICNAHFEDICIGKTRLNIGSIPTLELGHEETEDLFQVNPEELQSNLFGRQRRVNSALGISIKQENSELDDDMKPDNNTSLVKKKRPLPDYKCCVPDCGRSRLEHGARLFPFPNGKQQQSKWRHNLRLQPHEVDRSTRVCSAHFNRRCIDGKQLRGWSMPTQQLGHQELPIYENPKNIPGFFTPTCALAHCRRRRSIDNDLRTYRYPRSEELLEKWRVNLRLAPDQCRGRICADHFEPMVRGKLKLKTGAVPTLKLGHSEGVVFDNEAIKAGLQQEAEEGGDHETSMESLVKVKQEKLDPDEEPADHAEQEPEQDEDDEQADHGYFDPLELVETFAEQHSAEEDEEDNEHGLDDNDDDDEDEDEDEPGDDDELLLPDTPPVKRRAPLVLRTRREKAVNNVTPICCLKHCRKERTASHQLSTFGFPKDRQQLLKWSANLQLSLDDCVGRVCIEHFESEMLGTRKLKQHAVPTLNLGHATPLSYSCNGQTLSIYDAQPQHSVFRLWSLKHCRKRKHPTEPPDQQKKQLDQAATVIATTATATPTTTKRRCCLPSCGKQPELHGVQLQRLPSNRIQLRKWLHNLKLSPMLDSSQARICSEHFEPEQQHVEEAVPTLRLGHDDPHIYRNRGSANSGSIAASTSSACLVASCPCARLNLYRCYDLPEHRLVQQAWLQWLQLPLPQQASDGKLCVMHYMQLYEQVPLPEELPGSVLRQLQETYDLIAGSTMAMKLRCAVPGCYSKYTDNIRLTKLPMCAEMCAKWVHNTKISYDATRHYVYRICMLHFESRCLGPVRPKLWAVPTLQLNHQDASIYQNPKLDGQSTPTSAPVPVAMSASVPVELPLRIKTELVCSGSPSASASPSPRGKLRFCCIPNCLQQATSQTRLFRFPSAETTLLKWLVNTQQQPRLVDTQQLFICQDHFEAEAICKKQLRSWAVPTLKLGHDGHVIPNARHNGNIADSQENRQTLQYIWENYCSVLSCFQPRSEQLRLYAYPTDRPTIRKWAANCKHRSMQASSDGFQVCQSHFAPHCFDQETGELREDAVPTLELSRCLNDMRCVVVGCVKDEDGPRQRFYKMPKRSAQLLSWCHNLRLDAAAMSSGEHHVCDRHFEAQCINQQKLLRPGARPTLHLGHDTAIDLMPNPAEWDAPDTTPAVDLVCCVPKCALSRDEDEDVQLFAFPKLRMLAEKWLQNIRLEHLGREQLLRLRICSAHFDPGCLESNGRPQLGAMPTLQLGHEERANLHRSTDAAAVKAKKFCNRSGSSYDCCYPQCVELQKSYLRISYELPQSEALRLRWLEYMGVAEKEEKPLKLCPLHLVLLYDHSVEHFAAEHTPEQLLDANYEDARNSVRLRVISCAVPGCRTLKPRDGGILHGLPQRRDVLEMWLHNMQLVFYEQQRYMYKICSKHFEPSCFMDTTRRLKPWTMPTLELPARAADEAPIYPNPSESEWQRMNELLAAEQLQLQQQQQQLEQQEEQPEDLCNLLEPIVKMEHIERDEEEEEYAEQQEHELQPDIDRDYDNDNSQQPLALEVLLEVGHVEKCTTYEQMDNEANLGYAEQQQQQLLHSNEAQPRPAYNAAGSGQLASNGFKYTARHCSVRGCDVTANDVNGSIKLHKFPTSLDAMEKWKHNTQVDVDVNFSWRFRICSYHFTDECFHGARIKRGAMPTLSLGPRRPAKIYDNEFNASLPLEQEPEASDEQLPKHTKGGEISLRLPEPAPPRKSSKFCQIDGCPNHLTSENLTLHKFPHSVDMCAKWQHNTQVPFDPDYRWRYRICSAHFEPICLMNMRLMHGSVPTLKLGPRAPRQLFDSDFEAINLRLDKHKSSSEQQLSIKQEHDEDEDDEAELSYLVPEMQLHEDTHQLQETPSSWKEQRLPNIKQEEQDQSQTTYNPVKSGYDKCSLVHCQRQRSQHGVHIYKFPRSRQLQQHWMHNLRIKYDERRPWKTMICSVHFEPSCIRLRKLCSWAVPTLELGDNVPLDIYSNEQSRQQLEAGSDCEDMPLEDAYEDDDYDDDLAEQLANEPLVKRERRSRFDPLPPGQLPPWKIKVCSLPYCRSPRGDGIKLFRLPNNISSIRKWEQATGMRFTESQRNTKLICSRHFDPQLIGVRRLMYNAVPTLNLGPMSAESAAVLPPAGPRCCMPNCQAEGKAAKLHKFPSDPMLLHQWCHALNLSDIQRYRGKHICAQHLPEKTPSCIVCGMEQLQLPMIDFPENRNLRAKWCYNLKIEPIAKWDNSKQICSKHFESYCFTQPGELQPEAAPTLHLRHNDSNIFLNDYAITDQSKMLRIKDEPLDSDDLML

Similar Transcription Factors

Sequence clustering based on sequence similarity using MMseqs2

100% Identity: iTF_00601834;
90% Identity: -
80% Identity: -