Basic Information

Insect: Drosophila anomalata
Gene Symbol: -
Assembly: GCA_035046425.1
Location: JAWNNY010001937.1:3758360-3771427[+]

Transcription Factor Domain

TF Family: THAP
Domain: THAP domain
PFAM: PF05485
TF Group: Zinc-Coordinating Group
Description: The THAP domain is a putative DNA-binding domain (DBD) and probably also binds a zinc ion. It features the conserved C2CH architecture (consensus sequence: Cys - 2-4 residues - Cys - 35-50 residues - Cys - 2 residues - His). Other universal features include the location of the domain at the N-termini of proteins, its size of about 90 residues, a C-terminal AVPTIF box and several other conserved residues. Orthologues of the human THAP domain have been identified in other vertebrates and probably worms and flies, but not in other eukaryotes or any prokaryotes [1].
Hmmscan Out: # of c-Evalue i-Evalue score bias hmm coord from hmm coord to ali coord from ali coord to env coord from env coord to acc

1 29 2.4 8.2e+03 -2.2 3.4 38 62 338 365 329 381 0.59

2 29 2e-15 6.9e-12 46.1 4.1 1 86 573 645 573 646 0.85

3 29 7.6e-15 2.6e-11 44.3 5.0 1 87 673 742 673 742 0.83

4 29 6.9e-16 2.4e-12 47.6 0.2 1 87 764 836 764 836 0.85

5 29 2.2e-16 7.6e-13 49.2 6.3 1 87 935 1005 935 1005 0.82

6 29 4.4e-15 1.5e-11 45.1 3.5 1 86 1029 1100 1029 1101 0.81

7 29 6e-13 2e-09 38.2 1.3 1 87 1136 1204 1136 1204 0.80

8 29 2.4e-11 8.2e-08 33.1 2.5 1 86 1244 1313 1244 1314 0.77

9 29 1.7e-17 5.8e-14 52.8 0.3 1 86 1341 1410 1341 1411 0.82

10 29 6.3e-13 2.1e-09 38.2 1.5 1 85 1432 1500 1432 1502 0.79

11 29 1.1e-14 3.6e-11 43.9 1.0 1 86 1529 1600 1529 1601 0.85

12 29 3.5e-14 1.2e-10 42.2 2.0 1 86 1683 1752 1683 1753 0.82

13 29 4.4e-13 1.5e-09 38.7 0.1 1 86 1776 1844 1776 1845 0.82

14 29 4.6e-14 1.6e-10 41.8 1.1 1 87 1972 2041 1972 2041 0.80

15 29 2.3e-08 7.9e-05 23.5 0.0 1 86 2133 2198 2133 2199 0.75

16 29 1.9e-06 0.0064 17.4 0.0 1 58 2214 2261 2214 2277 0.81

17 29 5.2e-13 1.8e-09 38.4 0.2 1 87 2291 2363 2291 2363 0.80

18 29 7.8e-14 2.6e-10 41.1 0.3 1 87 2423 2493 2423 2493 0.82

19 29 7.7e-11 2.6e-07 31.5 0.0 1 86 2528 2599 2528 2600 0.79

20 29 4e-13 1.3e-09 38.8 0.0 1 86 2610 2681 2610 2682 0.79

21 29 7.4e-15 2.5e-11 44.3 1.0 1 85 2706 2776 2706 2778 0.81

22 29 5.5e-06 0.019 15.9 0.2 1 58 2808 2855 2808 2889 0.76

23 29 2.7e-12 9.1e-09 36.1 0.1 1 87 2893 2965 2893 2965 0.81

24 29 4.8e-16 1.6e-12 48.2 0.2 1 86 3072 3144 3072 3145 0.81

25 29 5.4e-13 1.8e-09 38.4 3.1 1 86 3205 3275 3205 3276 0.82

26 29 5e-14 1.7e-10 41.7 3.6 1 86 3346 3416 3346 3417 0.85

27 29 5.1e-12 1.7e-08 35.2 0.1 1 87 3500 3570 3500 3570 0.84

28 29 2.5e-10 8.5e-07 29.8 1.8 1 58 3598 3646 3598 3655 0.84

29 29 1.4e-09 4.7e-06 27.4 1.4 18 86 3664 3721 3653 3722 0.73

#	of	c-Evalue	i-Evalue	score	bias	hmm coord from	hmm coord to	ali coord from	ali coord to	env coord from	env coord to	acc
1	29	2.4	8.2e+03	-2.2	3.4	38	62	338	365	329	381	0.59
2	29	2e-15	6.9e-12	46.1	4.1	1	86	573	645	573	646	0.85
3	29	7.6e-15	2.6e-11	44.3	5.0	1	87	673	742	673	742	0.83
4	29	6.9e-16	2.4e-12	47.6	0.2	1	87	764	836	764	836	0.85
5	29	2.2e-16	7.6e-13	49.2	6.3	1	87	935	1005	935	1005	0.82
6	29	4.4e-15	1.5e-11	45.1	3.5	1	86	1029	1100	1029	1101	0.81
7	29	6e-13	2e-09	38.2	1.3	1	87	1136	1204	1136	1204	0.80
8	29	2.4e-11	8.2e-08	33.1	2.5	1	86	1244	1313	1244	1314	0.77
9	29	1.7e-17	5.8e-14	52.8	0.3	1	86	1341	1410	1341	1411	0.82
10	29	6.3e-13	2.1e-09	38.2	1.5	1	85	1432	1500	1432	1502	0.79
11	29	1.1e-14	3.6e-11	43.9	1.0	1	86	1529	1600	1529	1601	0.85
12	29	3.5e-14	1.2e-10	42.2	2.0	1	86	1683	1752	1683	1753	0.82
13	29	4.4e-13	1.5e-09	38.7	0.1	1	86	1776	1844	1776	1845	0.82
14	29	4.6e-14	1.6e-10	41.8	1.1	1	87	1972	2041	1972	2041	0.80
15	29	2.3e-08	7.9e-05	23.5	0.0	1	86	2133	2198	2133	2199	0.75
16	29	1.9e-06	0.0064	17.4	0.0	1	58	2214	2261	2214	2277	0.81
17	29	5.2e-13	1.8e-09	38.4	0.2	1	87	2291	2363	2291	2363	0.80
18	29	7.8e-14	2.6e-10	41.1	0.3	1	87	2423	2493	2423	2493	0.82
19	29	7.7e-11	2.6e-07	31.5	0.0	1	86	2528	2599	2528	2600	0.79
20	29	4e-13	1.3e-09	38.8	0.0	1	86	2610	2681	2610	2682	0.79
21	29	7.4e-15	2.5e-11	44.3	1.0	1	85	2706	2776	2706	2778	0.81
22	29	5.5e-06	0.019	15.9	0.2	1	58	2808	2855	2808	2889	0.76
23	29	2.7e-12	9.1e-09	36.1	0.1	1	87	2893	2965	2893	2965	0.81
24	29	4.8e-16	1.6e-12	48.2	0.2	1	86	3072	3144	3072	3145	0.81
25	29	5.4e-13	1.8e-09	38.4	3.1	1	86	3205	3275	3205	3276	0.82
26	29	5e-14	1.7e-10	41.7	3.6	1	86	3346	3416	3346	3417	0.85
27	29	5.1e-12	1.7e-08	35.2	0.1	1	87	3500	3570	3500	3570	0.84
28	29	2.5e-10	8.5e-07	29.8	1.8	1	58	3598	3646	3598	3655	0.84
29	29	1.4e-09	4.7e-06	27.4	1.4	18	86	3664	3721	3653	3722	0.73

Sequence Information

Coding Sequence: ATGTCACAACATAACCAACCCCACCAAGTTCCCCCCCATCCGCACTATCCCTACCACCACGCCTCTTTGTCGCTGCccctgcaacagcaacagcagcagcagcaacagcagcaacatcaacagcaacagcaacatcatcaacaacagcttcagcagcagcagcaacatgccAGCAGTTGGTACTCACATGTTGCTTCCTACCCACCCTCCCATACGGCCTTCAACCCCTCACTCCCCTGCAAGGccgccagcaacagcagcagcaccaacaacaactcCATCATGGGCGCCTAcggagggggtggtggtggtacgCATGGCTACTACGGCAATGTCAGCGGCGGAGTGGTTGTTGGAGTGGGAgggggcggtggcggtggcggaggcggaggaggcgcAGTTGGCTCGACCTACGGCCTTGGGGCCAACACAGTGGCCTATGCCCACAACCAGCTGCTTCAGTACcagcaacaccaccaacagcaggagcaacactcgcagcagtcgCACCTTGGACAGCGTTCCTCCTACATGGGCCACGATGTCATGACCGGGAGCTATCCGTACATCAAGAGCGAACCCATGGAGgtcttccagcagccgtcAAATCCGATGGCTCCACCGCCACCTCTGCCTCCGGCCCAGGAAATGATCATAAAATCGGAACCCATGGATGAACAGGCCTACAAGTCCAACTACATCGATGACAACACCCCGTTCGCGGACTTCAGCAAGTTCAACGAATTCAGCGAGGATATGCTGAGTCCCAAAGTGGAGCTTACTGTCAAAGACGAGTCCTACGGCAAGAACCATAATAGCTTTCCTCGTCGCAAGCCACACAATGATCGCCCCGCCGGCAATGAGAGCCTGCCGATCTGCCAGCGCTGCAAGGAGGTGTTCTTCAAGAAGCAGACCTACTTGCGCCACGTCGCCGAGAGCAGCTGCACCATCCAGGAGTATGACTTCAAGTGCAACATCTGCCCCATGTCCTTCGTGAGCGCCGAGGAGCTGCAGCGGCACAAAAACCATCACCGGGCCGACCGGTTCTTCTGCCACAAGTACTGCGGCAAGCACTTTGAATCGATCGCGGAATGTGAGGCGCATGAGTACATGCAGCATGAGTACGACAGCTTCGTCTGCAACATGTGCTCGGCCACTTTTGCGTCCAGGGATCAGCTCTACTCCCACCTGCCGCAGCACAAGTTTCAGCAGCGCTTCGACTGCCCCATATGCCGCCTGTGGTACCAGACCGCCCTCCAGCTGCACGAGCACCGGATAGCGGAGCCCTTTTACTGCGGAAAGTACTACGGGGCCGGGCTGAACACGGCGACACctcagcagcaacaccaccaccagagcCAGACCAACTACAAGCTACAGGATTGCCACATGGCCACCATGGAGATGCCCAACACATCGCAGCACAAGCCGAACTCCTCCAACTCCACCTTGCCGGCCACTGCGGCTCTAAGTTCCTTGCTGCAGCAGCGGCAAGCGAATGCCGATGGAGCTGCCATGTTCGCTGCCTCGGCGGTCAAGGCGGAGATGAACGTCAAGCTGGAGCGAAGCTTCAGCAACTCGACCAGCGAATCATCGTACGGTGTGCAGGACGGCGGCTACAACAACTCGTTTTCAGGAGAAACTGCTATGCACAGTGGTGCCATCGCCGGACCACAGGCGAACTCCTCGACGCTGGACGACTCCGAGGATGCACTGTGCTGTGTGCCGTTGTGCGGAGTGCGCAAGAGCACCAGCCCTACGCTGCAGTTCTTCACGTTCCCCAAGGACGAAAAATACCTCAACCAGTGGCTGCACAACCTCAAGATGTTCCACGTGCCGGCCTCCAGCTACGCCAGCTTCCGCATCTGCAGCATGCACTTCCCCAAGCGCTGCATCAACCGCTACTCGCTGTGCTACTGGGCAGTTCCGACCTTCAACCTGGGCCACGACGACGTGGCCAATCTCTACCAGAACCGCGAGCTCACCAACACGTTCACCGTCGGTGAAGTGGCCAGGTGCAGCATGCCCCACTGCACCAGCCAGCGGGGCGAGAGCAACCTCAAGTTCTACAACTTTCCCAAGGACATCAAGAGCCTGATCAAGTGGTGTCAGAACGCCCGGCTACCCGTCCAGGCCAAGGAGCCACGGCACTTCTGCAGCCGACACTTCGAGGAGCGGTGTATTGGCAAGTTCCGCCTCAAGCCCTGGGCGGTGCCCACTCTTCATCTGGGCGCCCAGTACGGAAAGATTCACGACAATCCCAAGAACTTGTATGTGGAGGAGAAGCGTTGTTGCCTCAACTTCTGTCGCCGGAGCAGGTCCTCTGACTTCAATATGTCGCTATATCGTTTTCCCAGAGACGAGGTGCTCCTCCGCCGCTGGTGCTATAATCTTCGCCTGGATCCTGGAGTTTATCGCGGCAAGAATCATAAAATATGCAGTGCCCACTTCATCAAGGAGGCTTTGGGCTTGCGGAAGCTGTCCCCTGGAGCGGTACCAACATTGCATTTGGGCCACAACGACACCTTCAACATCTACGAGAACGAGCTGTGGCCGCCTCCAACTCCCTCCACCAGCCACGGCAGTGGCCAGGTGCACTTGCAACACCAGCCACATATCCCGTCGCATCACTCGCTCCAGCACCAGCTGCATATTGGACAGAGCAAATCCTATCAACGGCACTCGGCCGcatccacctcctcctcggcgAGCTCCACCTCGCACTACGTGGATCCGGAGGTGAGTGCTTCCTACCTGGCGATGGGCGGATCCTCGGTGAACGCCAGCGACAGCatggatgtctgctgtgtgcCCAGCTGCGAGAGCAAGCGGCACAACTCTGAAAACATCACCTTCCACACGATTCCGCGAAGACCCGAGCAGATGCGCAAGTGGTGCCACAACCTAAAGATACCCGAGGACAAGATGCACAAGGGCATGAGGATCTGCAGCCGGCACTTCGAGCCATACTGCATCGGCGGGTGCATGCGTCCGTTCGCAGTGCCCACCTTGCACCTGGGCCACGACGACGAGGACATTCACCGAAATCCGGACGTAATAAAGAAGCTGAACATCCGGGAGACCTGCTGCGTAGCTGTGTGCAAGCGGAACCGGGATAGGGACCACGCCAACCTGCACCGCTTCCCCAGCAACGTGGCGTTGCTGACCAAGTGGTGTGCCAATCTCCAGCGTCCCGTGCCGGACGGCAGCAAGCTCTTCAATGACGCTATTTGCGAGGTGCATTTCGAGGACCGCTGTCTGCGGAACAAGCGCCTGGAGAAGTGGGCAGTGCCTACCCTGACCCTGGGCCACGAAGACATTGCATATCCTCTGCCCACACCGGAGCAGGTGGCCGAGTTCCACTCGCGgccctcggcgcccaacaatgGCGAGGAGCAGGGAGAGTGCTGCGTTGAGACCTGCAAGCGAAACCCCAGCGTGGACGACATTAAGCTGTACCGTCCTCCGGAGGAGGCGTCCGTGCTAGCCAAGTGGGCCCACAACCTGCAAACCGAGGCCGCCCAGCTGGTGAACCAGCGGATCTGCAATCTGCACTTTGAGGCCCACTGCATCGGCAAGCGAATGCGCCCATGGGCCATACCAACCCTGAACCTGGCCGGCAACATTGAGAATCTCTACGAGAACCCGGAGCCCTCGATGCTCTACAAGCGGCGCATGCACGCAAAGGCGAAACTGTCCGCATCTGCGAAGCCTACATGGGTGCCACGGTGCTGCCTCCCCCATTGCCGCAAGGTGCGCGCCCTGCACAATGTCCAGCTCTACCGCTTCCCCAAGCACAACCGCTCCACACTAGCCAAGTGGGCCCACAACCTGCAGGTGCCCATGGTGGGCAGTGCCCAACGGCGCGTCTGTTCGGCTCATTTCGAGCCTCATGTGCTGAGCAAAAAGTGTCCGGTGCCGTTGGCAGTGCCCACATTGGACCTCAACGCCCCGGCAGGGCACATGGTGTACCAGAATCCGGCCAAGCTGCGGGCTAGTAAACTGTGCCTGCAGCGCGTGTGCATCGTGGAGAGCTGTCGCAAGACCCGGGCGCAAGGCGTGCAACTCTTCCGGCTCCCGCACAATCCATCCCAGCTAAGGAAGTGGATGCACAACATCCGGACACGTCCAAGGGGTTCCATGCGGTCCCAATACCGGATCTGTTCCCGCCACTTTGAAACGCACTCGTTCAACGGGCGAAGGCTCAGTGCAGGAGCCATTCCCACGCTGGAGCTGGGccacgacgacgacgacatcTACCCGAACGAGGCACAGGCTTTTGTGGACGAGCACTGTGCCGTGGAGGGATGTGGGGCGTCCAAAGAACAGCCGGAAGTGCGACTCTTCCGCTTCCCCACTGACGACGATGACATGTTGTGGAAGTGGTGCAACAACCTCAAGATGAACCCCGCCGACTGCACGGGCGTGCGCATCTGCAACAAGCATTTCGAAGCGGACTGCATCGGTCCCAAGCACCTGTTTAAGTGGGCCATTCCCACCCAAGAGCTGGGCCACGACGATGCCCAGATAGAACTTATTCCGAACCCGAAGCCGGAGGATCGGTACGTCGATCCAGTGTTCAAGTGCGTGGTTCCTACTTGCGGCAAGACGCGGCGATTTGACGAAGTCCAGATGAACAGCTTCCCCAAGGACCCGGAGCTCTTCCAGCGGTGGCGACACAACCTCCGCTTGGACCATTTGCACTTCCACGAGCGGGAACGCTACAAGATCTGCAACGCCCACTTCGAGGACGTTTGTATTGGCAAGACCCGCTTGAATATCGGCTCGATACCCACTCTAGAACTGGGCCACGATGAGACGGATGACCTGTTCCAAGTCAATCCCTTGGAGTTGCAAAGCAACTTGTTCGGTCGCCAAAGGCGGCTGCTTGACGGAACGGAATCCGGCGAGGTGATGGTCAAGCAGGAGCTTCCAGATGGGGAAGGTGACTCCGAGCCCGAGGACATAAAACCGGATATAAGACAAATACTAATTTCCAGACCCAGACAGGTGAAGGCCAAGAAAGGAACTCTGGGGAATCTGAAATGCTGCGTCCGGAGTTGCGGAAGGAGTCGGCTCCAACATGGGGCTCGTCTGTTTGCGTTTCCCACGGGCAAGCAGCAGCACCTTAAATGGCGCCACAATCTCCGGCTGGAACCTGAGGACGTGGATCGGACCACCCGGGTATGCAGCGCTCACTTCAATCGCCGCTGCATAGACGGCAAGCAGCTGAGGAGCTGGGCCATGCCCACACTGCAGCTGGGGCATCGGGAGCAGCCCATCTACGAGAACCCGAAGAACATACCGGGCTTTTTCACGCCCACCTGTGCCCTGAGCCACTGCCGTCAGAGAAGGAGCATCGACAACGACCTACGGACCTACCGGTACCCCCGGACGGAAGACCTCTTGGAAAAGTGGCGGGCCAATCTCCGCCTGACTCCGGATCAGTGCCGCGGTCGCATCTGTGCCGATCATTTCGAGCCTATGGTGCGCGGCAAGTTGAAGCTTAAAACCGGAGCGGTGCCCACTTTGAAGCTCGGCCACGACGAGGGACTGATCTACGATAATGAGGCAATCAAGGCTGGCatggcggaggaggaggaggtcacCTGTAAGCAGGAGATcctggacgaggaggaggagggcgaaGGCGAGGAGTCGCGAGAAGGTGCTCCCGCTGTCAACGAGGATGAGGACGACAAAGACGACAGTTACTTCGATCCTTTGGAGTTGGTAGAAACGTTCGCAGAGCGGGCCAGCGATGACGAAGCGGAAGACCCCGAAATGGAGGAGAAAAATGAGCCCGATGAGGGGGATGAGGAGGAGGCAGAGGAGCTCCTGCCCGACCTGCCTCCCACACCGCCTCCTGTGCCCCAGCGTCGCGAAAAACCCGCCAACAATGTGACCCCCATTTGCTGTTTGAAGCACTGTCGCAAGGAGCGCACGGCCTTCCATCTGCTGAGCACATTCGGGTTTCCCAAGGACCGTAAGCTGTTGCTGAAATGGTGCGACAATCTCCACCTGCACCCGGATGACATTGTAGGGCGGGTCTGCATCGAGCACTTCGAGGCGGAGGTCCTCGGCACTCGGAAGCTTAAACAGAATGCAGTGCCCACCTTGAACTTGGGCCACGACGATCCGTTGCGGTACACCTGCCATGGCGTGGAGCTAGATGAGGACTTGGAGCATGGCCAGCCGCAGCACTCGGTTTTTCGGCTTTGGAGCCTGAAACACTGCCGCAAGAGGAAGCTATCGGATCCCCCGGACATTCGCCTCAGCCACTGGAAGGAGCTGAAGATGCACATGCAGAAGCAGAGGGAGATGGAGATGGCGATGGAGACGGACATAGTGATGAGCACTCCTCCTCAGACGCCGGTGAAGATTaagccaaagagatgctgcgTTATCAGTTGCGGAAGCGAGGACGCCAAAAAGTTGGTAACCATGCCGGATGAGCGCAGTCTTCTCCGCCGGTGGCAGCATAATCTCAAGTTGTCAGTGTTCACGGATCCAAGTCTTGGCCTGTGCCTGGACCACTTTGAAGAGTCTCTGGTGCAATTTGGAAAGCCCTTGGACAGGGCAGTGCCCACCCTGAAGCTGGGTCACAACAGTGATAATCTCTACCGAAACAACGCCTCTTGCCTAGTTCCCAGTTGTCCCAGTTCTGACTCCGATGTAACCAGTTTTGTGAGTCCGCCCGTGAATCCAGTGATGAGAAGGGCCTGGCTCTCCTACCTTCAACTGCCATTCCCTAGCGAAGGACTTCTATGTGGCAACCACTTCGTGGAACTCTACGAGCAGGTGGACTTGCCGGAGGACTTACCTGTCCAGGATCTGGAGGAGCTGGAACGAACTGTCGATGAGCTCCAATGCGCTGTGCCCGGTTGCGAGTCAAAGAATGCCCGTGAGATTCCTGTCCAGCTGGTCCAGTTACCGCACAACGAGGAGGAACTGTCCAAGTGGCTGCACAACACGAAGATCACTTATGACTATTCGCGGCACGGTAGCTATCGCATCTGCCTGCTCCACTTTGACCCCATCTGCCTGGAAGAGGACTTTCCACAGAGTTGGGCAGTGCCTACACTAAACCTGGGCCACGAGGATGACATCCATCTGAATCCCGTGCAGAATCAGGCTCCTGAGGCTCTGAACGGAACCTCCAACAGCAATCCCTGGCTAACGCCTCTGAGAATCAAGACGGAACTCGCTTCCGTAAGCAGCCCCAGCGTGAGCGCCAGCCCCAGTCCGAGGGGAAAGATACGGATTTGCTGCATCCCCACCTGCGGCCAGTTTGGAAATAGCCAGGTGCGACTGTATCGCTTTCCCAGCGAGGAGCAGTTCCTCCTCCAGTGGCTGATCAAcacgcagcagcagccccgACTCGTGGATCCCATGGAGCTCTACGTGTGTCAGGCACACTTTGAAGCCGACGCCATTCACAAGAAGCATCTCCGCAGCTGGGCACTGCCGACCCTAAATCTTGGCCACGACGGGCATGTCTTTCAAAACGCCAGGCACAACGGAACCATTGCCGAGGCCTTGGATATCGAGGAGGCCACTAAGTTTATCCGGGAGCGCTACTGCTCGGTGATGAGTTGCTTTCAACCCGCGGGAGAGGAAGTCAGGCTCTTCGAGTACCCCGAGGACATGGCTATTATCCGAAAGTGGGCAGTGGCCTGCAAGCATCGATCCATGCACGCCAGAAGCCATGGGCTCCGGGTGTGTCAGGCGCACTTTGCTGCCGAGTGTTTTGATCCCGGCACTGGAGATCTGCTAGAAGGGTCTATTCCCACGCTGGAACTCAACCGAGACGACATCGAGAGACACTGCTTGGTGCGAGGATGTGAGAGGGACGAGTCGGGTCCTCGCTTGCGTTTCTATAAGCTGCCCAAGACCGGTGACCAGATCCAGGCATGGAGCAACAATATGAGAATTCCGCCCACCGAACTGATGCAGGGAGACCAGCGCATTTGCGAGCGCCACTTCGAGGCGTACTGCTTCGGACCCTGCCGGGGTCTTCGGCAGGGAGCTCTTCCCACTTTGTCCCTGGGCcacgaggaggaggtggactTGCTTCCCAATCCCGAGAAGTTGCGGTTGGGCAAGCAGGAGACATGTTGCGTACCGGGCTGCGACCGAGTCCGGCAGCCAGATGACATCCCTTTCTACTGCTTCCCGAAGCTCTGGCCTTTGGCCAGGAAGTGGCTGCACAATATCCGCCTGGAGAAGTCGAGCAAGGATCCGCTAAACAAACTTAGGGTGTGCCCGGCGCACTTTGAGTCGGATGTGCAAGAAAACGATGCACTCCTGCCGGAAGCCATGCCCACCAAGCAGCTGGGACACTCCTCCGAAGGCATTTTCCTCACCAACAAGCAGGACAGGAGCTTTCAGAATCACAAGAAATCCTTCCCGGAGGTGGTTTGCTGTTATCCGAACTGCACTGATTTGTCCAGGATCCAGTTGATGGATCTTCCCGACGCGGCAGAGCTTCGCAACGCGTGGTTGGAACACTTGGAAATCAAGGAGACACATAATGATGCTCTACAGCTCTGTCCGCTCCATTATGTGATTCTTTATGAGCACAGTGCCAAGGAGTTTCCGGAGCACGTTCCAGACCAGTTGATGGAGGAAAACTACCAAAACGCCCGCAACAACCGGCGCGTGAAGATCGTCAGTTGTGCCATCAAGGGATGCAGTATGGTGAAGCCCAGGGATGGAGTGCAGCTGCACGGAATGCCCGTGTACAAGGACATCTTGCAGATGTGGGTGGACAACGGACAGATAGACTTCTCCGAGCAGCAGCGCTACATGCTTAAGGTGTGCCACAGACACTTTGATCCAAGCTGCTTCATCGAGGAACGGCGGCTTACCTCCTGGAGTGTTCCTACCCTGCATCTTCCCGGCGAGACTATCCACCAGAATCCCAGCAAAGAGGAGTGGCTGGCCATAAAGCAGGAAAAGGAAGAGCCAGAGATTAAGGAGGAACCTCTGGAGCCGGAGATGGAAACGGAAAACTCTCTACTGGAGCCTATTGTGAAGATGGAACACATGGACTCCGAGGAGGACGACTCACAGATGCAGGCGTTGGAGGTGCTGCTGGAGGTGGGGCACGTGGAGCGGCTAGACAGCTATGAGAAGATTGACAAATCCCCCATCGCCTATCCGGAGCACGTCATATACAAATCCAATCGAAGTCAATACAACGCCAACCGCTGCGCCGTGGAGGGATGCGAGGTCACAGCCGAGGACGTAGACGGAACTATCCGACTGCACAAGTTTCCCGCCTCAGCGGATGCCGCCCAGAAGTGGATGCACAACACGCAGGTGGACATGGAGGAGAAGTTCTGGTGGCGCTATCGCATTTGCAGCTATCACTTCCACCAGGAATGCTTTCAGGGCTCTAGAATCCGGAAGGGAGCCATGCCCACGCTACTCCTGGGTCCTCGGCGACCGGATGAGCTTTACGACAATGAGTTTGCTTCGCAGCAGGAGGCGGAGGACCCGTCTCTGCCCGTCGAGATGTGTCAGACCAGCGCTACAGAGCGGACTGCTCCGGACGTTACCAATCTCTGCCTGCCTCCGCCGGCTGCGCCGCGAAAGTCCAGCAAGTTCTGCCAAATCGAAGGCTGCTCGAATCATCTGACCACCGAGAACATAACCCTCCACAAGTTTCCCCACTCCGAGGACATGTGCATCCGATGGCAGCACAACACTCAAGTTCCATTCGATCCGAATCATCGCTGGCGGTACAGGATCTGTACCGCCCACTTCGAGCCTGTGTGCTTGGCCAACTTGCGCCTGCTCCACGGAAGTGTGCCCACCCTGAAGCTGGGACCCAAAGCTCCCGCCCAGCTCTTCGACAACGACTTTGAGGCCATCAACCAGCGTCTGGATAAGAGGTCGGCGGCAGAGATAAAACAGGAACGAGTGGACATGGAAGACGAGCTGCACGAGGATCAGATGGAGGTGCCTAGCTGGAAACCAGTGAAGCAGGAGAAGGTAACCTTCAACCAGATAAAATCTGGCTACGACAAGTGCTCGCTGGCCCACTGCCAGCGCCAAAGATCTCTGCACGGCGTCCACATCTACAAGTTTCCCAGGTCGCAGCGCCAGCAGGAGCGGTGGATGCACAACCTCCGCATTCGCTACGATGAGCGCCGTCCCTGGCGATTCATGATCTGCAGCGTCCACTTCGAGCCCCACTGCATCAGCCTTAGGAAACTGCGTCCCTGGGCAGTTCCTACACTGGAGCTGGGCACCAATGTGCCGGAGAAGATCTTCACGAACGAGCAGTGCCAGGAACTGGAGGTGGAACAGCCCAGCGATCGCAGCGAGGCGGAGAGCGAAGAGGAGGATGGCCTGGAAGAAGACGACGATGGGGAGGACGACGAGGTGGCGGAAGAAGGACTAGAGTGCAATGTCCGCATTAAGAAGGAACGGCGTTCGAAGCTGGATCCATGTCCTCCTGGTCAGGTTCCGCCCTGGAAGGTGAAGCAGTGCTGCCTTCCCTACTGTCGTGCCTTCCGAGGCGATGGCATCAAGCTCTTCCGGCTCCCCAACAACCGATCCTCCATTCGCAATTGGGAGCTGGCCACGGGCATGGTGTTCAAAGAGTCGCAGCGAAACACGCGACTCATTTGCAGTCGACACTTTGACCCGGAACTAATCGGTGTGCGTCGTCTCATGCGCAACGCTATTCCCACCCTGCATCTGAATCCCCAGGCCGTAACAGTCAAGGAGAAGAAGATTTCGACGAGCAAGCCTAAGGATGTCCCCTCTTCCATGCCCACCTGCTGCATGGCGGATTGCCATCACAACGGAAATGCGAAGCTGCATAAATTCCCCAGTGACTCCACCCACCTGAGGCAGTGGTGCCAGGCTCTCAGGCTCACGGATACACAGCGTTATCGCGGCAAGTACATCTGTTCGGCCCACCTGCCGACCAACATGTCAGTAAGCTGCGTCGTCTGCGGGGTAGATGACGTTCAGCTGCCGATGCTGGACTTCCCAGAGAACCGCAACCAGCGGGCCAAATGGTGCTACAACCTGAAAATCGAGACCATACCCAAGTGGGATCGCTCCAAGCATATCTGCTGCCGGCATTTTGAGGCACACTGCTTTGCCCGGCCGGGTGAACTTCGTCCAGGAGCGACCCCAACAGTGGCTTTGAACCACAACGACACAAACATATTCCTGAGCGACTACGCCACCGATCCGACGACCTCCTACGAGGGTAATCAGATCAAGGACGAGCCCATGGACGGCGACGAGACGCTCCTGGTCTAG
Protein Sequence: MSQHNQPHQVPPHPHYPYHHASLSLPLQQQQQQQQQQQHQQQQQHHQQQLQQQQQHASSWYSHVASYPPSHTAFNPSLPCKAASNSSSTNNNSIMGAYGGGGGGTHGYYGNVSGGVVVGVGGGGGGGGGGGGAVGSTYGLGANTVAYAHNQLLQYQQHHQQQEQHSQQSHLGQRSSYMGHDVMTGSYPYIKSEPMEVFQQPSNPMAPPPPLPPAQEMIIKSEPMDEQAYKSNYIDDNTPFADFSKFNEFSEDMLSPKVELTVKDESYGKNHNSFPRRKPHNDRPAGNESLPICQRCKEVFFKKQTYLRHVAESSCTIQEYDFKCNICPMSFVSAEELQRHKNHHRADRFFCHKYCGKHFESIAECEAHEYMQHEYDSFVCNMCSATFASRDQLYSHLPQHKFQQRFDCPICRLWYQTALQLHEHRIAEPFYCGKYYGAGLNTATPQQQHHHQSQTNYKLQDCHMATMEMPNTSQHKPNSSNSTLPATAALSSLLQQRQANADGAAMFAASAVKAEMNVKLERSFSNSTSESSYGVQDGGYNNSFSGETAMHSGAIAGPQANSSTLDDSEDALCCVPLCGVRKSTSPTLQFFTFPKDEKYLNQWLHNLKMFHVPASSYASFRICSMHFPKRCINRYSLCYWAVPTFNLGHDDVANLYQNRELTNTFTVGEVARCSMPHCTSQRGESNLKFYNFPKDIKSLIKWCQNARLPVQAKEPRHFCSRHFEERCIGKFRLKPWAVPTLHLGAQYGKIHDNPKNLYVEEKRCCLNFCRRSRSSDFNMSLYRFPRDEVLLRRWCYNLRLDPGVYRGKNHKICSAHFIKEALGLRKLSPGAVPTLHLGHNDTFNIYENELWPPPTPSTSHGSGQVHLQHQPHIPSHHSLQHQLHIGQSKSYQRHSAASTSSSASSTSHYVDPEVSASYLAMGGSSVNASDSMDVCCVPSCESKRHNSENITFHTIPRRPEQMRKWCHNLKIPEDKMHKGMRICSRHFEPYCIGGCMRPFAVPTLHLGHDDEDIHRNPDVIKKLNIRETCCVAVCKRNRDRDHANLHRFPSNVALLTKWCANLQRPVPDGSKLFNDAICEVHFEDRCLRNKRLEKWAVPTLTLGHEDIAYPLPTPEQVAEFHSRPSAPNNGEEQGECCVETCKRNPSVDDIKLYRPPEEASVLAKWAHNLQTEAAQLVNQRICNLHFEAHCIGKRMRPWAIPTLNLAGNIENLYENPEPSMLYKRRMHAKAKLSASAKPTWVPRCCLPHCRKVRALHNVQLYRFPKHNRSTLAKWAHNLQVPMVGSAQRRVCSAHFEPHVLSKKCPVPLAVPTLDLNAPAGHMVYQNPAKLRASKLCLQRVCIVESCRKTRAQGVQLFRLPHNPSQLRKWMHNIRTRPRGSMRSQYRICSRHFETHSFNGRRLSAGAIPTLELGHDDDDIYPNEAQAFVDEHCAVEGCGASKEQPEVRLFRFPTDDDDMLWKWCNNLKMNPADCTGVRICNKHFEADCIGPKHLFKWAIPTQELGHDDAQIELIPNPKPEDRYVDPVFKCVVPTCGKTRRFDEVQMNSFPKDPELFQRWRHNLRLDHLHFHERERYKICNAHFEDVCIGKTRLNIGSIPTLELGHDETDDLFQVNPLELQSNLFGRQRRLLDGTESGEVMVKQELPDGEGDSEPEDIKPDIRQILISRPRQVKAKKGTLGNLKCCVRSCGRSRLQHGARLFAFPTGKQQHLKWRHNLRLEPEDVDRTTRVCSAHFNRRCIDGKQLRSWAMPTLQLGHREQPIYENPKNIPGFFTPTCALSHCRQRRSIDNDLRTYRYPRTEDLLEKWRANLRLTPDQCRGRICADHFEPMVRGKLKLKTGAVPTLKLGHDEGLIYDNEAIKAGMAEEEEVTCKQEILDEEEEGEGEESREGAPAVNEDEDDKDDSYFDPLELVETFAERASDDEAEDPEMEEKNEPDEGDEEEAEELLPDLPPTPPPVPQRREKPANNVTPICCLKHCRKERTAFHLLSTFGFPKDRKLLLKWCDNLHLHPDDIVGRVCIEHFEAEVLGTRKLKQNAVPTLNLGHDDPLRYTCHGVELDEDLEHGQPQHSVFRLWSLKHCRKRKLSDPPDIRLSHWKELKMHMQKQREMEMAMETDIVMSTPPQTPVKIKPKRCCVISCGSEDAKKLVTMPDERSLLRRWQHNLKLSVFTDPSLGLCLDHFEESLVQFGKPLDRAVPTLKLGHNSDNLYRNNASCLVPSCPSSDSDVTSFVSPPVNPVMRRAWLSYLQLPFPSEGLLCGNHFVELYEQVDLPEDLPVQDLEELERTVDELQCAVPGCESKNAREIPVQLVQLPHNEEELSKWLHNTKITYDYSRHGSYRICLLHFDPICLEEDFPQSWAVPTLNLGHEDDIHLNPVQNQAPEALNGTSNSNPWLTPLRIKTELASVSSPSVSASPSPRGKIRICCIPTCGQFGNSQVRLYRFPSEEQFLLQWLINTQQQPRLVDPMELYVCQAHFEADAIHKKHLRSWALPTLNLGHDGHVFQNARHNGTIAEALDIEEATKFIRERYCSVMSCFQPAGEEVRLFEYPEDMAIIRKWAVACKHRSMHARSHGLRVCQAHFAAECFDPGTGDLLEGSIPTLELNRDDIERHCLVRGCERDESGPRLRFYKLPKTGDQIQAWSNNMRIPPTELMQGDQRICERHFEAYCFGPCRGLRQGALPTLSLGHEEEVDLLPNPEKLRLGKQETCCVPGCDRVRQPDDIPFYCFPKLWPLARKWLHNIRLEKSSKDPLNKLRVCPAHFESDVQENDALLPEAMPTKQLGHSSEGIFLTNKQDRSFQNHKKSFPEVVCCYPNCTDLSRIQLMDLPDAAELRNAWLEHLEIKETHNDALQLCPLHYVILYEHSAKEFPEHVPDQLMEENYQNARNNRRVKIVSCAIKGCSMVKPRDGVQLHGMPVYKDILQMWVDNGQIDFSEQQRYMLKVCHRHFDPSCFIEERRLTSWSVPTLHLPGETIHQNPSKEEWLAIKQEKEEPEIKEEPLEPEMETENSLLEPIVKMEHMDSEEDDSQMQALEVLLEVGHVERLDSYEKIDKSPIAYPEHVIYKSNRSQYNANRCAVEGCEVTAEDVDGTIRLHKFPASADAAQKWMHNTQVDMEEKFWWRYRICSYHFHQECFQGSRIRKGAMPTLLLGPRRPDELYDNEFASQQEAEDPSLPVEMCQTSATERTAPDVTNLCLPPPAAPRKSSKFCQIEGCSNHLTTENITLHKFPHSEDMCIRWQHNTQVPFDPNHRWRYRICTAHFEPVCLANLRLLHGSVPTLKLGPKAPAQLFDNDFEAINQRLDKRSAAEIKQERVDMEDELHEDQMEVPSWKPVKQEKVTFNQIKSGYDKCSLAHCQRQRSLHGVHIYKFPRSQRQQERWMHNLRIRYDERRPWRFMICSVHFEPHCISLRKLRPWAVPTLELGTNVPEKIFTNEQCQELEVEQPSDRSEAESEEEDGLEEDDDGEDDEVAEEGLECNVRIKKERRSKLDPCPPGQVPPWKVKQCCLPYCRAFRGDGIKLFRLPNNRSSIRNWELATGMVFKESQRNTRLICSRHFDPELIGVRRLMRNAIPTLHLNPQAVTVKEKKISTSKPKDVPSSMPTCCMADCHHNGNAKLHKFPSDSTHLRQWCQALRLTDTQRYRGKYICSAHLPTNMSVSCVVCGVDDVQLPMLDFPENRNQRAKWCYNLKIETIPKWDRSKHICCRHFEAHCFARPGELRPGATPTVALNHNDTNIFLSDYATDPTTSYEGNQIKDEPMDGDETLLV

Similar Transcription Factors

Sequence clustering based on sequence similarity using MMseqs2

100% Identity: iTF_00475962;
90% Identity: iTF_00538995;
80% Identity: -