Basic Information

Insect: Drosophila picticornis
Gene Symbol: -
Assembly: GCA_035043845.1
Location: JAWNMR010000491.1:24721205-24735291[-]

Transcription Factor Domain

TF Family: THAP
Domain: THAP domain
PFAM: PF05485
TF Group: Zinc-Coordinating Group
Description: The THAP domain is a putative DNA-binding domain (DBD) and probably also binds a zinc ion. It features the conserved C2CH architecture (consensus sequence: Cys - 2-4 residues - Cys - 35-50 residues - Cys - 2 residues - His). Other universal features include the location of the domain at the N-termini of proteins, its size of about 90 residues, a C-terminal AVPTIF box and several other conserved residues. Orthologues of the human THAP domain have been identified in other vertebrates and probably worms and flies, but not in other eukaryotes or any prokaryotes [1].
Hmmscan Out: # of c-Evalue i-Evalue score bias hmm coord from hmm coord to ali coord from ali coord to env coord from env coord to acc

1 28 8.1e-15 1.2e-11 45.1 4.2 1 86 577 649 577 650 0.85

2 28 3.4e-15 5.1e-12 46.3 4.6 1 87 677 746 677 746 0.83

3 28 8.3e-16 1.2e-12 48.2 0.4 1 87 768 840 768 840 0.85

4 28 7.3e-16 1.1e-12 48.4 5.7 1 87 935 1005 935 1005 0.83

5 28 1e-14 1.5e-11 44.7 3.4 1 86 1029 1100 1029 1101 0.81

6 28 1.5e-12 2.2e-09 37.8 1.2 1 87 1136 1204 1136 1204 0.80

7 28 3.6e-11 5.3e-08 33.4 1.9 1 86 1252 1321 1252 1322 0.77

8 28 7.4e-17 1.1e-13 51.6 0.3 1 86 1349 1418 1349 1419 0.82

9 28 1.1e-12 1.7e-09 38.2 1.5 1 87 1440 1510 1440 1510 0.80

10 28 1.6e-15 2.4e-12 47.3 1.7 1 86 1537 1608 1537 1609 0.85

11 28 2e-13 3e-10 40.6 1.5 1 85 1680 1748 1680 1750 0.82

12 28 3.7e-12 5.5e-09 36.5 0.1 1 86 1773 1841 1773 1842 0.82

13 28 6e-14 9e-11 42.3 0.9 1 86 1992 2060 1992 2061 0.82

14 28 1.1e-11 1.7e-08 35.0 0.8 1 61 2114 2168 2114 2189 0.79

15 28 3.1e-05 0.047 14.3 0.1 1 58 2195 2246 2195 2270 0.79

16 28 3.9e-11 5.8e-08 33.3 0.1 1 86 2285 2354 2285 2355 0.83

17 28 3.3e-14 4.9e-11 43.1 1.3 1 87 2413 2483 2413 2483 0.81

18 28 1.9e-13 2.9e-10 40.7 0.9 1 86 2518 2589 2518 2590 0.83

19 28 2.1e-13 3.1e-10 40.6 0.9 1 87 2600 2672 2600 2672 0.81

20 28 5.4e-14 8.1e-11 42.4 0.1 1 87 2695 2766 2695 2766 0.77

21 28 2.7e-05 0.04 14.6 0.0 1 57 2799 2853 2799 2872 0.79

22 28 8.9e-15 1.3e-11 44.9 0.1 1 86 2892 2964 2892 2965 0.80

23 28 8.5e-14 1.3e-10 41.8 1.2 1 86 3099 3171 3099 3172 0.80

24 28 1.8e-14 2.7e-11 43.9 2.4 1 87 3235 3306 3235 3306 0.83

25 28 1e-14 1.5e-11 44.7 4.0 1 86 3419 3489 3419 3490 0.85

26 28 2.5e-13 3.8e-10 40.3 0.1 1 87 3584 3654 3584 3654 0.85

27 28 9.6e-10 1.4e-06 28.8 0.2 1 58 3671 3719 3671 3730 0.87

28 28 1.2e-08 1.8e-05 25.3 1.4 18 87 3736 3794 3725 3794 0.76

#	of	c-Evalue	i-Evalue	score	bias	hmm coord from	hmm coord to	ali coord from	ali coord to	env coord from	env coord to	acc
1	28	8.1e-15	1.2e-11	45.1	4.2	1	86	577	649	577	650	0.85
2	28	3.4e-15	5.1e-12	46.3	4.6	1	87	677	746	677	746	0.83
3	28	8.3e-16	1.2e-12	48.2	0.4	1	87	768	840	768	840	0.85
4	28	7.3e-16	1.1e-12	48.4	5.7	1	87	935	1005	935	1005	0.83
5	28	1e-14	1.5e-11	44.7	3.4	1	86	1029	1100	1029	1101	0.81
6	28	1.5e-12	2.2e-09	37.8	1.2	1	87	1136	1204	1136	1204	0.80
7	28	3.6e-11	5.3e-08	33.4	1.9	1	86	1252	1321	1252	1322	0.77
8	28	7.4e-17	1.1e-13	51.6	0.3	1	86	1349	1418	1349	1419	0.82
9	28	1.1e-12	1.7e-09	38.2	1.5	1	87	1440	1510	1440	1510	0.80
10	28	1.6e-15	2.4e-12	47.3	1.7	1	86	1537	1608	1537	1609	0.85
11	28	2e-13	3e-10	40.6	1.5	1	85	1680	1748	1680	1750	0.82
12	28	3.7e-12	5.5e-09	36.5	0.1	1	86	1773	1841	1773	1842	0.82
13	28	6e-14	9e-11	42.3	0.9	1	86	1992	2060	1992	2061	0.82
14	28	1.1e-11	1.7e-08	35.0	0.8	1	61	2114	2168	2114	2189	0.79
15	28	3.1e-05	0.047	14.3	0.1	1	58	2195	2246	2195	2270	0.79
16	28	3.9e-11	5.8e-08	33.3	0.1	1	86	2285	2354	2285	2355	0.83
17	28	3.3e-14	4.9e-11	43.1	1.3	1	87	2413	2483	2413	2483	0.81
18	28	1.9e-13	2.9e-10	40.7	0.9	1	86	2518	2589	2518	2590	0.83
19	28	2.1e-13	3.1e-10	40.6	0.9	1	87	2600	2672	2600	2672	0.81
20	28	5.4e-14	8.1e-11	42.4	0.1	1	87	2695	2766	2695	2766	0.77
21	28	2.7e-05	0.04	14.6	0.0	1	57	2799	2853	2799	2872	0.79
22	28	8.9e-15	1.3e-11	44.9	0.1	1	86	2892	2964	2892	2965	0.80
23	28	8.5e-14	1.3e-10	41.8	1.2	1	86	3099	3171	3099	3172	0.80
24	28	1.8e-14	2.7e-11	43.9	2.4	1	87	3235	3306	3235	3306	0.83
25	28	1e-14	1.5e-11	44.7	4.0	1	86	3419	3489	3419	3490	0.85
26	28	2.5e-13	3.8e-10	40.3	0.1	1	87	3584	3654	3584	3654	0.85
27	28	9.6e-10	1.4e-06	28.8	0.2	1	58	3671	3719	3671	3730	0.87
28	28	1.2e-08	1.8e-05	25.3	1.4	18	87	3736	3794	3725	3794	0.76

Sequence Information

Coding Sequence: atgtcacaacaacaacacaatccCCCTCCACAtcaccaacatcaacatcactactatcagcaacagcagcagcaacaacaacaacagcatcatctgcagcagcagcagcagcatttgcagcataaacaaatacaacaacaacagcacagtTGGTACTCACATGTTGCTTCCTATCCGCCCCCGCATGCCGCTGCCTTTGCGTCGCcctgcaaaagcagcagcagcagtagcaacaacaataacaacaacaacaaccacattaTGAATGCATACGGCACGGGTGCAGGAGCGTATTATGGCTCAACGGGAGCGGGTGGCGTTGGGGTTGGCTATAACCTTGAAGCCAATACTGTGGCCTATGCGCACAACCAGCTGCtgcaataccaacaacaacaacagcagcagcagcatcagcaacaacaacatcagcagcagcaacagcagcagcagctcagccAGCGCTCGTATATGCCACCACATATAATGCACAGCTCGTATCCGTACATTAAGAGCGAACCATTGGAGCCACTGCCCGaacgccaccagcagcagcagcagcaacagcagcagcaactctttCAGAATCCTATGGCACCGCCGCCAGCACCCGCCATTGCAAACCGTCATTCGCTCGATGCTAGTGGCGaaatgataattaaatCGGAACCCATTGACGAACATGCTTTCAAGTCCAACTATATCGATGATAATACTCCCTTTGCCGATTTTAGTAAATTTCCCGAATTCGGCGACGATATGCTAAATCCCAAGCTAGAGCTAAACGTCAAGGATGAGGCCTATGGAAACCAAAAAAACCCGCTGAACTACCCACGGCGTAAGCTCCAAACGGATCGCTCCGCGGAGAGTATGCCCATTTGTCAACGCTGCAAAGAGGTGTTCTTCAAGAAGCACATTTACCTGCGGCATGTGGCTGAGAGCAGTTGCAGCATACACGAGTATGAGTTCAAGTGCAACATTTGTCCCATGTCCTTTATGGGCGCCGATGAGCTGCAGAAGCACAAGCATCTGCATCGAACCGACAAGTTCTTCTGCCACAAATACTGTGGCAATCACTACGACTCGATTGCAGAGTGCGAATCGCACGAGTACATGGAGCACGAGAATGATAGCTTTGTGTGCAATATGTGCTCGGTTACGTTCCCCACACGGGAACAGCTGTCTGCCCATTTGCCGCAACACAAGTTCCAACATCGTTACGATTGCCCCATTTGCCGTTTGTGGTACCAAACGGCATTAGAGCTGCACGAGCATCGACTGGCGGCGCCCTACTTTTGTGGCAAGTATTACGCTGCagcacaccagcaacagcagcagcaacaacaacagcagcagcagcaacatacacaacaacatcagcaacagggCAACTACAAACTGCAGGATTGTCACATGGGCACTATTGAAAtgaCTCCACCGCAGCACAAGGCGAATGCGGCATTACCGGCAACGGCGGCGCTTAATTCGCTGTTGCAGCAACGCCAGGCGAACGCTGATGGCGCCGCTTTATATGCCTCGGCGCTGAAGAGCGAGACGAACGTAAAACTGGAGCGAAGCTATAGCAACTCCACCAGCGAGTCTGGTTACAGTATGCACGAGAGCAGCTATAACAATGCCTACGCCAGCGACAATTCTCTGCATGGCGGGGGCGGGGCAATTGGTGGTCCGCAGGCGCATTCCTCGACGCTGGACGATTCCGAGGATGCGCTGTGCTGCGTGCCACTTTGCGGGGTGCGCAAGAGCACAAGCCCGACGCTGCAATTCTTTACGTTTCCCAAAGATGACAAGTACTTGCATCAGTGGCTGCACAACCTCAAGATGTTCCACATTCCGGCGTCGAGCTATGCCAGCTTTCGCATCTGCAGCATGCACTTCCCTAAGCGTTGCATCAATCGTTACTCTCTGTGCTATTGGGCGGTGCCCACATTTAATCTGGGCCACGACGATGTGGCCAACCTCTATCAAAATCGTGAGCTGACCAACACATTCACCACCGGCGAGGTGGCCCGCTGCAGTATGCCAAACTGCACTAGTCAGCGTGGCGAGAGTAATCTGAAGTTCTACAACTTTCCCAAAGACATCAAGAGTTTGATTAAGTGGTGCCAAAACGCTCGCCTGCCCGTCCAGGCCAAGGAGCCGCGTCACTTCTGCAGTCGCCACTTTGAGGAGCGTTGCATCGGCAAGTTCCGGCTGAAGCCTTGGGCAGTGCCCACGTTACACCTCGGCGCCCAGTACGGCAAGATTCATGACAATCCGAAAAATCTGTATGTGGAGGAGAAGCGCTGCTGCCTCAACTTTTGTCGTCGCAGTCGCTCCTCCGACTTTAACATGTCGCTGTATCGCTTCCCCAGGGATGAGGTGCTACTGCGTCGTTGGTGCTACAATCTTCGCCTTGATCCGGCTGTCTATCGTGGCAAGAATCACAAAATTTGTAGCGCCCACTTTATCAAAGAAGCTTTGGGATTACGCAAACTATCTCCGGGCGCTGTGCCCACGCTGCATCTGGGTCATAATGACACGTTTAACATCTACGAAAACGAACTGTGGCCACCGCCGACGCCCTCCACGCCCACCCAcaatcatcagcagcagctgcagcaacaccagttgcagcaacagccgcaacaagTGCATCATAAATATCAGCGGCACTCGGCTGCATCCACATCCTCGTCGGCCTCATCGACATCGCATTATGTGGATCCGGAGCTAAGTGCATCCTACATGAGCATGGGCGCTGGAGGCTCATCGTCTGGCCTTAATGTCAGCGACAGCATGGATGTCTGCTGTGTGCCCAGCTGCGAGAGCAAGCGTCACAACAATGAGAATATCACATTCCACACAATACCCAGGCGGCCAGAGCAGATGCGCAAGTGGTGTCACAATCTTAAGATACCCGAGGACAAGATGCACAAGGGCATGCGGATATGTAGCTTGCACTTTGAGCCCTACTGCATTGGCGGCTGCATGCGTCCGTTTGCGGTGCCGACATTGCATCTGGGGCACGACGACGAGGACATTCACCGCAATCCGGATGTGATCAAGAAGCTTAACATACGCGAAACTTGCTGCGTGGCTGTTTGCAAACGAAATCGTGACCGGGATCATGCCAATCTGCATCGCTTTCCCAGCAATGTGCCGCTGTTGACCAAATGGTGCGCAAATCTGCAGCGTCCTGTGCCGGATGGCAGTAAACTTTTCAATGATGCCATCTGCGAGGTGCACTTTGAGGATCGATGCCTGCGCAACAAACGGCTGGAGAAGTGGGCAGTGCCCACACTCATCCTTGGGCATGAGAATATACCTTATCCGCTGCCCACGGCGGAGCAAGTTGCCGAGTTCTATGCGCGTCCCACTGCGCCTAACAATGGCGAGGAGCAGGGCGAGTGCTGTGTGGAGACGTGCAAGCGTAATCCCAGTGTTGATGACATCAAGCTATATCGCCCGCCCGAGGAGTCGCAGGTGCTGGTAAAGTGGGCGCACAATCTCCAACTGGAGATCGCCCAGCTGCCCAATATGAGAATATGTAATCTTCATTTTGAATCCCACTGCATTGGCAAGCGGATGCGTCCCTGGGCAATACCCACGCTCAATCTGGCAACCAACATAGAGAATCTCTACGAGAATCCTGAACACCAGATGCTCTACAAGCGACGCACGCATCTCAAGCCGGGCAGAGCAGCGAGAGGATCTGAAGCAGGCGCTGGTGGTGTGAAGCCCACCTGGGTGCCacgctgctgcttgccacactgCCGCAAGGTGCGTGCCACGCACAATGTCCAGCTGTACCGCTTCCCCAAACTCAATCGCTCCACGCTGGCCAAGTGGGCTCATAATCTGCAGGTGCCGCTCGTGGGCAGCGCTCAGCGTCGCCTCTGCTCCGCACACTTTGAGCCACATGTGCTCAGCAAGAAATGCCCGGTGCCCATGGCGGTGCCCACACTGGACCTCAATACACCATCCGGCTACAAGATCTATCAGAATCCGGCCAAGCTCAAGGCGAATAAGCTGTGCTTGCAGCGTGTCTGCATTGTGGAGAGCTGCCGGCGTCAGCGGGCGCAGGGGGTGCAGCTCTTCCGTCTGCCTCACAGCCCCACCCAGCTGCGTAAGTGGATGCACAACATCCGGATGCGTCCCCGAGGAGCTATGCGACAACAGTATCGCATCTGCTCGAAGCACTTCGAGACGCACTCGTTCAATGGGAAGAGACTCAGTGCGGGTGCAATTCCAACGCTTGAGTTGGGCCATGATGACGAAGACATATTTCCGAATGAGGCGCAGTCTTTCGTGGAGGAGCACTGCACCGTCGAGGGTTGCGATGCCGCCAAGGAGCAAGCGGATGTGCGTCTCTTCCGTTTCCCCAACGACGACGAGGATCTGCTCTGGAAGTGGTGCAACAATCTGAAAATGAGTCCGGTCGACTGCATCGGCGTTCGCATCTGCAACAGACACTTCGAGACAGATTGCATTGGACCAAAGCACCTGTTTAAGTGGGCCATTCCCACGCTCCACCTCGGccacgatgatgatgacatcGAGCTGATGCTGAATCCCAAGCCGGAGGAGCGCTATATTGATCCGGTCTTTAAGTGCTGTGTGCCCTCATGCGGCAAGACGCGTAAATTCGATGAAGTGCAGATGAACAGCTTCCCCAAAGATCCGGAGCTCTTCCAGCGCTGGCGCCACAATCTCCGCCTTGAGCATCTCAACTTCAAGGAGCGCGAACGCTATAAGATCTGCAACGCCCACTTCGAGGACATTTGCATTGGTAAGACGCGCTTGAACATTGGTTCCATACCGACACTGGAGCTTGGCCATGACGAGACTGATGACTTGTTCCAAGTCAACCCCGAGGAGCTGCAGAGCAATCTCTTTGGACGCCAGAGACGCGTGCAGGATTCCATGAGGATCAACATTAAGCAGGAGTCGCACTCCGACCTCGATGAAGACACTAAGCCGGACATTAGCATGTCAAATGCAACACAGgTTAAAATCAAGAAATCTGTGACCGATTTCAAGTGCTGTGTGCCGAGCTGTGGTCGCAGTCGCCTGGAGCATGGTGCCCGGCTCTTTCCGTTTCCGAACgggaaacagcagcagagcaagTGGCGCCACAATCTCCGGCTGCCTGCTGCCGACGTGGATAAGACGACGCGCATCTGCAGCGCCCACTTCAATCGCCGTTGCATCGATGGCAATCAGCTAAGGGGCTGGGCAATGCCTACACAGCAGCTGGGCCATCAGGAGCTGCCAATCTATGAGAATCCAAAGAATATACCGGGCTTCTTTACGCCCACCTGTGCGCTGGCGCACTGCCGCAAGCGGCGCAGCATTGACAACGATCTGCGTACCTATCGCTATCCACGCAGCGAGGAGCTGCTCGAGAAGTGGCGTGTCAATCTGCGCTTGTCGCCGGACCAATGCCGCGGACGCATCTGTGCGGATCATTTCGAGCCACTGGTGCGTGgcaagctgaagctgaagacGGGAGCAGTGCCTACGCTCAAATTGGGACACGACGAGGGCGTAGTCTTCGATAATGAGGCCATTAAGGCGGGTctgcagcaggaggaggaggcggaggaAGAAGAGGGCGATGCCAGCTTGAAGTCGTTGCTCAAAGTAAAGACTGAGCAGGAGGATGAGCAGGAGCTAGAGAATGAAGATGaagagcagcaggagcatGATCTGGAGCAGGATCAAGATATGGACGTGGAAGGGGAAGAGCATCGAGACTCTGAGGAACATGGCTATTTTGATCCCTTGGAACTTGTGGAAACCTACGCCGAGCACCACAGCGATGATAACTCTGCCGTACATGATAATctcaacgatgatgatgacgaagaTGACATTCCCGGCAATGACGATGAGCTGCTTCTGCCTGATACGCGGCCACTTCGAATGACAATGGCTCCGCGGCGCGAGAAGGCTGTGAATAATGTGACGCCCATTTGCTGTCTGAAGCACTGTCGCAAGGAGCGCACCGCCATCCATCATCTGAGCACCTTTGGCTTTCCCAAGGatccgcagctgctgctcaagtgGAGCGCCAATCTACAGCTGCCATTGGAGTCTTGCATGGGTCGTGTATGCGTCGAGCACTTTGAGCCCTCGATGCTGGGCACGCGCAAGCTGAAGCAGAATGCGGTGCCTACCTTGAAACTGGGCCATGCCACACCGCTCACCTACAGCTGCAATGGTCGGATGCTGTCGGGCATTTACGATGAACAGCCGCAGCATTCGGTTTTTCGGCTTTCGAGCCTGAAACACTGCCGCAAACGGAAACCGGATCTGGCGGAGATTAAGCCCAGTCGTCGCTGTTGCCTGCCAAGTTGCGGCAAGCAGTCGGAGTCGCATGGCGTCCAGCTGCAGCGTCTGCCCAAGGATCGTCTGATGCTGCGCAAATGGTTGCACAACCTGAAGCTGCCTCCAACGATGGACTGCACTCAAATGTTCCTGTGCAGCGATCACTTTGAGCTGAATGCGCCGTGTCCCACTTTGAAACTGGGCCACTCGGATACCAATATTTATCGCCACAATGTGGCTAGCACCAGCGGCAGCTGCCTGGTGCCCAAATGTACTTGTGCTCGTCTCAACCTCTATCGCGGCTATGATCTGCCTGCGCATCCGCAGGTGCAACAGGCTTGGCTGCACTGGTTGCAGCTGCCCCATCCACAGCCGTCGCCCAGGCACGCCCAGCTGTGTGTGATGCACTTTATGCAGCTCTACGAACTGGTGCCGCTGCCCGAATCGGTGCCAGATGTTGTGCGCAGGCAGCTGCGTGAGACTTACGAACTGATATCCAGCTCCAGCATGGCCATGAAGCTGCGTTGCGCTGTGCCCGGCTGCTACTCGAAGTATACGGACAATGTGCGTCTGACCAAGCTGCCCGTTTACCCCGACACCTGCGCCAAGTGGGTGCACAACACCAAGATTCAATATGATCCGGCCCGACATTATGTCTATCGCATCTGCATGTTGCACTTTGAGCCAGGCTGCCTGGGCCCAGTGCGTCCAAAAGTGTGGGCAATGCCAACGCTGCAGCTACACCACAACGATGCCAACATCTATTTAAATCCAAAGCTGGATGGCAGCCAAACACAGGCAGTCGTGCCGCTGGACCTGCCGCTGCGAATTAAAACTGAGCTGCCGATGTGCAACAGTCCCAGCTTTAGTGCGAGTGCCAGTCCCAGTCCGCGTGGCAAGCTGCGCACTTGCTGCATTCCCAGCTGCGGTCAGCAGGCTTCGGCCCTGACGCGTCTCTTTCGCTTTCCCAGCGCAGAGACGTCGATGCTGAAGTGGCTGGTGAAtacccagcagcagccgcgcTTTGTCGATGCACAACGGCTGTTCGTCTGCCAGGACCACTTCGAGGCGGAGGCCATTTGCAAGAATCAGCTGCGCAGCTGGGCGGTGCCAACACTGAATCTAGGACACGATGGACACATCATACCGAATGCCAAGCACAATGGCAACATTGCCGACAGCCAGGAGAACAAGCAGACGTTGCAGTTTATCTGGGCCAACTATTGTTCGGTGCTGACCTGCTTCCAGCAAAGTAGCGAGCACTTGCGTCTCTACCAATACCCCACGGATCGGCCGACCATCCGCAAGTGGGCCGCCAATTGTAAGCATCGCTCCATGCAGGCCAGCAGTGATGGATTCCAGGTGTGCCAGTCGCATTTTACACCGGATTGCTTTGATTCCGATACCGGGGAGCTGAAGGAGGACGCTGTGCCCACACTGGCGCTGAGCCGCTCAGTCACTGAGATGCGCTGTGTGGTCAACGGTTGCGTTAAAGACGAAGATGCATCGCGTCGCCGTCTGTTCAAGATGCCCAAGCGTGCCCCACAGATATTGGATTGGTGCCACAATTTGCGACTGGATCAGGCGGCCATGAGCGGCTCGGAGCAGCACGTTTGTGAACGGCACTTCGAGGCGAACTGCTTCAATGCGTCTAGAGTGCTGCGTCCAGGAGCACGACCCACACTTCATTTAGGTCATGAGGACTTAGACGATGTGATACCCAATCCGGCGAACTGGGAAGAGGATGTGATAGTGTGCTGTGTGCCGCACTGCGAAAGCTCCAAGGATGCGGATGAAGTGCAACTGTTTGGGCTGCCAAAGGTGCGCCAGTTGGCGGATAAGTGGCTTCAAAATGTGCGCCTCGATCCGAGCAAGGAGCAACTGGCCGGCCTGAAGATCTGCAGTGTGCACTTTGAGGCGAGCTGCATGGAGAATGGACGACCCACCTATGGTGCAATGCCCACACTCCATCTCGGTCACGATGAGCTCGACAATATACACCCAAGCGTAGAGTCGGTGCCGACGCAGCTGAAGCGATACTGCAATAGAGATGGCGCCAGTCACGATTGTTGCTATCCGCAGTGCGTGGAGCTGCAGAAGAGCTATTTGCGGGTCACCTACGAGCTGCCACAGGAGCAGGAGCTCCGTCAGCAGTGGCTCTCCTATATGGGGATGGACCTAGAAGCGCAGCAGCTCgataagcagcagctgctcaagcTCTGTCCACTTCACCTAATCTTGCTCTACGATCACAGTGCGGATCACTTTTCAGCACACGCCGCTGAGGAGCTGTTGGACTCCAATTATGAGGCAGCGCGCAGCAGCGTTCGCATACGCGTTGTCAGCTGTGCTGTGCGCGGCTGCAGAACGCTCAAACCACGCGACGGTGGTCGGCTGCATGGTTTGCCCACGCGGCGAGATCTGCTGGAGATGTGGCTGCACAACATGCAGTTGGTGTTTTACGAGCAACAGCGTTATATGTACAAGATTTGCAGCAAGCACTTTGAGTCCACATGCTTCACGGAGACAACAAAACGGCTGAAGCCGTGGAGCATGCCTACGCTGGAGTTGCCGGAGCGCCAACCGGACGAGATGCCCGCATATCAGAATCCCACTGAGTTGGAGTGGCAACACATGAATGAGCTGCAGGTCAGCGAGAAAGTTGTTGAGGCTCTGCCAGAGCCATTACTCAAGGTGGATCCGTTGCCCAAGAAGGAGCCACCAGCACCGCAGGTTATGGAATATGAAGAGGATTGCGACAATAACTCGCAGCAGCCACTGGAAATGCAGGCGTTGGAGGTGCTGCTCGAAGTGGGCCATGTCGAGAAGTGCACTACCTACGAGCAAATGGATACCGAGGCTAATCTCAGCTATGCCGAGCAGTTCTCTCATAATCCCCTCAGTCCAGGTCCACCCCAATGCCGTATCCCCGTTGTCCAGAATGGACTCCACTACAGTGCACGGCACTGCAGCGTGCATGGCTGCAATGTCGCCTCAAATAatctgagcagcagcatcaagcTACACAAGTTCCCCGTCTCGCTGGATGCCATGCAAAAGTGGATGCACAACACCCAGGTGCTCGTGGACGTCAAATTCGCTTGGCGTTTTCGCATCTGCAGTCATCATTTCATCGAGGATTGCTTCCACGGCTCGCGCATCAGACGTGGGGCGATGCCCACGTTGCGACTGGGCTCACGTCGACCGAAGCATATCTATGATAATGAGTTCAACGcccaactgcaactggaacAGTCGAAAGAAGAAGCCAGGGAGGCTCTCGCTGCCCCGCTGGAGTctcagcaacagttgctctcTGCGAATGTAGGTCTTCGTTTGCCGCGTCCAGCCCCGCCTTGCAAATCCAGCAAATACTGTCAGATCGAGGGCTGCTCCAATCATTTGACCAGCGAGAATGTGACACTGCACAAGTTCCCCCACTCGTCGGATATGTGTGCCAAGTGGCAGCACAACACTCAGGTGCCCTTCGATCCCGAGTTCCGTTGGCGCTATCGCATCTGCAGCGCACACTTTGAGCCCATCTGTCTAGGCAATGTGCGACTGATGCACGGCAGTGTGCCCACCCTAAATCTGGGACCGCTTGCGCCGAAGAAACTGTTTGACAATGAATTCTTGCGTCTGGACAAGCCAATGAGCAGTTCGGAGCTGGGTATGACTGTCAAACAGGAACAAATGGAGCAATTTGatgagctggagctggaaGATGGCAACCAGGAGCAGGATGATTTCAGTCCGCTGGAGCCCGAGCTGCAGTTGCATGAGGGTAGCGAGGATGAGCAACAATGTGACAATTATTTTAGTCAAAACGATTCCTATAACTGGTCCGATCAGCAGCTGCGTCTGCCAAGCATTAATCAGGACAAGTGCACCACCAGCTATAATCCGGTCAAGTCCGGCTATGATAAATGCTCACTGGTCCACTGCCAACGACAGCGTTCCCAGCACGGCGTGCACATCTACAAGTTTCCACGCTCGCGTCAGCTACAGCAACGATGGATGCATAATTTGCGCATCCAATATGATGAGCGACGGCCGTGGAAGACAATGATATGCAGTGTCCATTTCGAGCCGCACTGCATCCGTCTGCGCAAGTTGCGCCCCTGGGCGGTGCCCACGCTAGAACTGGGGGACAATGTGCCGGTAGAGATCTTTACGAATGAGCAGAGCCAGCAGCTGTTTGCTCAGTCCGAAGCAGGCAGCGAGTGTGATGAGGTTGAAGTGGATTTTGAGGACACCATACTGGAGGACTTGGATGATGACTATGATGACAATGATGCTGATGtgaatgtaaatgtgaatGCTGGTGATCAAATGCGAACAGCTCCATATGTCAAACGAGAGCGTCGCTCTCGATTTGATTGTCTGCCACCGGGTCAGCTGCCACCGTGGAAGATCAAATGCTGCTGTTTACCCTATTGTCGCAGTCCTCGCGGTGATGGCATCAAGCTCTTTCGACTGCCCAACAACATCAGCTCCATACGTAAATGGGAGCAGGCCACAGGCATGCGCTTCTATGAGTCCCAGCGCAACACAAAGCTCATCTGCAGTCGACACTTTGATCCGCAACTTATAGGCGTGCGTCGCCTCATGTCCAATGCGGTACCCAGCCTCCATTTGGGGCCAGACAGCGCAGAGCCCGAGCTGCCTCCTGTAGGACCACTTTGCTGCATGCCCGATTGCTCTGAGGATGTCGATGTCCAGCTGCACAAGTTTCCCAAAGATCCCATGCTGCTGCATCAATGGTGTCAGGCGCTCAATCTACCGGATGTTCAAAGCTACTCCGGCAAACTTATTTGTGCGGCACATCTGCCCTCCAACGCGATGAGCTGTCTAATTTGTGGCGTGGACGATGTACAGCTGCCAATGCTGGACTTTCCCCAGAATCGCAATCAGCGCACCAAGTGGTGCTATAATCTGAAAATCGAGCCTCTGCCTAAATGGGACAACTCAAAGCAAATTTGCTGCAAACACTTTGAGAGCTTTTGCTTTATCCAACCCGGCCAACTCCTGGCGGACGCATTGCCAACGCTTCACTTGGAGCACGGGGATAGCAACATATTCGTAAACGATGAAGCCATGGATAATAGCAAGTTGTTGCGCATCAAGGACGAGCCCATGGAGAGCGAGGATCTGATGCTGTAA
Protein Sequence: MSQQQHNPPPHHQHQHHYYQQQQQQQQQQHHLQQQQQHLQHKQIQQQQHSWYSHVASYPPPHAAAFASPCKSSSSSSNNNNNNNNHIMNAYGTGAGAYYGSTGAGGVGVGYNLEANTVAYAHNQLLQYQQQQQQQQHQQQQHQQQQQQQQLSQRSYMPPHIMHSSYPYIKSEPLEPLPERHQQQQQQQQQQLFQNPMAPPPAPAIANRHSLDASGEMIIKSEPIDEHAFKSNYIDDNTPFADFSKFPEFGDDMLNPKLELNVKDEAYGNQKNPLNYPRRKLQTDRSAESMPICQRCKEVFFKKHIYLRHVAESSCSIHEYEFKCNICPMSFMGADELQKHKHLHRTDKFFCHKYCGNHYDSIAECESHEYMEHENDSFVCNMCSVTFPTREQLSAHLPQHKFQHRYDCPICRLWYQTALELHEHRLAAPYFCGKYYAAAHQQQQQQQQQQQQQHTQQHQQQGNYKLQDCHMGTIEMTPPQHKANAALPATAALNSLLQQRQANADGAALYASALKSETNVKLERSYSNSTSESGYSMHESSYNNAYASDNSLHGGGGAIGGPQAHSSTLDDSEDALCCVPLCGVRKSTSPTLQFFTFPKDDKYLHQWLHNLKMFHIPASSYASFRICSMHFPKRCINRYSLCYWAVPTFNLGHDDVANLYQNRELTNTFTTGEVARCSMPNCTSQRGESNLKFYNFPKDIKSLIKWCQNARLPVQAKEPRHFCSRHFEERCIGKFRLKPWAVPTLHLGAQYGKIHDNPKNLYVEEKRCCLNFCRRSRSSDFNMSLYRFPRDEVLLRRWCYNLRLDPAVYRGKNHKICSAHFIKEALGLRKLSPGAVPTLHLGHNDTFNIYENELWPPPTPSTPTHNHQQQLQQHQLQQQPQQVHHKYQRHSAASTSSSASSTSHYVDPELSASYMSMGAGGSSSGLNVSDSMDVCCVPSCESKRHNNENITFHTIPRRPEQMRKWCHNLKIPEDKMHKGMRICSLHFEPYCIGGCMRPFAVPTLHLGHDDEDIHRNPDVIKKLNIRETCCVAVCKRNRDRDHANLHRFPSNVPLLTKWCANLQRPVPDGSKLFNDAICEVHFEDRCLRNKRLEKWAVPTLILGHENIPYPLPTAEQVAEFYARPTAPNNGEEQGECCVETCKRNPSVDDIKLYRPPEESQVLVKWAHNLQLEIAQLPNMRICNLHFESHCIGKRMRPWAIPTLNLATNIENLYENPEHQMLYKRRTHLKPGRAARGSEAGAGGVKPTWVPRCCLPHCRKVRATHNVQLYRFPKLNRSTLAKWAHNLQVPLVGSAQRRLCSAHFEPHVLSKKCPVPMAVPTLDLNTPSGYKIYQNPAKLKANKLCLQRVCIVESCRRQRAQGVQLFRLPHSPTQLRKWMHNIRMRPRGAMRQQYRICSKHFETHSFNGKRLSAGAIPTLELGHDDEDIFPNEAQSFVEEHCTVEGCDAAKEQADVRLFRFPNDDEDLLWKWCNNLKMSPVDCIGVRICNRHFETDCIGPKHLFKWAIPTLHLGHDDDDIELMLNPKPEERYIDPVFKCCVPSCGKTRKFDEVQMNSFPKDPELFQRWRHNLRLEHLNFKERERYKICNAHFEDICIGKTRLNIGSIPTLELGHDETDDLFQVNPEELQSNLFGRQRRVQDSMRINIKQESHSDLDEDTKPDISMSNATQVKIKKSVTDFKCCVPSCGRSRLEHGARLFPFPNGKQQQSKWRHNLRLPAADVDKTTRICSAHFNRRCIDGNQLRGWAMPTQQLGHQELPIYENPKNIPGFFTPTCALAHCRKRRSIDNDLRTYRYPRSEELLEKWRVNLRLSPDQCRGRICADHFEPLVRGKLKLKTGAVPTLKLGHDEGVVFDNEAIKAGLQQEEEAEEEEGDASLKSLLKVKTEQEDEQELENEDEEQQEHDLEQDQDMDVEGEEHRDSEEHGYFDPLELVETYAEHHSDDNSAVHDNLNDDDDEDDIPGNDDELLLPDTRPLRMTMAPRREKAVNNVTPICCLKHCRKERTAIHHLSTFGFPKDPQLLLKWSANLQLPLESCMGRVCVEHFEPSMLGTRKLKQNAVPTLKLGHATPLTYSCNGRMLSGIYDEQPQHSVFRLSSLKHCRKRKPDLAEIKPSRRCCLPSCGKQSESHGVQLQRLPKDRLMLRKWLHNLKLPPTMDCTQMFLCSDHFELNAPCPTLKLGHSDTNIYRHNVASTSGSCLVPKCTCARLNLYRGYDLPAHPQVQQAWLHWLQLPHPQPSPRHAQLCVMHFMQLYELVPLPESVPDVVRRQLRETYELISSSSMAMKLRCAVPGCYSKYTDNVRLTKLPVYPDTCAKWVHNTKIQYDPARHYVYRICMLHFEPGCLGPVRPKVWAMPTLQLHHNDANIYLNPKLDGSQTQAVVPLDLPLRIKTELPMCNSPSFSASASPSPRGKLRTCCIPSCGQQASALTRLFRFPSAETSMLKWLVNTQQQPRFVDAQRLFVCQDHFEAEAICKNQLRSWAVPTLNLGHDGHIIPNAKHNGNIADSQENKQTLQFIWANYCSVLTCFQQSSEHLRLYQYPTDRPTIRKWAANCKHRSMQASSDGFQVCQSHFTPDCFDSDTGELKEDAVPTLALSRSVTEMRCVVNGCVKDEDASRRRLFKMPKRAPQILDWCHNLRLDQAAMSGSEQHVCERHFEANCFNASRVLRPGARPTLHLGHEDLDDVIPNPANWEEDVIVCCVPHCESSKDADEVQLFGLPKVRQLADKWLQNVRLDPSKEQLAGLKICSVHFEASCMENGRPTYGAMPTLHLGHDELDNIHPSVESVPTQLKRYCNRDGASHDCCYPQCVELQKSYLRVTYELPQEQELRQQWLSYMGMDLEAQQLDKQQLLKLCPLHLILLYDHSADHFSAHAAEELLDSNYEAARSSVRIRVVSCAVRGCRTLKPRDGGRLHGLPTRRDLLEMWLHNMQLVFYEQQRYMYKICSKHFESTCFTETTKRLKPWSMPTLELPERQPDEMPAYQNPTELEWQHMNELQVSEKVVEALPEPLLKVDPLPKKEPPAPQVMEYEEDCDNNSQQPLEMQALEVLLEVGHVEKCTTYEQMDTEANLSYAEQFSHNPLSPGPPQCRIPVVQNGLHYSARHCSVHGCNVASNNLSSSIKLHKFPVSLDAMQKWMHNTQVLVDVKFAWRFRICSHHFIEDCFHGSRIRRGAMPTLRLGSRRPKHIYDNEFNAQLQLEQSKEEAREALAAPLESQQQLLSANVGLRLPRPAPPCKSSKYCQIEGCSNHLTSENVTLHKFPHSSDMCAKWQHNTQVPFDPEFRWRYRICSAHFEPICLGNVRLMHGSVPTLNLGPLAPKKLFDNEFLRLDKPMSSSELGMTVKQEQMEQFDELELEDGNQEQDDFSPLEPELQLHEGSEDEQQCDNYFSQNDSYNWSDQQLRLPSINQDKCTTSYNPVKSGYDKCSLVHCQRQRSQHGVHIYKFPRSRQLQQRWMHNLRIQYDERRPWKTMICSVHFEPHCIRLRKLRPWAVPTLELGDNVPVEIFTNEQSQQLFAQSEAGSECDEVEVDFEDTILEDLDDDYDDNDADVNVNVNAGDQMRTAPYVKRERRSRFDCLPPGQLPPWKIKCCCLPYCRSPRGDGIKLFRLPNNISSIRKWEQATGMRFYESQRNTKLICSRHFDPQLIGVRRLMSNAVPSLHLGPDSAEPELPPVGPLCCMPDCSEDVDVQLHKFPKDPMLLHQWCQALNLPDVQSYSGKLICAAHLPSNAMSCLICGVDDVQLPMLDFPQNRNQRTKWCYNLKIEPLPKWDNSKQICCKHFESFCFIQPGQLLADALPTLHLEHGDSNIFVNDEAMDNSKLLRIKDEPMESEDLML

Similar Transcription Factors

Sequence clustering based on sequence similarity using MMseqs2

100% Identity: iTF_00595971;
90% Identity: iTF_00500343;
80% Identity: -