Basic Information

Insect: Drosophila santomea
Gene Symbol: -
Assembly: GCA_016746245.1
Location: NC:7717613-7731844[-]

Transcription Factor Domain

TF Family: THAP
Domain: THAP domain
PFAM: PF05485
TF Group: Zinc-Coordinating Group
Description: The THAP domain is a putative DNA-binding domain (DBD) and probably also binds a zinc ion. It features the conserved C2CH architecture (consensus sequence: Cys - 2-4 residues - Cys - 35-50 residues - Cys - 2 residues - His). Other universal features include the location of the domain at the N-termini of proteins, its size of about 90 residues, a C-terminal AVPTIF box and several other conserved residues. Orthologues of the human THAP domain have been identified in other vertebrates and probably worms and flies, but not in other eukaryotes or any prokaryotes [1].
Hmmscan Out: # of c-Evalue i-Evalue score bias hmm coord from hmm coord to ali coord from ali coord to env coord from env coord to acc

1 28 2.8e-15 4.2e-12 46.3 3.9 1 86 549 621 549 622 0.85

2 28 1.1e-14 1.7e-11 44.3 5.0 1 87 649 718 649 718 0.83

3 28 1e-15 1.6e-12 47.6 0.2 1 87 740 812 740 812 0.85

4 28 4.8e-16 7.2e-13 48.7 5.5 1 87 910 980 910 980 0.82

5 28 7.2e-15 1.1e-11 44.9 3.3 1 86 1004 1075 1004 1076 0.82

6 28 3.6e-13 5.5e-10 39.5 1.3 1 87 1111 1179 1111 1179 0.80

7 28 9.2e-11 1.4e-07 31.8 1.4 1 86 1219 1288 1219 1289 0.76

8 28 5e-17 7.7e-14 51.9 0.4 1 86 1316 1385 1316 1386 0.83

9 28 7.2e-13 1.1e-09 38.5 1.5 1 85 1407 1475 1407 1477 0.81

10 28 1.9e-13 2.9e-10 40.4 0.6 1 86 1504 1575 1504 1576 0.84

11 28 7.1e-13 1.1e-09 38.6 3.2 1 85 1652 1720 1652 1722 0.83

12 28 6.7e-13 1e-09 38.6 0.1 1 87 1745 1814 1745 1814 0.82

13 28 3e-13 4.6e-10 39.7 2.4 1 87 1947 2016 1947 2016 0.80

14 28 7.9e-10 1.2e-06 28.8 0.0 1 86 2118 2184 2118 2185 0.78

15 28 8.3e-06 0.013 15.9 0.0 1 58 2200 2247 2200 2262 0.80

16 28 6.4e-13 9.7e-10 38.7 1.0 1 87 2277 2347 2277 2347 0.83

17 28 4.8e-12 7.3e-09 35.9 0.7 1 87 2403 2473 2403 2473 0.83

18 28 2.1e-11 3.2e-08 33.8 0.2 1 86 2508 2579 2508 2580 0.81

19 28 5e-12 7.6e-09 35.8 0.0 1 86 2590 2661 2590 2662 0.79

20 28 1e-11 1.6e-08 34.8 0.0 1 86 2686 2756 2686 2757 0.79

21 28 1e-05 0.016 15.6 0.2 1 58 2790 2837 2790 2863 0.76

22 28 1.2e-13 1.8e-10 41.1 0.2 1 87 2875 2948 2875 2948 0.83

23 28 4.4e-16 6.7e-13 48.8 0.4 1 86 3064 3136 3064 3137 0.82

24 28 8.7e-13 1.3e-09 38.3 3.1 1 86 3195 3265 3195 3266 0.81

25 28 5.8e-14 8.8e-11 42.0 4.1 1 86 3363 3433 3363 3434 0.84

26 28 1.5e-11 2.3e-08 34.3 0.1 1 86 3513 3582 3513 3583 0.84

27 28 1.1e-10 1.7e-07 31.5 1.5 1 58 3606 3654 3606 3666 0.84

28 28 1.2e-09 1.9e-06 28.2 1.1 19 87 3673 3730 3662 3730 0.76

#	of	c-Evalue	i-Evalue	score	bias	hmm coord from	hmm coord to	ali coord from	ali coord to	env coord from	env coord to	acc
1	28	2.8e-15	4.2e-12	46.3	3.9	1	86	549	621	549	622	0.85
2	28	1.1e-14	1.7e-11	44.3	5.0	1	87	649	718	649	718	0.83
3	28	1e-15	1.6e-12	47.6	0.2	1	87	740	812	740	812	0.85
4	28	4.8e-16	7.2e-13	48.7	5.5	1	87	910	980	910	980	0.82
5	28	7.2e-15	1.1e-11	44.9	3.3	1	86	1004	1075	1004	1076	0.82
6	28	3.6e-13	5.5e-10	39.5	1.3	1	87	1111	1179	1111	1179	0.80
7	28	9.2e-11	1.4e-07	31.8	1.4	1	86	1219	1288	1219	1289	0.76
8	28	5e-17	7.7e-14	51.9	0.4	1	86	1316	1385	1316	1386	0.83
9	28	7.2e-13	1.1e-09	38.5	1.5	1	85	1407	1475	1407	1477	0.81
10	28	1.9e-13	2.9e-10	40.4	0.6	1	86	1504	1575	1504	1576	0.84
11	28	7.1e-13	1.1e-09	38.6	3.2	1	85	1652	1720	1652	1722	0.83
12	28	6.7e-13	1e-09	38.6	0.1	1	87	1745	1814	1745	1814	0.82
13	28	3e-13	4.6e-10	39.7	2.4	1	87	1947	2016	1947	2016	0.80
14	28	7.9e-10	1.2e-06	28.8	0.0	1	86	2118	2184	2118	2185	0.78
15	28	8.3e-06	0.013	15.9	0.0	1	58	2200	2247	2200	2262	0.80
16	28	6.4e-13	9.7e-10	38.7	1.0	1	87	2277	2347	2277	2347	0.83
17	28	4.8e-12	7.3e-09	35.9	0.7	1	87	2403	2473	2403	2473	0.83
18	28	2.1e-11	3.2e-08	33.8	0.2	1	86	2508	2579	2508	2580	0.81
19	28	5e-12	7.6e-09	35.8	0.0	1	86	2590	2661	2590	2662	0.79
20	28	1e-11	1.6e-08	34.8	0.0	1	86	2686	2756	2686	2757	0.79
21	28	1e-05	0.016	15.6	0.2	1	58	2790	2837	2790	2863	0.76
22	28	1.2e-13	1.8e-10	41.1	0.2	1	87	2875	2948	2875	2948	0.83
23	28	4.4e-16	6.7e-13	48.8	0.4	1	86	3064	3136	3064	3137	0.82
24	28	8.7e-13	1.3e-09	38.3	3.1	1	86	3195	3265	3195	3266	0.81
25	28	5.8e-14	8.8e-11	42.0	4.1	1	86	3363	3433	3363	3434	0.84
26	28	1.5e-11	2.3e-08	34.3	0.1	1	86	3513	3582	3513	3583	0.84
27	28	1.1e-10	1.7e-07	31.5	1.5	1	58	3606	3654	3606	3666	0.84
28	28	1.2e-09	1.9e-06	28.2	1.1	19	87	3673	3730	3662	3730	0.76

Sequence Information

Coding Sequence: ATGTCACAACAACACCCCCATCACGCCCACCCCCACCACTACGCACAACACTACCCGCCGCCCGCGACGCCCATGTccctgcagcaacagcagcagcagcaagcgcAGCTGCCgcctcagcagcagcacgccAATTGGTACTCACATGTTGCTTCCTACCCCACACCCCACTCGGCCTTCGGCCCCGCCCCCTCTTGCAAggccaccaacaacaacatcatGGGCGGCGGGGGATACGCGCCAGGGGGTGGTGGCACGCAGAGCTATTATGGCGCCGCTGGCGGCGGCCTCAATGTCAGTGGGGcggttgtgggtggtggtggtccaAGCTACGGCCTTGGGGCCAATACAGTGGCATATGCCCACAACCAACTGCTGCAgtatcaacaacaacaacaacaacaacagcagcagcagcaacaacaacagcagcatcatcatctTCCACAGCATATAAGCCAACAGAGGCCCTATATGGGCCACAATATCATGACCGGCAGCTATCCTTATATCAAAAGCGAACCCATGGAGGCCTACCAGCAGCCCCCGAATCCTATGGCCCCGCCACCGGCACCAGAAGTATTAATCAAATCGGAACCCATGGACGAGCATTCCTATAAGTCTAACTATATAGACGACAATACGCCATTTGCTGACTTTAGCAAGTTCAGCGAATTCAGCGAGGACATGCTGAGCCCCAAAGTGGAGCTGACCGTGAAGGATGAGTCCTACGGAAAGAGCACTAGCAGTTTCCTGCGGCGCAAACAACAATCGGATCGGGGCACCGAAAGCTTGCCCATCTGCCAGCGCTGCAAGGAGGTCTTTTTTAAGAAGCAGGTCTATGTTCGCCATGTGGCCGAGAGCAACTGCGGAATCCAGGAGTACGACTTCAAGTGCAGCACCTGTCCCATGTCGTTCATGACCACCGAGGAGTTGCAGCGGCACAAGCTCCACCACCGGGCCGACAGATTCTTCTGCCACAAGTACTGCGGCAAGTACTTTGACACGATCGCAGAGTGCGAGGCACATGAGTACATGCAACACGAGTACGATGCCTTTGTCTGCAACATGTGCTCCGGCACCTTCGCTACGCGGGAGCAACTGTACGCCCACCTGCCGCAGCATAAGTTTCAGCAGCGCTTCGACTGTCCCATCTGCCGTCTATGGTATCAGACGGCTGTAGAGCTTCACGAACATCGTCTGGCTGCGCCCTATTTCTGTGGCAAGTACTACACGGCGGGACAGGCATCCTCTGCCTCCCTGTCGCAGtcgcaggcgcagcagcacCAGACCAATTACAAGCTGCAGGACTGCCATATGGCGACCATGGAAATGACCACAACCACGCACCACAAAACAGCTCCATCCGGCTCGTCCTTGCCGGCGACGGCTGCGCTGAATTCTCTACTGCAACAGCGTCAGGCAAATGCCGATGGAGCTGCCATGTTCGCAGCATCCGCAATAAAGAACGAAGTGAATGTTAAGATGGAGCGGAGCTACAGCAACTCTACCAGCGAGTCATCCTACAGCGTTCAGGACAGTGGGTACAATAACACCTATGGAAGCGACAGCTCAATGCAAGCAGGAGCGATCGCCGGACCACAAGCGCACTCCTCAACGCTGGACGACTCGGAAGACGCCTTGTGCTGTGTTCCTCTGTGTGGAGTGCGCAAAAGCACGAGCCCTACGCTTCAGTTTTTCACGTTTCCCAAGGACGAGAAGTACCTCAATCAGTGGCTGCACAACCTCAAGATGTTCCACATACCCGCCGCCAGCTACGCCAATTTCCGCATATGTAGCATGCATTTTCCGAAGCGCTGCATTAACCGCTACTCTCTGTGCTATTGGGCCGTTCCCACTTTTAATCTGGGTCATGACGACGTGGCCAATCTATACCAGAACAGGGAACTCACTAACACCTTCACAACCGGCGAGGTTGCGCGCTGCAGCATGCCTCACTGTACAAGTCAGCGGGGTGAGAGCAACTTAAAGTTTTACAACTTTCCGAAGGACATCAAAAGCTTGATCAAATGGTGCCAAAACGCACGACTACCCGTTCAGGCAAAAGAGCCGCGTCATTTTTGCAGCCGCCACTTCGAGGAGCGCTGCATCGGCAAGTTCCGACTGAAGCCGTGGGCGGTGCCTACTTTGCATCTAGGTGCCCAGTATGGCAAGATCTACGACAACCCGAAGAATTTGTACGTTGAGGAGAAACGCTGCTGCCTCAACTTCTGCCGCCGGAGCCGATCCTCTGACTTCAATATGTCGCTATATCGATTTCCCAGAGATGAAGTTCTTCTGCGACGCTGGTGCTACAATCTTCGCTTGGATCCTGGAGTATATCGTGGGAAAAATCACAAAATATGCAGCGCCCACTTTATCAAAGAGGCGCTGGGTCTGCGGAAACTATCTCCGGGGGCAGTTCCCACACTTCATCTGGGTCACACTGACACCTTTAACATCTACGAGAACGAACTGTGGCCACCGCCAACAACTCCAAACAGTCACAGCAGTGGCCTCCAGCACCACACGCAACATCATCCCTCGCAACACtcactgcagcagcagttgcataGCAAATCATACCAGCGCCAATCTGCGGCTTCCACGTCCTCCTCCGCCAGCTCGGCAAACTCTCATTACGTGGATCCTGATCTAAGCGCTTCTTACCTGGCCTTAGGTGCCAGTGGATCTTCTGCAATTAATGCCAGCGACAGCATGGACGTATGTTGTGTGCCCAGCTGCGAAAGCAAGCGCCACAATAATGAGAACATTACATTCCACACCATACCACGCCGACCGGAGCAGATGCGCAAGTGGTGCCATAATCTGAAAATACCCGAAGAAAAGATGCACAAGGGTATGAGGATTTGCAGCCTGCACTTCGAGCCCTATTGCATTGGCGGTTGCATGCGTCCATTTGCGGTGCCAACGCTTAATTTGGGTCACGATGACGACGATATTCATAAAAATCCGGATGTGATTAAAAAATTGAACATCCGGGAAACATGTTGCGTTGCCGTATGTAAACGAAATCGGGACAGAGACCATGCCAATCTGCACCGTTTCCCAAGCAATATGTCACTACTGACCAAGTGGTGCGGCAACCTTCAGCGTCCTGTTCCGGATGGAAGTAAACTTTTCAACGACGCTATTTGTGAAGTGCACTTTGAGGAACGATGTCTGCGCAACAAAAGGCTTGAGAAGTGGGCGGTGCCCACACTGTCGTTGGGCCATGAAAACATCCCATACCCGCTACCAACGCCGGAACAGGTTACAGAGTTCTACGCTCGACCCACTGCACCCAATAATGGCGATGAACAGGGAGAGTGCTGTGTGGAGACGTGCAAGAGAAATCCCAGTGTGGACGACATCAAGCTTTATCGACCTCCGGAAGAAGCTTCCGTGTTGGCCAAATGGGCGCATAACCTGCAGACGGAGAGTAGTCAACTGACGAGCATGAGGATCTGTAATCTTCACTTTGAGGCACACTGCATCGGCAAGCGGATGAGACCGTGGGCTATTCCAACACTTAATCTTGCTGGTAATATAGAAAATCTCTACGAAAATCCGGAGCATTCGATGCTGTACAAGCGGCGGACTCACATAAAAACCAAGCAGTCGGCTTCCGTGAAGCCCACTTGGGTGCCCAGGTGCTGTCTTCCGCACTGCCGCAAAGTTCGGGCTCTCCACAACGTTCAGCTTTATCGCTTCCCCAAGCTAAATCGCTCCACTCTGGCTAAGTGGGCGCACAATCTGCAGGTTCCTATGGTTGGCAGTGCGCAACGCCGTCTATGCTCGGCTCATTTTGAGCCGCACGTGTTGAGCAAGAAGTGTCCGGTGCCGCTGGCGGTACCCACATTGGACCTGAACGCGCCGCCCGGTTTAAAGATTTACCAGAATCCTGCCAAGCTCAAGGCAAGCAAGCTGTGTCTGCAGCGCGTGTGTATTGTCGAGAGCTGCCGCAAGACGAGGGCGCAGGGCGTCCAGCTCTTTCGGCTGCCGCATAGTCCAACGCAACTGCGCAAGTGGATGCATAACATCAAAACGCGTCCTAGAGCGGCGATGAGGGCCCAATACCGGGTGTGTTCCCGCCACTTCGAGACACACTCTTTCAATGGCAGGAGACTGAGCGCTGGCGCCATTCCCACCCTGGAATTGGGTCATGACGACGAGGACATCTATCCTAACGAAGCGCAGGCCTTTGCCGATGAACACTGCGTGGTGGAGGGATGCGAGGCCTCCAAAGAACAGCCGGACGTACGTCTGTTCCGTTTTCCCACAGAGGATGACGATATGCTATGGAAATGGTGCAACAATCTCAAAATGAACCCGGTGGATTGCACCGGCGTGCGCATATGCAATAAACACTTCGAGGCGGATTGCATCGGGCCCAAGCACTTGTACAAGTGGGCTATTCCCACCGAGGAACTGGGCCACGACGACGCCGAAATCGAGCTAATACTAAATCCCAAGCCAGAGGACAGGTATGTGGATCCGGTGTTCAAGTGCATCGTACCGACCTGCGGAAAGACGCGTCGCTTCGACGAGGTGCAGATGAACAGCTTTCCCAAGGATACGAATCTCTTTGAGCGGTGGAAACACAATTTGCGGCTGGAACACCTCAGCTTCCAGGAACGCGATCGGTACAAGATATGCAACTCTCACTTTGAGGATATATGTATCGGAAAGACTCGGCTAAATATAGGTTCGATTCCGACTCTAGAATTGGGTCACGACGACACAGACGACCTGTTCCAAGTAAATCCGGCGGAACTGCAAAGCAACCTTTTCGGACGACAGCGACGAATACAAGACGAGTTGGGCGGAACAATCATCAAACAGGAGTTTTCCGAGTCGGAAGACGTCAAAACGGATGTGACATCCATGTCTGATGCCAAAGATTTTAATACGAGACAGGTTAAGCTCAAAAAGACTATGTCCGATCTGAAGTGTTGTGTGCGCAGTTGTGGGCGCAGTCGTCTGGAGCACGGAGCACGCCTCTTTCCATTTCCCAATGGTAAGCAGCAGCACCTAAAGTGGCGCCATAACCTGCGCCTGGAACCCGACGAGGTGGAGCGTTCGACACGGATTTGCAGTGCGCACTTTAACCGGCGCTGCATTGATGGCAAGCATCTGAGAAGCTGGGCAATGCCCACGCAACAACTGGGCCACCAGGAGCTGCCGATCTACGAGAATCCGAAAAACATACCAGGATTCTTTACGCCCACCTGTGCTCTGAGTCATTGCCGCAAGCGTAGGAGCATTGACAACGATCTCCGCACCTATCGATATCCAAGGAGTGAGGATCTTCTGGAAAAATGGCGGGCGAATCTGCGTCTGGCACCGGATCAGTGTCGCGGCAGGATATGCGCGGACCATTTTGAGGCACAGGTGCGTGGAAAGTTGAAGCTGAAAACGGGAGCTGTGCCTACATTAAATCTGGGCCATGATGAGGGCTTAATATACGACAATGAGGCTATAAAGGTGGGAATGGCCGAAGAAGAGGAAGGTAGCTCCGAGTTGCCACGACTGAAAACCAAAAGAGAGCCGATTGATGAAGAGGAAGAAGAACTAGAGGCTGAAGAGGAGCACCATGACCACGATATTTACGATGAAGATGAGAGAGACGGCCACTATTTCGATCCCCTCGAACTGGTCGAGACCTTTGCTGAACATCCAAGTGATGATGAAGGCGAATATTGTGGAGATGAGGAGGATGAACGCGACGAAGAAGATGACGTAGAGGAAGCGGAGCACTTTCATCCGGACGCCCCACCCACTCCTCCTACCATCCCTCTGCGTCGGGAGAAGCCCGCAAATAATGTGACGCCCATATGCTGTCTAAAGCACTGCAGAAAAGAACGCACGGCTTTTCATCTACTGAGCACCTTTGGCTTTCCCAAGGATCGCCAGCTGCTGCTCAAGTGGTGCTCCAATCTACACCTGAATCCGGATGACTGCATCGGCCGCGTTTGTATAGAGCACTTTCAGCCGGAGGTACTGGGAACTCGAAAGCTTAAGCAAAATGCAGTGCCCACTCTCAATGTGGGCCACGATGATCCACTTAGATACTCTTGTAATGGAATGGATCTAGAGCAAGAGCAATTACAGCCACAGCACTCGGTTTTTCGGCTTTGGAGCCTAAAACACTGCCGCAAGAGGAAGCTGACAGAGCCGCCGGACATCCGCCAAAGCAAGTGGAGTGCGGCGGAAGTGCGGAAGACGCAGATGTCGAGGATGGAGATGAAGGTAGGGAGGAAGATCAAGCTGGAGGCGCAGACGGAGAGGGAAGTGAAGATGAAGGAAAAGACTCCAACGAAGAATCAGAGAGAGACTAATTTGGAAAGATGTTGCATCAGCTACTGTGCGAATGCGGACGTTGGCCAACTACTTCCGCTGCCTGAGGAGCCAAATCTCTTAAAAAAATGGCAGCTTAACCTAAAGCTTTCCCAAGACACTGACTTCAAGGAAATTCGAGTGTGTCTTAAGCACTTTGAGGCACAAGTGGTCGAGAACGGAAAGCCCTTGGAGCACGCAGTACCCACCTTAATGCTAGGTCAAAAAAGTTGGAGCATCTACAGAAACCATGGCAGTTGTCTCTTTCCCGAGTGCAGGAATTCTTCATCGGATCACCTAAGCTTTGTTAATTTACCCGGAAATGTGGTCATAAAAGATGCCTGGATAAGACACCTTAATTTGCCACCCAGCAGTGAGGGTCTTCTTTGTGGTGACCATTTTATGCATCTGTTCAAACGGGTGGAGCTCCCCAAAGTATTGGCCGCACAAGATTTGGAAGACTTGAAGTGGGTTCATGACGAACTTAAATGCGCTGTGCCTAGTTGTTCTTCTAAATCTGACAGGGATCTTCAGCTTACCCCGCTTCCAGACAAGGAAACTACCCTTCTGAAGTGGTTACATAACACAAAGATATCTTACGATCAATCAAGGCACAAAAGCTATCGCATATGTTTTCTTCACTTCGAGCCAATGTGCTTAGAAGCGAATTTCCTAAAAACGTGGGCCATACCTACCTTGCATTTAAGCCACGATGACGAGATTCATTTGAGTCTCAGCCCTGAATCTCGCAGCGATACACCAAACAACCATTCTAGACTAACTCCTTTAAGAATTAAAACGGACCTCGCCTCCTTGGAGAGTCCGTGCTCGAGTGCGAGTCCAAGTCCTCGAGGTAGAATCAGGATATGTTGCATTTCTACATGTGGACAGATCGGAAGTAGTCAAATTCGACTCTACCGCTTTCCCACCGAAGAACAGGCCTTGCTCCGGTGGCTGGTAAACACGCAGCAGCAACCTCGCCTTGTTGACCCTGCGGAGCTTTATGTGTGCCAAACTCACTTTGAACCTGACGCCATATGCAAAAAACAACTTCGTTGCTGGGCAGAACCCACTTTAAACCTGGGTCACGACGGATTGGTTATCCCCAATGCCAAGCACAACGGAAACATTGCTGGGGGCCAGGACACTGAGGAGGCGATGAGGCTTATTCGGGAGCGCTATTGCTCCATACTTACTTGTTTCCAGAGTGAAGCTAGCGGTATAAGACTCTATGAGTATCCCAAGGATATGCCAACTATACGAAAGTGGGCAGCAGCGTGTAGACATCGTTCAATGCAGGCCAGCAGCAATGGTTTCAAGATATGCCAGTCTCACTTTGCACCGGAATGCTTTGAGCAGGACACTTTAAATTTGATCGACGGATCCGTTCCCACTCTGGAGTTAAGTAGAAGCGACATCGAAAGACATTGCCTAGTGTCTGGATGTGAAAAGGACGCCTCTGGAGGACGTCGCCGCTTTTATAAGGTGCCAAAGTCCGCTGCTCAACTGAATGCGTGGAGCAACAACCTGAAGATCAGTTCCGTTGACCTCGGGTTGGGGGAGCAGCTTATCTGTGAACGTCACTTTGAGCCCTTTTGTTTTGGTGCTCACAAAGGCTTACGTCCTGGCGCACTGCCGACTATAATGCTAGGGCACGACGAAGAGGTGGAGATGTTACCAAACCCAGAAAGTCTCTGGCAGAAGAAAGCGGATGTTTGCTGTGCTACTGAATGTGGTCGGATATGGCAGCCCGGAGACACTAAATTCAGTGGATTTCCTAAAACGCTGGCGTTGGCTAGGAAATGGATTCATAATCTCAAACTAAGCATACTTAATGACCAGCTAGGCAGTCTGAAAGTCTGCAGTGCGCATTTCGAACCATCTCTCTTCAATAAAAGTGGTTTAATATCGGGTTCCATACCCACACTGGAGCTTGGCCATTCCTCTCAGGATATATTTCAGTCGGACACCCAAAACCTGGgtaaaagtttaaagtttgAAAGAAGAGCTATAATATCGGAGGTAGATTGCATTTATCCTGAGTGCAAGGAACTGTGCAAAACCGTGTCATTCAACCTGCCCCATGAGGAGAACCTTCGCAGAGCGTGGCTCCGTCATTTGAAGATCGAAGAGCCGTCGAGTGATGTCGGTCAGCTATGTCCACTACACTTCGTTATTCTTTACGAATTAAGTATCAAAAGTTTTCCAGAGCACGTTTCAAACCGATACCTCGAAGAAAATTACTATTCTGCTCGAAACAACAGACGCGTCAAGATTGTTAGCTGTGCGGTTAAAGGTTGTGAAATGATCAGGCCCCGGGATAAGGTGCTCCTGCATGGGTTGCCGCAAAGGAAAGACATACTTAGGATGTGGGTTGAGAATGGCCAACTAGAGATTACGGAGCCCCAGCAACAATATATGCTTAGAGTATGCCGCAATCACTTTGAGTCCCGATGCTCATTTGACGACAGGCGGCTGCATCCCTGGAGTGTTCCCACTCTGAACTTACCTGGAAATCCGGTGCACCAAATTCCCACTAAGGAAGAGTGGCAGGAAATGACAGTAAAACTGACCCAGGAAGCCGATACAATTAAATTGGAGAGAGAGGAGGAGGCGGAAGAGGAAGAGCTTCGCGAGGAGGAAGAGGGTGACAGTTTCCTTCTAGAGCCCATTGTTAGAATGGAGCACATCGAGTCTGATGAGGAAGACTCGGAGATGCAGGCCCTGGAGGTCCTTCTGGAGGTTGGTCACGTTGAGCGAATGGACAGCTACGAAAGAGTGGACAAGTCCTATACCGAACATTCCGTCTACCACTCTAATAGCATTCGAAACCAGTACAATGCCAACCACTGTGCCGTTGAAGGGTGCGAAGTGACAGTAGAGGACGTGGACGGGACCATCAAGCTGCACAAGTTCCCCGCATCGTCCGAGGCCGCTCGGAAGTGGATGCACAACACCCAAGTTGACATGGATGAGAAGTTCTGGTGGCGGTATCGAATTTGCAGTTATCATTTCGAACAGGAATGCTTCCAGAGCGCTAGAATAAAGAAGGGAGCGATGCCCACTCTCCTCCTAGGACCTAGAAGACCAGAAGAGGTATATGAGAATGAATTCGTATTGCAGGAAACTGAGGAGCTTATTTTGCCCGAAGAACTTCAGTTTGTGGAGCACAAAAAGGTTAAAAGTGAGGTAATAAAAATGTGCCTGCCAACGCCGGCTCCGCCTCGAAAGTCCAGTAAGTTTTGTCAGATCGAGGGCTGTATGAATCACCTGACCACTCAAAACATAACGTTGCACAAATTTCCTCATTCAGAGGACATGTGCCTTAAGTGGCAGCACAACACACAGGTGCCTTTCGATCCCTTGCACCGCTGGCGATACCGTATCTGTAGTGCCCATTTTCATCCCGTGTGCCTGCTTAACATGAGACTAGTCCACGGCAGTGTACCCACCTTACAACTAAGTAGCAAGGCTCCCACCGACCTATTCAATAACGACTTCGAAGCCATAAACCTCAGGCTGGACAAGAAGTTGGGAGCGGACTCAAGCATTGTGCAGATAAAGGAGGAGGATGAAGATTCTATGCCGTCCCTGGAAACAGAACTTCAGCTTCACGAGGACCAAGAGGCGGAGGATTCAGCAGCTACGCAAATACCCTTTACCCAGACAAACTGGAAGGGCCAACTGAGCTTGCCAGTGAAGCAGGAAACGGTGACCTACAACCAGGTGAAGTCTGGATACGATAAGTGCTCATTGGCTCATTGCCAGCGGCAAAGATCTAAGCATGGCGTCCACATCTACAAGTTTCCCAAATCGAGGCTTCAACAGGAGCGTTGGATGCACAACCTCCGCATCCGCTACGATGAGCGAAGGCCATGGAAGTTTATGATCTGCAGCGTGCATTTCGAGCCACACTGCATCAGCCTGAGGAAGCTGCGCCCCTGGGCGGTTCCTACCCTGGAGTTGGGCGACAATGTGCCCGAGAAGATCTTTACGAACGAACAGTGCCATGAGCTCTTCACCGATCGCAGTGAGGTGGAAAGCAATGCCGATGATGACGATGGACTgcaggaggacgaggacgaggaggatgaggacgaggaggaaATGGGGGCGGAGGTACGCATTAAGCGGGAGCGGCGTTCCAAGCTGGATCCTTGGCCGCCTGGGCAGGTTCCGCCGTGGAAAGTTAAGCAGTGTTGTCTTCCTTACTGCCGGGCCTTTCGTGGCGATGGGATCAAATTATTCCGGCTGCCCAACAACCGCACCTCCATACGAAACTGGGAGCTGGCGACGGGCATGGTGTTCAAGGAGTCTCAACGAAACACTCGCCTGATTTGCAGCCGACACTTTGAGCCCGAGTTGATTGGGGTAAGACGTCTCATGCGTAACGCCATTCCCACGAGGCACTTAAGTCCCCAGGCATCCTCAGACGAAGTTAAGAGAAAGCCGGATCCACCCCTCCCAATTGCAACCTGTTGCATGGCTGACTGTCATCATAATGGAAATGTTAAGCTGCACAAGTTTCCCAGTGATCCGGCGCTGCTAAGACAGTGGTGCCAGGCACTCAGGCTCACGGATACCCAGCGATACCGGGGCAAACATATTTGCTCGGTCCACCTGCCCTCTGACAGGACGGTTAGCTGTGTCATCTGCGGGGTGGACAATGTCCTGTTGCCGATGCTGGACTTTCCAGAGCCGCGCAATCAGCGCGCCAAGTGGTGCTACAATCTCAAGATCGAGGCCATATCCAAGTGGGACCACTCCAAGCACATTTGCTGTCGTCACTTCGAGTCGCAATGTTTCCTCCAGCCAGGTGAACTGCGTCCAGGTGCGATTCCCACGCTGCATCTCAACCACAACGACACGAATATATTCCTCAGCGACTTCGCCACTGGTTCGACCGGCAATCGGATCAAGGATGAGCCGCAGGACAACGACGACATGCTGCTGGTTTAG
Protein Sequence: MSQQHPHHAHPHHYAQHYPPPATPMSLQQQQQQQAQLPPQQQHANWYSHVASYPTPHSAFGPAPSCKATNNNIMGGGGYAPGGGGTQSYYGAAGGGLNVSGAVVGGGGPSYGLGANTVAYAHNQLLQYQQQQQQQQQQQQQQQQHHHLPQHISQQRPYMGHNIMTGSYPYIKSEPMEAYQQPPNPMAPPPAPEVLIKSEPMDEHSYKSNYIDDNTPFADFSKFSEFSEDMLSPKVELTVKDESYGKSTSSFLRRKQQSDRGTESLPICQRCKEVFFKKQVYVRHVAESNCGIQEYDFKCSTCPMSFMTTEELQRHKLHHRADRFFCHKYCGKYFDTIAECEAHEYMQHEYDAFVCNMCSGTFATREQLYAHLPQHKFQQRFDCPICRLWYQTAVELHEHRLAAPYFCGKYYTAGQASSASLSQSQAQQHQTNYKLQDCHMATMEMTTTTHHKTAPSGSSLPATAALNSLLQQRQANADGAAMFAASAIKNEVNVKMERSYSNSTSESSYSVQDSGYNNTYGSDSSMQAGAIAGPQAHSSTLDDSEDALCCVPLCGVRKSTSPTLQFFTFPKDEKYLNQWLHNLKMFHIPAASYANFRICSMHFPKRCINRYSLCYWAVPTFNLGHDDVANLYQNRELTNTFTTGEVARCSMPHCTSQRGESNLKFYNFPKDIKSLIKWCQNARLPVQAKEPRHFCSRHFEERCIGKFRLKPWAVPTLHLGAQYGKIYDNPKNLYVEEKRCCLNFCRRSRSSDFNMSLYRFPRDEVLLRRWCYNLRLDPGVYRGKNHKICSAHFIKEALGLRKLSPGAVPTLHLGHTDTFNIYENELWPPPTTPNSHSSGLQHHTQHHPSQHSLQQQLHSKSYQRQSAASTSSSASSANSHYVDPDLSASYLALGASGSSAINASDSMDVCCVPSCESKRHNNENITFHTIPRRPEQMRKWCHNLKIPEEKMHKGMRICSLHFEPYCIGGCMRPFAVPTLNLGHDDDDIHKNPDVIKKLNIRETCCVAVCKRNRDRDHANLHRFPSNMSLLTKWCGNLQRPVPDGSKLFNDAICEVHFEERCLRNKRLEKWAVPTLSLGHENIPYPLPTPEQVTEFYARPTAPNNGDEQGECCVETCKRNPSVDDIKLYRPPEEASVLAKWAHNLQTESSQLTSMRICNLHFEAHCIGKRMRPWAIPTLNLAGNIENLYENPEHSMLYKRRTHIKTKQSASVKPTWVPRCCLPHCRKVRALHNVQLYRFPKLNRSTLAKWAHNLQVPMVGSAQRRLCSAHFEPHVLSKKCPVPLAVPTLDLNAPPGLKIYQNPAKLKASKLCLQRVCIVESCRKTRAQGVQLFRLPHSPTQLRKWMHNIKTRPRAAMRAQYRVCSRHFETHSFNGRRLSAGAIPTLELGHDDEDIYPNEAQAFADEHCVVEGCEASKEQPDVRLFRFPTEDDDMLWKWCNNLKMNPVDCTGVRICNKHFEADCIGPKHLYKWAIPTEELGHDDAEIELILNPKPEDRYVDPVFKCIVPTCGKTRRFDEVQMNSFPKDTNLFERWKHNLRLEHLSFQERDRYKICNSHFEDICIGKTRLNIGSIPTLELGHDDTDDLFQVNPAELQSNLFGRQRRIQDELGGTIIKQEFSESEDVKTDVTSMSDAKDFNTRQVKLKKTMSDLKCCVRSCGRSRLEHGARLFPFPNGKQQHLKWRHNLRLEPDEVERSTRICSAHFNRRCIDGKHLRSWAMPTQQLGHQELPIYENPKNIPGFFTPTCALSHCRKRRSIDNDLRTYRYPRSEDLLEKWRANLRLAPDQCRGRICADHFEAQVRGKLKLKTGAVPTLNLGHDEGLIYDNEAIKVGMAEEEEGSSELPRLKTKREPIDEEEEELEAEEEHHDHDIYDEDERDGHYFDPLELVETFAEHPSDDEGEYCGDEEDERDEEDDVEEAEHFHPDAPPTPPTIPLRREKPANNVTPICCLKHCRKERTAFHLLSTFGFPKDRQLLLKWCSNLHLNPDDCIGRVCIEHFQPEVLGTRKLKQNAVPTLNVGHDDPLRYSCNGMDLEQEQLQPQHSVFRLWSLKHCRKRKLTEPPDIRQSKWSAAEVRKTQMSRMEMKVGRKIKLEAQTEREVKMKEKTPTKNQRETNLERCCISYCANADVGQLLPLPEEPNLLKKWQLNLKLSQDTDFKEIRVCLKHFEAQVVENGKPLEHAVPTLMLGQKSWSIYRNHGSCLFPECRNSSSDHLSFVNLPGNVVIKDAWIRHLNLPPSSEGLLCGDHFMHLFKRVELPKVLAAQDLEDLKWVHDELKCAVPSCSSKSDRDLQLTPLPDKETTLLKWLHNTKISYDQSRHKSYRICFLHFEPMCLEANFLKTWAIPTLHLSHDDEIHLSLSPESRSDTPNNHSRLTPLRIKTDLASLESPCSSASPSPRGRIRICCISTCGQIGSSQIRLYRFPTEEQALLRWLVNTQQQPRLVDPAELYVCQTHFEPDAICKKQLRCWAEPTLNLGHDGLVIPNAKHNGNIAGGQDTEEAMRLIRERYCSILTCFQSEASGIRLYEYPKDMPTIRKWAAACRHRSMQASSNGFKICQSHFAPECFEQDTLNLIDGSVPTLELSRSDIERHCLVSGCEKDASGGRRRFYKVPKSAAQLNAWSNNLKISSVDLGLGEQLICERHFEPFCFGAHKGLRPGALPTIMLGHDEEVEMLPNPESLWQKKADVCCATECGRIWQPGDTKFSGFPKTLALARKWIHNLKLSILNDQLGSLKVCSAHFEPSLFNKSGLISGSIPTLELGHSSQDIFQSDTQNLGKSLKFERRAIISEVDCIYPECKELCKTVSFNLPHEENLRRAWLRHLKIEEPSSDVGQLCPLHFVILYELSIKSFPEHVSNRYLEENYYSARNNRRVKIVSCAVKGCEMIRPRDKVLLHGLPQRKDILRMWVENGQLEITEPQQQYMLRVCRNHFESRCSFDDRRLHPWSVPTLNLPGNPVHQIPTKEEWQEMTVKLTQEADTIKLEREEEAEEEELREEEEGDSFLLEPIVRMEHIESDEEDSEMQALEVLLEVGHVERMDSYERVDKSYTEHSVYHSNSIRNQYNANHCAVEGCEVTVEDVDGTIKLHKFPASSEAARKWMHNTQVDMDEKFWWRYRICSYHFEQECFQSARIKKGAMPTLLLGPRRPEEVYENEFVLQETEELILPEELQFVEHKKVKSEVIKMCLPTPAPPRKSSKFCQIEGCMNHLTTQNITLHKFPHSEDMCLKWQHNTQVPFDPLHRWRYRICSAHFHPVCLLNMRLVHGSVPTLQLSSKAPTDLFNNDFEAINLRLDKKLGADSSIVQIKEEDEDSMPSLETELQLHEDQEAEDSAATQIPFTQTNWKGQLSLPVKQETVTYNQVKSGYDKCSLAHCQRQRSKHGVHIYKFPKSRLQQERWMHNLRIRYDERRPWKFMICSVHFEPHCISLRKLRPWAVPTLELGDNVPEKIFTNEQCHELFTDRSEVESNADDDDGLQEDEDEEDEDEEEMGAEVRIKRERRSKLDPWPPGQVPPWKVKQCCLPYCRAFRGDGIKLFRLPNNRTSIRNWELATGMVFKESQRNTRLICSRHFEPELIGVRRLMRNAIPTRHLSPQASSDEVKRKPDPPLPIATCCMADCHHNGNVKLHKFPSDPALLRQWCQALRLTDTQRYRGKHICSVHLPSDRTVSCVICGVDNVLLPMLDFPEPRNQRAKWCYNLKIEAISKWDHSKHICCRHFESQCFLQPGELRPGAIPTLHLNHNDTNIFLSDFATGSTGNRIKDEPQDNDDMLLV

Similar Transcription Factors

Sequence clustering based on sequence similarity using MMseqs2

100% Identity: iTF_00605601;
90% Identity: iTF_00592421;
80% Identity: -