Basic Information

Insect: Drosophila gunungcola
Gene Symbol: -
Assembly: GCA_011057485.1
Location: WTSR01005020.1:3230362-3245935[+]

Transcription Factor Domain

TF Family: THAP
Domain: THAP domain
PFAM: PF05485
TF Group: Zinc-Coordinating Group
Description: The THAP domain is a putative DNA-binding domain (DBD) and probably also binds a zinc ion. It features the conserved C2CH architecture (consensus sequence: Cys - 2-4 residues - Cys - 35-50 residues - Cys - 2 residues - His). Other universal features include the location of the domain at the N-termini of proteins, its size of about 90 residues, a C-terminal AVPTIF box and several other conserved residues. Orthologues of the human THAP domain have been identified in other vertebrates and probably worms and flies, but not in other eukaryotes or any prokaryotes [1].
Hmmscan Out: # of c-Evalue i-Evalue score bias hmm coord from hmm coord to ali coord from ali coord to env coord from env coord to acc

1 29 7.9 1.6e+04 -3.4 3.8 38 62 164 191 155 207 0.58

2 29 2.4e-15 4.9e-12 46.3 3.9 1 86 407 479 407 480 0.85

3 29 9.8e-15 2e-11 44.3 5.0 1 87 507 576 507 576 0.83

4 29 8.9e-16 1.8e-12 47.7 0.2 1 87 598 670 598 670 0.85

5 29 5.6e-16 1.1e-12 48.3 5.4 1 86 771 840 771 841 0.82

6 29 1.2e-14 2.4e-11 44.1 2.8 1 86 865 936 865 937 0.82

7 29 7e-13 1.4e-09 38.4 1.1 1 87 972 1041 972 1041 0.81

8 29 7.9e-11 1.6e-07 31.8 1.4 1 86 1081 1150 1081 1151 0.76

9 29 4.3e-17 8.9e-14 51.9 0.4 1 86 1178 1247 1178 1248 0.83

10 29 1.8e-13 3.6e-10 40.3 1.7 1 85 1269 1337 1269 1339 0.80

11 29 3.2e-14 6.7e-11 42.7 0.4 1 86 1366 1437 1366 1438 0.85

12 29 6.6e-13 1.4e-09 38.5 3.0 1 85 1514 1582 1514 1584 0.82

13 29 2e-12 4e-09 37.0 0.1 1 86 1607 1675 1607 1676 0.81

14 29 2.2e-13 4.5e-10 40.0 1.8 1 87 1819 1888 1819 1888 0.79

15 29 5.5e-10 1.1e-06 29.1 0.5 1 86 1992 2058 1992 2059 0.77

16 29 0.0031 6.4 7.5 0.0 1 58 2074 2119 2074 2132 0.79

17 29 2.2e-12 4.5e-09 36.8 0.6 1 87 2149 2220 2149 2220 0.84

18 29 2.4e-13 4.9e-10 39.9 0.4 1 86 2276 2345 2276 2346 0.82

19 29 1.3e-10 2.7e-07 31.1 0.3 1 86 2381 2452 2381 2453 0.78

20 29 9.8e-12 2e-08 34.7 0.0 1 87 2463 2535 2463 2535 0.79

21 29 1.5e-09 3.1e-06 27.7 0.0 1 86 2559 2629 2559 2630 0.77

22 29 4.3e-05 0.088 13.5 0.4 1 58 2663 2712 2663 2730 0.82

23 29 1.3e-12 2.7e-09 37.5 0.2 1 87 2750 2823 2750 2823 0.83

24 29 4.4e-15 9.1e-12 45.5 0.5 1 86 2929 3001 2929 3002 0.81

25 29 1.8e-11 3.6e-08 33.9 3.5 1 84 3059 3127 3059 3130 0.75

26 29 1.7e-13 3.5e-10 40.4 5.2 1 86 3233 3303 3233 3304 0.85

27 29 2.1e-12 4.3e-09 36.9 0.2 1 86 3398 3467 3398 3468 0.85

28 29 9.5e-11 1.9e-07 31.6 1.6 1 58 3491 3539 3491 3554 0.84

29 29 1.8e-10 3.6e-07 30.7 2.1 17 86 3556 3614 3546 3615 0.74

#	of	c-Evalue	i-Evalue	score	bias	hmm coord from	hmm coord to	ali coord from	ali coord to	env coord from	env coord to	acc
1	29	7.9	1.6e+04	-3.4	3.8	38	62	164	191	155	207	0.58
2	29	2.4e-15	4.9e-12	46.3	3.9	1	86	407	479	407	480	0.85
3	29	9.8e-15	2e-11	44.3	5.0	1	87	507	576	507	576	0.83
4	29	8.9e-16	1.8e-12	47.7	0.2	1	87	598	670	598	670	0.85
5	29	5.6e-16	1.1e-12	48.3	5.4	1	86	771	840	771	841	0.82
6	29	1.2e-14	2.4e-11	44.1	2.8	1	86	865	936	865	937	0.82
7	29	7e-13	1.4e-09	38.4	1.1	1	87	972	1041	972	1041	0.81
8	29	7.9e-11	1.6e-07	31.8	1.4	1	86	1081	1150	1081	1151	0.76
9	29	4.3e-17	8.9e-14	51.9	0.4	1	86	1178	1247	1178	1248	0.83
10	29	1.8e-13	3.6e-10	40.3	1.7	1	85	1269	1337	1269	1339	0.80
11	29	3.2e-14	6.7e-11	42.7	0.4	1	86	1366	1437	1366	1438	0.85
12	29	6.6e-13	1.4e-09	38.5	3.0	1	85	1514	1582	1514	1584	0.82
13	29	2e-12	4e-09	37.0	0.1	1	86	1607	1675	1607	1676	0.81
14	29	2.2e-13	4.5e-10	40.0	1.8	1	87	1819	1888	1819	1888	0.79
15	29	5.5e-10	1.1e-06	29.1	0.5	1	86	1992	2058	1992	2059	0.77
16	29	0.0031	6.4	7.5	0.0	1	58	2074	2119	2074	2132	0.79
17	29	2.2e-12	4.5e-09	36.8	0.6	1	87	2149	2220	2149	2220	0.84
18	29	2.4e-13	4.9e-10	39.9	0.4	1	86	2276	2345	2276	2346	0.82
19	29	1.3e-10	2.7e-07	31.1	0.3	1	86	2381	2452	2381	2453	0.78
20	29	9.8e-12	2e-08	34.7	0.0	1	87	2463	2535	2463	2535	0.79
21	29	1.5e-09	3.1e-06	27.7	0.0	1	86	2559	2629	2559	2630	0.77
22	29	4.3e-05	0.088	13.5	0.4	1	58	2663	2712	2663	2730	0.82
23	29	1.3e-12	2.7e-09	37.5	0.2	1	87	2750	2823	2750	2823	0.83
24	29	4.4e-15	9.1e-12	45.5	0.5	1	86	2929	3001	2929	3002	0.81
25	29	1.8e-11	3.6e-08	33.9	3.5	1	84	3059	3127	3059	3130	0.75
26	29	1.7e-13	3.5e-10	40.4	5.2	1	86	3233	3303	3233	3304	0.85
27	29	2.1e-12	4.3e-09	36.9	0.2	1	86	3398	3467	3398	3468	0.85
28	29	9.5e-11	1.9e-07	31.6	1.6	1	58	3491	3539	3491	3554	0.84
29	29	1.8e-10	3.6e-07	30.7	2.1	17	86	3556	3614	3546	3615	0.74

Sequence Information

Coding Sequence: ATGTCACAACAANNNCANNCCCATCACGCCCATCCCCACTACCACCACTACCCGCCCCCTGCGACGCCCATCGAACCGCTGGAGGCCTTCCAGCAGCCGCCCAATCCCATGGCCCCGCCCCCAGCGccagaaatattaataaaatcGGAACCCATTGATGAACATTCCTACAAGTCAAACTATATAGACGACAATACGCCCTTTGCCGACTTTAGCAAGTTCAGCGAATTCAGCGAGGACATGCTGAGTCCCAAGGTGGAGTTGACCGTCAAGGATGAGTCCTACGGAAGGAATACCAACAGCTTTCTGCGCCGGAAACAGCAGTTGGATCGCAGCGCCGAAAGTCTGCCCATCTGCCAGCGCTGCAAAGAGGTCTTCTTCAAGAAGCAAACCTATCTGCGGCACGTGGCCGAGAGCAACTGCGGGATCCAGGAGTACGACTTCAAGTGCAGCACTTGCCCCATGTCCTTTATGACCACCGAAGAGCTGCAGCGGCACAAGCACCATCACCGGGCCGACAGGTTCTTCTGCCACAAGTACTGTGGCAAGCACTTCGATACGATCGCCGAGTGCGAGGCGCACGAGTACATGCAGCACGAATACGATAGCTTTGTCTGCAACATGTGCTCGGTGACCTTCGCCAACCGAGAGCAGCTATATGCCCACCTTCCCCAACACAAGTTCCAGCAGCGCTTCGACTGTCCCATCTGCCGGTTATGGTACCAGACAGCCCTCGAGCTCCACGAGCACCGCCTGGCGGCACCGTACTTCTGTGGCAAGTACTACACGGGCGGACAGTCATCCTCAGCTTCCCAACCGCAGACGCAGTCGCAGCACCAAAACCAGACGAACTACAAGCTGCAAGACTGCCACATGGCGACTATGGAAAtGCCCTCCGGCCCGCATCACAAGGCGAACCCATCCGGCTCTTCCTTGCCGGCCACGGCTGCGCTAAGTTccctgctgcagcagcggcaggcAAATGCCGATGGAGCGGCCATGTTTGCCGCATCCGCGCTGAAGAACGAGNNNNNNNNNNNNgtgaatgtgaatgtgaagcTGGAGCGCAGCTATAGCAACTCGACCAGCGAGTCATCCTACAGCGTTCAGGACAGCAGCTACAACAATGCCTACGGCAGTGATGGCTCGATTCACGGCGGAGCCATCGCCGGACCGCAGGCCCACTCATCCACGCTGGACGACTCCGAGGACGCAGTGTGCTGTGTGCCGCTGTGCGGAGTGCGGAAGAGCACCAGCCCCACGCTGCAGTTCTTCACGTTCCCCAAGGACGAGAAGTACCTCAACCAGTGGCTGCACAACCTCAAGATGTTCCACATACCCGCCGCCAGCTACGCCAATTTCCGCATCTGTAGTATGCACTTCCCGAAGCGCTGCATCAACCGGTACTCGCTGTGCTACTGGGCCGTGCCCACGTTCAACCTGGGCCACGACGACGTGGCCAATCTCTACCAGAACCGGGAGCTGACCAACACCTTCACCACCGGCGAGGTGGCCCGCTGCAGCATGCCGCACTGCACCAGCCAGCGGGGCGAGAGCAACCTGAAGTTCTACAACTTTCCCAAGGACATCAAGAGCCTGATCAAGTGGTGCCAGAACGCCCGACTGCCGGTGCAGGCCAAGGAGCCGCGTCACTTCTGCAGCCGCCACTTCGAGGAGCGCTGCATCGGCAAGTTCCGGCTGAAGCCGTGGGCGGTGCCCACCCTGCATCTGGGTGCCCAATACGGCAAGATCCACGACAACCCCAAGAATCTCTATGTGGAGGAGAAGCGCTGCTGCCTAAACTTCTGCCGCCGGAGCCGATCCTCTGACTTCAATATGTCGCTCTATCGATTCCCCAGGGATGAGGTGCTCCTGCGACGCTGGTGCTACAATCTCCGCCTGGATCCGGGTGTGTATCGCGGAAAGAATCACAAGATATGCAGTGCCCACTTTATCAAGGAGGCGTTGGGTCTGAGGAAACTATCACCAGGAGCGGTTCCAACGCTCCACTTGGGCCACACCGACACCTTCAACATCTACGAGAACGAGCTGTGGCCGCCACCGACGGCCTCCTCCAGTGGCATCNNNCAGCNNNNCCAANNNCANNCGCAACATCTCACCTCGCAGCACTCGCTGCAGCAGNNNNNNNNNNTGCACAGCAAATCCTACCAGCGCCACTCGGCGGCCTCCACGTCGTCGTCGGCCAGTTCGGCCACCTCCCATTACGTGGATGCGGACATGAACGCCTCCTATCTGGCCATGGGTGCCGGCGGATCCTCGGCGCTGAATGCCAGCGACAGCATGGACATCTGCTGCGTGCCCAGTTGTGAGAGCAAGAGGCACAACAACGAGAACATCACATTCCACACGATCCCACGGCGGCCGGAGCAAATGCGCAAGTGGTGCCACAACCTGAAGATACCCGAGGAGAAGATGCACAAGGGCATGCGAATCTGCAGCCTGCACTTCGAGCCCTACTGCATCGGCGGCTGTATGCGTCCGTTTGCGGTGCCCACCCTGCAGTTGGGCCACGATGACGACGACATTCACCGCAATCCGGACGTGATCAAGAAGCTCAACATCCGGGAAACGTGCTGCGTGGCCGTGTGCAAGCGGAATCGGGACAGGGATCATGCCAACCTGCATCGCTTCCCGAGCAACGTCTCGCTGCTGACCAAGTGGTGTGGCAATCTCCAGCGGCCCGTGCCCGATGGCAGTAAGCTCTTCAACGACGCCATCTGCGAGGTGCACTTCGAGGATCGGTGTCTGCGCAACAAACGGCTGGAAAAGTGGGCGGTGCCCACGCTAATCCTGGGCCACGAGAACATCCCCTATCCGCTGCCCACGCCGCAACAGGTGGCCGAGTTCTATGCCCGACCCACTGCACCCAACAACGGCGAGGAGCAGGGCGAGTGCTGTGTGGAGAGCTGCAAGAGGAACCCCAGCGTGGACGACATCAAGCTGTACCGGCCGCCGGAGGAGGCCTCGGTGCTGGCCAAATGGGCGCACAACCTGCAGACGGAGGCCGCCCAACTGACCANNNGNCTGCGGATCTGTAATCTCCACTTCGAGGCCCACTGCATTGGCAAGCGAATGCGGCCGTGGGCCATACCCACTCTCAATCTGGCCGGCAACATAGAGAATCTCTACGAGAATCCGGAGCACTCGATGCTGTACAAGCGGCGANNNCATGCGAAGACCAAGCTGCCGGCCTCCGTGAAGCCCACTTGGGTGCCCAGGTGCTGTCTGCCGCACTGCCGCAAGGTGCGGGCGCTGCACAACGTCCAGCTGTACCGCTTCCCCAAGCTCAATCGCTCCACGCTGGCCAAGTGGGCGCACAACCTGCAGGTGCCCATGGTGGGCAGTGCCCAGCGGCGGCTCTGCTCGGCCCACTTTGAGCCGCATGTGCTGAGCAAGAAGTGTCCGGTGCCGCTGGCGGTGCCCACGTTGGACCTCAACTCGCCGCCCGGCCTGAAGATCTACCAGAATCCGGCCAAGCTGAAGGCCAGCAAGCTGTGCCTGCAGCGCGTCTGCATCGTGGAGAGTTGCCGCAAGACGCGGGCGCAGGGCGTCCAGCTCTTCCGGCTGCCCCACAGTCCCACGCAGCTGCGCAAGTGGATGCACAACATCAAGACGCGTCCGCGGGCAGCGATGCGGGCCCAGTACCGGGTTTGCTCGCGCCACTTTGAGACGCACTCGTTCAACGGCCGCCGGCTGAGCGCTGGCGCCATTCCCACACTGGAGCTGGGCCACGACGACGAGGACATTTATCCTAACGAGGCGCAGGCCTTTGCCGACGAGCACTGCGTGGTGGAGGGCTGCGAGTCGTCCAAGGAGCAGGCCGAGGTGCGACTCTTCCGCTTCCCCaccgacgacgacgacatgCTGTGGAAGTGGTGCAACAACCTCAAGATGAATCCCGTCGACTGCACCGGAGTGCGCATCTGCAACAAGCACTTCGAGGCGGACTGCATCGGGCCCAAGCACCTGTACAAGTGGGCCATTCCCACCCAGGAGCTGGGCCATGACGACGCCCAGATCGAGCTGATATCGAATCCCAAGCCGGAGGACCGCTACGTGGATCCGGTGTTCAAGTGCATCGTGCCCACCTGCGGCAAGACGCGTCGCTTCGACGAGGTGCAGATGAACAGCTTCCCCAAGGACCCGCAGCTCTTCCAGCGCTGGCAGCACAACCTGCGGCTGGAGCACCTTAGCTTCCTGGAGCGCGAGCGCTACAAGATCTGCAACGCCCACTTCGAGGACATCTGCATTGGCAAGACACGACTCAATATCGGATCGATTCCCACCCTCGAGCTGGGCCACGACGAAACGGAGGATCTGTTCCAGGTGAATCCGGCCGAGTTGCAGAGCAATCTCTTTGGTCGCCAGCGGAGGGTTCAGGAGGAATCGGGTGGGATAAGCATCAAGCAGGAACTGTCCGAGCCGGAAGATGTTAAGCCAGATGTGACGAACATGCCTGCTGTCAGGGATTCCATTACCAGACAGGTGAAGTTCAAGAGAACAGTGTCCGAGCTGAAGTGTTGTGTGCACAGCTGTGGACGCAGTCGTCTGGAGCACGGAGCTCGGCTCTTTCCCTTTCCCACGGGCAAGCAGCAGCACCTCAAGTGGCGCCACAATCTGCGCCTGGAGCCCGACGAGGTGGATCGGTCGACGCGGGTGTGCAGTGCCCACTTCAACAGGCGCTGCATCGACGGCAAGCAGCTGAGGAGCTGGGCCATGCCCACCCAGCAGCTGGGCCACCGGGAGCAGCCGATCTACGAGAATCCCAAGAACATACCCGGCTTCTTCACGCCCACCTGTGCCCTCGGCCACTGTCGCAAGCGGCGGAGCATCGACAACGATCTGCGCACCTATCGGTATCCCAGAAGCGAGGATCTGCTCGAGAAATGGCGGGCGAATCTGCGACTGGCGCCGGATCAGTGCCGCGGCCGCATCTGTGCGGATCACTTTGAGGCCCAGGTGCGGGgcaagctgaagctgaagacGGGAGCGGTGCCCACGTTGAAGCTGGGCCACGATGAGGGCTTGATCTACGACAATGAGGCTATCAAGGTGGGACTAAACNNNGAGGACGAGGAGGGCAGCTCGGAGCTGCCGCGACTGAAGCCCAAAAGGGAGCCAATCGacgaggcggaggcggagNNNGAGGAAGACATGGAGGCTGAGGAGGAGCACCACCACGACCAGGACAACGGNNNNNNGGATGAGNNNNNNAAAGACGAACACTATTTCGATCCCCTTGAACTGGTCGAGACCTTTGCCGAGCATCCATCCGATGAAGAGNAGNANNNNGNNNAGGAGGAGGATCGAGACGAGTTGNNNNNNNNNNNNGAGGAGGAGTTGGACCACTTCCTGCCGGACATGCCACCCACTCCTCCTCCACTGATCGCACCGCTGCGTCGCGAAAAGCCCGCCAACAATGTGACGCCCATTTGCTGCCTGAAGCACTGCAGAAAGGAGCGCACTGCCTTCCACCTGCTCAGCACCTTTGGGTTTCCCAAGGACCGCCAGCTGCTGCTCAAGTGGTGCGCCAATCTCCACCTGGATCCGGACGACTGCATCGGCCGGGTGTGCATCGAGCACTTCCAGTCGGAGGTGCTCGGCACCCGCAAGCTCAAGCAGAACGCAGTGCCCACTCTCAATGTTGGCCACGATGAGCCACTCAGGTACTCGTGCAATGGCGTGGATCTGGATCGGGAGCAGTCACCGGCACAGCAGTCGGTTTTTCGGCTTTGGAGCCTGAAACACTGCCGCAAGAGGAAGCTAACAGAGCCGCCGGACWTTCGCCCCGGCAAGTGGAGCTCGATGGAGGTCCAGATGATGCGCAAGNTCAAGATGGAGATGCAGATAGAGCGGGAGATCAAGCTGGAGATGCAGATGGAGAGGGAGATAAAGACGGAGACGGAGGCGAAGACTCCAACGAAGAATCAGAGGGAGAGTAAGCCGGAAAGGTGTTGCATCAGCACCTGTGCCAACGAGGACGTTAGCCAGTTACTTCCAATGCCCGAGGAGCAAACTCTTTNNAGAAAGTGGCAGCACAACCTTCAACTACCCATGGACACTGTTCCCNNCAAGATTCGCGTTTGCCTGGAGCACTTTGAGGCGCAGTTTGTGCAAAATGGAAAGCCCACGGAGCAGGCAGTGCCCACTTTAAAGCTGCACCAAGGCAGTTGCNNNNTTTACAGAAACACTGGCTCATGTTTGGTGACCGACTGCATGAGTTCTTTAGCGGATTGCTTTGTGGATTTGCCTGGCAACATGGTCATAAGAGCGGACTGGATGTCCTACCTGAAGCTACCTCCCAGCAACGAGGGTTTACTATGTGGTGCCCACTTTATGGAACTTCATGAGAATGTGGACTTGCCGANNGTTCTGTCTGCNNNNNATTTGGATGAGCTGCAGTTTACNTCNGACGAACTCAAATGCGCTGTGCCcggctgctcctccagctccaNNNCGAAGGATCTTCAGCTTATTCCGCTGCCAGAAGAGGAGGTGAAGCTTTTCAAGTGGCTGCATAACACCAAAATGGCTTACGAWCGCTCGAGGCACAAGAGCTATCGCATCTGTCTGCTGCACTTTGAGCCATCGTGYTTGGAGGCGGACTTTNNGAAAGCTTGGGCCATACCCACYTTGCATCTCAATCATGAGGATAAGATTCACCCGAATCCCAGGCAGGAATCACGCAGTGAAACGCCCAATAGCAACTCCAGGCTGACGCCGCTGAGGATTAAGACAGACCTCGCCTCGCTGGGCAGCCCGTGCGCCAGTGCGAGTCCCAGTCCGCGCGGCAGGACCAGGATATGCTGCATTCCCACCTGCGGACAGTTTGGGAACAGTCAAGTGAGGCTCTACCGCTTCCCCACCGACGAACAGGCCCTGCTGCGTTGGCTGGTGAacacgcagcagcagcctcgCCTGGTGGATCCCCTCGAGCTCTATGTGTGCCAGGCCCACTTCGAACCCGATGCCATCTGCAAGAAGCAGCTCCGCAGCTGGGCAGAGCCCACCCTGAAACTGGGCCACGACGGGCACGTGATCCCCAATGCCAGGCACAACGGTAACATTGCCGACAGCCAGGAGACGGAGCAGGCGATGTCGTTCATCCGGGAGCGCTACTGCTCCGTGCTGACTTGCTTCCAGGCCGAGGGCAATGGCGTACGGCTCTATGAGTATCCCAAGGACATGGCAACGATACGGAAGTGGGCGGCAGCATGCCGACATCGCTCCATGCAGGCCAGCAGTCATGGCTTCAGGGTGTGCCAGTCGCACTTTGCTCCGGCTTGCTTCGAACCCAACACTTTGGATCTGATTGANNNNTCCGTGCCCACGCTGGAGTTGAGCAGGGATGACATTGAGAGGCACTGCCTGGTGGCGGGATGTGCGAAGGAGGCGGGTGGCGAACGGCTGCGCTACTACAAGGTGCCGAAGACTGCGGCTCAGCTGGATGCGTGGAGCAACAACCTGAAGATCAGCCCCGTGGACCTCGTTCAGGGGGATCAGTTCATCTGCGAGCGTCACTTTGAGTCCTTTTGCTTTGGTGCCTACAAGGGACTGCGCCCGGGAGCTCTGCCCACCCTCCACCTGGGTCACGACCAAGAGGCGGAGATGTTGCCCAATCCCGAAAGCCTTTGGCNNNNCAANNNGGAGGTGTGCTGTGCCCCCGGATGCGGGCGTATTTGGCAGCCGGGAGACACTCCGCTCAGTGGATTCCCCAAAGTATGGGCCCTGGCCGACAAATGGATGTACAATCTCCGACTGAAAGTGGCCAAGGAGCAGCTAGGCAGGCTGAAAGTGTGCAGTAGCCACTTCGAGGGCTCCCTATTCGACAGAAATGGATTGATCTTCGGAGCAATGCCCACTCTGGAGCTGGGGCATGACTCACCGGACATTTTCCAGACGGACAAGCAAAGTCTGGGCAAGAGCTTGAAGCTTTCTAAGCGTGCCCAGGTGACGGAGGCCCACTGCTGTTATCCCGAGTGCAAGGAGCTGTCCAAGAACTYGTCGTTCNATCTGCCCCAGGAGGANNACCTTCGCGCAGCTTGGCTGCGTCACTTGGACANNNAGGAAGATGGGAATGCGTGCGGTGTGGCCATGCTCTGTCCGCTGCACTTTGTCATCCTGTATGAGCTCAGTGTGAAAAGTTTCCCGGAGCATGTTCCAGATCGCCTGCTCGAGGATAACTAYCACTTGNCCAGGAGCAACAGGCGCGTCAAGATCGTGAGCTGTGCCGTCAGGGGTTGCGACATGATCCGGCCCCGGGACAAGGTTCTCCTGCACGGATTGCCGCAACGGCGGGACATCCTGAAGATGTGGGTTGACAATGGCCAGCTGGAGATCaccgagcagcagcaacagtacATGCTCAAGGTGTGCCGCAATCACTTTGAGCCACGGTGCTCGTTCGACGACNNNCGGCTGCACCCCTGGAGCGTTCCCACTCTCCACTTGCCGGCGGAGCCAGTGCACCAGATACCCAGCAAGGAGGAGTGGCTGGAGATGACGGCCAAACTGAGCCAGGAACCAGAGGCCATCGTGGAGGANGAGCTGCTGGAGCTNNNGGAAGAGGGTGACTCCCTGTTGGAGCCCATTGTGAGGATGGAGCACGTGGAGTCCGAGGAGGAGNNNNNNNNNATGCAGGCCCTCGAGGTGCTGCTGGAGGTGGGTCACGTGGAGCGCATGGACAGCTACGAGAAAGTGGACACCACCGAGCATGCCAACTACCNNNCCGCCGGCACTCGAAATCAGTACAATGCCAACCACTGTGCCGTCGAGGGATGCCAGGTGACCGNGGAGGATGTGGACGGGNCCANCAAGCTGCACNNGTTCCCCGCCTCCGCGGAGGCCGCCCAGAAGTGGATGCACAACACCCAGGTCGACATGGACGAGAAGTTCTGGTGGCGCTATCGCATYTGCAGCTACCATTTCGACCAGGAGTGCTTCCAGAGTGCCAGGATTAAGAAGGGTGCGATGCCCACGCTCCTTTTGGGGCCCAACAGACCGGACAGGCTGTACGACAATGAGTTTGCCTTGCAGGAGGCCGAGGAGCCGCCACCCTTGTCGGCAGATCTCCAGTCGGAGGAGGACNNNCACGAGCCGCCGACCAANTTGTGCCTGCCGCCACCGGCTCCTCCCCGCAAGTCCAGCAAGTTTTGCCAGATTGAGGGCTGCAGNAATCACCTGACCACCGAGAACATGACGCTGCACAAGTTCCCCCACTCCGAGGACATGTGCCTCAAGTGGCAGCACAACACGCAGGTGCCGTTCGATCCCTACTACCGCTGGCGCTACCGCATCTGCAGTGCCCACTTCCATCCGGTGTGCCTGGTCAACATGCGACTGGTGCACGGCAGTGTGCCCANNNNNAAGCTGGGCACCAAGGCTCCCGCCGACCTCTTCGACAACGACTTCGAGGCCATCAACTTGCGGCTGGACAAGCGNNCGGGAGTGGATCGGGAGCCCAGTGCCCTGCAGATCAAGGAGGAAAGGGAGNNNNNNNNNNNNNNNNNNTCCTCCATGCTGTTCCTAGAGCCYGAACTGCAGCTGCACGAGGAccaggaggaggtggagaTGCCCTTTAGCCAGTCNNNNTGGAAGAGCCAGCTACGCCTGCCCNNNNNNNNNGAGAAGCAGGANAAGNTCTACTACAACCAGGTGAAGTCCGGCTACGACAAGTGCTCGCTGAGCCATTGCCAGCGGCAGAGATCCCAGCACGGCGTGCACATCTACAAGTTCCCCAAGTCGAGGCGCCAGYAGGAGCGCTGGTCGCACAACCTCCGCATCCGCTACGACGAGCGGCGGCCCTGGAAGTTCATGATCTGCAGCGTGCACTTCGAACCGCACTGCATCAGCCTGAGGAAGCTGCGCCCGTGGGCGGTGCCCACTCTGGAACTGGGCGACAATGTGCCCGCCAAGATCTTCACCAACGAGCAATGCCGGGAACTTTCCACCGATCGCAGCGAGGCGGGCAGCGAAGGCNNNGACGAGAATGGCGACGAGGATGGCCTGCAGNNNNNNGAGGANNNNNNagacgaggaggaggaggaggtNNNNNNGGAGGAGGATGAGTGCGACGAGGACTTGGAGCCAGAGGTTCGCGTCAAGCGGGAGAGGCGTTCCAAGCTGGANNNNTGGCCTCCGGGCCAGGTTCCGCCCTGGAAGGTCAAGCAGTGCTGCCTGCCCTACTGCCGTGCCTTCCGCGGTGACGGCATCAAGCTCTTCCGGCTGCCCAACAACCGCACCTCCATCCGCAACTGGGAGCAGGCCACGGGCATGGTCTTCAAGGAGTCCCAGCGCAACACTCGTCTCATCTGCAGCCGCCACTTCGAGCCGGAGCTGATTGGGGTGCGGCGCCTCATGCGCAACGCCATTCCCACCCGCCATTTGAATGCCCAGGGAGCGCCGGCTGCTGTCAAGAGGAAACCAGATCCTCCCGTCCCCGTGGCCACCTGCTGCATGGCCGACTGCCATCATAATGGAAACGTCAAGCTGCACAAGTTTCCCAGTGatCCCACGCTGCTTAGGCAGTGGTGCCAAGCCCTGAGGCTCACGGATACGCAGCGGTACCGGGGCAAACACATCTGCTCGGTCCACCTGCCCACCGACAAGACGGTTAGCTGCGTTGTCTGCGGCGTGGACAACGTTCAGCTGCCGATGCTGGACTTTCCGGAGCAGCGCAATCAGCGCGCCAAGTGGTGCTACAATCTCAAGATCGAGGCCATACCCAAGTGGGACCACTCCAAGCACATCTGCCGTCGTCACTTCGAGTCGCATTGCTTTGCCCAGTCGGATGAGCTGCGTCCGGGAGCGATTCCCACGCGGCATCTGGGCCACGACGACACGAACATATTCCTCAGCGACTATGCCACTGGTCCTACGACNNNCGGCAATCGGATCAAGGACGAGCCCCTGGACAGCGACGACATGCTGCTGGTTTAG
Protein Sequence: MSQQXXXHHAHPHYHHYPPPATPIEPLEAFQQPPNPMAPPPAPEILIKSEPIDEHSYKSNYIDDNTPFADFSKFSEFSEDMLSPKVELTVKDESYGRNTNSFLRRKQQLDRSAESLPICQRCKEVFFKKQTYLRHVAESNCGIQEYDFKCSTCPMSFMTTEELQRHKHHHRADRFFCHKYCGKHFDTIAECEAHEYMQHEYDSFVCNMCSVTFANREQLYAHLPQHKFQQRFDCPICRLWYQTALELHEHRLAAPYFCGKYYTGGQSSSASQPQTQSQHQNQTNYKLQDCHMATMEMPSGPHHKANPSGSSLPATAALSSLLQQRQANADGAAMFAASALKNEXXXXVNVNVKLERSYSNSTSESSYSVQDSSYNNAYGSDGSIHGGAIAGPQAHSSTLDDSEDAVCCVPLCGVRKSTSPTLQFFTFPKDEKYLNQWLHNLKMFHIPAASYANFRICSMHFPKRCINRYSLCYWAVPTFNLGHDDVANLYQNRELTNTFTTGEVARCSMPHCTSQRGESNLKFYNFPKDIKSLIKWCQNARLPVQAKEPRHFCSRHFEERCIGKFRLKPWAVPTLHLGAQYGKIHDNPKNLYVEEKRCCLNFCRRSRSSDFNMSLYRFPRDEVLLRRWCYNLRLDPGVYRGKNHKICSAHFIKEALGLRKLSPGAVPTLHLGHTDTFNIYENELWPPPTASSSGIXQXXQXXXQHLTSQHSLQQXXXXHSKSYQRHSAASTSSSASSATSHYVDADMNASYLAMGAGGSSALNASDSMDICCVPSCESKRHNNENITFHTIPRRPEQMRKWCHNLKIPEEKMHKGMRICSLHFEPYCIGGCMRPFAVPTLQLGHDDDDIHRNPDVIKKLNIRETCCVAVCKRNRDRDHANLHRFPSNVSLLTKWCGNLQRPVPDGSKLFNDAICEVHFEDRCLRNKRLEKWAVPTLILGHENIPYPLPTPQQVAEFYARPTAPNNGEEQGECCVESCKRNPSVDDIKLYRPPEEASVLAKWAHNLQTEAAQLTXXLRICNLHFEAHCIGKRMRPWAIPTLNLAGNIENLYENPEHSMLYKRRXHAKTKLPASVKPTWVPRCCLPHCRKVRALHNVQLYRFPKLNRSTLAKWAHNLQVPMVGSAQRRLCSAHFEPHVLSKKCPVPLAVPTLDLNSPPGLKIYQNPAKLKASKLCLQRVCIVESCRKTRAQGVQLFRLPHSPTQLRKWMHNIKTRPRAAMRAQYRVCSRHFETHSFNGRRLSAGAIPTLELGHDDEDIYPNEAQAFADEHCVVEGCESSKEQAEVRLFRFPTDDDDMLWKWCNNLKMNPVDCTGVRICNKHFEADCIGPKHLYKWAIPTQELGHDDAQIELISNPKPEDRYVDPVFKCIVPTCGKTRRFDEVQMNSFPKDPQLFQRWQHNLRLEHLSFLERERYKICNAHFEDICIGKTRLNIGSIPTLELGHDETEDLFQVNPAELQSNLFGRQRRVQEESGGISIKQELSEPEDVKPDVTNMPAVRDSITRQVKFKRTVSELKCCVHSCGRSRLEHGARLFPFPTGKQQHLKWRHNLRLEPDEVDRSTRVCSAHFNRRCIDGKQLRSWAMPTQQLGHREQPIYENPKNIPGFFTPTCALGHCRKRRSIDNDLRTYRYPRSEDLLEKWRANLRLAPDQCRGRICADHFEAQVRGKLKLKTGAVPTLKLGHDEGLIYDNEAIKVGLNXEDEEGSSELPRLKPKREPIDEAEAEXEEDMEAEEEHHHDQDNGXXDEXXKDEHYFDPLELVETFAEHPSDEEXXXXXEEDRDELXXXXEEELDHFLPDMPPTPPPLIAPLRREKPANNVTPICCLKHCRKERTAFHLLSTFGFPKDRQLLLKWCANLHLDPDDCIGRVCIEHFQSEVLGTRKLKQNAVPTLNVGHDEPLRYSCNGVDLDREQSPAQQSVFRLWSLKHCRKRKLTEPPDXRPGKWSSMEVQMMRKXKMEMQIEREIKLEMQMEREIKTETEAKTPTKNQRESKPERCCISTCANEDVSQLLPMPEEQTLXRKWQHNLQLPMDTVPXKIRVCLEHFEAQFVQNGKPTEQAVPTLKLHQGSCXXYRNTGSCLVTDCMSSLADCFVDLPGNMVIRADWMSYLKLPPSNEGLLCGAHFMELHENVDLPXVLSAXXLDELQFTSDELKCAVPGCSSSSXXKDLQLIPLPEEEVKLFKWLHNTKMAYXRSRHKSYRICLLHFEPSCLEADFXKAWAIPTLHLNHEDKIHPNPRQESRSETPNSNSRLTPLRIKTDLASLGSPCASASPSPRGRTRICCIPTCGQFGNSQVRLYRFPTDEQALLRWLVNTQQQPRLVDPLELYVCQAHFEPDAICKKQLRSWAEPTLKLGHDGHVIPNARHNGNIADSQETEQAMSFIRERYCSVLTCFQAEGNGVRLYEYPKDMATIRKWAAACRHRSMQASSHGFRVCQSHFAPACFEPNTLDLIXXSVPTLELSRDDIERHCLVAGCAKEAGGERLRYYKVPKTAAQLDAWSNNLKISPVDLVQGDQFICERHFESFCFGAYKGLRPGALPTLHLGHDQEAEMLPNPESLWXXXXEVCCAPGCGRIWQPGDTPLSGFPKVWALADKWMYNLRLKVAKEQLGRLKVCSSHFEGSLFDRNGLIFGAMPTLELGHDSPDIFQTDKQSLGKSLKLSKRAQVTEAHCCYPECKELSKNXSFXLPQEXXLRAAWLRHLDXXEDGNACGVAMLCPLHFVILYELSVKSFPEHVPDRLLEDNYHLXRSNRRVKIVSCAVRGCDMIRPRDKVLLHGLPQRRDILKMWVDNGQLEITEQQQQYMLKVCRNHFEPRCSFDDXRLHPWSVPTLHLPAEPVHQIPSKEEWLEMTAKLSQEPEAIVEXELLELXEEGDSLLEPIVRMEHVESEEEXXXMQALEVLLEVGHVERMDSYEKVDTTEHANYXXAGTRNQYNANHCAVEGCQVTXEDVDGXXKLHXFPASAEAAQKWMHNTQVDMDEKFWWRYRICSYHFDQECFQSARIKKGAMPTLLLGPNRPDRLYDNEFALQEAEEPPPLSADLQSEEDXHEPPTXLCLPPPAPPRKSSKFCQIEGCXNHLTTENMTLHKFPHSEDMCLKWQHNTQVPFDPYYRWRYRICSAHFHPVCLVNMRLVHGSVPXXKLGTKAPADLFDNDFEAINLRLDKRXGVDREPSALQIKEEREXXXXXXSSMLFLEPELQLHEDQEEVEMPFSQSXWKSQLRLPXXXEKQXKXYYNQVKSGYDKCSLSHCQRQRSQHGVHIYKFPKSRRQXERWSHNLRIRYDERRPWKFMICSVHFEPHCISLRKLRPWAVPTLELGDNVPAKIFTNEQCRELSTDRSEAGSEGXDENGDEDGLQXXEXXXDEEEEEVXXEEDECDEDLEPEVRVKRERRSKLXXWPPGQVPPWKVKQCCLPYCRAFRGDGIKLFRLPNNRTSIRNWEQATGMVFKESQRNTRLICSRHFEPELIGVRRLMRNAIPTRHLNAQGAPAAVKRKPDPPVPVATCCMADCHHNGNVKLHKFPSDPTLLRQWCQALRLTDTQRYRGKHICSVHLPTDKTVSCVVCGVDNVQLPMLDFPEQRNQRAKWCYNLKIEAIPKWDHSKHICRRHFESHCFAQSDELRPGAIPTRHLGHDDTNIFLSDYATGPTTXGNRIKDEPLDSDDMLLV

Similar Transcription Factors

Sequence clustering based on sequence similarity using MMseqs2

100% Identity: iTF_00605601;
90% Identity: -
80% Identity: -