Basic Information

Insect: Drosophila sechellia
Gene Symbol: -
Assembly: GCA_004382195.1
Location: NC:19323134-19337177[-]

Transcription Factor Domain

TF Family: THAP
Domain: THAP domain
PFAM: PF05485
TF Group: Zinc-Coordinating Group
Description: The THAP domain is a putative DNA-binding domain (DBD) and probably also binds a zinc ion. It features the conserved C2CH architecture (consensus sequence: Cys - 2-4 residues - Cys - 35-50 residues - Cys - 2 residues - His). Other universal features include the location of the domain at the N-termini of proteins, its size of about 90 residues, a C-terminal AVPTIF box and several other conserved residues. Orthologues of the human THAP domain have been identified in other vertebrates and probably worms and flies, but not in other eukaryotes or any prokaryotes [1].
Hmmscan Out: # of c-Evalue i-Evalue score bias hmm coord from hmm coord to ali coord from ali coord to env coord from env coord to acc

1 29 6.4 1.1e+04 -3.1 3.0 38 62 382 409 375 425 0.60

2 29 2.5e-15 4.3e-12 46.2 3.9 1 86 616 688 616 689 0.85

3 29 1e-14 1.8e-11 44.3 5.0 1 87 716 785 716 785 0.83

4 29 9.4e-16 1.6e-12 47.6 0.2 1 87 807 879 807 879 0.85

5 29 4.3e-16 7.4e-13 48.7 5.5 1 87 977 1047 977 1047 0.82

6 29 1.3e-14 2.3e-11 43.9 3.4 1 86 1071 1142 1071 1143 0.82

7 29 3.3e-13 5.7e-10 39.5 1.3 1 87 1178 1246 1178 1246 0.80

8 29 8.4e-11 1.4e-07 31.8 1.4 1 86 1286 1355 1286 1356 0.76

9 29 4.6e-17 7.8e-14 51.8 0.4 1 86 1383 1452 1383 1453 0.83

10 29 2e-12 3.4e-09 37.0 1.4 1 85 1474 1542 1474 1544 0.80

11 29 2.3e-13 3.9e-10 40.0 0.7 1 86 1571 1642 1571 1643 0.84

12 29 3.5e-13 6e-10 39.4 2.4 1 85 1716 1784 1716 1786 0.82

13 29 4.9e-13 8.3e-10 38.9 0.1 1 87 1809 1878 1809 1878 0.81

14 29 2.7e-13 4.7e-10 39.7 2.4 1 87 2011 2080 2011 2080 0.80

15 29 8.5e-11 1.5e-07 31.7 0.4 1 86 2183 2249 2183 2250 0.79

16 29 1.4e-06 0.0025 18.2 0.0 1 59 2265 2313 2265 2329 0.80

17 29 3.7e-12 6.3e-09 36.1 0.5 1 87 2342 2412 2342 2412 0.82

18 29 5.3e-12 9.1e-09 35.6 0.8 1 87 2468 2538 2468 2538 0.83

19 29 1.9e-11 3.3e-08 33.8 0.2 1 86 2573 2644 2573 2645 0.81

20 29 7.3e-11 1.3e-07 31.9 0.0 1 86 2655 2726 2655 2727 0.78

21 29 8.6e-12 1.5e-08 34.9 0.1 1 86 2751 2821 2751 2822 0.77

22 29 0.0001 0.18 12.2 0.1 1 58 2849 2896 2849 2925 0.80

23 29 1.6e-13 2.8e-10 40.5 0.1 1 87 2934 3007 2934 3007 0.83

24 29 7.5e-16 1.3e-12 47.9 0.3 1 86 3129 3201 3129 3202 0.80

25 29 1.8e-12 3.1e-09 37.1 3.7 1 86 3260 3330 3260 3331 0.81

26 29 7.6e-14 1.3e-10 41.5 4.2 1 86 3428 3498 3428 3499 0.84

27 29 1.4e-11 2.4e-08 34.3 0.1 1 86 3578 3647 3578 3648 0.84

28 29 1.1e-10 1.9e-07 31.4 1.3 1 58 3671 3719 3671 3727 0.85

29 29 1.9e-10 3.3e-07 30.6 1.1 6 86 3730 3794 3726 3795 0.75

#	of	c-Evalue	i-Evalue	score	bias	hmm coord from	hmm coord to	ali coord from	ali coord to	env coord from	env coord to	acc
1	29	6.4	1.1e+04	-3.1	3.0	38	62	382	409	375	425	0.60
2	29	2.5e-15	4.3e-12	46.2	3.9	1	86	616	688	616	689	0.85
3	29	1e-14	1.8e-11	44.3	5.0	1	87	716	785	716	785	0.83
4	29	9.4e-16	1.6e-12	47.6	0.2	1	87	807	879	807	879	0.85
5	29	4.3e-16	7.4e-13	48.7	5.5	1	87	977	1047	977	1047	0.82
6	29	1.3e-14	2.3e-11	43.9	3.4	1	86	1071	1142	1071	1143	0.82
7	29	3.3e-13	5.7e-10	39.5	1.3	1	87	1178	1246	1178	1246	0.80
8	29	8.4e-11	1.4e-07	31.8	1.4	1	86	1286	1355	1286	1356	0.76
9	29	4.6e-17	7.8e-14	51.8	0.4	1	86	1383	1452	1383	1453	0.83
10	29	2e-12	3.4e-09	37.0	1.4	1	85	1474	1542	1474	1544	0.80
11	29	2.3e-13	3.9e-10	40.0	0.7	1	86	1571	1642	1571	1643	0.84
12	29	3.5e-13	6e-10	39.4	2.4	1	85	1716	1784	1716	1786	0.82
13	29	4.9e-13	8.3e-10	38.9	0.1	1	87	1809	1878	1809	1878	0.81
14	29	2.7e-13	4.7e-10	39.7	2.4	1	87	2011	2080	2011	2080	0.80
15	29	8.5e-11	1.5e-07	31.7	0.4	1	86	2183	2249	2183	2250	0.79
16	29	1.4e-06	0.0025	18.2	0.0	1	59	2265	2313	2265	2329	0.80
17	29	3.7e-12	6.3e-09	36.1	0.5	1	87	2342	2412	2342	2412	0.82
18	29	5.3e-12	9.1e-09	35.6	0.8	1	87	2468	2538	2468	2538	0.83
19	29	1.9e-11	3.3e-08	33.8	0.2	1	86	2573	2644	2573	2645	0.81
20	29	7.3e-11	1.3e-07	31.9	0.0	1	86	2655	2726	2655	2727	0.78
21	29	8.6e-12	1.5e-08	34.9	0.1	1	86	2751	2821	2751	2822	0.77
22	29	0.0001	0.18	12.2	0.1	1	58	2849	2896	2849	2925	0.80
23	29	1.6e-13	2.8e-10	40.5	0.1	1	87	2934	3007	2934	3007	0.83
24	29	7.5e-16	1.3e-12	47.9	0.3	1	86	3129	3201	3129	3202	0.80
25	29	1.8e-12	3.1e-09	37.1	3.7	1	86	3260	3330	3260	3331	0.81
26	29	7.6e-14	1.3e-10	41.5	4.2	1	86	3428	3498	3428	3499	0.84
27	29	1.4e-11	2.4e-08	34.3	0.1	1	86	3578	3647	3578	3648	0.84
28	29	1.1e-10	1.9e-07	31.4	1.3	1	58	3671	3719	3671	3727	0.85
29	29	1.9e-10	3.3e-07	30.6	1.1	6	86	3730	3794	3726	3795	0.75

Sequence Information

Coding Sequence: ATGCGAAATCCAAAGGACAATAGCAACAATGCCAGTTCGATACATACACACAGACGGGGGCCGATGAAAAACTGGACAACACACCACAAGGCGAACCGAAACAGGCGACACTTACCAGGGGGCAGCATAAACACAGGCAGCACCGCTTCCGTGATGTCACAACAACACCCCCATCACGCCCACCCCCACCACTACGCCCACCACTACCCGCCCCCCGTGACGCCCATGtccatgcagcagcagcaacagcagcatcagcaggcGCAGCTGTCgcctcagcagcagcagcagcagcacaccAATTGGTACTCACATGTTGCTTCCTACCCCACACCCCACTCGGCCTTCGGCCCCGCCCCCGCCCCCTCATGCAAGGCCGCCAACAACAGTgtcagcggcaacaacaacaacaacattatGGGCGGCGGGGGATACGGGCCAGGGGGTGGTGGCGCGCAGGGCTATTATGGCGCCGCTGGCGGTGGCCTCAATGTCAGTGGGGcagtggtgggtggtggtgggccGAGCTACGGCCTTGGGGCCAACACAGTGGCATATGCCCACAACCAACTGCTGCAgtatcaacaacaacaacaacagcagcagcagcagcaacaacagcagcagcaacagcagcaccaccagcatcTTCCGCAGCACATAAGCCAACAAAGACCCTATATGGGCCACAATATCATGGCCGGCAGCTATCCTTATATCAAAAGCGAACCCATGGAGGCCTACCAGCAACCCCCGAATCCCATGGCCCCGCCCCCGGCACCAGAAgtattaataaaatCGGAACCCATTGACGAGCATTCCTACAAGTCCAACTATATAGACGACAATACGCCATTTGCTGACTTCAGCAAGTTCAGCGAATTCAGCGAGGACATGCTGAGTCCGAAAGTGGAGCTGACCGTAAAGGATGAGTCCTACGGAAGGACCACTAGCAGTTTCCTGCGTCGCAAACAACAATCGGATCGGGGCACCGAAAGTCTGCCCATTTGCCAGCGCTGCAAGGAGGTCTTCTTTAAGAAGCAGGTCTATCTCCGCCATGTGGCCGAGAGCAACTGCGGCATCCAGGAGTACGACTTCAAGTGCAGCACCTGTCCCATGTCCTTCATGACCACCGAGGAGCTGCAGCGGCACAAGCTTCACCACCGGGCCGACAGGTTTTTCTGCCACAAGTACTGCGGCAAGCACTTCGACACGATCGCTGAGTGCGAGGCGCACGAGTACATGCAGCACGAATACGATAGCTTTGTCTGCAACATGTGCTCCAGCACCTTCGCTACGCGGGAACAACTGTACGCCCACCTGCCGCAGCACAAGTTCCAGCAGCGCTTCGACTGTCCCATCTGCCGACTATGGTATCAGACGGCTCTAGAGCTTCATGAACATCGTCTGGCTGCTCCATATTTCTGCGGCAAGTACTACACGGGCGGACAGTCATCTTCTGCCTCCCAATCCCAATCGCAGCAGCACCAGACCAACTACAAGCTGCAGGACTGTCATATGGCAACCATGGAGATGCCCACAACCCCGCACCACAAAACCACTCCATCCGGCTCGTCTTTGCCGGCGACGTCTGCGCTGAATTCTCTACTGCAGCAGCGTCAGGCAAATGCCGACGGAGCTGCCATGTTCGCAGTATCCGCAATGAAGAACGAAGTGAATGTTAAGATGGAGCGAAGCTACAGCAACTCTACCAGCGAGTCATCCTACAGCGTTCAGGACAGTGGCTACAATAATGCCTATGGAAGCGACAGCTCAATGCACGCAGGAGCGATCGCCGGGCCACAGGCGCACTCCTCAACGCTGGACGACTCCGAGGACGCCTTGTGCTGTGTTCCTCTGTGTGGAGTGCGCAAGAGCACGAGCCCCACGCTCCAGTTTTTCACGTTCCCCAAGGACGAGAAGTACCTCAATCAGTGGCTGCACAACCTCAAGATGTTTCACATACCCGCCGCCAGCTATGCCAATTTCCGCATCTGTAGCATGCATTTTCCGAAGCGCTGCATTAACCGCTACTCTCTGTGCTACTGGGCCGTTCCCACGTTCAACCTGGGCCACGACGACGTGGCCAATCTATACCAGAACAGGGAGCTCACCAACACGTTCACCACCGGCGAGGTAGCGCGCTGCAGCATGCCTCACTGTACAAGTCAGCGGGGTGAGAGCAATTTGAAGTTCTACAACTTTCCCAAGGACATCAAAAGCTTGATCAAGTGGTGCCAGAATGCACGACTTCCCGTTCAGGCAAAGGAGCCGCGTCATTTTTGCAGTCGCCACTTCGAGGAGCGCTGTATTGGCAAGTTCCGTCTAAAGCCGTGGGCGGTGCCTACTTTACACCTAGGTGCCCAATATGGCAAGATCCACGATAACCCAAAGAATTTGTACGTTGAAGAAAAACGCTGCTGCCTCAACTTCTGCCGCCGGAGCCGATCCTCTGACTTCAATATGTCGCTATATCGATTTCCCAGAGATGAAGTTCTCCTGCGACGCTGGTGCTACAATCTCCGCTTGGATCCCGGAGTGTATCGTGGgaaaaatcacaaaatatGCAGCGCCCACTTTATCAAAGAGGCGTTGGGTCTGCGCAAACTATCACCAGGGGCCGTTCCGACGCTTCACCTGGGTCACACTGACACCTTCAACATCTACGAAAACGAACTGTGGCCACCGCCAACGGCACCCAACAGTCACAGCAGTGGCCTCCAGCACCAGACGCAACATCATTCCTCACAACACTCACTGCAACAGCAATTGCACAGCAAATCGTACAACCGGCAATCGGCGGCCTCCACGTCCTCCTCCGCCAGCTCGGCAAACTCTCACTACGTGGATCCTGATCTAAGCGCCTCTTACCTTGGCTTAGGTGCCAGTGGATCTTCTGCAATGAATGCCAGCGACAGCATGGACGTATGTTGCGTGCCTAGTTGCGAGAGTAAGCGGCACAATAATGAGAACATTACATTCCACACCATACCACGACGACCGGAGCAGATGCGCAAGTGGTGCCATAATCTGAAAATACCCGAGGAAAAGATGCACAAGGGTATGAGGATCTGCAGCCTGCACTTCGAGCCCTATTGCATCGGCGGTTGCATGCGACCATTTGCGGTGCCTACGCTTAACTTGGGTCACGATGACGACGATATTCATAGAAATCCGGATGTGATCAAGAAGTTAAACATCCGGGAAACGTGCTGCGTTGCCGTGTGCAAACGAAATCGCGACAGGGACCACGCGAATCTGCACCGTTTCCCAAGCAATGTGTCCTTATTGACCAAGTGGTGTGGCAATCTCCAGCGGCCTGTTCCGGATGGAAGTAAACTTTTCAACGACGCCATTTGTGAAGTACACTTCGAGGAACGATGTCTGCGCAACAAAAGGCTAGAGAAGTGGGCAGTGCCCACACTATCGTTAGGCCACGAAAACATCCCATATCCGCTGCCAACGCCggaacaggttacggaattctACGCTCGACCCACTGCGCCCAATAATGGCGAGGAACAGGGAGAGTGCTGTGTGGAGACGTGCAAGAGAAATCCCAGTGTGGACGACATCAAGCTCTATCGGCCGCCGGAGGAAGCTTCCGTGTTGGCCAAATGGGCGCATAACCTGCAGACGGAGAGCAGTCAACTGACAAGCATGAGGATCTGTAATCTTCACTTTGAGGCACACTGCATCGGCAAGCGGATGAGACCTTGGGCTATTCCAACACTAAATCTGGCCGGCAACATAGAGAATCTCTACGAGAATCCGGAGCATTCGATGCTGTACAAGCGGCGGACTCACATGAAGGCCAAGCAGTCGGCTTCCGTGAAGCCCACTTGGGTGCCCAGGTGCTGTCTTCCGCATTGCCGCAAAGTTCGGGCTCTCCACAACGTTCAGCTGTATCGCTTCCCCAAGCTCAATCGCTCCACTCTGGCTAAGTGGGCGCACAATCTGCAGGTTCCTATGGTTGGCAGTGCCCAGCGCCGTCTATGCTCGGCTCATTTCGAGCCGCACGTGCTGAGCAAAAAGTGCCCGGTGCCGCTGGCGGTGCCCACATTGGACTTGAATGCGCCGCCCGGCTTGAAGATTTACCAGAATCCAGCAAAGCTCAAGGCAAGCAAGCTGTGTCTGCAGCGCGTGTGCATTGTCGAGAGTTGTCGTAAGACACGGGCGCAGGGCGTCCAGCTCTTCCGACTGCCACATAGTCCAACGCAGCTGCGCAAGTGGATGCACAACATCAAAACGCGACCCAGAGCGGCAATGAGGGCCCAATACCGTGTGTGTTCCCGCCACTTTGAGACACACTCTTTCAATGGCCGGAGACTGAGCGCTGGCGCCATTCCCACCCTGGAACTGGGTCATGACGACGAGGACATCTATCCCAACGAAGCGCAGGCCTTTGCGGACGAGCACTGCGTGGTGGATGGCTGCGAGGCATCCAAGGAACAGCCTGACGTGCGACTCTTCCGCTTTCCCACAGAGGATGACGATATGCTATGGAAGTGGTGCAACAATCTCAAAATGAACCCGGTGGATTGCACCGGCGTGCGCATATGCAATAAACACTTCGAGGTAGATTGCATCGGGCCCAAGCACTTATACAAGTGGGCTATTCCCACCGAGGAACTGGGTCACGACGACGCCGACATCGAGCTAGTGCTAAATCCCAAGCCGGAGGACAGGTATGTGGATCCTGTGTTCAAGTGCATCGTACCGACCTGCGGAAAGACGCGTCGCTTCGACGAAGTCCAGATGAACAGTTTTCCCAAGGACGCGAATCTCTTCGAGCGGTGGAAACACAACTTGCGGCTGGAACACCTCAGCTTCCACGAACGCGATCGGTACAAGATATGCAACTCTCACTTTGAGGATATATGTATTGGAAAGACGCGGCTAAACATAGGTTCGATCCCGACTCTAGAATTGGGTCACGACGAGACGGACGATCTGTTCCAGGTAAATCCGGAGGAGCTGCAGAGCAACCTTTTCGGACGACAGCGGCGAGTACACGACGAGTCGGTCGGAATTATCATCAAGCAGGAGTTTTCCGAGTCGGAGGACGTCAAAACGGACGTGTCTGATACCAAAGTTTTCAATACGAGACAGGTTAAGCTCAGAAAGACTATGTCCGATCTGAAGTGTTGTGTGCGCAGTTGTGGGCGCAGTCGACTGGAGCACGGAGCACGCCTCTTTCCATTTCCCACCGGTAAGCAGCAGCACTTGAAGTGGCGCCATAACCTGCGCCTGGAGCCCGACGAGGTGGACCGATCGACCCGGATTTGCAGTGCGCACTTCAACCGGCGCTGCATTGATGGCAAACAGCTGAGAAGCTGGGCAATGCCCACGCAACAACTGGGCCACCAGGAGCAGCCGATCTACGAGAATCCGAAAAACATACCAGGATTCTTTACGCCCACCTGTGCTCTGAGTCATTGCCGCAAGCGTAGGAGCATTGACAACGATCTCCGCACCTATCGATATCCGAGGAGTGAGGATCTTCTGGAGAAATGGCGGGCGAATCTGCGTCTGGCGCCGGATCAGTGTCGCGGCAGGATATGTGCTGACCATTTTGAGTCACAGGTGCGTGGAAAGTTGAAGCTGAAAACGGGAGCGGTGCCTACTCTAAATCTGGGCCATGATGAAGGCTTAATATACGATAATGAGGCTATAAAGGTGGGCATGACCGAAGAAGAGGAAGTCAGCTCGGAGATGCCACGACTGAAACCCAAAAGAGAGCTGATTgatgaagaggaagaagaacTAGAGGCTGAGGAGGAGCCCCATGAGCACGATATGTACGATGAAGATGAGAAGGACGGCCACTACTTCGATCCTCTCGAACTGGTCGAGACCTTTGCCGAACATCCAAGTGACGATGAAGGCGAGTATCGTGGAGATGAGGAGGATGAGCGCGACGAGGATGAGGACCTGGACGAGGCGGAGCACTTTCATCCGGAAAACCCACCCACTCCCCCAACTATCCCTCTGCGTCGCGAAAAGCCCGCTAATAATGTGACGCCCATCTGCTGTCTAAAGCACTGCAGAAAGGAACGCACTGCTTTTCATCTACTTAGCACCTTTGGCTTTCCCAAGGATCGCCAGCTGCTGCTCAAATGGTGCTCCAATCTACACCTGAATCCGGATGACTGCATCGGCCGCGTTTGCATAGAGCACTTTCAGCCGGAGGTACTGGGAACCCGAAAGCTGAAGCAAAATGCGGTGCCCACTCTCAATGTGGGCCACGATGAGCCACTTAGGTACTCTTGTAATGGAATAGATCTTGACCAGGAGCAATTGCAGCCACAGCACTCGGTTTTTCGGCTTTGGAGCCTAAAACACTGCCGCAAGAGGAAACTGACGGAGCCGCCGGACATCCGCCAAAGCAAGTGGAGTGCGGAAGTGCGGAAGATGCAGAGATTGAGGATGGAGATGAAAATGAAGATAGGGAGAGAGATCAAGCTGGAGGTGCAGACGGagagggaattgaagaccaaGGAAAAGACTCCAATGACGAATCAGGGGAAGATTAGGTTGGTAAGATGTTGCATCAGCTCCTGTGCGAACGAAGACGTTAACCAACTACTTCCGCTGCCTGAGGAGCCTAATCTCTTAAGAAAGTGGCAGCATAACCTTAAGTTATCAGTAGACACGGACTTCAAGAAAATCCAAGTGTGTCTAAAGCACTTTGAGGAGCAAGTGGTGCAAAACGGAAAGCCCTTGGAGCAGGCAGTACCCACCTTACAGCTAGATCAAAACAGTTGGAACATTAACAGAAACAGCGGAAGTTGTCTGTTTCCAGAGTGCAGAAAATCTTCATCGGATCGGTTAAGCTTTGTTGATTTACCTGGAAATGCGGTCATTAGAGATGCCTGGATGAGTCACCTTAATTTACCACCCAGCACTGATGGTCTTCTTTGTAGTGACCACTTTATGCAACTCCTTGAACAGGTGGAATTCCCCAAGGTATTGGCCGCACAAGATTTGGAGGACTTGCAGTGGATTGCTGACGAACTTAAATGCGCTGTTCCCAGTTGTTCGTCCAAATCTGATGGGGATCTTCAGCTTATCCCGCTTCCGGAAAAGGATGCTACCCTTTTGAAGTGGCTACATAACACAAAGATATCTTACGATCATTCAAAGCACAAAAGCTATCGCATATGTGTTCTTCATTTCGAGCCGACTTGCTTAGAGGCGAATTTTCCGAAAGCTTGGGCTATACCCACCTTGCATTTAAGCCACGATGACGAGCTTCATTTGAATCTCAGGCCTGAATCTCGCAGTGGTACTCCAAACAGCAACTCCAGGCTAACTCCATTGAGAATTAAAACAGATCTGGCCTCCTTGGGAAGTCCATGCTCGAGTGCAAGTCCTAGTCCTCGAGGCAGGATCAGGATATGTTGCATTTCCACATGTGGACAGATTGGAAGTAGTCAAGTTCGACTCTACCGCTTTCCCACCGAAGAGCAGGCCCTACTGCGGTGGCTGGTGAACACGCAGCAGCAACCTCGCCTTGTGGACCCTGCGGAGCTTTATGTGTGCCAATCTCACTTTGAACCCGACGCCATTTGCAAAAAACAGCTTCGTTGCTGGGCAGAACCCACCTTAAACCTAGGCCACGACGGGTTTGTTATCCCCAATGCCAAACACAATGGAAACATTGCTGGGGGCCAGGATACTGAGGAGGCGATGAGGCTTATCCGGGAGCGCTATTGCTCCGTACTGACTTGTTTCCAGGCTGAAGCCAGCGGTATAAGGCTATATGAGTATCCCAAGGATATGCCAACTATACGAAAGTGGGCAGCTGCGTGTAGACATCGCTCCATGCAGGCCAGCAGCAATGGATTCAAGGTATGCCAGTCTCACTTTGCACCGGAATGCTTCGAGCCGGACACTTTAAATTTGATTGAGGGATCCGTTCCCACTCTGGAGTTAAGTAGAGGGGACATAGAAAGACACTGCCTAGTGTCTGGATGTGAAAAGGATGCATCTGGAGGACGTCTGCGCTACTACAAGGTGCCAAAGACCGCTGCTCAACTGAATGCTTGGAGCAACAACCTGAAGATCAGTTCTGTGGACCTCGGATTGGGGGAGCAGCTCATTTGTGAGCGTCACTTTGAGCCCTTTTGCTTCGGTGCCCACAAGGGATTACGAACTGGCGCACTTCCGACTCTCATGCTAGGGCACGACGAAGAGGTGGAGATGTTACCGAACCCAGAAAGTCTCTGGCAGAAAAAAGAAGAGGTTTGCTGTGCCACTGAATGTGGTCGAATTTGGCAGCCTGGAGACACTAAGTTTAGTGGATTTCCTAAATCATTGGCGTTGGCTAAGAAATGGGTTCATAATCTTCAACTGAGCGTAGAAAATGACCAACTGAGCAGTCTGAAAGTCTGCAGTGTGCATTTCGAAGCTTCTCTCTTCAATAAAAGTGGCTTAATATCGGGTTCCATACCCACACTGGAGCTGGGCCATTCTTCTCAGGATATATTTCTGTCGGACACCCAACACATGGGTAAAAGAACCATAATATCGGATCTTGATTGCATTTATCCTGAGTGCAAGGAACTGTGCAAAACCGTGTCATTCAATCTGCCCCAAGAAGAGGACCTACGGACAGTGTGGCTCCGTCACTTGAAGATCGAAGAGCCGTCGAGTGGTGTCGGTCAGCTATGCCCACTACACTTCGTTATTCTTTACGAGCTAAGTATCAAAAGTTTTCCGGAGCACGTTTCAAACCGATTCCTTGAAGAAAAGTACTATTCTGCTCGGAACAACAGGCGCGTCAAAATCGTTAGCTGTGCGGTTGAAGGTTGTGAAATGATCAGACCGCGGGATAAGGTGCTCCTGCACGGGTTGCCGCAAAGGAAGGACATACTGAGAATGTGGGTTGAGAATGGCCAACTGGAGATTACGGagccgcagcagcaatatATGCTTAGGGTATGCCGCAATCACTTTGAGTCCCGATGTTCGTTTGACGACAGGCGGCTGCATCCATGGAGCGTTCCCACTCTGAACTTACCTGGAAATCCGGTGCATCAAATTCCCACTAAGGAGGAGTGGCAGGAAATGACGATAAAATTCAACCAGGAAGCCGATACAATTAAATTGGAGATAGAGGAGGAACAGGAGGAGGAAGAGCTGCCCGAGGAGGAAGAGCTGCTTGAGGAGGAAGTGGGTGACTGTTCTCTTCTAGAGCCTATTGTAAGAATGGAACACATCGAGTCCGATGAAGAAGACTCAGAGATGCCGGCTCTGGAGGTCCTTCTGGAGGTTGGTCACGTTGAGCGGATGGACAGCTACGAAAGAGTGGATGAGTCCTATACCGAACAAGCCGTCTACCAATCTAATGGCATTAGAAACCAGTACAATGCCAACCACTGCGCCGTTGAAGGATGCGAAGTGACCGTTGAGGACGTAGGCGGGACCATCAAGCTGCACAAGTTCCCCGCATCTTCGGAGGCCGCTAGGAAGTGGATGCACAACACCCAAGTCGACATGGATGAGAAGTTCTGGTGGCGGTATCGAATTTGCAGTTACCATTTCGATCAGGAGTGCTTTCAGAGCGCAAGGATAAAGAAGGGAGCGATGCCCACTCTTCGCCTGGGACCTAAGAGACCGGACAAGGTGTACGACAACGAATTCGCATTGCAGGAGACTGAGGAGCTCATAGTGCCTGAAGACCTTCAGTTTGAGGATCCCAAAAAGCCGAAAAGGGAGGTAATAAAACTGTGTCTGCCAACGCCGGCTCCGCCTCGAAAGTCCAGTAAGTTTTGTCAGATCGAGGGATGTATGAATCACCTGACCACTGAAAACATAACCTTGCACAAATTTCCCCATTCGGAGGACATGTGCCTCAAGTGGCAGCACAACACGCAGGTGCCTTTCGATTCTTTCCACCGATGGCGATACCGGATATGTAGTGTCCATTTTCATCCGGTGTGCTTGCTTAACATGAGACTAGTCCATGGCAGTGTGCCCACCTTAAAACTAGGTAGCAAGGCTCCCAGCGAACTGTTCGACAACGACTTCGAAGCCATTAACCTCAGGCTGGACAAGAAGTGGGGGACGAACCAAAGTACCGTGCAGATAAAGGAGGAGGATGAAGATTCTATGCCGTCCCTGGAACCAGAACTGCAGCTTCGCGAAGACCAAGAGGTGGAGGAATCAGAAGCTACGCAAATACCCTTTAACCAGACAAATTGGAAGGGCCAATTGCGATTGCCTGTGAAGCAAGAAAAGGTGGCCTACAACCAGGTGAAGTCAGGATACGATAAGTGCTCCTTAAGTCATTGCCAGCGGCAGAGATCTAAGCATGGCGTTCACATCTACAAGTTTCCCAAATCGAGGCTCCAACAGGAGCGTTGGATGCACAACCTCCGTATCCGCTACGATGATCGAAGGCCGTGGAAGTTTATGATCTGCAGCGTGCATTTCGAGCCCCACTGCATCagcctgaggaagttgcgcccCTGGGCGGTTCCCACCCTGGAGCTGGGAGATAATGTGCCGGAGAAGATCTTTACGAACGAACAGTGCCATGAACTCTCCACCGATCGCAGCGAGGCGGAGAGCGATGCCGATGAGGAGGACGGTCTgcaggaggacgaggaggaggaggatgagtaCGAAGAGGAAATGGGCCCGGAGGTACGCATCAAGCGGGAACGGCGTTCCAAGCTTGATCCTTGGCCACCCGGTCAGGTTCCTCCGTGGAAAGTTAAGCAGTGTTGTCTTCCTTACTGCCGTGCCTTCCGTGGCGATGGCATCAAACTGTTCCGGCTGCCCAACAACCGCACCTCCATACGCAACTGGGAGCTGGCGACGGGCATGGTGTTCAAGGAGTCTCAACGAAACACTCGCCTGATTTGCAGCCGGCACTTTGAGCCCGAGCTGATTGGCGTAAGGCGTCTCATGCGGAACGCCATTCCCACGAGGCACTTAAGTACGCAGGAACCGTCCGAGGAAGTAAAAAGAAAGCCGGATCCTCCACTCCCAATCGCAACCTGTTGCATGGCTGACTGTCATCATAATGGAAATGTTAAGCTGCACAAGTTTCCTAGTGACCCGGCGCTACTTAGGCAGTGGTGCCAGGCACTCAGGCTCACGGATACCCAGAGGTACCGGGGCAAACATATCTGCTCGGTCCACCTGCCCACCGACAGGTCGGTCAGCTGCGTCATCTGCGGAGTGGAAAACGCCCAGTTGCCGATGCTGGACTTTCCAGAGCAGCGCAATCAGCGTGCCAAATGGTGCTACAATCTCAAGATCGAAGCCATACCCAAGTGGGACCACTCCAAGCACATCTGCTGTCGTCACTTTGAGTCGCATTGCTACCTCCAGCCGGGTGAACTGCGTCCAGGTGCAATACCCACACTGCAGCTGAACCACGACGACACGAATATATTCCTCAGCGACTTCGCCACTAGTCCGACAGGCAATCGGATCAAGGACGAGCCGCTGAACAACGACGATATGTTGCTGGTTTAG
Protein Sequence: MRNPKDNSNNASSIHTHRRGPMKNWTTHHKANRNRRHLPGGSINTGSTASVMSQQHPHHAHPHHYAHHYPPPVTPMSMQQQQQQHQQAQLSPQQQQQQHTNWYSHVASYPTPHSAFGPAPAPSCKAANNSVSGNNNNNIMGGGGYGPGGGGAQGYYGAAGGGLNVSGAVVGGGGPSYGLGANTVAYAHNQLLQYQQQQQQQQQQQQQQQQQQHHQHLPQHISQQRPYMGHNIMAGSYPYIKSEPMEAYQQPPNPMAPPPAPEVLIKSEPIDEHSYKSNYIDDNTPFADFSKFSEFSEDMLSPKVELTVKDESYGRTTSSFLRRKQQSDRGTESLPICQRCKEVFFKKQVYLRHVAESNCGIQEYDFKCSTCPMSFMTTEELQRHKLHHRADRFFCHKYCGKHFDTIAECEAHEYMQHEYDSFVCNMCSSTFATREQLYAHLPQHKFQQRFDCPICRLWYQTALELHEHRLAAPYFCGKYYTGGQSSSASQSQSQQHQTNYKLQDCHMATMEMPTTPHHKTTPSGSSLPATSALNSLLQQRQANADGAAMFAVSAMKNEVNVKMERSYSNSTSESSYSVQDSGYNNAYGSDSSMHAGAIAGPQAHSSTLDDSEDALCCVPLCGVRKSTSPTLQFFTFPKDEKYLNQWLHNLKMFHIPAASYANFRICSMHFPKRCINRYSLCYWAVPTFNLGHDDVANLYQNRELTNTFTTGEVARCSMPHCTSQRGESNLKFYNFPKDIKSLIKWCQNARLPVQAKEPRHFCSRHFEERCIGKFRLKPWAVPTLHLGAQYGKIHDNPKNLYVEEKRCCLNFCRRSRSSDFNMSLYRFPRDEVLLRRWCYNLRLDPGVYRGKNHKICSAHFIKEALGLRKLSPGAVPTLHLGHTDTFNIYENELWPPPTAPNSHSSGLQHQTQHHSSQHSLQQQLHSKSYNRQSAASTSSSASSANSHYVDPDLSASYLGLGASGSSAMNASDSMDVCCVPSCESKRHNNENITFHTIPRRPEQMRKWCHNLKIPEEKMHKGMRICSLHFEPYCIGGCMRPFAVPTLNLGHDDDDIHRNPDVIKKLNIRETCCVAVCKRNRDRDHANLHRFPSNVSLLTKWCGNLQRPVPDGSKLFNDAICEVHFEERCLRNKRLEKWAVPTLSLGHENIPYPLPTPEQVTEFYARPTAPNNGEEQGECCVETCKRNPSVDDIKLYRPPEEASVLAKWAHNLQTESSQLTSMRICNLHFEAHCIGKRMRPWAIPTLNLAGNIENLYENPEHSMLYKRRTHMKAKQSASVKPTWVPRCCLPHCRKVRALHNVQLYRFPKLNRSTLAKWAHNLQVPMVGSAQRRLCSAHFEPHVLSKKCPVPLAVPTLDLNAPPGLKIYQNPAKLKASKLCLQRVCIVESCRKTRAQGVQLFRLPHSPTQLRKWMHNIKTRPRAAMRAQYRVCSRHFETHSFNGRRLSAGAIPTLELGHDDEDIYPNEAQAFADEHCVVDGCEASKEQPDVRLFRFPTEDDDMLWKWCNNLKMNPVDCTGVRICNKHFEVDCIGPKHLYKWAIPTEELGHDDADIELVLNPKPEDRYVDPVFKCIVPTCGKTRRFDEVQMNSFPKDANLFERWKHNLRLEHLSFHERDRYKICNSHFEDICIGKTRLNIGSIPTLELGHDETDDLFQVNPEELQSNLFGRQRRVHDESVGIIIKQEFSESEDVKTDVSDTKVFNTRQVKLRKTMSDLKCCVRSCGRSRLEHGARLFPFPTGKQQHLKWRHNLRLEPDEVDRSTRICSAHFNRRCIDGKQLRSWAMPTQQLGHQEQPIYENPKNIPGFFTPTCALSHCRKRRSIDNDLRTYRYPRSEDLLEKWRANLRLAPDQCRGRICADHFESQVRGKLKLKTGAVPTLNLGHDEGLIYDNEAIKVGMTEEEEVSSEMPRLKPKRELIDEEEEELEAEEEPHEHDMYDEDEKDGHYFDPLELVETFAEHPSDDEGEYRGDEEDERDEDEDLDEAEHFHPENPPTPPTIPLRREKPANNVTPICCLKHCRKERTAFHLLSTFGFPKDRQLLLKWCSNLHLNPDDCIGRVCIEHFQPEVLGTRKLKQNAVPTLNVGHDEPLRYSCNGIDLDQEQLQPQHSVFRLWSLKHCRKRKLTEPPDIRQSKWSAEVRKMQRLRMEMKMKIGREIKLEVQTERELKTKEKTPMTNQGKIRLVRCCISSCANEDVNQLLPLPEEPNLLRKWQHNLKLSVDTDFKKIQVCLKHFEEQVVQNGKPLEQAVPTLQLDQNSWNINRNSGSCLFPECRKSSSDRLSFVDLPGNAVIRDAWMSHLNLPPSTDGLLCSDHFMQLLEQVEFPKVLAAQDLEDLQWIADELKCAVPSCSSKSDGDLQLIPLPEKDATLLKWLHNTKISYDHSKHKSYRICVLHFEPTCLEANFPKAWAIPTLHLSHDDELHLNLRPESRSGTPNSNSRLTPLRIKTDLASLGSPCSSASPSPRGRIRICCISTCGQIGSSQVRLYRFPTEEQALLRWLVNTQQQPRLVDPAELYVCQSHFEPDAICKKQLRCWAEPTLNLGHDGFVIPNAKHNGNIAGGQDTEEAMRLIRERYCSVLTCFQAEASGIRLYEYPKDMPTIRKWAAACRHRSMQASSNGFKVCQSHFAPECFEPDTLNLIEGSVPTLELSRGDIERHCLVSGCEKDASGGRLRYYKVPKTAAQLNAWSNNLKISSVDLGLGEQLICERHFEPFCFGAHKGLRTGALPTLMLGHDEEVEMLPNPESLWQKKEEVCCATECGRIWQPGDTKFSGFPKSLALAKKWVHNLQLSVENDQLSSLKVCSVHFEASLFNKSGLISGSIPTLELGHSSQDIFLSDTQHMGKRTIISDLDCIYPECKELCKTVSFNLPQEEDLRTVWLRHLKIEEPSSGVGQLCPLHFVILYELSIKSFPEHVSNRFLEEKYYSARNNRRVKIVSCAVEGCEMIRPRDKVLLHGLPQRKDILRMWVENGQLEITEPQQQYMLRVCRNHFESRCSFDDRRLHPWSVPTLNLPGNPVHQIPTKEEWQEMTIKFNQEADTIKLEIEEEQEEEELPEEEELLEEEVGDCSLLEPIVRMEHIESDEEDSEMPALEVLLEVGHVERMDSYERVDESYTEQAVYQSNGIRNQYNANHCAVEGCEVTVEDVGGTIKLHKFPASSEAARKWMHNTQVDMDEKFWWRYRICSYHFDQECFQSARIKKGAMPTLRLGPKRPDKVYDNEFALQETEELIVPEDLQFEDPKKPKREVIKLCLPTPAPPRKSSKFCQIEGCMNHLTTENITLHKFPHSEDMCLKWQHNTQVPFDSFHRWRYRICSVHFHPVCLLNMRLVHGSVPTLKLGSKAPSELFDNDFEAINLRLDKKWGTNQSTVQIKEEDEDSMPSLEPELQLREDQEVEESEATQIPFNQTNWKGQLRLPVKQEKVAYNQVKSGYDKCSLSHCQRQRSKHGVHIYKFPKSRLQQERWMHNLRIRYDDRRPWKFMICSVHFEPHCISLRKLRPWAVPTLELGDNVPEKIFTNEQCHELSTDRSEAESDADEEDGLQEDEEEEDEYEEEMGPEVRIKRERRSKLDPWPPGQVPPWKVKQCCLPYCRAFRGDGIKLFRLPNNRTSIRNWELATGMVFKESQRNTRLICSRHFEPELIGVRRLMRNAIPTRHLSTQEPSEEVKRKPDPPLPIATCCMADCHHNGNVKLHKFPSDPALLRQWCQALRLTDTQRYRGKHICSVHLPTDRSVSCVICGVENAQLPMLDFPEQRNQRAKWCYNLKIEAIPKWDHSKHICCRHFESHCYLQPGELRPGAIPTLQLNHDDTNIFLSDFATSPTGNRIKDEPLNNDDMLLV

Similar Transcription Factors

Sequence clustering based on sequence similarity using MMseqs2

100% Identity: iTF_00605601;
90% Identity: iTF_00539688; iTF_00596688; iTF_00619178; iTF_00591728;
80% Identity: -