Basic Information

Insect: Drosophila nikananu
Gene Symbol: -
Assembly: GCA_008042635.1
Location: VNJV01006532.1:34621-47990[-]

Transcription Factor Domain

TF Family: THAP
Domain: THAP domain
PFAM: PF05485
TF Group: Zinc-Coordinating Group
Description: The THAP domain is a putative DNA-binding domain (DBD) and probably also binds a zinc ion. It features the conserved C2CH architecture (consensus sequence: Cys - 2-4 residues - Cys - 35-50 residues - Cys - 2 residues - His). Other universal features include the location of the domain at the N-termini of proteins, its size of about 90 residues, a C-terminal AVPTIF box and several other conserved residues. Orthologues of the human THAP domain have been identified in other vertebrates and probably worms and flies, but not in other eukaryotes or any prokaryotes [1].
Hmmscan Out: # of c-Evalue i-Evalue score bias hmm coord from hmm coord to ali coord from ali coord to env coord from env coord to acc

1 29 7 2.4e+04 -3.7 1.9 49 60 321 334 307 351 0.57

2 29 2.4e-15 8.1e-12 46.1 4.0 1 86 547 619 547 620 0.85

3 29 8.9e-15 3.1e-11 44.3 5.0 1 87 647 716 647 716 0.83

4 29 8.1e-16 2.8e-12 47.6 0.2 1 87 738 810 738 810 0.85

5 29 5.6e-16 1.9e-12 48.1 5.3 1 87 908 978 908 978 0.82

6 29 1.9e-15 6.7e-12 46.4 3.6 1 86 1002 1073 1002 1074 0.82

7 29 2.2e-13 7.6e-10 39.8 1.1 1 87 1109 1177 1109 1177 0.81

8 29 6.3e-11 2.2e-07 32.0 1.6 1 86 1219 1288 1219 1289 0.77

9 29 3.9e-17 1.4e-13 51.8 0.4 1 86 1316 1385 1316 1386 0.83

10 29 7e-13 2.4e-09 38.2 1.5 1 85 1407 1475 1407 1477 0.79

11 29 3.3e-15 1.1e-11 45.7 0.6 1 86 1504 1575 1504 1576 0.85

12 29 1.6e-12 5.4e-09 37.1 3.7 1 85 1650 1718 1650 1720 0.82

13 29 1.5e-12 5.3e-09 37.1 0.1 1 86 1743 1811 1743 1812 0.83

14 29 4.1e-13 1.4e-09 39.0 2.1 1 87 1959 2028 1959 2028 0.80

15 29 4.7e-13 1.6e-09 38.8 0.2 1 87 2118 2192 2118 2192 0.82

16 29 6.7e-06 0.023 15.9 0.0 1 69 2207 2261 2207 2277 0.73

17 29 1.9e-11 6.5e-08 33.6 0.0 1 87 2286 2357 2286 2357 0.79

18 29 7.8e-13 2.7e-09 38.1 0.3 1 87 2409 2479 2409 2479 0.82

19 29 6e-12 2.1e-08 35.2 0.1 1 86 2514 2588 2514 2589 0.80

20 29 9.8e-13 3.4e-09 37.8 0.0 1 86 2599 2672 2599 2673 0.80

21 29 6.7e-10 2.3e-06 28.7 0.0 1 86 2697 2770 2697 2771 0.67

22 29 7.3e-05 0.25 12.5 1.0 1 58 2800 2850 2800 2886 0.74

23 29 2.7e-11 9.3e-08 33.1 1.0 1 86 2890 2961 2890 2962 0.81

24 29 1.7e-16 6e-13 49.8 0.3 1 86 3073 3145 3073 3146 0.81

25 29 2.8e-12 9.5e-09 36.3 3.6 1 86 3209 3279 3209 3280 0.80

26 29 1.8e-14 6.2e-11 43.3 4.6 1 86 3372 3442 3372 3443 0.84

27 29 3.4e-12 1.2e-08 36.0 0.2 1 86 3524 3593 3524 3600 0.84

28 29 2.3e-10 7.8e-07 30.2 0.5 1 58 3619 3667 3619 3682 0.83

29 29 3.4e-10 1.2e-06 29.6 1.2 18 87 3685 3743 3674 3743 0.77

#	of	c-Evalue	i-Evalue	score	bias	hmm coord from	hmm coord to	ali coord from	ali coord to	env coord from	env coord to	acc
1	29	7	2.4e+04	-3.7	1.9	49	60	321	334	307	351	0.57
2	29	2.4e-15	8.1e-12	46.1	4.0	1	86	547	619	547	620	0.85
3	29	8.9e-15	3.1e-11	44.3	5.0	1	87	647	716	647	716	0.83
4	29	8.1e-16	2.8e-12	47.6	0.2	1	87	738	810	738	810	0.85
5	29	5.6e-16	1.9e-12	48.1	5.3	1	87	908	978	908	978	0.82
6	29	1.9e-15	6.7e-12	46.4	3.6	1	86	1002	1073	1002	1074	0.82
7	29	2.2e-13	7.6e-10	39.8	1.1	1	87	1109	1177	1109	1177	0.81
8	29	6.3e-11	2.2e-07	32.0	1.6	1	86	1219	1288	1219	1289	0.77
9	29	3.9e-17	1.4e-13	51.8	0.4	1	86	1316	1385	1316	1386	0.83
10	29	7e-13	2.4e-09	38.2	1.5	1	85	1407	1475	1407	1477	0.79
11	29	3.3e-15	1.1e-11	45.7	0.6	1	86	1504	1575	1504	1576	0.85
12	29	1.6e-12	5.4e-09	37.1	3.7	1	85	1650	1718	1650	1720	0.82
13	29	1.5e-12	5.3e-09	37.1	0.1	1	86	1743	1811	1743	1812	0.83
14	29	4.1e-13	1.4e-09	39.0	2.1	1	87	1959	2028	1959	2028	0.80
15	29	4.7e-13	1.6e-09	38.8	0.2	1	87	2118	2192	2118	2192	0.82
16	29	6.7e-06	0.023	15.9	0.0	1	69	2207	2261	2207	2277	0.73
17	29	1.9e-11	6.5e-08	33.6	0.0	1	87	2286	2357	2286	2357	0.79
18	29	7.8e-13	2.7e-09	38.1	0.3	1	87	2409	2479	2409	2479	0.82
19	29	6e-12	2.1e-08	35.2	0.1	1	86	2514	2588	2514	2589	0.80
20	29	9.8e-13	3.4e-09	37.8	0.0	1	86	2599	2672	2599	2673	0.80
21	29	6.7e-10	2.3e-06	28.7	0.0	1	86	2697	2770	2697	2771	0.67
22	29	7.3e-05	0.25	12.5	1.0	1	58	2800	2850	2800	2886	0.74
23	29	2.7e-11	9.3e-08	33.1	1.0	1	86	2890	2961	2890	2962	0.81
24	29	1.7e-16	6e-13	49.8	0.3	1	86	3073	3145	3073	3146	0.81
25	29	2.8e-12	9.5e-09	36.3	3.6	1	86	3209	3279	3209	3280	0.80
26	29	1.8e-14	6.2e-11	43.3	4.6	1	86	3372	3442	3372	3443	0.84
27	29	3.4e-12	1.2e-08	36.0	0.2	1	86	3524	3593	3524	3600	0.84
28	29	2.3e-10	7.8e-07	30.2	0.5	1	58	3619	3667	3619	3682	0.83
29	29	3.4e-10	1.2e-06	29.6	1.2	18	87	3685	3743	3674	3743	0.77

Sequence Information

Coding Sequence: ATGTCACAACACAACCCCAATCACGCCCACCCACACTACCACTACCCGTCCCATACGACGCCGCTGgctctgcagcagcagcagcaccatcaggagcagcagcagcacggcaGTAGTTGGTACTCACATGTTGCTTCCTACCCAGCAGCCTCCCACTCCCACCCCCTCTCTCACTCGGCCTTTGGCCCTGCGCCCCCTTGCAAGGccagcatcagcaacaacaaccccAACAACATTATGGGCGGCTACGGTGGAGTGGGAGGGGGTGGAGGCTCGCATGGATATTTCGGCGCCGCTGGCGGTGGCCTCAATGTCAGCGGGGCGGGGGGTGGTGCTGGGTCGTCCTACGGCCTTGGGGCCAACACGGTGGCATATGCTCACAACCAACTGCTGCAGTaccagcatcatcatcagcaaaaccagcagccgcagcagcagcacctgggCCTGGGACAGCGATCCTATATGGGCCACGATGTCATGGCCGGGAGCTATCCCTATATCAAGAGCGAACCCCTGGAGGGGTTCCAGCAGCCGGCCAATCCAATGGCCCCACCCCCGGCGCCagaaatgataataaaatCGGAACCCATTGACGACCTGGCCTACAAGTCAAACTACATAGACGACAATACGCCGTTTGCGGACTTCAGTAAGTTTAGCGAATTCAGCGAAGACATGCTGAGTCCCAAAGTCGAGCTGACGATCAAGGATGAATCCTTTGTCAGGAACCCCAATAGCTTTGTACGCCGTAAGCAACAATCGGATCTGACGACAGCAGAGAGCCTGCCCGTCTGCCAGCGCTGCAAGGAGGTGTTCTTCAAGAAGCAGACTTATCTGCGGCACGTCGCCGAGAGTAACTGCGGCATCCAGGAGTACGACTTTAAGTGCACCATATGCCCCATGTCCTTCATGACCGCCGAGGAGTTACACCTGCACAAGCAACAGCATCGAGCGGACAGGTTTTTCTGTCACAAGTACTGCGGAAAGCACTTCGGCACGATCGCTGAGTGCGAGGCACACGAGTACATGCAGCACGAATACGAAAACATTGTTTGCAACATGTGCTCGGGATCTTTCGCCACGCGGGAACAGCTGTATGCCCACTTGCCGCAGCACAAGTTCCAGCAGCGCTTCGACTGTCCCGTATGCCGCTTGTGGTACCAAACAGCTCTGGAACTCCACGAGCACCGCCTGGCTGCACCCTACTTCTGCGGTAAATACTACTCGGGCGGACAGTCTCCGTCCCCGTCCtcccaacagcaacagcaccagaGCCAGACGAACTACAAGCTTCAGGACTGTCATATGGCCACCATGGAAATGCCAAGCGTACCGCTCCTTAAGTCGAACCCATCCAACTCGCCTGCCTTGCCCGCGACAGCAGCGCTTAACTCACTGCTGCAACAGCGTCAGGCCAATGCCGATGGAGCGGCCATTTTTGCCGCATCTTCGCTGAAGAACGAGGTCGCTGTGAAGCTGGAGCGCAGCTACAGTAACTCGACCAATGAATCCTCTTATAGCGTCCAGGAGAGCGGCTACAATAATGTGTATGGCAGCAGCGACAGCTCTGTCCACGGTGCCATCGCCGGACCACAGGCACACTCTTCGACGCTGGACGACTCCGAAGATGCGCTGTGCTGTGTGCCACTGTGTGGCGTGCGGAAGAGCACCAGTCCCACCTTGCAGTTTTTCACGTTCCCGAAGGACGAGAAGTATCTCAACCAGTGGCTGCATAACCTCAAGATGTTCCACATACCAGCATCCAGCTACGTTAGTTTCCGGATCTGCAGCATGCACTTTCCCAAGCGATGCATCAACCGCTACTCCCTCTGCTACTGGGCGGTGCCGACGTTCAACCTCGGACACGATGACGTAGCCAATCTCTACCAGAACCGGGAGCTGACCAACACATTTACCACTGGCGAAGTGGCGCGTTGTAGCATGCCACACTGCACCAGCCAGCGGGGTGAGAGCAACCTCAAGTTTTACAACTTTCCCAAGGACATCAAAAGCCTGATTAAGTGGTGCCAAAACGCCCGCCTCCCAGTGCAGGCGAAGGAGCCTCGGCATTTCTGCAGCCGCCACTTCGAGGAGCGGTGCATAGGAAAGTTCCGACTAAAGCCTTGGGCGGTGCCCACCTTGCACCTGGGCGCCCAGTACGGCAAGATCCACGACAATCCGAAGAATCTATATGTGGAAGAGAAACGCTGTTGCCTCAACTTTTGCCGTCGGAGTCGCTCTTCTGATTTCAATATGTCGTTATATCGATTTCCTAGAGACGAAGTCCTGCTTCGTCGCTGGTGCTACAATCTTCGCCTCGATCCAGGAGTGTACCGCGGAAAgaaccacaaaatatgcagCGCCCACTTTATAAAGGAGGCGTTGGGTCTCCGTAAATTATCTCCTGGTGCCGTGCCCACACTTCATCTGGGTCACAACGATACCTTCAACATCTACGAGAACGAACTGTGGCCACCGCCAACACCGACGCCCACTTCTTGTCACatccaacagcagcagcagtcatCCCTGCATTCGCTACAACATCAGATGCACAGCAAGACCTACCAGCGCCGTTCGGTGGCATCCACTTCATCGTCGGCGAGCTCGGCAGCCTCGCATTACGTGGACCCGGAGATGAGCGCTTCTTAccatctagccatgtccgccTCAGCCGGTGGCTCCGCGACGATCAACGCCAGCGACAGCATGGACGTCTGTTGCGTGCCAAGTTGTGAGAGCAAGCGACACAATAGCGAGAACATTACATTCCACACGATTCCGCGACGGCCCGAGCAAATGCGCAAATGGTGTCACAACCTTAAGATTGCCGAGGACAAGATGCACAAGGGCATGCGAATCTGTAGCCTTCACTTCGAGCCCTACTGCATCGGCGGCTGTATGCGACCGTTTGCTGTGCCCACTCTTCACTTGGGGCACGATGACGACGACATTCATCGCAATCCGGACGTGATTAAAAAGCTGAACATCCGGGAAACATGCTGCGTGGCTGTGTGCAAGCGGAACAGGGACAGAGACCATGCCAACCTGCATCGTTTCCCTAGCAACGTGGCGTTACTGAAGAAGTGGTGCGCCAATTTACAGCGCAGCGTGCCCGATGGCAGTAAACTTTTCAATGATGCCATCTGTGAGGTGCACTTTGAGGATCGGTGCTTGCGCAACAAGAGACTGGAGAAGTGGGCAGTGCCTACTCTGATCCTGGGACACGAGGACATTCCCTATCCGCTGCCCACGCCGGAGCAAGTGACCGAGTTCTATGCCCGGCCCTCGGCTCCGAACAATGGAGAGGAACAGGGCGAGTGCTGTGTAGAGACCTGCAAGAGGAATCCTAGCGTGGACGATATAAAGCTATACCGCCCTCCGGAAGACGCTGCCGTGCTGGCCAAGTGGGCGCACAACCTGCAAACGGAGGCCAACCAACTGACAAGCATGAGGATCTGCAACCTTCACTTCGAGGCGCATTGCATCGGCAAGAGGATGCGGCAGTGGGCCATACCGACTTTGAATCTAGCCGGCAACATAGAAAATCTATACGAGAATCCAGAGCAATCGTTGCTCTACAGGCGTCGCACGACTCACTTGAAGGCGAAGCTGCCGCCAACCTCCGCGAAACCCACCTGGGTGCCCAGGTGCTGTCTTCCACATTGTCGCAAAGTCAGAGCCCTGCACAATGTTCAGCTGTATCGCTTCCCCAAGCTCAATCGGTCCACTTTGGCCAAGTGGGCGCATAATCTCCAGGTTCCAATGGTGGGCAGTGCCCAGCGCAGGCTTTGCTCTGCCCATTTCGAGCCTCATGTACTCAGTAAAAAGTGTCCGGTGCCGCTGGCGGTGCCTACGATCGACCTGAATTCACCACCCGGCTTGAAAATCTACCAGAATCCGGCCAAGCTTAAGGCCAGCAAACTATGCCTGCAGCGGGTTTGCATCGTCGAGAGCTGCCGCAAGACGAGGGCGCAAGGCGTGCAGCTTTTCCGGCTGCCACACAGCCCCACACAGCTACGGAAGTGGATGCATAACATTAAGACGCGGCCACGAGCAGCTATGCGTGCTCAGTACCGGGTCTGTTCCCGCCACTTTGAAACGCATTCATTCAATGGTCGAAGACTGAGTGCAGGTGCCATTCCGACCCTAGAACTGGGCCACGATGGCGACGATATCTACCCGAATGAAGCGCAGGCATTTGTGGATGAGCATTGTGCCGTCGAGGGCTGCGAGGCATCCAAGGAGAAGCCGGAGGTGCGACTGTTCCGCTTCCccaccgacgacgacgataTGTTGTGGAAGTGGTGCAACAACCTGAAAATGAATCCTGTGGATTGCATTGGAGTACGCATCTGCAACAAGCACTTTGAGGACGATTGCATCGGTCCCAAGCACCTGTACAAGTGGGCCATTCCCACGCAGGAGCTGGGCCACGACGACGCACAGATCGAGCTGATCCCGAATCCGAAGCTAGAGGAGAGGTATGTGGATCCCGTCTTCAAGTGCATCGTTCCCAGCTGCGGCAAGACTCGACGGTTTGACGAGGTGCAAATGAACAGCTTCCCCAAGGACCCGGAGCTTTTTCAGCGATGGCGGCACAACCTCCGCCTGGAACATCTCAGTTTCCAGGAGCGTGAGCGCTACAAGATCTGCAACGCTCACTTTGAGGAGATCTGTATTGGGAAGACACGGCTAAACATCGGATCCGTTCCAACCTTGGAACTTGGTCATGATGATGAGAATGATATCTTCCAAGTAAATCCAGCGGAGCTGCAGAGCAATTTGTTCGGGCGACAGCGTCGACTGCTGCTCGAGAGATCCGGCGAACTGAATGTCAAGCAAGAGCTGTCAGAGACAGAGGACAACAACAAAGCGGATACGGATGTGACGGCCACAGGCTCCAAGCAGGTCAAGATGAAGAGATCTACTTCGGATCTAAAGTGTTGTGTCCACAGTTGTGGAAGAAGTCGCTTGGAGCACGGGGCACGGCTGTTTCCCTTTCCTACCGGCAAGCAGCAACACCTCAAGTGGCGTCACAATCTGCACCTGGAACCAGAGGAGGTGGACCGGTCGACCCGCGTTTGCAGCGCTCACTTCAATCGACGTTGCATTGAGGGCAAACAACTTAGGAGTTGGGCGATGCCCACCCAACAATTGGGGCACAACGACCAACCGATCTACGAGAACCCAAAGAACATACCGGGATTCTTCACACCTACCTGTGCTCTGGGACACTGTCGCAAGCGGAGGAGTATTGACAACGACCTGCGCACCTATCGGTATCCCAGAAGCGAGGATCTTCTGGAAAAATGGCGAGCTAATCTACGGCTGGCTCCGGATCAGTGTCGTGGTCGGATCTGTGCAAATCACTTCGAACCGCAGGTGCGAGGAAAGCTAAAGTTGAAGACGGGAGCCGTTCCCACACTACAACTGGGACACGATGAGGGATTAATCTATGACAATGAAGCTATTAAGGCTGGCATGGCCGAGGAAGAGGAGGGCATAACCACAGAGTTCCCAAGACTGAAACTAAAAAAAGAGGTGTTcgatgatgaggaggaggagggcgaAGGTAATGATGGCGAGCAGCAGTACCCCGATGATCTGGGTGATAATGCAGATGACGAAGACAAGGATGACCAGTATTTTGATCCCCTTGAACTGGTAGAGACTTTTGCTGAACATCGCAGCGATGACGAAGCCCAAGACAATGAGGATGAAGAAGACGAGGGTCGAGCTGAGGACGCTCCCTCCGGGTTAGATGTCAAGGAGGAGATAGAACAGCTTCCAAGCTCCCCACCTTCCCCTCTTCCTCGACGGCACCAAGCTCCTCGACGTGACAAGCCGGCTAACAATGTAACGCCCATTTGCTGCCTGAGACACTGCAGAAAGGAACGCACTGCCTTCCACCTGCTGAGCACTTTCGGCTTCCCGAAGGATCGCCAGTTGCTGCTAAAATGGTGTGTCAATTTGCACCTAAACCCGGACGACTGTATCGGTAGGGTTTGCATCGAGCACTTCCAGCCAGAGGTACTCGGCACCCGTAAGCTCAAGCAGAATGCGGTGCCCACTCTTAATGTCGGACATGAGGAACCGCTTAGGTACTCCTGCCATGGCGTAGACCAGAATCTCGAGGAGCGGGACCCCCAGCCGCAGCACTCGGTTTTTCGGCTTTGGAGCCTGAAACACTGCCGGAAAAGGAAGCTAACGGAGCCGCCGGATATTCCCCAAGCCAAGAGGAAAGCACTGGAGATGCCGATAATGAAGCGAGAATGGGAGATGGAGATGCCGGAGCGGAAGAGGGAGGCGAAGAGAATGACTCAAACTGAAAGTGAATCTCATATATGCTGTATAAGTAGTTGCGGAAACCACGAAGTTAGTCATTTGCTGCCTTTTCCCGAGGAGAAGACCCTGCTAAGAAAGTGGAGCCATAATTTAAGGCTGCCGCCTGAGACTGAGACCACTTCTCTAAGCCTGAAAAGAGTTTGCTTGGCCCACTTCGAATCGCAGCTGTTAGATAATGGCAAGCTTACGAAGgaagcagaggcagaggctgTTCCCACTTTGAACCTGGGTCACAGCAGCTGGAACCTATACAGGACCAATGGAATCTGCGTAGTGCCTGACTGCAACCACAATGCCTACGGACGCTTAAGCTTCATCGATCTACCGGATAACAGCATAATTAGGGACGCTTACTTATCCTGCCTCAACCTACCTGGACCCTGCGAAGAGCAGGCAAGACTATGTCGTATCCACTTTATGGAGGCATATAAGAAGTTTGAACTTCCTTACGTTCTGCACCCTCAAGCCATAATGGCGCTACAAAGTGCTGTGGACGAACTGCAATGCGCTGTGCCCGGCTGCTATTTCGAAGATGCTGACATGGATTTGTACCTAATCCAGCTTCCCGATAACAAGGAGGTGCTGTCGAAGTGGCTGCACAACACCAAGGTACCATATGATCCTTCCAGGCACAAAAGCTTTCGCATTTGCACACTCCACTTTGAATCCGAGTACTTGGATTCGAATGGCCCGCTAAAAGGGGCTATACCGACGCTCCACCTTAACCATGAAGATGAAATTCACTTGAATACTAGACTTTTGCCAGAGGAGCAGGACTCTGTGTTGACTCCACTGCGGATAAAGACGGACCTAGCCTCCTTGGGCAGTCCCTGTGCAAGTGCAAGCCCCAGTCCCCGAGGGAGGATTCGAATATGCTGCATTCCCACATGTGGACAGTTTGGAAGCAGTCAAGTGAGGCTGTTTCGATTTCCCACCGAGGAGCAGGCGTTGCTTCGGTGGCTGGTAAATACACAACAGCAACCAAGACTGGTGGATCCAATGGATTTGTATGTGTGCCAGTTGCATTTTGAGCCTGAGGCTATTTGCATGAAGCAACTCCGAAGCTGGGCTGAGCCCACCTTAAACCTGGGACACGACGGATATGTAATCCCAAATGCCAAACACAATGGAAATATTTCCGATAGCCAAGATACAGAGCAAGCCATGAGGTTTATTCGCGAACGCTTCTGCTCCGTCATTTCCTGCTTTCAAGCAGGAggacaggaggaggagggagtGAGGCTATTTGATTATCCGGAGGATATGGCGACCACTCGAAAGTGGGCAGCCGCGTGCAGACATCGCTCCATGCAGGCCAGGAGCCATGGGTTCAAGGTGTGCCAGTTTCACTTCGCTAAGGAATGCTTTGACCCCAACACTGGAGAATTGATTGAGGGCGCTGTCCCCACCCTGGAGTTGAGCAGAGATGAAATGGATAGGCAATGTCTTGTGGCTGGATGTGTCAAAAATGATGCCAATGGAACCCGTCTCCGCTATTTTAAGTTACCAAAAGTTGCTGCTCAATTGGAAGCGTGGAGCAACAACCTTAAAGTCCATCCAACTGATCTCATGCAGGGGGAGCAGCAGTACATCTGCGAGAAACACTTTGAAGCTTTCTGCTTTGGGGCCAACAAGGGCCTGCGGTCTGGTGCTCTTCCAACCCTCCTGCTGGGTCATGATGAGGAGGTGCATATGCTTCCAAATCCCGAAAGCCTTTTCTGCCAGAAGACGGATACGTGCTGCGTACCAGGCTGCGGGCTTGTCTGGCAGACTGGGGACCGTAAGTTTCGTGGATTTCCCAAATTTTTGGCCATGGCCAATAAATGGCGGCATAACCTTCGTTTGGAAGTGCCCGTGGAGCAACTCGGCAAACTGAAAGTCTGCAATGCTCATTTTGAGACCACCTCATCCAACATGGGTTCAAATGGACTAAGCTCTAGTGCCTCGATACCAACACTGGAATTGGGTCATTCTTCTCCGGATATTTACCCAGCGGACATGAGCTTAAAGTTCCAAAAGCGGCCAGGAATACCAgcaaaaatttattgttgttatccCAAGTGCGAGGAAACCTGTTTGCCCAAGAATCTTTCTTACGGGCTTCCCCAGGAGGAGCATCTGAGGAATGCCTGGCTAAGCCATATGGACATAGAAAATCCGAAGGACGAAGAAGTCGTATTGCTTTGCCCTCTTCACTATGCCATCCTCTACCAGTATAGTGCCAAGCACTTTTCGGAGCATCACGCTTTAAGCCGGATTCATCTTGATAACAATTATAAGGAAGCTCGGAACAACAGGCGCGTGAGGATTGTGAGTTGTACCATCAAGGGCTGCGACATGGTTAAGCCCCGGGATGGGGTACCACTGCACGGCATGCCGCAAAGCAAAGAAATCCTGCAGATGTGGATAGACAATGGCCAGTTTGAGTTCTTAGAGCAACAGCGGTATATGTTCAAGGTGTGTCACAATCATTTTGAGCCATGCTGTTTCTTCGACGACAGACGTTTGCATTCATGGAGCGTGCCCACTTTGCGCCTACCTGGCGAGGTAATTCACCAGAATCCTACCGCCGAACAGTGGCAGAACATGATCaagcaagcagcagcaaaaacataCACAGAAGATATCGAGGAGTCAGATCCATTTGGGGTTGTGGTTAAAACCGAACCCATTTTAAAGATGGAGCACATCGAATCGGAATATGAAGATGAAACCCCAGAGATGCAGGCTCTTGAGGTCCTTCTAGAAGTTGGCCATGTCGAGCGAATGGAGAGCTACGAGAAAGTGGATAAATCCCCTCTGATCTATACAGAAAATGGGTCCTTCCGATATTCACCCATACGTTGCCCATACAATGCTAATCACTGTGCCGTAGATGGTTGTCAAGTGACTGCCGAAGATGTGGACGGCACGATCAAGCTGCACAAATTCCCCGCGTCGCAGGAAGCCGCACAGAAGTGGATGCACAACACCCAAGTTGAATTGAACGAGAAGTATTGGTGGCGCTACCGCATATGCAGTTACCACTTCGATCAGGAGTGCTTTCAGAGTGCTAGAATTCGAAAAGGCGCGATGCCCACGCTTTTATTAGGACCTCGGCGACCGGACAAGGTGTACGATAATGAGTTTTCACTACCAGAGGGAGAAGAGCCTGTTCTAGATCCACCGGACACTCAGCTCGAGGAAGGTACGACTGTAGTATCAAGAGTTCAAAAGGAGGTGTCCAATTTATGCCTGCCCCCACGGGCGCCGCCTCGAAAGTCAAGCAAGTTTTGCCAGATTGATTCCTGCACGAACCACTTGACCACTGAGAATATGACACTTCACAAGTTTCCCCACTCGGAGGACATGTGCCTCAAATGGCAGCACAACACGCAAGTGCCATTTGACCCCTACTACCGTTGGCGTTACCGCGTCTGCAGTGCTCATTTCCATCCGGTGTGTTTGGTCAACATGCGTCTAGTACACGGAAGCGTTCCCACATTAAAGCTGGGTCCCAAGGCTCCATCAGAGCTGTTTGACAACGATTTTGAAGCCATTAACCTTAGGCTGGATAAAAGGTTGACCGAGTCTAATGCTAATGTGTACATCAAGCATGAAAGAagggaggaggatgaggagtcGATGATGTTCCCGGAGCCCGAGCTCCAGGTACACGAGGATCAAGACGATATGATATCAAGCTGGAACAAAAAACTGCAATTACCACCTGTGAAGCAggagaaaattatatacaGCCAGATCAAGTCTGGCTATGATAAGTGTTCGCTGGCTCACTGCCAGCGCCAAAGATCCCAGCATGGCGTCCACATTTATAAGTTTCCTAGATCGAAGCGTCAACAGGAGCGTTGGATGCACAACCTACGTATCCGCtatgatgagcggacaccgTGGAAATTCATGATCTGCAGCGTTCATTTCGAACCACACTGCGTCAGCCTAAGGAAGCTGCGACCTTGGGCGGTTCCCACACTGGAACTGGGTGACAATGTACCAGAGACAATCTTTACTAACGATCAGTGCGAAGAGGAGCTGGTGACCGATCGCAGTGAGCTTGATAGCGACGCGGACGAAGAGGACGGCTTACAGgaggacgacgatgatgacgacgacgaagacgaTGTAAAGCCGGATGTTATTGGCATAAAAAGGAGGAGGCGTTTCAAGATAGATTCCGGCTGCCCTCCTAACCAGATTCCACCCTGGAAAGTCAAACAATGCTGCCTTCCCTATTGTCGTGCCTTCCGAGGCGATGGCATCAAGCTATTTCGGCTCCCGAACAACCGAAACTCAATTAGCAACTGGGAACGGGCCACCGGAATGGTATTCAAAGAGTCTCAACGGAACACTCGCCTGATATGCAGCCGACACTTCGAGCCAGAGCTGATTGGAGTCAGGCGTCTAATGCGTAACGCCATTCCCACGAAGCACTTGAACCCTCAAGCAGTTGACCACATCCGAACTAAGAAGGAAAAGAATCCTCCTGCCACTATTGTACCCATATGCTGCATGGCTGACTGCCACTACAACGGAAATGTGAAGCTGCACAAGTTTCCAAGTGATCCCACTCTTCTTAGACAGTGGTGCCAGGCTCTCCGACTCACTGACACACAGCGGTATTTGGGGAAGCACATTTGCTCCATGCACCTGCCAATGAACAAGACGCTGAGCTGTGTCATTTGCGGTGGGGACAACGTAGAGTTGCCGATGCTTGGGTTTCCAGAAAACCGCAACCAGCGCGCCAAATGGTGTTACAATCTCAAAATTGAGACAATACCAAAGTGGGACCACTCAAAGCACATTTGCTGCCGGCACTTTGAGCCCCATTGCTTTGACACCCCGGGTGAGCTACGTCCAGGAGCGGCTCCCACGCTTCATCTCAATCACGATGACACAAACATATTCTTCAGCGACTATGCCACTGGTCTTCCGTCCTCGCCACTAGGCAATCGAATTAAGGACGAGCCCCTGGAATCGGAGTCCGACGAGACGCTGCTGGTGTAG
Protein Sequence: MSQHNPNHAHPHYHYPSHTTPLALQQQQHHQEQQQHGSSWYSHVASYPAASHSHPLSHSAFGPAPPCKASISNNNPNNIMGGYGGVGGGGGSHGYFGAAGGGLNVSGAGGGAGSSYGLGANTVAYAHNQLLQYQHHHQQNQQPQQQHLGLGQRSYMGHDVMAGSYPYIKSEPLEGFQQPANPMAPPPAPEMIIKSEPIDDLAYKSNYIDDNTPFADFSKFSEFSEDMLSPKVELTIKDESFVRNPNSFVRRKQQSDLTTAESLPVCQRCKEVFFKKQTYLRHVAESNCGIQEYDFKCTICPMSFMTAEELHLHKQQHRADRFFCHKYCGKHFGTIAECEAHEYMQHEYENIVCNMCSGSFATREQLYAHLPQHKFQQRFDCPVCRLWYQTALELHEHRLAAPYFCGKYYSGGQSPSPSSQQQQHQSQTNYKLQDCHMATMEMPSVPLLKSNPSNSPALPATAALNSLLQQRQANADGAAIFAASSLKNEVAVKLERSYSNSTNESSYSVQESGYNNVYGSSDSSVHGAIAGPQAHSSTLDDSEDALCCVPLCGVRKSTSPTLQFFTFPKDEKYLNQWLHNLKMFHIPASSYVSFRICSMHFPKRCINRYSLCYWAVPTFNLGHDDVANLYQNRELTNTFTTGEVARCSMPHCTSQRGESNLKFYNFPKDIKSLIKWCQNARLPVQAKEPRHFCSRHFEERCIGKFRLKPWAVPTLHLGAQYGKIHDNPKNLYVEEKRCCLNFCRRSRSSDFNMSLYRFPRDEVLLRRWCYNLRLDPGVYRGKNHKICSAHFIKEALGLRKLSPGAVPTLHLGHNDTFNIYENELWPPPTPTPTSCHIQQQQQSSLHSLQHQMHSKTYQRRSVASTSSSASSAASHYVDPEMSASYHLAMSASAGGSATINASDSMDVCCVPSCESKRHNSENITFHTIPRRPEQMRKWCHNLKIAEDKMHKGMRICSLHFEPYCIGGCMRPFAVPTLHLGHDDDDIHRNPDVIKKLNIRETCCVAVCKRNRDRDHANLHRFPSNVALLKKWCANLQRSVPDGSKLFNDAICEVHFEDRCLRNKRLEKWAVPTLILGHEDIPYPLPTPEQVTEFYARPSAPNNGEEQGECCVETCKRNPSVDDIKLYRPPEDAAVLAKWAHNLQTEANQLTSMRICNLHFEAHCIGKRMRQWAIPTLNLAGNIENLYENPEQSLLYRRRTTHLKAKLPPTSAKPTWVPRCCLPHCRKVRALHNVQLYRFPKLNRSTLAKWAHNLQVPMVGSAQRRLCSAHFEPHVLSKKCPVPLAVPTIDLNSPPGLKIYQNPAKLKASKLCLQRVCIVESCRKTRAQGVQLFRLPHSPTQLRKWMHNIKTRPRAAMRAQYRVCSRHFETHSFNGRRLSAGAIPTLELGHDGDDIYPNEAQAFVDEHCAVEGCEASKEKPEVRLFRFPTDDDDMLWKWCNNLKMNPVDCIGVRICNKHFEDDCIGPKHLYKWAIPTQELGHDDAQIELIPNPKLEERYVDPVFKCIVPSCGKTRRFDEVQMNSFPKDPELFQRWRHNLRLEHLSFQERERYKICNAHFEEICIGKTRLNIGSVPTLELGHDDENDIFQVNPAELQSNLFGRQRRLLLERSGELNVKQELSETEDNNKADTDVTATGSKQVKMKRSTSDLKCCVHSCGRSRLEHGARLFPFPTGKQQHLKWRHNLHLEPEEVDRSTRVCSAHFNRRCIEGKQLRSWAMPTQQLGHNDQPIYENPKNIPGFFTPTCALGHCRKRRSIDNDLRTYRYPRSEDLLEKWRANLRLAPDQCRGRICANHFEPQVRGKLKLKTGAVPTLQLGHDEGLIYDNEAIKAGMAEEEEGITTEFPRLKLKKEVFDDEEEEGEGNDGEQQYPDDLGDNADDEDKDDQYFDPLELVETFAEHRSDDEAQDNEDEEDEGRAEDAPSGLDVKEEIEQLPSSPPSPLPRRHQAPRRDKPANNVTPICCLRHCRKERTAFHLLSTFGFPKDRQLLLKWCVNLHLNPDDCIGRVCIEHFQPEVLGTRKLKQNAVPTLNVGHEEPLRYSCHGVDQNLEERDPQPQHSVFRLWSLKHCRKRKLTEPPDIPQAKRKALEMPIMKREWEMEMPERKREAKRMTQTESESHICCISSCGNHEVSHLLPFPEEKTLLRKWSHNLRLPPETETTSLSLKRVCLAHFESQLLDNGKLTKEAEAEAVPTLNLGHSSWNLYRTNGICVVPDCNHNAYGRLSFIDLPDNSIIRDAYLSCLNLPGPCEEQARLCRIHFMEAYKKFELPYVLHPQAIMALQSAVDELQCAVPGCYFEDADMDLYLIQLPDNKEVLSKWLHNTKVPYDPSRHKSFRICTLHFESEYLDSNGPLKGAIPTLHLNHEDEIHLNTRLLPEEQDSVLTPLRIKTDLASLGSPCASASPSPRGRIRICCIPTCGQFGSSQVRLFRFPTEEQALLRWLVNTQQQPRLVDPMDLYVCQLHFEPEAICMKQLRSWAEPTLNLGHDGYVIPNAKHNGNISDSQDTEQAMRFIRERFCSVISCFQAGGQEEEGVRLFDYPEDMATTRKWAAACRHRSMQARSHGFKVCQFHFAKECFDPNTGELIEGAVPTLELSRDEMDRQCLVAGCVKNDANGTRLRYFKLPKVAAQLEAWSNNLKVHPTDLMQGEQQYICEKHFEAFCFGANKGLRSGALPTLLLGHDEEVHMLPNPESLFCQKTDTCCVPGCGLVWQTGDRKFRGFPKFLAMANKWRHNLRLEVPVEQLGKLKVCNAHFETTSSNMGSNGLSSSASIPTLELGHSSPDIYPADMSLKFQKRPGIPAKIYCCYPKCEETCLPKNLSYGLPQEEHLRNAWLSHMDIENPKDEEVVLLCPLHYAILYQYSAKHFSEHHALSRIHLDNNYKEARNNRRVRIVSCTIKGCDMVKPRDGVPLHGMPQSKEILQMWIDNGQFEFLEQQRYMFKVCHNHFEPCCFFDDRRLHSWSVPTLRLPGEVIHQNPTAEQWQNMIKQAAAKTYTEDIEESDPFGVVVKTEPILKMEHIESEYEDETPEMQALEVLLEVGHVERMESYEKVDKSPLIYTENGSFRYSPIRCPYNANHCAVDGCQVTAEDVDGTIKLHKFPASQEAAQKWMHNTQVELNEKYWWRYRICSYHFDQECFQSARIRKGAMPTLLLGPRRPDKVYDNEFSLPEGEEPVLDPPDTQLEEGTTVVSRVQKEVSNLCLPPRAPPRKSSKFCQIDSCTNHLTTENMTLHKFPHSEDMCLKWQHNTQVPFDPYYRWRYRVCSAHFHPVCLVNMRLVHGSVPTLKLGPKAPSELFDNDFEAINLRLDKRLTESNANVYIKHERREEDEESMMFPEPELQVHEDQDDMISSWNKKLQLPPVKQEKIIYSQIKSGYDKCSLAHCQRQRSQHGVHIYKFPRSKRQQERWMHNLRIRYDERTPWKFMICSVHFEPHCVSLRKLRPWAVPTLELGDNVPETIFTNDQCEEELVTDRSELDSDADEEDGLQEDDDDDDDEDDVKPDVIGIKRRRRFKIDSGCPPNQIPPWKVKQCCLPYCRAFRGDGIKLFRLPNNRNSISNWERATGMVFKESQRNTRLICSRHFEPELIGVRRLMRNAIPTKHLNPQAVDHIRTKKEKNPPATIVPICCMADCHYNGNVKLHKFPSDPTLLRQWCQALRLTDTQRYLGKHICSMHLPMNKTLSCVICGGDNVELPMLGFPENRNQRAKWCYNLKIETIPKWDHSKHICCRHFEPHCFDTPGELRPGAAPTLHLNHDDTNIFFSDYATGLPSSPLGNRIKDEPLESESDETLLV

Similar Transcription Factors

Sequence clustering based on sequence similarity using MMseqs2

100% Identity: iTF_00525910;
90% Identity: iTF_00490113;
80% Identity: -