Basic Information

Insect: Zaprionus lineosus
Gene Symbol: -
Assembly: GCA_035044505.1
Location: JAWNNX010000120.1:834175-848158[+]

Transcription Factor Domain

TF Family: THAP
Domain: THAP domain
PFAM: PF05485
TF Group: Zinc-Coordinating Group
Description: The THAP domain is a putative DNA-binding domain (DBD) and probably also binds a zinc ion. It features the conserved C2CH architecture (consensus sequence: Cys - 2-4 residues - Cys - 35-50 residues - Cys - 2 residues - His). Other universal features include the location of the domain at the N-termini of proteins, its size of about 90 residues, a C-terminal AVPTIF box and several other conserved residues. Orthologues of the human THAP domain have been identified in other vertebrates and probably worms and flies, but not in other eukaryotes or any prokaryotes [1].
Hmmscan Out: # of c-Evalue i-Evalue score bias hmm coord from hmm coord to ali coord from ali coord to env coord from env coord to acc

1 30 10 2e+04 -3.5 1.3 30 58 163 193 128 207 0.61

2 30 10 2e+04 -5.6 2.5 25 62 404 445 381 471 0.49

3 30 4.4e-15 8.8e-12 45.8 3.7 1 86 593 665 593 666 0.85

4 30 3.4e-15 6.8e-12 46.1 4.6 1 87 693 762 693 762 0.83

5 30 7.8e-16 1.6e-12 48.2 0.4 1 87 784 856 784 856 0.85

6 30 6.1e-16 1.2e-12 48.5 5.0 1 87 956 1026 956 1026 0.81

7 30 7.8e-15 1.6e-11 45.0 3.6 1 86 1050 1121 1050 1122 0.82

8 30 5.1e-13 1e-09 39.2 0.6 1 87 1157 1225 1157 1225 0.81

9 30 1.1e-10 2.2e-07 31.7 1.4 1 86 1274 1343 1274 1344 0.76

10 30 1.9e-16 3.9e-13 50.1 0.3 1 86 1371 1440 1371 1441 0.83

11 30 2.5e-12 5e-09 37.0 0.8 1 86 1462 1531 1462 1532 0.82

12 30 1.8e-14 3.6e-11 43.8 1.8 1 86 1559 1630 1559 1631 0.85

13 30 3.9e-13 7.8e-10 39.5 1.9 1 85 1707 1775 1707 1777 0.82

14 30 9.9e-13 2e-09 38.2 0.1 1 86 1798 1866 1798 1867 0.81

15 30 4.1e-14 8.3e-11 42.7 1.0 1 87 2045 2114 2045 2114 0.81

16 30 4.5e-10 9.1e-07 29.7 0.1 1 62 2173 2232 2173 2247 0.78

17 30 0.009 18 6.3 0.1 1 59 2269 2317 2269 2341 0.77

18 30 9.2e-14 1.9e-10 41.5 1.8 1 87 2355 2425 2355 2425 0.84

19 30 2.8e-14 5.6e-11 43.2 1.9 1 86 2482 2551 2482 2552 0.84

20 30 8.5e-11 1.7e-07 32.0 1.9 1 85 2587 2657 2587 2659 0.81

21 30 2.8e-12 5.7e-09 36.8 3.6 1 87 2669 2740 2669 2740 0.81

22 30 2.9e-11 5.8e-08 33.6 0.0 1 86 2766 2836 2766 2837 0.80

23 30 1e-06 0.002 19.0 0.6 1 58 2869 2921 2869 2945 0.82

24 30 3.2e-13 6.4e-10 39.8 0.3 1 87 2959 3032 2959 3032 0.83

25 30 1.2e-12 2.5e-09 38.0 2.2 1 87 3190 3263 3190 3263 0.83

26 30 8.1e-14 1.6e-10 41.7 2.0 1 86 3324 3394 3324 3395 0.81

27 30 2.3e-13 4.7e-10 40.3 5.0 1 86 3527 3597 3527 3598 0.84

28 30 4.8e-14 9.8e-11 42.4 0.2 1 87 3675 3745 3675 3745 0.85

29 30 2.5e-10 5.1e-07 30.5 0.1 1 58 3764 3813 3764 3830 0.82

30 30 1.1e-09 2.2e-06 28.5 1.1 19 87 3831 3888 3817 3888 0.74

#	of	c-Evalue	i-Evalue	score	bias	hmm coord from	hmm coord to	ali coord from	ali coord to	env coord from	env coord to	acc
1	30	10	2e+04	-3.5	1.3	30	58	163	193	128	207	0.61
2	30	10	2e+04	-5.6	2.5	25	62	404	445	381	471	0.49
3	30	4.4e-15	8.8e-12	45.8	3.7	1	86	593	665	593	666	0.85
4	30	3.4e-15	6.8e-12	46.1	4.6	1	87	693	762	693	762	0.83
5	30	7.8e-16	1.6e-12	48.2	0.4	1	87	784	856	784	856	0.85
6	30	6.1e-16	1.2e-12	48.5	5.0	1	87	956	1026	956	1026	0.81
7	30	7.8e-15	1.6e-11	45.0	3.6	1	86	1050	1121	1050	1122	0.82
8	30	5.1e-13	1e-09	39.2	0.6	1	87	1157	1225	1157	1225	0.81
9	30	1.1e-10	2.2e-07	31.7	1.4	1	86	1274	1343	1274	1344	0.76
10	30	1.9e-16	3.9e-13	50.1	0.3	1	86	1371	1440	1371	1441	0.83
11	30	2.5e-12	5e-09	37.0	0.8	1	86	1462	1531	1462	1532	0.82
12	30	1.8e-14	3.6e-11	43.8	1.8	1	86	1559	1630	1559	1631	0.85
13	30	3.9e-13	7.8e-10	39.5	1.9	1	85	1707	1775	1707	1777	0.82
14	30	9.9e-13	2e-09	38.2	0.1	1	86	1798	1866	1798	1867	0.81
15	30	4.1e-14	8.3e-11	42.7	1.0	1	87	2045	2114	2045	2114	0.81
16	30	4.5e-10	9.1e-07	29.7	0.1	1	62	2173	2232	2173	2247	0.78
17	30	0.009	18	6.3	0.1	1	59	2269	2317	2269	2341	0.77
18	30	9.2e-14	1.9e-10	41.5	1.8	1	87	2355	2425	2355	2425	0.84
19	30	2.8e-14	5.6e-11	43.2	1.9	1	86	2482	2551	2482	2552	0.84
20	30	8.5e-11	1.7e-07	32.0	1.9	1	85	2587	2657	2587	2659	0.81
21	30	2.8e-12	5.7e-09	36.8	3.6	1	87	2669	2740	2669	2740	0.81
22	30	2.9e-11	5.8e-08	33.6	0.0	1	86	2766	2836	2766	2837	0.80
23	30	1e-06	0.002	19.0	0.6	1	58	2869	2921	2869	2945	0.82
24	30	3.2e-13	6.4e-10	39.8	0.3	1	87	2959	3032	2959	3032	0.83
25	30	1.2e-12	2.5e-09	38.0	2.2	1	87	3190	3263	3190	3263	0.83
26	30	8.1e-14	1.6e-10	41.7	2.0	1	86	3324	3394	3324	3395	0.81
27	30	2.3e-13	4.7e-10	40.3	5.0	1	86	3527	3597	3527	3598	0.84
28	30	4.8e-14	9.8e-11	42.4	0.2	1	87	3675	3745	3675	3745	0.85
29	30	2.5e-10	5.1e-07	30.5	0.1	1	58	3764	3813	3764	3830	0.82
30	30	1.1e-09	2.2e-06	28.5	1.1	19	87	3831	3888	3817	3888	0.74

Sequence Information

Coding Sequence: ATGTCACAACACAACACCccgcatcatcatcaatattatcagcagcagcagcagcaacaacaacatcagcagcagcagcagcagcagcagcagcttcaacataaacaaatacaacaacacagTTGGTACTCACATGTTGCTTCCTACCCGCCCCACCATCCGCACGTCGCTGCGTTTGCGGCGCCCTGCAaaggcaataataataacaacaacattatgaATGCATACGGAACGGGGGTCGGTGGTTCACATGCAGCATATTATGGCTCTGCCGCAGCGGGATCTGCTGGGGTGGGTTATAACCTTGAGGCCAATAATGTGGCCTATGCGCACAACCAGCTGCtgcaatatcaacaacaacaacagcagcagcaacaacaacaacaacagcagctcagTCAACGTTCATATTTGCCGCACAATTTAATGCATAGCTCTTATCCCTACATCAAAAGTGAGCCAATGGAGTTATCTGATGatagacagcggcagcagcagcagcaacaacaacaacagcagcaacagcaacaacatcagcagcagcagcagcaacaacatcatcagcaacaccaacatttTCAGAACCCAATGGCACCGCCGCCAGTGCCCGCCAATCGCCACCCACTCGATGCCAGCGGCGAAATGATAGTAAAATctgaACCCATTGACGAGCATACGTACAAGTCCAACTACATTGATGACAATACGCCCTTCGCCGACTTCAGTAAATTCCCAGAATTTGGCGATAATATGCTGAATCCTAAGGTGGAACTTACTGTCAAGGACGAGGGGTATGGAAATCATAAGAATCAACTTAACTATCCACGCCGTAAAGTTCAAACGGAACGTGCATCGGAGAGTTTGCCCATTTGCCAGCGTTGCAAGGAGGTCTTCTTCAAGAAGCAGGCTTACATGCGCCATGTGGCTGAAAGCAGTTGCACCATGCAGGAGTACGACTTCACGTGCAACCTGTGCCCCATGTCCTTTATGAGCGTTGAGGAGCTGCAAAAGCACAAACACCTCCACAAAACGGACAAATTCTTCTGCCTGAAATACTGTGGCAAATACTATGATACAATCGCGGAGTGCGAGTCGCATGAGTACATGCAACACGAACACGAAAGTTTTGTGTGCAATATGTGCTCCGTAACACTTTCCACCCGCGAGCAACTGTACGCACATCTGCCTCAGCACAAGTTCCAGCAGCGTTACGATTGTCCAATTTGCCGCCTTTGGTACCAGACGGCGATAGAGCTGCACGATCATCGCATGGCAGCGCCCTATTTTTGCGGAAAGTATTATGCAGGTGCCCACTCCAGTgtccaccagcagcagcaacatcaacaacaacaacaacaacagcagcagcagcagcagcaacacacgCAACATCAGCACCCGCAACATCATTCACAGCATCAGCACCAAACAAACTACAAGCTGCAGGACTGTCACATGGGCTCCCTAGAATtgCCATCGACGCACCATAAGCCAGCGGCGTCTGTGTTGCCGGCGACGGCAGCGCTGAGTTCCTTGTTGCAACAGCGTCAAGCGAATGCCGATGGCGGTCCATTGTTTGGCTCGACGATGAAAAATGAGGGAAACGTAAAACTGGAGCGTAGCTACAGCAACTCAACAAGTGACTCTGGTTACAGTCTGCACGATGGTAGCTTTAATAACACCTACGGCAGTGACACCTCCATGCATGGGGGCAGCTCTGCGATTGGCGGGCCTCAGGCGCACTCATCTACATTGGACGATTCGGAAGATGCACTCTGCTGTGTGCCATTGTGTGGGGTACGCAAAAGCACCAGTCCAACACTGCAATTCTTCACGTTTCCCAAAGATGAGAAGTACTTGCACCAGTGGctgcacaatttaaaaatgttccatATTCCGGCCTCGAGTTACGGCAGCTTTCGAATTTGCAGTATGCATTTTCCGAAGCGATGCATCAATCGCTACTCCTTATGCTACTGGGCGGTGCCCACCTTCAACTTGGGCCACGATGATGTGGCCAATTTGTATCAGAATAGGGAACTGACCAACACCTTTACAACTGGCGAGATCGCACGTTGCAGCATGCCAAACTGTTCCAGTCAACGGGGAGAGAGTAACCTGaagttttacaattttcccAAGGATATTAAGAGCCTAATCAAGTGGTGTCAAAATGCCCGTTTGCCCGTCCAGGCCAAGGAGCCGCGTCATTTCTGCAGTCGCCACTTTGAGGAGCGCTGCATTGGCAAATTCCGATTGAAGCCATGGGCTGTGCCCACGTTGCATCTGGGCGCCCAATACGGCAAAATCCATGACAATCCAAAGAATTTATACGTCGAGGAGAAGCGTTGCTGTCTCAACTTCTGTCGACGCAGTCGATCCTCCGATTTTAACATGTCGCTCTACCGCTTTCCCAGAGATGAGGTTTTACTGCGTCGTTGGTGCTACAATTTACGTCTGGATCCTGCTGTGTATCGCGGCAAGAACCACAAAATATGCAGTGCCCACTTCATCAAGGAAGCATTGGGACTTCGAAAACTATCTCCTGGTGCTGTTCCGACCCTGCATCTGGGACATCACGACacctttaatatatatgagaaCGAACTGTGGCCACCACCAACAGCGGCCACGTCCTCCACtcatcagcagcaactgcaacaacatcagttGCAGCAGCACCAACTGCAACACTCGCACGCGACTCATCACAGCAAGTACCAGCGACACTCGGCtgcatccacatcctcatcgGCCAGTTCGGCGTCGCACTACGTGGACGCTGAGTCAAGTGCTTCGTACTTGGGCATGAATGCCTCGGGAGGCTCTTCCTCTGGTCTTAATGTCAGCGACAGCATGGATGTCTGCTGTGTGCCGAGCTGTGAGAGCAAGCGGCACAATAGTGAGAGCATTACATTCCACACCATACCCAGGCGGCCGGAGCAGATGCGCAAGTGGTGCCATAACCTGAAGATACCCGAAGACAAAATGCACAAGGGCATGCGCATATGTAGTCTCCATTTCGAGTCCTACTGCATTGGCGGTTGCATGCGTCCATTCGCAGTGCCCACACTTAATTTGGGAcacgaggacgaggacataCACCGAAATCCGGACGTGATAAAGAAACTCAATATTCGCGAGACATGCTGCGTCGCTGTGTGCAAGAGAAACCGCGACCGGGATCATGCCAATCTGCATCGTTTCCCCAGCAACGTGACCCTCTTGACCAAGTGGTGTGCCAACTTGCAGCGCTCTGTGCCGGATGGCACTAAGCTCTTTAACGATGCCATTTGTGAGGTGCACTTTGAAGATCGTTGTTTGCGGAACAAGCGGTTGGAAAAATGGGCTGTGCCCACGCTTGTCCTGGGTCATGATAATATTGCCCATCCATTGCCCACGCCGGAGCAGGTGGCCGAGTTCTATGCCCGTCCCACAGCTCCAAATAATGGCGAGGAGCAAGGAGAGTGCTGCGTGGATACATGCAAGCGTAATCCCAGCGTAGATGATATTAAACTCTATCGACCACCAGAGGAGACGCAGGTGCTCGCGAAATGGGCACATAATCTTGGGTTAGATGCTGCCAAGCTTCCGAATATGAGAATCTGCAATCTGCACTTCGAGTCGCATTGCATTGGCAAACGGATGCGTCCTTGGGCAATACCCACTCTCAATTTGTCAAGCAACATTGAGAATCTCTTTGAGAATCCGGAGCATCACATGGTCTACAAGCGTCGTACACATCTCAACTCAGAAAGAGCCGCTGCTCGCGAAGCACGATCAGGTGCAGGCATAATAAAACCAACGTGGGTGCCACgttgctgcttgccacattGCCGAAAGGTGCGTGCGCTCCACAATGTACAGCTCTATCGTTTCCCGAAGCTCAATCGCTCCACGCTTGCCAAGTGGGCACACAACCTGCAAGTGCCACTGGTCGGAAGTGCGCAAAGACGTCTTTGCTCAGCTCACTTCGAGCCACATGTTCTCAGCAAAAAGTGTCCAGTGCCATTAGCAGTGCCAACCCTGGACCTCAACACACCCACCGGCTACAAGATCTATCAGAATCCGGCCAAGCTGAAGGCCAACAAGCTGTGCCTTCAGCGTGTCTGCATTGTGGAAAGCTGTCGGCGTCAGCGTTCGCAGGGCGTTCAGCTGTTCCGACTGCCTCATAGTCCGACGCAGCTGCGCAAGTGGATGCACAATTTAAAGATGCGTCCGCGGGGTGCGATGCGGCAACAGTATCGCATTTGCTCTACACATTTTGAGTCTCATTCGTTCAATGGAAAGCGACTGAGCACTGGTGCCATACCGACTTTGGAGTTGGGCCATGACAATGATGACATTTATCCAAATGAGGCACAGTCGTTTGTGGAGGAGCACTGCGTCATCGAGGGCTGTGATTCAGTCAAGGAGCATCCGGATGTGCGCCTGTTCCGCTTCCCCACCGAAGATGAGGACATGCTCTGGAAGTGGAGCAACAATCTCAAAATGAATCCCGTGGACGGTTTCGGCGTACGCATCTGCAACAAGCACTTCGAATCCGATTGCATTGGACCAAAGCATCTGTTTAAGTGGGCTATTCCCACATTATGTTTGGGTcacaatgatgatgacattGAACTAATACCCAATCCTAAGCCAGAGGATCGCTATGTGGATCCAGTGTTCAAGTGCTGTGTTCCAACCTGTGGCAAGACACGCAAGTTTGATGAGGTTCAAATGAATAGCTTCCCCAAGGATCGAGCTCTTTTCGAACGCTGGCGTCACAATCTGCGATTGAATCATCTGAACTTCAAGGAGCGCGAACGCTACAAGATCTGTAACGCACACTTTGAAGACATTTGCATTGGCAAAACCCGTCTGAATATTGGTTCCATACCCACACTGGAGCTGGGCCACGATGAGACTGAAGACTTGTACCAAGTGAATCCTACAGAGCTGCAAAGCAATTTGTTTGGACGGCAACGTCGCGTACAGGAATCCATGCGTACCTCCATCAAGCAGGAAGAGCAATCCGAGGTAGAAGAAGACACTAAGCCGGAACAATCCATGCCCAATACCCACGATACTAAACCAAGACAGGTTAAAATGAGGAAATCCTTTGCGGATATCAAATGCTGTGTACTAACATGCGGTCGAAGTCGAGGAGAGCATGGTGCTCGCCTGTTTTGCTTTCCAAATggcaaacagcagcaaagcaAATGGCGTCAAAATCTTCGCATGGATCCCTCAGAAGTGGATAAAACGACGCGTGTGTGCAGTGCGCATTTCAATCGGCGGTGCATTGATGGCAAGGATCTGCGTGGCTGGGCCATACCAACCCAGCAACTGGGTCATCCGCCCATCTTCGAGAACCCGAAAAATATTCCGGGCTTCTTTACTCCGACTTGTGCGCTGGCGCATTGCCGGAAACGTCGAAGCATTGACAATGATCTGCGCACGTATCGCTATCCGCGCAACGAAGAGCTGCTCGAGAAGTGGCGAGTGAACTTGAGACTGGCACCAGATCAATGTCGTGGACGCATCTGCGCAGATCACTTTGAGCCAATGGTGCGTGgcaagctgaagctgaaaacAGGCGCTGTGCCTACACTGAAGCTGGGCCATGATGAAGGTGTTATTTTTGATAACGAATCCATAAAGACTGGTTTGCATCAGGAGGGTGATGATGACGGTGAGGAGATGCCGACAATTCAAACCAAAATTAAGAGAgaagaggatgaggaggaaTCTAAGCAAATGGAGGAAGGCCAtgaaaatgtagaaaataacgatgatgacgatatATATGGAGGCGGAAATGGAATTGGTGAAGATGCACACAATAATGACAGTGATGCTGACGAGGATCATGGACATAATGAAGAGCAGGATGAAGATCAAGATGATACTGAACATGGATATTTCGATCCGTTGGAATTAGTGGAAACCTTTGCTGAACATCACAGCGATGACAATACGGCTGACGATGTAGACGATCTTAATTATTccgatggcgatgatgatcaTATGGGTGCCGACGATGATGAgcttgatgatgatgagctgCTGTTGCCGGACAACCCACCAGTTCAGATTGCATTACCTCCAGTGCGTCGCGAGAAGCCTGTCAACAACATCACTCCCATCTGCTGCCTGAAACACTGTCGCAAGGAACGAACAGCCACCTACCAACTGAGTACATTTGGTTTCCCCAAGGATAAGCAGCAGCTTCTTAAATGGAGCTCCAACTTGCACCTGGAGCTGGAAGACTGTGTGGGACGGGTATGCATTGAGCATTTTGAACCGGAGGTATTGGGATCCCGCAAACTGAAGCAGAATGCAGTGCCCACCCTCAATGTGGGACACTCGATTCCGTTGCTTTTTGGTtgcaatggaaaattaatgtCCATTTACGATACTCAGCCGCAGCATTCGGTTTTTCGGCTTTGGAGCCTGAAACACTGTCGCAAAAGGAAGATTCTAGCGGAGCCACCGGATCAAGCAGTGAATAAGATGCAATATAAGCCACGATGCTGTCTTCTCAGCTGCGGGAAGCAGCCAGTTTTGCATGACGTGCAGCTTCTGCCCTTCCCGCAGAATCGTAGTATCTTTTTGAAATGGATGCACAATCTGAAGCTTGAACCTTCTACCGACACCAACGATATGTGGCTCTGCAATGAACACTTTGAGCCCGAACTCTTGGAAGGCATTGGTAAATCATTGGAGGAATGTATGCCCACCCTGAAACTGGGTCATGATGACCCAAACATTTACCGTAGTCACAACGGCTCCGAGGACCTCACAATGTCAACCGGCAGCTGTTTAGTTCCTACTTGTCCATGTGCACGACTGAACCTATACAGTTGCTGCGCTCTGCCAACGAATCCTCTCGTGCAACAAGCCTGGTTCCAGTATCTGCAGCTGCCCCTGCCAAAAGATGGGGAATTATGTTTTATGCACTTCATGGAGCTGTATGAGCAAGTGCCTCTGCCGAAGGATCTGCCCGAGTCAGAGGTGTTGCAGCTGAAAAATGCCTACGAAACTATCTCCAAATCTGCGATGGCCATGAAACTGCGCTGCGCCGTTCCTGGTTGTTACTCCAAGTACACGGACTCCGTACGCTTAACAAAGCTGCCGCAGTGTCCAGAGATATGCGCCAAGTGGGTGCACAATACAAAGATTACCTATGATTCCTCACGTCACTACATGTATCGCATATGCTATCTTCATTTCGAGCGACGATGTTTGGGTCAGGTGCGTCCCAAGCCGTGGGCAATGCCCACGTTGCACCTACACCACAAGGATCCAAATATTTACTATCCGTTTGGTGAGAAGCACGAGCCCAGTCCGGCTGCCCATCTGGGGCTGCCATTGCACATAAAAACGGAGATGACACCCAGTTCAAGTATCAGTCCCAGGAGTAGTGCCACTCCAAGTCCGCGTGGCAAGCTAAAGATCTGCTGCATACCAAGCTGTGCCCAACAGGCATCCATAAATACGCTAGTCTTTCGATTTCCCACCGCAGAAGCCGCTCTAGTTAAGTGGTTAGTGAACACGCAGCAAAGCCCGAGAGAGTCGGACCCACAGGAACTATTTGTGTGCCACGACCACTTCGAGACTGATGCCATATGCAAGAAGCAGCTACGCAGCTGGGCAATTCCTACTCTTAAGCTGGGTCATGATGGACACATTATTCCCAATGCCAGGCACAATGGCAACATTGCCGATAGTCAACAGGACAAGACTTGTTTCCAGTTCATTTGGGAGAACTACTGCTCGGTGCTCAGCTGTTTCCAGCAGCGCAGCGAAAACTTACGTCTCTTCGCTTACCCCACAGATAGGCCCACAATCCGCAAGTGGGCGGTCAACTGCAAGCATCGGTCCATGCAGGCGAGTAGCGATGGATTCCAGgtTTGTCAGTCGCACTTTTCGCCGGAGTGCTTTCTTCCAGGGACGTGCAATCTAGTCGAAGGCGCAGTGCCGACTAAGGAGCTCAACCGAATCATCACTAAACTACGCTGCTTTGTGGCCGGCTGTGAGAAGGAAGACTCCGTTCGCCGCCGTCTCTTTAAGATGCCAAAACGCAACCCGCATATTGTCGATTGGTGTCACAATCTCAACCTGGACCCGGCAACGGCTTGTGCCAGtgaaaaatatgtatgtgagCGACACTTTGAGTCGCACTGCTTCAACGTATACAAGATGCTGCGTCCGGGAGCACGACCAACACTACATTTGGGTCACGAGGAGAGTATCCAACTCTTGCCCAATCCTGCAAATTTGGCGAAATGCTCGGAAGAAGATGTTCTGTGCGATGTACCCAACTGTGGACGTTCAAAAGATGCGGATGGTGTTCAAATGTTTTACTTACCTAAGCTGCAAATATTGGCGGACAAGTGGTTGGAGAATGTGCGTCTAAAGCCAGAAGCCCAGTGCATAACAAAACTGAAGTTTTGCAACGCACACTTTGAACCAAGCAGCTTGGAAAATGGACGTCTCCTCTTGGGCGCTATGCCTACTTTGGAATTGGGTCATGAGGAGACAGACAACATACACCAATATAGTGACATTACATCGGCCAAGAACAGGAAATACTACAATAAAAACGGTTCCAACGATTGTTGTTATCCGCAGTGCGTGGAGCTCCAAAAGAACCACCAACGTTCTACCTACGATCTGCCAGAGGCGACGGAGCTGCGTCGTGCTTGGTCAAATTTCATGAAACTTGATGAATGCCTAGCGGAGTCTCCGATTCTTAAGCTTTGTCCAATTCACTTCATCATCCTGTACGAACAGAGCGTCGAACACTTTACGGAGCATAAAACGGAACCTCTTCTCGAACAGAACTATAAGAATTCGCGTAACTGCGTGCGGATTCGTATTATAAGTTGCGCTGTACGCGGCTGCAAAACCCTAAAGCCACGGGACGGTGGATGCCTGCACGGACTGCCGCAGCGTCAGGACATCCTGCAGATGTGGCTGGACAACACGAAGATAGTTTTCTTTGAGCAACAGCGTTACATGTACAAAATATGCACCAAGCACTTTGAGCCCTTCTGTTTGACGGAAGGAACGCGTCGTCTGAAACCCTGGAGCATGCCCACATTACATTTACCTGAACGTGAGCCCGATGAGGCGCCCATACATCGAGTTCCCACCGAAATAGAATGGCAGTCCATGAATGATGCCCTGGCTATATGCCGAGCTGCGAAAGTTGAAGAGTTGACCAAAGAATTCGAGGATTCCATACTCGAACCAACGGTGAATTCGGAACATTGGACCGATGGTGATTCGGAGCATTTTCCGGAGGAGGATAGCAACTCTTACCAGCATACACATGAAAATGTTGACTCCAAACTTAATTTCAAACATCATTCACCCGATGCAGATGAAGGCAACAGCTCTCAGCATCCATTGGATTCCGAAGCTTTAGAGGTGATGCTCGAAGTGGCTCATGTCGAGAAGTGTAAGACCTACGAAAAGTTTGACGTAAATGCATCTCATCCTGAACCAATGCACCAACATGAATCCGCGGAAAGTGGCCTGCTTCTAAGTACTGGAAGTAATTACAGTTCACGGCACTGCAGTGTCCGGGGCTGTTATGTGACGGACAAGGAAGTGAATGGCAACTTGAAGCTGCACAAGTTTCCCACTTCGTTCCACACTATGAAAAAGTGGATGCACAATACACAGGTTGCTGTGGATACAAATTTTCCTTGGCGTTTTCGGATCTGCAGTTTTCACTTTGCGTCCGATTGCTTTAATGGCTCACGGATAAGGCGTGGCTCAATGCCAACATTACATCTCGGACCACGTCGACCGGCCAAAGTATACGATAATGAGTTTTTTCCAATTGCACCGCTACAGAAGTCAAATACAAAGGAGCTGCAGTTGGCAGAGGAGTCTTCATTGGAGCATTTCAATTCTGATGAGATTTGCCTGAAACTTCCACGTCCCGCATCTCCGTTCAAGTCTAGCAAATTTTGCCAGATTGAAGGCTGTTCAAATCACTTGACCACCGAGAACTTGACACTCCACAAGTTCCCCCACTCATTGGACATGTGTCAGAAGTggcaacacaacacacaagtGCCCTTCAATCCGGAGTATCGTTGGCGCTATCGTATCTGCAGTGTACACTTTGAGCCCATCTGCCTGGCTAGTGTGCGTCTGGCGCACGGAAGTGTTCCCACCTTGCTCCTTGGTCCGCGTGCACCGAAACAGCTATTCCAGAACGATTTCAATGCGATAAACATGCGCCCGGAAAACCAAAATAATGATTTTAAAGATACGTTTATTAAACAAGAGCAGGAGGATCAGTTCGAACAGGATATGCAGGAGAATGAGGGGGAGTTCGAGGATGACGAGGATGACGAGGATGACGAGGAAGACGAGGAAGAAGAGCGGAAACATGATGCAAATTTACTTGTTCCAGAACTGCAATTACATGAGCAGGACGTGAAGCCGGATATTCAGTTTTATTCCAATAACAGTCAAAGCAGCTGGAAGGATCAACCGCACAAACTGCGCTTACCGAGCATTAAGCAGGGAATAGTTACCAACTATAATCCGGTTAAGTCGGGCTACGACAAATGTTCTCTGGTCCATTGCCAACGGCAGCGTTCGCATCATGGCGTTCACATCTATAAGTTCCCTCGATCACCAGCGCTTCAGCAGCGTTGGATGCACAACTTGCATATTCGGTATGACGAGCAGCGTCCCTGGAAGACAATGATTTGCAGCGCGCACTTTGAGCCGCTCTGCATACGCCGGCGTAAGCTGTGTTCCTGGGCAGTGCCCACCTTGGAGCTGGGCGACAATGTACCTCAAAATATCTACACCAATCAGCAAAGCCAACTGCAGTTTTCCAATGAACATAATGAACTGTTGGATGGCAGCGAAGACGAAGACTTTAACAACGACGTGGAGGACACAACGCAGGATGGAGAATTCAATGAGAATGATAATGAGAATCTCTTTTTGTCGGAGCCATATAGCAAAAAGGAAGCGCAGGCTTCTACTCTGAAAACTAAGTTCTGCTGCTTGCCTTATTGTCGCAGTCCACGTGGTGATGGCATTAAACTGTTCCGGCTGCCAAGCAGCCCCAGTTTCCTGCGCAAGTGGGCACAAGCAACGGGCATGAAGTTCAACGAATCGCAACGCAATACAAAACTAATTTGTAGCCGTCATTTTGCACCGCACTTGATTGGTGTCCGTCGTCTGGTTTCCAATGCTATACCAACCCTTCATCTCGGTCCCAAAAAGTTGGACATTCAACCTACGCTGCCACCAACTGCTCCTCACTGCTGCATGCCCGATTGTGGGCAAACGAAAAAAGATGTTCAACTGTTCAACTTTCCCAGTGATCCCATTCTGCTTCAGCAATGGAGTCAGGCCCTGAATCTTCCAGACATTCAAAAATATCGCAACAAATACATTTGCGTTATGCACCTGCCATCAAAAGCCATCAATTGTTTGATTTGTGGTAAGGATAATGTGCAGCCTCCGTTGCTGGCGTTTCCCAAGAATCACAATCAACGCGTCAAATGGtgctataatttaaaaatcgatGCCATCCCCAAGTGGGACGAAACCAAACAAATCTGTTCAAAACACTTTGAAAATATCTGCTTCGTCAAGCCGGGTCAATTGTTGCCAGATGCCGCACCAACGTTGCATTTAAGGCATAGCGACAGAAATATATTCCTAAACGAACATGCCATAGAAACCAACCAGATAGTTCACATTAAGGATGAACCCCTGGACAGCGATGATTTAATGCTGTAA
Protein Sequence: MSQHNTPHHHQYYQQQQQQQQHQQQQQQQQQLQHKQIQQHSWYSHVASYPPHHPHVAAFAAPCKGNNNNNNIMNAYGTGVGGSHAAYYGSAAAGSAGVGYNLEANNVAYAHNQLLQYQQQQQQQQQQQQQQLSQRSYLPHNLMHSSYPYIKSEPMELSDDRQRQQQQQQQQQQQQQQHQQQQQQQHHQQHQHFQNPMAPPPVPANRHPLDASGEMIVKSEPIDEHTYKSNYIDDNTPFADFSKFPEFGDNMLNPKVELTVKDEGYGNHKNQLNYPRRKVQTERASESLPICQRCKEVFFKKQAYMRHVAESSCTMQEYDFTCNLCPMSFMSVEELQKHKHLHKTDKFFCLKYCGKYYDTIAECESHEYMQHEHESFVCNMCSVTLSTREQLYAHLPQHKFQQRYDCPICRLWYQTAIELHDHRMAAPYFCGKYYAGAHSSVHQQQQHQQQQQQQQQQQQQHTQHQHPQHHSQHQHQTNYKLQDCHMGSLELPSTHHKPAASVLPATAALSSLLQQRQANADGGPLFGSTMKNEGNVKLERSYSNSTSDSGYSLHDGSFNNTYGSDTSMHGGSSAIGGPQAHSSTLDDSEDALCCVPLCGVRKSTSPTLQFFTFPKDEKYLHQWLHNLKMFHIPASSYGSFRICSMHFPKRCINRYSLCYWAVPTFNLGHDDVANLYQNRELTNTFTTGEIARCSMPNCSSQRGESNLKFYNFPKDIKSLIKWCQNARLPVQAKEPRHFCSRHFEERCIGKFRLKPWAVPTLHLGAQYGKIHDNPKNLYVEEKRCCLNFCRRSRSSDFNMSLYRFPRDEVLLRRWCYNLRLDPAVYRGKNHKICSAHFIKEALGLRKLSPGAVPTLHLGHHDTFNIYENELWPPPTAATSSTHQQQLQQHQLQQHQLQHSHATHHSKYQRHSAASTSSSASSASHYVDAESSASYLGMNASGGSSSGLNVSDSMDVCCVPSCESKRHNSESITFHTIPRRPEQMRKWCHNLKIPEDKMHKGMRICSLHFESYCIGGCMRPFAVPTLNLGHEDEDIHRNPDVIKKLNIRETCCVAVCKRNRDRDHANLHRFPSNVTLLTKWCANLQRSVPDGTKLFNDAICEVHFEDRCLRNKRLEKWAVPTLVLGHDNIAHPLPTPEQVAEFYARPTAPNNGEEQGECCVDTCKRNPSVDDIKLYRPPEETQVLAKWAHNLGLDAAKLPNMRICNLHFESHCIGKRMRPWAIPTLNLSSNIENLFENPEHHMVYKRRTHLNSERAAAREARSGAGIIKPTWVPRCCLPHCRKVRALHNVQLYRFPKLNRSTLAKWAHNLQVPLVGSAQRRLCSAHFEPHVLSKKCPVPLAVPTLDLNTPTGYKIYQNPAKLKANKLCLQRVCIVESCRRQRSQGVQLFRLPHSPTQLRKWMHNLKMRPRGAMRQQYRICSTHFESHSFNGKRLSTGAIPTLELGHDNDDIYPNEAQSFVEEHCVIEGCDSVKEHPDVRLFRFPTEDEDMLWKWSNNLKMNPVDGFGVRICNKHFESDCIGPKHLFKWAIPTLCLGHNDDDIELIPNPKPEDRYVDPVFKCCVPTCGKTRKFDEVQMNSFPKDRALFERWRHNLRLNHLNFKERERYKICNAHFEDICIGKTRLNIGSIPTLELGHDETEDLYQVNPTELQSNLFGRQRRVQESMRTSIKQEEQSEVEEDTKPEQSMPNTHDTKPRQVKMRKSFADIKCCVLTCGRSRGEHGARLFCFPNGKQQQSKWRQNLRMDPSEVDKTTRVCSAHFNRRCIDGKDLRGWAIPTQQLGHPPIFENPKNIPGFFTPTCALAHCRKRRSIDNDLRTYRYPRNEELLEKWRVNLRLAPDQCRGRICADHFEPMVRGKLKLKTGAVPTLKLGHDEGVIFDNESIKTGLHQEGDDDGEEMPTIQTKIKREEDEEESKQMEEGHENVENNDDDDIYGGGNGIGEDAHNNDSDADEDHGHNEEQDEDQDDTEHGYFDPLELVETFAEHHSDDNTADDVDDLNYSDGDDDHMGADDDELDDDELLLPDNPPVQIALPPVRREKPVNNITPICCLKHCRKERTATYQLSTFGFPKDKQQLLKWSSNLHLELEDCVGRVCIEHFEPEVLGSRKLKQNAVPTLNVGHSIPLLFGCNGKLMSIYDTQPQHSVFRLWSLKHCRKRKILAEPPDQAVNKMQYKPRCCLLSCGKQPVLHDVQLLPFPQNRSIFLKWMHNLKLEPSTDTNDMWLCNEHFEPELLEGIGKSLEECMPTLKLGHDDPNIYRSHNGSEDLTMSTGSCLVPTCPCARLNLYSCCALPTNPLVQQAWFQYLQLPLPKDGELCFMHFMELYEQVPLPKDLPESEVLQLKNAYETISKSAMAMKLRCAVPGCYSKYTDSVRLTKLPQCPEICAKWVHNTKITYDSSRHYMYRICYLHFERRCLGQVRPKPWAMPTLHLHHKDPNIYYPFGEKHEPSPAAHLGLPLHIKTEMTPSSSISPRSSATPSPRGKLKICCIPSCAQQASINTLVFRFPTAEAALVKWLVNTQQSPRESDPQELFVCHDHFETDAICKKQLRSWAIPTLKLGHDGHIIPNARHNGNIADSQQDKTCFQFIWENYCSVLSCFQQRSENLRLFAYPTDRPTIRKWAVNCKHRSMQASSDGFQVCQSHFSPECFLPGTCNLVEGAVPTKELNRIITKLRCFVAGCEKEDSVRRRLFKMPKRNPHIVDWCHNLNLDPATACASEKYVCERHFESHCFNVYKMLRPGARPTLHLGHEESIQLLPNPANLAKCSEEDVLCDVPNCGRSKDADGVQMFYLPKLQILADKWLENVRLKPEAQCITKLKFCNAHFEPSSLENGRLLLGAMPTLELGHEETDNIHQYSDITSAKNRKYYNKNGSNDCCYPQCVELQKNHQRSTYDLPEATELRRAWSNFMKLDECLAESPILKLCPIHFIILYEQSVEHFTEHKTEPLLEQNYKNSRNCVRIRIISCAVRGCKTLKPRDGGCLHGLPQRQDILQMWLDNTKIVFFEQQRYMYKICTKHFEPFCLTEGTRRLKPWSMPTLHLPEREPDEAPIHRVPTEIEWQSMNDALAICRAAKVEELTKEFEDSILEPTVNSEHWTDGDSEHFPEEDSNSYQHTHENVDSKLNFKHHSPDADEGNSSQHPLDSEALEVMLEVAHVEKCKTYEKFDVNASHPEPMHQHESAESGLLLSTGSNYSSRHCSVRGCYVTDKEVNGNLKLHKFPTSFHTMKKWMHNTQVAVDTNFPWRFRICSFHFASDCFNGSRIRRGSMPTLHLGPRRPAKVYDNEFFPIAPLQKSNTKELQLAEESSLEHFNSDEICLKLPRPASPFKSSKFCQIEGCSNHLTTENLTLHKFPHSLDMCQKWQHNTQVPFNPEYRWRYRICSVHFEPICLASVRLAHGSVPTLLLGPRAPKQLFQNDFNAINMRPENQNNDFKDTFIKQEQEDQFEQDMQENEGEFEDDEDDEDDEEDEEEERKHDANLLVPELQLHEQDVKPDIQFYSNNSQSSWKDQPHKLRLPSIKQGIVTNYNPVKSGYDKCSLVHCQRQRSHHGVHIYKFPRSPALQQRWMHNLHIRYDEQRPWKTMICSAHFEPLCIRRRKLCSWAVPTLELGDNVPQNIYTNQQSQLQFSNEHNELLDGSEDEDFNNDVEDTTQDGEFNENDNENLFLSEPYSKKEAQASTLKTKFCCLPYCRSPRGDGIKLFRLPSSPSFLRKWAQATGMKFNESQRNTKLICSRHFAPHLIGVRRLVSNAIPTLHLGPKKLDIQPTLPPTAPHCCMPDCGQTKKDVQLFNFPSDPILLQQWSQALNLPDIQKYRNKYICVMHLPSKAINCLICGKDNVQPPLLAFPKNHNQRVKWCYNLKIDAIPKWDETKQICSKHFENICFVKPGQLLPDAAPTLHLRHSDRNIFLNEHAIETNQIVHIKDEPLDSDDLML

Similar Transcription Factors

Sequence clustering based on sequence similarity using MMseqs2

100% Identity: -
90% Identity: -
80% Identity: -