Basic Information

Insect: Sphaerogastrella javana
Gene Symbol: -
Assembly: GCA_037040025.1
Location: JBANCZ010003344.1:1-12698[-]

Transcription Factor Domain

TF Family: THAP
Domain: THAP domain
PFAM: PF05485
TF Group: Zinc-Coordinating Group
Description: The THAP domain is a putative DNA-binding domain (DBD) and probably also binds a zinc ion. It features the conserved C2CH architecture (consensus sequence: Cys - 2-4 residues - Cys - 35-50 residues - Cys - 2 residues - His). Other universal features include the location of the domain at the N-termini of proteins, its size of about 90 residues, a C-terminal AVPTIF box and several other conserved residues. Orthologues of the human THAP domain have been identified in other vertebrates and probably worms and flies, but not in other eukaryotes or any prokaryotes [1].
Hmmscan Out: # of c-Evalue i-Evalue score bias hmm coord from hmm coord to ali coord from ali coord to env coord from env coord to acc

1 24 4.4e-15 4.2e-11 46.0 4.6 1 86 629 701 629 702 0.85

2 24 3.4e-15 3.2e-11 46.4 4.6 1 87 729 798 729 798 0.83

3 24 8.3e-16 7.9e-12 48.4 0.4 1 87 820 892 820 892 0.85

4 24 1.1e-15 1e-11 48.0 5.6 1 87 989 1059 989 1059 0.83

5 24 7.3e-15 6.9e-11 45.3 3.2 1 86 1083 1154 1083 1155 0.82

6 24 8.1e-13 7.7e-09 38.8 1.0 1 87 1190 1258 1190 1258 0.82

7 24 1.1e-10 1.1e-06 31.9 1.4 1 86 1305 1374 1305 1375 0.76

8 24 5.6e-16 5.3e-12 48.9 0.2 1 86 1402 1471 1402 1472 0.82

9 24 1.1e-12 1e-08 38.4 1.6 1 86 1493 1562 1493 1563 0.80

10 24 5.2e-15 4.9e-11 45.8 1.6 1 87 1590 1662 1590 1662 0.85

11 24 9.8e-14 9.3e-10 41.7 0.7 1 85 1736 1804 1736 1806 0.81

12 24 3.9e-12 3.7e-08 36.6 0.1 1 86 1829 1897 1829 1898 0.81

13 24 2.8e-14 2.7e-10 43.5 1.2 1 87 2052 2121 2052 2121 0.79

14 24 5e-13 4.7e-09 39.5 0.0 1 82 2200 2265 2200 2274 0.76

15 24 0.00061 5.8 10.3 0.1 1 58 2290 2340 2290 2364 0.83

16 24 1.4e-13 1.3e-09 41.2 0.3 1 86 2379 2448 2379 2449 0.84

17 24 3e-12 2.9e-08 36.9 0.1 1 87 2507 2577 2507 2577 0.81

18 24 4.4e-11 4.2e-07 33.2 0.0 1 86 2612 2683 2612 2684 0.79

19 24 1.5e-09 1.4e-05 28.3 0.2 1 87 2694 2767 2694 2767 0.80

20 24 6.7e-13 6.3e-09 39.0 0.7 1 86 2795 2880 2795 2881 0.80

21 24 4.5e-06 0.043 17.1 0.6 1 62 2914 2981 2914 2997 0.65

22 24 3.6e-12 3.4e-08 36.7 0.7 1 86 3000 3072 3000 3073 0.78

23 24 2.4e-14 2.3e-10 43.7 1.1 1 86 3228 3300 3228 3301 0.81

24 24 2.3e-14 2.2e-10 43.7 2.2 1 87 3354 3425 3354 3425 0.82

#	of	c-Evalue	i-Evalue	score	bias	hmm coord from	hmm coord to	ali coord from	ali coord to	env coord from	env coord to	acc
1	24	4.4e-15	4.2e-11	46.0	4.6	1	86	629	701	629	702	0.85
2	24	3.4e-15	3.2e-11	46.4	4.6	1	87	729	798	729	798	0.83
3	24	8.3e-16	7.9e-12	48.4	0.4	1	87	820	892	820	892	0.85
4	24	1.1e-15	1e-11	48.0	5.6	1	87	989	1059	989	1059	0.83
5	24	7.3e-15	6.9e-11	45.3	3.2	1	86	1083	1154	1083	1155	0.82
6	24	8.1e-13	7.7e-09	38.8	1.0	1	87	1190	1258	1190	1258	0.82
7	24	1.1e-10	1.1e-06	31.9	1.4	1	86	1305	1374	1305	1375	0.76
8	24	5.6e-16	5.3e-12	48.9	0.2	1	86	1402	1471	1402	1472	0.82
9	24	1.1e-12	1e-08	38.4	1.6	1	86	1493	1562	1493	1563	0.80
10	24	5.2e-15	4.9e-11	45.8	1.6	1	87	1590	1662	1590	1662	0.85
11	24	9.8e-14	9.3e-10	41.7	0.7	1	85	1736	1804	1736	1806	0.81
12	24	3.9e-12	3.7e-08	36.6	0.1	1	86	1829	1897	1829	1898	0.81
13	24	2.8e-14	2.7e-10	43.5	1.2	1	87	2052	2121	2052	2121	0.79
14	24	5e-13	4.7e-09	39.5	0.0	1	82	2200	2265	2200	2274	0.76
15	24	0.00061	5.8	10.3	0.1	1	58	2290	2340	2290	2364	0.83
16	24	1.4e-13	1.3e-09	41.2	0.3	1	86	2379	2448	2379	2449	0.84
17	24	3e-12	2.9e-08	36.9	0.1	1	87	2507	2577	2507	2577	0.81
18	24	4.4e-11	4.2e-07	33.2	0.0	1	86	2612	2683	2612	2684	0.79
19	24	1.5e-09	1.4e-05	28.3	0.2	1	87	2694	2767	2694	2767	0.80
20	24	6.7e-13	6.3e-09	39.0	0.7	1	86	2795	2880	2795	2881	0.80
21	24	4.5e-06	0.043	17.1	0.6	1	62	2914	2981	2914	2997	0.65
22	24	3.6e-12	3.4e-08	36.7	0.7	1	86	3000	3072	3000	3073	0.78
23	24	2.4e-14	2.3e-10	43.7	1.1	1	86	3228	3300	3228	3301	0.81
24	24	2.3e-14	2.2e-10	43.7	2.2	1	87	3354	3425	3354	3425	0.82

Sequence Information

Coding Sequence: ATGTCACAACACAACAATCCCCCGCAACCGCCGCATctacaacatcatcatcaccaccattattatcagcagcagccacaagaacagcagcagcagcaacaacatcattaccagcagcagcagcagcagcaacagcaacatcaacagcagctacaacataaacaaatacaacagcagcagcagcaccacagtTGGTACTCACATGTTGCTTCTTACCCTGCCCATCATCAAGCGCATGCCGCCGCAGCCTTTGCGGCGCCCTGCAaaaccaataacaataacaacgccagcagcagcaacagtaataacaacaacaacattatgaATACTGCATACGGCGCAGCGGCTGCAGGTACTAGTGCATACTATGGCTCtcccgttgctgttgctgctgcttctgctgcctctCCTGGGGGTGGGGTAGGCTATAACCTTGAGGCCAATACTGTGGCCTATGCGCACAACCAGCTGCTGCagtaccaacaacaacagcagcagcaacaacatcaacaacatcaacaacaacaacagcagcagctaggACAACGTACATCGTATATGTCGCACGGTTTGATGCATAGTTCGTATCCTTATATTAAGAGCGAACCATTGGAGCTGCCCGATGATAGAATTgcaaggcagcaacaacaacaacaacaacagcatcagcagcaacagcaacaacttcagcagcaacagcaacagcattatcAAAATCCCATGGCACCGCCACCTGCGCCTGCCGCAACAAACCGTCATACGCACGATGTTGGCGGcgatatgataataaaatCGGAACCAGTCGATGAACATGCGTACAAATCAAACTATATCGATGATAATACCCCATTTGCCGATTTTAGTAAATATCCCGATTTCGGTGACGGCATGCTGAGTCCCAAGGTGGAGCTAAATGTCAAAGATGAGGCCTATGGATCTGTCAAGAACCCTCTATGCTATCCACGGCGTAAGCTGCAATCGGATCGTTCCACGGAAAATTTGCCCATATGTCAGCGCTGCAAGGAGGTGTTCTTCAAGAAACATGTCTATTTGAGTCATGTGGCGGAGAGCAGTTGCACCATACATGagtatgaatttaaatgcaacatatGCCCCATGTCGTTCATGAGCACCGAGGAGCTGCAGAAGCATAAACAACTTCACAGAGTTGATAAATTCTTTTGCCACAAATATTGTGGCAAGTATTTTGATACAATAGCCGAATGCGAGTCGCATGAGTACATGCAACACGACTATGAAAGCTATGTGTGCAATATGTGCTCGATGACGTTTGCCACGCGTGAGCAACTCTATGCCCATTTGCCGCAACACAAGTTTCAGCAGCGCTACGACTGTCCCATATGCCGCCTGTGGTACCAAACGCCATTGGAACTGCACGAACATCGACTGGCGGCACCCTATTACTGTGGCAAGTATTATACGGGTGCACAAAATGCATCAACgtcacatcagcaacagcaacagcaacacccgcagcaacaacaacaacaattgcaacatcaTGCGCAACAGCAGGTCAACTACAAGCTGCAGGATTGTCACATGGCCACCATGGAAATGCCATCACCTCATCAAAAAGCGAATACCAATGCATTACCCGCAACGGCTGCATTAAACTCATTGCTGCACCGTCAGACTAATCCGGATGCGACTGGTGCCATGTTCAGCACACCGATAAAGAGCGAGGTGAATGTAAAACTGGAGCGTAGTTATAGCAATTCCACAAGCGAATCTGGTTACAGTCTGCATGACAGCAGCTATAACAATTCGTATGGCAGTGATACCTCATTGCACGGTGGCGCTGGTTCAATGGGCGGTCCACAGGCCCATTCATCGACGCTAGATGATTCCGAGGATGCGTTGTGCTGTGTGCCGTTGTGCGGTGTGCGTAAGAGCACTAGTCCTACGCTGCAGTTTTTCACGTTTCCCAAGGATGAGAAATATCTACACCAGTGGCtgcataatttgaaaatgttccaTATACCAGCGTCAAGTTATGCGAATTTTCGCATTTGCAGCATGCATTTTCCCAAGCGCTGCATCAATCGATATTCGCTGTGCTATTGGGCTGTGCCTACTTTTAATTTGGGCCACGATGATGTTGccaatttatatcaaaatcgTGAGCTAACAAATACTTTTACCACCGGCGAGGTGGCACGCTGCAGCATGCCGAATTGCACCAGTCAAAGGGGTGAAAGTAATTTGAAGTTCTATAATTTCCCCAAGGATATCAAGAGTCTGATCAAGTGGTGCCAGAATGCACGTCTGCCCGTCCAGGCCAAGGAGCCGCGTCACTTCTGTAGTCGACACTTTGAGGAGCGCTGCATTGGCAAATTCCGACTGAAGCCCTGGGCTGTGCCTACATTGCATTTGGGCACACAGTATGGCAAGATTCATGACAATCCAAAGAATTTGTACGTGGAGGAGAAACGTTGCTGCCTTAATTTCTGTCGTCGCAGTCGCTCCTCGGACTTCAACATGTCACTCTATCGCTTTCCTCGAGATGAGGTCCTTCTGCGACGCTGGTGCTACAATCTGCGTCTCGATCCTGCCGTTTATCGTggcaaaaatcacaaaatatgCAGTGCACACTTCATCAAGGAGGCGCTGGGTCTACGCAAACTATCACCGGgTGCTGTGCCCACTTTGCATTTGGGTCACAATGATACGTTCAATATATATGAGAACGAACTGTGGCCACCGCCAACGCCTTCAACACCCGcccatcagcaacatcagcaacaagtgcaacagcaccaaatgcagcaacaacacactAATTATCTTAGTAGCAAATATCAACGTCATTCAATGGCTGCATCCACCTCCTCCTCAGCTAGCTCCGCGTCTCATTACGTAGATCCAGAGCTGAGCTCAGCCTACATGGGCATGGGTAGTGGCAGCTCAACTGGTCTCAATGTAAGCGACAGCATGGACATATGCTGTGTGCCGAGCTGCGAGAGCAAGCGACATAATAATGAGAACATTACATTCCACACGATACCCAGAAGACCGGAACAGATGAGCAAATGGTGTCACAATCTTAAGATACCCGAGGACAAGATGCACAAAGGCATGCGCATATGCAGTCTACACTTTGAACCGTATTGCATTGGTGGCTGTATGCGTCCGTTCGCAGTGCCCACGCTGCATCTGGGACACGATGATGAGGACATACATCGCAATCCGGATGTTATCAAGAAACTGAATATACGCGAAACGTGCTGTGTGGCGGTGTGCAAAAGGAATCGGGACCGAGACCATGCGAATTTGCATCGGTTCCCTAGTAATGTGGCACTACTGACCAAATGGTGCGCCAACCTGCAACGACCAGTGCCTGATGGGAGTAAACTGTTTAATGATGCCATCTGTGAGGTGCACTTTGAGGATCGCTGTTTGCGCAACAAGCGTCTGGAGAAATGGGCAGTGCCCACTTTAATTTTAGGCCATGAGAACATTGCGTATCCATTGCCTACGCCGGAGCAAGTTGCTGAATTCTATGCGAGACCCAGTGCACCCAATAATGGCGAGGAGCAGGGAGAGTGCTGCGTGGAGACATGCAAACGCAACCCCAGCGTGGATGATATTAAGCTCTATCGTCCGCCAGAGGATGCATCAGTGCTGGCCAAATGGAAGCATAATCTTGACGTGGATGCTGCACAATTATCCAATCTGCGCATATGCAATCTACACTTTGAACCCCATTGCATTGGCAAGCGTATGCGTCCGTGGGCTGTACCTACACTCAATTTGTCCGGCACTATTGAGAATCTGCACGAGAATCCTGAGCAACATATGATCTACAAACGTCGCAAACTGCATAATGCGAATCGTGGCGCTGATGGAGTGCGCGCTGCATCCATGGTGAAACCCACTTGGGTACCCCGCTGCTGTTTGCCGCATTGTCGCAAGGTGCGTGCATTGCACAATGTGCAGCTGTATCGCTTCCCTAAACTCAATCGTTCCACGCTAGCCAAATGGGCGCACAACCTCCAAGTGCCAATGGTTGGCAGTGCCCAGCGGCGACTCTGTTCTGCGCACTTTGAACCACATGTGCTTAGTAAAAAGTGTCCCGTACCGCTGGCTGTGCCGACGTTGGATCTCAATACACCAGCCGGATTAAAAATCTATCAAAATCCCGCCAAGCTCAAGGCCAATAAGTTATGCCTGCAACGCGTCTGCATTGTGGAGAGCTGCCGCCGCCAACGTGCGCCTGGCGTACATCTATTCCGGCTGCCGAATAGCCCAACGCAATTGCGGAAATGGATGCATAATATACGCATGCGTCCCCGAGGTTCCATGCGGCAGCAGTATCGCATCTGTTCGCTGCACTTTGAGACGCATTCGTTTAATGGAAAGCGATTGAGTGCTGGTGCCATACCCACGTTGGAGTTGggccatgatgatgatgatatttatCCAAATGAGGCGCAATCCTTTGTGGAGGAACACTGCGCTGTGGAGGGCTGCGATGCGTCAAAGGAGCAGCCGGAGGTGCGTGTCTTTAGATTCCCCACCGATGACGATGATATGCTGTGGAAATGGTGCAACAATCTCAAAATGAATCCCGTTGATTGCGTCGGAGTGCGCATCTGCAACAAACATTTCGAACCGGATTGTATTGGACCGAAACATCTTTTCAAGTGGGCAATACCTACGCTCGAGTTAGGCCACAACGATGATGAGATTGAGTTGATACCCAACCCTAAGCCAGAGGATCGCTACGTCGATCCTGTGTTCAAGTGTTGTGTGCCCAGCTGTGGTAAAACGCGTAGATTCGATGAGGTACAAATGAACAGCTTTCCCAAAGATCCAGTGCTCTTCCAGCGATGGCGCCACAACCTACGCCTAGAACATCTTAATTTCAAGGAACGCGATCGTTATAAGATCTGCAATGCGCACTTTGAGGATATCTGCATAGGGAAAACGCGTCTCAATATTGGCTCTATACCTACGCTAAATCTAGGCCATGATGATACCGAAGATCTCTATCAAGTGAATCCTGAGGAGCTGCAAAGCAACTTGTTTGGACGCCAGCGGCGACTACATGACTCCATGCTAGGTAACACCATTAAGCGGGAGGAGCACTCAGAGCTTGAAGAGGATGACATTAAACCTGATATCTCAGGCGATATTCTTGGTCAGCAGGTAAAAGTAAAGAAATCTCTGCAGGATTACAAGTGCTGTGTGCCAGGCTGCGGGCGTAGTCGCTTGGAGCATGGGGCACGTCTGTTTGCCTTTCCCAccggcaagcagcagcagctcaaatgGCGTCATAATTTACACCTGGAACCATCTGATGTGGACAAATCCAGTCTAGTGTGCAGTGTTCACTTTAATCGGCGTTGCATTGATGGCAAACAGCTACGTGGATGGGCTATACCCACACAACAATTGGGTCACGATGACCAGCCCATCTATGAGAATCCAAAGAATATACCCGGTTTCTTTACGCCCACGTGTGCTTTGGCGCATTGCCGTAAACGGCGCAGCATTGACAATGATTTGCGCACATATCGCTATCCTCGCAGTGAAGATTTGCTGGAGAAATGGCGTGTGAATTTGCGTTTGGCGCCGGATCAATGCCGTGGACGCATCTGTGCGGATCACTTTGAACCTATGGTGCGTGGCAAGCTGAAGCTTAAGACGGGAGCGGTGCCTACGTTAAAACTGGGACATGAAGAGGGTGTGGTCTTTGACAATGAAGCTATTAAGGCAGGTCTGCAGCCGGATGAGGAGGCAGAGGATGGTGATCACAGGCAGCAGCTATTGGTGAAGGTGAAAAAGGAGCGACTTGACGAGGAACAggacgaagatgaagaagagcAGCTAAACCAGCGACAGCCAAAGGAAGAGCGTCTAAATGAAGAGGAACAGCAAGATCCCGACGAAGACGACCATGGCTATTTTGATCCGCTCGAACTGGTTGAAACCTATGCCGAACAGCACAGCGAAGACAACACGCCAGCTGATATGAATGATGACGATCCTGACGATGATGACGCAGATCTATCGGGCAACGACGATGAACTGTTATTGCCGGATACGCCACCAGTGAAAGTTTTACCTCCGCTACCGCTGCCACGCATGCCACCAGCACGTCGAACAGTGAACAATGTGGCGCCCATATGTTGCTTGAAACATTGCAGAAAAGAGCGCACTGCTACTTATCAGCTGAGCACATTTGGGTTTCCCAAGGATCAGGAGCAGCTGCACAAATGGAGCGCCAATCTACAGCTATCGCTGGAGGATTGCGTTGGCCGTGTATGCATTGAGCACTTTGAATCGGAAATGCTGGGCACGCGCAAGCTGAAACAGCATGCAGTGCCCACTTTGAATCTGGGCCATGACACGCCGCTTAGCTACACTTGCAACGGTTTAACTGCGAACATTTATGATGCACAGCCGCAGCATTCGGTTTTTCGGCTTTGGAGCCTAAAACATTGCCGCAAAAGGAAGATGCAGCAGATACGGAAGCTGacacagaagcagcagatacagaagcaacagagacagaagcatcagcagcagctagcGATAGTTGAACAGGAGAAAGAGCTAAGTCcaaactgctgctgtttgcccAACTGTGGCAAGCAGCCGGAGCTGCACGACGTAAAGCTTTACAGATTTCCCACAGATGGTGTACTGCAACGCAAATGGTTGTACAATCTAAAGCTTACATCCATCCAGCTGAATCTCAGCCAGGCACGCCTTTGTAGTGAACATTTTGAGCCTAATTTGGAGCTGGAGTTGCAGCGTGGCACAGCGCTGCCCACATTGAAGTTAGGCCATGACGACACTAGCATCTATTTGCAGCGTAATACTAACATATCGACGTCCTGTCTGGTGCCTAGTTGCCCGTGTGCCCGCTTAAATCTTTATCGTTGCTATCGACTGCCGCAGCATACGCTCGTGCAGCAAGCTTGGTTGCAATGGTTACAGCTGCCCGATCCTCGTCTGGATAGCGACAAACAACTTTGTGTTATGCATTATATGCAGCTATATGAGCAGGTACCTCTGCCGCCGGATGTGCCAAGCGATGtgttgcaacagctgcagcagactTATGATCAAATCGCCAACTCCACCACGGCTATGAAATTGCGCTGCGCTGTACCTGGCtgttatagtaaatatattgatGATATACGGTTTATCGAGTTGCCAACCGACGCAGAGACCTGTGACAAATGGGTGCATAATACAAAGATAATGTACGAGCAGGAGCGGCATCCTAATTATCGCATATGTTTGCTGCACTTCGAACCGCACTGTTTGGGTGCAGTGCGTCCAAAGCCATGGGCCATGCCCACACTAATGCTCAACCACGATGATACGGATATTCATCTAAACCCCACAGACGAACCCCCTCTAAAAACTGAACCGCCGCAACCAACATCTCAACCGTTCAACCAGGCTTTGCGCATTAAAACCGAACGtggttgcagcagcagccccagcgCCAGTCCTGGTGCACGCAGCAAGTACATTTGCTGCATACCAGGCTGTGGACAGTTTGGCACATCAATGAACCGACTCTATCAATTTCCCACTGCGGAAAATGCACTGGTCAAGTGGCTGTTTAATACGCGGCAGCAGCCGCGACTTGTCGATGTGGAGCAGCTTAGCATTTGTGCGAATCACTTCGAACCCGAAGCCCTTTATCGCAAACAGTTGACTAGCTGGGCTGTACCTACGCTTAATTTGGGACATGACGGCCATATCATACCAAATGCCAAGCATAACGGAAATATAGCCGATAGCAATGAGAACAAACAAACGTTGCAATATATCTGGAAGAACTACTGCTCCGTGTTGACTTGCTTTCAGGCAGGCAGCGATACAGTGCGTTTGTTTCCGTATCCCACGGATCGTGCAATGGCGCGCAAATGGGCTGGCAACTGCAGGCATCGTTCCACGCTGGCCACCAGTGATGGCTATCAGGTTTGTCAAGCTCACTTTGGTGAGCACTGCTTTGATACGGAGACGGGTGAGCTGCTGGACAGTGCTATACCCACACTGGAGCGGAGTCGCTGCGTCGAAAGAATACGCTGTGTGGTAGATGAATGTGCGCGAGATGAGTACGGAATACGACGTCGATTGCTACGCATGCCCAAGCGATTCAGTAATCTGTCGGATTGGTGCCACAATTTGCAACTGGATCCGGCTGTTATTAGTGCTTCGGAACAGTCTCAATATGTGTGCGAGCGACACTTTGAGAGGGAGTGTCTCTACAAGTCAGGTCTACGTTCTGGATCAAAGCCTACATTGAATTTGGGCCATAATGCGGATATAAAACTACATCTAAATCCCTCTAATTGGGAATCTGAAACTGTAAAGGATGAAGTTCTGTTTTGCTGTGTGCCAAATTGTGGGCGCATGAAGAAGGACGAAGATAGAGAGCAAATGGAACCGGATCAAGTGCACGAACAGGAGCAAGTGCAGTTCCTTAGCTTTCCCAAACAAATTGCGTTTGCACAAAAATGGGCGTACAATATACGCCTCAATCTGAGTAAAGAGCAGCTCAGCTGCATGAAGATCTGCAGCGTACACTTTTTGCCGGACTGTATGGCCGCAAATGGAAGACCTCGCCTTGGTGCTATGCCTACGCTTGAGTTAGGCCACGACGATCTGAACGATGTGTATCGTACAGGAGAGGGTAATCCCACCAGATTGAAAGGTTTCCTCAATCGCAATGGGTCTATTTTCGAGTGTTGTTATCCACAGTGCACAGAGCTAAAGAAGAGTTATCTGAGAATTAACTATGATCTGCCTAAAACGGATGCACTGCGTCGCAAATGGATAGAAAACATGGAGATTGAGGATCAAGAATCTCTGAAACTCTGCCCGTTTCACTTGGTCATCATGTACGACTACAGTTTGGAGCATTTCGAAGAGCATCAGCCCGAAGAGCTGCTCGATCAGAGCTATGAACACTGCAGGAATAGCGTTCGTCTGCGCACGATTGGCTGTGCTGTGCGCGGCTGTCGTTATCTGCAGCCACGAGATGGCGGACCAAGACACTGTCTGCCGACTCGTCAAGATCTTCGTGATCTTTGGATTCATAATCTACAGTGGGTCACCCAAGAGCAGTACGATTATACGTACAAAGTCTGCAGTAAACACTTTGAGGCACATTGCTTTGTAGACATGTCACCACGTCTCAAGCCGTGGAGCATACCAACACTGGAATTGCCAGAATTGCCGGATGATAAACCGCTTCACAAGTGCCTCACCGAAGCAGAATGGCACCACATGACGGAGATATGGACAGTGAAACAGAAAGAGCTGCAAATGGCAAAGGCACTGGAACAGTCTGATGAACCTGTGGTTATGCTAGAGAAGGATGACGATCTGCTGGTAGATCCAGACATTGAAAGGCAACAATCACCAACACTGGAAGAAGAGGAGCCGCTGGCATATGACGAGAACAGCTCGCAACAGCCTCTTGAAATGGGAGAACTGGATGTGCAGCTGGAGGTGTCGCACGTTGAAAAAATGTACTCCTATGAAACCACAGGAAAACGTCTGGGTCCAATCCCTTGCTATACTGAACCTGAatcgccaccaccaccagcgcaCTCTACAAAAGAAAGATGCGCCAATACAACCATGTCAGCCACCAATGGTCGCGCTAGGTACAATGCGAGGCACTGCAGCGTGTATGGTTGTAAAGTAACCATAAATGATATATGCGAAAATGTGAAGCTGCACAAGTTTCCCACATCACTGGATGCCATGCGCAAATGGATGCACAATACACAGGTTGAGGTGAATCTCAGTGTGTCTTGGCGGTTTCGTATATGCAGCTATCATTTCGAGCAGGACTGTTTCAATGGTTCACGGATTCGACGTGGCGCTATGCCCACGCTCCAACTAGGTTCCAGACGTCCTCCTGATATCTACGacaatgaatttttgaattgcaaTGAATCGGAGCAGCAGATCGGAGGAACGCCAGCCATAAAGCACGACGGCAATATACGCTTGTGTATACCAGAACCAGCAGCACCGCGCAAATCGAGTATGGTCTGCCAGATCGATGGCTGTAACAATCATATGACTGGCGACAATCTAACGCTGCACAAGTTTCCACATTCGCCAGAGATGTGCGCCAAGTGGCAGCATAATACGCAGGTGCCATTCGATCCAGATTTTCGTTGGCGATATCGCATCTGCAGCGTACACTTTGAGCCAATGTGTCTAGTAAATATGCGTCTTATGCATGGCAGTGTGCCTACGCTGCATTTGGGTCCAAGTGCTCCACTCCAACTGTTTGATAACAACATCGAGGCATTCAGCGCACgtttggaaaaacaaaagtccACGCCCGAGAGTCAGTTGCTAATTAAACAGGAAAAACTGAAGCAGGAGGAGCTAGAGGATGAGGATTATGATATGGATTTGGACGAGCAGCAAGATGGGCTAAGTCTGCTGGAACCAGAGATGCAACTGCACGAGGATGCAGAACGGTCGGCAGATCAACAAGTGGAGCAAAATTggaagcaattgcaattgcaaagcATTGGGCAAGATCA
Protein Sequence: MSQHNNPPQPPHLQHHHHHHYYQQQPQEQQQQQQHHYQQQQQQQQQHQQQLQHKQIQQQQQHHSWYSHVASYPAHHQAHAAAAFAAPCKTNNNNNASSSNSNNNNNIMNTAYGAAAAGTSAYYGSPVAVAAASAASPGGGVGYNLEANTVAYAHNQLLQYQQQQQQQQHQQHQQQQQQQLGQRTSYMSHGLMHSSYPYIKSEPLELPDDRIARQQQQQQQQHQQQQQQLQQQQQQHYQNPMAPPPAPAATNRHTHDVGGDMIIKSEPVDEHAYKSNYIDDNTPFADFSKYPDFGDGMLSPKVELNVKDEAYGSVKNPLCYPRRKLQSDRSTENLPICQRCKEVFFKKHVYLSHVAESSCTIHEYEFKCNICPMSFMSTEELQKHKQLHRVDKFFCHKYCGKYFDTIAECESHEYMQHDYESYVCNMCSMTFATREQLYAHLPQHKFQQRYDCPICRLWYQTPLELHEHRLAAPYYCGKYYTGAQNASTSHQQQQQQHPQQQQQQLQHHAQQQVNYKLQDCHMATMEMPSPHQKANTNALPATAALNSLLHRQTNPDATGAMFSTPIKSEVNVKLERSYSNSTSESGYSLHDSSYNNSYGSDTSLHGGAGSMGGPQAHSSTLDDSEDALCCVPLCGVRKSTSPTLQFFTFPKDEKYLHQWLHNLKMFHIPASSYANFRICSMHFPKRCINRYSLCYWAVPTFNLGHDDVANLYQNRELTNTFTTGEVARCSMPNCTSQRGESNLKFYNFPKDIKSLIKWCQNARLPVQAKEPRHFCSRHFEERCIGKFRLKPWAVPTLHLGTQYGKIHDNPKNLYVEEKRCCLNFCRRSRSSDFNMSLYRFPRDEVLLRRWCYNLRLDPAVYRGKNHKICSAHFIKEALGLRKLSPGAVPTLHLGHNDTFNIYENELWPPPTPSTPAHQQHQQQVQQHQMQQQHTNYLSSKYQRHSMAASTSSSASSASHYVDPELSSAYMGMGSGSSTGLNVSDSMDICCVPSCESKRHNNENITFHTIPRRPEQMSKWCHNLKIPEDKMHKGMRICSLHFEPYCIGGCMRPFAVPTLHLGHDDEDIHRNPDVIKKLNIRETCCVAVCKRNRDRDHANLHRFPSNVALLTKWCANLQRPVPDGSKLFNDAICEVHFEDRCLRNKRLEKWAVPTLILGHENIAYPLPTPEQVAEFYARPSAPNNGEEQGECCVETCKRNPSVDDIKLYRPPEDASVLAKWKHNLDVDAAQLSNLRICNLHFEPHCIGKRMRPWAVPTLNLSGTIENLHENPEQHMIYKRRKLHNANRGADGVRAASMVKPTWVPRCCLPHCRKVRALHNVQLYRFPKLNRSTLAKWAHNLQVPMVGSAQRRLCSAHFEPHVLSKKCPVPLAVPTLDLNTPAGLKIYQNPAKLKANKLCLQRVCIVESCRRQRAPGVHLFRLPNSPTQLRKWMHNIRMRPRGSMRQQYRICSLHFETHSFNGKRLSAGAIPTLELGHDDDDIYPNEAQSFVEEHCAVEGCDASKEQPEVRVFRFPTDDDDMLWKWCNNLKMNPVDCVGVRICNKHFEPDCIGPKHLFKWAIPTLELGHNDDEIELIPNPKPEDRYVDPVFKCCVPSCGKTRRFDEVQMNSFPKDPVLFQRWRHNLRLEHLNFKERDRYKICNAHFEDICIGKTRLNIGSIPTLNLGHDDTEDLYQVNPEELQSNLFGRQRRLHDSMLGNTIKREEHSELEEDDIKPDISGDILGQQVKVKKSLQDYKCCVPGCGRSRLEHGARLFAFPTGKQQQLKWRHNLHLEPSDVDKSSLVCSVHFNRRCIDGKQLRGWAIPTQQLGHDDQPIYENPKNIPGFFTPTCALAHCRKRRSIDNDLRTYRYPRSEDLLEKWRVNLRLAPDQCRGRICADHFEPMVRGKLKLKTGAVPTLKLGHEEGVVFDNEAIKAGLQPDEEAEDGDHRQQLLVKVKKERLDEEQDEDEEEQLNQRQPKEERLNEEEQQDPDEDDHGYFDPLELVETYAEQHSEDNTPADMNDDDPDDDDADLSGNDDELLLPDTPPVKVLPPLPLPRMPPARRTVNNVAPICCLKHCRKERTATYQLSTFGFPKDQEQLHKWSANLQLSLEDCVGRVCIEHFESEMLGTRKLKQHAVPTLNLGHDTPLSYTCNGLTANIYDAQPQHSVFRLWSLKHCRKRKMQQIRKLTQKQQIQKQQRQKHQQQLAIVEQEKELSPNCCCLPNCGKQPELHDVKLYRFPTDGVLQRKWLYNLKLTSIQLNLSQARLCSEHFEPNLELELQRGTALPTLKLGHDDTSIYLQRNTNISTSCLVPSCPCARLNLYRCYRLPQHTLVQQAWLQWLQLPDPRLDSDKQLCVMHYMQLYEQVPLPPDVPSDVLQQLQQTYDQIANSTTAMKLRCAVPGCYSKYIDDIRFIELPTDAETCDKWVHNTKIMYEQERHPNYRICLLHFEPHCLGAVRPKPWAMPTLMLNHDDTDIHLNPTDEPPLKTEPPQPTSQPFNQALRIKTERGCSSSPSASPGARSKYICCIPGCGQFGTSMNRLYQFPTAENALVKWLFNTRQQPRLVDVEQLSICANHFEPEALYRKQLTSWAVPTLNLGHDGHIIPNAKHNGNIADSNENKQTLQYIWKNYCSVLTCFQAGSDTVRLFPYPTDRAMARKWAGNCRHRSTLATSDGYQVCQAHFGEHCFDTETGELLDSAIPTLERSRCVERIRCVVDECARDEYGIRRRLLRMPKRFSNLSDWCHNLQLDPAVISASEQSQYVCERHFERECLYKSGLRSGSKPTLNLGHNADIKLHLNPSNWESETVKDEVLFCCVPNCGRMKKDEDREQMEPDQVHEQEQVQFLSFPKQIAFAQKWAYNIRLNLSKEQLSCMKICSVHFLPDCMAANGRPRLGAMPTLELGHDDLNDVYRTGEGNPTRLKGFLNRNGSIFECCYPQCTELKKSYLRINYDLPKTDALRRKWIENMEIEDQESLKLCPFHLVIMYDYSLEHFEEHQPEELLDQSYEHCRNSVRLRTIGCAVRGCRYLQPRDGGPRHCLPTRQDLRDLWIHNLQWVTQEQYDYTYKVCSKHFEAHCFVDMSPRLKPWSIPTLELPELPDDKPLHKCLTEAEWHHMTEIWTVKQKELQMAKALEQSDEPVVMLEKDDDLLVDPDIERQQSPTLEEEEPLAYDENSSQQPLEMGELDVQLEVSHVEKMYSYETTGKRLGPIPCYTEPESPPPPAHSTKERCANTTMSATNGRARYNARHCSVYGCKVTINDICENVKLHKFPTSLDAMRKWMHNTQVEVNLSVSWRFRICSYHFEQDCFNGSRIRRGAMPTLQLGSRRPPDIYDNEFLNCNESEQQIGGTPAIKHDGNIRLCIPEPAAPRKSSMVCQIDGCNNHMTGDNLTLHKFPHSPEMCAKWQHNTQVPFDPDFRWRYRICSVHFEPMCLVNMRLMHGSVPTLHLGPSAPLQLFDNNIEAFSARLEKQKSTPESQLLIKQEKLKQEELEDEDYDMDLDEQQDGLSLLEPEMQLHEDAERSADQQVEQNWKQLQLQSIGQD

Similar Transcription Factors

Sequence clustering based on sequence similarity using MMseqs2

100% Identity: -
90% Identity: -
80% Identity: -