Basic Information

Insect: Cacoxenus indagator
Gene Symbol: -
Assembly: GCA_035041755.1
Location: JAWNKX010000180.1:423146-440721[-]

Transcription Factor Domain

TF Family: THAP
Domain: THAP domain
PFAM: PF05485
TF Group: Zinc-Coordinating Group
Description: The THAP domain is a putative DNA-binding domain (DBD) and probably also binds a zinc ion. It features the conserved C2CH architecture (consensus sequence: Cys - 2-4 residues - Cys - 35-50 residues - Cys - 2 residues - His). Other universal features include the location of the domain at the N-termini of proteins, its size of about 90 residues, a C-terminal AVPTIF box and several other conserved residues. Orthologues of the human THAP domain have been identified in other vertebrates and probably worms and flies, but not in other eukaryotes or any prokaryotes [1].
Hmmscan Out: # of c-Evalue i-Evalue score bias hmm coord from hmm coord to ali coord from ali coord to env coord from env coord to acc

1 30 1.5e-15 4.1e-12 46.9 3.3 1 86 544 616 544 617 0.86

2 30 1.1e-14 2.8e-11 44.2 3.2 1 87 644 713 644 713 0.83

3 30 1.8e-16 4.7e-13 49.9 0.2 1 87 735 807 735 807 0.85

4 30 4.3e-17 1.1e-13 51.9 3.4 1 86 887 956 887 957 0.82

5 30 3.9e-14 1e-10 42.4 6.1 1 87 981 1053 981 1053 0.81

6 30 2e-13 5.2e-10 40.2 0.5 1 87 1088 1156 1088 1156 0.80

7 30 7.5e-11 2e-07 31.9 2.9 1 86 1198 1267 1198 1273 0.76

8 30 6.5e-17 1.7e-13 51.3 1.4 1 87 1295 1365 1295 1365 0.81

9 30 4.1e-13 1.1e-09 39.1 1.7 1 86 1386 1455 1386 1456 0.81

10 30 5.1e-15 1.4e-11 45.3 2.1 1 87 1483 1555 1483 1555 0.83

11 30 1.4e-13 3.8e-10 40.6 3.4 1 87 1654 1724 1654 1724 0.82

12 30 2.2e-12 5.7e-09 36.8 0.3 1 87 1746 1814 1746 1814 0.82

13 30 1.2e-14 3.2e-11 44.0 2.0 1 87 1912 1981 1912 1981 0.81

14 30 3.4 8.9e+03 -2.2 0.0 75 86 1989 2000 1984 2001 0.83

15 30 3.5e-11 9.3e-08 33.0 2.1 1 86 2036 2106 2036 2107 0.77

16 30 1.8e-14 4.8e-11 43.5 0.2 1 86 2139 2208 2139 2209 0.81

17 30 1.3e-15 3.3e-12 47.2 1.0 1 87 2233 2304 2233 2304 0.83

18 30 4.6e-05 0.12 13.4 0.4 1 79 2343 2409 2343 2413 0.73

19 30 3.8e-14 9.9e-11 42.5 0.2 1 86 2437 2508 2437 2509 0.79

20 30 9.4e-13 2.5e-09 38.0 2.1 1 87 2526 2596 2526 2596 0.78

21 30 2.5e-14 6.6e-11 43.0 5.0 1 87 2743 2814 2743 2814 0.80

22 30 1.6e-13 4.3e-10 40.4 2.9 1 86 2873 2943 2873 2944 0.79

23 30 7.1e-13 1.9e-09 38.4 2.2 1 86 3029 3099 3029 3100 0.80

24 30 9.5e-16 2.5e-12 47.6 0.0 1 87 3147 3224 3147 3224 0.83

25 30 1.4e-15 3.8e-12 47.0 3.4 1 87 3268 3339 3268 3339 0.84

26 30 3.9e-14 1e-10 42.4 0.5 1 87 3419 3489 3419 3489 0.82

27 30 7.7e-13 2e-09 38.3 0.1 1 87 3577 3647 3577 3647 0.85

28 30 2e-14 5.4e-11 43.3 1.4 1 86 3672 3746 3672 3747 0.78

29 30 8.4e-14 2.2e-10 41.4 0.1 1 86 3764 3832 3764 3833 0.82

30 30 8e-12 2.1e-08 35.0 3.5 1 87 3843 3911 3843 3911 0.85

#	of	c-Evalue	i-Evalue	score	bias	hmm coord from	hmm coord to	ali coord from	ali coord to	env coord from	env coord to	acc
1	30	1.5e-15	4.1e-12	46.9	3.3	1	86	544	616	544	617	0.86
2	30	1.1e-14	2.8e-11	44.2	3.2	1	87	644	713	644	713	0.83
3	30	1.8e-16	4.7e-13	49.9	0.2	1	87	735	807	735	807	0.85
4	30	4.3e-17	1.1e-13	51.9	3.4	1	86	887	956	887	957	0.82
5	30	3.9e-14	1e-10	42.4	6.1	1	87	981	1053	981	1053	0.81
6	30	2e-13	5.2e-10	40.2	0.5	1	87	1088	1156	1088	1156	0.80
7	30	7.5e-11	2e-07	31.9	2.9	1	86	1198	1267	1198	1273	0.76
8	30	6.5e-17	1.7e-13	51.3	1.4	1	87	1295	1365	1295	1365	0.81
9	30	4.1e-13	1.1e-09	39.1	1.7	1	86	1386	1455	1386	1456	0.81
10	30	5.1e-15	1.4e-11	45.3	2.1	1	87	1483	1555	1483	1555	0.83
11	30	1.4e-13	3.8e-10	40.6	3.4	1	87	1654	1724	1654	1724	0.82
12	30	2.2e-12	5.7e-09	36.8	0.3	1	87	1746	1814	1746	1814	0.82
13	30	1.2e-14	3.2e-11	44.0	2.0	1	87	1912	1981	1912	1981	0.81
14	30	3.4	8.9e+03	-2.2	0.0	75	86	1989	2000	1984	2001	0.83
15	30	3.5e-11	9.3e-08	33.0	2.1	1	86	2036	2106	2036	2107	0.77
16	30	1.8e-14	4.8e-11	43.5	0.2	1	86	2139	2208	2139	2209	0.81
17	30	1.3e-15	3.3e-12	47.2	1.0	1	87	2233	2304	2233	2304	0.83
18	30	4.6e-05	0.12	13.4	0.4	1	79	2343	2409	2343	2413	0.73
19	30	3.8e-14	9.9e-11	42.5	0.2	1	86	2437	2508	2437	2509	0.79
20	30	9.4e-13	2.5e-09	38.0	2.1	1	87	2526	2596	2526	2596	0.78
21	30	2.5e-14	6.6e-11	43.0	5.0	1	87	2743	2814	2743	2814	0.80
22	30	1.6e-13	4.3e-10	40.4	2.9	1	86	2873	2943	2873	2944	0.79
23	30	7.1e-13	1.9e-09	38.4	2.2	1	86	3029	3099	3029	3100	0.80
24	30	9.5e-16	2.5e-12	47.6	0.0	1	87	3147	3224	3147	3224	0.83
25	30	1.4e-15	3.8e-12	47.0	3.4	1	87	3268	3339	3268	3339	0.84
26	30	3.9e-14	1e-10	42.4	0.5	1	87	3419	3489	3419	3489	0.82
27	30	7.7e-13	2e-09	38.3	0.1	1	87	3577	3647	3577	3647	0.85
28	30	2e-14	5.4e-11	43.3	1.4	1	86	3672	3746	3672	3747	0.78
29	30	8.4e-14	2.2e-10	41.4	0.1	1	86	3764	3832	3764	3833	0.82
30	30	8e-12	2.1e-08	35.0	3.5	1	87	3843	3911	3843	3911	0.85

Sequence Information

Coding Sequence: ATGTCACCAGAaagtcaaaacaaaacagagcAGAAACCATTAGTACAACATGAGTGGTACGCACATGTTGCTTCCTCCCACTCCCCCAATATGTCAACGCCGGCGAAGTTTGTCGGCAGAAGCAATAACGGCGACATTCACACGTACGGAAGCATCTACGAATCACGAAGCGTTGTTGGTTGCGGGGGTGATGGTGGAGGGGGGCCTGTCGCGAATAGATGGAGTTTTAACAGCGGGGATGGCAGTCATGGTATCGGCGGCGGTTGTATGTATGACCTTGAAATGCGCAGCGCCCCCAACTCGGAATACGCTCATAATCAGCTGCTGCAATATCAACAGAGGCAAGGTGGGCAAAGGCTGCAACATAACCCATTGGGAGCATCGACGCCACATCAAGACTACACGACTAGAAATGAAGACACTTCACAAAGAGAAATGAATCAACACAATCGTACGCTTCAGAACCCACAGATACGCCCGCCCATCGAAATCGACCCAGTCGATATTAAATcCGAACCTTCGGATGAGCACAATTATAAATCGGATTTTAATAACGAGGCCGCACCTTTTGCGGACTTTAATGACGAAATGTTGAATCCAAATATCGAGCTAACTAACAAGGAAGATAGTGCGGCCGATATACAGCAAAAGTCGTTCAATTTTCCACGCCGCAAACTGCAGACAGAGCGTTCGGAGACTTTGCCAATTTGCCAAAGGTGCAAGCAAGTTTTCTTCAAAAAGCAGGTCTATACAAATCATGTCGCCGAAAGCTCATGTGATATCGTCGAGTACGATTTTAAGTGCAGCATATGTCCAATGTCGTTTATGTGTATGGAAGACTTAGAGAAACATAATCAACTACATCGAGcaaataagtttttttgtcACAAGTTCTGTGGTAGATACTACGACACCATAGCAGATTGCGAAAGCCATGAGTACATGCATCACGAGTACCAGACATTTGTTTgtaatatttgttCGGGTACATTTTCAACGCGAGAACAACTTTTTTCGCATTTGCCGCTTCACAAGTTTCAGCAGCGCTTTGATTGTTGTGTCTGCCGTGTATGGTTTTCCACACCGCAGGAACTTCATGAACACCGTATAGCAGCACCCTACTTTTGTGGAAAGTATTACGAGTTGTCAGTGGTAGGgaatcaacagcagcagcgttcAAATTTTCTCAACCCTATGACTCCAAAGCTAAATATGCCTCAACAGAACAATTACAAACTCCAAGACTGTCGAATGGGTGTAATGGAAATGGCTTCACAGCAGCCTTTTCAGCCATTGGCCGTTGCCAATTCAACGGTTACAAGTTCCTTATTAAATCAAGGTGGTTTTTATCAGCAACCGACGAATTATAACAGCAGCAATTACTTTCCAGTACCATCTATTAAGACCGAAATAAAGACAGAGCCTGATTTTTATGCGAAGACCAATgattaccaacaacaacaaatgacatCGCAAACGTTTAGTGATTATACAAACGATTCTTTTTCGAGCTCACACAACTCATCGAGCTTCGCAAACGATTACAACGAAACGGGAAATTCGTCAGTACTTGGCCAACAAACCCAATCGGCGAATGCATCCACTCTGGATGAGTCCGAGGATGCGGTCTGTTGTGTTCCGCGTTGCGGTGTTCGCAAAAGTACGAGTCCGACTCTACAATTCTTCACATTCCCGAAGGATGAAAAATACTTACACCAGTGGCTGAGTAACCTAAAGATgttacacataccagcttttACCTATCTTAACTACCGCATATGCAGCTTACATTTTCCAAAACGTTGCATCAATCGCTATTCGTTATGCTACTGGGCTGTACCAACTTTTAACTTGGGCCATGATGATGTTGCTAATTTATATCAAAATCGAGAACTCACGAACACCTTTACAACCGGCGACGTGGCTCGCTGCAGCATGCCGAATTGTAAAAGTCAACGCGGCGAAAGTAATGTCAAGTTTTACAATTTTCCCAAAGATATCAAAAGTCTAATTAAGTGGTGCCAAAATGCTCGTCTTCCAGTTCAAGCTAAAGAGCCAAGGCACTTTTGTGGACTCCATTTTGAAGAGAGATGCATTGGTAAGTTCCGGCTAAAGCCGTGGGCGGTACCAACACTTAACTTGGGTACGCCGTTCGGCAAAATACACGACAATCCACAAAACCTTTATGTGGAAGAAAAAAGGTGTTGTTTACCTTTCTGTCGACGAAGTCGATCTTCCGATTTTAATATGTCACTCTATCGATTTCCGCGGGATGAGGTTCTCCTGCAGCGTTGGTGTTATAATCTTAGATTGGACCCCTCTGTTTATCGTggtaaaaatcataaaatttgcaGTGGGCACTTCATTAAAGAGGCACTGGGCTTAAGGAAACTATCGCCAGGTGCGGTACCTACCTTGAATTTAGGTCATAACGATACTTTTAATGTATATGAAAACGAACTCTATACCCCACCACCCCCACCACCAATACAGAAGGGGTATTACCGTCAAAATAATCCGTTACAGGCGTCTACATCGTCGACTTCATCAACATCGAGCAACTTTGGTTCTATATTCTTTGCCAATGAGACGAATTCGCCATTCTCAAGTGTCACCCATGGAAGTGTCCCGCCAAATATCACCGAATCGATGGATGTCTGCTGCGTGCCTGGTTGTGACAGTAAACGTAACAATTCTAGCGACATAACATTTCATACTATTCCTCGACGTCCGGAGCAGATGCAAAAGTGGTGTCACAACTTAAAAATGGCCGaaaataaaatgcacaaaGGCTTGCGTGTTTGCAGTTTGCATTTTGAACCTTACTGCATCGGTGGCTGTATGAGGCCGTTTGCGGTACCAACACTGAGATTGGGACATGACGAAgacaatatatacaaaaatccaGATGTCATAAAGAAGCTAAATATTCGTGAAACGTGTTGTGTTCAGATTTGTAAGCGTAACCGAGAGAGAGATCATGCCAATTTACATAGATTTCCATCGAATCCTGTTATGATGAAGAAATGGTGTGAAAATTTACACAAGCCTGTGCCGGATGGCTCTAGGCTTTTTAATGATGCTATTTGTGAAGTACATTTTGAGGATCGTTGTTTGAGAAACAAACGACTGGAGAAATGGTCAGTGCCCACATTGAATTTAGGTCATGACGACCTAGTGCATCTGCTACCAACTGAAACTGAAGTTGCAGAATTATATAGCAGACCAAGTGCTCCTAATAATGGGGAGGAGGAGGGCGAGTGCTGTGTGGAGACATGTAAACGAAATCCACAAGTTGATGACATCAAACTATATCGAACACCCGAAGACCCTGAACTACTTGCTAAATGGGCtaacaatttacaaattgAAGCAGAGGACTTGTCGCTTTTACGGATTTGCAATCTACATTTCGAATCGCACTGTATTGGAAAGCGTATGCACTCTTGGGCAATTCCTACTCTTAACCTGAGtacaaacattgaaaatttgtatgaGAATCCTGAACCAACAATAATAAGGAAGGAGAAAACAGTAAAACTACGTGGCGATATACATTCTTACTCACTGAAGCCAACTTGGGTTCCACGTTGCTGTCAACCACACTGTCGTAAAATGCGAGCCGTTCACAATGTTCAGCTTTTCAGATTTCCCAGCACTAACCGAACGATGCTCTCGAAATGGTGTCATAATCTACAAGTACCCCTCGTAGGCAGTGCACAACGGCGTGTGTGTTCAGTTCATTTTGATCCTAATATTCTAGGCAAAAAATGTCCAATTCCACACTCAGTACCCACCTTGGACTTGAATGCACCACCTGGATATAAAATTTATCAGAATCCTGCGCGACTTAAGGCTTCCAAAATATGTTTGCAGCGAATTTGTGTTGTAGAAAGTTGTCGCAAGAAACGTTCCGAAGGAGTTATACTATTTCGCTTTCCTAAGAATTATACCATGCTAAGGAAATGGCTACATAATATTAAGCAGCAGCCCAAGGGAACAATGCGTGCACAATGCAGGATTTGCTCGTCCCATTTTGAACCACATTCATTCCATGGCAAAAGGCTCAGCAACGGCGCCATACCAACTCTGAACTTGGGCCACAATGACGATGACATTTATCCCAACGAAGCGCAATCCTTTATTGATGAACAATGTACCGTTGTAGGTTGTGGTTCTTCAAAAGATATACCTGGAGTACGTTTATTCAGATTTCCAATGGATGACGAAGATAATCTTTGGAAATggtgtaataatttaaaaatgaatcCAATTGATTGCCAAGACGTACGCATCTGCCATAAACATTTTGAGCCCGAATGCATTGGACCGAAACATTTGTTCAAATGGGCTATACCGACCCTACAACTAGGTCATGATGACACAGACATTGAACTTATTCCGATCCCAAAGCTCGAAGATCGTTATGCTGATATAATATTCAAGTGTTGTGTACCAACCTGTGGAAAAACTCGAAAATATGATGAAGTTCAAATGAATAGTTTTCCAAAGGATCCCAAGCAGTTTGACAAATGGAAACACAATCTTAAGTTGGACTTTTTGGACTTTAAAGAACgtgataaatacaaaatatgtaaTGATCACTTTGAGGATATTTGCATTGCCAAGACACGACTCAATATTGGGTCTATACCCACACTTAACCTTGGACACAATGAAACAGAGAACCTATATAAGGTTAAACCCGAAAAACTACAAAGAAACTTATTTGGTAAGCATCGACCAGTGCTTGACTCTGCTACAAGTGAAGACAGTGATGTatacgaagaagaagacaCAAGTGAAATTAATGCCGAAGCCGTCAAGGAACTTTCGAATTCCGTTGACGATGATATCGATGATTCAGATAATTCGGAACTCCCAAGTGATCAACTTGTTAAGGACCCAGACTTGAATCTAACTCAAGCAAGGATGAAGAAATCGCTAGACATGTTAAAATGTTGCGTTCCTAGTTGCCGCAAAAGTCGCTTACAGCACGGTATCCAACTTTATAAATTTCCTAGCAGCACCATACAGTTAAAGAAGTGGCGCCACAACTTGCACTTGCCAGTGTCCATTATTAAGAGTCAATTAAGAATATGCAATTTACATTTCCATAAGCGCTGCATTGACGGCAAACAACTGCGTTCATGGGCAATGCCAACAATGAATTTAGGACACTCTGAGGCAATATACGAAAATCCGAAACATATACCAGGTTTCTTTCTGCCTGTGTGTGCGCTAAGTCACTGCCGCAAACGCCGCACCATTGACAATGATTTGCGCACATATCAATTCCCAAAAGGTCTTCTTCTAAAGAAATGGTGTGCCAACTTGCAACTAGAACCGGATAGATGCCGCGGACGCATTTGTGCAGAGCATTTTGAGCCAGAAGTACGAGGCAAACTAAAGTTGAGAACTGGTGCCGTGCCTACCCTTAATCTGGGGCAAAATAATGCCTTGGTATATAACAACGAAGCAATAAAGATATTGCAAAAAAGTAATGAAACTTATAGGATTCCTTCAGAGAAAATCGAAAATGAAATCGATCACGACATTGTTAAGTCAACTACGGAAGGCGAGGACGAGGACGAGGACGAGGAAGAGGATGATTTCTGTGATCCACTGAAATTTGTAGAAACTGTAGAGGAAAATGTGGAGCAATATGATAATGTTACcgtaaatgaattaatttttaaaaaagagaaACCGGCCAATAACGTGTCACCGATATGCTGCCTGAAACATTGCCGAAAGGAGAAGACTGCTCAACATCATCTGAGCACTTTTGGATTTCCAAAAAATCAAGAGCTCCTGTTAAAGTGGTGCgacaatttgaaattaaatccGGATGATTGCGTTGGCCGAGTTTGCATAGAGCATTTTGATCCAGAAGTCGTAGGCAGCAGAAAATTAAGGCAAGGAGCCGTTCCGACTATAAACGTCGGCCATGACGAACCGCTTCGACAAGAACTTCGCCCTTGGGCCTTACCCACAATTTCCTTGGCTCACGATGACGTGGTTATACAAAATGCTGAACACCTGGGTGACTTCCACAGCGAGGAACATGAGAGTAAAGATATGCAATACATCCGTAGTAATTATTGTGCTCTGCTGTGCTGTTTTAAGAAGCGTAGCGATGCACATCGACTTTATCAGTACCCTAGTGACATGGCGCTCATTCGAAAGTGGGCTTTTAACTGTAAGCATCGATCATTTCACGccagcaattatggttttcaAGTTTGCCAGGACCACTTTGAAGAGGATTGCTTCGATCAAAGTGGAAATTTGCGAACAGGAGCAGTGCCTACCTTGAAGCTTGGATTTACCGATGGGCAGCATATTTTGCACAGTGAATGGGTGGAAACAAGACGCAAATACCAACCAATATCAACTAATTTGCGCTATAAGTGCGTAGCGCCCAATTGCGATTCGATTATGGGTGAAGGTATCCGGTTTTATAAATTTCCCAAATCCGCTGATACATTTGAAGTATGGTGCAAAAACTTAAAGCTGGACGACGAGATTGAAAGCAATATCATGTATTTATGCCAATTGCACTTTGAACAACACTGCTTTACTGATAATCAGCGACTCCACAAAGGGGCTTTACCCACTCTCATGTTAGGACATACACAGCAAGAAGATATTGTTAAAAATCCAGAGAGTTTTGAGCGGATAGTGATACCGCAATGTTGCGTGCCTGGCTGCggaaaaacaaaactgaatGATGGAGTCCAATTGAGTAGATTTCCGCGATTTCGAGGTCAATTTGAGAAATGGGCGCATAATCTGAAAATTCCAAACCAGGCTCACATTTGGCAGAACGGCAAAGTATGTAACAGGCACTTTGAACCCAACTGCTACGAATATGGACGACTTAAAACAGGTGCTTTTCCCACTTTGTTCTTGGGTCACGATGAGACCGATATACATTACACGAATGCGCTTACACttggaaagaaaaagaaagcaaacaaTCCATTTCCCCACCAACCCAATTTAACAAAAGTTGAATGGAAATGCTGTTTTCCTTCCTGCGAGGAAGTAAAACGTTTGAGAACAAATCAAGAATTCGATTTACCTTCGATTGAACCTCTACGAAAGCAATGGCGCGACTTAATGGGTTGTGAACACGACGACACTGACTTGAAACTTTGCCCGCTACACTATATTTTGAACTATGAGGCAACATTTGACATAATGCAAGAAATGAAACTTAAAGAGGATATGCATGATGCTCTCACAGAAATTGAGGAATCATATTATTCAGCAAAATCCAATTCTCGCATACTTATGATAACCTGTGTCGTGCCAACGTGCTCGTCCCTATTGCCAAGAGATAACTACAAGCTATACCCATTGCCACAAAACCTAGAAGTTTCACAGAAGTGGCTGGACAACATACCCGTGGAAGTTGATGAATCTCGGCTTTACGCCGTTAGAGTATGCTCTCAACACTTCGAAGACCGCTGCTTTGAGCAATCAAGGCGTTTAAAGGTGTGGGCTGTGCCTACACTTAGTCTTGGCGAAGGCAAGCTTTTACATGAAAATCCATTAAACGAAGAAAAATGCTGCATTCGAACTTGTGCAAATTCGCAGGATCAATTTGAAGTAAAGGATGCGCTTTATGTATTTCCCTGGGAATCAGACATCTTAAAGAAGTGGCTATACAATACCCAACGAAAAGCTCGAGATACTTTTGGAGCTCGTGTCTGTGCGCTGCATTTTGAAAAATGCTGCATTGGTAAACGTTTACGCCCTTGGGCTATTCCAACATTAAATTTGGGACATGACTTACCGGACATTTATCTAAATCCTGGTTTTGGTTCTAAGAGATCTCTATATATCAAAGTTAAAGAAGTTGAGAGCGAGGAAAGCCAGCTGAGTATTATAACTGATTTCAAAACGGAGACAACGGATAGTTCAACCTTCGAACCAATTGTAAAAATCGAACCTCCGGATGAATTTGGTACTGACTATCAAACTATAAAATCTGAACCTTCTTACGATGGCGAATACAACACATTTTATGGTGGAAACCCTTTAAATAATTCCAAGGACGTTGATGATCCTGTTCAAATGTCGTTAGAAGTGATGCTAGAAGTTGCTCATGTAGAAAAGTGTACAACTTACGAACAGCTGCATACATCCCAACCTAACACGCCCGTAAGTGAGCAATCACTGCCCAGCCCTTGTGAAAGGACTGCCAATGCTCGTCGTTGCTGTATCGCAGGCTGCACTGTCCGACACACGGATGCTGGCATTAAACTTCACAAATTCCCTCAGTCGAGAGATATGCTCAAGAAATGGATGCACAACGCGCAAGTTGAGGTTGATCTCCGTTGCCCATGGCGATACAGAATTTGTAGTCGCCACTTTGAATCGTGCTGTTTTAACGGACACCGCTTTCGATATGGCACGGTGCCAACATTACATTTGGGACCGAAGACGCCGAATAATATTTATGAGATCGAGTTTACAGTTCAGAATCTGTCACTTCGAGACACGCGGGCCGAGCGCGATGATAGTGATATCGATGCAAacatagaagaagaaaacgatGATAGTCGTAGTGAAAGCGAATCGATCATGTACAAATCTGGAAAATATTGTCAAGTAGAAGGATGCCGCAATCATCTTCATACAAAAGGCGTAACGATGCACAAATTTCCACAACAGCAAAGACTGTGGAAAAAATGGCAACACAATACCCAAATTCCAGTTGACATTAATTACCCGTGGCGGTTCCGCGTTTGCAGTGATCATTTCGACCGCGAATGTCTTCGAAATTCACGTCTTTTGTTTGGTAGCGTCCCAATGCTCAATTTGGGACCTAATGCACCAGAAGACCTCTATGATAATGAGTTTCGTGTGAGCAATCTGAATGTTGAGAAATTCGAAGAAAATCAATTAGACACCTTTGATGACGATTACGATGTGTCAATGGCTATAGAACCAGAAATTGAACTAAAATTAACTGACGAAAAGGAAGATGACATCGCTAATGAGAACAACGATAGTATCAACGATAATTCATTAagttttgaagaaaaaaaccccAGAGCTGCTATGAACAAATGCTGCATACCGGGTTGTACCATGAACAGGAGTATTCCTGGTGTTACACTTCACAAATACCCGAGTCCTCCGGAGTATCTTAAAAAGTGGCTTCACAACACACAGGTTAAAGTGGATCTAGCCTTCAGGTGGCGGTATCGTGTCTGTAATGTTCATTTCGAACGTGAGTGTTTCCGTGGGTCACGGATAAAATTCGGATGTGTGCCAACTTTGAAACTAGCCTCCAAGCCTCCAAGATTCACATATACTAGCGATGGTATTATGGAACTTAACGAATCTGTTAAACCTCCACAAAACGACATAGATGTTAAACCAACCATTTCATTTGAGGGTATTTCATTTAACAAATTACGCTGTTCGATATCAAGCTGTGGCCGTGTTTCTGGGCAGGATGGGGTATCACTGCATCGACTGCCTAAAGATGGACCATTCAGAGAAAAGTGGTTAATGCACTGTAGCattgatgaaaaaaattattataataaccTATATCCATTGCGCATTTGTAGCAGACACTTCGAGAGGAATTGTTTGAATGGACTACCCGGAAAGCGTTATTTGAAGCCTGGCGTAATGCCAACACTGCACTTACGGGGGACTGATGAGAGTAGTTCATCGAATGTATCAATCAAAAAAGAAGATCCAACCGCtaacaatggaaaaaatatacatgAGAAAGATTTCAAATACAACGATATTAAGTCGGGTTATGGAAAATGTTCCCTAATTCAttgtcaaaaacaaaagtcgCAACATGGAGTTCGAATATACAAATTTCCAAAATcgccacaacaacaagcaaagtgGACACACAACTTGCGCATACAGTACGATCCAGATCGTCCGTGGAAATATTTGATTTGCAGCGAGCATTTCGAAGAGCAATGCGCCAGCATACGAAAACTTTATAAATGGGCAGTGCCAACCCTTAATTTGGGTTATAATATTCCAAAAATACTGTACACAAACGAGGAGTGTAGACAGTTGTGTCAGGGGAATGAAAGTTCTGCAGAAGACAGTGATAATGAGGAAAAGCGTGAGGAAAGTCTGGAACTTTCAATGCCCAATAATCCTAGAGTTGAAGAGACTAAAGCTTTAGATCCGTTAAACATACCCAACCATTTATACCAGATGCCAACGAAGCAGGTATTttcttacaaaacaaaaatttgttgtctgCCGCATTGTCGCAGTCCTCGTGGTGACGGCATCAAGCTATTCCGTTTGCCGACTAGTGTACACTTAATTCGAAAGTGGGAACATAACACTGGCATCAGTTTCAATGAGTCTCAGCGCAATACAAAGCTCATTTGCAGCAAACATTTTCCATCATCACTGATTGGCATTCGGCGTCTATCTAAGAATGCAGTGCCAACATTGAACCTGGGACTCAGTGCACCAACAAACttgcacacaaacaacacgCTGGAAGATGAAATGGACGATGACAATGAAGTTCAGGAATCTGCTGATacagaacaacaaaacgaGTCCCGACTTCAATGCGATGACTCCATACTGTCTCAACAGATGACAAGCAGTGGATACAACTTGGAGCCAGTGATCAAAGAAGAACATGATGACTGGCCCCCATACGTGGACATGCAACCCCCATCGAAAAATATGActtataaacaacaacattgttgTGTACCGCATTGCGGTGCAGCGCGCACAGGCCATCTGAAGCTATTTCGAGTTCCCATAGATCCGATGCTCAGAGCGAAATGGGAGTTTAACTTACGCATGAAGTTCGATGTAAATGATCGCAACATTGACCTGGTCTGCAGTCGACATTTTCAGCCTCACTTAATTGGAGCTACTCGGCTGGCACGGGGCTCAGTGCCTACCTTAAATTTGAGACCTCTTAATACAAATCAACAGACGCAACAGTCAAATTTCGTACCAGACACTTCCGTCCTTATATTTTGTAACGTGCCAGGTTGCGATCGCACTAATGCCCATCAAGATATCGTAATGTTCAACTCCTTTAATAGGGAGCCGGATATCTTAAAAAAGTGGTGTGATAATTTGCAAATCGATGCCGACAATCCTACTATCCGAGAAGGAGGATACAACATATGCAGTGAGCACTTTGAGCAACATTGCTTTTCGACCAATTACAGACTTCACAAGTGGGCAGTACCTACACTACGCTTAGGCCAGGATCAATTTACAAATCAGAATTCTGATTCTGAGCAAGAATGTTGCGTACCGGATTGCCATAGAGTGACAGAAGAAGGCGTACGACTGTTTGGATTTCCGACTGAAACATTTCTCTTGAGGAAGTGGTGCATAGCTCTGCAACTCGATGAAGATGATACttacgaaaacaacaaaatatgcaGTGCACATTTTCCACCACACAGCTACAGTGGCTCAATTCTAAACCCAGGCGCTGTGCcatctttgttgttgcctaGTTCCCGCCAACAGAAACACTGCATTGTTCGGAATTGTCTGGGAAAAAACAAACTGTACAACTTTCCCGAGAATCGTAACACATGCGCCAAATGGAGTCACAATTTAAAGATCTTTCATTTCCCGAAAATACATTTACATAATGGCTATCGCGTTTGTGATAGACATTTCGAGGCGCGTTTTACTAATCAGAAAAGTCTACCTGCAGACGCTGTGCCCACTTTGCATTTGGACCACGATGACCCAAATATATTTCTAAACGAAATAAACTCTGATCTTGATTGCGGAGCTAGTAGCCGCTTTCAAACAGCTACGCACGAATATGAAATTACTGTCAAGCAGGAGCCTTTCGCGGTTGACGACTTTGACGAAAACACAAGTCAATCACAGTTCTGGAACATGCCAGATGACCCACTGATTTAA
Protein Sequence: MSPESQNKTEQKPLVQHEWYAHVASSHSPNMSTPAKFVGRSNNGDIHTYGSIYESRSVVGCGGDGGGGPVANRWSFNSGDGSHGIGGGCMYDLEMRSAPNSEYAHNQLLQYQQRQGGQRLQHNPLGASTPHQDYTTRNEDTSQREMNQHNRTLQNPQIRPPIEIDPVDIKSEPSDEHNYKSDFNNEAAPFADFNDEMLNPNIELTNKEDSAADIQQKSFNFPRRKLQTERSETLPICQRCKQVFFKKQVYTNHVAESSCDIVEYDFKCSICPMSFMCMEDLEKHNQLHRANKFFCHKFCGRYYDTIADCESHEYMHHEYQTFVCNICSGTFSTREQLFSHLPLHKFQQRFDCCVCRVWFSTPQELHEHRIAAPYFCGKYYELSVVGNQQQQRSNFLNPMTPKLNMPQQNNYKLQDCRMGVMEMASQQPFQPLAVANSTVTSSLLNQGGFYQQPTNYNSSNYFPVPSIKTEIKTEPDFYAKTNDYQQQQMTSQTFSDYTNDSFSSSHNSSSFANDYNETGNSSVLGQQTQSANASTLDESEDAVCCVPRCGVRKSTSPTLQFFTFPKDEKYLHQWLSNLKMLHIPAFTYLNYRICSLHFPKRCINRYSLCYWAVPTFNLGHDDVANLYQNRELTNTFTTGDVARCSMPNCKSQRGESNVKFYNFPKDIKSLIKWCQNARLPVQAKEPRHFCGLHFEERCIGKFRLKPWAVPTLNLGTPFGKIHDNPQNLYVEEKRCCLPFCRRSRSSDFNMSLYRFPRDEVLLQRWCYNLRLDPSVYRGKNHKICSGHFIKEALGLRKLSPGAVPTLNLGHNDTFNVYENELYTPPPPPPIQKGYYRQNNPLQASTSSTSSTSSNFGSIFFANETNSPFSSVTHGSVPPNITESMDVCCVPGCDSKRNNSSDITFHTIPRRPEQMQKWCHNLKMAENKMHKGLRVCSLHFEPYCIGGCMRPFAVPTLRLGHDEDNIYKNPDVIKKLNIRETCCVQICKRNRERDHANLHRFPSNPVMMKKWCENLHKPVPDGSRLFNDAICEVHFEDRCLRNKRLEKWSVPTLNLGHDDLVHLLPTETEVAELYSRPSAPNNGEEEGECCVETCKRNPQVDDIKLYRTPEDPELLAKWANNLQIEAEDLSLLRICNLHFESHCIGKRMHSWAIPTLNLSTNIENLYENPEPTIIRKEKTVKLRGDIHSYSLKPTWVPRCCQPHCRKMRAVHNVQLFRFPSTNRTMLSKWCHNLQVPLVGSAQRRVCSVHFDPNILGKKCPIPHSVPTLDLNAPPGYKIYQNPARLKASKICLQRICVVESCRKKRSEGVILFRFPKNYTMLRKWLHNIKQQPKGTMRAQCRICSSHFEPHSFHGKRLSNGAIPTLNLGHNDDDIYPNEAQSFIDEQCTVVGCGSSKDIPGVRLFRFPMDDEDNLWKWCNNLKMNPIDCQDVRICHKHFEPECIGPKHLFKWAIPTLQLGHDDTDIELIPIPKLEDRYADIIFKCCVPTCGKTRKYDEVQMNSFPKDPKQFDKWKHNLKLDFLDFKERDKYKICNDHFEDICIAKTRLNIGSIPTLNLGHNETENLYKVKPEKLQRNLFGKHRPVLDSATSEDSDVYEEEDTSEINAEAVKELSNSVDDDIDDSDNSELPSDQLVKDPDLNLTQARMKKSLDMLKCCVPSCRKSRLQHGIQLYKFPSSTIQLKKWRHNLHLPVSIIKSQLRICNLHFHKRCIDGKQLRSWAMPTMNLGHSEAIYENPKHIPGFFLPVCALSHCRKRRTIDNDLRTYQFPKGLLLKKWCANLQLEPDRCRGRICAEHFEPEVRGKLKLRTGAVPTLNLGQNNALVYNNEAIKILQKSNETYRIPSEKIENEIDHDIVKSTTEGEDEDEDEEEDDFCDPLKFVETVEENVEQYDNVTVNELIFKKEKPANNVSPICCLKHCRKEKTAQHHLSTFGFPKNQELLLKWCDNLKLNPDDCVGRVCIEHFDPEVVGSRKLRQGAVPTINVGHDEPLRQELRPWALPTISLAHDDVVIQNAEHLGDFHSEEHESKDMQYIRSNYCALLCCFKKRSDAHRLYQYPSDMALIRKWAFNCKHRSFHASNYGFQVCQDHFEEDCFDQSGNLRTGAVPTLKLGFTDGQHILHSEWVETRRKYQPISTNLRYKCVAPNCDSIMGEGIRFYKFPKSADTFEVWCKNLKLDDEIESNIMYLCQLHFEQHCFTDNQRLHKGALPTLMLGHTQQEDIVKNPESFERIVIPQCCVPGCGKTKLNDGVQLSRFPRFRGQFEKWAHNLKIPNQAHIWQNGKVCNRHFEPNCYEYGRLKTGAFPTLFLGHDETDIHYTNALTLGKKKKANNPFPHQPNLTKVEWKCCFPSCEEVKRLRTNQEFDLPSIEPLRKQWRDLMGCEHDDTDLKLCPLHYILNYEATFDIMQEMKLKEDMHDALTEIEESYYSAKSNSRILMITCVVPTCSSLLPRDNYKLYPLPQNLEVSQKWLDNIPVEVDESRLYAVRVCSQHFEDRCFEQSRRLKVWAVPTLSLGEGKLLHENPLNEEKCCIRTCANSQDQFEVKDALYVFPWESDILKKWLYNTQRKARDTFGARVCALHFEKCCIGKRLRPWAIPTLNLGHDLPDIYLNPGFGSKRSLYIKVKEVESEESQLSIITDFKTETTDSSTFEPIVKIEPPDEFGTDYQTIKSEPSYDGEYNTFYGGNPLNNSKDVDDPVQMSLEVMLEVAHVEKCTTYEQLHTSQPNTPVSEQSLPSPCERTANARRCCIAGCTVRHTDAGIKLHKFPQSRDMLKKWMHNAQVEVDLRCPWRYRICSRHFESCCFNGHRFRYGTVPTLHLGPKTPNNIYEIEFTVQNLSLRDTRAERDDSDIDANIEEENDDSRSESESIMYKSGKYCQVEGCRNHLHTKGVTMHKFPQQQRLWKKWQHNTQIPVDINYPWRFRVCSDHFDRECLRNSRLLFGSVPMLNLGPNAPEDLYDNEFRVSNLNVEKFEENQLDTFDDDYDVSMAIEPEIELKLTDEKEDDIANENNDSINDNSLSFEEKNPRAAMNKCCIPGCTMNRSIPGVTLHKYPSPPEYLKKWLHNTQVKVDLAFRWRYRVCNVHFERECFRGSRIKFGCVPTLKLASKPPRFTYTSDGIMELNESVKPPQNDIDVKPTISFEGISFNKLRCSISSCGRVSGQDGVSLHRLPKDGPFREKWLMHCSIDEKNYYNNLYPLRICSRHFERNCLNGLPGKRYLKPGVMPTLHLRGTDESSSSNVSIKKEDPTANNGKNIHEKDFKYNDIKSGYGKCSLIHCQKQKSQHGVRIYKFPKSPQQQAKWTHNLRIQYDPDRPWKYLICSEHFEEQCASIRKLYKWAVPTLNLGYNIPKILYTNEECRQLCQGNESSAEDSDNEEKREESLELSMPNNPRVEETKALDPLNIPNHLYQMPTKQVFSYKTKICCLPHCRSPRGDGIKLFRLPTSVHLIRKWEHNTGISFNESQRNTKLICSKHFPSSLIGIRRLSKNAVPTLNLGLSAPTNLHTNNTLEDEMDDDNEVQESADTEQQNESRLQCDDSILSQQMTSSGYNLEPVIKEEHDDWPPYVDMQPPSKNMTYKQQHCCVPHCGAARTGHLKLFRVPIDPMLRAKWEFNLRMKFDVNDRNIDLVCSRHFQPHLIGATRLARGSVPTLNLRPLNTNQQTQQSNFVPDTSVLIFCNVPGCDRTNAHQDIVMFNSFNREPDILKKWCDNLQIDADNPTIREGGYNICSEHFEQHCFSTNYRLHKWAVPTLRLGQDQFTNQNSDSEQECCVPDCHRVTEEGVRLFGFPTETFLLRKWCIALQLDEDDTYENNKICSAHFPPHSYSGSILNPGAVPSLLLPSSRQQKHCIVRNCLGKNKLYNFPENRNTCAKWSHNLKIFHFPKIHLHNGYRVCDRHFEARFTNQKSLPADAVPTLHLDHDDPNIFLNEINSDLDCGASSRFQTATHEYEITVKQEPFAVDDFDENTSQSQFWNMPDDPLI

Similar Transcription Factors

Sequence clustering based on sequence similarity using MMseqs2

100% Identity: -
90% Identity: -
80% Identity: -