Basic Information

Insect: Lordiphosa fenestrarum
Gene Symbol: -
Assembly: GCA_035044985.1
Location: JAWNNO010002308.1:108350-131380[-]

Transcription Factor Domain

TF Family: THAP
Domain: THAP domain
PFAM: PF05485
TF Group: Zinc-Coordinating Group
Description: The THAP domain is a putative DNA-binding domain (DBD) and probably also binds a zinc ion. It features the conserved C2CH architecture (consensus sequence: Cys - 2-4 residues - Cys - 35-50 residues - Cys - 2 residues - His). Other universal features include the location of the domain at the N-termini of proteins, its size of about 90 residues, a C-terminal AVPTIF box and several other conserved residues. Orthologues of the human THAP domain have been identified in other vertebrates and probably worms and flies, but not in other eukaryotes or any prokaryotes [1].
Hmmscan Out: # of c-Evalue i-Evalue score bias hmm coord from hmm coord to ali coord from ali coord to env coord from env coord to acc

1 30 10 2.3e+04 -6.1 2.3 27 45 23 41 9 53 0.47

2 30 4.2 9.6e+03 -2.2 2.1 49 63 299 317 280 333 0.58

3 30 4.5e-15 1e-11 45.8 4.6 1 86 533 605 533 606 0.86

4 30 1.3e-14 3.1e-11 44.2 5.0 1 87 633 702 633 702 0.83

5 30 1.2e-15 2.7e-12 47.6 0.2 1 87 724 796 724 796 0.85

6 30 8.3e-16 1.9e-12 48.1 5.9 1 87 894 964 894 964 0.81

7 30 8.6e-15 2e-11 44.8 3.3 1 86 988 1059 988 1060 0.82

8 30 2.7e-13 6.3e-10 40.0 1.0 1 87 1095 1163 1095 1163 0.80

9 30 2.8e-11 6.4e-08 33.6 2.0 1 86 1203 1272 1203 1273 0.78

10 30 1.8e-16 4.3e-13 50.2 0.4 1 86 1300 1369 1300 1370 0.82

11 30 2.1e-13 4.9e-10 40.4 1.3 1 86 1391 1460 1391 1461 0.80

12 30 3.9e-15 9e-12 45.9 0.8 1 86 1488 1559 1488 1560 0.85

13 30 1.1e-12 2.5e-09 38.1 2.8 1 85 1638 1706 1638 1708 0.82

14 30 1.5e-12 3.6e-09 37.6 0.1 1 86 1732 1800 1732 1801 0.83

15 30 1.4e-14 3.3e-11 44.1 0.7 1 87 1917 1986 1917 1986 0.80

16 30 9.4e-09 2.2e-05 25.5 0.1 1 86 2051 2117 2051 2118 0.81

17 30 8.2e-05 0.19 12.9 0.1 1 59 2138 2186 2138 2208 0.68

18 30 8.2e-14 1.9e-10 41.7 0.1 1 86 2219 2288 2219 2289 0.86

19 30 3.1e-14 7.2e-11 43.1 0.3 1 87 2348 2418 2348 2418 0.83

20 30 4.3e-11 1e-07 33.0 0.3 1 86 2453 2524 2453 2525 0.80

21 30 3.4e-13 7.8e-10 39.7 2.0 1 87 2535 2607 2535 2607 0.83

22 30 5.3e-12 1.2e-08 35.9 0.8 1 86 2633 2703 2633 2704 0.78

23 30 8.6e-07 0.002 19.2 0.2 1 58 2737 2787 2737 2806 0.82

24 30 6.9e-13 1.6e-09 38.7 0.6 1 87 2825 2897 2825 2897 0.83

25 30 1.1e-15 2.5e-12 47.8 0.6 1 87 3058 3131 3058 3131 0.84

26 30 6.1e-13 1.4e-09 38.9 2.7 1 86 3192 3262 3192 3263 0.80

27 30 9e-14 2.1e-10 41.6 5.3 1 86 3371 3441 3371 3442 0.84

28 30 4.8e-12 1.1e-08 36.1 0.3 1 86 3516 3585 3516 3586 0.84

29 30 3.8e-11 8.8e-08 33.2 1.0 1 58 3610 3658 3610 3674 0.86

30 30 1.4e-08 3.2e-05 24.9 1.1 18 87 3675 3733 3663 3733 0.75

#	of	c-Evalue	i-Evalue	score	bias	hmm coord from	hmm coord to	ali coord from	ali coord to	env coord from	env coord to	acc
1	30	10	2.3e+04	-6.1	2.3	27	45	23	41	9	53	0.47
2	30	4.2	9.6e+03	-2.2	2.1	49	63	299	317	280	333	0.58
3	30	4.5e-15	1e-11	45.8	4.6	1	86	533	605	533	606	0.86
4	30	1.3e-14	3.1e-11	44.2	5.0	1	87	633	702	633	702	0.83
5	30	1.2e-15	2.7e-12	47.6	0.2	1	87	724	796	724	796	0.85
6	30	8.3e-16	1.9e-12	48.1	5.9	1	87	894	964	894	964	0.81
7	30	8.6e-15	2e-11	44.8	3.3	1	86	988	1059	988	1060	0.82
8	30	2.7e-13	6.3e-10	40.0	1.0	1	87	1095	1163	1095	1163	0.80
9	30	2.8e-11	6.4e-08	33.6	2.0	1	86	1203	1272	1203	1273	0.78
10	30	1.8e-16	4.3e-13	50.2	0.4	1	86	1300	1369	1300	1370	0.82
11	30	2.1e-13	4.9e-10	40.4	1.3	1	86	1391	1460	1391	1461	0.80
12	30	3.9e-15	9e-12	45.9	0.8	1	86	1488	1559	1488	1560	0.85
13	30	1.1e-12	2.5e-09	38.1	2.8	1	85	1638	1706	1638	1708	0.82
14	30	1.5e-12	3.6e-09	37.6	0.1	1	86	1732	1800	1732	1801	0.83
15	30	1.4e-14	3.3e-11	44.1	0.7	1	87	1917	1986	1917	1986	0.80
16	30	9.4e-09	2.2e-05	25.5	0.1	1	86	2051	2117	2051	2118	0.81
17	30	8.2e-05	0.19	12.9	0.1	1	59	2138	2186	2138	2208	0.68
18	30	8.2e-14	1.9e-10	41.7	0.1	1	86	2219	2288	2219	2289	0.86
19	30	3.1e-14	7.2e-11	43.1	0.3	1	87	2348	2418	2348	2418	0.83
20	30	4.3e-11	1e-07	33.0	0.3	1	86	2453	2524	2453	2525	0.80
21	30	3.4e-13	7.8e-10	39.7	2.0	1	87	2535	2607	2535	2607	0.83
22	30	5.3e-12	1.2e-08	35.9	0.8	1	86	2633	2703	2633	2704	0.78
23	30	8.6e-07	0.002	19.2	0.2	1	58	2737	2787	2737	2806	0.82
24	30	6.9e-13	1.6e-09	38.7	0.6	1	87	2825	2897	2825	2897	0.83
25	30	1.1e-15	2.5e-12	47.8	0.6	1	87	3058	3131	3058	3131	0.84
26	30	6.1e-13	1.4e-09	38.9	2.7	1	86	3192	3262	3192	3263	0.80
27	30	9e-14	2.1e-10	41.6	5.3	1	86	3371	3441	3371	3442	0.84
28	30	4.8e-12	1.1e-08	36.1	0.3	1	86	3516	3585	3516	3586	0.84
29	30	3.8e-11	8.8e-08	33.2	1.0	1	58	3610	3658	3610	3674	0.86
30	30	1.4e-08	3.2e-05	24.9	1.1	18	87	3675	3733	3663	3733	0.75

Sequence Information

Coding Sequence: ATGTCACAGCATAATCCGCACTATCATCACTCCCATCCCTTACACTACCCACaacaccaccaacaacaacaacaacagcagcagcacctacaccaccagcagcagcagcaacaacagcagcagcagcataaacAAATGAATTGGTACTCACATGTTGCTTCCACCTCCTCGCCCAGCTCCCCCTACCCAGCGTCGGCggccaccaacaacaacaatcacatCTTGAATGCCTATGGAACACATGGATATTATGGAGCCGCTGGCGGCGGTCTCAATGTCAATGCCACGGGGGGTGTGAGCGGAGGGAGTTCAAACAGTTATAACCTAGACACGGCCAATACGGTGGCTTATGCCCACAACCAGCTGCTGCAatatcaacagcagcagcagcaacaacatctcAGTCAAAGATCTTATATGGGAGGACACCATGGCATATATCCCTATATAAAAAGCGAACCCGTGGAGTATGCCAATCCCATGGCTCCACCACCGGCTCCTTCAGAAATGAGAATTAAATCGGAACCCATTGACGAACATGCCTACAAGTCCAACTATATTGATGATAATACTCCCTTTGCTGATTTTAGTAAGTTTAATGAGTTCAGCGAGGACATGTTGAGTCCCAAAGTGGAATTAACCGTCAAAGATGATTCGTATGGAAAGAATCCCAATAATTATCCGAGGCGCAAAATGCAAACCGAACGCGCTGAGGAAAGTTTGCCGATTTGTCAACGCTGCAAAGaggttttctttaaaaagcaATCCTACCTACGTCATGTGGCCGAGAGCAGCTGCGGCATCCAGGAGTATGATTTCAAATGCAATATTTGTCCCATGTCCTTTATGAGTACGGAAGAGTTGCAAGCGCATAAACAACTGCATAGAGCGGACAAATTCTTTTGTCACAAATATTgtggcaaacattttgataCAATTGCCGAATGTGAATCGCATGAGTATATGCAGCATGAATACGATAGTTTTGTGTGTAATATGTGCTCGGGTACTTTTCCTACGCGTGAGCAGCTTTATAACCATTTGCCTCAACATAAGTTTCAACAGCGTTACGATTGTCCCATTTGTCGTTTGTGGTATCAAACGGCTGGAGAACTCCATGAACATCGTTTGGCGGCACCTTATTTCTGTGGCAAATATTATGCGGGAGCGCAGGCAGCAGCTGCAACTCAATCCCATCAATCACAGTCCCAGCAGCAATTACATCAAGCGAATTATAAACTGCAGGATTGCCATATGGCCACCATGGAAATGCCGACGCCTCCAGCGGCTGCAACCACATCCCATCACAAATCTAGCCCCTCCACTTCAGCATTACCGGCCACAGCAGCTTTAAGTTCCCTACTGCAGCAGCGCCAGGCTAATGCCGATGGAACCTCAATGTTTTCCTCTGCCCATAAAAATGAAGTCAATGTCAAGCTGGAGCGCAGTTATAGCAACTCCACCAGCGAGTCCTCATTCAGTATGCACGAATCGAACTACAACAATACCTACGCCAGCGATAACTCCATGCATGGTGGAGCCCTGGGTGGTCCCCAGGCTCATTCCTCAACACTGGATGACTCCGAGGATGCGCTATGTTGTGTTCCCCTCTGCGGAGTAAGGAAGAGCACTAGTCCCACACTACAGTTTTTCACCTTCCCCAAAGATGAGAAATACTTGCATCAATGGCTACACAACCTTAAGATGTTCCACATCCCAGCCTCTAGCTATACGACATTTCGCATCTGCAGCATGCATTTCCCCAAACGCTGCATTAATCGTTATTCGTTGTGCTATTGGGCAGTACCAACTTTCAATTTGGGACACGATGATGTGGCTAATCTTTATCAGAATCGCGAATTGACCAACACATTTACCACCGGTGAAATTGCACGCTGTAGCATGCCCCATTGCAGCAGTCAAAGGGGTGAAAGTAATctgaaattttataatttcccCAAGGACatcaaaagtttgatcaaatgGTGTCAGAATGCTCGCCTGCCTGTTCAGGCCAAGGAGCCGCGACACTTTTGTAGCCGTCACTTTGAGGAGCGTTGCATTGGCAAGTTTCGTCTAAAGCCCTGGGCAGTACCCACCTTGCATTTGGGAGCACATTATGGCAAAATACATGACAATCCCAAGAATTTGTACGTGGAGGAGAAGCGTTGTTGTCTCAACTTTTGCCGCCGCAGCCGCTCATCGGACTTTAACATGTCGCTATATCGTTTCCCGAGAGATGAGGTGTTGCTGCGACGCTGGTGTTACAATCTACGCCTGGATCCCGGTGTATATCGTGGCAAGAATCATAAAATATGCAGTGCTCACTTCATTAAGGAGGCATTGGGACTAAGGAAACTATCGCCAGGTGCCGTGCCTACCCTTCATTTGGGACACAACGATACCTTCAACATCTATGAGAACGAACTATGGCCACCACCTACGCCCAGTTCCACACCACACAAcaatcatcatcagcagcagcatctccatcatcagcaacaacattcTCATCATTCAGCTCAGCAGCACCACAGCAAATCATATCAACGTCATTCGGCAGCATCCACTTCCTCTTCGGCTAGTTCGGCATCGCATTACATGGACGCCGATATGAGTGGGTCATATCTCGGTATGGGCACTTCAACTGGCATGAACGTCACCGACAGCATGGACATTTGCTGTGTGCCCAGCTGTGAGAGCAAGCGCCACAACAACGAGAATATTACATTCCATACGATTCCCCGAAGGCCGGAGCAGATGAGGAAATGGTGTCACAATCTGAAGATACCCGAGGACAAAATGCACAAGGGCATGCGGATATGCAGTTTGCACTTTGAGTCCTATTGCATTGGCGGTTGTATGCGTCCCTTTGCGGTGCCCACTTTGCACTTGGGGCACGACGATGAGGATATACATCGTAATCCGGATGTGATCAAGAAGTTGAATATACGCGAAACCTgctgtgtggctgtgtgtaaGAGGAATCGTGACCGAGATCATGCAAATCTTCATAGATTCCCCAGCAATGTACCTCTCCTGACCAAATGGTGTGCGAATCTGCAGAGACCAGTGCCGGATGGCACTAAATTGTTCAACGATGCCATCTGTGAGGTGCATTTTGAGGATCGTTGTTTGCGAAATAAACGACTGGAGAAGTGGGCAGTACCTACTCTAATATTGGGTCATGAGGATATAGCCTACCAGTTGCCCACGCCCGAGGAAGTGGCCGAGTTCTTTGCCCGGCCCAGCGCACCCAATAACGGGGAAGAGCAGGGTGAATGCTGTGTGGAGAGTTGTAAACGTAATCCCAGTGTGGATGACATCAAACTGTATCGTCCACCCGAGGAAGCGGAGGTCTTAAGCAAATGGGCGCACAATCTGCAACTGGAAGTCTCCGAGTTGTCCAATTTAAGGATATGTAACTTACATTTCGAGTCCCATTGCATAGGCAAACGCATGCGGCCCTGGGCCATACCCACCCTGAATCTATCGGGTAATATTGAAAACCTCTACGAGAATCCCGAGCATACCATGTTGTACAAGCGACGAACCAGAGATCCAAATAGAGACTTAAGTGGTCTCAAGCCGACCTGGGTGCCCAGATGCTGTCTACCCCATTGCCGTAAGGTGAGAGCTTTGCACAACGTGCAGCTCTATCGATTCCCCAAGCTGAACCGTTCCACTTTGGCCAAATGGGCGCATAACTTGCAAGTGCCGATGGTGGGCAGTGCACAGAGACGTGTCTGTTCGGCTCACTTTGAACCGCATGTGTTGAGTAAAAAGTGTCCAGTTCCCATGGCGGTGCCCACTCTGGAGTTGAACTCTCCGCCGGGATATAAGATCTACCAGAACCCAGCCAAATTGAAAGCCAGCAAACTGTGCCTTCAAAGAGTGTGCATTGTGGAGAGCTGTCGAAAGACTCGTGCTCAGGGGGTACATCTGTTCCGTCTGCCCCATAGTCCCACGCAGCTAAGGAAATGGATGCATAACATTCGTACACGTCCGCGAACAGCCATGCGAGCTCAATACCGCATCTGCTCCGCACACTTCGAAACACACTCATTCAATGGCAAAAGATTAAGCGCTGGAGCGATACCCACACTGGAGTTGGGTCATCAGGATGACGATATCTATCCCAATGAAGCCCAATCCTTTGTGGAGGAGCACTGCGCCGTTGAGGGCTGTGACTCGACCAAGGAGCAAGCGGAAGTGCGTCTCTTCCGTTTCCCTACCGATGATGATGACTTGCTCTGGAAGTGGTGTAATAATCTCAAAATGAATCCAGTGGATTGTGTGGGCGTTCGAATATGTAACAAGCATTTCGAGACCGATTGTGTAGGGCCCAAACATCTATTTAAATGGGCCATACCTACCCTGGCCCTTGGCCATGATGATTCACAAATCGAGCTGATCCCCAATCCGAAGCCCGAAGATCGCTATGCGGATCCTTTGTTCAAATGTTGTGTACCCACTTGTGGCAAGACACGTAAGTTCGACGAGGTACAAATGAACAGTTTTCCCAAGGATCCCACACTGTTTCAACGTTGGCGCCATAATCTGCGACTGGACTACTTGGATTTCAAGGAACGTGAGCGCTATAAAATATGCAACGATCATTTCGAGGATATATGCGTGGGAAAGACACGTCTTAATATTGGATCCATTCCCACTTTGGAGTTGGGGCATGAGGAAACCGAGGATTTGTATCAAGTAAATCCCGCTGACTTGCAGAGTAATCTATTTGGACGCCAGCGTAGATTGCTAGGAGATAGCAaacaggaggaggaggaggctgaGGAAGATGAAGAGCATGCTGAACTTAGACCCCGTGTTAAGAAGGTCATGGAAGAAGCCACCGATCTAAACACCAAACAGGTGAAGATCAAAAAGTCTCTGTCTGAGCTGAAGTGCTGTGTGCGTAGCTGCGGTCGCAGTCGATTGGAGCACGGTGCTCGCTTGTTTCCCTTTCCTACGGgcaagcaacagcaactcaAATGGCGTCATAATCTTCAGCTGGAACCGCATGAGGTGAACAAAATGACACGGGTCTGCAGTGCCCATTTCAATAGACGTTGCATAGACGGTAAACATTTGAGAGGATGGGCTATGCCTACCCAGCAATTGGGACATAAAAAACATCAGAATATCTATGAGAATCCCAAGAATATACCTGGTTTCTTTACGCCCACCTGTGCTTTGGGTCACTGTAGGAAACGGCGCAGCATAGACAACGATTTGCGTACCTACCGTTATCCCAGGACAGAGGATTTGCTAGAGAAGTGGCGTGCCAACCTACGTTTGGCACCAGACCAGTGCAGGGGACGAATCTGTGCAGATCATTTTGAGCCTCAGGTGAGGGGAAAACTAAAATTGAAGACAGGAGCTGTGCCCACTTTAAAGTTGGGACACGACGAGGGTTTGGAATATGATAATGAGGCCATTAAGGCTGGTCTAAATGACGATGAGGAAGCCAGCTTGGACTCACCCCCAGTACAAGCCAAtaaggaggagcaggaggaagAAGATCAAGAAGAAGATGGGGAGGATGCGTCCGCAGAAATGCAGGATCCTGCCGCAGGCGAACAAGACGATGATCAAAGCGGCTATTTCGATCCTCTGGAACTGGTAGAGACATTTGCACATGACCATTCAGACCCCCCCGACGAGGACTCACCTGCAACACCTCCTCCATCGGCTGCTCCTCAATTGAGGCGGGATAAGCCCGCCAATAATGTCTCTCCCATCTGTTGTCTCAAGCATTGCCGCAAGGAACGCACTGCTCGGAATCTTCTAAGCACTTTTGGCTTTCCAAAAGATCAACAGCTGCTTTTGAAATGGTGCGCCAATCTGCAACTGGATCTGGACGACTGTATAGGTCGCGTGTGCATGGAACATTTCGAGGCGGAGGTCTTGGGCTCACGAAAACTCAAACAAAATGCCGTGCCTACTTTGAATGTGGGTCATGAATTGGATTTGCCCTACACCTGTAATGGTCAGGAGCGTTCCACAGAAGACCAGTCGGTTTTTCGGCTTTGGAGCCTGAAACATTGCCGTAAAAGGAAGCCAGAGGAGCCGCCAGATATGCCAGTAGTCAAACAGGAGAAGATGGAGGTGAAGGAGGAGCCGAAAGAGAGTAAACCAAAGATGTGTTGCCTCAGTCATTGTGGGAAATTGAAGCGCTTACAACGCTTACCCCAGGATCAGTTGTTGCTCAACAAATGGTTATGCAATCTTAAATTAGTCATGGCCAAGCCCACCGATCCTCAGGAACTGCGTTTGTGCTTGGACCACTTCGAACCGCATTTGGTAAGAAACGGAGAGCTCTTGCCCATTGCTCTGCCCACTCTCGATCTGGGACATCAAGATCCCAAGATATATCGAAATACTATGAGCTCCAACGAAAGTGGTTGTCTAGTGGCCAGTTGTCCTTGTGCACGCCTCAACCTCTATCGCAGCTGTGATCTACCAAGCAATCCGGAAATAAGACAAGCCTGGCTAAGTCATCTCAAGCTCAAACCAAACACCCAAGGACAACTATGTGTCATGCACTTTATGCAGCTCTACGAAGATATCCAGATTGAGCCACACTCTGCAGAACTCAAGTCAGCCTATGAATCCATAGCCAACTCCGCGCAGGCCTTGAAACTACGCTGTGCCGTACCCGGCTGTCGTTCCAAATACACCGACAATATTCACTTGACTCGGTTGCCCTACGATCAGCACATCTTCAGCAAATGGTTGCACAACACGAAAATAGAATACGATCCTTCCAGACATTATATCTATCGCATTTGCCTGCTCCACTTTGAGCCCGATGCCTTGGGCGCCGTACGTCCCAAATCTTGGGCCGTTCCTACCCTCAGACTCAATCACGATGAGGAGATCTACTTGAACTCCACAAAAGAGGAGCCTCAGCTGCACACGCCACTTCACATAAAAACCGAACCTTCTGTTCCGCTGCGAATTAAGACAGAACTCACGGCCTTGACTAGTCCCAGCATAAGTTCCACTCCCAGTCCCCGTGGCAAAGTCCGTACCTGCTGTATACCCACGTGTCTGCAGCAGTCCAGCTCTCAGATGCGTCTGTATCGCTTTCCTACCGCCGAAGCCGCTCTGCTCAAATGGCTGGTCAATACTCAACAGCAACCACGTCTGGTGGATGCACTGCAGCTGTATGTGTGTCAAAGTCATTTCGAACCCGAAGCCATTGTCAAAAAGCAATTGAGAAGTTGGGCGGTGCCTACCATGAATTTGGGCCACGATGGTCACATCATTCCCAATGCCAAGCATAATGGTAATATAGCCGATAGCCAGGAAACGGAACAGGCCATGGAGTTCATACGAGAGAACTATTGTTCGGTGCTCAGTTGCTTTCAGCCACGAAGTGATGAGTTGCGTCTGTACGAGTATCCCAAGGATATGCCCACAATCCGAAGATGGGCGGCCAACTGTAAACACCGCTCTATGCAGGCCAGCAGTCATGGATTTCAGGTATGTCAATTGCATTTTGGCCCCGAATGCTTTGACCCAGAGACTGGTGAATTGCGTGAGGGTTCAGTGCCCTCTCTGGAGATTAACAAAAGTCACACCGAACTGCGTTGCCTTGTAGCAGGCTGCGTTAAAGATGAATCTACGCCACGTCGCCGTTACTACAAGCTACCCAAACGCTCCACACAATTGGCGGAATGGTGTCACAATCTCTGTTTGGAACCGTCTGAACTCTCGGCAACTGATCAGCACATATGTGAGCGTCACTTTGAGCCAAGCTGTCTGAATAACTACAAACAGCTGCGTCCTGGAGCCCGACCCACCTTGCATTTGGGTCACGATCAGCCTGTAGAATTGCTGAACAATCCGGAGAACTTAAATGAGCTGCCGGAAGAGGAAGTCGTCTGCTGTGTTCCCCATTGTGAGCGCATCCAGCAGCCAGATGAGGCGCCTTTTAGTTACTTTCCCAAAATGCGACTACTGGCCGACAAGTGGCTCCATAATTTCCGCCTGGAAGCAAGCAAAGAGCAGCTGGGTAAGCTGCGAGTATGTCTGCGTCATTTCGAGACCACGTGTTTTGAGAATGAACGGGTACGTTTGGGTGCCATGCCCACTTTGGAGTTGGGTCATGACGATCGCGATGTTTACCAGACCGACGAACAGGCTTTGGGTAAGAGTCGAAAACACCACAAGAAGAACAGTGGCCTGGGTATGGACTGTTGTTATGCTCAGTGTGCGGAATTACAAAAGAATTACCAAAGAGTAGTCTACGATCTGCCGGTGGATGAGCAATTACGTTCTGCTTGGCTACAGCATATCGAAgtgcaggaggaggaggaccaGCCATTGAAGCTGTGTCCACTGCATTTTATTATACTATACGAACATAGCCAGGAACACTTTCCAGACCATGCACCGGAAGAGTTGCTCGACCATAACTATGAAGATGCACGGAACAGTGTGAGAATCCGTCTGATAAGCTGTGCTGTACGAGATTGTAAAACCATACAGCCGCGCGACGGAGGGCGCTTACATGGTCTACCTCCGCGAAGAGATGTATCGCAGATGTGGCTGGAGAATACCCAAATGGAGTACTTTGAGCCACAACGCTACATGCTTAAGGTGTGCAGCAAACACTTTGAGCCGCACTGCTTTACGGATAGTCGTAAGTTGAAGTACTGGAGTATGCCGACGCTTCATCTCCCTGTGGAGGCGGTGCACAAAAATCTCACCGAAGAGGAATGGCAGCAAATGAATGAGAAACCCGCGGAGCTGAGCAAAGAGAAGAAGGTAGAGGAGGAGATCTATGAAGAGAATTCTTTGCTAGAGCCTATTGTTATAATGGAGCATGTGGAATCCGAgaaagaggaggaggaggagcaggagaaATCGGCGGATGTGGAAGGTGGGCAGGAGAAGACTGCGGAAATCTATGAGGAACTTCTTACACCCGAACTGGTGATCGATGAGCGCACTCAGGACACTGCAGAACACCAGGAAGATGAAATGGAAGCACTCGAAGTGCTGCTAGAGGTGGGTCATGTGGAGAAATGTGCCAGCTACGAGAAAATGGATCAGAAATCGCACTTGCCCTACTCCCAGGAGGCCTCTGCCACACCCTCGCACTTACACTCCCACTCCGCCGGTTCTGCTTTACGGAATCAATACAATGCCAGACATTGCAGTGTCCAGGGTTGTCAGACCAGTTCCCATGACATTGATGGACAAATAAAACTACACAAATTTCCCACCTCAATGGATGCTACTAAAAAATGGATGCACAACACCCAAGTGGATGTGGACGAGAGTGTTTCATGGCGCTATCGCATTTGCAGCTATCACTTCGAGCCGGATTGCTTTAACGGAGCACGGATTCGTAAAGGTTCGATGCCCACATTACATTTGGGTCGTTCCCGTCCCGAAGAGATctatgaaaatgaatttgcccaaatggaaatggaagaaTCTTTGGTAGTGGAAGCAGCACCCGCTCCCACGACCAGCCGGGAAACCTCCTCAAAGGGTGAGGTGACGCAATTGTTTCTACCCCGCCCAGCCCCACCACGCAAATCGAGCAAATTCTGTCAGATTGAGGGCTGTCCCAATCATCTGACCAGTGAGAATATGACACTGCACAAGTTTCCGCACTCGGTCGATATTTGTGAGCGCTGGCAACACAATACCCAAGTGCCATTTGATCCTGAATATCGTTGGCGCTATCGCATTTGCAGTGCCCACTTCAAGTCGGTGTGTTTGGTCAATATGCGACTGCTACATGGTAGTGTACCTACCCTAAAACTGGGTCCAAGAGCTCCTGCCCAACTGTTTGATAATGATTTCGATGCCATGCACAGCAGATTGGACAAGAAGCAGACACAGTCAGCGGTAAAGCACGAAAAGCCACTGAAATATCATCAGTATCAGCCGGAGAATGAGCTGTACTTCGAGCCCGAATGGGATGAGGAAGAGGAGGGCGATGAGCTGGAACAGGAGGAAGACGACGAGGAGCCGCAATCCTCTTTTGCCACTCCCATTGACAGCTGGCGGCATCAATTGCGTCTGCCCGCCGTTAAACAGGAGAAGTCCCCCTACAATCCCATCAAATCTGGCTATGATAAATGCTCACTAGTGCACTGTCAGCGTCAGAGATCCCTGCATGGTGTACATATCTTTAAATTTCCACGCTTTAAACGCCATCAGCAGCGTTGGATGCACAATTTGCGCATACGCTATGACGAGCGACGTCCCTGGAAATATATGATCTGCAGTGTACACTTTGAGCCGCACTGTGTTCGCCTGAGGAAACTGCGTCCGTGGGCAGTGCCCACCCTGGAGCTGGGTGACAACGTGCCTGATCAGATTTATACCAATGAACAGTGTAAGGAAATGGCCACCGATCTGAGCGAGGCTGAAACAGAAGAGGAAGATGGTCTGCAGGAggatgacgacgacgaggacgaggaAGTGGACTTGGGCCCTTAtatcaagaaagaaaaacgTAGTCGCTTGGATCCTTGGGCGACTGGTCAATTAACAGCCTGGAAAGCTAAACAATGTTGCCTGCCCTATTGCCGCCGAcctcggggtgatggcatccGCTTGTTCCgtctgcccagcaattgcaaTTCCATCAAATATTGGGAACAGGCCACAGGCATGGCATTCAAAGAGTCCCAAAGGAATACTCGCCTGATTTGCAGTCGTCACTTTGAGCCGGAACTGATGGGCGTGAGACGTCTAATGAGAAATGCCATCCCCACCAGGAATTTGGGACCACAGAGTGAGAGTTTCAGCACTGAGATAGAGATGGTGGTACCGACTCCCACAGGACCCATGTGCTGCATGGCTGATTGCACGAATGAGGGAAACACGAAACTGCATCAGTTTCCCAGAGATCCCACTCTGCTGCAGCAATGGTGTCAATCCCTAAGACTGTCGGACTTCCAAAGCTATCGGGGCAAACATATTTGCTCCGCCCATTTGCCTGCTCAGGCCCTAACCTGCCTCATCTGTGGCGTCGACGATGTTCATCTACCTTTGCTCGATTTCCCCGAGAACCGCAATCATCGCGCCAAATGGTGTTATAATCTCAAAATCGATACCATACCAAAATGGGATACATCCAAGCACATTTGCTGCAAGCATTTCGAATCATATTGCTTTGTCCAACCAGGCGAACTATTGCCCGATGCCGCACCAACATTGCATTTGAATCACAATGATACGAATATATTCCACAATGATTATACCATAGATGATCAGCAGCACTCCATGATCCGCATTAAGGACGAACCTCTGGACAATGACGACTTTTTGTTGGTGTAG
Protein Sequence: MSQHNPHYHHSHPLHYPQHHQQQQQQQQHLHHQQQQQQQQQQHKQMNWYSHVASTSSPSSPYPASAATNNNNHILNAYGTHGYYGAAGGGLNVNATGGVSGGSSNSYNLDTANTVAYAHNQLLQYQQQQQQQHLSQRSYMGGHHGIYPYIKSEPVEYANPMAPPPAPSEMRIKSEPIDEHAYKSNYIDDNTPFADFSKFNEFSEDMLSPKVELTVKDDSYGKNPNNYPRRKMQTERAEESLPICQRCKEVFFKKQSYLRHVAESSCGIQEYDFKCNICPMSFMSTEELQAHKQLHRADKFFCHKYCGKHFDTIAECESHEYMQHEYDSFVCNMCSGTFPTREQLYNHLPQHKFQQRYDCPICRLWYQTAGELHEHRLAAPYFCGKYYAGAQAAAATQSHQSQSQQQLHQANYKLQDCHMATMEMPTPPAAATTSHHKSSPSTSALPATAALSSLLQQRQANADGTSMFSSAHKNEVNVKLERSYSNSTSESSFSMHESNYNNTYASDNSMHGGALGGPQAHSSTLDDSEDALCCVPLCGVRKSTSPTLQFFTFPKDEKYLHQWLHNLKMFHIPASSYTTFRICSMHFPKRCINRYSLCYWAVPTFNLGHDDVANLYQNRELTNTFTTGEIARCSMPHCSSQRGESNLKFYNFPKDIKSLIKWCQNARLPVQAKEPRHFCSRHFEERCIGKFRLKPWAVPTLHLGAHYGKIHDNPKNLYVEEKRCCLNFCRRSRSSDFNMSLYRFPRDEVLLRRWCYNLRLDPGVYRGKNHKICSAHFIKEALGLRKLSPGAVPTLHLGHNDTFNIYENELWPPPTPSSTPHNNHHQQQHLHHQQQHSHHSAQQHHSKSYQRHSAASTSSSASSASHYMDADMSGSYLGMGTSTGMNVTDSMDICCVPSCESKRHNNENITFHTIPRRPEQMRKWCHNLKIPEDKMHKGMRICSLHFESYCIGGCMRPFAVPTLHLGHDDEDIHRNPDVIKKLNIRETCCVAVCKRNRDRDHANLHRFPSNVPLLTKWCANLQRPVPDGTKLFNDAICEVHFEDRCLRNKRLEKWAVPTLILGHEDIAYQLPTPEEVAEFFARPSAPNNGEEQGECCVESCKRNPSVDDIKLYRPPEEAEVLSKWAHNLQLEVSELSNLRICNLHFESHCIGKRMRPWAIPTLNLSGNIENLYENPEHTMLYKRRTRDPNRDLSGLKPTWVPRCCLPHCRKVRALHNVQLYRFPKLNRSTLAKWAHNLQVPMVGSAQRRVCSAHFEPHVLSKKCPVPMAVPTLELNSPPGYKIYQNPAKLKASKLCLQRVCIVESCRKTRAQGVHLFRLPHSPTQLRKWMHNIRTRPRTAMRAQYRICSAHFETHSFNGKRLSAGAIPTLELGHQDDDIYPNEAQSFVEEHCAVEGCDSTKEQAEVRLFRFPTDDDDLLWKWCNNLKMNPVDCVGVRICNKHFETDCVGPKHLFKWAIPTLALGHDDSQIELIPNPKPEDRYADPLFKCCVPTCGKTRKFDEVQMNSFPKDPTLFQRWRHNLRLDYLDFKERERYKICNDHFEDICVGKTRLNIGSIPTLELGHEETEDLYQVNPADLQSNLFGRQRRLLGDSKQEEEEAEEDEEHAELRPRVKKVMEEATDLNTKQVKIKKSLSELKCCVRSCGRSRLEHGARLFPFPTGKQQQLKWRHNLQLEPHEVNKMTRVCSAHFNRRCIDGKHLRGWAMPTQQLGHKKHQNIYENPKNIPGFFTPTCALGHCRKRRSIDNDLRTYRYPRTEDLLEKWRANLRLAPDQCRGRICADHFEPQVRGKLKLKTGAVPTLKLGHDEGLEYDNEAIKAGLNDDEEASLDSPPVQANKEEQEEEDQEEDGEDASAEMQDPAAGEQDDDQSGYFDPLELVETFAHDHSDPPDEDSPATPPPSAAPQLRRDKPANNVSPICCLKHCRKERTARNLLSTFGFPKDQQLLLKWCANLQLDLDDCIGRVCMEHFEAEVLGSRKLKQNAVPTLNVGHELDLPYTCNGQERSTEDQSVFRLWSLKHCRKRKPEEPPDMPVVKQEKMEVKEEPKESKPKMCCLSHCGKLKRLQRLPQDQLLLNKWLCNLKLVMAKPTDPQELRLCLDHFEPHLVRNGELLPIALPTLDLGHQDPKIYRNTMSSNESGCLVASCPCARLNLYRSCDLPSNPEIRQAWLSHLKLKPNTQGQLCVMHFMQLYEDIQIEPHSAELKSAYESIANSAQALKLRCAVPGCRSKYTDNIHLTRLPYDQHIFSKWLHNTKIEYDPSRHYIYRICLLHFEPDALGAVRPKSWAVPTLRLNHDEEIYLNSTKEEPQLHTPLHIKTEPSVPLRIKTELTALTSPSISSTPSPRGKVRTCCIPTCLQQSSSQMRLYRFPTAEAALLKWLVNTQQQPRLVDALQLYVCQSHFEPEAIVKKQLRSWAVPTMNLGHDGHIIPNAKHNGNIADSQETEQAMEFIRENYCSVLSCFQPRSDELRLYEYPKDMPTIRRWAANCKHRSMQASSHGFQVCQLHFGPECFDPETGELREGSVPSLEINKSHTELRCLVAGCVKDESTPRRRYYKLPKRSTQLAEWCHNLCLEPSELSATDQHICERHFEPSCLNNYKQLRPGARPTLHLGHDQPVELLNNPENLNELPEEEVVCCVPHCERIQQPDEAPFSYFPKMRLLADKWLHNFRLEASKEQLGKLRVCLRHFETTCFENERVRLGAMPTLELGHDDRDVYQTDEQALGKSRKHHKKNSGLGMDCCYAQCAELQKNYQRVVYDLPVDEQLRSAWLQHIEVQEEEDQPLKLCPLHFIILYEHSQEHFPDHAPEELLDHNYEDARNSVRIRLISCAVRDCKTIQPRDGGRLHGLPPRRDVSQMWLENTQMEYFEPQRYMLKVCSKHFEPHCFTDSRKLKYWSMPTLHLPVEAVHKNLTEEEWQQMNEKPAELSKEKKVEEEIYEENSLLEPIVIMEHVESEKEEEEEQEKSADVEGGQEKTAEIYEELLTPELVIDERTQDTAEHQEDEMEALEVLLEVGHVEKCASYEKMDQKSHLPYSQEASATPSHLHSHSAGSALRNQYNARHCSVQGCQTSSHDIDGQIKLHKFPTSMDATKKWMHNTQVDVDESVSWRYRICSYHFEPDCFNGARIRKGSMPTLHLGRSRPEEIYENEFAQMEMEESLVVEAAPAPTTSRETSSKGEVTQLFLPRPAPPRKSSKFCQIEGCPNHLTSENMTLHKFPHSVDICERWQHNTQVPFDPEYRWRYRICSAHFKSVCLVNMRLLHGSVPTLKLGPRAPAQLFDNDFDAMHSRLDKKQTQSAVKHEKPLKYHQYQPENELYFEPEWDEEEEGDELEQEEDDEEPQSSFATPIDSWRHQLRLPAVKQEKSPYNPIKSGYDKCSLVHCQRQRSLHGVHIFKFPRFKRHQQRWMHNLRIRYDERRPWKYMICSVHFEPHCVRLRKLRPWAVPTLELGDNVPDQIYTNEQCKEMATDLSEAETEEEDGLQEDDDDEDEEVDLGPYIKKEKRSRLDPWATGQLTAWKAKQCCLPYCRRPRGDGIRLFRLPSNCNSIKYWEQATGMAFKESQRNTRLICSRHFEPELMGVRRLMRNAIPTRNLGPQSESFSTEIEMVVPTPTGPMCCMADCTNEGNTKLHQFPRDPTLLQQWCQSLRLSDFQSYRGKHICSAHLPAQALTCLICGVDDVHLPLLDFPENRNHRAKWCYNLKIDTIPKWDTSKHICCKHFESYCFVQPGELLPDAAPTLHLNHNDTNIFHNDYTIDDQQHSMIRIKDEPLDNDDFLLV

Similar Transcription Factors

Sequence clustering based on sequence similarity using MMseqs2

100% Identity: iTF_00914540;
90% Identity: iTF_00918172;
80% Identity: -