Basic Information

Insect: Lordiphosa magnipectinata
Gene Symbol: -
Assembly: GCA_018904285.1
Location: JBAMBO010004021.1:218779-248701[+]

Transcription Factor Domain

TF Family: THAP
Domain: THAP domain
PFAM: PF05485
TF Group: Zinc-Coordinating Group
Description: The THAP domain is a putative DNA-binding domain (DBD) and probably also binds a zinc ion. It features the conserved C2CH architecture (consensus sequence: Cys - 2-4 residues - Cys - 35-50 residues - Cys - 2 residues - His). Other universal features include the location of the domain at the N-termini of proteins, its size of about 90 residues, a C-terminal AVPTIF box and several other conserved residues. Orthologues of the human THAP domain have been identified in other vertebrates and probably worms and flies, but not in other eukaryotes or any prokaryotes [1].
Hmmscan Out: # of c-Evalue i-Evalue score bias hmm coord from hmm coord to ali coord from ali coord to env coord from env coord to acc

1 29 7.8 1.4e+04 -2.4 2.0 50 63 304 319 282 335 0.59

2 29 7.1e-15 1.3e-11 45.8 4.6 1 86 535 607 535 608 0.86

3 29 2.2e-14 3.9e-11 44.2 5.0 1 87 635 704 635 704 0.83

4 29 1.8e-15 3.4e-12 47.6 0.2 1 87 726 798 726 798 0.85

5 29 2.9e-15 5.2e-12 47.0 6.2 1 86 896 965 896 966 0.80

6 29 1.4e-14 2.5e-11 44.8 3.3 1 86 990 1061 990 1062 0.82

7 29 1.8e-12 3.3e-09 38.0 2.0 1 87 1097 1165 1097 1165 0.81

8 29 1.6e-10 2.9e-07 31.8 2.1 1 86 1205 1274 1205 1275 0.78

9 29 5.1e-16 9.3e-13 49.4 0.4 1 86 1302 1371 1302 1372 0.82

10 29 2.7e-13 4.9e-10 40.7 1.5 1 86 1393 1462 1393 1463 0.80

11 29 6.2e-15 1.1e-11 45.9 0.8 1 86 1490 1561 1490 1562 0.85

12 29 1.7e-12 3.1e-09 38.1 2.8 1 85 1638 1706 1638 1708 0.82

13 29 5.9e-12 1.1e-08 36.4 0.1 1 86 1732 1800 1732 1801 0.82

14 29 4.2e-14 7.7e-11 43.3 0.7 1 87 1917 1986 1917 1986 0.79

15 29 7.6e-09 1.4e-05 26.4 0.0 1 86 2051 2117 2051 2118 0.79

16 29 2e-05 0.036 15.5 0.2 1 60 2138 2187 2138 2208 0.68

17 29 1.2e-13 2.2e-10 41.8 0.1 1 86 2219 2288 2219 2289 0.85

18 29 2.5e-14 4.6e-11 44.0 0.3 1 87 2348 2418 2348 2418 0.83

19 29 4.1e-11 7.4e-08 33.7 0.2 1 86 2453 2524 2453 2525 0.79

20 29 9.3e-13 1.7e-09 39.0 2.0 1 87 2535 2607 2535 2607 0.83

21 29 2.4e-11 4.4e-08 34.4 0.6 1 86 2633 2703 2633 2704 0.75

22 29 8e-07 0.0015 20.0 0.2 1 58 2737 2788 2737 2808 0.83

23 29 1.5e-12 2.7e-09 38.3 0.5 1 87 2826 2898 2826 2898 0.83

24 29 2.5e-15 4.5e-12 47.2 0.8 1 87 3045 3118 3045 3118 0.83

25 29 9.8e-13 1.8e-09 38.9 2.7 1 86 3179 3249 3179 3250 0.80

26 29 7.5e-14 1.4e-10 42.5 4.9 1 86 3358 3428 3358 3429 0.84

27 29 1.3e-11 2.4e-08 35.3 0.3 1 86 3503 3572 3503 3573 0.84

28 29 2.1e-10 3.8e-07 31.4 0.8 1 58 3597 3645 3597 3661 0.85

29 29 2.1e-08 3.7e-05 25.1 1.3 18 87 3662 3720 3650 3720 0.75

#	of	c-Evalue	i-Evalue	score	bias	hmm coord from	hmm coord to	ali coord from	ali coord to	env coord from	env coord to	acc
1	29	7.8	1.4e+04	-2.4	2.0	50	63	304	319	282	335	0.59
2	29	7.1e-15	1.3e-11	45.8	4.6	1	86	535	607	535	608	0.86
3	29	2.2e-14	3.9e-11	44.2	5.0	1	87	635	704	635	704	0.83
4	29	1.8e-15	3.4e-12	47.6	0.2	1	87	726	798	726	798	0.85
5	29	2.9e-15	5.2e-12	47.0	6.2	1	86	896	965	896	966	0.80
6	29	1.4e-14	2.5e-11	44.8	3.3	1	86	990	1061	990	1062	0.82
7	29	1.8e-12	3.3e-09	38.0	2.0	1	87	1097	1165	1097	1165	0.81
8	29	1.6e-10	2.9e-07	31.8	2.1	1	86	1205	1274	1205	1275	0.78
9	29	5.1e-16	9.3e-13	49.4	0.4	1	86	1302	1371	1302	1372	0.82
10	29	2.7e-13	4.9e-10	40.7	1.5	1	86	1393	1462	1393	1463	0.80
11	29	6.2e-15	1.1e-11	45.9	0.8	1	86	1490	1561	1490	1562	0.85
12	29	1.7e-12	3.1e-09	38.1	2.8	1	85	1638	1706	1638	1708	0.82
13	29	5.9e-12	1.1e-08	36.4	0.1	1	86	1732	1800	1732	1801	0.82
14	29	4.2e-14	7.7e-11	43.3	0.7	1	87	1917	1986	1917	1986	0.79
15	29	7.6e-09	1.4e-05	26.4	0.0	1	86	2051	2117	2051	2118	0.79
16	29	2e-05	0.036	15.5	0.2	1	60	2138	2187	2138	2208	0.68
17	29	1.2e-13	2.2e-10	41.8	0.1	1	86	2219	2288	2219	2289	0.85
18	29	2.5e-14	4.6e-11	44.0	0.3	1	87	2348	2418	2348	2418	0.83
19	29	4.1e-11	7.4e-08	33.7	0.2	1	86	2453	2524	2453	2525	0.79
20	29	9.3e-13	1.7e-09	39.0	2.0	1	87	2535	2607	2535	2607	0.83
21	29	2.4e-11	4.4e-08	34.4	0.6	1	86	2633	2703	2633	2704	0.75
22	29	8e-07	0.0015	20.0	0.2	1	58	2737	2788	2737	2808	0.83
23	29	1.5e-12	2.7e-09	38.3	0.5	1	87	2826	2898	2826	2898	0.83
24	29	2.5e-15	4.5e-12	47.2	0.8	1	87	3045	3118	3045	3118	0.83
25	29	9.8e-13	1.8e-09	38.9	2.7	1	86	3179	3249	3179	3250	0.80
26	29	7.5e-14	1.4e-10	42.5	4.9	1	86	3358	3428	3358	3429	0.84
27	29	1.3e-11	2.4e-08	35.3	0.3	1	86	3503	3572	3503	3573	0.84
28	29	2.1e-10	3.8e-07	31.4	0.8	1	58	3597	3645	3597	3661	0.85
29	29	2.1e-08	3.7e-05	25.1	1.3	18	87	3662	3720	3650	3720	0.75

Sequence Information

Coding Sequence: ATGTCACAGCATAATCCGCACTATCATCACTCCCATCCCTTACACTATCCACaacaccaccaacaacaacaacagcagcagcagcatctccaccatcagcagcagcaacaacaacagcagcagcagcagcataaacaaataaattggtACTCACATGTTGCTTCCACCTCCTCTCCCGGCTCCCCCTACCCGTCGTCGGCTgccgccaacaacaacaatcacatTTTGAACGCCTATGGAACACATGGATATTATGGAGCCGCTGGCGGCGGTCTCAATGTCAATGCTGTGGGGGGTGTGAGCGGAGGGAGTTCAAACAATTATAACCTAGACACGGCCAATACGGTGGCCTATGCCCATAACCAGCTGCTGCaatatcagcagcagcagcagcagcaacatcatctCAGTCAAAGATCTTATATGGGAGGACACCATGGCATATATCCCTATATAAAAAGCGAACCCGTGGAGTATGCCAATCCCATGGCTCCGCCACCAGCTCCTTCAGAAATGAGAATAAAATcGGAACCCACTGACGAACATGCCTATAAGTCCAACTATATTGATGATAATACTCCCTTTGCTGATTTTAGTAAGTTTAATGAGTTCAGCGAGGATATGTTGAGTCCCAAAGTGGAACTAACCGTCAAAGACGATTCCTATGGAAAGAATCCTAATAATTATCCGCGGCGCAAAATGCAAACCGAACGGTCTGAGGAGAGTTTGCCGATTTGTCAACGCTGCAAAGAGGTTTTCTTTAAAAAGCAATCCTACCTGCGTCATGTGGCCGAAAGCAGCTGTGGCATCCAGGAGTATGATTTCAAATGTAATATTTGTCCCATGTCCTTTATGAGCACGGAAGAGTTACAAGCGCACAAACAACTACATCGAGTGGATAAATTCTTTTGTCATAAATATTGTGGCAAACATTTTGACACAATTGCCGAATGTGAATCGCATGAATATATGCAACATGAATACGATAGTTTTGTGTGtaatATGTGCTCGGGAACTTTTCCTACACGTGAGCAGCTTTATAACCATTTGCCTCAGCATAAGTTTCAACAGCGTTTCGATTGTCCCATTTGTCGTTTGTGGTATCAAACGGCTGGAGAACTCCACGAACATCGTTTGGCGGCACCTTATTTCTGTGGCAAATATTATACGGGAGCGCAGCCAGCAGCTGCAACTCAATCCCATCAGTCGCAGTCACAGCAGCAATCACATCAGACGAATTATAAACTGCAGGATTGTCATATGGCCACCATGGAGATGCCTACGCCTCCAGCAGCGACAACAACCTCCCATCACAAATCTAGCCCCTCAACTTCAGCATTACCGGCCACAGCAGCTTTAAGTTCCCTGCTGCAGCAACGCCAGGCTAATGCCGATGGAGCCTCAATGTTTTCCTCTACCCATAAAAATGAAGTGAATGTCAAGCTGGAGCGCAGTTATAGCAACTCCACCAGCGAGTCCTCATTCAGTATGCACGAATCGAACTACAACAATACCTATGCCAGCGATAATTCCCTGCATGGTGGAGCCCTGGGTGGTCCCCAGGCTCATTCCTCAACACTGGATGACTCGGAGGATGCTTTATGTTGCGTTCCCCTCTGCGGAGTAAGGAAGAGCACTAGTCCCACACTACAGTTCTTTACCTTCCCTAAAGATGAGAAATATTTGCATCAATGGCTGCACAATCTCAAGATGTTCCACATCCCAGCCTCAAGCTATACGACTTTCCGAATCTGCAGCATGCATTTCCCCAAACGTTGCATCAATCGTTATTCGCTGTGCTATTGGGCAGTACCAACTTTCAATTTGGGACACGATGATGTGGCTAATCTTTATCAGAATCGCGAACTGACCAACACTTTTACCACCGGTGAAATTGCACGCTGTAGCATGCCCCATTGCAGCAGCCAAAGGGGTGAAAGTAAtcttaaattttataatttcccTAAGGACATTAAAAGCTTGATCAAATGGTGTCAGAATGCTCGCCTGCCTGTCCAGGCCAAAGAGCCGCGTCACTTTTGTAGCCGCCATTTCGAAGAGCGTTGCATTGGCAAATTTCGTTTAAAACCCTGGGCAGTTCCCACCTTGCATCTGGGTGCACATTATGGTAAAATTCATGACAATCCCAAGAATTTGTATGTGGAGGAGAAGCGCTGTTGTCTCAACTTTTGTCGACGCAGCCGCTCATCAGACTTTAATATGTCGCTTTATCGTTTCCCGAGAGATGAAGTGTTGCTGCGACGCTGGTGTTACAATCTACGCCTAGATCCCGGTGTATATCGTggcaaaaatcataaaatatgCAGTGCTCACTTCATTAAGGAGGCCTTGGGACTAAGGAAACTATCGCCAGGTGCCGTGCCCACCCTTCATTTGGGTCACAACGATACTTTCAATATATATGAGAACGAATTATGGCCACCACCTACGCCCAGTTCCACACCACACAGcaatcatcatcaacagcatcAGCACCATCATCAGCAACAGCATTCTCACCATTCAGCTCAGCAGCACCACAGCAAAGCATATCAACGTCATTCGGCAGCATCCACTTCATCATCGGCCAGTTCGGCTTCGCACTATATGGACGCCGATATGAGTGGATCATATCTCGGTATGGGCACTTCTACTGGCCTGAATGTCACCGATAGCATGGACATTTGCTGTGTGCCCAGCTGTGAGAGCAAGCGTCATAACAATGAGAATATTACATTCCATACGATACCCCGAAGGCCAGAGCAGATGAGGAAATGGTGTCACAATCTCAAGATACCCGAGGAAAAAATGCACAAAGGCATGCGGATATGCAGTTTGCATTTTGAATCCTATTGCATTGGCGGTTGTATGCGTCCCTTTGCGGTGCCCACTATGCATTTGGGTCACGACGATGAGGATATACATCGTAATCCGGATGTGATCAAGAAGTTGAACATTCGCGAAACCTGCTGTGTGGCCGTGTGTAAGAGAAATCGTGATCGTGATCATGCTAATCTTCATAGATTCCCCAGTAATGTACCCCTACTGACCAAATGGTGTGCGAATCTGCAGAGACCAGTGCCGGATGGCACTAAATTGTTCAACGACGCCATCTGTGAGGTGCATTTTGAGGATCGTTGTTTGAGAAATAAACGACTGGAGAAATGGGCAGTACCTACTCTAATATTGGGCCATGACGATATAGCCTATCAGTTGCCCACGCCCGAGGAAGTGGCCGAGTTCTTTGCCCGGCCTAGTGCACCCAATAACGGGGAAGAGCAGGGCGAATGCTGTGTAGAGAGTTGCAAACGTAATCCCAGTGTGGATGACATCAAACTTTATCGTCCACCCGAGGAAGCGGAGGTCTTAAGCAAATGGGCACACAATCTACAACTAGAAGTATGCGAGTTGACCAATCTACGAATATGTAACTTACATTTCGAGTCCCATTGCATAGGCAAACGAATGAGACCCTGGGCTATACCCACTTTGAATCTATCGGGTAATATTGAAAACCTCTATGAGAATCCCGAGCATACCATGTTGTATAAGCGACGAACCAGAGATCCAAATAGAGATTTAAGTGGTCAGAAGCCCACTTGGGTGCCTAGATGCTGTCTGTCCCATTGCCGTAAGGTGAGAGCCTTGCATAATGTGCAACTCTATCGATTCCCCAAGCTAAATCGCTCCACTTTGGCTAAATGGGCACATAACTTACAAGTGCCGATGGTGGGCAGTGCACAGCGACGTGTCTGTTCGGCTCACTTTGAACCTCATGTGTTGAGTAAAAAGTGTCCAGTTCCCATGGCGGTGCCCACTCTGGAGTTGAACTCTCCGCCGGGCTATAAAATCTACCAGAATCCAGCCAAATTGAAAGCCAGCAAACTGTGCCTGCAAAGGGTATGCATAGTGGAGAGCTGTCGAAAGACTCGTGCTCAGGGGGTACATCTATTCCGTCTGCCCCACAGTCCTACCCAGCTAAGGAAATGGATGCATAACATACGCACACGTCCTCGAACCGCCATGAGAGCTCAATACCGCATCTGCTCCGTACATTTCGAAACGCATTCATTCAATGGCAAAAGATTAAGCGCTGGAGCGATACCAACTTTGGAATTGGGCCATCAGGATGATGATATCTATCCCAATGAAGCTCAATCCTTTGTGGAGGAACATTGTGCCGTTGAGGGCTGTGAGTCGACCAAGGAGCAAGCGGAAGTGCGTCTCTTCCGTTTTCCTACCGATGATGATGATTTGCTCTGGAAATGGTGTAATAACCTTAAAATGAATCCCGTGGATTGTGTGGGCGTTCGTATTTGTAATAAACATTTTGAGACCGATTGTGTAGGACCCAAACATCTGTTTAAATGGGCCATACCCACCTTGGCCTTGGGTCATGATGATTCACAAATCGAGCTGATCCCCAATCCCAAGCCCGAAGATCGTTATGCGGAACCTTTGTTCAAATGTTGTGTACCCACTTGTGGCAAGACCCGTAAATTCGATGAGGTGCAAATGAATAGTTTTCCCAAGGATCCCACACTGTTTCAACGGTGGCGTCATAATCTCCGACTGGACTATTTGGATTTCAAGGAACGGGAACGTTATAAAATATGCAACGACCATTTTGAGGATATATGCGTGGGCAAGACACGTTTAAATATTGGTTCCATTCCCACCTTGGAGTTGGGACATGAGGAAACCGAGGATTTGTATCAAGTAAATCCCGCTGACTTGCAAAGTAATCTATTTGGACGCCAGCGTAGATTGCTAGGAGATAGTAAACAGGAAGAGGAGGCTGAGGAAGTTGAACAGGAGCCTGAACTCAGACCCAGGGTTAAGGTCATGGAAGAAGCCACTGATTTGAACACCAAGCaagtgaaaatcaaaaaatctctGGCCGAGCTGAAGTGCTGTGTTCGTAGCTGTGGTCGTAGTCGCTTGGAGCACGGTGCTCGCTTGTTTCCTTTTCCCACGGGCAAGCAACAGCAACTCAAATGGCGTCACAATCTTCAGCTGGAACCGCACGAGGTGAACAAAATGACTCGAGTCTGCAGTGCCCATTTCAATAGACGTTGCATAGATGGTAAACATTTAAGAGGATGGGCCATGCCTACCCAGCAATTGGGGCATAAGAAACATCAGAATATCTACGAGAATCCCAAGAATATACCCGGTTTCTTTACGCCCACCTGTGCTTTGGGTCACTGTAGGAAACGGCGCAGCATAGACAACGATTTGCGAACCTATCGTTATCCTAGGACAGACGATATGCTAGAGAAATGGCGTGCCAATCTACGATTAGCACCAGATCAGTGTAGAGGTCGAATCTGTGCAGATCATTTTGAGCCACAGGTGAGaggaaaattaaaattgaagacAGGTGCTGTGCCCACATTAAAACTGGGACATGATGAGGGCTTGGTTTATGATAATGAAGCCATCAAGGCTGGTCTAAATGAAGATGAGGAGGCTAGTTTGGGTTCGCCCGCAGTACAAGTCAAAAAGAAGGAGCAGAAGGAAGAAGATCAAGAAGAAGATGGGGAAGATGCGTCCGCAGAAATGCAGGATCCTGCCGAAGACGAGCAAGACGATGAGCAAAGCGGTTACTTCGATCCTCTGGAACTGGTTGAGACTTTTGCACATGACCAGTCAAACCCCCCCGATGAGGACTCACCTGCAACACCTCCCCCATCGGCTGCTCCTCAATTGAGGCGGGATAAGCCCGCCAATAATGTCACTCCCATCTGTTGTCTCAAACATTGCCGTAAGGAACGCACTCCCAAATATCTTCTAAGCACTTTTGGGTTTCCCAAAGATCAACAGCTGCTTCTGAAGTGGTGTGCCAATCTACAAATGGAGCTCGACGACTGTATAGGTCGCGTGTGCATGGAACATTTCGAGGCGGAGGTCTTGGGATCACGTAAACTCAAGCAGAATGCGGTGCCTACTCTGAATGTGGGTCATGATTTTGAATTACCCTACACCTGTAATGGTCAGGAGCGTTCCACAGAAGATCAGTCGGTTTTTCGGCTTTGGAGCCTGAAACATTGCCGTAAAAGGAAGCAAGAGGAGCCTCCAGATATGCCAGTAGTGAAACATGAGAAGACGGAGTTGAAGGCGGAGCCGAAAGAGAGTAAACCAAAGATGTGTTGCCTCAGTCATTGTGGGAAAATGAAGCGCTTACAACGCTTACCGCAGGATCAATTGTTGCTCAACAAATGGTTACGCAATCTGAAATTAGTCATGGCCAAACCCACCGATCCTCAGGAACTGCGTTTGTGCTTGGACCACTTTGAACCACATTTGGTAAGAAATGGTGAGCTCTTGGCCATTGCTCTGCCCACTCTCAATCTGGGACACCAAGATCCCAAGATATACCGAAACACTGTAAGCGCCAACGAAAGTGGCTGTCTAGTGGCCAGTTGTTCTTGTGCACGCCTCAACCTCTATCGCAGCTGTGATCTACCAAAAAATCCGGAAATAAGACAAGCCTGGTTAAGACATCTCAAGCTCAATCCAAACACCCAGGGACAACTATGTGTCATGCACTTTATGCAGCTCTACGAAGAAATCAAAATTGAGCCACATTCTGCTGAACTTAAGTCAGCCTATGAATCCATAGCCAACTCCGCACAGGCCTTGAAACTACGATGTGCCGTGCCCGGTTGTCGTTCCAAATATACCGATAATATACACTTGACCCGGTTGCCCTATGATCAGCACATCTTCAGCAAATGGTTACACAACACGAAAATAGAATATGATCCTTCAAGACATTATATATATCGTATTTGCCTGCTGCACTTTGAGCCCGATGCCTTGGGCGCCGTACGTCCCAAGTCGTGGGCCGTTCCCACCCTAAAACTCAATCATCAGGAGGAGATCTACTTGAATTCCACAAAAGACGAACCTCAGCTGCATACGCCACTTCACATTAAAACCGAACCTTCTGTTCCGCTGCGAGTCAAAACAGAACTCACGGCTTTGACTAGTCCCAGCATAAGTTCCACGCCCAGTCCTCGTGGCAAAATCCGTATCTGCTGTATACCCACATGCCTGCAGCAGTCCAGCTCGCAAATGCGTCTCTATCGGTTTCCTACCGCTGAATCCGCTCTCCTCAAATGGCTGGTCAATACTCAACAGCAACCACGTCTGATAGATGCCCTTCAGCTGTATGTGTGTCAAACACATTTCGAACCAGAAGCCATTGTCAAAAAGCAATTGAGAAGTTGGGCTGTGCCCACCTTGAACTTGGGACACGATGGTCACATCATTCCCAATGCCAAGCATAATGGTAATATAGCAGATAGCCAGGAAACGGAACAAGCGATGGAGTTTATCCGAGAGAACTATTGTTCGGTACTCAGCTGCTTTCAGCCACGTAGTGAGGATTTGCGTCTGTACGAGTATCCCAAGGATATGCCCACAATAAGAAAATGGGCGGCTAACTGTAAACATCGCTCTATGCAGGCAAGCAGTCATGGATTTCAGGTATGCCAATTGCATTTTGGCCCCGAATGCTTCGACCCAGATACTGGCGATTTGCGTGAGGGTTCAGTGCCCTCTCTGGAAACAAACAAAAGCCATGCCGAATTGCATTGCCTAGTATCAGGTTGTGTTAAAGATGACTCTACACCACGTCGTCGTTACTACAAGCTACCCAAGCGCTCCACTCAGTTGGCGGAATGGTGTCACAATCTCTGTATGGAACCGTCTGAGCTCCTGCCAACTGATCAGCACATATGTGAGCGTCATTTTGAGCCAAGTTGTCTAAATAACTACAAACAGCTACGGCCTGGAGCACGACCCACCTTGCATTTGGGTCACGATCAGCAAGTAGAATTACTAAACAATCCGGAGATCTTTAGTGAACCGCCGGAAGAGGAAGTCGTCTGCTGTGTTCCTCAATGTGAACGCATACAACAGCCGGATGAGGGGCCTTTTAGTTTCTTTCCCAAAATTCGACTATTGGCCGACAAATGGCTTCACAATTTCCGCCTGGAATCAAGCAAAGAGCAGCTGGGCAAGCTGCGAGTATGCCTGAGACATTTTGAGACAACGTGCTTTGAGAATGAGCGTGTGCGTTTGGGTGCCATGCCAACTTTGGAGCTGGGTCATGACGATCGCGATGTTTACCACACCGATGAACAGGCTCTGGGTAAGGGTCGAAAACATCATAAGAAGAACAGTGGCCTGGGTATGGATTGTTGTTATGCTCAGTGTGCGGAATTGCAAAAGAATTACCAAAGAGTGGTCTATGATCTGCCCGTGGATGAGCAACTGCGTAGTGCTTGGATGCAGCATATCGAAgtgcaggaggaggaggagcaacCACCATTAAAGCTGTGTCCACTGCATTTTATTATACTATACGAGCATAGCCAGGAACACTTTCCAGAACATGCACCGGAAGAGTTACTCGATCACAACTATGAAGATGCCAGGAACAGTGTGAGAATACGTTTGATTAGTTGTGCTGTACGAGATTGCAAAACCATTCAGCCGCGAGATGGAGGGCGCTTACATGGACTACCTCCGCGAAGAGATGTATCGCAAATGTGGCTGGATAATACCCAGATGGAGTACTTTGAGCCACAACGCTACATGCTTAAGGTGTGTAGCAAACACTTTGAGCCTCATTGCTTCACGGACAGTCGTAAATTGAAGTACTGGAGTATGCCGACGCTTCATCTCCCAGTAGAGGCGGTACATAAAAATCTCACCGAAGAGGAATGGCAAAAAATGAATGACAAACCCGCAGAGCCAAGCAAAGAGAAGAAGGTAGAGGAGGAGAATTATGAAGAGAACTCTTTGCTGGAGCCCATTGTCATAATGGAGCATGTGGAATCCGagaaagaggaggaggaggagcaggaaAAGGTGGTGGAAGTAGAAGATGAGCAACTTACACCCGAGCTGGTGATCGATGAGCGCACTCAGGACACTGAAGAACATCAGGAAGaagaaatggaagaattggaagTGCTGCTAGAGGTGGGTCATGTGGAGAAATGTGCCAGCTATGAGAAAATGGATCAGAAATCCCATTTGCCCTACTCCCAGGAGGCCTCTGCCACACCCTCACACTCCGCCAATTCTGCGCTACGAAATCAATACAATGCCAGGCACTGCAGTGTCCAGGGTTGTCAGACCAGTTCCCATGACATAGATGGACAAATAAAACTACACAAATTTCCCACCTCAACGGATGCTACCAGAAAATGGATGCACAACACCCAAGTGGATGTGGACGAGAGTGTTTCGTGGCGTTATCGCATTTGTAGCTATCATTTCGAGCAGGATTGCTTTAACGGCGCACGGATTCGCAAAGGTTCCATGCCCACACTACATTTGGGTCGATCCAGACCAGAAGAAATCTATGAAAATGAATTTGcccaaatggaaatggaagaatCTTTGGTGATGGAAACTCCACCCGCTGCCACAACAAGCTGGGAAACATCATCCAAGGGTGAGGTATCGCAATTGTTTTTGCCCCGCCCAGCTCCACCACGCAAATCGAGCAAATTCTGTCAGATTGAAGGCTGTCCCAATCATCTGACCAGTGAGAATATGACACTGCATAAGtttccgcactcggtggatatATGTGAACGCTGGCAACATAATACCCAAGTGCCGTTTGATCCTGAGTATCGTTGGCGTTATCGCATTTGCAGTGCCCATTTCAAGTCTGTGTGTTTGGTCAATATGAGACTGCTACATGGTAGTGTACCTACCCTAAAACTGGGTCCACGAGCTCCTGCCCAATTGTTTGATAATGATTTCGATGCCATGCACAGTAGATTGGATAAGAAGCAGACACAGTCAGCGGTAAAGCACGAAAAATCACAACAGTATCATCAGTATCAGCCGGAAAATGAGATGTACTTCGAGCCTGAATGGGACGAGGAAGAGGAGGCAGATGATCTGGAACAGGAGGAAGACGGAGAGGAACCGCATACCTCATTCTCCACCCCCTTTGACAGCTGGAGGCATCAATTGCGTCTACCTGCCGTTAAGCAGGAGAAGTCCCCCTACAATCCCATCAAATCTGGCTATGATAAATGCTCTCTGGTGCACTGCCAACGACAGAGATCTCTACATGGTGTACATATCTTTAAATTCCCACGCTCTAGACGCCATCAGCAGCGTTGGATGCACAATCTACGCATACGCTATGATGAGCGGCGTCCCTGGAAATATATGATCTGCAGTGTACATTTTGAACCGCATTGTGTACGCCTAAGGAAATTGCGACCATGGGCAGTTCCTACCCTGGAGTTGGGTGACAATGTGCCGGATCAAATTTATACCAATGAACAGTGTCAGGAAATGGCCACCGATCTGAGCGAGGCTGAAACTGATGAGGAGGATGGCCTTCAGGAGGATGATGacgatgaggaggaggaggtggactTGGGACCTTTTATCAAGAAAGAAAAACGTAGTCGCTTAGATCCTTATTCAACTGGTCAATTAACAGCCTGGAAAGCTAAACAATGTTGCCTACCATATTGCCGCCGACCACGGGGTGACGGCATCCGGTTGTTCCGGCTGCCCAGCAATTGCAACTCTATCAAATATTGGGAACAGGCCACAGGCATGGTGTTCAAGGAGTCCCAGAGGAATACTCGCCTGATTTGCAGTCGTCACTTTGAACCGGAACTGATGGGAGTGCGGCGTCTTATGAGAAATGCCATCCCCACCAGGAATTTGGGCCCTCAAAGTGAAAGTTTCAGCAATGAGATTGAGATGGTGGTACCGACGCCCACAGGACCCATGTGCTGCATGGCTGATTGCACAACTGAAGGAAATACGAAACTGCATCAGTTTCCCAGAGATCCCACTCTGCTGCAACAATGGTGTCAATCCCTAAGACTGTCGGACTTTCAAAGCTATCGGGGCAAACATATTTGCTCCGCTCATTTGCCCGCTCAGGCCCTAACTTGCCTCATCTGTGGTGTCGACGACGTTCATCTACCTTTGCTCGATTTTCCCGAGAATCGCAATCATCGCGCCAAATGGTGTTATAATCTCAAAATCGAAACCATACCAAAGTGGGATACATCTAAGCACATTTGCTGCAAGCATTTCGAATCATACTGCTTTGTCCAACCGGGCGAACTATTACCCGATGCCGCACCAACATTGCATTTGAATCACAATGATACGAATATATTCCACAATGATTATACCATAGATGATCAGCAGCACTCCATGATCCGCATTAAAGATGAACCTCTGGACAATGACGACTTCTTATTGGTGTAG
Protein Sequence: MSQHNPHYHHSHPLHYPQHHQQQQQQQQHLHHQQQQQQQQQQQHKQINWYSHVASTSSPGSPYPSSAAANNNNHILNAYGTHGYYGAAGGGLNVNAVGGVSGGSSNNYNLDTANTVAYAHNQLLQYQQQQQQQHHLSQRSYMGGHHGIYPYIKSEPVEYANPMAPPPAPSEMRIKSEPTDEHAYKSNYIDDNTPFADFSKFNEFSEDMLSPKVELTVKDDSYGKNPNNYPRRKMQTERSEESLPICQRCKEVFFKKQSYLRHVAESSCGIQEYDFKCNICPMSFMSTEELQAHKQLHRVDKFFCHKYCGKHFDTIAECESHEYMQHEYDSFVCNMCSGTFPTREQLYNHLPQHKFQQRFDCPICRLWYQTAGELHEHRLAAPYFCGKYYTGAQPAAATQSHQSQSQQQSHQTNYKLQDCHMATMEMPTPPAATTTSHHKSSPSTSALPATAALSSLLQQRQANADGASMFSSTHKNEVNVKLERSYSNSTSESSFSMHESNYNNTYASDNSLHGGALGGPQAHSSTLDDSEDALCCVPLCGVRKSTSPTLQFFTFPKDEKYLHQWLHNLKMFHIPASSYTTFRICSMHFPKRCINRYSLCYWAVPTFNLGHDDVANLYQNRELTNTFTTGEIARCSMPHCSSQRGESNLKFYNFPKDIKSLIKWCQNARLPVQAKEPRHFCSRHFEERCIGKFRLKPWAVPTLHLGAHYGKIHDNPKNLYVEEKRCCLNFCRRSRSSDFNMSLYRFPRDEVLLRRWCYNLRLDPGVYRGKNHKICSAHFIKEALGLRKLSPGAVPTLHLGHNDTFNIYENELWPPPTPSSTPHSNHHQQHQHHHQQQHSHHSAQQHHSKAYQRHSAASTSSSASSASHYMDADMSGSYLGMGTSTGLNVTDSMDICCVPSCESKRHNNENITFHTIPRRPEQMRKWCHNLKIPEEKMHKGMRICSLHFESYCIGGCMRPFAVPTMHLGHDDEDIHRNPDVIKKLNIRETCCVAVCKRNRDRDHANLHRFPSNVPLLTKWCANLQRPVPDGTKLFNDAICEVHFEDRCLRNKRLEKWAVPTLILGHDDIAYQLPTPEEVAEFFARPSAPNNGEEQGECCVESCKRNPSVDDIKLYRPPEEAEVLSKWAHNLQLEVCELTNLRICNLHFESHCIGKRMRPWAIPTLNLSGNIENLYENPEHTMLYKRRTRDPNRDLSGQKPTWVPRCCLSHCRKVRALHNVQLYRFPKLNRSTLAKWAHNLQVPMVGSAQRRVCSAHFEPHVLSKKCPVPMAVPTLELNSPPGYKIYQNPAKLKASKLCLQRVCIVESCRKTRAQGVHLFRLPHSPTQLRKWMHNIRTRPRTAMRAQYRICSVHFETHSFNGKRLSAGAIPTLELGHQDDDIYPNEAQSFVEEHCAVEGCESTKEQAEVRLFRFPTDDDDLLWKWCNNLKMNPVDCVGVRICNKHFETDCVGPKHLFKWAIPTLALGHDDSQIELIPNPKPEDRYAEPLFKCCVPTCGKTRKFDEVQMNSFPKDPTLFQRWRHNLRLDYLDFKERERYKICNDHFEDICVGKTRLNIGSIPTLELGHEETEDLYQVNPADLQSNLFGRQRRLLGDSKQEEEAEEVEQEPELRPRVKVMEEATDLNTKQVKIKKSLAELKCCVRSCGRSRLEHGARLFPFPTGKQQQLKWRHNLQLEPHEVNKMTRVCSAHFNRRCIDGKHLRGWAMPTQQLGHKKHQNIYENPKNIPGFFTPTCALGHCRKRRSIDNDLRTYRYPRTDDMLEKWRANLRLAPDQCRGRICADHFEPQVRGKLKLKTGAVPTLKLGHDEGLVYDNEAIKAGLNEDEEASLGSPAVQVKKKEQKEEDQEEDGEDASAEMQDPAEDEQDDEQSGYFDPLELVETFAHDQSNPPDEDSPATPPPSAAPQLRRDKPANNVTPICCLKHCRKERTPKYLLSTFGFPKDQQLLLKWCANLQMELDDCIGRVCMEHFEAEVLGSRKLKQNAVPTLNVGHDFELPYTCNGQERSTEDQSVFRLWSLKHCRKRKQEEPPDMPVVKHEKTELKAEPKESKPKMCCLSHCGKMKRLQRLPQDQLLLNKWLRNLKLVMAKPTDPQELRLCLDHFEPHLVRNGELLAIALPTLNLGHQDPKIYRNTVSANESGCLVASCSCARLNLYRSCDLPKNPEIRQAWLRHLKLNPNTQGQLCVMHFMQLYEEIKIEPHSAELKSAYESIANSAQALKLRCAVPGCRSKYTDNIHLTRLPYDQHIFSKWLHNTKIEYDPSRHYIYRICLLHFEPDALGAVRPKSWAVPTLKLNHQEEIYLNSTKDEPQLHTPLHIKTEPSVPLRVKTELTALTSPSISSTPSPRGKIRICCIPTCLQQSSSQMRLYRFPTAESALLKWLVNTQQQPRLIDALQLYVCQTHFEPEAIVKKQLRSWAVPTLNLGHDGHIIPNAKHNGNIADSQETEQAMEFIRENYCSVLSCFQPRSEDLRLYEYPKDMPTIRKWAANCKHRSMQASSHGFQVCQLHFGPECFDPDTGDLREGSVPSLETNKSHAELHCLVSGCVKDDSTPRRRYYKLPKRSTQLAEWCHNLCMEPSELLPTDQHICERHFEPSCLNNYKQLRPGARPTLHLGHDQQVELLNNPEIFSEPPEEEVVCCVPQCERIQQPDEGPFSFFPKIRLLADKWLHNFRLESSKEQLGKLRVCLRHFETTCFENERVRLGAMPTLELGHDDRDVYHTDEQALGKGRKHHKKNSGLGMDCCYAQCAELQKNYQRVVYDLPVDEQLRSAWMQHIEVQEEEEQPPLKLCPLHFIILYEHSQEHFPEHAPEELLDHNYEDARNSVRIRLISCAVRDCKTIQPRDGGRLHGLPPRRDVSQMWLDNTQMEYFEPQRYMLKVCSKHFEPHCFTDSRKLKYWSMPTLHLPVEAVHKNLTEEEWQKMNDKPAEPSKEKKVEEENYEENSLLEPIVIMEHVESEKEEEEEQEKVVEVEDEQLTPELVIDERTQDTEEHQEEEMEELEVLLEVGHVEKCASYEKMDQKSHLPYSQEASATPSHSANSALRNQYNARHCSVQGCQTSSHDIDGQIKLHKFPTSTDATRKWMHNTQVDVDESVSWRYRICSYHFEQDCFNGARIRKGSMPTLHLGRSRPEEIYENEFAQMEMEESLVMETPPAATTSWETSSKGEVSQLFLPRPAPPRKSSKFCQIEGCPNHLTSENMTLHKFPHSVDICERWQHNTQVPFDPEYRWRYRICSAHFKSVCLVNMRLLHGSVPTLKLGPRAPAQLFDNDFDAMHSRLDKKQTQSAVKHEKSQQYHQYQPENEMYFEPEWDEEEEADDLEQEEDGEEPHTSFSTPFDSWRHQLRLPAVKQEKSPYNPIKSGYDKCSLVHCQRQRSLHGVHIFKFPRSRRHQQRWMHNLRIRYDERRPWKYMICSVHFEPHCVRLRKLRPWAVPTLELGDNVPDQIYTNEQCQEMATDLSEAETDEEDGLQEDDDDEEEEVDLGPFIKKEKRSRLDPYSTGQLTAWKAKQCCLPYCRRPRGDGIRLFRLPSNCNSIKYWEQATGMVFKESQRNTRLICSRHFEPELMGVRRLMRNAIPTRNLGPQSESFSNEIEMVVPTPTGPMCCMADCTTEGNTKLHQFPRDPTLLQQWCQSLRLSDFQSYRGKHICSAHLPAQALTCLICGVDDVHLPLLDFPENRNHRAKWCYNLKIETIPKWDTSKHICCKHFESYCFVQPGELLPDAAPTLHLNHNDTNIFHNDYTIDDQQHSMIRIKDEPLDNDDFLLV

Similar Transcription Factors

Sequence clustering based on sequence similarity using MMseqs2

100% Identity: iTF_00914540;
90% Identity: iTF_00915368; iTF_00919848; iTF_00914540; iTF_00917248; iTF_00916271;
80% Identity: -