Basic Information

Insect: Drosophila multiciliata
Gene Symbol: -
Assembly: GCA_037043605.1
Location: JBAMBF010000103.1:2730400-2744364[-]

Transcription Factor Domain

TF Family: THAP
Domain: THAP domain
PFAM: PF05485
TF Group: Zinc-Coordinating Group
Description: The THAP domain is a putative DNA-binding domain (DBD) and probably also binds a zinc ion. It features the conserved C2CH architecture (consensus sequence: Cys - 2-4 residues - Cys - 35-50 residues - Cys - 2 residues - His). Other universal features include the location of the domain at the N-termini of proteins, its size of about 90 residues, a C-terminal AVPTIF box and several other conserved residues. Orthologues of the human THAP domain have been identified in other vertebrates and probably worms and flies, but not in other eukaryotes or any prokaryotes [1].
Hmmscan Out: # of c-Evalue i-Evalue score bias hmm coord from hmm coord to ali coord from ali coord to env coord from env coord to acc

1 30 6.5 1.1e+04 -2.8 2.9 49 62 338 357 321 373 0.56

2 30 7.2 1.2e+04 -3.0 0.2 21 71 392 441 371 455 0.51

3 30 8.4e-15 1.4e-11 44.9 4.2 1 86 574 646 574 647 0.85

4 30 3.1e-15 5.3e-12 46.3 4.6 1 87 674 743 674 743 0.83

5 30 7.6e-16 1.3e-12 48.2 0.4 1 87 765 837 765 837 0.85

6 30 6.6e-16 1.1e-12 48.4 5.7 1 87 934 1004 934 1004 0.83

7 30 9.3e-15 1.6e-11 44.7 3.4 1 86 1028 1099 1028 1100 0.81

8 30 5.9e-13 1e-09 39.0 1.0 1 87 1135 1203 1135 1203 0.80

9 30 3e-11 5.1e-08 33.5 2.0 1 86 1251 1320 1251 1321 0.76

10 30 4.8e-17 8.2e-14 52.1 0.4 1 86 1348 1417 1348 1418 0.82

11 30 2.9e-12 4.9e-09 36.8 0.7 1 86 1439 1508 1439 1509 0.81

12 30 2.9e-15 4.9e-12 46.4 1.7 1 87 1536 1608 1536 1608 0.85

13 30 4e-14 6.7e-11 42.7 2.2 1 85 1684 1752 1684 1754 0.82

14 30 3.7e-12 6.3e-09 36.4 0.1 1 86 1777 1845 1777 1846 0.81

15 30 6.6e-14 1.1e-10 42.0 0.8 1 86 2002 2070 2002 2071 0.81

16 30 2.8e-11 4.7e-08 33.6 0.2 1 61 2124 2178 2124 2200 0.79

17 30 1.6e-05 0.028 15.1 0.1 1 58 2205 2256 2205 2280 0.79

18 30 2.3e-11 3.9e-08 33.9 0.6 1 86 2295 2364 2295 2365 0.83

19 30 2.3e-14 3.9e-11 43.5 1.0 1 87 2423 2493 2423 2493 0.81

20 30 8.4e-13 1.4e-09 38.5 1.1 1 86 2528 2599 2528 2600 0.83

21 30 2.3e-12 3.8e-09 37.1 1.7 1 87 2610 2682 2610 2682 0.81

22 30 4.6e-13 7.8e-10 39.3 0.7 1 87 2705 2775 2705 2775 0.78

23 30 1.1e-06 0.0018 18.9 0.1 1 58 2808 2861 2808 2875 0.85

24 30 4.4e-15 7.4e-12 45.8 0.3 1 86 2899 2971 2899 2972 0.80

25 30 5e-14 8.5e-11 42.4 1.4 1 86 3106 3178 3106 3179 0.81

26 30 1.3e-14 2.2e-11 44.3 1.9 1 87 3242 3313 3242 3313 0.82

27 30 8.9e-14 1.5e-10 41.6 4.9 1 85 3426 3495 3426 3497 0.84

28 30 2.3e-13 3.9e-10 40.3 0.1 1 87 3589 3659 3589 3659 0.85

29 30 2.4e-08 4e-05 24.2 0.3 1 58 3676 3724 3676 3740 0.87

30 30 2e-08 3.4e-05 24.4 1.7 18 87 3741 3799 3730 3799 0.76

#	of	c-Evalue	i-Evalue	score	bias	hmm coord from	hmm coord to	ali coord from	ali coord to	env coord from	env coord to	acc
1	30	6.5	1.1e+04	-2.8	2.9	49	62	338	357	321	373	0.56
2	30	7.2	1.2e+04	-3.0	0.2	21	71	392	441	371	455	0.51
3	30	8.4e-15	1.4e-11	44.9	4.2	1	86	574	646	574	647	0.85
4	30	3.1e-15	5.3e-12	46.3	4.6	1	87	674	743	674	743	0.83
5	30	7.6e-16	1.3e-12	48.2	0.4	1	87	765	837	765	837	0.85
6	30	6.6e-16	1.1e-12	48.4	5.7	1	87	934	1004	934	1004	0.83
7	30	9.3e-15	1.6e-11	44.7	3.4	1	86	1028	1099	1028	1100	0.81
8	30	5.9e-13	1e-09	39.0	1.0	1	87	1135	1203	1135	1203	0.80
9	30	3e-11	5.1e-08	33.5	2.0	1	86	1251	1320	1251	1321	0.76
10	30	4.8e-17	8.2e-14	52.1	0.4	1	86	1348	1417	1348	1418	0.82
11	30	2.9e-12	4.9e-09	36.8	0.7	1	86	1439	1508	1439	1509	0.81
12	30	2.9e-15	4.9e-12	46.4	1.7	1	87	1536	1608	1536	1608	0.85
13	30	4e-14	6.7e-11	42.7	2.2	1	85	1684	1752	1684	1754	0.82
14	30	3.7e-12	6.3e-09	36.4	0.1	1	86	1777	1845	1777	1846	0.81
15	30	6.6e-14	1.1e-10	42.0	0.8	1	86	2002	2070	2002	2071	0.81
16	30	2.8e-11	4.7e-08	33.6	0.2	1	61	2124	2178	2124	2200	0.79
17	30	1.6e-05	0.028	15.1	0.1	1	58	2205	2256	2205	2280	0.79
18	30	2.3e-11	3.9e-08	33.9	0.6	1	86	2295	2364	2295	2365	0.83
19	30	2.3e-14	3.9e-11	43.5	1.0	1	87	2423	2493	2423	2493	0.81
20	30	8.4e-13	1.4e-09	38.5	1.1	1	86	2528	2599	2528	2600	0.83
21	30	2.3e-12	3.8e-09	37.1	1.7	1	87	2610	2682	2610	2682	0.81
22	30	4.6e-13	7.8e-10	39.3	0.7	1	87	2705	2775	2705	2775	0.78
23	30	1.1e-06	0.0018	18.9	0.1	1	58	2808	2861	2808	2875	0.85
24	30	4.4e-15	7.4e-12	45.8	0.3	1	86	2899	2971	2899	2972	0.80
25	30	5e-14	8.5e-11	42.4	1.4	1	86	3106	3178	3106	3179	0.81
26	30	1.3e-14	2.2e-11	44.3	1.9	1	87	3242	3313	3242	3313	0.82
27	30	8.9e-14	1.5e-10	41.6	4.9	1	85	3426	3495	3426	3497	0.84
28	30	2.3e-13	3.9e-10	40.3	0.1	1	87	3589	3659	3589	3659	0.85
29	30	2.4e-08	4e-05	24.2	0.3	1	58	3676	3724	3676	3740	0.87
30	30	2e-08	3.4e-05	24.4	1.7	18	87	3741	3799	3730	3799	0.76

Sequence Information

Coding Sequence: atgtcacaacaacaacacaatccCCCTTCACATcaccaacatcaacatcactactatcagcaacagcagcaacaacaacaacatcaacaacatcatctgcagcagcagcatttgcagcacaaacaaatacaacaacaacaacacagttGGTACTCACATGTTGCTTCCTATCAGCCCCCGCATGCCGCTGCCTTTGCGTCTCCctgcaaaagcagcagcagcaacaacaataacaacaacaaccacattaTGAATGCATACGGCACGGGTGCAGGAGCTTATTATGGCTCAACGGGAGCGGGTGGCGTTGGGGCTGGCTATAACCTTGAGGCCAATACTGTGGCCTATGCGCACAACCAGCTGCtgcaataccaacaacaacaacagcagcaacaacagcagcagcatcagcaacaacaacatcagcagcatctCAGTCAGCGCTCGTATATGGCACCGCATATAATGCACAGCTCGTATCCGTACATTAAGAGCGAACCATTGGAGCCACTACCCGAAcgccatcagcagcagcaacagcagccacaactcTTTCAGAACCCTATGGCACCGCCGCCAGCACCCGCCATTGCTAATCGTCATTCGCTGGATGCTAGTGGCgaaatgataattaaatCGGAACCCATTGACGAACATGCTTTCAAGTCCAACTATATCGATGATAACACTCCCTTTGCGGATTTTAGTAAATATCCTGAATTCAGCGACGATATGCTAAGTCCAAAACTTGAGCTAAATGTCAAGGATGAGGCCTATGGAAACCAAAAAAACCCGCTGATCTACCCACGGCGCAAGCTGCAAACGGATCGCTCCGCGGAGAATATGCCGATTTGCCAGCGTTGCAAAGAGGTGTTCTTCAAGAAGCACATTTACCTGCGACATGTGGCCGAAAGCAGTTGCAACATACACGAGTATGAGTTCAAGTGCAACATCTGTCCCATGTCCTTTATGGGCGCCGAGGAGCTGCAGAAGCACAAGCATCTGCATCGAACCGACGAGTTCTTCTGCCACAAATACTGCGGAAAGCACTTCGACTCGATTGCGGAGTGCGAAGCGCACGAGTACATGGAGCACGAGTACGATAACTTTGTGTGCAATATGTGCTCCGTTACGTTCCCCACACGGGAACAGCTGTATGCCCATTTGCCGCAACATAAGTTCCAACAGCGTTACGATTGCCCCATTTGCCGTTTGTGGTATCAAACGGCATTAGAGCTCCACGAGCATCGACTGGCGGCACCCTACTTCTGTGGCAAGTATTACGCTGCAgcacaccagcaacagcagcagcagcaacagcaacaacagcaacaacaacaacaacagcagcagcagcatacacaacaacatcagcaacagggCAACTACAAACTGCAGGATTGTCACATGGGCACCATTGAAAtGACTCCACCGCAGCACAAGGCTAATACGGCATTACCAGCAACGGCGGCGCTCAATTCGCTGTTGCAGCAACGCCAGGCGAACGCTGATGGCGCCGCCTTATATGCCTCGGCGCTGAAGAGCGAGACGAACGTAAAACTGGAGCGCAGCTATAGCAACTCCACCAGCGAGTCTGGTTACAGTATGCACGAGAGCAGCTACAACAATGCCTACGCCAGCGACAATTCTCTTCATGGCGGGGCAATTGGTGGTCCGCAGGCGCATTCCTCGACGCTGGACGATTCGGAGGATGCGCTGTGCTGTGTGCCACTGTGCGGGGTGCGCAAAAGCACCAGCCCGACGCTGCAATTCTTTACATTTCCCAAAGATGACAAATACTTGCATCAGTGGCTGCACAATCTAAAGATGTTCCACATTCCCGCGTCGACCTATGTCAGCTTTCGCATCTGCAGCATGCATTTTCCCAAGCGTTGCATCAATCGTTACTCTCTGTGCTATTGGGCGGTGCCCACGTTTAATCTGGGCCACGACGATGTAGCCAATCTCTATCAGAACCGTGAGCTGACCAACACATTCACCACCGGCGAGGTGGCCCGCTGCAGTATGCCAAACTGCACTAGTCAGCGTGGCGAGAGTAATCTGAAGTTCTACAACTTTCCCAAGGACATCAAGAGTTTGATTAAGTGGTGCCAAAACGCTCGCCTGCCCGTCCAGGCCAAGGAACCGCGTCACTTCTGCAGTCGCCACTTCGAAGAGCGCTGCATCGGCAAGTTCCGGCTGAAGCCCTGGGCAGTGCCCACGTTACACCTGGGCGCCCAGTACGGCAAGATTCATGACAATCCGAAAAATCTGTATGTGGAGGAGAAGCGCTGCTGCCTCAACTTTTGTCGTCGCAGTCGCTCCTCCGACTTCAACATGTCGCTGTATCGCTTCCCCAGAGATGAGGTGCTACTGCGTCGTTGGTGCTACAATCTTCGCCTTGATCCCGCTGTCTATCGTGGCAAGAATCACAAAATTTGCAGTGCACACTTTATCAAGGAAGCTTTGGGATTACGCAAACTATCTCCAGgTGCTGTGCCCACGCTGCATCTGGGTCATAATGACACCTTCAACATCTACGAGAACGAACTGTGGCCACCGCCAACGCCctccacgcccacacacaatcatcagcagcaccagATGCAGCCAcaccagctgcaacagcagcagccgcatcaAGTGCATCATAAATATCAGCGGCACTCGGCTGCATCCACATCATCGTCGGCCTCATCGACATCACATTATGTGGATCCGGAGTTAAGTGCATCCTACATGAGCATGGCCGCTGGTGGTTCATCCTCTGGCCTTAATGTCAGCGATAGCATGGACGTCTGCTGTGTGCCCAGCTGCGAGAGCAAGCGTCACAACAATGAGAACATCACATTCCACACAATACCCAGGCGGCCAGAACAGATGCGCAAGTGGTGTCACAATCTTAAGATACCCGAGGACAAGATGCACAAGGGCATGCGTATATGTAGCTTGCACTTTGAGCCCTACTGCATTGGCGGCTGCATGCGTCCGTTTGCGGTGCCCACATTGCATCTGGGCCACGACGACGAGGACATTCATCGCAATCCGGATGTGATCAAGAAGCTCAACATACGCGAAACCTGTTGCGTGGCTGTTTGCAAGCGCAATCGTGACCGGGACCATGCCAATCTGCATCGCTTTCCCAGCAATGTGCCGCTGCTTACCAAATGGTGCGCAAATCTACAGCGTCCTGTGCCGGATGGCAGTAAACTCTTCAACGATGCCATCTGTGAGGTGCACTTTGAGGATCGGTGTCTGCGCAACAAGCGGCTAGAGAAGTGGGCAGTGCCCACACTCATCCTTGGGCATGAGAATATACCCTATCCATTGCCCACACCAGAGCAGGTTGCCGAGTTCTATGCGCGTCCCAGTGCGCCTAACAATGGCGAGGAGCAGGGCGAGTGCTGTGTGGATACCTGCAAGCGTAATCCCAGTGTCGATGACATCAAGCTATATCGCCCGCCTGAGGAGTCGCAGGTGCTGGCCAAGTGGGCACACAATCTGCAACTGGAGATTGCTCAGCTGCCCAATATGAGAATATGCAATCTACATTTCGAATCACACTGCATTGGCAAGCGGATGCGCCCCTGGGCAATACCCACGCTCAATCTGGCAACCAACATAGAGAATCTCTACGAGAATCCCGAACAACAGATGCTCTACAAGCGACGAACGCATCTCAAGCCGGGCAGAGCAGCCCGAGGCTCAGAAGGAAGCGCTGGTGGTGTGAAGCCCACCTGGGTGCCAcgctgctgcttgccgcaCTGCCGTAAGGTGCGTGCCACACACAATGTGCAGCTCTATCGCTTCCCCAAACTCAATCGCTCCACACTGGCCAAGTGGGCGCATAACCTGCAGGTGCCCCCCGTGGGCAGCGCCCAGCGTCGCCTCTGCTCCGCACACTTTGAGCCGCATGTGCTCAGCAAGAAATGCCCAGTGCCCTTGGCGGTGCCCACACTGGACCTCAACACACCATCCGGGTACAAGATCTATCAGAATCCGGCCAAGCTCAAGGCCAACAAGCTGTGCTTGCAGCGCGTTTGCATTGTGGAGAGCTGCCGGCGTCAGCGGGCACAGGGTGTGCAGCTCTTCCGTCTGCCTCACAGCCCCACCCAGCTGCGTAAGTGGATGCACAACATCCGGATGCGTCCCAGAGGCGCTATGCGACAACAGTACCGCATCTGCTCGAAGCACTTCGAGACGCACTCATTCAACGGGAAAAGACTCAGCAACGGAGCAATTCCAACGCTTGAATTGGGCCATGAGGACGAAGACATATTTCCGAATGAGGCGCAGTCTTTCCTGGAGGAGCACTGCACCGTCGAGGGCTGCGATGCCGTCAAGGAGCAGCCGGATGTGCGTCTCTTCCGCTTCCCCATCGATGATGAGGATCTGCTGTGGAAGTGGTGCAACAATCTGAAAATAAGTCCAGTCGACTGCATCGGCGTTCGCATCTGCAACAAACACTTTGAGGCTGATTGCATTGGACCCAAGCATCTGTATAAGTGGGCCATTCCCACGCTCTCCCTTGGCCACGATGATGAGGACATCGAACTGATGCTAAATCCCAAGCCAGAGGATCGCTATATTGATCCGGTCTTCAAGTGCTGTGTGCCTTCGTGCGGCAAGACGCGTAAATTCGATGAAGTGCAGATGAACAGTTTTCCCAAAGATCCGGAGGTCTTCCAGCGATGGCGCCACAATCTCCGCCTCGAGCATCTCATCTTCAAGGACCGCGAACGCTATAAGATCTGCAACGACCACTTCGAGGAGATTTGCATTGGTAAGACGCGCCTAAACATTGGGTCCATACCAACACTGAATCTTGGCCATGACGAGACTGATGACTTGTTCCAAGTCAATCCCGAGGCGCTGCAGAGCAATCTCTTTGGACGCCAGCGACGCGTCCAAGATTCTATGAGGATCAACATTAAACAAGAGGCGCACTCCGATCTGGATGAAGACATTAAACCGGACATAAACATGACGGATGCCACAGATTCCCATACCAAACCGgttaaaaacaagaaatctTTTACCGATTTTAATTGCTGTGTGCCGAACTGTGGTCGCAGTCGTCTGGAGCACGGTGCCCGCCTCTTTTCGTTCCCGAACgggaaacagcagcagagcaagTGGCGCCACAATCTGCGGCTACATGCTGCCGATGTGGACAAGACGACACGCATCTGCAGCGCCCACTTCAATCGCCGTTGCATCGATGGCAATCAGCTGAGGGGCTGGGCAATGCCCACACAGCAGCTGGGCCATCAGGAGCTTCCGATCTATGAGAATCCAAAGAATATTCCGGGCTTCTTCACGCCCACCTGTGCGCTGGGTCACTGCCGTAAGCGGCGCAGCATTGACAACGACCTGCGCACATATCGCTATCCACGCAGCGAGGAGCTGCTCGAGAAGTGGCGCGCGAATCTACGCTTATCGCCGGATCAATGCCGCGGACGCATCTGTGCTGATCATTTTGAGCCGCTGGTGCGCGgcaagctgaagctgaagacAGGCGCAGTGCCTACGCTCAAATTGGGTCACGACGAGGGCGTGATCTTTGATAACGAAGGCATTAAGGTGAGTCTGCAGCAGGAGGACGAGGCGGAGGAAGAAGAGGGCGATGCCAGCATGAAGTCGTTGGTCAAAGTAAAGACTGAGCAGGAGGATGAGCAGGAGCTAGAGAATGAAGATGAtgagcagcaagagcagcagcaggatctAGAGCAGGAGCATGATCAAGATATGATCGAGGATGGGGATGAGCATCGGGACTCTGAGGAACATGGCTATTTCGATCCCTTGGAACTTGTGGAAACGTACGCTGAGCACCACAGCGATGATACTTCTGCCGGACACGATAAtctcgatgatgatgaggatgatgaagACGAAGACATTCCCGGCAATGATGATGAGCTGCTTCTGCCTGACACGCGGCCACTTCGAATGCCAATGGCTCCGCGGCGCGAGAAGGCTGTGAATAATGTGACGCCGATTTGCTGCCTGAAACACTGTCGCAAGGAGCGCACCGCCCTCCATCATCTGAGCACCTTTGGCTTCCCCAAGGatccgcagctgctgctcaagTGGAGCGCCAATCTGCAGCTGCCCTTGGAGTCCTGCATGGGTCGTGTATGCGTCGAGCACTTTGAGCCCTCGATGCTGGGCACGCGCAAGCTGAAGCAGAATGCGGTTCCCACCTTGAAACTGGGCCATGCCACACCGCTCACCTACAGCTGCAATGGTCGGATGCTGTCGGGCATATATGATGAACAGCCGCAACATTCGGTTTTTCGGCTTTGGAGCCTGAAACACTGCCGCAAACGGAAACCTGATTTGGAGGAGATTAAGCCTGTTCGTCGTTGTTGCCTGCCAAGTTGCGGCAAGCAGTCGGAGCTGCATGGCGTCCAGCTGCAGCGTCTGCCCAAGGATCGTCTGACACTGCGCAAATGGTTGCACAACCTGAAGCTGCCGCTAACGATTGACTCCACTCAAATGTTCCTCTGCAGCGATCACTTTGAGCTGAATGCGCCGTGTCCCACCTTGAAACTGGGCCATTCGGATACCAATATTTATCGCCACAATGTGGCCAGCACCAGCGGCAGCTGTCTCGTGCCAAAATGCCCTTGTGCTCGTCTCAATCTCTATCGTGGCTACGATCTGCCCGCAAATCCGCAGGTGCAACAGGCCTGGCTACACTGGTTGCAGCTCCCCCATCCGCAGCCGTCGCCCAGGCACACCCAGCTGTGTGTGATGCACTTTATGCAGCTCTTCGAACTGGTGCCGCTGCCCGAGTCGGTACCAGATGTTGTGCGCCGGCAGCTGCGTGAGACTTACGAACTGATATCCGGCTCCAGCATGGCCATGAAGCTACGTTGCGCTGTGCCCGGCTGTTACTCAAAGTATACGGATAATGTGCGTCTGACCAAACTACCCGTTTGCCCCAACACCTGCGCCAAGTGGGTGCACAATACCAAGATCCAATACGATCCGGCCCGACATTATGTCTATCGCATCTGCATGTTGCACTTTGAGCCAGGCTGCCTGGGCCCAGTGCGTCCCAAATTGTGGGCAATGCCAACGCTGCAGCTGCACCACGAGGATGCcgacataaatttaaatccaaAGCTGAGTGGCAGCCAAGCGCGGCCGTCCGTGCCACTGGAGTTGCCGCTGCGCATCAAAACTGAGCTGCCGATGTGCAACAGTCCCAGCTTTAGTGCGAGTGCGAGTCCCAGTCCGCGTGGCAAGCTGCGCACCTGCTGCATTCCCAGCTGCGGTCAGCAGGCTTCGGCCCTGTTGCGCCTCTTTCGCTTTCCCAGCGCGGAGACGTCGCTGCTGAAGTGGCTGGTgaacacacagcagcagccgcgtTTTGTCGATGCACAACGACTGTTCGTCTGCCAGGATCACTTCGAGGCGGAGGCCATTTGCAAGAATCAGCTGCGCAGCTGGGCGGTGCCAACACTGAATCTCGGACACGATGGACACATCATACCGAATGCCAAGCACAATGGCAACATTGCCGACAGCCAGGAGAACAAACAGACGCTGCAGTTCATTTGGGCCAACTACTGCTCGGTGCTGACCTGCTTCCAGcagagcagcgagcagcagcgTCTCTACCAATACCCCACAGATCGGCCAACTATTCGCAAGTGGGCCGCCAATTGTAAGCATCGCTCCATGCAGGCCAGCAGCGATGGATTCCAGGTGTGCCAGTCACATTTTGCGCCGGATTGCTTTGATTCTCTTACCGGGGAGCTGAAGGAAAACGCTGTGCCCACACTGGCCCTGAACCGTGCTGTGACTGAGGTGCGCTGTGTGGCCAATGGTTGCGTTAAAGACGAAGATGCATCGCGTCGCCGTCTGTTCAAGATGCCCAAGCGGACCCCACAGTTAATGGATTGGTGCCACAATTTGCACCTGGATCATGCCGCCGTGAGTGGCTCGGAACAGCACGTTTGTGAACGCCACTTCGAAGTTAACTGCTTCAATTCATATAAAATGCTACGTCCAGGAGCACGGCCTACACTTCATTTAGGTCATGAGGATCTAGACGATGTGATACCCAATCCGGCGAACTGGGAAGAGGATGTCATCTTGTGTTGTGTACCGCACTGCGAGAATTCCAAGGATGCGGATGAAGTGCAAATGTTTGGACTGCCAAAGGTGCGCCAATTGGCGGACAAGTGGCTGCAAAATGCGCACCTCTATCCCAAAGAACAACAACCCAATCTGAAGTTTTGCAGTGTGCATTTTGAGGCTAGCTGCTTGGAAAATGGACGACCTACGTATGGTGCAATGCCCACACTCCATTTGGGCCACGATGAGCTCCACAACATACACCCAAGCGTAGAGTCGTTGCCGGCGCAGCAGAAGCGCTACTGCAATAGAGATGGGGCCAGACACGACTGCTGCTATCCGCAGTGTGTGGAGCTGCAGAAGAGCTATTTGCGGGTCACCTACGAGCTGCCCCAGGAGCAGGAGCTTCGTCAGCAGTGGCTTTCCTTTATGGGCCTAGAGGCGCAGCAGCCCGATAAGCAGGAGCTGCCCAAGCTCTGTCCACTTCACCTAATCGTGCTCTATGATCACAGTGCGGATCACTTGTCGGCACACGCCTCTGAGGAGCTGCTGGACTCCAATTATGATGCAGCGCGCAGCAGCGTTCGCATACGCGTTGTCAGCTGTGCGGTGCGCGGCTGCAAAACGCTCAAGCCACGCGACGGTGGTCGGCTGCACGGCTTGCCCACGCGTCGAGATCTGCTGGAGATGTGGCTGCACAACATGCAGCTGGTGTTTTACGAGCAGCAGCGTTATATGTACAAGATATGCAGCAAGCACTTTGAGCCCAAATGCTTTACGGAGACAACCAAGCGCTTGAAGCCATGGAGCATGCCTACGCTGAAGTTGCCGGAGCTTCAATCGGGCGATATGCCAGCCTATCAGAATCCCACAGAGTTGGAGTGGCTACACATGAACGAGCTGCAGGTCAGCGAAAAAGTTGTTGAGGCTCTGCCGGATCCCTTACTCAACCTGGATCCGTTGCCCGAGAAGGAGCCACCACCACCCCAGGTTATTGAATATGAAGAGGATTGCGATAATAACTCACAGCAGCCACTAGAAATGCAGGCGCTGGAGGTGCTGCTCGAGGTGGGTCATGTCGAGAAGTGCACCACCTACGAGCAAATGGATACCGAGGCAAATCTCAGCTATGCCGAACAGTTCTCGCACAATCCCCTGAGTCCAAGTCCACCCCAATGCCGTATACCCGTTGTCCAGAATGGACTCCACTACAGCGCACGGCAGTGCAGCGTGCATGGCTGCAATGTCACCTCGAATAAtctgagcagcagcatcaagcTGCACAAGTTCCCCGTCTCGCTGGATGCCATGCAAAAGTGGATGCACAACACCCAAGTGCTCGTGGACGTCAAATTCGCTTGGCGCTTTCGCATCTGCAGTCATCATTTCATCGAGGATTGCTTTCACGGCTCACGCATCAGGCGTGGCGCGATGCCCACGTTGCGACTGGGCTCACGTCGTCCGAAGCATATCTATGATAATGAGTTCAACGcccaactgcaactggaactgACTAAGGAAGAGACCAAGGATGCACTCGCTGCACCACTGGAGTctcagcaacagttgctctcTGCAAATGTAGGTCTTCGTCTGCCGCGTCCTGCACCGCCCTGCAAATCTAGCAAATACTGTCAGATCGAGGGCTGCTCAAATCATTTGACCAGCGAGAATGTGACGCTGCACAAGTTCCCCCATTCGTCGGACATGTGCGCCAAGTGGCAGCATAACACTCAGGTGCCCTTCGATCCCGAGTACCGCTGGCGCTATCGCATCTGCAGCGCACACTTTGAGCCCATCTGTTTAGGCAATGTGCGATTGATGCACGGCAGTGTGCCCACCCTGAATCTGGGACCGCTTGCGCCGAAGAAACTGTTTGACAATGAATTCTTGCGCCTGGACAAGCCAATGATTAGTTCAGAGCTGGGCATGACAGTCAAGCCTGAGCAAATGGAGCAATTTGATCAACTAGAGCTTGAAGATGGCAACCAGGAGCGGGATGATTTCAGTTTGCTGGAGCCCGAGCTGCAGTTGCACGAGGGTAGCGAGGATGAGCAACAATATGACAATCATTTCAGACAAAACGATTCCTATAACTGGTCCGATCAGCAGCTGCGTCTGTCCAGCAATAATCAGGAGAATTCCACAATTAGCTACAATCCAGTCAAGTCCGGCTATGATAAGTGCTCACTGGTCCACTGCCAACGACAGCGTTCCCATCACGGCGTGCACATCTACAAGTTTCCGCGCTCGCGTCAGTTGCAGCAACGATGGATGCATAACTTGCGCATCCAATACGATGAGCGACGGCCGTGGAAGACAATGATTTGCAGTGTCCATTTCGAACCACACTGCATCCGTCTGCGCAAATTGCGTCCCTGGGCGGTGCCCACGCAGGATCTGGGAGACAACGTGCCACAGGAAATCTTTACGAATGAGCAGAGTCACCGGCTGTTTGCTCAATCCGAAGCAGGCAGCGAGTGTGATGAGGTTGAAGTGGATGTTGAGGACACCATACTGGAGGACTTGGATGATGACTATGATGACAATGATGCTGATTTGAATATGGATGCTAAAGATCAAATGCGAACAGCTCCATATGGGAAAAGTGACCGTCGCTCTCGATTTGAACAATTGCCGCCTGGTCAGCTGCCACCGTGGAAGATCAAATGCTGTTGTTTGCCCTATTGCCGCAGTCCTCGCGGTGATGGCATTAAGCTCTTCCGACTGCCCAACAACATTAGCTCCATTCGCAAATGGGAGCAGGCCACAGGCATGCGCTTCTATGAGTCCCAGCGCAACACAAAGCTCATCTGCAGTCGGCACTTTGATCCGCAGCTTATAGGCGTGCGTCGTCTCATGTCGAATGCGGTGCCAAGCCTCAATTTGGGCCCAGACAGCGCAGAGCCCGAGCTGCCTCTTGTGGGACCACGGTGCTGCATGTCCGATTGTTTTGAGGATGTCAACGTCGAGCTGCACAAGTTTCCCAGTGATCCCATGCTGCTGCATCAATGGTGTCAGGCGCTCAATTTACCGGATGTTCAAAGCTACACTGACAAACTCATATGTGCCGCACATCTGCCCGCCAACGCGATGAGCTGTCTAATTTGTGGCGTGGACGATGTACAGCTGCCAATGCTGGACTTTCCCCAGAATCGCAATCAGCGCACCAAGTGGtgctacaatttaaaaatagagcCTCTGCCCAAATGGGATAACTGTAAGCAAATTTGCTGCAAACACTTTGAGAGCTACTGTTTTATCCAGCCTGGCCAACTGCTGGCGGAGGCAATGCCCACACTACACTTGGAGCACGGGGATAGCAACATATTCCTAAACGAGGACGCCATGTATAACAGCAAGTTGTTGCGCATTAAGGACGAGCCCGTGGAGAGCGAGGATCTGATGCTATAA
Protein Sequence: MSQQQHNPPSHHQHQHHYYQQQQQQQQHQQHHLQQQHLQHKQIQQQQHSWYSHVASYQPPHAAAFASPCKSSSSNNNNNNNHIMNAYGTGAGAYYGSTGAGGVGAGYNLEANTVAYAHNQLLQYQQQQQQQQQQQHQQQQHQQHLSQRSYMAPHIMHSSYPYIKSEPLEPLPERHQQQQQQPQLFQNPMAPPPAPAIANRHSLDASGEMIIKSEPIDEHAFKSNYIDDNTPFADFSKYPEFSDDMLSPKLELNVKDEAYGNQKNPLIYPRRKLQTDRSAENMPICQRCKEVFFKKHIYLRHVAESSCNIHEYEFKCNICPMSFMGAEELQKHKHLHRTDEFFCHKYCGKHFDSIAECEAHEYMEHEYDNFVCNMCSVTFPTREQLYAHLPQHKFQQRYDCPICRLWYQTALELHEHRLAAPYFCGKYYAAAHQQQQQQQQQQQQQQQQQQQQHTQQHQQQGNYKLQDCHMGTIEMTPPQHKANTALPATAALNSLLQQRQANADGAALYASALKSETNVKLERSYSNSTSESGYSMHESSYNNAYASDNSLHGGAIGGPQAHSSTLDDSEDALCCVPLCGVRKSTSPTLQFFTFPKDDKYLHQWLHNLKMFHIPASTYVSFRICSMHFPKRCINRYSLCYWAVPTFNLGHDDVANLYQNRELTNTFTTGEVARCSMPNCTSQRGESNLKFYNFPKDIKSLIKWCQNARLPVQAKEPRHFCSRHFEERCIGKFRLKPWAVPTLHLGAQYGKIHDNPKNLYVEEKRCCLNFCRRSRSSDFNMSLYRFPRDEVLLRRWCYNLRLDPAVYRGKNHKICSAHFIKEALGLRKLSPGAVPTLHLGHNDTFNIYENELWPPPTPSTPTHNHQQHQMQPHQLQQQQPHQVHHKYQRHSAASTSSSASSTSHYVDPELSASYMSMAAGGSSSGLNVSDSMDVCCVPSCESKRHNNENITFHTIPRRPEQMRKWCHNLKIPEDKMHKGMRICSLHFEPYCIGGCMRPFAVPTLHLGHDDEDIHRNPDVIKKLNIRETCCVAVCKRNRDRDHANLHRFPSNVPLLTKWCANLQRPVPDGSKLFNDAICEVHFEDRCLRNKRLEKWAVPTLILGHENIPYPLPTPEQVAEFYARPSAPNNGEEQGECCVDTCKRNPSVDDIKLYRPPEESQVLAKWAHNLQLEIAQLPNMRICNLHFESHCIGKRMRPWAIPTLNLATNIENLYENPEQQMLYKRRTHLKPGRAARGSEGSAGGVKPTWVPRCCLPHCRKVRATHNVQLYRFPKLNRSTLAKWAHNLQVPPVGSAQRRLCSAHFEPHVLSKKCPVPLAVPTLDLNTPSGYKIYQNPAKLKANKLCLQRVCIVESCRRQRAQGVQLFRLPHSPTQLRKWMHNIRMRPRGAMRQQYRICSKHFETHSFNGKRLSNGAIPTLELGHEDEDIFPNEAQSFLEEHCTVEGCDAVKEQPDVRLFRFPIDDEDLLWKWCNNLKISPVDCIGVRICNKHFEADCIGPKHLYKWAIPTLSLGHDDEDIELMLNPKPEDRYIDPVFKCCVPSCGKTRKFDEVQMNSFPKDPEVFQRWRHNLRLEHLIFKDRERYKICNDHFEEICIGKTRLNIGSIPTLNLGHDETDDLFQVNPEALQSNLFGRQRRVQDSMRINIKQEAHSDLDEDIKPDINMTDATDSHTKPVKNKKSFTDFNCCVPNCGRSRLEHGARLFSFPNGKQQQSKWRHNLRLHAADVDKTTRICSAHFNRRCIDGNQLRGWAMPTQQLGHQELPIYENPKNIPGFFTPTCALGHCRKRRSIDNDLRTYRYPRSEELLEKWRANLRLSPDQCRGRICADHFEPLVRGKLKLKTGAVPTLKLGHDEGVIFDNEGIKVSLQQEDEAEEEEGDASMKSLVKVKTEQEDEQELENEDDEQQEQQQDLEQEHDQDMIEDGDEHRDSEEHGYFDPLELVETYAEHHSDDTSAGHDNLDDDEDDEDEDIPGNDDELLLPDTRPLRMPMAPRREKAVNNVTPICCLKHCRKERTALHHLSTFGFPKDPQLLLKWSANLQLPLESCMGRVCVEHFEPSMLGTRKLKQNAVPTLKLGHATPLTYSCNGRMLSGIYDEQPQHSVFRLWSLKHCRKRKPDLEEIKPVRRCCLPSCGKQSELHGVQLQRLPKDRLTLRKWLHNLKLPLTIDSTQMFLCSDHFELNAPCPTLKLGHSDTNIYRHNVASTSGSCLVPKCPCARLNLYRGYDLPANPQVQQAWLHWLQLPHPQPSPRHTQLCVMHFMQLFELVPLPESVPDVVRRQLRETYELISGSSMAMKLRCAVPGCYSKYTDNVRLTKLPVCPNTCAKWVHNTKIQYDPARHYVYRICMLHFEPGCLGPVRPKLWAMPTLQLHHEDADINLNPKLSGSQARPSVPLELPLRIKTELPMCNSPSFSASASPSPRGKLRTCCIPSCGQQASALLRLFRFPSAETSLLKWLVNTQQQPRFVDAQRLFVCQDHFEAEAICKNQLRSWAVPTLNLGHDGHIIPNAKHNGNIADSQENKQTLQFIWANYCSVLTCFQQSSEQQRLYQYPTDRPTIRKWAANCKHRSMQASSDGFQVCQSHFAPDCFDSLTGELKENAVPTLALNRAVTEVRCVANGCVKDEDASRRRLFKMPKRTPQLMDWCHNLHLDHAAVSGSEQHVCERHFEVNCFNSYKMLRPGARPTLHLGHEDLDDVIPNPANWEEDVILCCVPHCENSKDADEVQMFGLPKVRQLADKWLQNAHLYPKEQQPNLKFCSVHFEASCLENGRPTYGAMPTLHLGHDELHNIHPSVESLPAQQKRYCNRDGARHDCCYPQCVELQKSYLRVTYELPQEQELRQQWLSFMGLEAQQPDKQELPKLCPLHLIVLYDHSADHLSAHASEELLDSNYDAARSSVRIRVVSCAVRGCKTLKPRDGGRLHGLPTRRDLLEMWLHNMQLVFYEQQRYMYKICSKHFEPKCFTETTKRLKPWSMPTLKLPELQSGDMPAYQNPTELEWLHMNELQVSEKVVEALPDPLLNLDPLPEKEPPPPQVIEYEEDCDNNSQQPLEMQALEVLLEVGHVEKCTTYEQMDTEANLSYAEQFSHNPLSPSPPQCRIPVVQNGLHYSARQCSVHGCNVTSNNLSSSIKLHKFPVSLDAMQKWMHNTQVLVDVKFAWRFRICSHHFIEDCFHGSRIRRGAMPTLRLGSRRPKHIYDNEFNAQLQLELTKEETKDALAAPLESQQQLLSANVGLRLPRPAPPCKSSKYCQIEGCSNHLTSENVTLHKFPHSSDMCAKWQHNTQVPFDPEYRWRYRICSAHFEPICLGNVRLMHGSVPTLNLGPLAPKKLFDNEFLRLDKPMISSELGMTVKPEQMEQFDQLELEDGNQERDDFSLLEPELQLHEGSEDEQQYDNHFRQNDSYNWSDQQLRLSSNNQENSTISYNPVKSGYDKCSLVHCQRQRSHHGVHIYKFPRSRQLQQRWMHNLRIQYDERRPWKTMICSVHFEPHCIRLRKLRPWAVPTQDLGDNVPQEIFTNEQSHRLFAQSEAGSECDEVEVDVEDTILEDLDDDYDDNDADLNMDAKDQMRTAPYGKSDRRSRFEQLPPGQLPPWKIKCCCLPYCRSPRGDGIKLFRLPNNISSIRKWEQATGMRFYESQRNTKLICSRHFDPQLIGVRRLMSNAVPSLNLGPDSAEPELPLVGPRCCMSDCFEDVNVELHKFPSDPMLLHQWCQALNLPDVQSYTDKLICAAHLPANAMSCLICGVDDVQLPMLDFPQNRNQRTKWCYNLKIEPLPKWDNCKQICCKHFESYCFIQPGQLLAEAMPTLHLEHGDSNIFLNEDAMYNSKLLRIKDEPVESEDLML

Similar Transcription Factors

Sequence clustering based on sequence similarity using MMseqs2

100% Identity: iTF_00595971;
90% Identity: iTF_00500343;
80% Identity: -