Basic Information

Insect: Drosophila borealis
Gene Symbol: -
Assembly: GCA_035045885.1
Location: JAWNOR010000137.1:4357871-4371834[+]

Transcription Factor Domain

TF Family: THAP
Domain: THAP domain
PFAM: PF05485
TF Group: Zinc-Coordinating Group
Description: The THAP domain is a putative DNA-binding domain (DBD) and probably also binds a zinc ion. It features the conserved C2CH architecture (consensus sequence: Cys - 2-4 residues - Cys - 35-50 residues - Cys - 2 residues - His). Other universal features include the location of the domain at the N-termini of proteins, its size of about 90 residues, a C-terminal AVPTIF box and several other conserved residues. Orthologues of the human THAP domain have been identified in other vertebrates and probably worms and flies, but not in other eukaryotes or any prokaryotes [1].
Hmmscan Out: # of c-Evalue i-Evalue score bias hmm coord from hmm coord to ali coord from ali coord to env coord from env coord to acc

1 29 8 1.4e+04 -2.8 3.4 49 64 337 356 318 370 0.55

2 29 6.5e-15 1.1e-11 45.6 4.3 1 86 564 636 564 637 0.85

3 29 4e-15 7e-12 46.3 4.6 1 87 664 733 664 733 0.83

4 29 9.8e-16 1.7e-12 48.2 0.4 1 87 755 827 755 827 0.85

5 29 8.6e-16 1.5e-12 48.4 5.7 1 87 924 994 924 994 0.83

6 29 9.1e-15 1.6e-11 45.1 3.3 1 86 1018 1089 1018 1090 0.82

7 29 9.2e-13 1.6e-09 38.7 0.9 1 87 1125 1193 1125 1193 0.80

8 29 1.2e-10 2.1e-07 31.9 1.2 1 86 1242 1311 1242 1312 0.76

9 29 5.8e-15 1e-11 45.8 0.1 1 86 1339 1408 1339 1409 0.81

10 29 1.8e-13 3.1e-10 41.0 1.0 1 86 1430 1499 1430 1500 0.81

11 29 1.2e-14 2e-11 44.8 1.6 1 86 1527 1598 1527 1599 0.86

12 29 4.1e-13 7e-10 39.8 1.3 1 85 1671 1739 1671 1741 0.82

13 29 1.3e-12 2.2e-09 38.3 0.1 1 86 1764 1832 1764 1833 0.81

14 29 1.5e-13 2.6e-10 41.2 1.3 1 87 1992 2061 1992 2061 0.80

15 29 1.3e-10 2.2e-07 31.9 0.0 1 62 2116 2175 2116 2192 0.79

16 29 0.0029 4.9 8.3 0.0 1 58 2197 2247 2197 2270 0.81

17 29 6.2e-13 1.1e-09 39.2 1.8 1 87 2286 2356 2286 2356 0.86

18 29 1.4e-14 2.3e-11 44.6 1.5 1 86 2415 2484 2415 2485 0.83

19 29 2.4e-12 4.1e-09 37.4 1.7 1 86 2520 2591 2520 2592 0.81

20 29 1.6e-12 2.8e-09 37.9 1.7 1 87 2602 2673 2602 2673 0.82

21 29 6.7e-14 1.2e-10 42.4 0.0 1 86 2696 2766 2696 2767 0.82

22 29 7.8e-05 0.13 13.3 0.1 1 58 2798 2848 2798 2870 0.82

23 29 8e-15 1.4e-11 45.3 0.2 1 86 2887 2959 2887 2960 0.81

24 29 1.4e-13 2.4e-10 41.3 0.2 1 86 3100 3172 3100 3173 0.84

25 29 3.8e-14 6.6e-11 43.1 1.5 1 86 3238 3308 3238 3309 0.82

26 29 2.9e-14 5e-11 43.5 4.0 1 86 3423 3493 3423 3494 0.85

27 29 5.5e-13 9.6e-10 39.4 0.1 1 86 3585 3654 3585 3655 0.85

28 29 1.5e-09 2.6e-06 28.4 1.3 1 58 3672 3720 3672 3731 0.87

29 29 1.1e-07 0.0002 22.4 2.9 19 87 3738 3795 3726 3795 0.75

#	of	c-Evalue	i-Evalue	score	bias	hmm coord from	hmm coord to	ali coord from	ali coord to	env coord from	env coord to	acc
1	29	8	1.4e+04	-2.8	3.4	49	64	337	356	318	370	0.55
2	29	6.5e-15	1.1e-11	45.6	4.3	1	86	564	636	564	637	0.85
3	29	4e-15	7e-12	46.3	4.6	1	87	664	733	664	733	0.83
4	29	9.8e-16	1.7e-12	48.2	0.4	1	87	755	827	755	827	0.85
5	29	8.6e-16	1.5e-12	48.4	5.7	1	87	924	994	924	994	0.83
6	29	9.1e-15	1.6e-11	45.1	3.3	1	86	1018	1089	1018	1090	0.82
7	29	9.2e-13	1.6e-09	38.7	0.9	1	87	1125	1193	1125	1193	0.80
8	29	1.2e-10	2.1e-07	31.9	1.2	1	86	1242	1311	1242	1312	0.76
9	29	5.8e-15	1e-11	45.8	0.1	1	86	1339	1408	1339	1409	0.81
10	29	1.8e-13	3.1e-10	41.0	1.0	1	86	1430	1499	1430	1500	0.81
11	29	1.2e-14	2e-11	44.8	1.6	1	86	1527	1598	1527	1599	0.86
12	29	4.1e-13	7e-10	39.8	1.3	1	85	1671	1739	1671	1741	0.82
13	29	1.3e-12	2.2e-09	38.3	0.1	1	86	1764	1832	1764	1833	0.81
14	29	1.5e-13	2.6e-10	41.2	1.3	1	87	1992	2061	1992	2061	0.80
15	29	1.3e-10	2.2e-07	31.9	0.0	1	62	2116	2175	2116	2192	0.79
16	29	0.0029	4.9	8.3	0.0	1	58	2197	2247	2197	2270	0.81
17	29	6.2e-13	1.1e-09	39.2	1.8	1	87	2286	2356	2286	2356	0.86
18	29	1.4e-14	2.3e-11	44.6	1.5	1	86	2415	2484	2415	2485	0.83
19	29	2.4e-12	4.1e-09	37.4	1.7	1	86	2520	2591	2520	2592	0.81
20	29	1.6e-12	2.8e-09	37.9	1.7	1	87	2602	2673	2602	2673	0.82
21	29	6.7e-14	1.2e-10	42.4	0.0	1	86	2696	2766	2696	2767	0.82
22	29	7.8e-05	0.13	13.3	0.1	1	58	2798	2848	2798	2870	0.82
23	29	8e-15	1.4e-11	45.3	0.2	1	86	2887	2959	2887	2960	0.81
24	29	1.4e-13	2.4e-10	41.3	0.2	1	86	3100	3172	3100	3173	0.84
25	29	3.8e-14	6.6e-11	43.1	1.5	1	86	3238	3308	3238	3309	0.82
26	29	2.9e-14	5e-11	43.5	4.0	1	86	3423	3493	3423	3494	0.85
27	29	5.5e-13	9.6e-10	39.4	0.1	1	86	3585	3654	3585	3655	0.85
28	29	1.5e-09	2.6e-06	28.4	1.3	1	58	3672	3720	3672	3731	0.87
29	29	1.1e-07	0.0002	22.4	2.9	19	87	3738	3795	3726	3795	0.75

Sequence Information

Coding Sequence: ATGTCACAACACAACAATCAACCGCATTCGCATCAGCATCATCACTactatcagcagcagcagcaccaccaccagcaacaacaacaacaacaacaccaccacctccagcagcagcagcagcatttgcagcataaacaaatacaacagcagcacagtTGGTACTCACATGTTGCTTCCTACCCGCCCCACCAACCGCACGCCGCCGCTGCTTATGCGGCGCCCTgcaagaataacaacaataataacaacaacaatattatgAATGCATACGGCACGGGCGCTGCTAGCGCGCACTATTATGGGGCTGCTCCTTCTGCTGGGGCTGGGGTGGGTTATAACCTTGAGGCCAATACTGTGGCCTATGCGCACAACCAGCTGCTGCaataccaacaacagcagcagcaacagctcagTCAACGCTCGTATATGCAGCACAGTTTAATGCATGGCTCCTATCCTTATATCAAGAGCGAACCATTGGAACTGCCTGATGATAGACAACGCcatcaacaacatcaacagcagcagctacaacaacaacaacatttccAGAATCCAATGGCACCGCCACCAGCGCCTGCCGTCAATCGTCACACGCTCGATGCTAGCGGtgaaatgataataaaatCGGAACCCATTGACGAACATGCGTTCAAGTCCAACTATATCGATGACAATACGCCCTTTGCCGATTTTAGTAAATTTCCCGAGTTTGGCGACGACATGCTAAGTCCCAAGGTTGAGCTAACGGTTAAGGACGAGGCTTATGGCAGTCAAAAGaaCCCGCTCAGCTATCCGCGCCGCAAACTGCAAACTGAGCGCTCTGCGGAAAGTCTGCCCATTTGCCAACGCTGCAAGGAGGTCTTCTTCAAGAAGCAGGTCTATCTGCGTCATGTGGCCgagagcagctgcagcatacACGAGTATGACTTTAAGTGCAACATCTGCCCTATGTCCTTCATGGGCGCTGAGGAGCTGCAGAAGCACAAGCAACTGCATCGCGCGGACAAGTTCTTTTGCCACAAATACTGTGGCAAGCACTTTGACAACATTGCTGATTGCGAGTCGCATGAGTATATGCAGCATGAATACGAAAGCTTTGTGTGCAATATGTGCTCCGTAACGTTTTCAACGCGGGAACAGCTTTATGCTCATCTGCCGCAGCACAAGTTTCAGCAGCGTTACGATTGCCCTATTTGTCGCTTGTGGTATCAAACGGCACTAGAGTTGCACGAGCATCGACTGGCGGCGCCCTACTTTTGTGGCAAGTATTATCCAGCAgctcatcagcagcagcagcagcagcaacaacaacaacaacaacatcaacatccacagcagcagcaaggcaACTACAAACTGCAGGACTGCCACATGGGCACCATAGAAATGACACCACCGCACCACAAGACAAATGCGTTGCCTGCAACGGCGGCGCTTAGTTccttgctgcagcagcgccaggCGAATGCGGATGGTGCCGCTCTGTATGCCTCGACGCTGAAGAGCGAGGCTAATGTCAAGTTGGAGCGCAGCTATAGCAACTCCACCAGCGAGTCTGGTTACAGTCTGCACGAGAGTAGTTATAATAATGCCTACGGCAGCGATAATTCGTTGCATGGTGGCAGCGCAGCAATTGGTGGTCCGCAGGCACACTCCTCCACGCTGGACGAATCGGAGGATGCGCTGTGCTGTGTGCCGCTGTGCGGTGTGCGCAAAAGCACCAGCCCCACGCTGCAGTTCTTTACGTTTCCCAAGGATGAAAAGTATCTGCATCAGTGGCTGCACAATCTCAAAATGTTCCATATTCCGGCCTCAAGCTATGCCAGCTTTCGTATCTGCAGTATGCATTTTCCTAAGCGATGCATCAATCGTTATTCGTTGTGTTATTGGGCGGTGCCCACATTCAACCTGGGTCACGATGATGTAGCCAATCTGTATCAAAATCGCGAGCTGACCAACACCTTCACCACCGGCGAGGTGGCGCGCTGCAGCATGCCCAACTGCACCAGCCAACGCGGCGAGAGCAATCtcaagttttataattttcccAAGGACATCAAGAGCCTGATCAAGTGGTGCCAGAATGCACGTTTACCCGTCCAGGCCAAGGAGCCGCGTCATTTTTGCAGCCGCCATTTTGAGGAGCGCTGCATCGGCAAGTTCCGGCTGAAGCCCTGGGCTGTGCCCACTCTACATCTGGGCGCCCAGTACGGCAAGATTCATGACAATCCCAAGAACCTGTATGTGGAAGAGAAACGCTGCTGCCTTAACTTttgccgtcgcagtcgctcTTCGGACTTTAACATGTCACTGTATCGCTTTCCCAGAGATGAAGTACTGCTGCGACGCTGGTGCTATAATCTGCGCCTCGATCCGGCTGTCTATCGCGGCAAGAACCACAAAATATGCAGCGCACACTTCATTAAGGAAGCCCTCGGATTGCGCAAACTATCACCAGGCGCTGTGCCCACACTGCATCTGGGCCACAATGACACCTTCAACATCTACGAGAACGAACTATGGCCACCACCGACGCCCTCTACATCCACCCAAAATCAtcagcagcaattgcagcagcatcagctgcagcagcatcaacagcaactgcaacaaaatgTACATCATAAATATCAGCGTCATTCGGCTGCATCCACATCATCGTCGGCCAGCTCGGCCTCGCACTATGTGGATCCAGAGCTGAGTGCATCCTACATGGGCATGGGCGCTTCATCCTCTGGCCTGAATGTCAGCGACAGCATGGACGTGTGCTGTGTGCCCAGCTGCGAGAGCAAACGGCACAACAATGAGAACATCACATTCCATACAATACCCAGGCGGCCAGAGCAGATGCGTAAATGGTGCCACAATCTGAAGATACCCGAGGACAAGATGCACAAGGGTATGCGGATATGCAGTCTACACTTTGAACCCTACTGCATTGGCGGTTGTATGCGACCGTTTGCGGTGCCCACACTCCATCTGGGCCACGATGACGAGGACATTCATCGTAATCCGGATGTGATTAAGAAGCTGAACATACGCGAAACCTGTTGCGTTGCCGTTTGCAAGCGCAATCGAGATCGGGATCATGCCAATCTGCATCGTTTCCCCAGCAATGTCGCCCTGCTGACCAAGTGGTGCGCCAATCTGCAGCGACCCGTACCGGATGGCACCAAACTTTTCAATGATGCCATCTGCGAGGTGCACTTCGAGGATCGCTGTCTGCGCAACAAGCGACTGGAGAAGTGGGCAGTGCCTACGCTTGTGCTAGGCCACGAGAATATTGCCTACCCGCTGCCCACGCCCGAGCAGGTGGCCGAGTCCTATGCGCGTCCGAGTGCGCCCAACAATGGTGAAGAGCAGGGTGAATGCTGTGTAGAGACCTGTAAGCGTAATCCTACCGTAGATGACATCAAGCTCTATCGTCCGCCCGAAGAATCGCAGGTGCTTGCCAAATGGGCGCACAATCTGCAGCTGGACATTGCCCAGCTTTCTAGCATGCGAATCTGTAATCTGCACTTTGAATCCCATTGCATTGGCAAACGCATGCGACCCTGGGCTATACCCACCCTCAATTTGGCCACCAACATTGAGAATCTCTTCGAGAATCCCGAACACCAGATGCTCTATAAGCGTCGCACGCATCTCAACGCGGACAGAGCCGCCGCTCGCAGCGCTGGCGCTGACGGAGCCACGATGAAGGCCTCTTGGGTGCCACGCTGTTGCCTGCCGCACTGCCGCAAGGTGCGCGCTCTGCACAATGTCCAGCTGTATCGCTTCCCCAAGGTCAATCGCACAACGTTGGCTAAATGGGCGCATAATCTACAAGTGCCGCTGGTCGGCAGCGCCCAAAGGCGTTTATGCTCCGCCCACTTTGAGCCGAATGTGCTGAGCAAGAAATGCCCGGTGCCGTTAGCGGTGCCCACGCTGGATCTCAATACTCCACCGGGCTACAAGATTTACCAAAACCCAGCCAAGGTGAGGGCTAACAAGCTGTGTTGGCAGCGCGTCTGCATTGTGGAGAGCTGCCGTCGACAGCGGGCACAGGGCGTACAGCTCTTCCGGCTGCCGCACAGTCGCACCCAGTTGCGCAAGTGGATGCACAATCTACGCATGCTACCGAGAGGCGCCATGCGGCAACAGTATCGCATCTGCTCGCTGCACTTTGAGGCGCACTCGTTCAACGGCAAGCGTCTGAGCACAGGCGCAATTCCAACGCTGGAGCTGGGCCATCAGGATGACGATATTTATCCCAATGAGGCGCAGTCGTTTGTCGAGGAACACTGCACCGTAGAGGGCTGCGATGCGTCCAAGGAGCAGCCAGATGTGCGTCTCTTCCGCTTTCCCAACGACGACGAGGATCTGCTCTGGAAGTGGTGCAACAATCTCAAAATGAATCCCGTTGACTGCTATGGCATGCGTATCTGCAATAGGCACTTCGAGCCGGACTGCATTGGGCCCAAGCATCTGTACAAGTGGGCCATACCCACTTTGGTTCTGGGGCACGACGATAGCCAGATCGAGCTGATACCCAATCCCAAGCCGGAGGAACGCTATGGTGATCCTGTGTTCAAGTGCTGTGTGCCCACCTGCGGCAAAACGCGCAAATTTGATGAGGCGCAAATGAATAGCTTTCCCAAGGACCCATCGCTCTTCCAGCGCTGGCGGCACAATCTGCGGCTGGACCATCTCAACTTCAAGGAGCGCGAGCGCTACAAGATTTGTAATGCGCACTTTGAGGACATTTGTATTGGCAAGACGCGTCTCAATATTGGATCCATACCCACGCTGGAGCTGGGCCACGAAGAAACCGATGATCTGTTTCAGGTTAATCCCGAGGAGCTGCAGAGCAACTTGTTTGGACGCCCGCGACGCGTGCATGAGAATCAGCGACTGAGCATCAAGCAGGAGCTGGATGAGGATATCAAGCCGGACATAACCATGTCAGAGGCCACGGATACAAACACAACACAGGTGAAGATCAAGAAATCTGTGTTGGACTTGAAGTGTTGTGTGGCCAGCTGCGGTCGCAGCCGGCTGGAGCATGGGGCTCGTCTGTTTCCCTTTCCCActggcaagcagcagcagaccaAGTGGCGCCACAATCTCCGCCTTAGCGCCGCCGATGTGGATAGGACAACGCGTGTTTGCAGCGCTCACTTCAATCGACGCTGCATCGATGGCAAACAGCTGCGTGGCTGGGCCATACCCACACAGCAGCTGGGCCACCAGGAACAAAACATATATGAGAACCCAAAGAATATACCGGGCTTCTTTACGCCCACCTGTGCGCTGGCGCACTGTCGTAAACGACGAAGCATTGACAATGATTTGCGCACCTACCGCTATCCGCGCAACGAGGAGCTGCTCGAGAAATGGCGCGTGAATCTGCGTCTGGCGCCGGATCAATGTCGCGGACGCATCTGTGCGGATCACTTTGAGCCCATGGTGCGCGGCAAGCTGAAGTTGAAGACGGGTGCAGTGCCCACGCTGAAGCTAGGCCATGATGAGGGCGTAGTCTTTGACAATGAGGCCATTAAAGTAGGAatgcagcaggaggaggaagaggaggaggaggtggGCAGCTTGGAGTCGCTGGGGAAGATAAAAATTGAGAAGCAGGAGAAGGAAACCCCAGAGCCGGAGTTAGAAAATGATGATGAGGATGAAGAGGGCGAACAGCAGCCGAAGGTGGAAGATCCTGATGATGATatggagcaggagcaggatgAGGAGGAAGAAGAGCTGCAGGACCATGGCTTTTTTGATCCCCTAGAGCTAGTGGAAACCTTTGCCGAACAGCACAGCGATGATAATTCCGCTGACAATTATCATCTCgaagctgatgatgatgatgatgatgaagatgaAGATATACCTGGCAATGAtgatgagctgctgctgccagacACAGTTCCAATACAGCTGCCGCCACGCCGCGAAAAGGCGGTGAATAATGTGACGCCCATTTGTTGCTTGAAACATTGCCGCAAGGAGCGCACCCCAAGTCATCAGCTGAGTACTTTTGGCTTTCCCAaggatcagcagcagctgcttaaaTGGAGCTCCAATCTGCAGCTGGACCTCGTCGATTGTGTGGGACGCGTGTGCATCGAACATTTTGAGTCGGAGGTGCTAGGCACACGCAAGCTAAAGCAGAATGCCGTGCCCACAGTGAATCTGGGTCATGCCACGCCGTTGAGCTATAGCTGCAATGGCCAATCCTTGAGCATATACGATGCACAGCCGCAGCATTCGGTTTTTCGGCTTTGGAGCCTGAAACACTGCCGCAAAAGGAAGCTGCTGACGATGCCTCCGGATCCGACGACGACTAAACGACGCTGTTGCCTCCCCAGCTGTGGCAAGGAGCCGGAGCTGCATGGCGTTCAATTGAAGCGACTGCCCAAGGAACGTCTGCTGCTGCGCAAGTGGCTGCACAATCTGAAGCTGCCGGCGCACATAGACACCAGATACGCGTTTCTTTGCGAGGAGCACTTTGAGCCACAGGCGACGCTGCCTACCCTGAAGCTGGGCCACGCGGGTAACAACATTTATCGCAATGGCAGCTCGGCTTTATCCAGCGGCTGCCTGGTGCCTAGCTGTCCGTGTGCACGGCTTAATCTATATCGCTGCTATGCTCTGCCCGAGCATCCGCAGGTGCAGCAGGCCTGGCTGCAGTGGCTGCaactgccgccgccgcagctggCTAGCGTTGCCCAGCTCTGCGTCATGCATTATATGCAGCTGTTTGAGCAGGTGCCGCTACCTGAGGATCTGCCTGAGGTTGTGCTGCGCCAACTGCAGGAAACCTACGAACAAATATCAAGCTCCAGCATGGCCATGAAACTGCGCTGTGCTGTGCCCGGTTGCTACTCCAAATACACGGACAATGTGCGTCTCACCAAGCTGCCCGTGTGCCCGCAAACCTGCGCCCAGTGGGTGCACAATACCAAAATTAAGTACGATCCGGAGCGCCATTACATGTATCGCATCTGCATGCGGCACTTTGAGCCTCAATGCTTGGGTGCAGTACGTCCTAAGCTGTGGGCGGTGCCTACGCTGCATCTTAACCATAACGATGCGGATATATATCAGAATTCCATGTTGGACAGCTCGGACGCCATGCCGGTAGCCGAGTCTGTGCCGCTGGAGTTGCCACTGCGCATCAAGACAGAGCTGCCGCTAACCCTATCGGTCAGTCCCAGTGCCAGTCCCAGTCCACGCGGCAAACTGCGCACCTGTTGCATTCCCACCTGCGGCCAACAGGCCAATGCCCAAACGCGTCTGTTTCGCTTTCCCAGCGCCGAGACGGCCCTGCTTAAATGGCTGGTGAAcacgcaacagcagccacgCCTTGTTGATACGCAGAATCTCTTTGTATGCCAGCGTCACTTCGCGGCGGAGGCGATCTGCAAGAAGCAGCTACAAAGTTGGGCAGTGCCTACCCTCAGTCTGGGCCATCAGGGCCACATCATACCGAATGCCAAGCACAATGGCAATATTGCCGACAGCCAGGAGAACAAGCAGGCGCTGCAATACATCTGGGCCAATTACTGCTCGGTGGTCACCTGCTTCCAACAGCGCAGCGAGCAGGTTCGTCTCTATGCCTATCCCACAGATCGGCCCACCATACGCAGGTGGGCCGCCAACTGCAAACATCGCTCCATGCAGGCCAGTTGCGATGGATTTCAGGTCTGCCAGTCACATTTTACACCAGACTGTTTTGATCCTGATACCGGGGAGCTGAAGGAAGACGCGGTGCCCACACTGGAGCTGAGCCGGCCTGTCCACGAGTTGCGCTGCTTGGTTAATGGCTGCGTTAGGGAGAAGGATGCAGCACGTTGTCGTTTTTTCAAGGTGCCCAAGCGTGCCTCACAGCTGGAGGACTGGTGTTACAATCTGCGCATCGATGCTGCGTCAATAAGCGGCCAGGAGGTGCACGTGTGTGAGCGCCACTTCGAGGCGCACTGTTTCAGTGCGTACAAGCTGCGTCCGGGTGCTCGACCTACACTTCATTTGGGCCACGATGATGAGTTCGATTTGTTGCCCAATCCGGCAAAGTGGGAGGAGGACGTGAATGTATGCTTTGTGCCCAGCTGTGGACGCTCCAAGGATGGGGATAATGTGGAGCTATTCGGAGTGCCCAGGATTAAGGGGGTCTTGGAGAAATGGCTGCAAAATTTCCGCCTCGAGCCGAGCAAGGAACAGCTGCAGGGAATGCGGATATGCAGCGCACATTTTGAGCCCAGCTGCATAGAGAATGGCCGTCTACATTTAGGCGCGATGCCCACGCTACAGCTGGGCCACGATGAGTTGGACAATATACATCAAAGCGCGGAGCTGCCGCCATCGCAGCTTAAAGGCAAACGAATAGCCATGAGCTACGACTGCTGCTATCCACAGTGTATGGAGCTGCAGAAGAGCTATCAAAGAATCGCCTATGAGCTGCCCCAGCAGGAGGCACTGCGTAACTTGTGGATGTCGTATCTGGGTCTGGAGCAGCATAGTCAGCAAACGCTCAAGCTCTGCCCGCTGCACTTGATCATGCTTTATGAACACAGTGTCAACCATTTTCCAGAGCATTCATCagaggagcagctgctggacGCCAATTACGAGGCTGCGCGAAATAGCGTCCGCATACGGATTATTAGCTGTGCGGTGCGTGGCTGCAGGACACTCAAGCCACGCGATGACTACCGCCTGCACGCCATGCCTACGCGTCGGGATGTACTCCAGATGTGGCTAGACAACATGCAGCTTGTGTTCTACGAGCAGCAGCGTTATATGTATAAGGTATGCAGCAGACACTTTGAGCCCATCTGCGTAACAGAGACCACTCGCCGTCTCAAACCATGGAGCATGCCGACGTTGGAGTTGCCGGAACGTGACCCAGACGCGCTGCCGTTGCATCAGAATCCCACGGAGGAGGAGTGGCAGCGCATGAACGAGCAGATAGGCAGCAGCGAGGCAGTGGAGTTATTAGAGCCCGTGGTCAAGCTGGAGCCGGAGCCAATTGTCAAGCAGGAGCTGCACCCTATTGTCAAGCTGGAGCCGAAGCAGCAGCCAGAACAGCTGTATGAGGATGAGGAGTACGAGGCCAACGATCAGCAGCAAGCGCTAGAGGTGCTGCTCGAAGTGGGCCACGTTGAGAAGTGCACCACATACGAGCAAATGGACACAAAACCCATTATAGGCTATGCCGATACCCTGTCACATAATCCACTAGGCCCAACGACAACAGTGGGCAGTGCCAGTATTGTCGGCAACGGATTCACCTACAGCGCGCGCCACTGCAGCGTGCGGGGTTGCGATGTGACCACTCTGGATGTGAATGACAGTCTCAAGCTGCACAAGTTTCCCACATCGCTGGATGCAATGGAGAAATGGATGCACAACACCCAGGTGAATGTGGACATCAACTTTGCGTGGCGTTTTCGCATCTGCAGCTTGCATTTTCTACCCGAGTGCTTTAATGGTTCGCGTATCAGACGTGGGGCCATGCCCACGCTGCGTCTGGGATCGCGCCGCCCAGGGGATATCTATGACAATGAGTTCAATGTGCAGCCAGAGCAGACGAGTGTAGATCAGCCGGCTGAGGCGTCAGCAGACGCTTTGGTGCCCACTGAACCGCACGATGGCGCGACGGAGTTTAATATAAATCTGCATTTGCCCAGCCCCGCACCGCCGCGCAAGTCCAGCAAATTCTGTCAGATCGATGGCTGCTCCAATCATTTGACCAGCGAAAATCTTACGCTGCACAAGTTTCCACACTCGGCAGACATGTGCGCCAAGTGGCAGCACAATACACAGGTGCCGTTCGATCCGGAGTACCGCTGGCGTTATCGTATCTGCAGCGCACACTTCGAGCCCATCTGCCTGGGAAACATGCGGCTGATGCATGGCAGCGTGCCCACACTGAAACTGGGCGCCCGGGCGCCCAAGCAGCTCTTTGGCAATGACTTTGCGGCGATTAGCTTGCGCCTGGATAAGGAAAAGCGCAGCGTCGAGGAGGGCTTGCCAGTGAAGCAGGAGCAAGTGGAAGATGATCAGGAGCTGTATGATCAGGAGCAGGAGGATCTGAGCATGCTGGTAccagagctgcagctgcacgaGGGCGACGAGGAGCAGGAAGACAATCAGTTTATTTACACCAACAGTTGGAGAGAttcgcagcaacagctgcagctgcagctacgTCTGCCCAGCATTAAGCAGGAGAAGGGCACCATCTATAATCCCGTCAAGTCTGGCTATGACAAGTGCTCGCTGGTGCACTGTCAGCGCCAGCGTTCACAGCATGGCGTCCACATCTATAAATTCCCACGCTCGCGGCAGCTACAGCATCGCTGGATGCACAATTTACGAATCAGATATGACGAGCGGCGACCTTGGAAGACAATGATATGCAGTGTACACTTTGAGCCGCAGTGCATACGCCTGCGTAAACTGCGTCCTTGGGCGGTACCCACACTAGAGCTGGGCGACAATGTTCCGCAGGATCTGTACAGGAACGAGCAAAGCCAACAGCAGTTTgtgcagcagcgcagcagcgaCGTGGAAGCGGGCAGTGAGGGCGAGGACTATGATGCGGAGCTGGAGGACACCATACTGGAGGAATACGACGATGAgtatgatgataatgataatgctgAGCAATTGCCGGCTGAGCCACACATCAAGCGGGAGTATCGCTCACGCTGCGATCCACTACCGCCGGGTCAGCTGCCACCCTGGAAAATCAAGCAATGCTGTTTGCCCTATTGCCGCAGACCACGCGGCGATGGCATCAAGCTTTTCCGACTGCCTAACAATATCAGCGCCATACGCAAATGGGAGCAGGCGACGGGCATGCGCTTCTTTGAGTCCCAGCGCAACACAAAACTCATCTGCAGTCGTCACTTTGATCCGCAACTTATTGGCGTGCGTCGTCTTATGTCCAATGCGGTACCCACGCGCAATCTGGGTCCAAACAGCGAAGAATCCGAGCTGCCAGCGACCAGTCCACACTGCTGCATTAAGGATTGCCAACCAGATGGACATGTTAAGCTGCACAAGTTTCCCAGCGATCCCCAGTTGCTGCATGAGTGGTGTCAGGCGCTCAATTTGCGGGATGAGCAGCGTCACTCCGGCAAGTACATTTGTGCCATGCACCTGCCCACCAAAGCGATGAGCTGTCTCATTTGCGGTGTGGAGGATGTACAGCTACCCATGCAGGACTTTCCCGAGCATCGCAATCAGCGAGTCAAATGGTGCTACAATTTGAAAATCGAACCAGTCGCCAAGTGGGACAACTCGAAGCACATTTGCTGCAAACACTTTGAGAGCTATTGCTTCATTAAGCCGGGTCATCTATTTCCGGACGCCATGCCCACGCTGCATTTAAACCACAACGACAGCAATATATTCCTCAACGAATCTGCCATAGATAGCAGCAGGCTGCTGCGCGTCAAGGATGAGCCTATGGAGTGTGAGGATCTGATGCTGTAA
Protein Sequence: MSQHNNQPHSHQHHHYYQQQQHHHQQQQQQQHHHLQQQQQHLQHKQIQQQHSWYSHVASYPPHQPHAAAAYAAPCKNNNNNNNNNIMNAYGTGAASAHYYGAAPSAGAGVGYNLEANTVAYAHNQLLQYQQQQQQQLSQRSYMQHSLMHGSYPYIKSEPLELPDDRQRHQQHQQQQLQQQQHFQNPMAPPPAPAVNRHTLDASGEMIIKSEPIDEHAFKSNYIDDNTPFADFSKFPEFGDDMLSPKVELTVKDEAYGSQKNPLSYPRRKLQTERSAESLPICQRCKEVFFKKQVYLRHVAESSCSIHEYDFKCNICPMSFMGAEELQKHKQLHRADKFFCHKYCGKHFDNIADCESHEYMQHEYESFVCNMCSVTFSTREQLYAHLPQHKFQQRYDCPICRLWYQTALELHEHRLAAPYFCGKYYPAAHQQQQQQQQQQQQHQHPQQQQGNYKLQDCHMGTIEMTPPHHKTNALPATAALSSLLQQRQANADGAALYASTLKSEANVKLERSYSNSTSESGYSLHESSYNNAYGSDNSLHGGSAAIGGPQAHSSTLDESEDALCCVPLCGVRKSTSPTLQFFTFPKDEKYLHQWLHNLKMFHIPASSYASFRICSMHFPKRCINRYSLCYWAVPTFNLGHDDVANLYQNRELTNTFTTGEVARCSMPNCTSQRGESNLKFYNFPKDIKSLIKWCQNARLPVQAKEPRHFCSRHFEERCIGKFRLKPWAVPTLHLGAQYGKIHDNPKNLYVEEKRCCLNFCRRSRSSDFNMSLYRFPRDEVLLRRWCYNLRLDPAVYRGKNHKICSAHFIKEALGLRKLSPGAVPTLHLGHNDTFNIYENELWPPPTPSTSTQNHQQQLQQHQLQQHQQQLQQNVHHKYQRHSAASTSSSASSASHYVDPELSASYMGMGASSSGLNVSDSMDVCCVPSCESKRHNNENITFHTIPRRPEQMRKWCHNLKIPEDKMHKGMRICSLHFEPYCIGGCMRPFAVPTLHLGHDDEDIHRNPDVIKKLNIRETCCVAVCKRNRDRDHANLHRFPSNVALLTKWCANLQRPVPDGTKLFNDAICEVHFEDRCLRNKRLEKWAVPTLVLGHENIAYPLPTPEQVAESYARPSAPNNGEEQGECCVETCKRNPTVDDIKLYRPPEESQVLAKWAHNLQLDIAQLSSMRICNLHFESHCIGKRMRPWAIPTLNLATNIENLFENPEHQMLYKRRTHLNADRAAARSAGADGATMKASWVPRCCLPHCRKVRALHNVQLYRFPKVNRTTLAKWAHNLQVPLVGSAQRRLCSAHFEPNVLSKKCPVPLAVPTLDLNTPPGYKIYQNPAKVRANKLCWQRVCIVESCRRQRAQGVQLFRLPHSRTQLRKWMHNLRMLPRGAMRQQYRICSLHFEAHSFNGKRLSTGAIPTLELGHQDDDIYPNEAQSFVEEHCTVEGCDASKEQPDVRLFRFPNDDEDLLWKWCNNLKMNPVDCYGMRICNRHFEPDCIGPKHLYKWAIPTLVLGHDDSQIELIPNPKPEERYGDPVFKCCVPTCGKTRKFDEAQMNSFPKDPSLFQRWRHNLRLDHLNFKERERYKICNAHFEDICIGKTRLNIGSIPTLELGHEETDDLFQVNPEELQSNLFGRPRRVHENQRLSIKQELDEDIKPDITMSEATDTNTTQVKIKKSVLDLKCCVASCGRSRLEHGARLFPFPTGKQQQTKWRHNLRLSAADVDRTTRVCSAHFNRRCIDGKQLRGWAIPTQQLGHQEQNIYENPKNIPGFFTPTCALAHCRKRRSIDNDLRTYRYPRNEELLEKWRVNLRLAPDQCRGRICADHFEPMVRGKLKLKTGAVPTLKLGHDEGVVFDNEAIKVGMQQEEEEEEEVGSLESLGKIKIEKQEKETPEPELENDDEDEEGEQQPKVEDPDDDMEQEQDEEEEELQDHGFFDPLELVETFAEQHSDDNSADNYHLEADDDDDDEDEDIPGNDDELLLPDTVPIQLPPRREKAVNNVTPICCLKHCRKERTPSHQLSTFGFPKDQQQLLKWSSNLQLDLVDCVGRVCIEHFESEVLGTRKLKQNAVPTVNLGHATPLSYSCNGQSLSIYDAQPQHSVFRLWSLKHCRKRKLLTMPPDPTTTKRRCCLPSCGKEPELHGVQLKRLPKERLLLRKWLHNLKLPAHIDTRYAFLCEEHFEPQATLPTLKLGHAGNNIYRNGSSALSSGCLVPSCPCARLNLYRCYALPEHPQVQQAWLQWLQLPPPQLASVAQLCVMHYMQLFEQVPLPEDLPEVVLRQLQETYEQISSSSMAMKLRCAVPGCYSKYTDNVRLTKLPVCPQTCAQWVHNTKIKYDPERHYMYRICMRHFEPQCLGAVRPKLWAVPTLHLNHNDADIYQNSMLDSSDAMPVAESVPLELPLRIKTELPLTLSVSPSASPSPRGKLRTCCIPTCGQQANAQTRLFRFPSAETALLKWLVNTQQQPRLVDTQNLFVCQRHFAAEAICKKQLQSWAVPTLSLGHQGHIIPNAKHNGNIADSQENKQALQYIWANYCSVVTCFQQRSEQVRLYAYPTDRPTIRRWAANCKHRSMQASCDGFQVCQSHFTPDCFDPDTGELKEDAVPTLELSRPVHELRCLVNGCVREKDAARCRFFKVPKRASQLEDWCYNLRIDAASISGQEVHVCERHFEAHCFSAYKLRPGARPTLHLGHDDEFDLLPNPAKWEEDVNVCFVPSCGRSKDGDNVELFGVPRIKGVLEKWLQNFRLEPSKEQLQGMRICSAHFEPSCIENGRLHLGAMPTLQLGHDELDNIHQSAELPPSQLKGKRIAMSYDCCYPQCMELQKSYQRIAYELPQQEALRNLWMSYLGLEQHSQQTLKLCPLHLIMLYEHSVNHFPEHSSEEQLLDANYEAARNSVRIRIISCAVRGCRTLKPRDDYRLHAMPTRRDVLQMWLDNMQLVFYEQQRYMYKVCSRHFEPICVTETTRRLKPWSMPTLELPERDPDALPLHQNPTEEEWQRMNEQIGSSEAVELLEPVVKLEPEPIVKQELHPIVKLEPKQQPEQLYEDEEYEANDQQQALEVLLEVGHVEKCTTYEQMDTKPIIGYADTLSHNPLGPTTTVGSASIVGNGFTYSARHCSVRGCDVTTLDVNDSLKLHKFPTSLDAMEKWMHNTQVNVDINFAWRFRICSLHFLPECFNGSRIRRGAMPTLRLGSRRPGDIYDNEFNVQPEQTSVDQPAEASADALVPTEPHDGATEFNINLHLPSPAPPRKSSKFCQIDGCSNHLTSENLTLHKFPHSADMCAKWQHNTQVPFDPEYRWRYRICSAHFEPICLGNMRLMHGSVPTLKLGARAPKQLFGNDFAAISLRLDKEKRSVEEGLPVKQEQVEDDQELYDQEQEDLSMLVPELQLHEGDEEQEDNQFIYTNSWRDSQQQLQLQLRLPSIKQEKGTIYNPVKSGYDKCSLVHCQRQRSQHGVHIYKFPRSRQLQHRWMHNLRIRYDERRPWKTMICSVHFEPQCIRLRKLRPWAVPTLELGDNVPQDLYRNEQSQQQFVQQRSSDVEAGSEGEDYDAELEDTILEEYDDEYDDNDNAEQLPAEPHIKREYRSRCDPLPPGQLPPWKIKQCCLPYCRRPRGDGIKLFRLPNNISAIRKWEQATGMRFFESQRNTKLICSRHFDPQLIGVRRLMSNAVPTRNLGPNSEESELPATSPHCCIKDCQPDGHVKLHKFPSDPQLLHEWCQALNLRDEQRHSGKYICAMHLPTKAMSCLICGVEDVQLPMQDFPEHRNQRVKWCYNLKIEPVAKWDNSKHICCKHFESYCFIKPGHLFPDAMPTLHLNHNDSNIFLNESAIDSSRLLRVKDEPMECEDLML

Similar Transcription Factors

Sequence clustering based on sequence similarity using MMseqs2

100% Identity: iTF_00534610;
90% Identity: iTF_00563203; iTF_00475247; iTF_00616933; iTF_00530983; iTF_00526609; iTF_00534610; iTF_00506141;
80% Identity: -