Basic Information

Insect: Drosophila obscura
Gene Symbol: -
Assembly: GCA_018151105.1
Location: NW:7794687-7813012[+]

Transcription Factor Domain

TF Family: THAP
Domain: THAP domain
PFAM: PF05485
TF Group: Zinc-Coordinating Group
Description: The THAP domain is a putative DNA-binding domain (DBD) and probably also binds a zinc ion. It features the conserved C2CH architecture (consensus sequence: Cys - 2-4 residues - Cys - 35-50 residues - Cys - 2 residues - His). Other universal features include the location of the domain at the N-termini of proteins, its size of about 90 residues, a C-terminal AVPTIF box and several other conserved residues. Orthologues of the human THAP domain have been identified in other vertebrates and probably worms and flies, but not in other eukaryotes or any prokaryotes [1].
Hmmscan Out: # of c-Evalue i-Evalue score bias hmm coord from hmm coord to ali coord from ali coord to env coord from env coord to acc

1 29 9 7.6e+03 -2.6 3.0 43 62 377 399 363 416 0.56

2 29 1.1e-14 9.6e-12 45.2 3.5 1 86 624 696 624 697 0.85

3 29 2.5e-14 2.1e-11 44.1 4.8 1 87 724 793 724 793 0.82

4 29 2.1e-15 1.8e-12 47.5 0.2 1 87 815 887 815 887 0.85

5 29 1.3e-15 1.1e-12 48.2 5.0 1 86 986 1055 986 1056 0.82

6 29 7.1e-15 6e-12 45.8 3.2 1 86 1081 1152 1081 1153 0.82

7 29 7.4e-13 6.3e-10 39.4 0.5 1 87 1188 1257 1188 1257 0.82

8 29 1.7e-11 1.4e-08 35.0 2.5 1 86 1296 1365 1296 1366 0.77

9 29 8.9e-17 7.5e-14 51.9 0.4 1 86 1393 1462 1393 1463 0.82

10 29 5.3e-13 4.5e-10 39.8 0.8 1 86 1484 1553 1484 1554 0.79

11 29 1.1e-13 9e-11 42.1 1.1 1 86 1581 1652 1581 1653 0.85

12 29 1.8e-12 1.5e-09 38.1 1.8 1 85 1727 1795 1727 1797 0.83

13 29 7.1e-12 6e-09 36.2 0.0 1 86 1820 1888 1820 1889 0.82

14 29 9.9e-14 8.4e-11 42.2 0.5 1 87 2057 2126 2057 2126 0.78

15 29 2.8e-09 2.4e-06 27.9 0.0 1 85 2220 2289 2220 2294 0.74

16 29 0.011 9 6.8 0.0 1 58 2311 2355 2311 2373 0.79

17 29 1e-11 8.5e-09 35.7 0.1 1 86 2391 2460 2391 2461 0.81

18 29 1.6e-13 1.4e-10 41.5 0.2 1 86 2555 2624 2555 2625 0.81

19 29 1.3e-10 1.1e-07 32.1 0.1 1 85 2660 2730 2660 2732 0.79

20 29 3.3e-11 2.8e-08 34.1 0.3 1 87 2743 2815 2743 2815 0.81

21 29 1.9e-16 1.6e-13 50.9 1.1 1 86 2840 2916 2840 2917 0.80

22 29 0.001 0.87 10.1 0.0 1 58 2944 2997 2944 3013 0.77

23 29 6.2e-12 5.3e-09 36.4 0.7 1 87 3036 3108 3036 3108 0.80

24 29 2.8e-12 2.4e-09 37.5 0.0 1 86 3240 3310 3240 3311 0.79

25 29 1.4e-11 1.2e-08 35.2 4.2 1 86 3371 3441 3371 3442 0.80

26 29 3.5e-14 3e-11 43.6 5.5 1 86 3577 3647 3577 3648 0.84

27 29 6e-12 5.1e-09 36.5 0.2 1 86 3744 3813 3744 3814 0.84

28 29 5.5e-09 4.6e-06 27.0 0.7 1 58 3838 3887 3838 3895 0.86

29 29 3.4e-09 2.8e-06 27.7 0.7 18 87 3906 3964 3894 3964 0.73

#	of	c-Evalue	i-Evalue	score	bias	hmm coord from	hmm coord to	ali coord from	ali coord to	env coord from	env coord to	acc
1	29	9	7.6e+03	-2.6	3.0	43	62	377	399	363	416	0.56
2	29	1.1e-14	9.6e-12	45.2	3.5	1	86	624	696	624	697	0.85
3	29	2.5e-14	2.1e-11	44.1	4.8	1	87	724	793	724	793	0.82
4	29	2.1e-15	1.8e-12	47.5	0.2	1	87	815	887	815	887	0.85
5	29	1.3e-15	1.1e-12	48.2	5.0	1	86	986	1055	986	1056	0.82
6	29	7.1e-15	6e-12	45.8	3.2	1	86	1081	1152	1081	1153	0.82
7	29	7.4e-13	6.3e-10	39.4	0.5	1	87	1188	1257	1188	1257	0.82
8	29	1.7e-11	1.4e-08	35.0	2.5	1	86	1296	1365	1296	1366	0.77
9	29	8.9e-17	7.5e-14	51.9	0.4	1	86	1393	1462	1393	1463	0.82
10	29	5.3e-13	4.5e-10	39.8	0.8	1	86	1484	1553	1484	1554	0.79
11	29	1.1e-13	9e-11	42.1	1.1	1	86	1581	1652	1581	1653	0.85
12	29	1.8e-12	1.5e-09	38.1	1.8	1	85	1727	1795	1727	1797	0.83
13	29	7.1e-12	6e-09	36.2	0.0	1	86	1820	1888	1820	1889	0.82
14	29	9.9e-14	8.4e-11	42.2	0.5	1	87	2057	2126	2057	2126	0.78
15	29	2.8e-09	2.4e-06	27.9	0.0	1	85	2220	2289	2220	2294	0.74
16	29	0.011	9	6.8	0.0	1	58	2311	2355	2311	2373	0.79
17	29	1e-11	8.5e-09	35.7	0.1	1	86	2391	2460	2391	2461	0.81
18	29	1.6e-13	1.4e-10	41.5	0.2	1	86	2555	2624	2555	2625	0.81
19	29	1.3e-10	1.1e-07	32.1	0.1	1	85	2660	2730	2660	2732	0.79
20	29	3.3e-11	2.8e-08	34.1	0.3	1	87	2743	2815	2743	2815	0.81
21	29	1.9e-16	1.6e-13	50.9	1.1	1	86	2840	2916	2840	2917	0.80
22	29	0.001	0.87	10.1	0.0	1	58	2944	2997	2944	3013	0.77
23	29	6.2e-12	5.3e-09	36.4	0.7	1	87	3036	3108	3036	3108	0.80
24	29	2.8e-12	2.4e-09	37.5	0.0	1	86	3240	3310	3240	3311	0.79
25	29	1.4e-11	1.2e-08	35.2	4.2	1	86	3371	3441	3371	3442	0.80
26	29	3.5e-14	3e-11	43.6	5.5	1	86	3577	3647	3577	3648	0.84
27	29	6e-12	5.1e-09	36.5	0.2	1	86	3744	3813	3744	3814	0.84
28	29	5.5e-09	4.6e-06	27.0	0.7	1	58	3838	3887	3838	3895	0.86
29	29	3.4e-09	2.8e-06	27.7	0.7	18	87	3906	3964	3894	3964	0.73

Sequence Information

Coding Sequence: ATGTCACAGCATAATCCGCACGCCCATCCGCACTACCATCACCACCCACTGCACCAgtcgaacaacaacaacaacaacaacaacgactaTCAATCTGGGATTGGGATGTACTCGGCGCCGCCCAGTGCCCACTATGGATGCCTCGACcagaagcagcaccagcagcaacaacagcaacaacagcaacagcagcagcagcaacaacaacaggcacAAATGCCACACAGCAATTGGTACTCACATGTTGCTTCCTACCCGCCAGTGCCACCCCACCACCATGCGACGGCTACCTCCGCATTTGCCGCCACCTCTACACCTTGCAAGGGCAGtaacagtggcagtggcagtgtcagcagcaacaacatgaaTGCGTATGGGGTAGGCAGCACGCATGGAtattatgctgctgctgcagccgccgccgccgccgctggcgGTGGGCTCAATGTCAACgctgtgggtgggggtggggtcgGGTCCGTGGCTGCCGCAGCAGCCTATAACCTTGAGGCAAACACAGTGGCATATGCACACAACCAGCTGCTGCAGTACCAAcagcaccatcagcagcagcagcagcagcagcatctcagTCAGCGTTCCTATATGGGGCATGATATAATGTCCGGCACATATCCGTACATCAAAAGCGAACCCATGGAGGCCGCGTATCAGCAGCCACCCCCCAATCCGATGGCCCCACCCCCAGCGCCAGATATGATAATAAAATCGGAACCCATGGATGAACATGCCTACAAGTCCAACTACATTGATGACAATACGCCCTTTGctgattttaataaattcaatGAATTCAGCGGCGATATGCTGAGCCCCAAAGTGGAGCTAACCATCAAGGATGAGACCTATGGAAAGACatccagcggcagcagctttGCACGCCGCAAAGtccaacagcagccgcagcaacagccacagctgcCAACGACAGATCGTTCAGCGGAGAGTCTGCCCATTTGTCAGCGCTGCAAGGAGGTGTTCTTCAAGAAGCAATCCTACCTAAGGCATGTGGCCGAGAGCAGTTGTGGCATACAGGAGTACGATTTCAAGTGCAACATTTGCCCCATGTCCTTCATGACCAGCGAGGAGCTGCAGCGGCACAAGCATCTGCATCGTGCGGACAAGTACTTTTGCCACAAATACTGCGGCAAGCATTTCGATACGATAGCCGAGTGCGAAACGCATGAGTACATGCAGCACGAGTATGACAGTTTCGTTTGTAATATGTGCTCGGGTACCTTTGCCACACGTGAGCAGCTGTACGTCCACTTGCCGCAGCACAAGTTCCAGCAGCGTTACGACTGTCCCATCTGTCGCTTGTGGTATCAAACGGCCGTCGAATTGCATGAACATCGACTGGCGGCTCCATACTTTTGCGGCAAATACTACAccaatcaacagcagcagcaacagcagcagcagcagctgcaggggAACTACAAGCTGCAGGACTGCCATATGGCCACCATGGAGATGCCCACATTGCCCACAGCACCTATTCTTAAGGCACCAACGAACTGCAATGCTTCGGTGCTGCCAGCCACCGCGGCTTTGAGCtctctgctgcagcagcggcaggcgaATGCCGATGGAGCAGCTGCCATGTTTGCTgcggcctcctcctcctcctcctccgccgccgcgGCCGCCACCTCTGTCTCGCTAAAGAGCGAGGTGAGCGTGAAGCTCGAGCGCAGCTACAGCAACTCCACCAGCGAGTCCTCGTACAGCCATCAGGACAACAGCAGCTACAACAATGCCTATGGCAGCGACAGCTCCATTCATGGCGGTGCACTGGCCGGACCACAGGCGCACTCCTCAACGCTAGACGACTCGGAGGATGCTTTGTGCTGTGTGCCGCTGTGCGGCGTGCGTAAGAGCACCAGTCCCACGCTGCAGTTCTTTACATTCCCCAAGGACGACAAGTATCTGAATCAGTGGCTGCACAACCTCAAGATGTTCCACATACCGGCGGCCAGCTATGCGACATTTCGCATCTGCAGCATGCACTTCCCGAAGCGTTGCATCAATCGGTATTCGCTGTGCTATTGGGCGGTGCCCACCTTCAATTTGGGCCACGACGATGTCGCCAATCTGTACCAGAATCGCGAGCTAACCAACACCTTCACCACCGGCGAGGTGGCCCGTTGCAGCATGCCGCACTGCACCAGCCAGCGGGGCGAGAGCAATCTGAAGTTCTACAATTTCCCCAAGGACATCAAGAGCCTGATCAAGTGGTGCCAGAATGCGCGCCTGCCAGTGCAGGCCAAGGAGCCGCGTCACTTTTGCAGCCGCCACTTTGAGGATCGCTGCATTGGCAAGTTCCGTCTGAAGCCCTGGGCCGTGCCCACGCTCCATCTGGGTGCGCAGTACGGCAAGATCCATGACAATCCCAAGAATCTGTATGTGGAGGAGAAGCGCTGCTGCCTGAACTTTTGCCGTCGCAGCCGCTCCTCGGACTTTAACATGTCGCTGTATCGCTTTCCACGCGATGAGGTGCTCCTGCGACGCTGGTGCTATAATTTAAGGCTCGATCCGGGCGTCTATCGTGGCAAGAATCATAAAATATGCAGTGCACATTTCATCAAGGAAGCGCTGGGCCTGAGGAAGCTATCGCCAGGAGCCGTGCCCACATTGCATTTGGGACACAATGACACGTTTAATATCTATGAGAACGAGCTGTGGCCACCGCCATCACCCACTGGACAGCATGGCCAGCTTctaccgcagcagcagcagcagcagccgtcgcAGCATCAACactctccatcAATGCACAGCAAATCCTCGTATCAGCGACATTCGGCAGCCTCCACTTCATCCTCTGCCAGTTCGGCGTCGCATTATGTGGATGCCGAGATGAGTGCCTCGTATTTGAGCCTCTCTGCGGCTGGCTCCTCGGGCGGCATGAATGCCAGCGACTGCATGGACGTGTGCTGTGTGCCCAGCTGTGAGAGCAAGCGGCACAACAGCGAGAACATCACATTCCACACGATACCGCGCCGGCCGGAGCAGATGCGCAAGTGGTGCCACAATCTGAAGATACCCGAGGACAAGATGCACAAAGGGATGCGGATATGCAGCCTGCACTTTGAGCCCTACTGCATTGGCGGCTGCATGCGTCCGTTTGCCGTGCCCACGCTGCAGTTGGGGCACGAGGATCTGGAGGACATACACCGCAATCCGGATGTGATCAAGAAGCTGAACATACGCGAGACCTGCTGCGTGGCGGTGTGCAAGCGGAATCGCGACCGAGACCATGCCAATCTGCATCGTTTCCCCAGCAATGTGGCGCTGCTGACCAAGTGGTGTGCGAATCTGCAGCGGACAGTGCCCGATGGCAGCAAACTGTTCAACGATGCCATCTGCGAGGTGCACTTCGAGGACCGTTGTCTGCGCAACAAGCGGCTGGAGAAGTGGGCGGTGCCCACGCTGATGCTCGGCCACGAGGACATGGCCTATCAGCTGCCCACTCCGGAGCAGGTGGCCGAGTTCTATGCCAGGCCGACCGCCCCGAACAATGGCGAGGAGCAGGGCGAGTGCTGTGTGGAGACGTGCAAACGAAATCCCAGTGTGGATGACATCAAACTGTATCGGCCGCCGGAGGACAGCTCGGTGCTGGCCAAATGGGCGCACAATCTGCAAACGGAGGCCGCAGCTCTCACCAACGGACTGCGGATATGCAATCTGCACTTTGAGGCCCACTGCATAGGCAAGCGGATGCGTCCGTGGGCCATACCCACCCTCAATCTGGCCGGCAACATTGAGAACCTCTACGAGAACCCGGAGCACTCGATGCTGTACAAGCGACGGACGCACCTCAAACAGAAGGTGCCCGTGGCGAAGCCCACGTGGGTGCCACGTTGCTGCCTGCCGCACTGCCGCAAGGTGCGTGCCCAGCACAATGTCCAGCTGTATCGCTTCCCCAAACTCAACCGCTCCACGCTGGCCAAGTGGGCGCACAATCTGCAAGTGCCGCAGGTGGGCAGTGCCCAGCGGCGAGTCTGTTCCGCACACTTTGAGCCGCATGTCCTCAGCAAGAAGTGCCCGGTGCCGCTGGCGGTGCCCACACTGGACCTCAACTCGCCCGCTGGCCACAAGATCTACCAGAATCCGGCCAAGCTGAAGGCCAACAAGCTGTGCCTGCAGCGGGTATGCATTGTGGAGAGCTGCCGGAAGACCAGGGCCCAGGGCGTTCAGCTCTTCCGTCTGCCGCACAGCCCCACGCAGCTGAGGAAGTGGATGCACAACATCAGGACACGCCCAAGGGCGGCCATGAGGAGCCAGTATCGTGTGTGTTCGCGTCACTTTGAGACGCACTCCTTCAATGGGCGCCGACTGAGCGCGGGGGCCATTCCCACGCTGGAGTTGGGCCACGACGACGATGACATCTTCCCGAACGAAGCGCAGGCCTTTGCGGATGAGCACTGCGCCGTGGAGGGCTGTGAATCGTCCAAGGAGCAGGCCGAGGTGCGTCTCTTCCGCTTCCCCacggacgacgacgacatgCTGTGGAAGTGGTGCAACAATCTGAAGATGAATCCCGTCGACTGCATCGGTGTGCGGATATGCAACAAGCACTTCGATGCGGATTGCATCGGGCCGAAGCATCTGTACAAGTGGGCCATACCCACGATGCTGCTGGGCCACGATGACTCCCAGATCGAGCTGATACTCAATCCGAAGCCGGAGGAGCGCTATGTGGATCCCGTGTTCAAGTGCATTGTGCCCACGTGCGGCAAGACGCGTCGCTTCGATGAGGTGCAAATGAACAGCTTCCCCAAGGATGCGGATCTCTTTCAGCGCTGGCGTCACAATCTGAGGTTGGAGCATTTGTGCTTTAAGGAGCGCGAGAAGTACAAGATATGCAATGCCCACTTCGAGGACATGTGCATTGGCAAGACGCGTCTGAACATTGGCTCGATACCCACCCTGGAGCTGGGCCACGCGGAAACTGAGGATCTGTTCAAGGTGAATCCGGCTGAGCTGCAGAGCAACCTATTTGGACGTCCGCGTCGACTGCTGCGAGGATACAACAATGTGAGCATCAAACAGGAGCCGCCAGAGtcgcaggaggagcagcagcaggacgtGAAGCCCGATATGGGCACGGATTTTACACAGGTTAAAATCAAGAAATCTCTTGGAGACATCAAGTGTTGTGTGCGCACCTGCGGCCGCAGTCGCCTGGAGCATGGGGCGCgtctctttccctttcccaacggcaagcagcagcacctcaaGTGGCGCCACAATCTGCGCCTCGAGCCGGACGAAGTGGACAAATTGACGCGCGTGTGCAGCGCCCACTTCAACCGGCGCTGCATCGATGGCAAGCAGCTGCGTGGCTGGGCCATGCCCACACAGCAGCTGGGCCACCAGGAGCAGCCCATCTACGAGAATCCCAAGAATATTCCGGGCTTCTTTACGCCCACCTGTGCGCTGGGACACTGCCGCAAGCGGCGTAGCATTGACAACGATTTGCGCACGTATCGGTATCCGCGCAGCGAGGATCTGCTCGAGAAGTGGCGGGCGAATCTCGGCCTGTCGCTGGATCAGTGCCGTGGCAGGATCTGTGCGGATCACTTTGAGCCGCAGGTGCGTGGCAAACTGAAGCTAAAGACGGGCGCTGTGCCCACACTAAAGCTGGGCCATGAGGAGGCTCTGATCTACGACAATGAGGCTATAAAGGCGGGCGTGGCCGaagaggaggcggcggcggcggcagcgggcAGTGCCTCGCCTCTGGTGATACCCAAAACGGAAGTgctggacgaggaggagcgcgaggaagatgaggaggaggaggatgacaCGCCCgaaggagcagagcagctgaGGGATGAGGATGACGATGAAGACGACGATGAGGATCCTGGCAACTATTTTGATCCTTTGGAGCTGGTGGAGACGTATGCAGAGCATcccagcgacgacgacgacgacgaggcaGGAGAGAAGGATGCCagagaggatgaggatgaggaggaggaggaggcagaaaCTCTACTGCCTGATACACCACCCAAATCGTCAGCAGTCCTTCGCATGCCCAAACCATGGGACAgacctgctgccgctgccgctgtcgcctCCGCTGTAGTTGTGCCGCGCCGCGAGAAGCGTCCGAATAACGTGGATCCCATCTGCTGCCTCAAGCACTGCCGCAAGGAACGCTCCGCCATGTATTTGCTGAGCACCTTTGGCTTCCCCAAggaccagcagctgctgctcaagTGGTGCGCCAATCTCCAAATGGACCCCTCCGGCTGCATTGGTCGCGTCTGCATCGAGCACTTTCAGTCGGAGGTGCTGGGCACGCGCAAACTCAAACAGAATGCGGTGCCCACGCTCAATGTGGGCCACGATGCGCCACTGCGTTACAGCTGCAACGGCCAGGAGATCTccgccaacagcaacagtttTCCGGATGAAATGCCACAGCATTCGGTTTTTCGGCTTTGGAGCCTGAAACACTGCCGCAAGAGGAAGCTGTCGGAGagttcagctccagctccagcagcgatcaagaaggagcagcatcagcagcagcatcagcagcagcagcatcagcagcagacaccgatggagatggagatgcagatggagctggagctggagactAAACCAAAGATTTGCTGCCTGCCCAGCTGTGGCAATGTGGAGGGTTATGGCCTCGGCGGGCACTTCCAGCCGCTGCCCGTGGACCAAAGACTGCTCAAAAAGTGGCAGCACAACCTAAGGCTACCCACCATCAATTCCGACACGGAACTTCGTCTGTGCCTGGAGCACTTTGAGCCGCAACAAATCGAGAATGGCTGCCCCGTGCGGATGGCAGTGCCGACTGTCAAGCTGGGCCACACCAGTCCGAATATCTTCAGGAACAGCGAGGGCTCCCGGCTGCCCGGCTGCCTGTGGCCCTCGTGTCCGCCCAATCGCAAGCTGTGCTACGACCTGCCGGAGCATGAGGCTGTCCGCGTGGCCTGGCTGTCGTATGTGCGGCTGCCAGTGGACAGCCAGGGACGCCTCTGTGGCCTGCACTTCTTGCAGCTGTACGAGGAGGTGGATCTGCCGGGAGACGTGCCCGAAAAGGTGCTCGAACGACTGCAGGATACCTACGATCAGGCCTCCATCTCGCTGAAGTTTCAGTGCTCCGTGCTGGGCTGTGGCTCCAAATACAAGCAGGACACGCATCTGGCGAAGCTGCCACGCGACgcccagctgctggccaagtgGCTGCACAACACCAGAATCTCATACGATCGCTCCCTGCACTTTAGCTATCGCATTTGCCTGCTGCACTTTGAGGCGCTCTGCTTGAATGGCCACAGGCCACAGACGTGGGCCATACCCACACTGCAGCTGAATCACGACGGGGAGATCTACCAGAATAGCGTCAAGCAGGAGCTGCTTGAGAATCCTCCGAAGCAGGAGTTGCTGGAGAACCCTCCGAAGCAGGAGTCCGAGAATCACGAGACTCCCGtgaagcaggagaagcaggagAAGCCTCACTGCAGCCTCAGTCTCTCGATTCCGCTGCACATCAAGACGGAGCAGGTCACTCCTGTGCTGCGGGGCACATCCTCGCTGAGCAGTCCCTGCCTCAGTGCCAGCTCCAGTCCCCGCGCGAAGAACCGAGTCTGCTGCATACCCAACTGCGGGGAGATGCCACCCAGATCCCAGCGGCTGCATCGCTTTCCCACCGCCGAACCGACGCTGCTCAAGTGGCTGGTGAACACACAGCAAAAACCGGGACTGGTGGACATTCAGAGTCTGTTTGTGTGCCAGCTGCACTTTGAGGCGGATGCCATTAACCAGACGCAGCTGAGAAGCTGGGCCGTGCCCACACTGCGGCTGGGCCACGATGGCCATGTCATACCGAATGCCCGGCACAATGGGAACATTGCCAACAGCCAGGAGACGGAGCAGGCCATGGAGTTCATTCGGGCCAACTACTGTTCGGTGCTGAGCTGCTTCCAGCCGAAGGGCGAGGGTGTGCGCTTCCACAAGTATCCCAGCGACATTGCCATGGTGCGCAAGTGGGCCACAAATCTCAAGCATCGCTCCATGCAGGCCAGCAGCCATGGCTTTCTCGTCTGCCAGTCGCACTTTCCAGCCGAATGCTTCGATCCGGGCACGGGAGAGCTACGCGCGGATGCCGTACCCGTCGCTAGTAGTGTGAAAACGGAGAGCCTGCCGCTGCATTGCCTGGTGAGAGGTTGCTCCGCCGATAACCTCGGCAAGGAGGGGCGGCTGCTGTTCAAGGTGCCAAAGAAGAATCGCGTGCGGGATGCATGGGCCCACAATCTGTGGATGCATCCGATCGAGCTGATGGGCGAGCAACACATCTGCGAGCGGCACTTCGAGGCGCACTGCGTCAATGAACAGAAAATGCTGCACGCGGGCTCAGTGCCAACGCTCCACCTCGGACACACTGAACCGCTGGAACTGCTGCCCAACCCACAGACCTTTAACGAGTGCCAGGAGGAGTGCGTGTGCTGTGTGCCCGGCTGTGGGCGCAGCAATCGAAAGAATAGCCAGGAGGAGCTGCAGTTCAGCAAATTCCCCAAGTGGCGGGTGCTCTACGACAAGTGGCTGCACAACTTCCGCCTGGAAGTGCCCAAGGAGCAGCGCATTGGTACGCTGCGCGTCTGCCACACGCACTTTGAGGAGAGCTGCTTTGAGCCGGAGCAGGGTGGCGTGCGACGGGGAGCCATGCCCACACTGCAGCTGGGACACTCGCATCCGGACATTTATCGCACGGACAAGGGATCGCTGTGGAAGAAGGTGCACAAGAGATTCAGCGACTGCTGCTATCCGGATTGCTACGAGGACTGCCACAAGGCCAACACCAATCGCATGGTCTACGAACTGCCAGGCGCGGGGCCGCTACGTGAGGCCTGGCAGCAGCATTTGGGCATCCCCGACAGCGGCTCCTCGGTGCTCCTCAGGCTCTGTGCCCTCCACTACATCATGCTGTACGAGCACAGCGAGCAGAACTTGCCCGAGCACGCAGCAgatctcctgctgctggccaagaacTACGCGCACGCCCGCCAGTTGGCCTATCTGCGACGCTTCATGTGTGCCGTACAGGGCTGTCGCCATTTGCAGCCGCGGGACGGGGGATCGATGCATGGCATACCCAGGCGGCGGCAGATACTTCGCATGTGGGTGGAGAATGCGCAGCTTCGGCTGAACGAGCACGAGATTTACATGACGAAGCTATGCAGCAAACACTTTGAGCCGCACTGCCTGTTCGAGGGCAAGAAGTGCTATCCGTGGAGTGTGCCCACGCTCCATCTGCCCGCGCTGCTGCCGGGTCAGGTGCTGCACCAGAATCCCACCACGGAGGAGTGGCAGCAAATGAAGCAGCGCATGAAAATGGAGGAGCAGACGCTGAGGGCGGAACCGCAGCCCGATGGAGGACTACAAATGGAGCCCTACGTTAAGATGGAACCGCACGACGATGACGATAGATCGCAAACGGAGTCGGAATTGCTGGTAAATGAGAGCACCATGGACGACTCGCAGGAGACGGACTTTCAAGCGAATGAGCCACTGGAGGTGCTGCTGGAGGTGGGCCATGTGGAGCGGCTGGAGAGCTACGAGAAGAAGGATTACCCCGCCGTCAGCTATGCGGTGCCGCCGGCGCCGCCGCCGAAACGTTTCCGCCATCCGTACAGTGCCCACAAGTGCAGTGTCGCGGGCTGTGGCGTCTCGCTCGAGGATGTGGGCGGCAATCTGAAGCTGCACAAGCTACCCAGCGCCACGGAGGCGACCCGCAAGTGGCTGTACAACATACAGGTGGACATAGAGGACAAATGGCGGATACGCGTCTGCAGTCATCACTTTGACAGGCAGTGCCTGAATGGCTCGCGGCTCAGGCGGGGATCGATGCccacgctgctgctggggccaCGAGTCCCGGCGACTATCCACCAGAATGAGTTTGCGCCGCTGCCGTTGGACGATGcggcgccagcagcagcgaatgGAGCAGCACCGATCCACGTGGAGCCATCCATTGGCAAGGTGTTGCACCCGTGCGTGCCGCGGCCCTCGCCGCCGCGAAAGTCCAGCAAATTCTGCCAGATCGAGGGATGTGCGAACCACTTGACCAGCGAGCATATGACACTGCACAAGTTCCCGCACTCCGCGTGGATCTGCACCAAGTGGCAGCACAACACCCAGGTGCCATTCGATCCGGAGTACCGCTGGCGCTATCGCATCTGCAGCGCCCACTTCCACCCCGTGTGCATGGTCAATATGCGGCTGCTGCATGGCAGTGTGCCCACCCTCAAGCTGGGCCCGCGGGCACCCGCCGAGCTCTTCGACAGCGACTTTGAGGCCATAAACATCAAGATTGAGAAGCTGGAGAAGATGGAGCGGAGGGCGGAGGCTCAGAGAGTCACCACCAgtcgcagtcacagtcacCATTCCACCATGCCGGACATGGGGGAGGTCAGACTGAAGGTCAAGACTGAGCAGCTGGACGATGGCAGTGGACCaatgcaggagcaggagcaggaggaggaggagggggaggaggatGCCATGCTCTACCTGGAGCCAGAGATGCAGCTGTACGAGGatcaggaggagcagcaacagaggcCACAGGTAAATGGTGGCTGGAAAACGGAACTCCGTTTGCCATCAAAGGGCAGGGTGGCCTTCAATCCGGTGCGTTCGGGCTACGACAAGTGCTCGCTGATGCACTGCCAGCGCCAGAGATCGAAGCACGGCGTCCACATCTACAAGTTCCCCCGCTCGCAggagcaccagcagcgatGGATGCACAATCTGCGCATCCGCTACGACGAGAAGCGTCCCTGGAAGTTCATGGTGTGCAGCGTGCACTTTGAGCCGCATTGCATACGGCTGCGGAAGCTGCGACCCTGGGCAGTGCCCACACTGGAGCTGGGCGACAATGTGCCCGAGGATATCTACACGAACGAGCAGTGCCAGATGTTTGCCAGTGGCCAGGCAGGAGGCGAGGTCCATGGCATTGACAGCGAtgcggaggcagaggcagaggtggaggcggaggcagagaGCGATGGGAATGAGGAGGATGGCCTGCAAgaggacgaggatgaggagaCAGATGACCAGGAGCCCAGCACCGCTAAGAAGCGTCGTCGTTCGCGACTGGATGCGGCTGGATGGCCGCCCGGCCAGGTGCCACCGTGGAAGGTGAAGCAGTGCTGTCTGCCCTACTGCCGCAGTCCGCGCGGCGATGGCATCAAGCTGTTCCGACTGCCCAACAAAGTCAACTCCATTCGCAACTGGGAGCTGGCCACGGGCATGAAGTTCAAGGAGTCGCAGCGCAACACGCGGCTCATCTGCAGCCGCCACTTTGAGCCGGAGCTGATTGGAGTGCGTCGTCTCATGCGCAATGCCATTCCCACCAGGCATTTGGGACCCACGGCCGTCACGGGCGATGTGAAGCCAGTGCTGGTGCCACCGAGCACAGCTGGTCCCAAATGCTGCATGGCCGATTGCGCCTACGATGTGGCCGATGTGAAGCTGCACAAGTTTCCCAGCAATCCCAAGCTACTGAGGGAGTGGTGCCAGGCATTGAGAGTCACCGACATGCAGAGGTATCGCGGCAAGCACATTTGCTCCGCCCATCTGCCCGTACACAAGGCCGTGCACTGCATTGTGTGTGGCACGGACAGCGTCCCACTGCTGCCGATGCTTAACTTTCCCGCCAACCGGAATCAGCGGGCCAAATGGTGCTACAACCTGAAGATCGAAACGATACCCAAGTGGGACATATCCAAGCACATTTGCTGCAAACACTTTGAGCCATATTGCTTTGCGGCGGCGGGTCTACTCAAGCCAGAGGCTGCGCCCACACTGCATTTGAATCACAATGATACAAACATATTCCTTAACGATTGTGCCATAAATCCCGCCTACACAGGTGTAGGTGTAGGCGCAGGAGTGCTGCGGGTAAAGGATGAGCCCATGGACAATCAGGTCCTATCGTTGTTGTAG
Protein Sequence: MSQHNPHAHPHYHHHPLHQSNNNNNNNNDYQSGIGMYSAPPSAHYGCLDQKQHQQQQQQQQQQQQQQQQQAQMPHSNWYSHVASYPPVPPHHHATATSAFAATSTPCKGSNSGSGSVSSNNMNAYGVGSTHGYYAAAAAAAAAAGGGLNVNAVGGGGVGSVAAAAAYNLEANTVAYAHNQLLQYQQHHQQQQQQQHLSQRSYMGHDIMSGTYPYIKSEPMEAAYQQPPPNPMAPPPAPDMIIKSEPMDEHAYKSNYIDDNTPFADFNKFNEFSGDMLSPKVELTIKDETYGKTSSGSSFARRKVQQQPQQQPQLPTTDRSAESLPICQRCKEVFFKKQSYLRHVAESSCGIQEYDFKCNICPMSFMTSEELQRHKHLHRADKYFCHKYCGKHFDTIAECETHEYMQHEYDSFVCNMCSGTFATREQLYVHLPQHKFQQRYDCPICRLWYQTAVELHEHRLAAPYFCGKYYTNQQQQQQQQQQLQGNYKLQDCHMATMEMPTLPTAPILKAPTNCNASVLPATAALSSLLQQRQANADGAAAMFAAASSSSSSAAAAATSVSLKSEVSVKLERSYSNSTSESSYSHQDNSSYNNAYGSDSSIHGGALAGPQAHSSTLDDSEDALCCVPLCGVRKSTSPTLQFFTFPKDDKYLNQWLHNLKMFHIPAASYATFRICSMHFPKRCINRYSLCYWAVPTFNLGHDDVANLYQNRELTNTFTTGEVARCSMPHCTSQRGESNLKFYNFPKDIKSLIKWCQNARLPVQAKEPRHFCSRHFEDRCIGKFRLKPWAVPTLHLGAQYGKIHDNPKNLYVEEKRCCLNFCRRSRSSDFNMSLYRFPRDEVLLRRWCYNLRLDPGVYRGKNHKICSAHFIKEALGLRKLSPGAVPTLHLGHNDTFNIYENELWPPPSPTGQHGQLLPQQQQQQPSQHQHSPSMHSKSSYQRHSAASTSSSASSASHYVDAEMSASYLSLSAAGSSGGMNASDCMDVCCVPSCESKRHNSENITFHTIPRRPEQMRKWCHNLKIPEDKMHKGMRICSLHFEPYCIGGCMRPFAVPTLQLGHEDLEDIHRNPDVIKKLNIRETCCVAVCKRNRDRDHANLHRFPSNVALLTKWCANLQRTVPDGSKLFNDAICEVHFEDRCLRNKRLEKWAVPTLMLGHEDMAYQLPTPEQVAEFYARPTAPNNGEEQGECCVETCKRNPSVDDIKLYRPPEDSSVLAKWAHNLQTEAAALTNGLRICNLHFEAHCIGKRMRPWAIPTLNLAGNIENLYENPEHSMLYKRRTHLKQKVPVAKPTWVPRCCLPHCRKVRAQHNVQLYRFPKLNRSTLAKWAHNLQVPQVGSAQRRVCSAHFEPHVLSKKCPVPLAVPTLDLNSPAGHKIYQNPAKLKANKLCLQRVCIVESCRKTRAQGVQLFRLPHSPTQLRKWMHNIRTRPRAAMRSQYRVCSRHFETHSFNGRRLSAGAIPTLELGHDDDDIFPNEAQAFADEHCAVEGCESSKEQAEVRLFRFPTDDDDMLWKWCNNLKMNPVDCIGVRICNKHFDADCIGPKHLYKWAIPTMLLGHDDSQIELILNPKPEERYVDPVFKCIVPTCGKTRRFDEVQMNSFPKDADLFQRWRHNLRLEHLCFKEREKYKICNAHFEDMCIGKTRLNIGSIPTLELGHAETEDLFKVNPAELQSNLFGRPRRLLRGYNNVSIKQEPPESQEEQQQDVKPDMGTDFTQVKIKKSLGDIKCCVRTCGRSRLEHGARLFPFPNGKQQHLKWRHNLRLEPDEVDKLTRVCSAHFNRRCIDGKQLRGWAMPTQQLGHQEQPIYENPKNIPGFFTPTCALGHCRKRRSIDNDLRTYRYPRSEDLLEKWRANLGLSLDQCRGRICADHFEPQVRGKLKLKTGAVPTLKLGHEEALIYDNEAIKAGVAEEEAAAAAAGSASPLVIPKTEVLDEEEREEDEEEEDDTPEGAEQLRDEDDDEDDDEDPGNYFDPLELVETYAEHPSDDDDDEAGEKDAREDEDEEEEEAETLLPDTPPKSSAVLRMPKPWDRPAAAAAVASAVVVPRREKRPNNVDPICCLKHCRKERSAMYLLSTFGFPKDQQLLLKWCANLQMDPSGCIGRVCIEHFQSEVLGTRKLKQNAVPTLNVGHDAPLRYSCNGQEISANSNSFPDEMPQHSVFRLWSLKHCRKRKLSESSAPAPAAIKKEQHQQQHQQQQHQQQTPMEMEMQMELELETKPKICCLPSCGNVEGYGLGGHFQPLPVDQRLLKKWQHNLRLPTINSDTELRLCLEHFEPQQIENGCPVRMAVPTVKLGHTSPNIFRNSEGSRLPGCLWPSCPPNRKLCYDLPEHEAVRVAWLSYVRLPVDSQGRLCGLHFLQLYEEVDLPGDVPEKVLERLQDTYDQASISLKFQCSVLGCGSKYKQDTHLAKLPRDAQLLAKWLHNTRISYDRSLHFSYRICLLHFEALCLNGHRPQTWAIPTLQLNHDGEIYQNSVKQELLENPPKQELLENPPKQESENHETPVKQEKQEKPHCSLSLSIPLHIKTEQVTPVLRGTSSLSSPCLSASSSPRAKNRVCCIPNCGEMPPRSQRLHRFPTAEPTLLKWLVNTQQKPGLVDIQSLFVCQLHFEADAINQTQLRSWAVPTLRLGHDGHVIPNARHNGNIANSQETEQAMEFIRANYCSVLSCFQPKGEGVRFHKYPSDIAMVRKWATNLKHRSMQASSHGFLVCQSHFPAECFDPGTGELRADAVPVASSVKTESLPLHCLVRGCSADNLGKEGRLLFKVPKKNRVRDAWAHNLWMHPIELMGEQHICERHFEAHCVNEQKMLHAGSVPTLHLGHTEPLELLPNPQTFNECQEECVCCVPGCGRSNRKNSQEELQFSKFPKWRVLYDKWLHNFRLEVPKEQRIGTLRVCHTHFEESCFEPEQGGVRRGAMPTLQLGHSHPDIYRTDKGSLWKKVHKRFSDCCYPDCYEDCHKANTNRMVYELPGAGPLREAWQQHLGIPDSGSSVLLRLCALHYIMLYEHSEQNLPEHAADLLLLAKNYAHARQLAYLRRFMCAVQGCRHLQPRDGGSMHGIPRRRQILRMWVENAQLRLNEHEIYMTKLCSKHFEPHCLFEGKKCYPWSVPTLHLPALLPGQVLHQNPTTEEWQQMKQRMKMEEQTLRAEPQPDGGLQMEPYVKMEPHDDDDRSQTESELLVNESTMDDSQETDFQANEPLEVLLEVGHVERLESYEKKDYPAVSYAVPPAPPPKRFRHPYSAHKCSVAGCGVSLEDVGGNLKLHKLPSATEATRKWLYNIQVDIEDKWRIRVCSHHFDRQCLNGSRLRRGSMPTLLLGPRVPATIHQNEFAPLPLDDAAPAAANGAAPIHVEPSIGKVLHPCVPRPSPPRKSSKFCQIEGCANHLTSEHMTLHKFPHSAWICTKWQHNTQVPFDPEYRWRYRICSAHFHPVCMVNMRLLHGSVPTLKLGPRAPAELFDSDFEAINIKIEKLEKMERRAEAQRVTTSRSHSHHSTMPDMGEVRLKVKTEQLDDGSGPMQEQEQEEEEGEEDAMLYLEPEMQLYEDQEEQQQRPQVNGGWKTELRLPSKGRVAFNPVRSGYDKCSLMHCQRQRSKHGVHIYKFPRSQEHQQRWMHNLRIRYDEKRPWKFMVCSVHFEPHCIRLRKLRPWAVPTLELGDNVPEDIYTNEQCQMFASGQAGGEVHGIDSDAEAEAEVEAEAESDGNEEDGLQEDEDEETDDQEPSTAKKRRRSRLDAAGWPPGQVPPWKVKQCCLPYCRSPRGDGIKLFRLPNKVNSIRNWELATGMKFKESQRNTRLICSRHFEPELIGVRRLMRNAIPTRHLGPTAVTGDVKPVLVPPSTAGPKCCMADCAYDVADVKLHKFPSNPKLLREWCQALRVTDMQRYRGKHICSAHLPVHKAVHCIVCGTDSVPLLPMLNFPANRNQRAKWCYNLKIETIPKWDISKHICCKHFEPYCFAAAGLLKPEAAPTLHLNHNDTNIFLNDCAINPAYTGVGVGAGVLRVKDEPMDNQVLSLL

Similar Transcription Factors

Sequence clustering based on sequence similarity using MMseqs2

100% Identity: iTF_00536072;
90% Identity: iTF_00603372; iTF_00611379; iTF_00474529;
80% Identity: -