Basic Information

Insect: Drosophila serrata
Gene Symbol: -
Assembly: GCA_002093755.1
Location: NW:2857-17508[-]

Transcription Factor Domain

TF Family: THAP
Domain: THAP domain
PFAM: PF05485
TF Group: Zinc-Coordinating Group
Description: The THAP domain is a putative DNA-binding domain (DBD) and probably also binds a zinc ion. It features the conserved C2CH architecture (consensus sequence: Cys - 2-4 residues - Cys - 35-50 residues - Cys - 2 residues - His). Other universal features include the location of the domain at the N-termini of proteins, its size of about 90 residues, a C-terminal AVPTIF box and several other conserved residues. Orthologues of the human THAP domain have been identified in other vertebrates and probably worms and flies, but not in other eukaryotes or any prokaryotes [1].
Hmmscan Out: # of c-Evalue i-Evalue score bias hmm coord from hmm coord to ali coord from ali coord to env coord from env coord to acc

1 29 3.3 5.9e+03 -2.2 2.3 44 62 318 339 303 354 0.55

2 29 2.7e-15 4.8e-12 46.1 4.0 1 86 548 620 548 621 0.85

3 29 1e-14 1.8e-11 44.3 5.0 1 87 648 717 648 717 0.83

4 29 9.3e-16 1.7e-12 47.6 0.2 1 87 739 811 739 811 0.85

5 29 6.2e-16 1.1e-12 48.2 5.2 1 86 909 978 909 979 0.81

6 29 2.2e-15 3.9e-12 46.4 3.6 1 86 1003 1074 1003 1075 0.82

7 29 8.3e-13 1.5e-09 38.2 1.2 1 87 1110 1178 1110 1178 0.80

8 29 8.2e-11 1.5e-07 31.8 1.4 1 86 1220 1289 1220 1290 0.76

9 29 5.1e-17 9.1e-14 51.7 0.4 1 86 1317 1386 1317 1387 0.82

10 29 1.3e-12 2.4e-09 37.5 1.4 1 85 1408 1476 1408 1478 0.79

11 29 2.1e-14 3.7e-11 43.3 0.4 1 86 1505 1576 1505 1577 0.85

12 29 1.8e-12 3.2e-09 37.1 3.5 1 85 1651 1719 1651 1721 0.82

13 29 1.8e-12 3.2e-09 37.1 0.1 1 86 1744 1812 1744 1813 0.83

14 29 2.6e-13 4.6e-10 39.8 2.2 1 87 1959 2028 1959 2028 0.79

15 29 7.4e-12 1.3e-08 35.1 0.3 1 87 2127 2200 2127 2200 0.83

16 29 0.00032 0.57 10.7 0.4 1 61 2215 2267 2215 2282 0.73

17 29 2.2e-12 4e-09 36.8 0.0 1 87 2294 2365 2294 2365 0.80

18 29 2.3e-13 4.2e-10 39.9 0.6 1 87 2417 2487 2417 2487 0.83

19 29 2.5e-12 4.5e-09 36.6 0.1 1 86 2522 2596 2522 2597 0.80

20 29 1.4e-12 2.6e-09 37.4 0.0 1 86 2607 2680 2607 2681 0.80

21 29 2.9e-11 5.2e-08 33.2 0.1 1 86 2703 2776 2703 2777 0.73

22 29 1.7e-05 0.03 14.8 0.8 1 58 2806 2856 2806 2892 0.79

23 29 2.5e-12 4.4e-09 36.6 0.7 1 86 2896 2967 2896 2968 0.82

24 29 4e-16 7.2e-13 48.8 0.3 1 86 3080 3152 3080 3153 0.81

25 29 2.4e-12 4.3e-09 36.7 3.7 1 86 3216 3286 3216 3287 0.80

26 29 7.7e-14 1.4e-10 41.5 4.8 1 86 3378 3448 3378 3449 0.84

27 29 4.3e-12 7.7e-09 35.9 0.2 1 86 3528 3597 3528 3598 0.85

28 29 2.3e-08 4.1e-05 23.9 0.7 1 58 3623 3670 3623 3678 0.82

29 29 1.4e-10 2.5e-07 31.0 2.0 17 87 3687 3746 3677 3746 0.75

#	of	c-Evalue	i-Evalue	score	bias	hmm coord from	hmm coord to	ali coord from	ali coord to	env coord from	env coord to	acc
1	29	3.3	5.9e+03	-2.2	2.3	44	62	318	339	303	354	0.55
2	29	2.7e-15	4.8e-12	46.1	4.0	1	86	548	620	548	621	0.85
3	29	1e-14	1.8e-11	44.3	5.0	1	87	648	717	648	717	0.83
4	29	9.3e-16	1.7e-12	47.6	0.2	1	87	739	811	739	811	0.85
5	29	6.2e-16	1.1e-12	48.2	5.2	1	86	909	978	909	979	0.81
6	29	2.2e-15	3.9e-12	46.4	3.6	1	86	1003	1074	1003	1075	0.82
7	29	8.3e-13	1.5e-09	38.2	1.2	1	87	1110	1178	1110	1178	0.80
8	29	8.2e-11	1.5e-07	31.8	1.4	1	86	1220	1289	1220	1290	0.76
9	29	5.1e-17	9.1e-14	51.7	0.4	1	86	1317	1386	1317	1387	0.82
10	29	1.3e-12	2.4e-09	37.5	1.4	1	85	1408	1476	1408	1478	0.79
11	29	2.1e-14	3.7e-11	43.3	0.4	1	86	1505	1576	1505	1577	0.85
12	29	1.8e-12	3.2e-09	37.1	3.5	1	85	1651	1719	1651	1721	0.82
13	29	1.8e-12	3.2e-09	37.1	0.1	1	86	1744	1812	1744	1813	0.83
14	29	2.6e-13	4.6e-10	39.8	2.2	1	87	1959	2028	1959	2028	0.79
15	29	7.4e-12	1.3e-08	35.1	0.3	1	87	2127	2200	2127	2200	0.83
16	29	0.00032	0.57	10.7	0.4	1	61	2215	2267	2215	2282	0.73
17	29	2.2e-12	4e-09	36.8	0.0	1	87	2294	2365	2294	2365	0.80
18	29	2.3e-13	4.2e-10	39.9	0.6	1	87	2417	2487	2417	2487	0.83
19	29	2.5e-12	4.5e-09	36.6	0.1	1	86	2522	2596	2522	2597	0.80
20	29	1.4e-12	2.6e-09	37.4	0.0	1	86	2607	2680	2607	2681	0.80
21	29	2.9e-11	5.2e-08	33.2	0.1	1	86	2703	2776	2703	2777	0.73
22	29	1.7e-05	0.03	14.8	0.8	1	58	2806	2856	2806	2892	0.79
23	29	2.5e-12	4.4e-09	36.6	0.7	1	86	2896	2967	2896	2968	0.82
24	29	4e-16	7.2e-13	48.8	0.3	1	86	3080	3152	3080	3153	0.81
25	29	2.4e-12	4.3e-09	36.7	3.7	1	86	3216	3286	3216	3287	0.80
26	29	7.7e-14	1.4e-10	41.5	4.8	1	86	3378	3448	3378	3449	0.84
27	29	4.3e-12	7.7e-09	35.9	0.2	1	86	3528	3597	3528	3598	0.85
28	29	2.3e-08	4.1e-05	23.9	0.7	1	58	3623	3670	3623	3678	0.82
29	29	1.4e-10	2.5e-07	31.0	2.0	17	87	3687	3746	3677	3746	0.75

Sequence Information

Coding Sequence: ATGTCACAACACAACCCCAATCACGCCCACCCACACTACCACTACCCGTCCCATACGACGCCGCTGgctctgcagcagcagcagcatcaacagcagcagcagcacggcAGTAGTTGGTACTCACATGTTGCTTCCTACCCAGCAGCCTCGGCCTCCCACTCCCACCCCCTCTCTCACTCGGCCTTTGGCCCTGCGCCCCCTTGCAAGGccaacatcagcaacaacaacgcaAACAACATTATGGGCGCCTATGGAGGAGGAGTGGGAGGGAGTGGAGGCTCGCATGGATATTTCGGCGCCGCTGGCGGTGGCCTCAATGTCAGCGGGGCGGGGGGTGGTGCTGGGTCGTCCTACGGCCTTGGGGCCAACACGGTGGCATATGCTCACAACCAACTGCTGCAGTaccagcatcatcatcagcaaaaccagcagcagcagcagcacataGGCCTGGGCCAGCGATCCTATATGGGCCACGATGTCATGGCCGGGAGCTATCCCTATATCAAGAGCGAACCCTTAGAGGGGTTTCAGCAGCCGCCGAATCCAATGGCCCCACCTCCGGCACCAGAAATGATGATAAAATCGGAGCCCATTGACGACCTGGCCTACAAGTCAAACTACATAGACGACAATACGCCATTTGCGGACTTCAGCAAGTTTAGCGAATTCAGCGAGGACATGCTGAGTCCCAAAGTCGAGCTGACTGTCAAGGATGAGTCCTTCGTCAGGAACCCCAATAGCTTTTTACGCCGTAAGCAACAATCGGATCTGACGACAGCAGAGAGCCTGCCCGTCTGCCAGCGATGCAAGGAGGTGTTCTTCAAAAAGCAGACTTACCTGCGGCACGTCGCGGAGAGCAACTGCGGCATCCAGGAGTATGACTTCAAATGCACCATATGCCCTATGTCCTTCATGACCGCCGAGGAGTTACAACAGCACAAACAACAGCATCGAGCGGACAGGTTCTTCTGTCACAAGTACTGCGGAAAGCATTTTGCCACGATCGCTGAGTGCGAGTCGCACGAGTACATGCAGCACGAATACGAAAACATTGTGTGCAACATGTGCTCGGGATCTTTCGCCACGCGGGAACAACTGTATGCCCACTTGCCACAGCACAAGTTCCAGCAGCGCTTTGACTGCCCCGTATGTCGGCTGTGGTACCAAACGGCTATGGAACTGCACGAGCATCGCCTAGCTGCACCTTACTTCTGCGGTAAATACTACACAAGTGGACAATCCCCGGTCCCGTCCTCCCAACAGCAACCGCACCAGAGCCAGACGAACTACAAGCTGCAGGACTGTCATATGGCCACCATGGAAATGCCAAGCGCACCGCTTCTTAAGACGAACTCATCCAACTCGCCTGCCTTGCCTGCGACAGCAGCGCTTAATTCACTGCTGCAGCAGCGCCAGGCCAATGCCGATGGAGCGGCTATTTTTGCCGCATCTTCGCTGAAGAACGAGGTTGCTGTAAAACTGGAGCGTAGCTACAGTAACTCGACCAACGAATCTTCTTATAGCGTCCAGGAGAGTGGCTACAATAATGTGTATGGCAGCAGCGACAGCTCAGTGCACGGTGCCATCGCCGGACCACAGGCACACTCTTCAACGCTGGACGACTCCGAGGATGCGCTGTGCTGTGTGCCGCTGTGCGGTGTGCGGAAGAGCACGAGTCCCACCTTGCAGTTTTTCACGTTCCCGAAGGACGAAAAGTATCTCAACCAGTGGTTGCATAACCTCAAGATGTTCCACATACCCGCTTCCAGCTACGTTAGCTTCCGGATCTGCAGCATGCACTTCCCCAAGCGATGCATCAACCGCTACTCGCTGTGCTACTGGGCGGTGCCGACGTTTAACCTCGGCCACGATGACGTAGCCAATCTCTACCAGAACCGGGAGCTGACCAACACCTTTACCACTGGCGAAGTGGCGCGCTGCAGCATGCCACACTGTACCAGCCAGCGGGGTGAGAGCAACCTCAAGTTTTACAACTTCCCAAAGGACATCAAAAGCCTGATTAAGTGGTGCCAAAACGCTCGACTCCCGGTGCAGGCAAAGGAACCGCGACATTTCTGCAGCCGTCACTTCGAGGAGCGGTGCATTGGCAAGTTCCGTCTAAAGCCTTGGGCGGTGCCCACCTTGCACTTGGGCGCCCAGTACGGCAAGATCCACGACAATCCGAAGAATCTATACGTGGAAGAAAAACGCTGTTGCCTCAACTTTTGCCGTCGGAGCCGTTCTTCTGATTTCAATATGTCGCTATATCGATTTCCTAGAGACGAAGTCCTGCTACGTCGCTGGTGCTACAATCTTCGCCTCGATCCAGGAGTGTATCGTGGAAAGAATCACAAAATATGCAGCGCCCACTTTATAAAGGAGGCGTTGGGTCTCCGTAAACTATCTCCTGGTGCCGTGCCCACACTTCATCTGGGCCACAATGATACCTTCAATATCTACGAGAACGAACTGTGGCCCCCGCCAACACCGACACCTTCCTCTTGTCATctccaacagcaacagcagtcaTCTATGCATTCGCTACAACAGCAGATGCATAGCAAGTCCTATCAGCGCCGTTCGGTGGCATCCACTTCGTCATCGGCTAGCTCCGCAGCTTCGCATTATGTGGACCCGGAGATGAGCGCCTCTTAccatctagccatgtccgccTCCGCCGGAGGCTCTTCGGCCATAAACGCTAGTGACAGCATGGACGTCTGTTGTGTGCCCAGTTGCGAGAGCAAGCGACACAATAGCGAGAACATTACATTCCACACGATTCCGCGACGGCCCGAGCAGATGCGTAAATGGTGTCACAATCTTAAAATTCCCGAGGAGAAGATGCATAAGGGCATGCGAATCTGTAGCCTTCACTTCGAGCCCTACTGCATCGGTGGCTGTATGCGACCGTTTGCTGTGCCAACCCTTCAGTTGGGTCACGACGACGAGGACATTCACCGCAATCCGGACGTGATCAAGAAGCTGAACATCCGGGAGACATGCTGTGTGGCTGTATGCAAACGGAATAGGGACAGGGACCATGCCAACCTGCATCGTTTCCCTAGCAACGTGGCGTTACTAAAGAAGTGGTGCGCCAATTTGCAACGCAGCGTGCCCGATGGCAGTAAGCTTTTCAATGATGCCATCTGTGAGGTGCACTTTGAGGATCGCTGCCTGCGCAACAAGAGGCTTGAGAAGTGGGCAGTACCTACTCTGATCCTGGGGCATGAGGACATCGCCTATCCGCTGCCCACCCCAGAGCAAGTCACTGAGTTCTATGCCCGGCCCACGGCTCCTAACAACGGCGAGGAACAGGGCGAGTGCTGTGTGGAGACTTGCAAGAGAAATCCTAGCGTGGACGATATCAAACTATACCGCCCGCCGGAGGAGGCCACCGTGCTAGCCAAGTGGGCGCACAACCTGCAAACGGACGCCAACCAACTGACAAGCATGAGGATCTGCAACCTTCACTTCGAGGCGCATTGCATCGGCAAGAGGATGCGACAGTGGGCCATACCGACTTTGAATCTAGCCGGCAACATTGAGAATCTTTACGAGAACCCAGAGCAATCGTTGCTGTACAGGCGACGCACGACTCACTTGAAGACGAAGCTGCCGCCAGCCTCCGTGAAGCCCACTTGGGTGCCCAGATGCTGTCTTCCACACTGTCGCAAAGTCAGAGCCCTGCACAATGTCCAGCTCTATCGCTTCCCCAAGCTCAATCGCTCCACATTGGCCAAGTGGGCGCATAATCTCCAGGTCCCAATGGTGGGCAGTGCCCAGCGCAGGCTATGTTCGGCCCATTTCGAGCCGCATGTGCTTAGCAAAAAGTGTCCGGTGCCGCTGGCGGTGCCTACGCTCGACCTAAATTCACCACCCGGCTTAAAAATCTATCAGAATCCGGCCAAGCTAAAGGCCAGCAAACTGTGCCTGCAACGAGTTTGCATCGTCGAGAGCTGCCGCAAGACGCGGGCGCAGGGCGTGCAGCTTTTCCGGCTGCCGCATAGTCCTACACAGCTGCGAAAATGGATGCACAACATAAGGACGCGGCCACGAGCAGCTATGCGGGCTCAGTACCGAGTTTGTTCTCGCCACTTTGAGACGCACTCATTCAATGGCCGAAGATTAAGTGCAGGTGCCATACCGACTCTGGAACTGGGCCACGATGGCGACGATATCTATCCCAATGAAGCGCAGGCATTTGTGGACGAGCATTGTGCTGTGGAGGGCTGCGAGGCATCTAAGGAGCAACCGGAGGTGCGTCTTTTCCGCTTCCCCACCGACGACGACGATATGTTGTGGAAGTGGTGCAACAACCTCAAAATGAATCCGGTGGATTGCATTGGGGTACGCATCTGCAACAAGCACTTCGAGGCCGATTGCATCGGTCCTAAGCACCTGTACAAGTGGGCCATTCCTACGCAGGAGTTGGGCCACGATGACGCGCAGATCGAGCTGATCCCGAATCCCAAACCAGAGGAGAGGTATGTGGATCCCGTCTTCAAGTGCATCGTACCCACCTGCGGCAAGACTCGACGGTTTGACGAGGTGCAAATGAACAGCTTTCCCAAGGACCCGGATCTATTCGAGCGATGGCGGCACAACCTGCGCCTGGATCATCTCAGTTTCCAGGAGCGTGACCGCTACAAGATCTGCAACGCTCACTTTGAGGAGATCTGTATTGGAAAAACACGGCTCAACATCGGTTCCGTTCCAACCTTGGAACTTGGTCatgacgatgaggatgatATTTTCCAAGTGAACCCAGCGGAGCTTCAAAGCAATTTATTCGGGCGACAGCGTCGACTGCAGCTCGAGGGATCCGGCGAACTGAGGGTCAAGCAAGAGCTATCCGAGACAGAGGACAACAACAAAGTGGATGTGATGGTCACAGGCTCCAATTCCAAGCAGGTGAAAATCAAGAGATCTACTTCGGATCTAAAATGTTGTGTGCACAGTTGTGGAAGAAGTCGCTTGGAGCACGGTGCACGTCTGTTTCCTTTTCCTACGGGCAAGCAGCAGCACCTAAAGTGGCGTCATAATCTGCACTTGGAACCAGAGGAGGTGGACCGATCGACGCGCGTTTGCAGCGCTCACTTTAATCGACGTTGCATCGATGGCAAACAACTGAGGAGCTGGGCGATGCCCACCCAACAACTGGGACACAACGACCAACCGATCTACGAGAACCCGAAGAACATACCCGGTTTTTTCACACCTACCTGTGCCCTGGGCCACTGTCGCAAGCGAAGAAGTATTGACAACGATCTGCGTACCTATCGGTATCCTAGAAGCGAAGATCTTCTGGAAAAATGGCGAGCTAACCTACGATTGGCTCCGGATCAGTGTCGTGGTCGGATCTGTGCGAATCACTTCGAACCGCAGGTGCGGGGCAAGCTTAAGTTGAAGACGGGAGCGGTTCCCACACTACAACTGGGACACGACGAGGGATTGATCTACGACAATGAAGCTATAAAGGCTGGCATGGCCGAAGAAGAGGAGAGCATAACCACAGAGTTCCCGAGACTGAAACCAAAAGAGGTGCtcgaagaggaggaggaggagggtgaAGGAATTGATGGCGAGCAGGAGCACCCAGATGACCTGGACGACAATGCCGATGAAGAAGACAGAGATGAACATTATTTTGATCCTCTTGAACTAGTAGAGACTTTTGCTGAACATCGTAGCGATGACGAAGCCCAGGACTATGAGGATGAAGAAGACGAGGGTCGGGTTGAGGACTCCCCTTCCAGGTACGATTTGAAGGAGGAGATAGAACAGCTTCCAAGCTCCCCACCTTCCCCTCTTCCCCGGCGTTACCAAGCTCCGCGTCGAGACAAGCCGGCTAACAACGTAACGCCCATTTGCTGCCTGAAGCACTGCAGGAAGGAACGTACTGCCTTCCACCTCCTGAGCACTTTCGGATTCCCAAAGGATCGTCAGTTGCTGCTAAAGTGGTGTGCCAATTTGCATCTAAACCCGGACGACTGTATCGGTAGGGTTTGCATTGAGCACTTCCAGTCGGAGGTACTCGGCACCCGTAAGCTTAAGCAGAATGCCGTGCCCACCCTTAATGTGGGACATGAGGAACCGCTTAGATACTCGTGTCATGGCGTGGATCAGAATCTCGAGGAGCGGGACCCGCAGCCACAGCATTCGGTTTTTCGGCTTTGGAGCCTGAAACACTGCcgaaaaaggaagctaacggAGCCGCCGGATATTCCCCTAGCCAAGAGGAGAGCGCAGGAGATGCCTATGTTGAAACGAGAGTGGGAGATGGAGATGCCGATGCCAATGCCGATTCAGATGCAGATGGAGCGGAAGAATGAGGCAAAGAATATAACTCAAACTAAAAATGAATCATATATATGCTGTATCAGCAGTTGCGCAAACCAGGAAATTAGCCAACTGCTGGCTTTTCCCGAAGAGAAGTTCCTGCTAAGAAAGTGGAGACATAATTTAAGGATGTCTGAGACTGACCCTACTTCTCTAAGCCTGAAAAAAGTTTGTGTGGCGCACTTCGATTCGCAGCTGTTGGAGAATGGAAAACTCAGGAAGGATGCAGAGGCAAAAGCTGTGCCCACTGTGAACGTGGGCCACAGCAGCTGGAACCTTTACAGAAGCAATGGGATCTGTCTGGTGCCAGAATGCAGCCACACAACCTTCGGACGCGTAAGCTTCATCGACCTGCCGGATAACAGCATAATTAGGGACGCTTGCTTCTCCTGCCTCAATCTACCTGAATCCTGCGAGGAGCAGGCGAGACTATGTAGTATCCACTTTATGGAGGCATACAAGAAGTTAGATCTTCCTAATGTTCTGCACCCCCAAGTAATAGAGGCTCTACAAAGTGCTCTGGACGAAATGCAATGTGCGGTACCCGGCTGTTGTTATAAGGATGCTGATCCGAATATTTACCTAATCCAGCTTCCCGGTAACAAGGAGATGCTGTCGAAGTGGCTGCACAACACCAAGGTCCCCTACGATCCTTCTAGGCGCCAAAGCTATCGTATCTGCACGAACCACTTTGAATTAGATTACTTGGATACGAATGGCCCGCTAAAGGGGGCTATACCGACGCTCCACCTAAACCATGAAGATGAGATTCACTTAAATACTAGGCCCTTGCCAGAGGAGCAGGGCTCTATATTAACTCCACTGCGGATAAAGACGGATGTGGCCTTCCTGGGCAGTCCCTGTGCAAGTGCAAGCCCCAGTCCACGGGGCAGAATCCGGATATGCTGCATTCCCACATGTGGACAGATTGGAAGCAGTCAAGTGAGGCTGTTTCGTTTTCCCACCGAGGAGCAGGCGTTGCTCCGGTGGCTGGTGAACACACAACAGCAGCCAAGACTGGTAGATCCCACGGACTTGTACGTGTGCCAGTCGCATTTTGAGCCGGAGGCCATTTGCAAGAAGCAACTTCGAAGCTGGGCTGAGCCCACACTAAACCTGGGACACGACGGTTATGTAATTCCAAATGCCAAACATAATGGAAATATTTCGGACAGCCAAGATACTGAGGAAGCAATGAGATTTATTCGGGAACGCTTCTGCTCAGTCATTTCTTGCTTTCAGGCAGGAGGACAGGATGAGGAGGGAGTGAGGCTATTTGACTATCCCGAGGATATGGCGGCTACTCGAAAATGGGCAGCCGCATGCAGACATCGCTCTATGCAGGCCAGGAGCCATGGCTTCAAGGTGTGCCAGTTGCACTTCGCTAAGGAATGCTTTGACCACAATACTGGAGACTTGATTGAGGGTGCTGTGCCCACTTTGGAGTTGAGCAGAGATGAAATGGAGAGGCAATGTCTTGTGGCTGGATGTGTAAAAAATGATGCCAATGGAACTCGCCTCCGCTACTTTAAGATACCAAAAGTTGCTGCCCAATTGGAAGCGTGGAGCAATAACCTTAAAATCCCTCCATCGGATCTCATGCAAGGGGAGCAGCAGTACATCTGCGAGAAACACTTTGAGGCGTTCTGCTTCGGGGCCAATAAAGGACTGCGTTCTGGTGCTCTTCCAACCCTCCTGCTAGGCCATGATGAGGAGGTGGATATGCTTCCAAATCCGGAAAGCCTTTTATGCCAGGATACGTGCTGCGTACCGGGATGCGGGCGTATCTGGCAGACTGGGGATCGTAAGTTTCGCGGATTTCCCAAATTATTGGCCATGGCCAAAAAATGGAGGCATAACCTTCGTCTGGTAGAGCCCGTGGAGCAACTAGCCAAGCTGAAGGTCTGCAGTACTCACTTTGAAGCAACCTCACCCAACCTGGGCTCAAATGGATTATGTTCTAGTACCTCGATACCAACCCTGGAATTGGGTCACTCTTCTCCGGATATTTACCCAGCGGATATCAGCTTTAAGTTCCAAAAGCGGTCCGGAATGCCGgcgaaaatttattgttgttatcCCAAGTGCGAGGAAACCTGTTTGCCCAAGAATCTCTCTTACGGGCTTCCCCAGGACGAGCATCTAAGGAAAGCCTGGCTAAACCATATGGACATAGAAGATCCGAAAGACGAAGGAGTCGCTCTGCTTTGCCCGCTGCACTATGTCATTCTATATCAGCACAGTGCCACACACCATCCGGAGCATCATGCTTCAAGCAGAATGTTTCTTGAAGACAACTACAATGAAGCGCGGAACAACAGGCGTTTGAAGATTGTGAGCTGTACGGTCAAGGGCTGTGACATGGTTAAGCCCCGGGATGGTGTAGCACTGCACGGGATGCCGCAAAACAAAGACATTCTGCAAATGTGGATAGACAATGGCCAGATTGAGTTCTTAGAGCAACAGCGGTACATGTTCAAGGTGTGTCACAATCACTTTGAGCCATGCTGCTTCTTCGACGACAGACGTTTGCACTCATGGAGTGTGCCCACTTTACGCTTACCTGGCGACGTAATTCATCAAAATCCTACCGCCGAGCAGTGGCAGAGCATGATTAAGAAGCAAGAAGCAGCAAACACATACGCAGAAGAGAGCGATGAGCCAGAGCCATTTGAGGACGTAGTTAAAACCGAGCCCATTTTGAAGATGGAGCATATCGAATCGGAATATGAAGATGAAAACCCTGAGATGCAAGCCCTAGAGGTCCTCCTAGAAGTTGGCCATGTCGAGCGAATGGAGAGTTatgaaaaaattgataaatcaCCTTTGATCTACAACGATAATGCACCTTTTCGATCTTCACCCATACGTTGCCAATACAATGCTAATCACTGTGCCGTAGAAGGATGTGAGGTGACTGTTGAGGATGTGGACGGCACGATTAAACTGCACAAATTCCCCGCGTCGCAGGAAGCCGCACAGAAGTGGATGCACAACACCCAAGTTGACATGGACGAAAAGTTCTGGTGGCGCTACCGCATATGCAGTTACCACTTTGATCAAGAGTGCTTTCAGAGTGCTAGAATTCGAAAAGGCGCGATGCCCACGCTTCTGCTAGGACCTCGGCGACCGGAAACGGTGTACGATAATGAATTTGCACTACCAGATGGGGAAGAACCTTTTCTAGAGCCACCGGAGACTCAGCTTGAGGATACTATGACTGTGGCGTCCAGACTTCGAAAGGAGGTGTCTAATTTATGCCTGCCCCCACGGGCGCCGCCTCGAAAGTCAAGCAAGTTCTGCCAGATTGATTCTTGCACGAACCATCTAAACACTGAGAACATGACTCTTCACAAGTTTCCCCATTCGGAGGACATGTGCCTCAAATGGCAGCACAACACGCAAGTCCCATTCGACCCATACTACCGTTGGCGTTACCGCATTTGCAGTGCGCATTTTCATCCGGTCTGTTTGGTCAATATGCGTCTGGTCCATGGAAGCGTTCCCACTTTAAAGCTGGGACCCAAGGCTCCTTCCGAGCTGTTTGACAACGATTTCGAAGCCATTAACCTAAGGTTGGATAAAAGGTTGACAGAGTCCAATGCTAATGTGTACATTAAGCATGAAAGGGAAGAGGATGAGGATTCTATGGTGTTCCTGGAGCCGGAACTCCAGTTACACGATGATCAAGACGATAAGATATCAAGCTGGAACAGCAAACTACAATTACAACCTGTGAAGCAAGAGAAAATTGTTTACAGCCAGATCAAGTCTGGCTATGATAAGTGTTCCCTGGCTCACTGCCAGCGCCAAAGGTCCCAGCATGGCGTCCACATTTATAAGTTTCCCAGATCGAGGCGGCAACAGGAACGTTGGATGCACAATCTACATATTCGCTATGATGAGCGGACACCGTGGAAATTCATGATCTGCAGCGTTCATTTTGAGCCGCACTGTGTCAGCCTCAGGAAGCTGCGACCTTGGGCTGTGCCCACACTGGAACTTGGTGACAATGCACCAGCAATCTTTTCGAACGAACAGTGCGAGAAGGAGCTGCTGACCGATCGCAGTGATCTGGATAGCGATGCGGAGGACGAAGACGGCTTACAGgaggacgacgatgatgaAGACGAAGACGATGTGAAGCCCGATGTAATTGGCATAAAAAGGAGGAGACGTTTTAAGATAGATTCCACCTGCCCTTCAAGCCAGATTGCACCCTGGAAAGTTAAACAATGCTGCCTCCCCTATTGTCGTGCCTTTCGAGGGGATGGCATCAAACTGTTTCGGCTTCCGAACAACCGAAACTCCATTAGCAACTGGGAAAGGGCCACCGGCATGGTATTCAAAGAGTCGCAAAGGAACACTCGACTAATCTGCAGCCGTCACTTCGAGCCAGAGTTGATTGGAGTCAGGCGTCTAATGCGTAACGCCATTCCCACGAAGCACTTGAGCCCTCAAGCAGTTAACCAGATCCGTACTAAAAAGGAGAAGAATCCTCCTGCCACTATTATACCCATCTGCTGCATGGCGGACTGTCACTACAATGGAAATGTGAAGCTGCACAAGTTTCCAAGTGATCCTACTCTTCTCAGACAGTGGTGCCAGGCTCTCCGGCTCACTGATACGCAACGGTATTTGGGCAAGCATTGCTCCATGCACCTGCCAATGAACAAGACGTTGAGTTGTGTCATCTGCGGTGGGGACAATGTAGAGTTGCCGATGTTAAGGTTTCCGGAAAACCGCAACCAGCGCGCCAAATGGTGTTATAATCTCAAAATTGATACAATACCAAAGTGGGACCACTCCAAGCACATTTGCTGCCGGCACTTTGAGTCCCATTGCTTCGACAAGCCGGGTGAGCTTCGTCCAGGAGCGGCTCCCACGCTCCATCTCAATCACGATGACACAAACATATTCTTCAGCGACTATGCCACTGGTCTTCCGTCCTCGCCACTAGGCAATCGAATCAAAGACGAGCCCCTGGAATCTGAGTCCGACGAGATGCTGCTGGTGTAG
Protein Sequence: MSQHNPNHAHPHYHYPSHTTPLALQQQQHQQQQQHGSSWYSHVASYPAASASHSHPLSHSAFGPAPPCKANISNNNANNIMGAYGGGVGGSGGSHGYFGAAGGGLNVSGAGGGAGSSYGLGANTVAYAHNQLLQYQHHHQQNQQQQQHIGLGQRSYMGHDVMAGSYPYIKSEPLEGFQQPPNPMAPPPAPEMMIKSEPIDDLAYKSNYIDDNTPFADFSKFSEFSEDMLSPKVELTVKDESFVRNPNSFLRRKQQSDLTTAESLPVCQRCKEVFFKKQTYLRHVAESNCGIQEYDFKCTICPMSFMTAEELQQHKQQHRADRFFCHKYCGKHFATIAECESHEYMQHEYENIVCNMCSGSFATREQLYAHLPQHKFQQRFDCPVCRLWYQTAMELHEHRLAAPYFCGKYYTSGQSPVPSSQQQPHQSQTNYKLQDCHMATMEMPSAPLLKTNSSNSPALPATAALNSLLQQRQANADGAAIFAASSLKNEVAVKLERSYSNSTNESSYSVQESGYNNVYGSSDSSVHGAIAGPQAHSSTLDDSEDALCCVPLCGVRKSTSPTLQFFTFPKDEKYLNQWLHNLKMFHIPASSYVSFRICSMHFPKRCINRYSLCYWAVPTFNLGHDDVANLYQNRELTNTFTTGEVARCSMPHCTSQRGESNLKFYNFPKDIKSLIKWCQNARLPVQAKEPRHFCSRHFEERCIGKFRLKPWAVPTLHLGAQYGKIHDNPKNLYVEEKRCCLNFCRRSRSSDFNMSLYRFPRDEVLLRRWCYNLRLDPGVYRGKNHKICSAHFIKEALGLRKLSPGAVPTLHLGHNDTFNIYENELWPPPTPTPSSCHLQQQQQSSMHSLQQQMHSKSYQRRSVASTSSSASSAASHYVDPEMSASYHLAMSASAGGSSAINASDSMDVCCVPSCESKRHNSENITFHTIPRRPEQMRKWCHNLKIPEEKMHKGMRICSLHFEPYCIGGCMRPFAVPTLQLGHDDEDIHRNPDVIKKLNIRETCCVAVCKRNRDRDHANLHRFPSNVALLKKWCANLQRSVPDGSKLFNDAICEVHFEDRCLRNKRLEKWAVPTLILGHEDIAYPLPTPEQVTEFYARPTAPNNGEEQGECCVETCKRNPSVDDIKLYRPPEEATVLAKWAHNLQTDANQLTSMRICNLHFEAHCIGKRMRQWAIPTLNLAGNIENLYENPEQSLLYRRRTTHLKTKLPPASVKPTWVPRCCLPHCRKVRALHNVQLYRFPKLNRSTLAKWAHNLQVPMVGSAQRRLCSAHFEPHVLSKKCPVPLAVPTLDLNSPPGLKIYQNPAKLKASKLCLQRVCIVESCRKTRAQGVQLFRLPHSPTQLRKWMHNIRTRPRAAMRAQYRVCSRHFETHSFNGRRLSAGAIPTLELGHDGDDIYPNEAQAFVDEHCAVEGCEASKEQPEVRLFRFPTDDDDMLWKWCNNLKMNPVDCIGVRICNKHFEADCIGPKHLYKWAIPTQELGHDDAQIELIPNPKPEERYVDPVFKCIVPTCGKTRRFDEVQMNSFPKDPDLFERWRHNLRLDHLSFQERDRYKICNAHFEEICIGKTRLNIGSVPTLELGHDDEDDIFQVNPAELQSNLFGRQRRLQLEGSGELRVKQELSETEDNNKVDVMVTGSNSKQVKIKRSTSDLKCCVHSCGRSRLEHGARLFPFPTGKQQHLKWRHNLHLEPEEVDRSTRVCSAHFNRRCIDGKQLRSWAMPTQQLGHNDQPIYENPKNIPGFFTPTCALGHCRKRRSIDNDLRTYRYPRSEDLLEKWRANLRLAPDQCRGRICANHFEPQVRGKLKLKTGAVPTLQLGHDEGLIYDNEAIKAGMAEEEESITTEFPRLKPKEVLEEEEEEGEGIDGEQEHPDDLDDNADEEDRDEHYFDPLELVETFAEHRSDDEAQDYEDEEDEGRVEDSPSRYDLKEEIEQLPSSPPSPLPRRYQAPRRDKPANNVTPICCLKHCRKERTAFHLLSTFGFPKDRQLLLKWCANLHLNPDDCIGRVCIEHFQSEVLGTRKLKQNAVPTLNVGHEEPLRYSCHGVDQNLEERDPQPQHSVFRLWSLKHCRKRKLTEPPDIPLAKRRAQEMPMLKREWEMEMPMPMPIQMQMERKNEAKNITQTKNESYICCISSCANQEISQLLAFPEEKFLLRKWRHNLRMSETDPTSLSLKKVCVAHFDSQLLENGKLRKDAEAKAVPTVNVGHSSWNLYRSNGICLVPECSHTTFGRVSFIDLPDNSIIRDACFSCLNLPESCEEQARLCSIHFMEAYKKLDLPNVLHPQVIEALQSALDEMQCAVPGCCYKDADPNIYLIQLPGNKEMLSKWLHNTKVPYDPSRRQSYRICTNHFELDYLDTNGPLKGAIPTLHLNHEDEIHLNTRPLPEEQGSILTPLRIKTDVAFLGSPCASASPSPRGRIRICCIPTCGQIGSSQVRLFRFPTEEQALLRWLVNTQQQPRLVDPTDLYVCQSHFEPEAICKKQLRSWAEPTLNLGHDGYVIPNAKHNGNISDSQDTEEAMRFIRERFCSVISCFQAGGQDEEGVRLFDYPEDMAATRKWAAACRHRSMQARSHGFKVCQLHFAKECFDHNTGDLIEGAVPTLELSRDEMERQCLVAGCVKNDANGTRLRYFKIPKVAAQLEAWSNNLKIPPSDLMQGEQQYICEKHFEAFCFGANKGLRSGALPTLLLGHDEEVDMLPNPESLLCQDTCCVPGCGRIWQTGDRKFRGFPKLLAMAKKWRHNLRLVEPVEQLAKLKVCSTHFEATSPNLGSNGLCSSTSIPTLELGHSSPDIYPADISFKFQKRSGMPAKIYCCYPKCEETCLPKNLSYGLPQDEHLRKAWLNHMDIEDPKDEGVALLCPLHYVILYQHSATHHPEHHASSRMFLEDNYNEARNNRRLKIVSCTVKGCDMVKPRDGVALHGMPQNKDILQMWIDNGQIEFLEQQRYMFKVCHNHFEPCCFFDDRRLHSWSVPTLRLPGDVIHQNPTAEQWQSMIKKQEAANTYAEESDEPEPFEDVVKTEPILKMEHIESEYEDENPEMQALEVLLEVGHVERMESYEKIDKSPLIYNDNAPFRSSPIRCQYNANHCAVEGCEVTVEDVDGTIKLHKFPASQEAAQKWMHNTQVDMDEKFWWRYRICSYHFDQECFQSARIRKGAMPTLLLGPRRPETVYDNEFALPDGEEPFLEPPETQLEDTMTVASRLRKEVSNLCLPPRAPPRKSSKFCQIDSCTNHLNTENMTLHKFPHSEDMCLKWQHNTQVPFDPYYRWRYRICSAHFHPVCLVNMRLVHGSVPTLKLGPKAPSELFDNDFEAINLRLDKRLTESNANVYIKHEREEDEDSMVFLEPELQLHDDQDDKISSWNSKLQLQPVKQEKIVYSQIKSGYDKCSLAHCQRQRSQHGVHIYKFPRSRRQQERWMHNLHIRYDERTPWKFMICSVHFEPHCVSLRKLRPWAVPTLELGDNAPAIFSNEQCEKELLTDRSDLDSDAEDEDGLQEDDDDEDEDDVKPDVIGIKRRRRFKIDSTCPSSQIAPWKVKQCCLPYCRAFRGDGIKLFRLPNNRNSISNWERATGMVFKESQRNTRLICSRHFEPELIGVRRLMRNAIPTKHLSPQAVNQIRTKKEKNPPATIIPICCMADCHYNGNVKLHKFPSDPTLLRQWCQALRLTDTQRYLGKHCSMHLPMNKTLSCVICGGDNVELPMLRFPENRNQRAKWCYNLKIDTIPKWDHSKHICCRHFESHCFDKPGELRPGAAPTLHLNHDDTNIFFSDYATGLPSSPLGNRIKDEPLESESDEMLLV

Similar Transcription Factors

Sequence clustering based on sequence similarity using MMseqs2

100% Identity: iTF_00525910;
90% Identity: iTF_00527336; iTF_00533131; iTF_00593867; iTF_00612846; iTF_00617683; iTF_00594582; iTF_00488697; iTF_00491545; iTF_00489405; iTF_00478047; iTF_00541107;
80% Identity: -