Basic Information

Insect: Drosophila testacea
Gene Symbol: -
Assembly: GCA_035043265.1
Location: JAWNND010000151.1:5062841-5077585[+]

Transcription Factor Domain

TF Family: THAP
Domain: THAP domain
PFAM: PF05485
TF Group: Zinc-Coordinating Group
Description: The THAP domain is a putative DNA-binding domain (DBD) and probably also binds a zinc ion. It features the conserved C2CH architecture (consensus sequence: Cys - 2-4 residues - Cys - 35-50 residues - Cys - 2 residues - His). Other universal features include the location of the domain at the N-termini of proteins, its size of about 90 residues, a C-terminal AVPTIF box and several other conserved residues. Orthologues of the human THAP domain have been identified in other vertebrates and probably worms and flies, but not in other eukaryotes or any prokaryotes [1].
Hmmscan Out: # of c-Evalue i-Evalue score bias hmm coord from hmm coord to ali coord from ali coord to env coord from env coord to acc

1 28 6e-15 1.1e-11 45.5 4.3 1 86 487 559 487 560 0.85

2 28 3.4e-15 6.5e-12 46.3 4.6 1 87 587 656 587 656 0.83

3 28 7.4e-16 1.4e-12 48.4 0.4 1 87 678 750 678 750 0.84

4 28 7.3e-16 1.4e-12 48.4 5.7 1 87 853 923 853 923 0.83

5 28 8.9e-15 1.7e-11 44.9 3.4 1 86 947 1018 947 1019 0.82

6 28 5.3e-13 1e-09 39.2 1.1 1 87 1054 1122 1054 1122 0.80

7 28 4.1e-10 7.8e-07 30.0 1.7 1 86 1169 1238 1169 1239 0.76

8 28 7.2e-16 1.4e-12 48.4 0.1 1 86 1266 1335 1266 1336 0.83

9 28 1.6e-12 3e-09 37.7 1.2 1 86 1357 1426 1357 1427 0.81

10 28 8.1e-15 1.6e-11 45.1 1.6 1 86 1454 1525 1454 1526 0.85

11 28 7.4e-14 1.4e-10 42.0 1.6 1 85 1602 1670 1602 1672 0.82

12 28 3.9e-12 7.4e-09 36.5 0.1 1 86 1695 1763 1695 1764 0.81

13 28 9.2e-14 1.8e-10 41.7 1.3 1 87 1916 1985 1916 1985 0.81

14 28 4.8e-12 9.3e-09 36.2 0.0 1 64 2042 2099 2042 2119 0.78

15 28 0.15 3e+02 2.5 0.0 1 58 2134 2184 2134 2200 0.77

16 28 1.7e-12 3.3e-09 37.6 1.1 1 86 2223 2292 2223 2293 0.84

17 28 2.1e-14 4e-11 43.7 2.2 1 87 2386 2456 2386 2456 0.83

18 28 9.6e-12 1.8e-08 35.2 0.7 1 86 2491 2562 2491 2563 0.81

19 28 2.7e-12 5.2e-09 37.0 2.6 1 87 2573 2645 2573 2645 0.81

20 28 5e-15 9.5e-12 45.7 0.1 1 86 2675 2745 2675 2746 0.76

21 28 0.0011 2 9.4 0.0 1 58 2779 2829 2779 2854 0.72

22 28 1.7e-13 3.2e-10 40.8 0.1 1 86 2867 2939 2867 2940 0.79

23 28 1.5e-15 2.8e-12 47.4 0.2 1 86 3092 3164 3092 3165 0.82

24 28 1.1e-13 2.1e-10 41.4 2.2 1 87 3232 3303 3232 3303 0.82

25 28 4.2e-15 8.1e-12 46.0 3.8 1 86 3418 3488 3418 3489 0.85

26 28 5.9e-13 1.1e-09 39.1 0.0 1 87 3572 3642 3572 3642 0.85

27 28 6.7e-09 1.3e-05 26.1 1.0 1 58 3661 3707 3661 3721 0.87

28 28 6.6e-10 1.3e-06 29.3 0.7 18 87 3724 3782 3710 3782 0.75

#	of	c-Evalue	i-Evalue	score	bias	hmm coord from	hmm coord to	ali coord from	ali coord to	env coord from	env coord to	acc
1	28	6e-15	1.1e-11	45.5	4.3	1	86	487	559	487	560	0.85
2	28	3.4e-15	6.5e-12	46.3	4.6	1	87	587	656	587	656	0.83
3	28	7.4e-16	1.4e-12	48.4	0.4	1	87	678	750	678	750	0.84
4	28	7.3e-16	1.4e-12	48.4	5.7	1	87	853	923	853	923	0.83
5	28	8.9e-15	1.7e-11	44.9	3.4	1	86	947	1018	947	1019	0.82
6	28	5.3e-13	1e-09	39.2	1.1	1	87	1054	1122	1054	1122	0.80
7	28	4.1e-10	7.8e-07	30.0	1.7	1	86	1169	1238	1169	1239	0.76
8	28	7.2e-16	1.4e-12	48.4	0.1	1	86	1266	1335	1266	1336	0.83
9	28	1.6e-12	3e-09	37.7	1.2	1	86	1357	1426	1357	1427	0.81
10	28	8.1e-15	1.6e-11	45.1	1.6	1	86	1454	1525	1454	1526	0.85
11	28	7.4e-14	1.4e-10	42.0	1.6	1	85	1602	1670	1602	1672	0.82
12	28	3.9e-12	7.4e-09	36.5	0.1	1	86	1695	1763	1695	1764	0.81
13	28	9.2e-14	1.8e-10	41.7	1.3	1	87	1916	1985	1916	1985	0.81
14	28	4.8e-12	9.3e-09	36.2	0.0	1	64	2042	2099	2042	2119	0.78
15	28	0.15	3e+02	2.5	0.0	1	58	2134	2184	2134	2200	0.77
16	28	1.7e-12	3.3e-09	37.6	1.1	1	86	2223	2292	2223	2293	0.84
17	28	2.1e-14	4e-11	43.7	2.2	1	87	2386	2456	2386	2456	0.83
18	28	9.6e-12	1.8e-08	35.2	0.7	1	86	2491	2562	2491	2563	0.81
19	28	2.7e-12	5.2e-09	37.0	2.6	1	87	2573	2645	2573	2645	0.81
20	28	5e-15	9.5e-12	45.7	0.1	1	86	2675	2745	2675	2746	0.76
21	28	0.0011	2	9.4	0.0	1	58	2779	2829	2779	2854	0.72
22	28	1.7e-13	3.2e-10	40.8	0.1	1	86	2867	2939	2867	2940	0.79
23	28	1.5e-15	2.8e-12	47.4	0.2	1	86	3092	3164	3092	3165	0.82
24	28	1.1e-13	2.1e-10	41.4	2.2	1	87	3232	3303	3232	3303	0.82
25	28	4.2e-15	8.1e-12	46.0	3.8	1	86	3418	3488	3418	3489	0.85
26	28	5.9e-13	1.1e-09	39.1	0.0	1	87	3572	3642	3572	3642	0.85
27	28	6.7e-09	1.3e-05	26.1	1.0	1	58	3661	3707	3661	3721	0.87
28	28	6.6e-10	1.3e-06	29.3	0.7	18	87	3724	3782	3710	3782	0.75

Sequence Information

Coding Sequence: atgaATGCATACGGTGCGGGAGCTGGAAGCACGCATGCAGCATATTATGGCTCTGGTGGGGTGGGCTATAACCTTGAGGGCAATACTGTGGCCTATGCGCACAACCAGCTGctacaataccaacaacaacaacaacaacagcagcagcagcagcagcaacaacaacatcatcagctcAGTCAACGCTCGTATATGCCGCACAGTTTAATGCATAGCTCGTATCCCTATATTAAGAGCGAGCCATTGGAGCTGGCTGATGATagacaacgccaacaacaccaacatcagcaacagcaaccgcagcaacaacatttccaGAATCCTATGGCACCGCCGCCAGCTCCCGCCAATCGTCACAGTCTCGATGCCAGCGGtgaaatgataataaaatCGGAACCCATTGACGAACATGCCTACAAGTCTAACTATATCGATGACAACACGCCCTTTGCCGATTTTAGTAAATATCCGGAGTTCGGTGACGACATGTTAAGTCCCAAGGTGGAGCTAACGGTCAAGGACGAGGGCTATGGGAGTCAAAAAGTTCCCAACCCGCTCAGCTATCCGAGACGAAAGCTACAATCGGAGCGCTCATCGGAAAGTCTTCCCATTTGTCAGCGTTGCAAGGAGGTGTTCTTTAAGAAACAAATCTATTTGCGTCATGTGGCCGAGAGCAGTTGCGGTATACAGGAGTATGACTTCAAGTGCAACATATGTCCCATGTCCTTTATGAGCACTGAGGAGTTGCAGAAGCACAAGCATCTACACAGAGCAGACAAATTCTTTTGCCACAAATATTGTGGCAAGTACTTTGACACCATTGCCGAATGTGAGTCACATGAGTACATGCAACATGAGTATGATAGTTTTGTTTGCAACATGTGTTCCGTTACGTTTGCCACGCGGGAACAGCTTTACGCTCATTTGCCGCAACACAAATTCCAGCAGCGTTACGATTGTCCCATTTGCCGCTTGTGGTACCAAACGGCTCTGGAGCTGCACGAGCATCGTCTGGCTGCGCCCTATTTCTGTGGCAAGTATTACACAGGCGCTCAATCGGCatcacaccaacaacagcaacaacagcatccacagcatcagcaacaggcCAACTACAAACTGCAGGACTGTCACATGGCCACCATGGAAATGCCAACACATCACAAGGCAAATACAACTGTAAATGCATTGCCGGCAACGGCAGCTTTGAGCTCATTGTTGCAACAACGTCAGGCGAATGCCGATGGAACCGCTATGTTTGCCTCAACGATGAAGAACGAGGCAAATGTGAAGCTGGAGCGAAGTTATAGCAATTCTACAAGCGAGTCTGGTTACAGTTTGCACGACAGCAGCTATAACAATGCCTATGGGAGCGATACATCGTTACatgctggtggtggtgcagTTGGTGGTCCACAGGCGCACTCCTCGACGCTGGACGATTCGGAGGATGCTCTCTGTTGTGTGCCACTGTGCGGTGTCCGAAAGAGCACCAGCCCGACGCTTCAGTTCTTTACTTTCCCCAAAGATGAGAAGTACTTGCATCAGTGGCTCCATAATCTCAAGATGTTCCATATTCCAGCATCGAGTTATGCAACTTTTCGGATTTGCAGCATGCACTTCCCGAAGCGTTGTATCAATCGTTATTCCCTGTGCTATTGGGCGGTGCCTACGTTCAATCTGGGGCATGACGATGTTGCCAATTTGTATCAGAATCGTGAACTGACCAACACTTTTACCACTGGAGAGGTGGCACGTTGCAGCATGCCAAACTGCACCAGCCAGAGGGGCGAGAGTAATCTcaagttttacaattttcccAAGGATATCAAGAGTCTGATCAAGTGGTGCCAGAACGCCCGTTTGCCCGTCCAGGCCAAGGAGCCGCGTCACTTTTGCAGTCGACACTTCGAGGAGCGTTGCATTGGCAAATTTCGCCTGAAGCCCTGGGCAGTGCCCACTTTACATTTGGGGGCTCAATACGGCAAGATCCATGACAATCCGAAGAACTTGTATGTGGAGGAGAAACGTTGCTGTCTTAATTTCTGTCGTCGCAGTCGCTCTTCAGATTTTAACATGTCACTGTATCGCTTTCCCCGGGATGAGGTCCTCCTCCGACGCTGGTGCTACAATCTACGACTTGATCCTTCTGTCTATCGTGgcaaaaatcacaaaatatgCAGCGCTCACTTTATCAAAGAGGCATTGGGACTTCGCAAATTATCACCAGGAGCTGTTCCCACGTTGCATTTGGGCCACAATGATACGTTCAACATATACGAAAATGAACTGTGGCCACCACCAACATCGACCACGCCCACCAATAAccaacagcaattgcagcagcaacagttgcaacagcaacatcaacaacatcagtcgCATCATGGTCATCATGGCAACAGCAAGTATCTACGTCATTCGGCTGCATCGACATCCTCGTCGGCCAGCTCGGCATCGCATTATGTGGATCCGGAAATGAGTGGTTCATATATGGGAATGGGTAACTCGGGAGGATCTTCGTCTGGCCTAAATGTAAGCGACAGCATGGACGTGTGCTGTGTGCCTAGCTGTGAGAGTAAACGTCACAACAATGAGAATATCACATTCCATACGATACCAAGAAGGCCGGAGCAGATGCGCAAATGGTGTCACAATCTCAAGATACCCGAGGATAAGATGCACAAGGGAATGCGCATCTGTAGTCTGCACTTTGAGCCCTACTGCATCGGTGGATGCATGCGTCCATTTGCGGTGCCCACATTGCATCTTGGACACGACGACGAGGACATTCATCGTAATCCGGACGTGATCAAGAAGCTGAACATACGCGAAACATGCTGTGTTGCTGTCTGCAAACGCAATCGGGATCGAGATCATGCCAATCTTCATCGCTTCCCCAGCAACGTGTCCCTGTTGACCAAGTGGTGTGCCAACTTGCAACGTCCAGTTCCAGATGGCACCAAGCTCTTTAACGATGCCATTTGTGAGGTGCACTTTGAGGATCGATGTCTGCGCAACAAGCGACTAGAGAAATGGGCGGTGCCCACGTTGATCCTTGGTCATGAAAATATTGCTTATCCTCTGCCTACGGCAGAGCAAGTGGCCGAGTTCTATTCCCGACCCAGTGCACCCAACAATGGCGAGGAGCAAGGCGAGTGCTGTGTGGAGACTTGTAAGCGTAATCCAAGCGTGGATGACATCAAGCTCTATCGTCCGCCAGAGGAGTCACAAGTGCTTGCCAAATGGGCTCATAATCTGCAGCTAGATGTCGCCCAGTTGCCCAACATGAGGATCTGTAATCTGCACTTTGAATCCCACTGCATTGGCAAACGGATGCGACCCTGGGCCATACCTACGCTTAATCTGTCCATCAATGTTGAGAATCTCTATGAGAATCCTGAACACCAGATGCTCTACAAGCGTCGCAAGCATCTCAATCCCGATCGAGGAGTTGCCTCCCATGGCGTTGCTGGCATCGTGAAGCCCACTTGGGTGCCACGCTGTTGCTTGTCACATTGTCGCAAGGTGCGCGCTTTGCATAATGTCCAACTGTATCGATTCCCTAAACTCAATCGTTCCACGCTCGCGAAATGGGCGCACAATCTCCAAGTGCCAATGGTGGGCAGTGCCCAGAGACGACTGTGCTCGGCCCACTTTGAGCCCCATGTGCTGAGTAAGAAGTGTCCAGTGCCGCTGGCGGTGCCCACACTGGAACTTAATTCACCGCCTGGCTACAAGATCTATCAGAATCCCGCCAAGCTGAAGGCTAACAAGCTCTGCCTCCAGCGTGTCTGCATTGTCGAGAGTTGTCGTCGGCAACGTGGTCAGGGAGTTCAGCTCTTCCGGCTGCCGCACAATCCCACCCAGCTGCGCAAATGGATGCACAACATACGGATGCGACCGAGAGGAGCTATGCGCCAACAGTATCGCATGTGTTCCATTCACTTTGAGACGCACTCGTTCAATGGGAAGCGGTTAAGTGCCGGTGCTATACCAACTCTGGAGCTGGGACACCAGGATGATGATATCTATCCGAATGAAGCACAATCTTTTGTCGAGGAGCACTGCACTGTCGAGGGCTGTGATGCGTCCAAGGAGCAGCCGGATGTGCGTCTCTTCCGATTCCCCACCGAAGATGAGGATCTGCTCTGGAAATGGTGCAACAATCTCAAGATGAATCCTGTTGATTGCGTCGGCGTTCGCATCTGCAACAAACATTTCGAGACAGACTGCATCGGACCCAAGCATCTATACAAGTGGGCGTTACCCACACTGGAACTGGGACATGATGATGCTCAGATTGAGCTCATACACAATCCCAAGCCGGAGGAACGGTACGTTGATCCCGTGTTCAAGTGCTGTGTTCCCACTTGTGGCAAAACCCGCAAGTTCGATGAGGTGCAAATGAATAGCTTCCCCAAGGATCCAACACTCTTTCAGCGCTGGCGTCACAATCTCCGTCTCGACCATCTCAATTTCAAGGAGCGCGAACGCTACAAGATCTGCAACGTTCACTTTGAGGACATTTGCATTGGAAAGACTCGGCTCAACATTGGCTCCATTCCAACTCTGGAGCTTGGACATGAGGAGACTGAAGATCTCTATCAGGTGAATCCCGCGGAATTGCAAAGCAATCTTTTCGGACGTCAACGACGTGTTCACGAATCCATGGGCATTACCATCAAGCAGGAGGAGAACTCAGAGGTGGATGAGGACATTAAACCAGACATTGACATGTCCGAGGCATCAGACTTGAATACAAGACAGgttaaaataaagaaatctaTGTACGATTTGAAGTGCTGTGTGCCAAGTTGTGGACGTAGCCGTTTGGAGCATGGAGCACGCCTGTTTCCCTTTCCCAGTGGCAAGCAACAGCAGAGCAAGTGGCGCCATAATCTCCGTTTGGAACCCGACGACGTGGACAGAACAACACGTGTGTGCAGTGCTCATTTTAATCGGCGGTGCATCGATGGGAAGCAGCTAAGAGGATGGGCAATGCCCACCCAGCAATTGGGACACCAGGAGCAACCCATCTATGAGAATCCGAAGAATATACCAGGCTTTTTTACGCCCACCTGTGCTTTGGCACATTGCCGAAAGCGTCGGAGCATTGACAATGATCTGCGCACCTATCGATATCCCCGCAGCGAGGATCTGCTCGAGAAATGGCGTGTCAATTTGAGGTTGGCGCCTGATCAGTGTCGCGGACGCATTTGTGCCGATCACTTTGAGCCCATGGTGCGTGGAAAGTTGAAACTAAAGACGGGAGCTGTGCCCACGTTAAAATTGGGACATAATGAAGGCGTGGTCTTTGATAATGAAGTCATTAAGGCTGGTCTGCAGCAGGAGGCGGAGGCTGAAGAGGGTGAGGCAAGCATGGAGTCGCTGGTCAAGATAAAGCAAGAGAAGCTCGATCCGGACGATGAGCTGCATGACAACGATGATCGTGAAGAGcgtgatgataatgatgatgatgaggagtcCGAACGCAAGCACGAGCAGGACGCCGATCCAGAGGATCATGGTTATTTTGATCCCTTGGAACTGGTGGAAACCTTCGCAGAGCATCACAGCgaacatgatgatgatgacgaggccgacgatgatgatgatgatgatgatgaggatgaacctggcgatgatgatgagttGCTGCTGCCGGATACACCGCCAGTTCAAGTGTCGCTACCAGTGCCTCCACTACGTCGTGAGAAGCCTGTGAATAATGTGACGCCCATTTGTTGCCTAAAGCATTGTCGCAAGGAACGCACAGCGATTCATCCGCTGAGCACCTTTGGCTTTCCCAAGGATCATCAGCAATTGCTGAAGTGGAGCGCCAATCTAAAGCTGTCACCAGCCGACTGCGTTGGACGTGTCTGCATTGAACATTTTGAACCGGAAATGCTGGGCACACGGAAACTGAAGCAGAATGCGGTGCCCACTATTAATCTGGGACACACAACTCCTCTTAGCTACAGTTGCAATGGCCAATCTCAGGGCATTTATGATACCCAGCCGCAGCACTCGGTTTTTCGGCTTTGGAGCCTGAAACACTGTCGCAAAAGGAAGCTTCCAATGGAACCGGATCCGGATCAGGCAGCGACTAAGCGACGACGCTGCTGCCTGCCAAGCTGTGGCAAGCAGCCGGATCTCCATGGCGTCCAGCTACACCGCTTGCCAAGCGATCGCATCCTGCTCCGCAAATGGCTATACAACCTGAAGCTATCACCGATGGTGGACATCGGCCAGGCACGTCTCTGTAGCGAACACTTTGAGCCGCAGATGGAGACGATGGAGGGTTGTGTTCCAACATTGCGCTTGGGTCATGACGATACTCGTATTTATCGCAATCGTGGAAGTATTAGTGGTAGCATCTCGGCATCATCCGGTGGCTGCATGGTGGCCAGCTGTCCCTGTGCCCGCCTCAATCTCTATCGCTGCTATGATCTGCCCGCGAATCGTTTGGTGCAGAAGGTCTGGCTGGAATGGCTCCAACTGCCCATGCCTCAGCTGGCTAGCGATGGCAAGCTCTGCGTGATGCACTATATGCAGCTCTATGAGCAGGTGCCGTTGCCACAGGAGCTCCCAGAACCTGTGCTCCGTCAGCTGCAAGAGGCTTATGATTCAATCTCCGGTTCCTCCATGGCCATGAAGCTACGCTGTGCCGTTCCAGGCTGTTACTCCAAGTACACGGACAACATTAGGCTGACCAAGCTACCAATGTGCCCGGATACCTGTGCCAAATGGGTGCACAACACCAAGATCACCTATGATCCTACTCGACATTATGTTTATCGCATTTGTATGCTTCACTTTGAGGCACGTTGCTTGGGTCCAGTGCGTCCAAAGCAGTGGGCGGTGCCGACACTGCAATTAAATCACAACGATCCGGATATCTATCTAAATCCTAAGGCTACTGAAACTCTGCCGACTCCTATGTCCATTTCCACTCCCGTTCCCGTGTCTATCTCCACGCCTGTTCGCGTGTCTATCTCCACGCCTGTTCCCGTGTCTATCTCCACGCCTGTTCCCGTATCTCTGTCAACATCTATTCCCGTGGAGCTGCCTTTGCGTATTAAGACAGAGCTGGCTTTTAGCGGCAGTCCCAGCGCCAGTGCCAGTCCAAGTCCACGTGGCAAACTGCGCATCTGCTGTATTTCCAGCTGTGCCCAACAGGCAACATCGCAGTCGCGTCTCTTTCGCTTTCCCACCGCCGAGACGGCATTGCTCAAGTGGCTGGTGAATACACAGCAACAGCCAAGATTGGCTGATCCACAGCATCTGTTTGTCTGCCAGGATCATTTCGAGGCGGAGGCCATTTGTAAGAATCAACTACGAAGTTGGGCTGTGCCCACATTGAACCTTGGACACGATGGACATGTCATTCCAAATGCCAGGCACAATGGCAACATTGCAGACAGCCAGGAGAATAAGCAGGCGCTGCAGTTCATCTGGGAAAACTATTGCTCGGTCTTGAGCTGCTTCCAGCCACGCAGCGAGGATCTACGTCTCTATGCATATCCCACGGATAGACCCACCATACGGAAATGGGCGGCCAACTGCAAGCATCGATCCATGCAGGCCAGCAGCGATGGATTTCAGGTCTGCCAATCACATTTTGCGCCTCATTGCTTTGACCCGGATACGGGTGAACTGCGGGCGAATGCTGTGCCGACGCTGGAACTGAGTCGTTGCATCAATGAGGTGCGCTGTGTGGTGTCCGGTTGTGTCAAGGATGAGGATGGACCGCGTCAACGCTATTACAAGATGCCCAAACGTTCCTCACAGCTTAATATTTGGTGTCACAATCTTTGCCTGGACACCGTTGCCATGAGCTCTAGTGAGCATCATGTGTGCGATCGTCACTTTGAGACGCAGTGCTTCAATCAGCAAAAACTCCTGCGTCCTGGAGCACGACCCACGCTGCATTTGGGTCATGATGAGCCAATAGATCTGATGCCCAACCCCGCTGATTGGGCAACGGATGGCTCAGATGCGATGGCTATGACCACGGTCTGCTGTGTGCCCAACTGTGGACACTCCAGGGATAAGGATGATGTGCAGCTTTTTGCCTTCCCCAAAATGAGAGTTTTGGCGGAAAAGTGGCTACAGAATATACGCCTGGAGGTAGGCAAAGAGCAGTTGACTAAGATGAGGATATGTGGGGCACACTTTGAGCACAGTTGCCTGGAGAATGGACGACCTCAGTTGGGGGCCATGCCCACGCTCGAACTGGGACACGAGGAGCGCCACAAAATTCATCGAAGCTCAGATCCGACGGTAGGCAAGGTCAAGAAATATTGTAACAGAAGTGGCTCCAGCTACGACTGCTGTTATCCTCAATGTGTGGAGCTACAAAAGACTTATCTGAGAATTAGCTACGATCTACCCCAAGGGATTGCACTGCGTCGCCAGTGGCTAGATTATATGGCCGTTGAGGAAACGGAGGAGAAACCCCTCAAGCTCTGTCCAATGCATTTAATCCTACTCTATGATCACAGTGAGCAGCATTTTGCAGAGCACACAAAAGAGCAGCTGCTGGACTCCAACTACGAGGATGCACGGAGCAGTGTCCGCATACGTGTCATCAGTTGTGCGGTCCGTGGTTGCCGGACTCTAAAACCCCGAGACGGCGGACGACTTCATGGATTGCCCACACGTCGGGATGTGCTTGAGATGTGGCTGTATAACATGCAGCTGGTGTTTTATGAGCACCAACGATACATGTACAAAATATGTAGCAAACACTTTGAGGCGAGTTGCTTCATGGACACGACACGACGCCTAAAGCCTTGGACTATGCCCACATTGGAGTTGCCGGATCGTGAGCCTGGCGAGGCGCCTGTCTTTCAGAATCCCACGGAAGAGGAATGGCAGCGTATGAATGAGCTGTTCGCagaggagcagcaacaaatacagcagcaacaagtgaATCAGGAGAATAATGAGGGAGAAAACGACTTGCTTGAGCCAATTGTAAAGATTGAGCATATGGGAAATGAAGATCAACTCTACGAGGAGGAGTTggagcagcatcagcagccgGATGGGGAAGAAGACTTTGAGAACTCACAGCAGCCGCTGGAAGTGCTCCTCGAGGTGGGTCATGTTGAAAAGTGTCCCACCTATGAGCAAATGGATTCAGAGGCAAATCTTAGCTATACCGTCGAGCAGCAGACCCAGATCAGCAGCTTTGCTCCGTCGTCATCGACGTCGCAATATGGTGGTGCTATTGTCAGCAATGGATTCAAGTACAATGCTCGCCACTGCAGCGTAAGGGGGTGTGATGTGACGGCCAATGATGTGAATGGCAATATTAAGTTGCACAAGTTCCCGACATCGCTGGATGCAATGAAAAAGTGGATGCACAACACCCAGGTTGATGTGGACACGAACGTTGCTTGGCGCTATCGTATTTGTAGCTATCACTTTACCGATGAATGCTTTAATGGATCACGCATACGACGTGGTGCCATGCCCACACTTAGTCTAGGGCCACGTCGTCCTCCAAAAATCTACGACAATGAGTTCAATACAACGCTGCAGCCGGAACAGGAGCAGACCAATGAGGTGGCCAGCGAGGAGCAGCTAAACAATGAAGTGGAGTCAAGAGAGACTCACATGAAGGGCGGTGACATCAGTTTGAAACTGCCACAGCCGGCACCGCCCCGCAAGTCCAGCAAATTCTGCCAGATCGAGGGTTGTCCCAATCATTTGACAAGCGAGAATCTGACACTCCATAAATTTCCGCATTCGGTGGACATGTGCGCCAAGTGGCAGCATAATACTCAAGTTCCGTTTGATCCCGACTTCCGTTGGCGCTATCGCATTTGCAGTGCCCACTTTGAGCCCATCTGCCTGATGAATATGCGTCTGATGCATGGCAGCGTGCCCACACTTAATCTGGGACCACGTGCGCCTCGCCAGCTTTTCGACAGTGACTTTGAGGCGATTAGCATGCGATTGGATAAACAGAAGAGCAGCTCGGAGCAGCATTTGCTGGACAAGCACGAGCTGTTGGAGCAGCGAGAGCAATTACAGGTCGACGAACAGGATGAGGAAGAGTTAAGTTTTCTCGTGCCAGAGATGCAACTGCATGAAGATGCAGATGCGGAGCAGTCGGACAATCCGTTGACTTTTAGTaatcacaacaacagctggAAGGATCTGCGTTTGCCCAGCATTAAGCAGGAAAAGACTATGACTGCGACAAGCTATAATCCAGTCAAGTCTGGCTATGACAAGTGCTCCCTGGTGCATTGCCAGCGTCAGCGTTCTCAGCACGGCGTCCACATCTACAAGTTTCCACGATCGAAGCAACTCCAGCAGCGCTGGATGCACAATTTGAGGATACAATACGATGAGAGACGTCCTTGGAAAACAATGATATGCAGCGTACACTTTGAACCCAACTGCATTCGACTCCGCAAGCTGCGTCCCTGGGCAGTGCCCACATTGGAACTGGGCGACAATGTGCCGGAAGAGATCTACACAAATGAACAGAGTCGACAGCAGGAGGAGACGGGCAGTGACAATGATGAATTGGAACTGGGCATGAACATGTCCATGGAGGAAGCATTTGAAGacgatgattatgatgatgaagatgatgatttTCTGGCTACAGAGCCATTAGTGAAAAGGGAGCGTCGTTCACGCTTTGATCCATTACCGCCAGGTCAGTTGCCACCTTGGAAACTCAAATTCTGCTCCTTGCCCTACTGTCGTAGTCCACGTGGTGATGGCATCAAGCTTTTCCGGCTGCCCAATAACATCAGTTCCATTCGTAAATGGGAACAGGCAACTGGAATGCGCTTTACGGAATCCCAACGCAATACGAAGCTCATCTGTAGTCGTCACTTTGATCCTCAGCTAATCGGAGTGCGTCGTCTTATGTACAATGCTGTGCCAACACTTCATCTGGGCCCAATGAGTGTAGACAATCAACCAGTGCAACGTCCTGTCGGTCCACGATGCTGTATGCCTGATTGTCAGGAGAGCGCAAAGCTGCATAAGTTTCCCAGTGATCCTATGCTGCTGAATCAATGGTGTCACGCGCTGAATCTGTCGGATATTCAGCGTTATCGTGGCAAACACATCTGTGCTGCACATTTGCCTGCCAAAGCGCCGAATTGCATCATCTGTGGCGTGGATGATATACAATTGCCGTTACTAAACTTTCCGGAGAATCGCAATCAGCGCGCCAAATGGTGTTACAATCTCAAAATCGAATCCATACCCAAGTGGGATAACTTAAAGCAGATATGCAGTAAACACTTTGAGAACTACTGCTTCGTTCAGCCGGGTCAACTGCTGCCCGAGGCAGCTCCCACGTTGCATTTAAGGCACGGCGATAGCAACATATTCCTAAACGATGCCATAGATCACAGCAAGATGCTGCGTATTAAGGATGAGCCCTTGGACAGCGAGGACCTGATGCtgtaa
Protein Sequence: MNAYGAGAGSTHAAYYGSGGVGYNLEGNTVAYAHNQLLQYQQQQQQQQQQQQQQQHHQLSQRSYMPHSLMHSSYPYIKSEPLELADDRQRQQHQHQQQQPQQQHFQNPMAPPPAPANRHSLDASGEMIIKSEPIDEHAYKSNYIDDNTPFADFSKYPEFGDDMLSPKVELTVKDEGYGSQKVPNPLSYPRRKLQSERSSESLPICQRCKEVFFKKQIYLRHVAESSCGIQEYDFKCNICPMSFMSTEELQKHKHLHRADKFFCHKYCGKYFDTIAECESHEYMQHEYDSFVCNMCSVTFATREQLYAHLPQHKFQQRYDCPICRLWYQTALELHEHRLAAPYFCGKYYTGAQSASHQQQQQQHPQHQQQANYKLQDCHMATMEMPTHHKANTTVNALPATAALSSLLQQRQANADGTAMFASTMKNEANVKLERSYSNSTSESGYSLHDSSYNNAYGSDTSLHAGGGAVGGPQAHSSTLDDSEDALCCVPLCGVRKSTSPTLQFFTFPKDEKYLHQWLHNLKMFHIPASSYATFRICSMHFPKRCINRYSLCYWAVPTFNLGHDDVANLYQNRELTNTFTTGEVARCSMPNCTSQRGESNLKFYNFPKDIKSLIKWCQNARLPVQAKEPRHFCSRHFEERCIGKFRLKPWAVPTLHLGAQYGKIHDNPKNLYVEEKRCCLNFCRRSRSSDFNMSLYRFPRDEVLLRRWCYNLRLDPSVYRGKNHKICSAHFIKEALGLRKLSPGAVPTLHLGHNDTFNIYENELWPPPTSTTPTNNQQQLQQQQLQQQHQQHQSHHGHHGNSKYLRHSAASTSSSASSASHYVDPEMSGSYMGMGNSGGSSSGLNVSDSMDVCCVPSCESKRHNNENITFHTIPRRPEQMRKWCHNLKIPEDKMHKGMRICSLHFEPYCIGGCMRPFAVPTLHLGHDDEDIHRNPDVIKKLNIRETCCVAVCKRNRDRDHANLHRFPSNVSLLTKWCANLQRPVPDGTKLFNDAICEVHFEDRCLRNKRLEKWAVPTLILGHENIAYPLPTAEQVAEFYSRPSAPNNGEEQGECCVETCKRNPSVDDIKLYRPPEESQVLAKWAHNLQLDVAQLPNMRICNLHFESHCIGKRMRPWAIPTLNLSINVENLYENPEHQMLYKRRKHLNPDRGVASHGVAGIVKPTWVPRCCLSHCRKVRALHNVQLYRFPKLNRSTLAKWAHNLQVPMVGSAQRRLCSAHFEPHVLSKKCPVPLAVPTLELNSPPGYKIYQNPAKLKANKLCLQRVCIVESCRRQRGQGVQLFRLPHNPTQLRKWMHNIRMRPRGAMRQQYRMCSIHFETHSFNGKRLSAGAIPTLELGHQDDDIYPNEAQSFVEEHCTVEGCDASKEQPDVRLFRFPTEDEDLLWKWCNNLKMNPVDCVGVRICNKHFETDCIGPKHLYKWALPTLELGHDDAQIELIHNPKPEERYVDPVFKCCVPTCGKTRKFDEVQMNSFPKDPTLFQRWRHNLRLDHLNFKERERYKICNVHFEDICIGKTRLNIGSIPTLELGHEETEDLYQVNPAELQSNLFGRQRRVHESMGITIKQEENSEVDEDIKPDIDMSEASDLNTRQVKIKKSMYDLKCCVPSCGRSRLEHGARLFPFPSGKQQQSKWRHNLRLEPDDVDRTTRVCSAHFNRRCIDGKQLRGWAMPTQQLGHQEQPIYENPKNIPGFFTPTCALAHCRKRRSIDNDLRTYRYPRSEDLLEKWRVNLRLAPDQCRGRICADHFEPMVRGKLKLKTGAVPTLKLGHNEGVVFDNEVIKAGLQQEAEAEEGEASMESLVKIKQEKLDPDDELHDNDDREERDDNDDDEESERKHEQDADPEDHGYFDPLELVETFAEHHSEHDDDDEADDDDDDDDEDEPGDDDELLLPDTPPVQVSLPVPPLRREKPVNNVTPICCLKHCRKERTAIHPLSTFGFPKDHQQLLKWSANLKLSPADCVGRVCIEHFEPEMLGTRKLKQNAVPTINLGHTTPLSYSCNGQSQGIYDTQPQHSVFRLWSLKHCRKRKLPMEPDPDQAATKRRRCCLPSCGKQPDLHGVQLHRLPSDRILLRKWLYNLKLSPMVDIGQARLCSEHFEPQMETMEGCVPTLRLGHDDTRIYRNRGSISGSISASSGGCMVASCPCARLNLYRCYDLPANRLVQKVWLEWLQLPMPQLASDGKLCVMHYMQLYEQVPLPQELPEPVLRQLQEAYDSISGSSMAMKLRCAVPGCYSKYTDNIRLTKLPMCPDTCAKWVHNTKITYDPTRHYVYRICMLHFEARCLGPVRPKQWAVPTLQLNHNDPDIYLNPKATETLPTPMSISTPVPVSISTPVRVSISTPVPVSISTPVPVSLSTSIPVELPLRIKTELAFSGSPSASASPSPRGKLRICCISSCAQQATSQSRLFRFPTAETALLKWLVNTQQQPRLADPQHLFVCQDHFEAEAICKNQLRSWAVPTLNLGHDGHVIPNARHNGNIADSQENKQALQFIWENYCSVLSCFQPRSEDLRLYAYPTDRPTIRKWAANCKHRSMQASSDGFQVCQSHFAPHCFDPDTGELRANAVPTLELSRCINEVRCVVSGCVKDEDGPRQRYYKMPKRSSQLNIWCHNLCLDTVAMSSSEHHVCDRHFETQCFNQQKLLRPGARPTLHLGHDEPIDLMPNPADWATDGSDAMAMTTVCCVPNCGHSRDKDDVQLFAFPKMRVLAEKWLQNIRLEVGKEQLTKMRICGAHFEHSCLENGRPQLGAMPTLELGHEERHKIHRSSDPTVGKVKKYCNRSGSSYDCCYPQCVELQKTYLRISYDLPQGIALRRQWLDYMAVEETEEKPLKLCPMHLILLYDHSEQHFAEHTKEQLLDSNYEDARSSVRIRVISCAVRGCRTLKPRDGGRLHGLPTRRDVLEMWLYNMQLVFYEHQRYMYKICSKHFEASCFMDTTRRLKPWTMPTLELPDREPGEAPVFQNPTEEEWQRMNELFAEEQQQIQQQQVNQENNEGENDLLEPIVKIEHMGNEDQLYEEELEQHQQPDGEEDFENSQQPLEVLLEVGHVEKCPTYEQMDSEANLSYTVEQQTQISSFAPSSSTSQYGGAIVSNGFKYNARHCSVRGCDVTANDVNGNIKLHKFPTSLDAMKKWMHNTQVDVDTNVAWRYRICSYHFTDECFNGSRIRRGAMPTLSLGPRRPPKIYDNEFNTTLQPEQEQTNEVASEEQLNNEVESRETHMKGGDISLKLPQPAPPRKSSKFCQIEGCPNHLTSENLTLHKFPHSVDMCAKWQHNTQVPFDPDFRWRYRICSAHFEPICLMNMRLMHGSVPTLNLGPRAPRQLFDSDFEAISMRLDKQKSSSEQHLLDKHELLEQREQLQVDEQDEEELSFLVPEMQLHEDADAEQSDNPLTFSNHNNSWKDLRLPSIKQEKTMTATSYNPVKSGYDKCSLVHCQRQRSQHGVHIYKFPRSKQLQQRWMHNLRIQYDERRPWKTMICSVHFEPNCIRLRKLRPWAVPTLELGDNVPEEIYTNEQSRQQEETGSDNDELELGMNMSMEEAFEDDDYDDEDDDFLATEPLVKRERRSRFDPLPPGQLPPWKLKFCSLPYCRSPRGDGIKLFRLPNNISSIRKWEQATGMRFTESQRNTKLICSRHFDPQLIGVRRLMYNAVPTLHLGPMSVDNQPVQRPVGPRCCMPDCQESAKLHKFPSDPMLLNQWCHALNLSDIQRYRGKHICAAHLPAKAPNCIICGVDDIQLPLLNFPENRNQRAKWCYNLKIESIPKWDNLKQICSKHFENYCFVQPGQLLPEAAPTLHLRHGDSNIFLNDAIDHSKMLRIKDEPLDSEDLML

Similar Transcription Factors

Sequence clustering based on sequence similarity using MMseqs2

100% Identity: iTF_00601834;
90% Identity: -
80% Identity: -