Basic Information

Insect: Drosophila simulans
Gene Symbol: -
Assembly: GCA_016746395.1
Location: NC:19441606-19455736[-]

Transcription Factor Domain

TF Family: THAP
Domain: THAP domain
PFAM: PF05485
TF Group: Zinc-Coordinating Group
Description: The THAP domain is a putative DNA-binding domain (DBD) and probably also binds a zinc ion. It features the conserved C2CH architecture (consensus sequence: Cys - 2-4 residues - Cys - 35-50 residues - Cys - 2 residues - His). Other universal features include the location of the domain at the N-termini of proteins, its size of about 90 residues, a C-terminal AVPTIF box and several other conserved residues. Orthologues of the human THAP domain have been identified in other vertebrates and probably worms and flies, but not in other eukaryotes or any prokaryotes [1].
Hmmscan Out: # of c-Evalue i-Evalue score bias hmm coord from hmm coord to ali coord from ali coord to env coord from env coord to acc

1 29 7.1 1.1e+04 -3.1 3.0 38 62 332 359 325 375 0.60

2 29 2.8e-15 4.2e-12 46.3 3.9 1 86 566 638 566 639 0.85

3 29 1.1e-14 1.8e-11 44.3 5.0 1 87 666 735 666 735 0.83

4 29 1e-15 1.6e-12 47.6 0.2 1 87 757 829 757 829 0.85

5 29 4.8e-16 7.3e-13 48.7 5.5 1 87 927 997 927 997 0.82

6 29 1.6e-14 2.4e-11 43.8 3.2 1 86 1021 1092 1021 1093 0.81

7 29 3.7e-13 5.6e-10 39.5 1.3 1 87 1128 1196 1128 1196 0.80

8 29 9.3e-11 1.4e-07 31.8 1.4 1 86 1236 1305 1236 1306 0.76

9 29 5.1e-17 7.7e-14 51.8 0.4 1 86 1333 1402 1333 1403 0.83

10 29 1.7e-12 2.5e-09 37.4 1.5 1 85 1424 1492 1424 1494 0.80

11 29 2.5e-13 3.8e-10 40.0 0.7 1 86 1521 1592 1521 1593 0.84

12 29 3.9e-13 5.9e-10 39.4 2.4 1 85 1666 1734 1666 1736 0.82

13 29 5.4e-13 8.2e-10 38.9 0.1 1 87 1759 1828 1759 1828 0.81

14 29 3e-13 4.6e-10 39.7 2.4 1 87 1961 2030 1961 2030 0.80

15 29 4.8e-11 7.3e-08 32.7 0.5 1 86 2133 2199 2133 2200 0.79

16 29 1.4e-06 0.0021 18.4 0.0 1 59 2215 2263 2215 2279 0.79

17 29 6.2e-12 9.5e-09 35.5 0.4 1 87 2292 2362 2292 2362 0.83

18 29 5.4e-12 8.2e-09 35.7 1.1 1 87 2418 2488 2418 2488 0.82

19 29 2.1e-11 3.2e-08 33.8 0.2 1 86 2523 2594 2523 2595 0.81

20 29 1.2e-11 1.8e-08 34.6 0.0 1 86 2605 2676 2605 2677 0.78

21 29 9.6e-12 1.5e-08 34.9 0.1 1 86 2701 2771 2701 2772 0.77

22 29 0.0007 1.1 9.7 0.1 1 58 2799 2846 2799 2870 0.79

23 29 1e-13 1.6e-10 41.2 0.1 1 87 2884 2957 2884 2957 0.83

24 29 5.4e-16 8.3e-13 48.5 0.4 1 86 3079 3151 3079 3152 0.81

25 29 2e-12 3e-09 37.1 3.7 1 86 3210 3280 3210 3281 0.81

26 29 6.8e-14 1e-10 41.8 4.4 1 86 3378 3448 3378 3449 0.84

27 29 1.5e-11 2.3e-08 34.3 0.1 1 86 3528 3597 3528 3598 0.84

28 29 1.3e-10 1.9e-07 31.4 1.4 1 58 3621 3669 3621 3677 0.85

29 29 2.9e-10 4.5e-07 30.2 1.4 6 86 3680 3744 3676 3745 0.74

#	of	c-Evalue	i-Evalue	score	bias	hmm coord from	hmm coord to	ali coord from	ali coord to	env coord from	env coord to	acc
1	29	7.1	1.1e+04	-3.1	3.0	38	62	332	359	325	375	0.60
2	29	2.8e-15	4.2e-12	46.3	3.9	1	86	566	638	566	639	0.85
3	29	1.1e-14	1.8e-11	44.3	5.0	1	87	666	735	666	735	0.83
4	29	1e-15	1.6e-12	47.6	0.2	1	87	757	829	757	829	0.85
5	29	4.8e-16	7.3e-13	48.7	5.5	1	87	927	997	927	997	0.82
6	29	1.6e-14	2.4e-11	43.8	3.2	1	86	1021	1092	1021	1093	0.81
7	29	3.7e-13	5.6e-10	39.5	1.3	1	87	1128	1196	1128	1196	0.80
8	29	9.3e-11	1.4e-07	31.8	1.4	1	86	1236	1305	1236	1306	0.76
9	29	5.1e-17	7.7e-14	51.8	0.4	1	86	1333	1402	1333	1403	0.83
10	29	1.7e-12	2.5e-09	37.4	1.5	1	85	1424	1492	1424	1494	0.80
11	29	2.5e-13	3.8e-10	40.0	0.7	1	86	1521	1592	1521	1593	0.84
12	29	3.9e-13	5.9e-10	39.4	2.4	1	85	1666	1734	1666	1736	0.82
13	29	5.4e-13	8.2e-10	38.9	0.1	1	87	1759	1828	1759	1828	0.81
14	29	3e-13	4.6e-10	39.7	2.4	1	87	1961	2030	1961	2030	0.80
15	29	4.8e-11	7.3e-08	32.7	0.5	1	86	2133	2199	2133	2200	0.79
16	29	1.4e-06	0.0021	18.4	0.0	1	59	2215	2263	2215	2279	0.79
17	29	6.2e-12	9.5e-09	35.5	0.4	1	87	2292	2362	2292	2362	0.83
18	29	5.4e-12	8.2e-09	35.7	1.1	1	87	2418	2488	2418	2488	0.82
19	29	2.1e-11	3.2e-08	33.8	0.2	1	86	2523	2594	2523	2595	0.81
20	29	1.2e-11	1.8e-08	34.6	0.0	1	86	2605	2676	2605	2677	0.78
21	29	9.6e-12	1.5e-08	34.9	0.1	1	86	2701	2771	2701	2772	0.77
22	29	0.0007	1.1	9.7	0.1	1	58	2799	2846	2799	2870	0.79
23	29	1e-13	1.6e-10	41.2	0.1	1	87	2884	2957	2884	2957	0.83
24	29	5.4e-16	8.3e-13	48.5	0.4	1	86	3079	3151	3079	3152	0.81
25	29	2e-12	3e-09	37.1	3.7	1	86	3210	3280	3210	3281	0.81
26	29	6.8e-14	1e-10	41.8	4.4	1	86	3378	3448	3378	3449	0.84
27	29	1.5e-11	2.3e-08	34.3	0.1	1	86	3528	3597	3528	3598	0.84
28	29	1.3e-10	1.9e-07	31.4	1.4	1	58	3621	3669	3621	3677	0.85
29	29	2.9e-10	4.5e-07	30.2	1.4	6	86	3680	3744	3676	3745	0.74

Sequence Information

Coding Sequence: ATGTCACAACAACACCCCCATCACGCCCACCCCCACCACTACGTCCACCACTACCCGCCCCCCGTGACGCCCATGtccatgcagcagcagcaacagcagcatcagcaggcgcagctgtcgcctcagcagcagcagcagcagcacaccAATTGGTACTCACATGTTGCTTCCTACCCCACACCCCACTCGGCCTTCggccccgcccccgccccctcaTGCAAGGCCGCCAACAACAGTgtcagcggcaacaacaacaacaacattatGGGCGGCGGGGGATACGGGCCGGGGGGTGGTGGCGCGCAGGGCTATTATGGCGCCGCTGGCGGTGGCCTCAATGTCAGTGGggcggtggtgggtggtggtgggccgAGCTACGGCCTTGGGGCCAACACAGTGGCATATGCCCACAACCAACTGCTGCAgtatcaacaacaacagcaacaacaacaacagcagcagcaacaacagcagcagcaacagcagcaccaccagcatcTTCCGCAGCACTTAAGCCAACAAAGACCCTATATGGGCCACAATATCATGGCCGGCAGCTATCCTTATATCAAAAGCGAACCCATGGAGGCCTACCAGCAGCCCCCGAATCCCATGGCCCCGCCCCCGGCACCAGAAgtattaataaaatCGGAACCCATTGACGAGCATTCCTACAAGTCCAACTATATAGACGACAATACGCCATTTGCTGACTTCAGCAAGTTCAGCGAATTCAGCGAGGACATGCTGAGTCCGAAAGTGGAGCTGACCGTAAAGGATGAGTCCTACGGAAGGACCACTAGCAGTTTCCTGCGTCGCAAACAACAATCGGATCGGGGCACCGAAAGTCTGCCCATCTGCCAGCGCTGCAAGGAGGTCTTCTTTAAGAAGCAGGTCTATCTCCGCCATGTGGCCGAGAGCAACTGCGGCATCCAGGAGTACGACTTCAAGTGCAGCACCTGTCCCATGTCCTTCATGACCACCGAGGAGCTGCAGCGGCACAAGCTTCACCACCGGGCCGACAGGTTTTTCTGCCACAAGTACTGCGGCAAGCACTTCGACACGATCGCTGAGTGCGAGGCGCACGAGTACATGCAGCACGAATACGATAGCTTTGTCTGCAACATGTGCTCCAGCACCTTCGCTACGCGGGAACAACTGTACGCCCACCTGCCGCAGCACAAGTTCCAGCAGCGCTTCGACTGTCCCATCTGCCGCCTATGGTATCAGACGGCTCTAGAGCTTCATGAACATCGTCTGGCTGCTCCATATTTCTGCGGCAAGTACTACACGGGCGGACAGACATCTTCTGCCtcccaatcccaatcgcaGCAGCACCAGACCAACTACAAGCTGCAGGACTGTCATATGGCAACCATGGAGATGCCCACAACCCCGCACCACAAAACCACTCCATCCGGCTCGTCTTTGCCGGCGACGGCTGCGCTGAATTCTCTACTGCAGCAGCGTCAGGCAAATGCCGACGGAGCTGCCATGTTCGCAGCATCCGCAATGAAGAACGAAGTGAATGTTAAGATGGAGCGAAGCTACAGCAACTCTACCAGCGAGTCATCCTACAGCGTTCAGGACAGTGGGTACAATAATGCCTATGGAAGTGACAGTTCAATGCACGCAGGAGCGATCGCCGGGCCACAGGCGCACTCCTCAACGCTGGACGACTCCGAGGACGCCTTGTGCTGTGTTCCTCTGTGTGGAGTGCGCAAGAGCACGAGCCCCACGCTCCAGTTTTTCACGTTCCCCAAGGACGAGAAGTACCTCAATCAATGGCTGCACAACCTCAAGATGTTTCACATACCCGCCGCCAGCTACGCCAATTTCCGCATCTGTAGCATGCATTTTCCGAAGCGCTGCATTAACCGCTACTCTCTGTGCTACTGGGCCGTTCCCACGTTCAACCTGGGCCACGACGACGTGGCCAATCTATACCAGAACAGGGAGCTCACCAACACGTTCACCACCGGCGAGGTAGCGCGCTGCAGCATGCCTCACTGTACAAGTCAGCGGGGTGAGAGCAATTTAAAGTTCTACAACTTTCCCAAGGACATCAAAAGCTTGATCAAGTGGTGCCAGAATGCACGACTTCCCGTTCAGGCAAAGGAGCCGCGTCATTTTTGCAGTCGCCACTTCGAGGAGCGCTGTATTGGCAAGTTCCGTCTGAAGCCGTGGGCGGTGCCTACTTTACACCTAGGTGCCCAATATGGCAAGATCCACGATAACCCAAAGAATTTGTACGTTGAAGAAAAACGCTGCTGCCTCAACTTCTGCCGTCGGAGCCGATCCTCTGACTTCAATATGTCGCTATATCGATTTCCCAGAGACGAAGTTCTCCTGCGACGCTGGTGCTACAATCTCCGCTTGGATCCCGGAGTGTATCGTGggaaaaatcacaaaatatgCAGCGCCCACTTTATCAAAGAGGCGTTGGGTCTGCGCAAACTATCACCAGGGGCCGTTCCGACGCTTCACCTGGGTCACACTGACACCTTCAACATCTACGAAAACGAACTGTGGCCACCGCCAACGGCACCCAACAGTCACAGCAGTGGTCTCCAGCACCAGACGCAACATCATTCCTCACAACACTCactgcaacagcaattgcACAGCAAATCGTACCACCGGCAATCGGCGGCCTCCACgtcctcctccgccagctCGGCAAACTCTCACTACGTGGATCCTGATCTAAGCGCCTCTTACCTTGGCTTAGGTGCCAGTGGATCTTCTGCAATGAATGCCAGCGACAGCATGGACGTATGTTGCGTGCCCAGTTGCGAGAGCAAGCGGCACAATAATGAGAACATTACATTCCACACCATACCACGCCGACCGGAGCAGATGCGCAAGTGGTGCCATAATCTGAAAATACCCGAAGAAAAGATGCACAAGGGTATGAGGATCTGCAGCCTGCACTTCGAGCCCTATTGCATTGGAGGTTGCATGCGTCCATTTGCGGTGCCTACGCTTAACTTGGGTCACGATGACGACGATATTCATAGAAATCCGGATGTGATCAAGAAGTTAAACATCCGAGAAACGTGCTGCGTCGCCGTGTGCAAACGAAATCGGGACAGGGACCACGCGAATCTGCACCGTTTCCCAAGCAATGTGTCCTTATTGACCAAGTGGTGTGGCAATCTCCAGCGGCCTGTTCCGGATGGAAGTAAACTTTTCAACGACGCCATTTGTGAAGTACACTTCGAGGATCGGTGTCTGCGCAACAAAAGGCTAGAGAAGTGGGCAGTGCCCACACTATCGTTAGGCCACGAAAACATCCCATACCCGCTGCCAACGCCGGAACAGGTTACGGAGTTCTACGCTCGACCCACTGCGCCCAATAATGGCGAGGAACAGGGAGAGTGCTGTGTGGAGACGTGCAAGAGAAATCCCAGTGTGGACGACATCAAGCTCTATCGGCCGCCGGAGGAAGCTTCCGTGTTGGCCAAATGGGCGCACAACCTGCAGACGGAGAGTAGTCAACTGACAAGCATGAGGATTTGTAATCTTCACTTTGAGGCGCACTGCATCGGCAAGCGGATGAGACCTTGGGCTATTCCAACACTAAATCTGGCCGGCAACATAGAGAATCTCTACGAGAATCCGGAGCATTCGATGCTGTACAAGCGGCGGACTCACATGAAAGCCAAGCAGTCGGCTTCCGTGAAGCCCACTTGGGTGCCCAGGTGCTGTCTTCCGCATTGCCGCAAAGTTCGGGCTCTCCACAACGTTCAGCTGTATCGCTTCCCCAAGCTCAATCGCTCCACTCTGGCTAAGTGGGCGCACAATCTGCAGGTTCCTATGGTTGGCAGTGCCCAGCGCCGTCTATGCTCGGCTCATTTCGAGCCGCACGTGCTGAGCAAGAAGTGCCCGGTGCCGCTGGCGGTGCCCACATTGGACTTGAATGCGCCGCCCGGCTTGAAGATTTACCAGAATCCAGCCAAGCTCAAGGCTAGCAAGCTGTGTCTGCAGCGCGTGTGCATTGTCGAGAGTTGTCGTAAGACGCGGGCGCAGGGCGTCCAGCTCTTCCGACTGCCACATAGTCCAACGCAGCTACGCAAGTGGATGCACAACATCAAAACGCGACCCAGAGCGGCGATGAGGGCCCAATACCGTGTGTGTTCCCGCCACTTTGAGACACACTCTTTCAATGGCCGGAGACTGAGCGCTGGCGCCATTCCCACCCTGGAACTGGGTCATGACGACGAGGACATCTATCCCAACGAAGCGCAGGCTTTTGCGGACGAGCACTGCGTGGTGGAGGGATGCGAGGCATCCAAAGAACAGCCTGACGTGCGACTCTTCCGCTTTCCCACAGAGGATGACGATATGCTATGGAAGTGGTGCAACAATCTCAAAATGAACCCGGTGGATTGCACCGGCGTGCGCATATGCAATAAACACTTCGAGGTAGATTGCATCGGGCCCAAGCACTTATACAAGTGGGCTATTCCCACCGAGGAACTGGGTCACGACGACGCCGACATCGAGCTAGTGCTAAATCCCAAGCCGGAGGACAGGTATGTGGATCCTGTGTTCAAGTGCATCGTACCGACCTGCGGAAAGACGCGTCGCTTCGACGAAGTCCAGATGAACAGTTTTCCCAAGGACGCGAATCTCTTCGAGCGGTGGAAACACAACTTGCGGCTGGAACACCTCAGCTTCCACGAACGCGATCGGTACAAGATATGCAACTCTCACTTTGAGGATATATGTATTGGGAAGACGCGGCTAAACATAGGTTCGATCCCGACTCTAGAATTGGGTCACGACGAGACGGACGATCTGTTCCAGGTAAATCCGGCGGAGCTGCAGAGCAACCTTTTCGGACGACAGCGGCGAGTACACGACGAGTCGGGCGGAATAATCATCAAGCAGGAGTTTTCCGAGTCGGAGGATGTCAAAACGGACGTGTCTGATACCAAAGATTTCAATACGAGACAGGTTAAGCTCAGAAAGACTATGTCCGATCTGAAGTGTTGTGTGCGCAGTTGTGGGCGCAGTCGACTGGAGCACGGAGCACGCCTCTTTCCATTTCCCACCGGTAAGCAGCAGCACCTGAAGTGGCGCCATAACCTGCGCCTGGAGCCCGACGAGGTGGACCGTTCGACACGGATTTGCAGTGCGCACTTCAACCGACGCTGCATTGATGGCAAGCAGCTGAGAAGCTGGGCAATGCCCACGCAACAATTGGGCCACCAGGAGCAGCCGATCTACGAGAATCCGAAAAACATACCAGGATTCTTTACGCCCACCTGTGCTCTGAGTCATTGCCGAAAGCGTAGGAGCATTGACAACGATCTCCGCACCTATCGATATCCGAGGAGTGAGGATCTTCTGGAGAAATGGCGGGCGAATCTGCGTCTGGCGCCGGATCAGTGTCGCGGCAGGATATGTGCTGACCATTTTGAGTCACAGGTGCGTGGAAAGTTGAAGCTGAAAACGGGAGCGGTGCCTACTCTAAATCTGGGCCATGATGAGGGCTTAATATACGACAATGAGGCTATAAAGGTGGGCATGACCGAAGAAGAGGATGGCAGCTCGGAGATGCCACGACTGAAACCCAAAAGAGAGCTGATTgatgaagaggaagaagaacTAGAGGCTGAGGAGGAGCCCCATGAGCACGATATGTACGATGAAGATGAGAAGGACGGCCACTACTTCGATCCTCTCGAACTGGTCGAGACCTTTGCCGAACATCCAAGTGACGATGAAGGCGAGTATCGTGGAGATGAGGAGGATGAGCgcgacgaggatgaggactTGGACGAGGCGGAGCACTTTCATCCGGAAAACCCACCCACTCCCCCAACTATCCCTCTGCGTCGCGAAAAGCCCGCTAATAATGTGACGCCCATCTGCTGTCTAAAGCACTGCAGAAAAGAACGCACTGCTTTTCATCTACTGAGCACCTTTGGCTTTCCCAAGGATCGCCAGTTGCTGCTCAAATGGTGCTCCAATCTACACCTGAATCCGGATGACTGCATCGGCCGCGTTTGCATAGAGCACTTTCAGCCGGAGGTACTGGGAACCCGAAAGCTGAAGCAAAATGCGGTGCCCACTCTCAATGTGGGCCACGATGAGCCACTTAGATACTCTTGTAATGGAATAGATCTTGACCAGGAGCAATTGCAGCCGCAGCACTCGGTTTTTCGGCTTTGGAGCCTAAAACACTGCCGCAAGAGGAAACTGACGGAGCCGCCGGACATCCGCCAAAGCAAGTGGAGTGCGGAAGTGCGGAAGATGCAGAGATTGAGGATGGAGATGAAAGTGAACATAGGGAGAGAGATCAAGCTGGAGGTGCAGACGGAGAGGGAAATGAAGATCAAGGAAAAGACTCCAATGACGAATCAAGGGAAGATTAAGTTGGTAAGATGTTGCATCAGCTCCTGTGAGAATGAGGACGTTAACCAACTACTTCCGCTGCCTGAGGAGCCAAATCTCTTAAGAAAGTGGCAGCATAACCTAAAGTTATCCGTAGACACGGACTTCAAGAAAATCCAAGTGTGTCTAAAGCACTTTGAGGAGCAAGTGGTGCAAAACGGAAAGCCCTTGGAGCAGGCAGTACCCACCTTACAGCTATATCAAAACAGTTGGAACATCAACAGAAACAGCGGAAGTTGTCTGTTTCCAGAGTGCAGAAAATCTTCATCGGATCGGTTAAGCTTTGTTGATTTACCTGGAAATGCGGTCATTAGAGATGCCTGGATGAGTCACCTTAATCTGCCACCCAGCACTGATGGTCTTCTTTGTAGTGACCACTTTATGCAACTCTTTGAACAGGTGGAATTCCCCAAGGTATTGGCCGCACAAGATTTGGAGGACTTGCAGTGGATTGCTGACGAACTTAAATGCGCTGTTCCCAGTTGTTCGTCCAAATATGATGGGGATCTTCAGCTTATCCCGCTTCCGGAAAAGGATGCTACCCTTTTGAAGTGGCTACATAACACAAAGATATCTTACGATCATTCAAAGCACAAAAGCTATCGCATATGTGTTCTTCATTTCGAGCCGACTTGCTTAGAGGCGAATTTTCCGAAAGCTTGGGCTATACCCACCTTGCATTTAAGCCACGATGACGAGCTGCATTTGAATCTCAGGCCTGAATCTCGCAGTGGTACTCCAAACAGCAACTCCAGGCTAACTCCATTGAGAATTAAAACAGATCTGGCCTCCTTGGGGAGTCCATGCTCGAGTGCAAGTCCTAGTCCTCGAGGCAGGATCAGGATATGTTGCATTTCCACATGTGGACAGATTGCAAGTAGTCAAGTTCGACTCTACCGCTTTCCCACCGAAGAGCAGGCCCTACTGCGGTGGCTGGTGAACACGCAGCAGCAACCTCGCCTTGTGGACCCTGCCGAGCTCTATGTGTGCCAATCTCACTTTGAACCAGACGCcatttgcaaaaaacaacTTCGTTGCTGGGCAGAACCCACCTTAAACGTAGGCCACGACGGATTTGTTATCCCCAATGCCAAACACAATGGAAACATTGCTGGGGGCCAGGATACTGAGGAGGCGATGAGGCTTATCCGGGAGCGCTATTGCTCCGTACTGACTTGTTTCCAGGCTGAAGCCAGCGGTATAAGGCTCTATGAGTATCCCAAGGATATGCCAACTATACGAAAGTGGGCAGCCGCGTGTAGACATCGCTCCATGCAGGCCAGCAGCAATGGATTCAAGGTATGCCAGTCTCACTTTGCACCGGAATGCTTCGAGCCGGACACTTTAAATTTGATTGAGGGATCCGTTCCCACTCTGGAGTTAAGTAGAGGCGACATCGAAAGACACTGCCTAGTGTCTGGATGTGAAAAGGATGCATCTGGAGGACGTCTGCGCTATTACAAGGTGCCAAAGACCGCTGCTCAACTGAATGCTTGGAGCAACAACCTAAAGATGAGTTCCATGGACCTCGGATTGGGGGAGCAGCTCATCTGCGAGCGTCACTTTGAGCCCTTTTGCTTCGGTGCCCACAAAGGATTACGACCTGGCGCACTCCCCACTCTCATGCTAGGGCACGACGAAGAGGTGGAGATGTTACCGAACCCAGAAAGTCTCTGGCAGAAAAAAGAAGAGGTTTGCTGTGCCACTGAATGTGGTCGAATTTGGCAGCCTGGAGACACTAAGTTTAGTGGATTTCCTAAATCATTGGCGTTGGCTAAGAAATGGGTTCATAATCTTCAACTGAGCGTAGAAAATGACCAACTGAGCAGTCTGAAAGTCTGCAGTGTGCATTTCGAAGCTTCTCTCTTCAATAAAAGTGGCTTAATATCGGGTTCCATACCCACACTGGAGCTGGGCCATTCCTCTCAGGATATATTTCAGTCGGACACCCAAAACATGGGTAAAAGAACCATAATATCGGATCTTGATTGCATTTATCCTGAGTGCAAGGAACTGTGCAAAACCGTGTCATTCAATCTGCCCCAAGAAGAGGACCTACGCACAGCGTGGCTCCGTCACTTGAAGATCGAAGAGCCGTCGAGTGGTGTCGGTCAGCTATGCCCACTACACTACGTTATTCTTTACGAGCTAAGTATCAAAAGTTTTCCGGAGCACGTTTCAAACCGATTCCTTGAAGAAAACTACTATTCTGCTCGGAACAACAGGCGCGTCAAAATCGTTAGCTGTGCGGTTAAAGGTTGTGAAATGATCAGGCCGCGGGATAAGGTGCTCCTGCACGGGTTGCCGCAAAGGAAGGACATACTGAGAATGTGGGTTGAGAATGGCCAACTGGAGATTACggagccgcagcagcaatatATGCTTAGGGTATGCCGCAATCACTTTGAGTCCCGATGTTCGTTTGACGACAGGCGGCTGCAACCGTGGAGCGTTCCCACTCTGAACTTACCTGGAAATCCAGTGCATCAAATTCCCACTAAGGAGGAGTGGCAGGAAATGACGATAAAATTGAACCAGGAAGCCGATACAATTAAATTGGAGAGAGAGGAGGaacaggaggaggaagagctGCCCGAGGAGGAAGAGCTGCTCGAGGAGGAAGTGGGTGACTGTTCTCTTCTAGAGCCTATTGTAAGAATGGAACACATCGAGTCCGATGAAGAAGACTCAGAGATGCAGGCTCTGGAGGTCCTTCTGGAGGTTGGTCACGTTGAGCGGATGGACAGCTACGAAAGAGTGGATGAGTCCTATACCGAACAAGCCGTCTACCAATCTAATGGCATTAGAAACCAGTACAATGCCAACCACTGCGCCGTTGAAGGATGCGAAGTGACCGTTGAGGACGTAGGCGGGACCATCAAGCTGCACAAGTTCCCCGCATCCTCGGAGGCCGCTAGGAAGTGGATGCACAACACCCAAGTCGACATGGATGAGAAGTTCTGGTGGCGGTATCGAATTTGCAGTTACCATTTCGAGCAGGAGTGCTTTCAGAGCGCCAGGATAAAGAAGGGAGCGATGCCCACTCTTCGCCTGGGACCTAAGAGACCGGACAAGGTGTACGACAACGAATTCGCATTGCAGGAGATTGAGGAGCTCATTGTGCCTGAAGACCTTCAGTTTGAGGATTCCAAAAAGCCGAAAAGGGAGGTAATAAAACTGTGTCTGCCAACGCCGGCTCCACCTCGAAGGTCTAGTAAGTTTTGTCAGATCGAGGGATGTATGAATCACCTGACCACTGAAAACATAACCTTGCACAAATTTCCCCATTCGGAGGACATGTGCCTCAAGTGGCAGCACAACACGCAGGTGCCTTTCGATCCTTTCCACCGGTGGCGATACCGGATATGTAGTGTCCATTTCCATCCGGTGTGCTTGCTTAACATGAGACTAGTCCATGGCAGTGTGCCTACCTTAAAACTAGGTAGCAAGGCTCCCACCGAACTGTTCGACAACGACTTCGAAGCCATTAACCTCAGGCTGGACAAGAAGTGGGGTCCGGACCAAAGTACCGTGCAGATAAAGGAGGAGGATGAAGATTCTATGCCGTCCCTGGAACCAGAACTGCAGCTTCGCGAAGACCAAGAGGTGGAGGAATCAGAAGCTACGCAAATACCCTTTAACCAGACAAATTGGAAGGGCCAATTGCGATTGCCTGTGAAGCAGGAAAAGGTCACTTACAACCAGGTGAAGTCAGGATACGATAAGTGCTCCTTAAGTCATTGCCAGCGGCAGAGATCTAAGCATGGCGTCCACATCTACAAGTTTCCCAAATCGAGGCTCCAACAGGAGCGTTGGATGCACAACCTCCGTATCCGCTACGATGAGCGAAGGCCGTGGAAGTTTATGATCTGCAGCGTGCATTTCGAGCCCCACTGCATCAGCCTGAGGAAGCTGCGCCCCTGGGCGGTTCCCACCCTGGAGCTGGGCGATAATGTGCCGGAGAAGATCTTTACAAACGAACAGTGCCATGAACTATCCACCGATCGCAGCGAGGCGGAGAGCGATGCCGATGAGGAGGACGGTCTgcaggaggacgaggaggaggaggatgagtaCGAAGAGGAAATGGGCCCGGAGGTGCGCATCAAGCGGGAACGGCGTTCCAAGCTGGATCCTTGGCCACCCGGGCAGGTTCCTCCGTGGAAAGTTAAGCAGTGTTGTCTTCCTTACTGCCGTGCCTTCCGTGGCGATGGCATCAAACTGTTCCGGCTGCCCAACAACCGCACCTCCATACGCAACTGGGAGCTGGCGACGGGCATGGTGTTCAAGGAGTCTCAACGAAACACTCGCCTGATTTGCAGCCGGCACTTTGAGCCCGAGCTGATTGGCGTAAGGCGTCTCATGCGGAACGCCATTCCCACGAGGCACTTAAGTCCGCAGGAACCGTCCGAGGAACTAAAGAGAAAGCCGGATCCTCCACTCCCAATCGCAACCTGTTGCATGGCTGACTGTCATCATAATGGAAATGTTAAGCTGCACAAGTTTCCTAGTGACCCGGCGCTACTTAGGCAGTGGTGCCAGGCACTCAGGCTCACGGATACCCAGAGGTACCGGGGCAAACATATCTGCTCGGTCCACCTGCCCACCGACAGGACGGTCAGCTGCGTCATCTGCGGAGTGGAAAACGCCCAGTTGCCGATGCTGGACTTTCCAGAGCAGCGCAATCAGCGCGCCAAGTGGTGCTACAATCTCAAGATCGAGGCCATACCCAAGTGGGACCACTCCAAGCACATCTGCTGTCGTCACTTTGAGTCGCATTGCTTCCTCCAGCCGGGTGAACTGCGCCCAGGTGCAATACCCACACTGCAGCTGAACCACGACGACACGAATATATTCCTCAGCGACTTCGCCACTAGTCCGACAGGCAATCGGATCAAGGACGAGCCGCTGGACAACGACGACATGCTGCTGGTTTAG
Protein Sequence: MSQQHPHHAHPHHYVHHYPPPVTPMSMQQQQQQHQQAQLSPQQQQQQHTNWYSHVASYPTPHSAFGPAPAPSCKAANNSVSGNNNNNIMGGGGYGPGGGGAQGYYGAAGGGLNVSGAVVGGGGPSYGLGANTVAYAHNQLLQYQQQQQQQQQQQQQQQQQQQHHQHLPQHLSQQRPYMGHNIMAGSYPYIKSEPMEAYQQPPNPMAPPPAPEVLIKSEPIDEHSYKSNYIDDNTPFADFSKFSEFSEDMLSPKVELTVKDESYGRTTSSFLRRKQQSDRGTESLPICQRCKEVFFKKQVYLRHVAESNCGIQEYDFKCSTCPMSFMTTEELQRHKLHHRADRFFCHKYCGKHFDTIAECEAHEYMQHEYDSFVCNMCSSTFATREQLYAHLPQHKFQQRFDCPICRLWYQTALELHEHRLAAPYFCGKYYTGGQTSSASQSQSQQHQTNYKLQDCHMATMEMPTTPHHKTTPSGSSLPATAALNSLLQQRQANADGAAMFAASAMKNEVNVKMERSYSNSTSESSYSVQDSGYNNAYGSDSSMHAGAIAGPQAHSSTLDDSEDALCCVPLCGVRKSTSPTLQFFTFPKDEKYLNQWLHNLKMFHIPAASYANFRICSMHFPKRCINRYSLCYWAVPTFNLGHDDVANLYQNRELTNTFTTGEVARCSMPHCTSQRGESNLKFYNFPKDIKSLIKWCQNARLPVQAKEPRHFCSRHFEERCIGKFRLKPWAVPTLHLGAQYGKIHDNPKNLYVEEKRCCLNFCRRSRSSDFNMSLYRFPRDEVLLRRWCYNLRLDPGVYRGKNHKICSAHFIKEALGLRKLSPGAVPTLHLGHTDTFNIYENELWPPPTAPNSHSSGLQHQTQHHSSQHSLQQQLHSKSYHRQSAASTSSSASSANSHYVDPDLSASYLGLGASGSSAMNASDSMDVCCVPSCESKRHNNENITFHTIPRRPEQMRKWCHNLKIPEEKMHKGMRICSLHFEPYCIGGCMRPFAVPTLNLGHDDDDIHRNPDVIKKLNIRETCCVAVCKRNRDRDHANLHRFPSNVSLLTKWCGNLQRPVPDGSKLFNDAICEVHFEDRCLRNKRLEKWAVPTLSLGHENIPYPLPTPEQVTEFYARPTAPNNGEEQGECCVETCKRNPSVDDIKLYRPPEEASVLAKWAHNLQTESSQLTSMRICNLHFEAHCIGKRMRPWAIPTLNLAGNIENLYENPEHSMLYKRRTHMKAKQSASVKPTWVPRCCLPHCRKVRALHNVQLYRFPKLNRSTLAKWAHNLQVPMVGSAQRRLCSAHFEPHVLSKKCPVPLAVPTLDLNAPPGLKIYQNPAKLKASKLCLQRVCIVESCRKTRAQGVQLFRLPHSPTQLRKWMHNIKTRPRAAMRAQYRVCSRHFETHSFNGRRLSAGAIPTLELGHDDEDIYPNEAQAFADEHCVVEGCEASKEQPDVRLFRFPTEDDDMLWKWCNNLKMNPVDCTGVRICNKHFEVDCIGPKHLYKWAIPTEELGHDDADIELVLNPKPEDRYVDPVFKCIVPTCGKTRRFDEVQMNSFPKDANLFERWKHNLRLEHLSFHERDRYKICNSHFEDICIGKTRLNIGSIPTLELGHDETDDLFQVNPAELQSNLFGRQRRVHDESGGIIIKQEFSESEDVKTDVSDTKDFNTRQVKLRKTMSDLKCCVRSCGRSRLEHGARLFPFPTGKQQHLKWRHNLRLEPDEVDRSTRICSAHFNRRCIDGKQLRSWAMPTQQLGHQEQPIYENPKNIPGFFTPTCALSHCRKRRSIDNDLRTYRYPRSEDLLEKWRANLRLAPDQCRGRICADHFESQVRGKLKLKTGAVPTLNLGHDEGLIYDNEAIKVGMTEEEDGSSEMPRLKPKRELIDEEEEELEAEEEPHEHDMYDEDEKDGHYFDPLELVETFAEHPSDDEGEYRGDEEDERDEDEDLDEAEHFHPENPPTPPTIPLRREKPANNVTPICCLKHCRKERTAFHLLSTFGFPKDRQLLLKWCSNLHLNPDDCIGRVCIEHFQPEVLGTRKLKQNAVPTLNVGHDEPLRYSCNGIDLDQEQLQPQHSVFRLWSLKHCRKRKLTEPPDIRQSKWSAEVRKMQRLRMEMKVNIGREIKLEVQTEREMKIKEKTPMTNQGKIKLVRCCISSCENEDVNQLLPLPEEPNLLRKWQHNLKLSVDTDFKKIQVCLKHFEEQVVQNGKPLEQAVPTLQLYQNSWNINRNSGSCLFPECRKSSSDRLSFVDLPGNAVIRDAWMSHLNLPPSTDGLLCSDHFMQLFEQVEFPKVLAAQDLEDLQWIADELKCAVPSCSSKYDGDLQLIPLPEKDATLLKWLHNTKISYDHSKHKSYRICVLHFEPTCLEANFPKAWAIPTLHLSHDDELHLNLRPESRSGTPNSNSRLTPLRIKTDLASLGSPCSSASPSPRGRIRICCISTCGQIASSQVRLYRFPTEEQALLRWLVNTQQQPRLVDPAELYVCQSHFEPDAICKKQLRCWAEPTLNVGHDGFVIPNAKHNGNIAGGQDTEEAMRLIRERYCSVLTCFQAEASGIRLYEYPKDMPTIRKWAAACRHRSMQASSNGFKVCQSHFAPECFEPDTLNLIEGSVPTLELSRGDIERHCLVSGCEKDASGGRLRYYKVPKTAAQLNAWSNNLKMSSMDLGLGEQLICERHFEPFCFGAHKGLRPGALPTLMLGHDEEVEMLPNPESLWQKKEEVCCATECGRIWQPGDTKFSGFPKSLALAKKWVHNLQLSVENDQLSSLKVCSVHFEASLFNKSGLISGSIPTLELGHSSQDIFQSDTQNMGKRTIISDLDCIYPECKELCKTVSFNLPQEEDLRTAWLRHLKIEEPSSGVGQLCPLHYVILYELSIKSFPEHVSNRFLEENYYSARNNRRVKIVSCAVKGCEMIRPRDKVLLHGLPQRKDILRMWVENGQLEITEPQQQYMLRVCRNHFESRCSFDDRRLQPWSVPTLNLPGNPVHQIPTKEEWQEMTIKLNQEADTIKLEREEEQEEEELPEEEELLEEEVGDCSLLEPIVRMEHIESDEEDSEMQALEVLLEVGHVERMDSYERVDESYTEQAVYQSNGIRNQYNANHCAVEGCEVTVEDVGGTIKLHKFPASSEAARKWMHNTQVDMDEKFWWRYRICSYHFEQECFQSARIKKGAMPTLRLGPKRPDKVYDNEFALQEIEELIVPEDLQFEDSKKPKREVIKLCLPTPAPPRRSSKFCQIEGCMNHLTTENITLHKFPHSEDMCLKWQHNTQVPFDPFHRWRYRICSVHFHPVCLLNMRLVHGSVPTLKLGSKAPTELFDNDFEAINLRLDKKWGPDQSTVQIKEEDEDSMPSLEPELQLREDQEVEESEATQIPFNQTNWKGQLRLPVKQEKVTYNQVKSGYDKCSLSHCQRQRSKHGVHIYKFPKSRLQQERWMHNLRIRYDERRPWKFMICSVHFEPHCISLRKLRPWAVPTLELGDNVPEKIFTNEQCHELSTDRSEAESDADEEDGLQEDEEEEDEYEEEMGPEVRIKRERRSKLDPWPPGQVPPWKVKQCCLPYCRAFRGDGIKLFRLPNNRTSIRNWELATGMVFKESQRNTRLICSRHFEPELIGVRRLMRNAIPTRHLSPQEPSEELKRKPDPPLPIATCCMADCHHNGNVKLHKFPSDPALLRQWCQALRLTDTQRYRGKHICSVHLPTDRTVSCVICGVENAQLPMLDFPEQRNQRAKWCYNLKIEAIPKWDHSKHICCRHFESHCFLQPGELRPGAIPTLQLNHDDTNIFLSDFATSPTGNRIKDEPLDNDDMLLV

Similar Transcription Factors

Sequence clustering based on sequence similarity using MMseqs2

100% Identity: iTF_00605601;
90% Identity: iTF_00592421;
80% Identity: -