Basic Information

Insect: Drosophila villosipedis
Gene Symbol: -
Assembly: GCA_035043025.1
Location: JAWNNF010000013.1:7377555-7391734[-]

Transcription Factor Domain

TF Family: THAP
Domain: THAP domain
PFAM: PF05485
TF Group: Zinc-Coordinating Group
Description: The THAP domain is a putative DNA-binding domain (DBD) and probably also binds a zinc ion. It features the conserved C2CH architecture (consensus sequence: Cys - 2-4 residues - Cys - 35-50 residues - Cys - 2 residues - His). Other universal features include the location of the domain at the N-termini of proteins, its size of about 90 residues, a C-terminal AVPTIF box and several other conserved residues. Orthologues of the human THAP domain have been identified in other vertebrates and probably worms and flies, but not in other eukaryotes or any prokaryotes [1].
Hmmscan Out: # of c-Evalue i-Evalue score bias hmm coord from hmm coord to ali coord from ali coord to env coord from env coord to acc

1 28 8.1e-15 1.2e-11 45.1 4.2 1 86 574 646 574 647 0.85

2 28 3.4e-15 5.1e-12 46.3 4.6 1 87 674 743 674 743 0.83

3 28 8.3e-16 1.2e-12 48.2 0.4 1 87 765 837 765 837 0.85

4 28 7.3e-16 1.1e-12 48.4 5.7 1 87 932 1002 932 1002 0.83

5 28 1e-14 1.5e-11 44.7 3.4 1 86 1026 1097 1026 1098 0.81

6 28 1.6e-12 2.4e-09 37.7 1.2 1 87 1133 1201 1133 1201 0.80

7 28 3.6e-11 5.3e-08 33.4 1.9 1 86 1249 1318 1249 1319 0.77

8 28 7.4e-17 1.1e-13 51.6 0.3 1 86 1346 1415 1346 1416 0.82

9 28 4.1e-12 6e-09 36.4 1.3 1 86 1437 1506 1437 1507 0.80

10 28 1.6e-15 2.4e-12 47.3 1.7 1 86 1534 1605 1534 1606 0.85

11 28 1e-13 1.5e-10 41.5 2.3 1 85 1682 1750 1682 1752 0.82

12 28 3.7e-12 5.4e-09 36.6 0.1 1 86 1775 1843 1775 1844 0.82

13 28 6e-14 8.9e-11 42.3 0.9 1 86 1993 2061 1993 2062 0.82

14 28 1.1e-11 1.7e-08 35.0 0.7 1 61 2115 2169 2115 2190 0.80

15 28 3.1e-05 0.046 14.3 0.1 1 58 2196 2247 2196 2271 0.79

16 28 2.8e-11 4.1e-08 33.7 0.2 1 87 2286 2356 2286 2356 0.83

17 28 8.4e-15 1.2e-11 45.0 2.0 1 87 2414 2484 2414 2484 0.82

18 28 1.4e-13 2.1e-10 41.1 0.8 1 86 2519 2590 2519 2591 0.83

19 28 1.9e-13 2.8e-10 40.7 1.3 1 87 2601 2673 2601 2673 0.81

20 28 1e-13 1.5e-10 41.6 0.1 1 87 2696 2767 2696 2767 0.77

21 28 6.6e-06 0.0098 16.5 0.1 1 58 2800 2853 2800 2872 0.84

22 28 8.8e-15 1.3e-11 44.9 0.1 1 86 2891 2963 2891 2964 0.80

23 28 5.5e-14 8.1e-11 42.4 1.4 1 86 3098 3170 3098 3171 0.81

24 28 1.8e-14 2.7e-11 43.9 2.4 1 87 3234 3305 3234 3305 0.83

25 28 1e-14 1.5e-11 44.7 4.0 1 86 3418 3488 3418 3489 0.85

26 28 2.5e-13 3.7e-10 40.3 0.1 1 87 3579 3649 3579 3649 0.85

27 28 5.4e-10 8e-07 29.6 0.4 1 58 3666 3714 3666 3726 0.87

28 28 1.1e-08 1.6e-05 25.5 2.2 18 87 3731 3789 3720 3789 0.75

#	of	c-Evalue	i-Evalue	score	bias	hmm coord from	hmm coord to	ali coord from	ali coord to	env coord from	env coord to	acc
1	28	8.1e-15	1.2e-11	45.1	4.2	1	86	574	646	574	647	0.85
2	28	3.4e-15	5.1e-12	46.3	4.6	1	87	674	743	674	743	0.83
3	28	8.3e-16	1.2e-12	48.2	0.4	1	87	765	837	765	837	0.85
4	28	7.3e-16	1.1e-12	48.4	5.7	1	87	932	1002	932	1002	0.83
5	28	1e-14	1.5e-11	44.7	3.4	1	86	1026	1097	1026	1098	0.81
6	28	1.6e-12	2.4e-09	37.7	1.2	1	87	1133	1201	1133	1201	0.80
7	28	3.6e-11	5.3e-08	33.4	1.9	1	86	1249	1318	1249	1319	0.77
8	28	7.4e-17	1.1e-13	51.6	0.3	1	86	1346	1415	1346	1416	0.82
9	28	4.1e-12	6e-09	36.4	1.3	1	86	1437	1506	1437	1507	0.80
10	28	1.6e-15	2.4e-12	47.3	1.7	1	86	1534	1605	1534	1606	0.85
11	28	1e-13	1.5e-10	41.5	2.3	1	85	1682	1750	1682	1752	0.82
12	28	3.7e-12	5.4e-09	36.6	0.1	1	86	1775	1843	1775	1844	0.82
13	28	6e-14	8.9e-11	42.3	0.9	1	86	1993	2061	1993	2062	0.82
14	28	1.1e-11	1.7e-08	35.0	0.7	1	61	2115	2169	2115	2190	0.80
15	28	3.1e-05	0.046	14.3	0.1	1	58	2196	2247	2196	2271	0.79
16	28	2.8e-11	4.1e-08	33.7	0.2	1	87	2286	2356	2286	2356	0.83
17	28	8.4e-15	1.2e-11	45.0	2.0	1	87	2414	2484	2414	2484	0.82
18	28	1.4e-13	2.1e-10	41.1	0.8	1	86	2519	2590	2519	2591	0.83
19	28	1.9e-13	2.8e-10	40.7	1.3	1	87	2601	2673	2601	2673	0.81
20	28	1e-13	1.5e-10	41.6	0.1	1	87	2696	2767	2696	2767	0.77
21	28	6.6e-06	0.0098	16.5	0.1	1	58	2800	2853	2800	2872	0.84
22	28	8.8e-15	1.3e-11	44.9	0.1	1	86	2891	2963	2891	2964	0.80
23	28	5.5e-14	8.1e-11	42.4	1.4	1	86	3098	3170	3098	3171	0.81
24	28	1.8e-14	2.7e-11	43.9	2.4	1	87	3234	3305	3234	3305	0.83
25	28	1e-14	1.5e-11	44.7	4.0	1	86	3418	3488	3418	3489	0.85
26	28	2.5e-13	3.7e-10	40.3	0.1	1	87	3579	3649	3579	3649	0.85
27	28	5.4e-10	8e-07	29.6	0.4	1	58	3666	3714	3666	3726	0.87
28	28	1.1e-08	1.6e-05	25.5	2.2	18	87	3731	3789	3720	3789	0.75

Sequence Information

Coding Sequence: atgtcacaacaacaacacaatccCCCTCCACATcaccaacatcaacatcactactatcagcaacagcaacaacaacaacatctgcagcagcagcagcatttgcagcataaacaaatacaacaacaacagcacagtTGGTACTCACATGTTGCTTCCTATCCGCCCCCGCATGCCGCTGCCTTTGCGTCGCCctgcaaaagcagcagcagcaacaacaataataacaacaacaaccacattaTGAATGCATACGGCACGGGTGCAGGAGGGTATTATGGCTCAACGGGAGCGGGTAGTGTTGGGGTTGGCTATAACCTTGAGGCCAATACTGTGGCCTATGCGCACAACCAGCTGCtgcaataccaacaacaacaacaacagcagcagcatcagcaacaacaacaacatcagcagcagcaacagcagctcagcCACCGCTCGTATATGCCACCACACATAATGCACAGCTCGTATCCGTACATTAAGAGCGAACCTTTGGAGCCACTGCCCGAacgccatcagcagcagcagcagcaacagcaactcttTCAGAATCCTATGGCACCGCCGCCAGCACCCGCCATTGCTAATCGTCCTTCACTCGATGCTAGTGGCgaaatgataattaaatCGGAACCCATTGACGAACATGCTTTCAAGTCCAACTATATCGATGATAATACTCCCTTTGCcgattttagtaaatattccGAATTCGGCGACGATATGCTAAGTCCCAAACTAGAGCTAAACGTCAAGGATGAGGGCTATGCAAACCAAAAAaaCCCGCTGAACTACCCACGTCGTAAGCTCCAAACGGATCGCTCCGCGGAGAGTATGCCCATTTGTCAGCGCTGCAAAGAGGTGTTCTTCAAGAAGCACATTTACCTGCAGCATGTGGCCGAGAGCAGTTGCAGCATACACGAGTATGAATTCAAGTGCAACATCTGTCCCATGTCCTTTATGGGCGGCGAGGAGCTGCAGAAGCACAAGCATCTGCATCGAACCGACAAGTTCTTCTGCCACAAATACTGTGGCAAGCACTACGACTCGATTGCAGAGTGCGAATCGCACGAGTACATGGAGCACGAGTACGATAGCTTTGTGTGCAATATGTGCTCTGTTACGTTCCCCACACGGGAACAGCTGTATGCCCATTTGCCGCAACACAAGTTCCAACAGCGTTACGATTGCCCCATTTGCCGATTGTGGTACCAAACGGCATTAGAGCTGCACGAGCATCGACTGGCGGCGCCCTACTTTTGTGGCAAGTATTATGCTGCagcacaccagcaacagcagcagcagcagcagcagcaacaacaacaacaacagcagcagcagcagcagcatacacaacaacatcagcaacagggCAACTACAAACTGCAGGATTGTCACATGGGCACCATTGAAAtgaCTCCACCGCAGCACAAGGCGAATGCGGCATTACCGGCAACGGCGGCGCTCAATTCGCTGTTGCAGCAACGCCAGGCGAACGCTGATGGCGCCGCTTTATATGCCTCGGCGCTGAAGAGCGAGACGAATGTGAAACTGGAGCGCAGCTACAGCAACTCCACCAGCGAGTCTGGTTACAGTATGCACGAGAGCAGCTATAACAATGCCTACGCCAGCGACAATTCTCTGCATGGCGGGGGCGGGGCAATTGGTGGTCCACAGGCGCATTCCTCGACGCTGGACGATTCGGAGGATGCGCTGTGCTGTGTGCCACTTTGCGGAGTGCGCAAGAGCACAAGCCCGACGCTGCAATTCTTTACGTTTCCCAAAGATGACAAGTACTTGCATCAGTGGCTGCACAACCTCAAGATGTTTCACATTCCGGCGTCGAGCTATGCTAGCTTTCGCATCTGCAGCATGCACTTCCCTAAGCGTTGCATCAATCGTTACTCTCTGTGCTATTGGGCGGTGCCCACATTTAATCTGGGCCACGACGATGTGGCCAATCTCTATCAGAATCGTGAGCTGACCAACACATTTACCACAGGCGAGGTGGCCCGCTGCAGTATGCCAAACTGTACTAGTCAGCGTGGTGAGAGTAATCTGAAGTTCTACAACTTTCCCAAGGACATCAAGAGTTTGATTAAGTGGTGCCAAAACGCTCGCCTGCCCGTCCAGGCCAAGGAGCCGCGTCACTTCTGCAGTCGCCACTTCGAGGAGCGTTGCATCGGCAAGTTCCGGCTGAAGCCTTGGGCAGTGCCCACCTTACATCTTGGCGCCCAGTACGGCAAGATTCATGACAATCCCAAAAATCTGTATGTGGAGGAGAAGCGCTGCTGCCTCAACTTTTGTCGTCGCAGTCGCTCCTCCGACTTCAACATGTCGCTGTATCGCTTCCCCAGGGATGAGGTGCTACTGCGTCGTTGGTGCTACAATCTACGCCTTGATCCGGCTGTTTATCGTGGGAAGAATCACAAAATTTGTAGCGCTCACTTTATCAAAGAAGCATTGGGATTGCGAAAGCTATCTCCGGgCGCTGTGCCTACGCTGCATCTGGGTCATAATGACACCTTTAACATCTACGAGAACGAACTGTGGCCACCGCCAACGCCCTCCACGCCCACCCAcaatcatcagcagcagctgcagcaacaccagttgcagcagcagccgcaacaagtGCATCATAAATATCAGCGGCACTCGGCTGCGTCAACATCCTCGTCGGCCTCGTCGACATCGCATTATGTGGATCCGGAGCTAAGTGCATCCTACATGAGCATGGGCGCTGGAGGCTCATCCTCTGGCCTTAATGTCAGCGACAGCATGGATGTCTGCTGTGTGCCCAGCTGCGAGAGCAAGCGCCACAACAATGAGAACATCACATTCCACACAATACCCAGGCGGCCAGAGCAGATGCGCAAGTGGTGCCACAATCTTAAGATACCCGAGGACAAGATGCACAAAGGCATGCGGATATGTAGCTTGCACTTTGAGCCCTACTGCATTGGCGGCTGCATGCGTCCGTTTGCGGTGCCGACATTGCATCTGGGCCACGACGACGATGACATTCACCGCAATCCGGATGTGATCAAGAAGCTCAACATACGCGAAACTTGCTGCGTGGCTGTTTGCAAACGCAATCGTGACCGGGACCATGCCAATCTCCATCGCTTTCCCAGCAATGTGCCGCTGTTAACCAAATGGTGCGCAAATCTGCAGCGTCCTGTACCGGATGGCAGTAAACTGTTCAACGATGCCATCTGTGAGGTGCACTTTGAGGATCGATGCCTGCGCAATAAACGGCTAGAGAAGTGGGCAGTGCCCACACTCATCCTTGGCCATGAGAATATACCCTATCCGCTGCCCACGCCGGAGCAAGTTGCCGAGTTCTATGCGCGTCCCACTGCGCCTAACAATGGCGAGGAGCAGGGCGAGTGCTGTGTGGAGACGTGCAAGCGTAATCCCAGTGTTGATGACATCAAGCTATATCGCCCGCCCGAGGAGTCGCAGGTGCTGGTAAAGTGGGCGCACAATCTCCAACTGGAGATTGCCCAGCTGCCCAATATGAGAATATGCAATCTGCATTTCGAAACCCACTGCATTGGCAAGCGGATGCGTCCCTGGGCAATACCCACGCTCAATCTGGCAACTAACATAGAGAATCTCTACGAGAATCCCGAACACCAGATGCTCTACAAGCGGCGCACGCATCTCAAGCCGGGCAGAGCAGCGCGAAACTCTGAAGCAAGCGCTGGTGGTGTGAAGCCCACCTGGGTGCCacgctgctgcttgccacactgCCGCAAAGTGCGTGCCACACACAATGTCCAGCTGTATCGCTTCCCCAAACTCAATCGTTCCACGCTGGCCAAGTGGGCGCATAATCTGCAGGTGCCGCTCGTGGGCAGCGCTCAGCGTCGCCTCTGCTCCGCACACTTTGAGCCGCATGTGCTTAGCAAGAAATGCCCGGTGCCCATGGCGGTGCCCACACTGGACCTCAATACACCATCCGGCTACAAGATCTATCAGAATCCGGCCAAGCTCAAGGCGAATAAGCTGTGCTTGCAGCGTGTCTGCATTGTGGAGAGCTGCCGGCGTCAGCGGGCGCAGGGGGTGCAGCTCTTCCGTCTGCCTCACAGCCCCACTCAGCTGCGTAAGTGGATGCACAATATCCGGATGCGGCCCCGAGGAGCTATGCGACAACAGTATCGCATCTGCTCGAAGCACTTCGAGACGCACTCGTTCAATGGGAAGAGACTCAGTGCGGGTGCAATTCCAACGCTTGAGTTGGGCCATGAGGACGAAGACATATTTCCGAATGAGGCGCAGTCTTTCGTGGAGGAGCACTGCACCGTCGAGGGCTGCGATGCCGTCAAGGAGCAACCGGATGTGCGTCTCTTCCGCTTCCCCAATGACGATGAGGATCTGCTCTGGAAGTGGTGCAACAATCTGAAAATGAGTCCGGTCGACTGCATCGGCGTTCGCATCTGCAACAGACACTTCGAGACTGATTGCATTGGACCAAAGCACCTGTTCAAGTGGGCCATTCCCACGCTCTCCCTCGgccacgatgatgatgacatcGAGTTGATGCTAAATCCCAAGCCGGAGGAGCGCTATATTGATCCGGTATTCAAGTGCTGTGTGCCCTCGTGCGGCAAGACGCGTAAATTTGATGAAGTGCAGATGAACAGTTTTCCCAAAGATCCGGAGCTCTTCCAGCGCTGGCGCCACAACCTCCGCCTCGAGCATCTCAACTTCAAGGAGCGCGAACGCTATAAGATCTGCAACGCCCACTTCGAGGACATTTGTATTGGTAAGACGCGCTTGAACATTGGCTCCATACCGACACTGGAGCTTGGCCATGACGAGACTGATGACTTGTTCCAAGTCAACCCCGAGGAACTACAGAGCAATCTCTTTGGACGCCAGAGACGCGTGCAGGATTCCATGAGGATCAACATTAAGCAGGAGGCGCACTCCGACCTCGATGAAGACACTAAACCGGACATTAACATGTTGGAGGCCACAGATTCAAATACAACACAGgctaaaatcaaaaaatctaTGACCGATTTCAAGTGCTGTGTGCCGAACTGTAGTCGCAGTCGCCTGGAGCATGGTGCTCGCCTCTTTCCGTTTCCGAACgggaaacagcagcagagtaAGTGGCGCCACAATCTTCGGCTGCCTGCTGCCGACGTGGACAAGACGACGCGCATCTGCAGCGCCCACTTCAATCGCCGTTGCATCGATGGCAATCAGCTGAGGGGCTGGGCAATGCCCACACAGCAGCTGGGACATCAGGAGCTGCCGATCTATGAGAATCCAAAGAATATACCAGGCTTCTTTACGCCCACCTGTGCGCTGGCGCACTGCCGCAAACGGCGCAGCATTGACAACGATCTGCGTACCTATCGCTATCCACGCAGTGAGGAGCTGCTCGAGAAGTGGCGTGTCAATCTGCGCTTGTCGCCGGACCAATGCCGCGGACGCATTTGTGCGGATCACTTCGAGCCACTGGTGCGTGGcaagctgaaactgaagacTGGAGCAGTGCCTACGCTCAAATTGGGACACGACGAGGGCGTAGTCTTCGATAATGAGGGCATTAAGGCGGGTCtgcagctggaggaggaggcggaggaaGAAGAGTGCAATGCCAGCTTGAAGTCATTGGTCAAAGTAAAGACTGAGCAGGAGGATGAGCAGGAGCTAGAGAATGAAGAtgaacagcagctggagcaggagcaggatcAAGATATGGACGAAGATGGGGAAGAGCACCGAGACTCTGAGGAACATGGCTATTTTGATCCCTTGGAACTTGTGGAAACCTACGCTGAGCACCAGAGCGATGATAACTCTGCCGGACATGATAATctcgacgatgatgatgatgaagatgaggaCATTCCCGGCAATGACGATGAGCTGCTTCTGCCCGATACGCGGCCACTTCGAATGACAATGGCTACGCGGCGCGAGAAGGCTGTGAATAATGTGACGCCTATTTGCTGTCTGAAGCACTGTCGCAAGGAGCGCACCGCCATCCATCATCTGAGCACCTTTGGCTTTCCCAAGGatccgcagctgctgctcaagtGGAGCGCCAATCTGCAGCTACCATTGGAGTCGTGCATGGGTCGTGTATGTGTCGAGCACTTTGAGCCTTCGATGCTGGGCACGCGCAAGTTGAAGCAGAATGCGGTGCCTACCTTGAAACTGGGCCATGCCACACCGCTCACTTACAGCTGCAATGGCCGGATGCTGTCGGGCATTTACGATGAACAGCCACAGCATTCGGTTTTTCGGCTTTGGAGCCTGAAACACTGCCGCAAACGGAAACCGGATCTGGCGGAGATTAAGCCCGGTCGTCGCTGTTGCCTGCCAAGTTGCGGCAAGCAGTCGGAGTCGCACGGCGTCCAGCTGCAGCGTCTGCCCAAGGATCGTCTGATGCTGCGCAAATGGTTGCACAACCTCAAGCTGCCTCCAACGATGGACTGCACCCAAATGTTCCTCTGCAGCGATCACTTTGAGCTGAATGCGCCGTGTCCCACTTTGAAACTGGGCCACTCGGACACCAATATTTATCGCCACAGTGTGGCTAGCACCAGTGGCAGCTGCCTGGTGCCCAAATGTACTTGTGCTCGTCTCAATCTCTATCGCGGCTATGATCTGCCTGCGCATCCGCAGGTGCAACAGGCCTGGCTACACTGGCTACAGCTGCCCCATCCGCAGCCGTCGCCCAGGCACGCCCAGCTGTGTGTGATGCACTTCATGCAGCTCTACGAACTGGTGCCGCTGCCCGAATCGGTGCCAGATGTTGTGCGCAGGCAGCTGCGGGAGACTTACGAACTGATATCCAATTCCAGCATGGCCATGAAGCTGCGTTGCGCTGTGCCCGGCTGCTACTCGAAGTATACGGACAATGTGCGTCTGACCAAGCTGCCCGTTTACCCCGACACCTGCGCCAAGTGGGTGCACAACACCAAGATTCAATATGATCCGGCCCGACATTATGTCTATCGCATCTGCATGTTGCACTTCGAGCCAGGTTGCCTGGGCCCAGTGCGTCCTAAAGTGTGGGCAATGCCAACGCTGCATCTGCACCACAAGGATgccaacatatatttaaatcccAAGCTGGATGGCAGCCAAACACTGTCGGCCGTGCCACTGGACCTGCCACTGCGTATTAAAACTGAGCTGCCGATGTGCAACAGTCCCAGCTTTAGTGCGAGTGCCAGTCCCAGTCCGCGTGGCAAGCTGCGCACTTGCTGCATTCCCAGCTGCGGTCAGCAGGCTTCGTCCCAGACGCGTCTCTTTCGCTTTCCCAGCGCAGAGACATCGATGCTGAAGTGGCTGGTGAAtactcagcagcagccacgcTTTGTCGATGCACAACGGCTGTTCGTCTGCCAGGATCACTTCGAGGCGGAGGCCATTTGCAAGAATCAACTGCGCAGCTGGGCGGTACCAACACTGAATCTAGGACACGATGGACACATCATACCGAATGCCAAGCACAATGGCAACATTGCCGACAGCCAGGAGAACAAGCAGACGCTGCAGTTCATCTGGGCCAACTACTGTTCAGTGCTGACCTGCTTCCAGAAAAGTAGCGAGCAGCTGCGTCTCTACCAATACCCCACGGATCGGCCAACCATCCGCAAGTGGGCCGCCAATTGTAAGCATCGCTCCATGCAGGCCAGCAGTGATGGATTCCAGGTGTGTCAGTCGCATTTTACGCCGGATTGCTTTGATTCTGATACCGGGGAGCTGAAAGAGGATGCTGTGCCCACACTGGCGCTGAGCCGGTCTGTCACTGAGGTGCGCTGTGTGGTCAATGGTTGCGTTAAGGACGAAGATGCATCGCGTCGCCGTCTGTTCAAGATGCCCAAGCGTAACCCACAGATATTGGATTGGTGCCACAATTTGCGGCTGGATCAGGCGGCCATGAACGGCTCGGAACAGCACGTTTGTGAACGTCACTTCGAGGCGAACTGCTTCAATGCGTCTAGAGTGCTGCGTCCAGGAGCACGACCCACACTTCATTTAGGTCATGAGGACCTAGACGATGTGATACCCAATCCAGCGAACTGGGAAGAGGATGTGATCGTGTGCTGTGTCCCCCACTGCGAAAGCTCCAAGGATGCGGATGAAGTCCAACTGTTTGGGCTGCCAAAGGTGCGCCAGTTGGCGGACAAGTGGCTGCAAAATGTGCACCTCGATCCGAGCAAAGAACAACTGGCCGGCTTGAAGATCTGCAGTGTGCACTTTGAGGCGAGCTGCATGGAGAATGGACGACCCACCTATGGTGCAATGCCCACACTCCATCTCGGTCACGATGAGCTCGACAATATACACCCAAGCGTAGAGTCGGTGCCGACGCAGCAGAAGCGGTACTGCAATAGAGATGGCGCCAGTCACGATTGCTGCTATCCGCAGTGCGTGGAGCTGCAGAAGAGCTATTTGCGGGTCACCTACGAACTGCCCCAGGAGCAGGAGCTCCGTCAGCAGTGGCTCTCCTATATGGGCCTGGAAGCGCAGCAGCTCgataagcagcagctgcccaaGCTCTGTCCACTCCACCTAATCTTGCTCTACGATCACAGTGCGGATCACTTTTCGGCTCACGCCGCTGAGGAGCTGTTGGACTCTAATTATGAGGCAGCGCGCAGCAGCGTTCGCATACGCGTTGTCAGCTGTGCTGTGCGCGGCTGCAGAACGCTCAAACCACGCGATGGTGGCCGGCTGCATGGTTTGCCCACGCGGCGAGATCTGCTGGAGATGTGGCTGCACAACATGCAGCTGGTGTTTTACGAGCAACAGCGTTATATGTACAAGATTTGCAGCAAGCACTTTGAGTCCACATGCTTCACGGAGACAACCAAGCGGCTGAAGCCGTGGAGCATGCCTACCCTCGAGTTGCCGGAGCGCCAACCGGGCGAGCTGCCTGCTTATCAGAATCCCACAGAGTTGGAGTGGCAACACATGAATGAGCTGCAGGTCAGCGAGAAAGCTGTTGAGGCTCAGCCGGAGCCATTACTTAATCTGGAGCCGTTGCCCAAGAAggagccaccaccaccgcagCTTGTGGAATATGAAGAGGATTGCGATAATAATTCACAGCAACCACTGGAAATGCAGGCGCTGGAGGTGCTGCTCGAGGTGGGCCATGTCGAGAAGTGCACCACCTACGAGCAAATGGATACCGAGGCAAATCTCAACTATGCCGAGCAGTTCTCGCACAATCCCCTCAGTCCAGGTCCACCTCAATGCCGTATCCCCGTTGTCCAGAATGGACTCCACTACAGTGCACGCCACTGCAGCGTGCATGGCTGCAATGTCACCTCCAATAATCTGAGCAGTAGCATCAAGCTACACAAGTTCCCCGTCTCGCTGGATGCCATGCAAAAGTGGATGCACAACACCCAGGTGCTCGTGGACGTCAAATTCGCTTGGCGTTTTCGAATCTGCAGTCATCATTTCATCGAGGATTGCTTTCACGGCTCGCGCATCAGACGTGGGGCGATGCCCACGTTGCGACTGGGCTCACGTCGACCGAAGCATATCTATGATAATGAGTTCAACgcccaactgcaactggaacaGTCCAAAGAAGAGGCCAGGGAGGCTCTCGCTGCCCCGCTGGAGTctcagcaacagttgctctcTGCGAATGTAGGTCTACGTCTGCCGCGTCCAGCCCCGCCCTGCAAATCTAGCAAATACTGTCAGATCGAAGGCTGCTCCAATCATTTGACCAGCGAAAATGTGACGCTGCACAAGTTCCCCCATTCGTCGGATATGTGCGCCAAGTGGCAGCACAACACTCAGGTACCCTTCGATCCCGAGTTCCGCTGGCGCTATCGCATCTGCAGCGCACACTTTGAGCCCATTTGTCTAGGCAATGTGCGACTGATGCACGGCAGTGTGCCCACCCTGAATCTGGGGCCGCTTGCGCCCAAGAAACTGTTTGACAATGAATTCTTGCGTCTGGACAAGCCAATAAGCAGTTCGGAGCTGGGTATGACCGTCAAACAGGAACAAATGGAGCAATTTGATCAAATGAAGCTGGAAGATGGCAACCAGGAGCAGAATGATTTCAGTCTGCTGGAGCCCGAGCTGCAGTTGCACGAGGATAGCGAGGAAGAGCAAGAATATGACAATCATTTTAGCCAAAACGATTCCTATAACTGGTCCGATCAGCAGCTGCGTCTGCCCAGTATTAATCAGGAGAAGTGCACCACCATCTACAATCCAGTCAAGTCCGGCTATGATAAGTGCTCACTGGTCCACTGCCAACGACAGCGTTCGCAGCACGGCGTGCACATCTACAAGTTTCCACGCTCGCGTCAGCTACAGCAACGATGGATGCATAATTTGCGCATCCAATACGATGAGCGACGGCCGTGGAAGACAATGATATGCAGTGTCCATTTCGAGCCGCACTGCATCCGATTGCGCAAGTTGCGTCCCTGGGCGGTGCCCACGCTGGAACTTGGGGACAATGTGCCGCTGGAGATCTTTACGAATGAACAGAGCCAGCAGCTGTTTGCTCAGTCCGAAGCAGGCAGCGAGTGTGATGAAGTGGATGTTGAGGACACCATACTGGAGGACATGGATGATGACTACGATGACAATGACGCtgatgtgaatgtgaatgctgATGATCAAGTGCGAACAGCTCCATATGTCAAAAGAGAGCGTCGCTCTCGATTTGATCCTTTGCCACCGGGTCAGCTGCCACCGTGGAAAATAAAGTGCTGCTGTTTACCTTATTGCCGCAGTCCTCGCGGTGATGGCATCAAGCTCTTTCGACTGCCCAACAACATCAGCTCCATACGTAAATGGGAGCAGGCCACAGGCATGCGCTTCTATGAGTCCCAGCGAAACACAAAGCTCATATGCAGTCGACACTTTGATCCGCAGCTTATAGGCGTGCGTCGCCTCATGTCCAATGCGGTACCCAGCCTCCATTTGGGCCCAGACAGCGTAGAGCCCGAGCTGCCTCCTGTGGGACCACGTTGCTGCATGCCCGATTGCTCTGAGGATGTCAATGTCCAGCTGCACAAGTTTCCCAAAgATCCCATGCTGCTGCATCAATGGTGTCAGGCGCTCAATCTACCAGATGTTCAAAGCTACTCCGGCAAATTCATTTGTGCGGCACATTTGCCCTCCAACGCGATGAGCTGTCTAATTTGTGGCGTGGACGATGTACAGCTGCCTATGCTGGACTTTCCCCAGAATCGCAATCAGCGCACCAAATGGTGCCACAATCTGAAAATCGAGCCTCTGCCCAAGTGGGACAACTCaaagcaaatttgttgcaaacaCTTTGAGAGCTTTTGCTTTATCCAGCCGGGTCAACTTCTGGCGGAAGCATTGCCCACTCTACACTTGGAGCACGGGGATAGCAACATATTCCTAAACGATGAGACCATGGATAACAGCAAGTTGTTGCGCATCAAGGACGAGCCCATGGAGAGCGAGGATCTGATGCTGTAA
Protein Sequence: MSQQQHNPPPHHQHQHHYYQQQQQQQHLQQQQHLQHKQIQQQQHSWYSHVASYPPPHAAAFASPCKSSSSNNNNNNNNHIMNAYGTGAGGYYGSTGAGSVGVGYNLEANTVAYAHNQLLQYQQQQQQQQHQQQQQHQQQQQQLSHRSYMPPHIMHSSYPYIKSEPLEPLPERHQQQQQQQQLFQNPMAPPPAPAIANRPSLDASGEMIIKSEPIDEHAFKSNYIDDNTPFADFSKYSEFGDDMLSPKLELNVKDEGYANQKNPLNYPRRKLQTDRSAESMPICQRCKEVFFKKHIYLQHVAESSCSIHEYEFKCNICPMSFMGGEELQKHKHLHRTDKFFCHKYCGKHYDSIAECESHEYMEHEYDSFVCNMCSVTFPTREQLYAHLPQHKFQQRYDCPICRLWYQTALELHEHRLAAPYFCGKYYAAAHQQQQQQQQQQQQQQQQQQQQHTQQHQQQGNYKLQDCHMGTIEMTPPQHKANAALPATAALNSLLQQRQANADGAALYASALKSETNVKLERSYSNSTSESGYSMHESSYNNAYASDNSLHGGGGAIGGPQAHSSTLDDSEDALCCVPLCGVRKSTSPTLQFFTFPKDDKYLHQWLHNLKMFHIPASSYASFRICSMHFPKRCINRYSLCYWAVPTFNLGHDDVANLYQNRELTNTFTTGEVARCSMPNCTSQRGESNLKFYNFPKDIKSLIKWCQNARLPVQAKEPRHFCSRHFEERCIGKFRLKPWAVPTLHLGAQYGKIHDNPKNLYVEEKRCCLNFCRRSRSSDFNMSLYRFPRDEVLLRRWCYNLRLDPAVYRGKNHKICSAHFIKEALGLRKLSPGAVPTLHLGHNDTFNIYENELWPPPTPSTPTHNHQQQLQQHQLQQQPQQVHHKYQRHSAASTSSSASSTSHYVDPELSASYMSMGAGGSSSGLNVSDSMDVCCVPSCESKRHNNENITFHTIPRRPEQMRKWCHNLKIPEDKMHKGMRICSLHFEPYCIGGCMRPFAVPTLHLGHDDDDIHRNPDVIKKLNIRETCCVAVCKRNRDRDHANLHRFPSNVPLLTKWCANLQRPVPDGSKLFNDAICEVHFEDRCLRNKRLEKWAVPTLILGHENIPYPLPTPEQVAEFYARPTAPNNGEEQGECCVETCKRNPSVDDIKLYRPPEESQVLVKWAHNLQLEIAQLPNMRICNLHFETHCIGKRMRPWAIPTLNLATNIENLYENPEHQMLYKRRTHLKPGRAARNSEASAGGVKPTWVPRCCLPHCRKVRATHNVQLYRFPKLNRSTLAKWAHNLQVPLVGSAQRRLCSAHFEPHVLSKKCPVPMAVPTLDLNTPSGYKIYQNPAKLKANKLCLQRVCIVESCRRQRAQGVQLFRLPHSPTQLRKWMHNIRMRPRGAMRQQYRICSKHFETHSFNGKRLSAGAIPTLELGHEDEDIFPNEAQSFVEEHCTVEGCDAVKEQPDVRLFRFPNDDEDLLWKWCNNLKMSPVDCIGVRICNRHFETDCIGPKHLFKWAIPTLSLGHDDDDIELMLNPKPEERYIDPVFKCCVPSCGKTRKFDEVQMNSFPKDPELFQRWRHNLRLEHLNFKERERYKICNAHFEDICIGKTRLNIGSIPTLELGHDETDDLFQVNPEELQSNLFGRQRRVQDSMRINIKQEAHSDLDEDTKPDINMLEATDSNTTQAKIKKSMTDFKCCVPNCSRSRLEHGARLFPFPNGKQQQSKWRHNLRLPAADVDKTTRICSAHFNRRCIDGNQLRGWAMPTQQLGHQELPIYENPKNIPGFFTPTCALAHCRKRRSIDNDLRTYRYPRSEELLEKWRVNLRLSPDQCRGRICADHFEPLVRGKLKLKTGAVPTLKLGHDEGVVFDNEGIKAGLQLEEEAEEEECNASLKSLVKVKTEQEDEQELENEDEQQLEQEQDQDMDEDGEEHRDSEEHGYFDPLELVETYAEHQSDDNSAGHDNLDDDDDEDEDIPGNDDELLLPDTRPLRMTMATRREKAVNNVTPICCLKHCRKERTAIHHLSTFGFPKDPQLLLKWSANLQLPLESCMGRVCVEHFEPSMLGTRKLKQNAVPTLKLGHATPLTYSCNGRMLSGIYDEQPQHSVFRLWSLKHCRKRKPDLAEIKPGRRCCLPSCGKQSESHGVQLQRLPKDRLMLRKWLHNLKLPPTMDCTQMFLCSDHFELNAPCPTLKLGHSDTNIYRHSVASTSGSCLVPKCTCARLNLYRGYDLPAHPQVQQAWLHWLQLPHPQPSPRHAQLCVMHFMQLYELVPLPESVPDVVRRQLRETYELISNSSMAMKLRCAVPGCYSKYTDNVRLTKLPVYPDTCAKWVHNTKIQYDPARHYVYRICMLHFEPGCLGPVRPKVWAMPTLHLHHKDANIYLNPKLDGSQTLSAVPLDLPLRIKTELPMCNSPSFSASASPSPRGKLRTCCIPSCGQQASSQTRLFRFPSAETSMLKWLVNTQQQPRFVDAQRLFVCQDHFEAEAICKNQLRSWAVPTLNLGHDGHIIPNAKHNGNIADSQENKQTLQFIWANYCSVLTCFQKSSEQLRLYQYPTDRPTIRKWAANCKHRSMQASSDGFQVCQSHFTPDCFDSDTGELKEDAVPTLALSRSVTEVRCVVNGCVKDEDASRRRLFKMPKRNPQILDWCHNLRLDQAAMNGSEQHVCERHFEANCFNASRVLRPGARPTLHLGHEDLDDVIPNPANWEEDVIVCCVPHCESSKDADEVQLFGLPKVRQLADKWLQNVHLDPSKEQLAGLKICSVHFEASCMENGRPTYGAMPTLHLGHDELDNIHPSVESVPTQQKRYCNRDGASHDCCYPQCVELQKSYLRVTYELPQEQELRQQWLSYMGLEAQQLDKQQLPKLCPLHLILLYDHSADHFSAHAAEELLDSNYEAARSSVRIRVVSCAVRGCRTLKPRDGGRLHGLPTRRDLLEMWLHNMQLVFYEQQRYMYKICSKHFESTCFTETTKRLKPWSMPTLELPERQPGELPAYQNPTELEWQHMNELQVSEKAVEAQPEPLLNLEPLPKKEPPPPQLVEYEEDCDNNSQQPLEMQALEVLLEVGHVEKCTTYEQMDTEANLNYAEQFSHNPLSPGPPQCRIPVVQNGLHYSARHCSVHGCNVTSNNLSSSIKLHKFPVSLDAMQKWMHNTQVLVDVKFAWRFRICSHHFIEDCFHGSRIRRGAMPTLRLGSRRPKHIYDNEFNAQLQLEQSKEEAREALAAPLESQQQLLSANVGLRLPRPAPPCKSSKYCQIEGCSNHLTSENVTLHKFPHSSDMCAKWQHNTQVPFDPEFRWRYRICSAHFEPICLGNVRLMHGSVPTLNLGPLAPKKLFDNEFLRLDKPISSSELGMTVKQEQMEQFDQMKLEDGNQEQNDFSLLEPELQLHEDSEEEQEYDNHFSQNDSYNWSDQQLRLPSINQEKCTTIYNPVKSGYDKCSLVHCQRQRSQHGVHIYKFPRSRQLQQRWMHNLRIQYDERRPWKTMICSVHFEPHCIRLRKLRPWAVPTLELGDNVPLEIFTNEQSQQLFAQSEAGSECDEVDVEDTILEDMDDDYDDNDADVNVNADDQVRTAPYVKRERRSRFDPLPPGQLPPWKIKCCCLPYCRSPRGDGIKLFRLPNNISSIRKWEQATGMRFYESQRNTKLICSRHFDPQLIGVRRLMSNAVPSLHLGPDSVEPELPPVGPRCCMPDCSEDVNVQLHKFPKDPMLLHQWCQALNLPDVQSYSGKFICAAHLPSNAMSCLICGVDDVQLPMLDFPQNRNQRTKWCHNLKIEPLPKWDNSKQICCKHFESFCFIQPGQLLAEALPTLHLEHGDSNIFLNDETMDNSKLLRIKDEPMESEDLML

Similar Transcription Factors

Sequence clustering based on sequence similarity using MMseqs2

100% Identity: iTF_00595971;
90% Identity: iTF_00553068;
80% Identity: -