Basic Information

Insect: Drosophila flavopinicola
Gene Symbol: -
Assembly: GCA_035042425.1
Location: JAWNLL010000033.1:643719-659612[+]

Transcription Factor Domain

TF Family: THAP
Domain: THAP domain
PFAM: PF05485
TF Group: Zinc-Coordinating Group
Description: The THAP domain is a putative DNA-binding domain (DBD) and probably also binds a zinc ion. It features the conserved C2CH architecture (consensus sequence: Cys - 2-4 residues - Cys - 35-50 residues - Cys - 2 residues - His). Other universal features include the location of the domain at the N-termini of proteins, its size of about 90 residues, a C-terminal AVPTIF box and several other conserved residues. Orthologues of the human THAP domain have been identified in other vertebrates and probably worms and flies, but not in other eukaryotes or any prokaryotes [1].
Hmmscan Out: # of c-Evalue i-Evalue score bias hmm coord from hmm coord to ali coord from ali coord to env coord from env coord to acc

1 28 8.1e-15 1.3e-11 45.1 4.2 1 86 565 637 565 638 0.85

2 28 3.4e-15 5.6e-12 46.3 4.6 1 87 665 734 665 734 0.83

3 28 8.3e-16 1.4e-12 48.2 0.4 1 87 756 828 756 828 0.85

4 28 7.3e-16 1.2e-12 48.4 5.7 1 87 923 993 923 993 0.83

5 28 7.7e-15 1.3e-11 45.1 3.3 1 86 1017 1088 1017 1089 0.82

6 28 4e-12 6.5e-09 36.4 0.8 1 87 1124 1192 1124 1192 0.80

7 28 5.6e-10 9.3e-07 29.5 0.9 1 76 1241 1300 1241 1312 0.73

8 28 3.1e-16 5e-13 49.6 0.1 1 86 1338 1407 1338 1408 0.82

9 28 8.9e-12 1.5e-08 35.3 2.9 1 85 1429 1497 1429 1499 0.80

10 28 3e-15 5e-12 46.4 1.5 1 86 1526 1597 1526 1598 0.85

11 28 1.3e-13 2.2e-10 41.2 1.6 1 85 1668 1736 1668 1738 0.82

12 28 2.4e-12 3.9e-09 37.2 0.1 1 86 1761 1829 1761 1830 0.81

13 28 3.7e-14 6.1e-11 42.9 0.3 1 86 1976 2044 1976 2045 0.81

14 28 1.3e-09 2.1e-06 28.4 0.1 1 61 2098 2152 2098 2173 0.80

15 28 0.00055 0.9 10.4 0.5 1 58 2179 2229 2179 2253 0.78

16 28 2.4e-11 3.9e-08 33.9 0.6 1 86 2268 2337 2268 2338 0.83

17 28 5.7e-14 9.4e-11 42.3 0.7 1 85 2395 2463 2395 2465 0.82

18 28 4.6e-13 7.6e-10 39.4 1.3 1 86 2500 2571 2500 2572 0.82

19 28 3.9e-12 6.4e-09 36.5 1.0 1 85 2582 2652 2582 2654 0.80

20 28 1.9e-11 3e-08 34.3 0.0 1 86 2677 2747 2677 2748 0.77

21 28 3.4e-06 0.0056 17.4 0.3 1 58 2781 2836 2781 2855 0.83

22 28 2.9e-13 4.8e-10 40.1 0.1 1 86 2874 2946 2874 2947 0.82

23 28 5.1e-15 8.4e-12 45.7 1.0 1 85 3078 3149 3078 3151 0.82

24 28 3.1e-14 5.1e-11 43.2 2.6 1 87 3228 3299 3228 3299 0.83

25 28 9.6e-14 1.6e-10 41.6 5.2 1 86 3414 3484 3414 3485 0.85

26 28 3.7e-14 6e-11 43.0 0.1 1 87 3577 3647 3577 3647 0.85

27 28 1.8e-08 2.9e-05 24.8 3.6 1 58 3674 3722 3674 3735 0.83

28 28 8.5e-09 1.4e-05 25.8 1.7 18 87 3739 3797 3728 3797 0.75

#	of	c-Evalue	i-Evalue	score	bias	hmm coord from	hmm coord to	ali coord from	ali coord to	env coord from	env coord to	acc
1	28	8.1e-15	1.3e-11	45.1	4.2	1	86	565	637	565	638	0.85
2	28	3.4e-15	5.6e-12	46.3	4.6	1	87	665	734	665	734	0.83
3	28	8.3e-16	1.4e-12	48.2	0.4	1	87	756	828	756	828	0.85
4	28	7.3e-16	1.2e-12	48.4	5.7	1	87	923	993	923	993	0.83
5	28	7.7e-15	1.3e-11	45.1	3.3	1	86	1017	1088	1017	1089	0.82
6	28	4e-12	6.5e-09	36.4	0.8	1	87	1124	1192	1124	1192	0.80
7	28	5.6e-10	9.3e-07	29.5	0.9	1	76	1241	1300	1241	1312	0.73
8	28	3.1e-16	5e-13	49.6	0.1	1	86	1338	1407	1338	1408	0.82
9	28	8.9e-12	1.5e-08	35.3	2.9	1	85	1429	1497	1429	1499	0.80
10	28	3e-15	5e-12	46.4	1.5	1	86	1526	1597	1526	1598	0.85
11	28	1.3e-13	2.2e-10	41.2	1.6	1	85	1668	1736	1668	1738	0.82
12	28	2.4e-12	3.9e-09	37.2	0.1	1	86	1761	1829	1761	1830	0.81
13	28	3.7e-14	6.1e-11	42.9	0.3	1	86	1976	2044	1976	2045	0.81
14	28	1.3e-09	2.1e-06	28.4	0.1	1	61	2098	2152	2098	2173	0.80
15	28	0.00055	0.9	10.4	0.5	1	58	2179	2229	2179	2253	0.78
16	28	2.4e-11	3.9e-08	33.9	0.6	1	86	2268	2337	2268	2338	0.83
17	28	5.7e-14	9.4e-11	42.3	0.7	1	85	2395	2463	2395	2465	0.82
18	28	4.6e-13	7.6e-10	39.4	1.3	1	86	2500	2571	2500	2572	0.82
19	28	3.9e-12	6.4e-09	36.5	1.0	1	85	2582	2652	2582	2654	0.80
20	28	1.9e-11	3e-08	34.3	0.0	1	86	2677	2747	2677	2748	0.77
21	28	3.4e-06	0.0056	17.4	0.3	1	58	2781	2836	2781	2855	0.83
22	28	2.9e-13	4.8e-10	40.1	0.1	1	86	2874	2946	2874	2947	0.82
23	28	5.1e-15	8.4e-12	45.7	1.0	1	85	3078	3149	3078	3151	0.82
24	28	3.1e-14	5.1e-11	43.2	2.6	1	87	3228	3299	3228	3299	0.83
25	28	9.6e-14	1.6e-10	41.6	5.2	1	86	3414	3484	3414	3485	0.85
26	28	3.7e-14	6e-11	43.0	0.1	1	87	3577	3647	3577	3647	0.85
27	28	1.8e-08	2.9e-05	24.8	3.6	1	58	3674	3722	3674	3735	0.83
28	28	8.5e-09	1.4e-05	25.8	1.7	18	87	3739	3797	3728	3797	0.75

Sequence Information

Coding Sequence: ATGTCACAACAACACAATAACCCCTCGCatcaccaacaacaacatcattactaccagcagcaacaacagcagcagcagcagcttttgcagcataaacaaatacaacagcagcagcacaattgGTACTCACATGTTGCTTCCTATCCGCCCCCGCATCCGCATGCCGCTGCGTTTGCGGCGCCctgcaagagcagcagcaacaataataacaacaacaacattatgaATGCATACGGCGCGGGTGCCGGAGCGTATTATGGCTCTACGGGCGCAGGTGGCGGTGGGGTGGGCTATAACCTTGAGGCCAATACTGTGGCCTATGCGCACAACCAGCTGCtgcaataccaacaacaacaacagcagcaacaacaacaccagcagcagcagcagcagctcaaccATCGGTCGTATATGCCGCCGCACAGCATAATGCACGGCTCGTATCCCTACATCAAGAGCGAGCCACTCGAGCTGCCCGAacggcatcagcagcagcagcagcaacaacaacagcagcagcagcagcaacattttcagAATCCTATGGCACCGCCGCCAGCACCCGCCATTACTAATCGTCACTCGCTCGATGCCAGCGGCgaaatgataataaaatCGGAACCCATCGACGAACATGCGTTCAAGTCCAACTATATCGATGATAATACCCCCTTTGCCGATTTTAGTAAATATCCAGAGTACGGCGACAACATGCTGAGTCCCAAGGTGGAGCTTAACGTCAAGGATGAGGCCTATGGAAACCAAAAAAACCCGCTCAACTATCCGCGCCGAAAGCTGCAAACGGAGCGCTCCTCGGAGAGTCTGCCCATATGCCAGCGCTGCAAGGAGGTGTTCTTTAAGAAGCAGATCTATCTGCGCCATGTGGCCGAGAGCAGTTGCATCATACAAGAGTACGAGTTCAAGTGCAACCTCTGCCCCATGACCTTCATGGGCGCCGAGGAGCAACATAAGCACAAGCATCTGCATCGTGTGGACAAATTCTTCTGCCACAAATACTGTGGCAAGCATTTTGATACGATTGCAGAGTGCGAGTCGCATGAATACATGCAGCACGAGTACGAAAGCTTTGTGTGCAATATGTGCTCTGTTACGTTTGCCACGCGGGAACAGCTCTATGCTCATTTGCCGCAACACAAGTTCCAGCAGCGTTTCGATTGCCCCATTTGCCGCTTGTGGTACCAAACGGCATTAGAGCTGCACGAGCATCGACTGGCGGCGCCCTACTTCTGCGGCAAGTATTACGCTGCGgcacaccagcagcaacagcagcagcagcaacagcagcagcagcagcagcaacatcctcAACAGCATCCGCAGCAGCAGGGCaactacaaacttcaggattGTCACATGGGCACCATTGAAAtgaCTCCACCGCATCACAAGGCGGCTGTAGCATTGCCGGCAACGGCGGCGCTCAgttcgctgctgcagcagcgccaggcGAATGCTGATGGCGCCGCTTTGTATGCTTCAGCGCTGACGAAGAGCGAGGCGAGTGTGAAACTGGAGCGCAGCTATAGCAACTCCACCAGCGAGTCGGGCTACAGCCTGCATGATAGCAGCTATAACAATGCCTATGGCAGCGACAGCTCGTTGCATGGCAGCGGCGGAATTGGTGGCCCGCAGGCGCACTCTTCGACGCTGGACGAATCGGAGGATGCGCTGTGCTGTGTGCCGCTGTGCGGTGTGCGCAAGAGCACCAGCCCGACGCTGCAGTTCTTTACGTTTCCCAAGGATGACAAGTACTTGCATCAGTGGCTGCACAATCTCAAGATGTTCCACATTCCGGCCTCGAGCTATGCCAGCTTTCGGATCTGCAGCATGCACTTCCCCAAGCGCTGTATCAATCGCTACTCGCTGTGCTATTGGGCCGTGCCCACGTTCAATCTGGGCCACGACGATGTCGCCAATCTCTATCAGAATCGCGAGCTGACCAACACGTTTACCACCGGTGAGGTAGCCCGCTGCAGCATGCCGAACTGCACCAGCCAGCGCGGCGAGAGCAATCTCAAGTTCTACAACTTTCCCAAAGATATCAAGAGCTTGATCAAGTGGTGTCAGAACGCCCGTCTGCCCGTCCAGGCCAAGGAGCCGCGTCACTTTTGTAGTCGCCACTTCGAGGAGCGCTGCATCGGAAAGTTCCGGCTGAAGCCGTGGGCAGTGCCCACGCTGCATCTGGGCGCTCAGTACGGCAAGATTCATGACAATCCCAAGAATCTGTATGTGGAGGAGAAGCGCTGCTGTCTCAACTTTTGTCGCCGCAGTCGCTCCTCCGACTTCAATATGTCGCTCTATCGCTTCCCCAGGGATGAGGTTCTGCTGCGTCGCTGGTGCTACAATCTGCGCCTCGATCCGGCTGTCTATCGTGGCAAGAATCACAAAATATGCAGTGCTCACTTCATCAAGGAAGCTCTGGGATTACGCAAACTGTCTCCGGGCGCTGTACCTACACTGCACCTGGGCCACAACGACACCTTCAACATCTACGAGAACGAACTGTGGCCACCGCCAACGCCCTCCACGCCCACCCACAATACCCAGCAGCAGGTGCCGCAGCACCAattgcagcatcagcagcaacatgtgcATCATAAATATCAGCGGCACTCGGCTGCCTCCACATCTTCATCGGCCAGTTCGGCATCGCATTATGTGGATCCGGAACTGAGTGCATCCTACATGAGCATGGGAGCTGGCGGCTCATCGTCAGGCCTGAATGTCAGCGATAGCATGGACGTCTGCTGTGTGCCCAGCTGCGAGAGCAAGCGCCACAACAATGAGAACATCACATTCCACACAATACCCAGGCGACCGGAGCAGATGCGAAAGTGGTGTCACAATCTGAAGATACCCGAGGACAAGATGCACAAGGGTATGCGAATATGTAGCCTGCACTTTGAGCCCTACTGCATTGGCGGCTGCATGCGTCCGTTTGCTGTGCCCACACTGCATCTGGGCCACGATGACGAGGACATTCATCGCAATCCGGATGTGATTAAGAAGCTCAACATACGTGAAACCTGCTGCGTAGCTGTCTGCAAGCGTAACAGAGACCGGGATCATGCGAATCTACATCGCTTTCCCAGCAATGTTGCGCTGCTGACCAAGTGGTGTGCGAATCTCCAACGACCGGTGCCTGATGGTACTAAGCTCTTCAACGATGCCATCTGTGAGGTGCACTTTGAGGATCGCTGCCTGCGCAACAAGCGACTGGAGAAGTGGGCGGTACCGACGCTCGTGCTGGGCCATGAGAATATACCGTATCCGCTGCCCACGCCGGAGCAGGTCGCCGAGTTCTATGCGCGTCCCAGTGCACCCAACAATGGCGACGAGACGGGCGAGTGCTGTGTGGAGACGTGCAAGCGTAATCCCAGTGTGGATGACATCAAGCTCTATCGCCCACCGGAAGAGACACAGGTGCTGTCCAAGTGGGCGCACAATCTCGAACTGGAGATTGCCGCGCTGCCCAGCTTGAGGATCTGCAATCTGCACTTCGAGTCGCACTGCATTGGCAAGCGTATGCGTCCCTGGGCCATACCCACGCTTAATCTGGCCAACAACATTGAGAATCTCTACGAGAATCCTGAACACCAAATGCTTTACAAACGGCGCACGCATCTCAATCCAGATAGAGCAGCCGCTCGTGCAAATGCTGGAGCGGCCGCTGGTGTGAAACCCACGTGGGTGCCACGCTGCTGTCTGTCGCACTGTCGCAAGGTGCGCGCCCTTCATAACGTTCAGCTGTATCGCTTCCCCAAGCTCAATCGCTCCACGTTGGCCAAGTGGGCACATAATCTGCAGGTGCCGATGGTCGGCAGCGCTCAGCGACGTCTCTGCTCGGCCCACTTCGAGCCGCATGTGCTTAGCAAGAAGTGCCCAGTGGCGCTGGCAGTGCCCACACTGGATCTGAACACACCATCCGGCTACAAGATCTACCAGAATCCGGCCAAGCTCAAGGCCAACAAGCTGTGCCTGCAGCGCGTTTGCATTGTGGACAGCTGCCGGCGGCAGCGGGCGCAGGGCGTGCAGCTCTTCCGACTGCCACACAGCCCCACCCAGCTACGAAAGTGGATGCACAACATACGGATGCGGCCGCGAGGTGCCATGCGGCAACAGTATCGCATTTGCTCGCTTCACTTTGAGACGCACTCGTTCAATGGCAAGCGACTGAGTGCTGGTGCGATTCCAACGCTGGAGCTGGGCCATGAGGACGAGGATATCTATCCGAATGAGGCGCAGTCATTCGTCGAGGAGCACTGCACTGTCGAGGGCTGCGATGCGTCCAAGGAGCAGCCGGATGTGCGCCTCTTCCGCTTTCCAACCGACGACGAGGACCTGCTGTGGAAGTGGTGTAACAATCTGAAAATGAATCCCGTCGACTGCATCGGTGTACGTATCTGCAACAGGCACTTCGAAGCGGACTGCATTGGACCCAAGCATCTGTTCAAGTGGGCCATTCCCACATTCTGCCTCGGCCACGACGATGACGAGACCGAACTTATACCGAATCCCAAGCCGGAGGAGCGTTACGTTGATCCCGTGTTCAAGTGCTGTGTGCCCACCTGCGGCAAGACGCGCAAATTTGATGAGGTGCAAATGAACAGCTTCCCCAAGGACCCCGCTCTCTTCCAGCGCTGGCGCCACAATCTCCGCCTGGAGCATCTCAGCTTCAAGGAACGCGAACGCTACAAGATCTGCAATGCTCACTTCGAAGACATTTGCATTGGCAAGACGCGCCTGAACATTGGCTCCGTTCCTACGCTTGAACTGGGCCACGACGAGACTGATGACCTGTTCCAAGTCAATCCCGAAGAGCTGCAGAGCAATCTTTTTGGACGCCAGCGTCGCGTCAGCATTAAGCAGGAAGCGCACTCCGAACTGGACGAGGACATCAAGCCGGACATAACCATGTCGGAGGCAACAGATTCGAACACAACACAGGTTAAAATCAAGAAATCCTTGGCCGATTTCAAGTGCTGTGTGCCGAGCTGTGGTCGTAGTCGCCTGGAGCATGGCGCCCGCCTCTTTCCCTTTCCCACtggaaagcagcagcagagcaagtGGCGCCACAACCTGCGCTTGTCTGCTGCCGACGTGGATAAGACGACACGCGTGTGTAGCGCCCATTTCAATCGCCGTTGCATCGATGGCAAGCAGCTGCGGGGCTGGGCTATGCCCACCCAGCAGTTGGGCCACCAGGAGCTGCCGATCTATGAGAATCCAAAGAATATTCCGGGCTTCTTTACGCCCACCTGTGCGCTGGCGCACTGCCGCAAGCGGCGCAGCATTGATAACGATCTGCGCACCTATCGCTATCCACGCAGCGAAGAGTTGCTTGAGAAGTGGCGGGTTAATCTGCGCCTGGCGCCAGATCAATGCCGCGGACGCATCTGTGCTGATCATTTCGAGACGATGGTGCGCGGCAAACTGAAGCTGAAGACGGGCGCGGTGCCGACGCTCAAATTGGGGCACGACGAGGGTGTGGTTTTTGATAATGAAAGCATTAAGGCGGGCatgcagcaggaggaggaggatgcgGAAGAAGAGGGCGATGCCAGCTTGGAGTCTTTGGTAAAGGTAAAGACTGAGAAGCAGGAGGAACAGCCGCTCGAGAATGTTgatgaggagcaggagcagggtATTGATAATGATCTTGATGATGGTGAAGGACAGGAGGAGGAGCACGACTCTGAAGATCATGGATATTTCGATCCCTTGGAACTCGTCGAAACGTTCGCTGAGCAGCACAGCGATAATAGCTCTGCCGAGGATGATAATCTAGACGACGATGAGGATATACCCGGCGACGatgatgagctgctgctgcccgacACTCCTCACATTCCACTGCTGGTACTGCCGCGGCGCGAGAAGCCCGTGAATAATGTAACGCCCATTTGCTGTCTGAAGCATTGTCGCAAAGAGCGCACAGCTGCCCTGCAGCTGAGCACCTTTGGCTTTCCCAAGGACCAGCAGTTGCTGCTCAAGTGGAGCGCCAATCTGCAGCTGCCGCTCGAGGATTGCGCGGGTCGCGTGTGCATCGAGCACTTTGAGCCCGAGATGCTGGGCACGCGCAAGCTAAAGCAGAATGCGGTGCCCACGCTAAAGCTCGGCCATGTCACGCCCCTCACCTACAGCTGCAACGGACGACTGCTGTCGGCCATTTACGATGCACAGCCGCAGCATTCGGTTTTTCGGCTTTGGAGCCTAAAACACTGCCGCAAAAGGAAGCCCGAGCTGGCGGAGACTAAGCCCAAGCGCCGTTGCTGTCTGGCCAGCTGCGGCAAGCAGTCGGAGTTGCATGGCGTCCAGTTGCGGCGTCTGCCGCGCGATCGTCTCATGCTGCGCAAATGGTTGCACAATCTGAAGCTGCCGCCGCTCATGGACTGCAACCAGATGTTCCTCTGTGGCGATCACTTTGAGCTGGATGCGCCGCTGCCGACACTTAAGCTGGGCCATGCCGACACGAATATATATCGCCACAATGCGTccggcagcagtggcagttgcCTGGTGCCTAGCTGCACGTGTGCGCGTCTCAATCTCTATCGCTGCTATGATCTGCCCGAACATCCGCTGGTGCAGCAATCATGGCTGCACTGGCTGCAGCTGCCCCATCCGCAGTCGACAAGTCACTCCCAGCTGTGTGTGATGCACTACATGCAGCTGTTTGAGCAGGTGCCGCTGCCTGAGGAGCTGCCGTCGGTTGTGCGGCGTCAGCTGCGCGAGACGTATGACCTCATAGCCAGTTCTTCGATGGCCATGAAGCTGCGCTGTGCCGTGCCCGGCTGCTACTCCAAGTATACGGACAATGTGCGACTGACCAAGCTGCCCGTCTGCCCCGACACCTGCGCCAAGTGGGTGCACAACACCAAGATCGAATACGATCCGGCGCGCCACTATATCTATCGCATCTGTATGCTGCACTTTGAGCCGCGCTGCCTGGGCCCAGTGCGTCCCAAGGTGTGGGCAATGCCCACACTAGCGCTGCACCATCGTGACACCAATATCCATTTGAATCCCATGCTGGATGGCACTCCAACTCCAAGCGTGCCGATCGAGCTGCCGCTGCGCATTAAAACCGAGCTGCCCATGTGCGCCAGTCCTAGCGCCAGCGCCAGTGCGAGTCCCAGTCCGCGTAGCAAGCTGCGCATCTGCTGCATTCCTACCTGTGGACAGCAGGCCGTCGGACAGACACGTCTCTTTCGCTTTCCCAGCACGGAGACGGCGCTGCTCAAGTGGCTGGTGAAtacgcaacagcagccgcgATTGGTCGATGCACAGCGTCTGTACATCTGCCAGGATCACTTCGAGGCGGATGCCATTTGCAAGAACCAGCTGCGCAGCTGGGCGGTGCCCACTCGGAAGCTGGGTCACGATGGACACATCATTCCGAATGCGCGGCATAATGGCAACATTGCCGACAGCTATGAGAACAGGCAGACGCTGCAGTTCATCTGGGAGAACTACTGCTCGGTGCTAACCTGCTTTCAGGAGCGCAGCGAGCAGCGGCGTCTTTATCAGTACCCCACGGATCGGCCTACGATTCGCAAGTGGGCCGCCAACTGTAAGCATCGCTCCATGCAGGCCAGCAGCGATGGATTCCAGGTCTGCCAGTCACACTTTGCGCCCGATTGCTTTGATCCCGAGACCGGGAATCTGAAGGAGGATGCTGTGCCGACGCTGGAGCTTAGCCGTACGGTGACTGAGTTGCGCTGTGTGGTCAACGGTTGCCTCAAAGGCGAGGATGCTCCGCGTAGCCGACTGTTCAAAATGCCCAAGCGTACGTCACAGATGTTGGATTGGTGCCAGAACTTGCGTCTGGATCCGACAGCCACTAACGGCTCGGAGCGGCACGTTTGTGAGCGCCACTTTGAGGCGCACTGCTTTAATGTTCATAAGTTGTTGCGACCGGGAGCACGACCCACACGCTACGTGGGTCACGAGGAGCTGAACGATTTGCTGCCGAATCCGACCAGCTGGAAACAGGATGCGCTCGTGTGCTGGGTGCCGCACTGCCGCCGCTCCTTAGATGCGGATGAGGTGCAGCTGTTCGGGCTGCCCAAGGTGCGTCACATAGCGGAGAAGTGGCTGAGTAATGTGCGTCTCGATCCCACTCGGGAGCAGCTGGCCAATGTGAAAATCTGCAGCGTACACTTTGAGAACAGGCTATTGGAGAGCGGACGTCCCTCGAGCGGTGCAATGCCCACGATCCTACTAGGTCACGATGAGCTGCACACAGTACACCGCAGCATAGAGGCGGCGCCAACACAACTGAAGCGCTACTGCAACAGAGATGGCGCCAGCCACGACTGCTGCTATCCGCAGTGTGTCGAACTGCAGAAGAGCTATCAGCGGGTCAGCTACGAGCTGCCCCAGGACCAGGCGCTGCGTAACGAGTGGCTCGAATACATGGGCCTGGACGAGCAGCAACATTTCGAGAAGAAGCAACAGCCGCCTAAGCTGTGTCCGCTCCATTTGATCCTGCTCTATGATCACAGTGTGGATAACTTTGAATCACACACGGCCGAGCAATTGCTGGACTCCTGCTATGAGGCAGCGCGCTCCAGCGTTCGCATACGTATTGTGAGCTGTGCGGTGCGTGGCTGCAGGACCCTTAAGCCTCGGGATGGAGGACGCCTGCATGGTTTGCCCACCCGCCGGGATGTGCTCGAGATGTGGCTGCACAACATGCAGCTGGTGTTCTACGAGCACCAGCGCTACATGTACAAGATCTGCGACAAGCACTTTGAGCCCAGCTGCCTGACGGAGACAACCAGGCGACTGAAGCCCTCGAGCATGCCAACACTGGAGTTGCCCGAACGTCAGCCGGGAGAAGCGCCTGCCTATCAGAATCCCACGGAGGCCGAGTGGCAGCAGATGACTGAGCTGCAGGCCAGCCAGGAAGTCGTCGAGGCGCAGATGGAGCCCATACCCATACTCAAGCTAGAAGAGGACCAGCCGCGGCTAAGGGAGTATGAAGAGAATGGCGACTACAATTCGCAGCAGCCACTGGAAATGCAGGCGCTGGAGGTGCTGCTCGAAGTGGGTCATGTCGAGAAGTGCACCACGTATGAGCAAATGGACACCAAACACAATGGCAGCTATACCGAGCAGCTCTCCTATGATTCCTTGGGACCAGCTCCCCAGCATGGACGCGGCGGCGTCATCGTGCAGAACGGGCTGCACTACAGCGCCCGCCACTGCAGCGTCCGTGGCTGCGATGTCACCTCGAATGATCTGAACGGCACCATTAAGCTGCACAAGTTTCCCACCTCACTGGATGCCATGCAAAAGTGGATGCACAACACCCAGGTGGATGTGGACACGAATTTCGCCTGGCGCTTTCGCATCTGCAGTCATCACTTTGATAAAGACTGCTTTAATGGCTCGCGCATCCGACGTGGTGCGATGCCCACGCGGCGTCTGGGTTCCCGTCGACCCGAGCTTATCTACGATAATGAGTTTAGCACGCAATGGCAGCTAGATCAGCCCAAGGCGGAGAAGCACAGTGAGCCGCTGGCAGCTCCGCTGgaatcgcagcagcagcagccgcagcagcagccgcagcgccagcctcagcctcagttGCTGTCTACTGATATAAGCCTGCGCCTGCCGCGTCCTGCCCATCCGCGCAAATCCAGCAAATTCTGTCAAATCGAGGGCTGCTCGAATCATTTGACCAGCGAGAATCTGACGCTGCACAAGTTCCCCCACTCGACGGACATGTGCGCCAAGTGGCAGCACAACACCCAGGTGCCGTTCGACCCGGAATTCCGCTGGCGCTATCGCATCTGCAGCGCACATTTTGAGCCATTCTGTCTGGGAAATATGCGTCTGATGCATGGCAGTGTGCCCACACTGAATCTGGGACCATTTGCGCCCAAGCagttatttgaaaatgatttcgCACTGATTAATATGCGGCTGGACAAGCAGAAGAGCGGCTCCGAGCAGAGTCTGCAAGTTAAGCAGGAGTTCGAGCAACTGGAACAGTTTGAAGtggaagatgatgatgatgatgatcaggAGCATGAGGATTTCAGTCTGCTGGTGccagagctgcagctgcacgaGGGTGGTAGCGATGAGGAACAGCAATATGACAATCAATATGCATACAACTGGagcgatcagcagcagcgtctgcCCGGCATTAAACAGGAAAACGGCACCAGCTTTAATCCAGTTAAGTCTGGCTATGACAAGTGCTCCCTGGTGCACTGCCAGCGGCAGCGTTCGCATCACGGCGTCCACATCTACAAGTTTCCGCGCtcgcggcagctgcagcagcgttgGATGCACAATTTGCGCATCCGTTACGATGAGCGGCGGCCCTGGAAGACAATGATATGCAGCGCGCACTTTGAGCCTAACTGCATTCGGCTGCGCAAATTGTGTCCCTGGGCGGTGCCCACGCTGGAGCTGGGCAACAATGTGCCGCTGGAGATTTTCACAAATGAGcaaagccagcagcagttTGCCCAGCTCGATGCAGGCAGCGAGGGTGATGAGCTCGAAGTTGATGTCGAGGATACCATGCTGGAAGACTTGGACGATGAATATGATGACAATGATACTGATAATGATGCTGATGGTGATGAGCTACTGCAGCCGACTCCAAAACATATCAAACGGGAGCGTCGCTCGCGTGATCCATTGCCGCCGGGTCAGCAGCCACCGTGGAAGATCAAGCTGTGTTGCTTGCCCTACTGCCGCAGTCCACGCGGCGATGGCATCAAGCTCTTCCGATTGCCCAACAATACCAGCTCCATACGCAAGTGGGAGCAGGCCACTGGCATGCGATTCTATGAGTCTCAACGCAACACAAAGCTCATCTGCAGTCGCCACTTCGATCCGCAGCTGATTGGCGTGCGACGCCTCATGTCCAATGCGGTGCCCACGCTTCATCTTGGCTCCGTCAGCGatgagttggagctggagctggaacgTGAGCTGGAGCCGGAGCTTCAGACCGTCGGGCCACGCTGCTGTATGCCCGATTGCCATCACGATGTGAATGACCAGTTGCACAAGTTTCCCAACGATCCAATGCTGCTGCATCAATGGTGCCAGGCACTGAATCTACCGGAtgttcaaagctattgcgataaacACATTTGTGCCGCTCACCTGCCCGACAATGCGCAGAGCTGCTTGATCTGCGGCGTGGACGATGTGCAGCTGCCAATGCTGGACTTTCCCGAGAATAGGAATCAGCGCACCAAGTGGTGCTACAATCTAAAAATCGAGCCAGTGCCTAAGTGGAACAATTCGAAGCACATCTGCTGCAAGCACTTTGAGAGCTACTGCTTCATCCAACCGGGTCAGTTGCTAGCGGAGGCGATGCCCACGCTGCATTTGAAGCATAGCGATAGCAACATATTCCTAAATGATTATGCCATGGACAGCAGCAAAATGTTGCCCATCAAGGACGAGCCCATGGAGAGCGATGATCTGATGCTGTAA
Protein Sequence: MSQQHNNPSHHQQQHHYYQQQQQQQQQLLQHKQIQQQQHNWYSHVASYPPPHPHAAAFAAPCKSSSNNNNNNNIMNAYGAGAGAYYGSTGAGGGGVGYNLEANTVAYAHNQLLQYQQQQQQQQQHQQQQQQLNHRSYMPPHSIMHGSYPYIKSEPLELPERHQQQQQQQQQQQQQQHFQNPMAPPPAPAITNRHSLDASGEMIIKSEPIDEHAFKSNYIDDNTPFADFSKYPEYGDNMLSPKVELNVKDEAYGNQKNPLNYPRRKLQTERSSESLPICQRCKEVFFKKQIYLRHVAESSCIIQEYEFKCNLCPMTFMGAEEQHKHKHLHRVDKFFCHKYCGKHFDTIAECESHEYMQHEYESFVCNMCSVTFATREQLYAHLPQHKFQQRFDCPICRLWYQTALELHEHRLAAPYFCGKYYAAAHQQQQQQQQQQQQQQQHPQQHPQQQGNYKLQDCHMGTIEMTPPHHKAAVALPATAALSSLLQQRQANADGAALYASALTKSEASVKLERSYSNSTSESGYSLHDSSYNNAYGSDSSLHGSGGIGGPQAHSSTLDESEDALCCVPLCGVRKSTSPTLQFFTFPKDDKYLHQWLHNLKMFHIPASSYASFRICSMHFPKRCINRYSLCYWAVPTFNLGHDDVANLYQNRELTNTFTTGEVARCSMPNCTSQRGESNLKFYNFPKDIKSLIKWCQNARLPVQAKEPRHFCSRHFEERCIGKFRLKPWAVPTLHLGAQYGKIHDNPKNLYVEEKRCCLNFCRRSRSSDFNMSLYRFPRDEVLLRRWCYNLRLDPAVYRGKNHKICSAHFIKEALGLRKLSPGAVPTLHLGHNDTFNIYENELWPPPTPSTPTHNTQQQVPQHQLQHQQQHVHHKYQRHSAASTSSSASSASHYVDPELSASYMSMGAGGSSSGLNVSDSMDVCCVPSCESKRHNNENITFHTIPRRPEQMRKWCHNLKIPEDKMHKGMRICSLHFEPYCIGGCMRPFAVPTLHLGHDDEDIHRNPDVIKKLNIRETCCVAVCKRNRDRDHANLHRFPSNVALLTKWCANLQRPVPDGTKLFNDAICEVHFEDRCLRNKRLEKWAVPTLVLGHENIPYPLPTPEQVAEFYARPSAPNNGDETGECCVETCKRNPSVDDIKLYRPPEETQVLSKWAHNLELEIAALPSLRICNLHFESHCIGKRMRPWAIPTLNLANNIENLYENPEHQMLYKRRTHLNPDRAAARANAGAAAGVKPTWVPRCCLSHCRKVRALHNVQLYRFPKLNRSTLAKWAHNLQVPMVGSAQRRLCSAHFEPHVLSKKCPVALAVPTLDLNTPSGYKIYQNPAKLKANKLCLQRVCIVDSCRRQRAQGVQLFRLPHSPTQLRKWMHNIRMRPRGAMRQQYRICSLHFETHSFNGKRLSAGAIPTLELGHEDEDIYPNEAQSFVEEHCTVEGCDASKEQPDVRLFRFPTDDEDLLWKWCNNLKMNPVDCIGVRICNRHFEADCIGPKHLFKWAIPTFCLGHDDDETELIPNPKPEERYVDPVFKCCVPTCGKTRKFDEVQMNSFPKDPALFQRWRHNLRLEHLSFKERERYKICNAHFEDICIGKTRLNIGSVPTLELGHDETDDLFQVNPEELQSNLFGRQRRVSIKQEAHSELDEDIKPDITMSEATDSNTTQVKIKKSLADFKCCVPSCGRSRLEHGARLFPFPTGKQQQSKWRHNLRLSAADVDKTTRVCSAHFNRRCIDGKQLRGWAMPTQQLGHQELPIYENPKNIPGFFTPTCALAHCRKRRSIDNDLRTYRYPRSEELLEKWRVNLRLAPDQCRGRICADHFETMVRGKLKLKTGAVPTLKLGHDEGVVFDNESIKAGMQQEEEDAEEEGDASLESLVKVKTEKQEEQPLENVDEEQEQGIDNDLDDGEGQEEEHDSEDHGYFDPLELVETFAEQHSDNSSAEDDNLDDDEDIPGDDDELLLPDTPHIPLLVLPRREKPVNNVTPICCLKHCRKERTAALQLSTFGFPKDQQLLLKWSANLQLPLEDCAGRVCIEHFEPEMLGTRKLKQNAVPTLKLGHVTPLTYSCNGRLLSAIYDAQPQHSVFRLWSLKHCRKRKPELAETKPKRRCCLASCGKQSELHGVQLRRLPRDRLMLRKWLHNLKLPPLMDCNQMFLCGDHFELDAPLPTLKLGHADTNIYRHNASGSSGSCLVPSCTCARLNLYRCYDLPEHPLVQQSWLHWLQLPHPQSTSHSQLCVMHYMQLFEQVPLPEELPSVVRRQLRETYDLIASSSMAMKLRCAVPGCYSKYTDNVRLTKLPVCPDTCAKWVHNTKIEYDPARHYIYRICMLHFEPRCLGPVRPKVWAMPTLALHHRDTNIHLNPMLDGTPTPSVPIELPLRIKTELPMCASPSASASASPSPRSKLRICCIPTCGQQAVGQTRLFRFPSTETALLKWLVNTQQQPRLVDAQRLYICQDHFEADAICKNQLRSWAVPTRKLGHDGHIIPNARHNGNIADSYENRQTLQFIWENYCSVLTCFQERSEQRRLYQYPTDRPTIRKWAANCKHRSMQASSDGFQVCQSHFAPDCFDPETGNLKEDAVPTLELSRTVTELRCVVNGCLKGEDAPRSRLFKMPKRTSQMLDWCQNLRLDPTATNGSERHVCERHFEAHCFNVHKLLRPGARPTRYVGHEELNDLLPNPTSWKQDALVCWVPHCRRSLDADEVQLFGLPKVRHIAEKWLSNVRLDPTREQLANVKICSVHFENRLLESGRPSSGAMPTILLGHDELHTVHRSIEAAPTQLKRYCNRDGASHDCCYPQCVELQKSYQRVSYELPQDQALRNEWLEYMGLDEQQHFEKKQQPPKLCPLHLILLYDHSVDNFESHTAEQLLDSCYEAARSSVRIRIVSCAVRGCRTLKPRDGGRLHGLPTRRDVLEMWLHNMQLVFYEHQRYMYKICDKHFEPSCLTETTRRLKPSSMPTLELPERQPGEAPAYQNPTEAEWQQMTELQASQEVVEAQMEPIPILKLEEDQPRLREYEENGDYNSQQPLEMQALEVLLEVGHVEKCTTYEQMDTKHNGSYTEQLSYDSLGPAPQHGRGGVIVQNGLHYSARHCSVRGCDVTSNDLNGTIKLHKFPTSLDAMQKWMHNTQVDVDTNFAWRFRICSHHFDKDCFNGSRIRRGAMPTRRLGSRRPELIYDNEFSTQWQLDQPKAEKHSEPLAAPLESQQQQPQQQPQRQPQPQLLSTDISLRLPRPAHPRKSSKFCQIEGCSNHLTSENLTLHKFPHSTDMCAKWQHNTQVPFDPEFRWRYRICSAHFEPFCLGNMRLMHGSVPTLNLGPFAPKQLFENDFALINMRLDKQKSGSEQSLQVKQEFEQLEQFEVEDDDDDDQEHEDFSLLVPELQLHEGGSDEEQQYDNQYAYNWSDQQQRLPGIKQENGTSFNPVKSGYDKCSLVHCQRQRSHHGVHIYKFPRSRQLQQRWMHNLRIRYDERRPWKTMICSAHFEPNCIRLRKLCPWAVPTLELGNNVPLEIFTNEQSQQQFAQLDAGSEGDELEVDVEDTMLEDLDDEYDDNDTDNDADGDELLQPTPKHIKRERRSRDPLPPGQQPPWKIKLCCLPYCRSPRGDGIKLFRLPNNTSSIRKWEQATGMRFYESQRNTKLICSRHFDPQLIGVRRLMSNAVPTLHLGSVSDELELELERELEPELQTVGPRCCMPDCHHDVNDQLHKFPNDPMLLHQWCQALNLPDVQSYCDKHICAAHLPDNAQSCLICGVDDVQLPMLDFPENRNQRTKWCYNLKIEPVPKWNNSKHICCKHFESYCFIQPGQLLAEAMPTLHLKHSDSNIFLNDYAMDSSKMLPIKDEPMESDDLML

Similar Transcription Factors

Sequence clustering based on sequence similarity using MMseqs2

100% Identity: iTF_00595971;
90% Identity: -
80% Identity: -