Basic Information

Insect: Drosophila robusta
Gene Symbol: -
Assembly: GCA_004143805.1
Location: SCDV01000407.1:25487-42470[+]

Transcription Factor Domain

TF Family: THAP
Domain: THAP domain
PFAM: PF05485
TF Group: Zinc-Coordinating Group
Description: The THAP domain is a putative DNA-binding domain (DBD) and probably also binds a zinc ion. It features the conserved C2CH architecture (consensus sequence: Cys - 2-4 residues - Cys - 35-50 residues - Cys - 2 residues - His). Other universal features include the location of the domain at the N-termini of proteins, its size of about 90 residues, a C-terminal AVPTIF box and several other conserved residues. Orthologues of the human THAP domain have been identified in other vertebrates and probably worms and flies, but not in other eukaryotes or any prokaryotes [1].
Hmmscan Out: # of c-Evalue i-Evalue score bias hmm coord from hmm coord to ali coord from ali coord to env coord from env coord to acc

1 28 3.8 1e+04 -2.1 2.3 49 62 349 366 330 382 0.57

2 28 5e-15 1.4e-11 45.6 4.3 1 86 576 648 576 649 0.85

3 28 3.1e-15 8.4e-12 46.3 4.6 1 87 676 745 676 745 0.83

4 28 7.5e-16 2e-12 48.2 0.4 1 87 767 839 767 839 0.85

5 28 7.2e-16 2e-12 48.3 5.9 1 87 941 1011 941 1011 0.82

6 28 6e-15 1.6e-11 45.3 3.2 1 86 1035 1106 1035 1107 0.82

7 28 2.5e-12 6.7e-09 37.0 0.6 1 87 1142 1210 1142 1210 0.80

8 28 4.8e-11 1.3e-07 32.8 1.4 1 86 1258 1327 1258 1328 0.77

9 28 2.2e-16 5.9e-13 50.0 0.2 1 86 1355 1424 1355 1425 0.82

10 28 4.7e-13 1.3e-09 39.3 0.8 1 86 1446 1515 1446 1516 0.81

11 28 5.3e-15 1.4e-11 45.5 1.3 1 86 1543 1614 1543 1615 0.85

12 28 4.8e-13 1.3e-09 39.2 0.5 1 85 1694 1762 1694 1764 0.82

13 28 5.3e-11 1.4e-07 32.7 0.1 1 87 1787 1856 1787 1856 0.80

14 28 6e-13 1.6e-09 38.9 1.7 1 87 2040 2109 2040 2109 0.81

15 28 0.00026 0.71 11.3 0.4 1 58 2188 2238 2181 2254 0.80

16 28 3e-12 8.1e-09 36.7 0.2 1 86 2277 2346 2277 2347 0.85

17 28 1.2e-13 3.2e-10 41.2 0.2 1 86 2409 2478 2409 2479 0.82

18 28 1.2e-11 3.2e-08 34.8 0.4 1 86 2514 2585 2514 2586 0.81

19 28 2.1e-12 5.7e-09 37.2 0.1 1 87 2596 2670 2596 2670 0.83

20 28 2.7e-13 7.4e-10 40.0 0.1 1 85 2691 2763 2691 2765 0.80

21 28 9.2e-05 0.25 12.7 0.0 1 60 2800 2853 2800 2874 0.79

22 28 1.3e-15 3.4e-12 47.5 2.0 1 86 2890 2962 2890 2963 0.83

23 28 2.1e-15 5.7e-12 46.8 1.6 1 86 3091 3163 3091 3164 0.81

24 28 5.3e-14 1.4e-10 42.3 1.6 1 86 3230 3300 3230 3301 0.81

25 28 5.8e-15 1.6e-11 45.4 4.3 1 87 3398 3469 3398 3469 0.85

26 28 3.6e-13 9.8e-10 39.6 0.0 1 87 3552 3622 3552 3622 0.83

27 28 8.6e-09 2.3e-05 25.6 0.7 1 58 3648 3696 3648 3710 0.86

28 28 4.5e-08 0.00012 23.3 2.0 18 86 3713 3770 3702 3771 0.73

#	of	c-Evalue	i-Evalue	score	bias	hmm coord from	hmm coord to	ali coord from	ali coord to	env coord from	env coord to	acc
1	28	3.8	1e+04	-2.1	2.3	49	62	349	366	330	382	0.57
2	28	5e-15	1.4e-11	45.6	4.3	1	86	576	648	576	649	0.85
3	28	3.1e-15	8.4e-12	46.3	4.6	1	87	676	745	676	745	0.83
4	28	7.5e-16	2e-12	48.2	0.4	1	87	767	839	767	839	0.85
5	28	7.2e-16	2e-12	48.3	5.9	1	87	941	1011	941	1011	0.82
6	28	6e-15	1.6e-11	45.3	3.2	1	86	1035	1106	1035	1107	0.82
7	28	2.5e-12	6.7e-09	37.0	0.6	1	87	1142	1210	1142	1210	0.80
8	28	4.8e-11	1.3e-07	32.8	1.4	1	86	1258	1327	1258	1328	0.77
9	28	2.2e-16	5.9e-13	50.0	0.2	1	86	1355	1424	1355	1425	0.82
10	28	4.7e-13	1.3e-09	39.3	0.8	1	86	1446	1515	1446	1516	0.81
11	28	5.3e-15	1.4e-11	45.5	1.3	1	86	1543	1614	1543	1615	0.85
12	28	4.8e-13	1.3e-09	39.2	0.5	1	85	1694	1762	1694	1764	0.82
13	28	5.3e-11	1.4e-07	32.7	0.1	1	87	1787	1856	1787	1856	0.80
14	28	6e-13	1.6e-09	38.9	1.7	1	87	2040	2109	2040	2109	0.81
15	28	0.00026	0.71	11.3	0.4	1	58	2188	2238	2181	2254	0.80
16	28	3e-12	8.1e-09	36.7	0.2	1	86	2277	2346	2277	2347	0.85
17	28	1.2e-13	3.2e-10	41.2	0.2	1	86	2409	2478	2409	2479	0.82
18	28	1.2e-11	3.2e-08	34.8	0.4	1	86	2514	2585	2514	2586	0.81
19	28	2.1e-12	5.7e-09	37.2	0.1	1	87	2596	2670	2596	2670	0.83
20	28	2.7e-13	7.4e-10	40.0	0.1	1	85	2691	2763	2691	2765	0.80
21	28	9.2e-05	0.25	12.7	0.0	1	60	2800	2853	2800	2874	0.79
22	28	1.3e-15	3.4e-12	47.5	2.0	1	86	2890	2962	2890	2963	0.83
23	28	2.1e-15	5.7e-12	46.8	1.6	1	86	3091	3163	3091	3164	0.81
24	28	5.3e-14	1.4e-10	42.3	1.6	1	86	3230	3300	3230	3301	0.81
25	28	5.8e-15	1.6e-11	45.4	4.3	1	87	3398	3469	3398	3469	0.85
26	28	3.6e-13	9.8e-10	39.6	0.0	1	87	3552	3622	3552	3622	0.83
27	28	8.6e-09	2.3e-05	25.6	0.7	1	58	3648	3696	3648	3710	0.86
28	28	4.5e-08	0.00012	23.3	2.0	18	86	3713	3770	3702	3771	0.73

Sequence Information

Coding Sequence: ATGTCACAACACAACATTAATCCGCATTCGCATCatcttcaacaacaacaacaacatcagctctactatcagcagcagcagcacttacaacataaacaaatacaacagccgcaacaacaacaacatcagcagcagcagccgcagcacagTTGGTACTCACATGTTGCTTCCTACCCGCCCCACCACCAGCCCCATGCGGGCGCTGCCTTTGCGCAGCCCTGcaagaccaacaacaacaacagcagcaacagccacaacaacaacattatgaATGCATACGGCAatgcaggagctgctgctgctgttgctgctgctggcacgcACTATTATggcgctgcgactgcgactgcggcaggGGTGGGCTATAACCTTGAGGCGAACACTGTGGCCTATGCGCACAACCAGCTGCtgcaataccaacaacaacagcagcagcagcaacaacaacagcaacagcagctcagTCAACGCGCTTATATGCCGCACAGCCTAATGCACGGCTCGTATCCCTACATTAAAAGCGAGCCTTTGGAGCTGCCCGATGATAGACAAcgtcatcagcagcagcagcagcaacaaattttccaGAATCCTATGGCACCGCCGCCAGCACCCGCCGCCAATCGTCATACGCTCGATGCCAGCGGcgaaatgataataaaatCGGAGCCCATTGACGAACATGCGTTCAAGTCCAACTATATCGATGATAATACGCCCTTTGCCGATTTTAGTAAATTTCCCGAATTCGGCGACGACATGTTGAGCCCCAAGGTGGAGCTAACGGTCAAGGATGAGGCCTACGGCAACCAAAAGAACCCGCTCAACTATCCGCGCCGCAAGCTGCAAACGGATCGCTCCGCGGAGAGCCTGCCCATCTGCCAGCGCTGCAAGGAGGTGTTCTTCAAGAAGCAGGTCTACCTGCGCCATGTGGCcgagagcagctgcagcatacACGAGTACGAGTTCAAGTGCAACATCTGCCCCATGTCCTTCACGGGCGTCGAGGAGCTGCAGAAGCACAAGCAGCTGCACCGCGCCGACAAGTTCTTCTGCCACAAATACTGTGGCAAGCACTTCGACACCATTGCCGAGTGCGAGTCGCATGAGTACATGCAGCACGAATACGATAGCTTTGTGTGCAACATGTGCTCGATGACGTTCGCGACGCGGGAACAGCTCTACGCCCATCTGCCGCAGCACAAGTTTCAGCAGCGCTACGACTGCCCCATCTGTCGGCTGTGGTACCAAACGGCGCTGGAGCTGCACGAGCATCGGCTGGCGGCGCCCTACTTCTGTGGCAAGTATTATGCAGCtgcacatcagcagcagcagcaacagcagcagcagcaacagcagcaacatccacAGCAGTCGCAGGGCAACTACAAGCTGCAGGACTGCCACATGGGCACCATTGAAATGACACCGTCGCACCACAAGGCAACCACGCTGCCGGCAACGGCGGCGCTCAGTtccctgctgcagcagcgccaggcgAATGCCGACGGCGCCGCCCTGTACGCCTCGTCGCTGAAGAGCGAGGCGAGCGTGAAGCTGGAGCGCAGCTACAGCAACTCCACCAGCGAGTCCGGCTACAGTCTGCACGAGAGCAGCGGCTACAACAATGCCTACGGCAGCGACAATTCCCTGCATGGCGGCGGCGCCGCAATTGGTGGTCCCCAGGCGCACTCCTCCACGCTGGACGAATCGGAGGATGCGCTGTGCTGTGTGCCGCTGTGCGGTGTGCGCAAGAGCACCAGCCCGACGCTGCAGTTCTTCACGTTTCCCAAGGACGAGAAATATCTGCACCAGTGGCTGCACAACCTCAAGATGTTCCACATTCCGGCCTCGAGCTATGCGAGCTTTCGCATCTGCAGCATGCACTTTCCCAAACGCTGCATCAATCGCTACTCGCTGTGCTATTGGGCGGTGCCCACGTTCAATCTGGGGCACGACGATGTCGCCAATCTGTATCAGAACCGGGAGCTGACCAACACCTTCACCACCGGCGAGGTGGCGCGCTGCAGCATGCCCAACTGCACCAGCCAGCGCGGCGAGAGCAATCTCAAGTTCTACAACTTTCCCAAGGACATTAAGAGCCTGATCAAATGGTGCCAGAACGCCCGCCTGCCCGTCCAGGCCAAGGAGCCGCGTCACTTCTGCAGCCGTCACTTCGAGGAGCGCTGCATCGGCAAGTTCCGGCTGAAGCCCTGGGCTGTGCCCACCCTCCATCTGGGCGCCCAGTACGGCAAGATCCATGACAATCCCAAGAACCTCTACGTGGAGGAGAAGCGCTGCTGCCTCAACTTCTGTCGACGCAGCCGCTCCTCGGACTTTAACATGTCGCTCTATCGCTTCCCCCGGGACGAGGTGCTGCTGCGACGCTGGTGCTACAATCTGCGGCTCGATCCGGCCGTCTATCGGGGCAAGAACCACAAAATATGCAGCGCTCACTTCATCAAGGAGGCTCTGGGACTGCGCAAACTGTCTCCGGGCGCTGTGCCCACGCTGCATCTGGGCCACAACGACACCTTCAACATCTACGAGAACGAGCTgtggccgccgccgacgccctCGACGCCCACCCACaatcaccagcagcaactgcagcagcagcagcatcagttgcagcagccgcagcagcatcagcagcagcagcaaccacatgTGCATCACAAATATCAGCGGCACTCGGCCGCATCCACATCCTCGTCGGCCAGCTCGGCCTCGCACTATGTGGACCCGGAGCTGAGCGCATCCTATATGGGCATGGGCGCCGCGGCCGGCGGCCTCAATGTCAGCGACAGCATGGATCTGTGCTGTGTGCCCAGCTGCGAGAGCAAGCGgcacaacaacgagaacatcACATTCCACACGATACCCAGGCGGCCGGAACAGATGCGCAAGTGGTGCCACAATCTGAAGATACCCGAGGAGAAGATGCACAAGGGCATGCGCATCTGTAGCCTGCACTTTGAGCCCTACTGCATTGGCGGCTGCATGCGTCCGTTTGCGGTGCCGACGCTGCATCTGGGCCACGACGACGAGGACATCCATCGCAATCCGGACGTCATCAAGAAGCTGAACATACGCGAAACGTGCTGCGTGGCCGTCTGCAAGCGCAACCGGGACCGCGATCACGCCAATCTCCATCGCTTCCCCAGCAACATCGCCCTGCTGACCAAGTGGTGCGCCAATCTGCAGCGACCCGTGCCGGATGGCAGCAAGCTCTTCAACGATGCCATCTGCGAGGTGCACTTCGAGGAGCGCTGTCTGCGCAACAAGCGCCTGGAGAAGTGGGCGGTGCCGACGCTCATCCTCGGCCACGAGAACATCGCCTATCCGCTGCCCAGCGCCGAGCAGGTGGCCGAGTTCTATGCACGGCCCAGTGCGCCCAACAATGGCGAGGAGCAGGGCGAGTGCTGTGTGGAGAGCTGCAGGCGCAATCCGAGCGTCGACGACATCAAGCTCTATCGGCCGCCCGAGGAGTCGCAGGTGCTCACCAAGTGGGCGCACAATCTCCAGCTGGACGTCGCCCAGCTGCCCGGCCTGCGCATCTGCAATCTGCACTTTGAGTCCCATTGCATTGGCAAGCGCATGCGGCCCTGGGCCATACCCACGCTCAATCTGGCCGCCAACATTGAGAATCTCTTCGAGAATCCCGAGCACCAGATGCTCTACAAGCGGCGCACGCACCACCAGGCGAGCGGCCgtggcgccggcggcagcggcggcgctggcTCCATCAAGCCGACGTGGGTGCCGCGCTGCTGCCTGCCGCACTGCCGCAAGGTGCGCGCCCTGCACAACGTCCAGCTGTATCGCTTCCCCAAGCTCAATCGCGCCACGCTCGCCAAGTGGGCGCACAATCTGCAGGTGCCGCCCGTGGGCAGTGCCCAGCGACGCCTCTGCTCCGCCCACTTTGAGCCGCACGTGCTGAGCAAGAAGTGCCCGGTGCCGTTGGCGGTGCCCACGCTCGATCTGAACACGCCGCCCGGCTACAAGATCTACCAGAATCCCGCCAAGCTGAAGGCCAACAAGCTGTGCCTGCAGCGCGTCTGCATCGTCGAGAGCTGCCGGCGGCAGCGGGCGCAGGGCGTGCAGCTCTTCCGGCTGCCGCACAGCCCCACCCAGCTGCGCAAGTGGATGCACAACATCCGGATGCGGCCGCGCGGCGCCATGCGCCAACAGTATCGCATCTGTTCGCTGCACTTCGAGACGCACTCGTTCAACGGCAAGCGGCTGAGCACGGGCGCCATTCCGACGCTGGAGCTGGGCCACCACGACGACGACATCTATCCGAACGAGGCGCAGTCCTTCGTCGAGGAGCACTGCACCGTCGAGGGCTGCGACGCGGCCAAGGAGCAGCCGGACGTGCGCCTCTTCCGCTTCCCCAGCGACGACGAGGATCTGCTGTGGAAGTGGTGCAACAATCTGAAAATGAATCCCGTCGACTGCATCGGCGTCCGGATCTGCAATCGACACTTCGAGCCGGACTGCATTGGGCCCAAGCATCTGTACAAGTGGGCGATACCGACGCTGGCGCTGGGCCACGACGACGGCCAGATCGAGCTGATACCGAATCCGCGGCCGGAGGAGCGCTACGTCGATCCCGTGTTCAAGTGCTGTGTGCCCACCTGCGGCAAGACGCGCAAATTCGACGAGGTCCAGATGAACAGCTTCCCCAAGGACGCGACGCTCTTCGAGCGCTGGCGCCACAATCTCCGCCTGGCGCACCTCAACTTCAAGGAGCGCGAGCGCTACAAGATCTGCAATGCGCACTTCGAGGACATCTGCATTGGCAAGACGCGGCTCAACATCGGCGCCATACCGACGCTGCAGCTGGGCCACGACGAGACCGAGGACTTGTTCGAGGTCAATCCCGACGAGCTGCAGAGCAATCTGTTTGGCCGCCAGCGACGCATCCGCGACAGCCAGCGCCTGCGCCCGAGGAtcaagcaggagcaggaggaggcggaggaggaggaggaggcggaggaggaagaggaggaTGACGACGACATCGTTGTCAACAGCGCACAGCACAAGAACAAGCGATCCCCGCAGGAGCTCAGGTGCTGCGTGGCGAGCTGCGGCCGCGGTCGCGCCGAGCACGGCGCCCGGCTCTTTCCCTTTCCCAgcggcaagcagcagcagagcaagTGGCGCCACAATCTGCGCCTCAGcgccgccgacgtcgacgGATCGACGCGCGTCTGCAGCGCGCACTTCAATCGCCGCTGCATCGACGGCAAGCAGCTGCGCGGCTGGGCAATGCCCACCCAGCAGCTGGGCCACGCGGAGCAGCCCATCTACGAGAATCCAAAGAACATACCGGGCTTCTTTACGCCCACGTGCGCCCTGGCGCACTGTCGCAAGCGGCGCAGCATCGACAACGATCTGCGCACGTATCGGTATCCGCGCAGCGCGGATCTGCTCGAGAAGTGGCGCATCAATCTGTGCCTGGCGCCGGATCAGTGTCGCGGCCGCATCTGTGCGGACCACTTTGAGCCCATGGTGCGCGGCAAGCTGAAGCTGCGGACGGGCGCGGTGCCCACGCTGAATCTGGGCCACGACGAGGACGTGGTGTTCGACAACGAGGCCATCAAGGCGGGACTGCAGCaggaggagggggaggaggaggaggccaGTCTGGCGGAGCTGGTCCAGGTGAAGAGCGAGCAAATGGAAGAGGAGCCAGAAGATGATAATGAAGAGGAGCAGGAGGGGGAggcggagcaggagcaggaagAGCAGGAGGCGGAAGAGGAGCCTGATGAGATTGCTGCAGAGGCGTCGCTTGGCGCTGACGTTGAGGATGAGGAGGAGCGCCAGCaacaggaggaggaggaggacgaggatcATGGCTACTTCGATCCCCTGGAGCTCGTCGAAACCTTTGCCGAGCAGCACAGCGACGACAACTCCgccgaagacgacgacgatgactaCGGCAATGATGACaatgaggatgatgatgatgaggatgaggatgaggatggCGATATACCCGGCAACGAcgatgagctgctgctgccggacaCCGTGCCCATCAAGCTGgaggcgctgccgccgccccgCCGCGAGAAGGCCGTGAACAACGTGACGCCCATCTGCTGCCTGAAGCACTGTCGCAAGGAGCGCACGGCCAGCCACCAGCTGAGCACCTTCGGCTTCCCCAagcaccgccagcagctggTCAAGTGGAGCGCCAacctgcagctgccgctgccggacTGCGTCGGCCGCGTCTGCATCGAGCACTTCGAGCCGGCGGTCCTCGGCACGCGCAAGCTCAAGCAGAACGCGGTGCCGACTCTGAATCTGGGCCACGGAGCGCCGCTCGCCTACGGCTGCAGCGGCCAGCCGGTGGCCATCTACGATGCCCAGCCGCAGCATTCGGTTTTTCGGCTTTCGAGCCTGAAACACTGCCGCAAAAGGAAGCCGACGACGGTGGAcatgacgccgccgccgccggatcTGGCGCCGAGTAAGCGCAGCCGGCTGCCCGGCGAGGAGCAGCGGACGGAGGCCAGCGTTTATCggtgcaacaacagctgcctgGTGCCCAGCTGTCCGTGTGCGCGGCTCAATCTCTATCGCTGCTACGATCTGCCCGAGCATCCGGCCGTGCAGCAGGCCTGGCTCGACTGGCTGCacctgccccgcccccagctggccagccacgcccagctgTGCGTGATGCACTTCATGCAGCTGTTCGAACAGGTGCCGCTGCCCCCGGAGCTGCCGACGCTCGCGCTGCGCCGCCTCCGCGACACGTACGAGCTGATCGCCGGCTCCTCGATGGCCATGAAGCTGCGCTGCGCGGTGCCCGGCTGCTACTCCAAGTACACGGACAACGTGCGGCTGACCAAGCTGCCGATGTGCCCGGAGCTGAGCGCCAAGTGGGTGCACAACACCAAGATCTGCTACGAGCACGGACGCCGCTACGCCTATCGCATCTGCATGCTGCACTTTGAGCCGGACAGCCTCGGTCCGGTGCGTCCGAAGCCGTGGGCGGTGCCCACGCTCCGGCTCAACCACACGGACGACGACATCTACCACAATCcggcgcagccgccgccggaCGTCGTCGAGGCGGCATCCGTGCCGCtcgagctgccgctgcgcatCAAGACGGACCTGCCGCCCGCCCTCAGCATCAGCCCCAgcgtcagcgccagcgccagtcCCAGTCCGCGCGGCAAGCTGCGCACCTGCTGCATCCCCGGCTGCGGCCAGCAGGCGAACGCCCTCACCCGGCTCTACCGCTTCCCCAGCGCCGAGACGACGCTGCTCAAGTGGCTGGTGaacacgcagcagcagccgcgccTGGTCGATCCCCTCTCTCTGTTCGTCTGCCAGGCGCACTTCGAGCCGGAGGCCatctgccagcagcagctgcgcagctGGGCGCTGCCCACGCTCCGGCTGGGCCACGACGGCCACGTCATCCCGAACGCCAAGCACAACGGCAACATCGCCGACGGCCAGGCCAACcggctggcgctgcagcacaTCTGGGCCAACTACTGCTCCGTGCTCAGCTGCTTCCAGCGGCGCAGCGAGCAGCTGCGTCTCTTCGCCTATCCCACGGACCGGCCCGCCATCCGCCGCTGGGCGGCCAACTGCAAGCACCGCTCCATGCAGGCCAGCAGCGACGGCTTTCAGGTCTGCCAGCTGCACTTTGCGCCGGACTGCTTTGATCCGGCGACGGGCGAGCTGACGGCGGAGGCGGTGCCCACGCTGGAGCTGAGCCGGGCCGTGCCCGAGCTGCGCTGCGTGGTCAGCGGCTGCAACCTGGGCCGCGGCGAGGACGCGACGCGCCGCCGCCTGTTCCGCATGCCCAAGCGCAGCGCGCAGCTGGACGACTGGTGCCACAATCTGCGCCTGGACGCGGCCGCGCTGAGCGGCCAGGAGCCGCACGTGTGCGAGCGCCACTTCGAGGCGAACTGCTTCAGTCTGCAGAAGCTGCTGCGCGTGGGCGCGCGGCCCACGCTGCACCTGGGCCACGACGAGCCGCTCCGGCCGAATCCGGCCTGCTGGGAGGAGGAGGCGCTCGTCTGCTGTGTGCCCCGCTGCGGGCGCGCCAagagcgacgacgacgacgacgatgtcCAGCTGTTCGGGCTGCCCTATCTGCGCGTGCACCTCGAGAAGTGGCTGCACAATCTGCGCATCGAGCCGAGCCGGGAACAGCTGCACGGTCTGCGCGTCTGCAGCGTGCACTTCGAGCCCGCCTGCATGGAGAACGGACGTCCGCACCTGGGCGCCATGCCCACGCGCCATCTGGGTCACGACGACCTCGAGGGCATACACCAGAACCCCGAGCCGCCGTCCGGCGCACTGAAGGCGGCGGCCAAGCAGGCGCGGCTGGCGAGCAGCCTGGACTGCTGCTATCCGCAGTGCGTCGAGCTGCAGAAGAGCTATCAGCGGATCACGTACGAGCTGCCCCGGCGGGCGGCGCTGCGCGATCTCTGGCTGGCGTATCTGGGCCTcgaccagctgctggccagccaGGCGCCCAAGCTCTGTCCGCTGCACCTGATCGAGCTGTACGAGCACAGCGAGGAGCACTTCGAGCAGTGCGCCGGCGAGGAGCCGCTGCTGGACGCCAACTATGAGGCGGCGCGCAGCAGCGTCCGGATCCGGGTGGTCAGCTGCGCGGTGCGCGGCTGCAAGACGCTGAAGCCGCGCGATCCGCAGCGGCTGCACTCGCTGCCCACGCGGCGCGACGTGTTCGAGATGTGGGTGGAGAACATGCAGCTGGTGTACAACGAACAGCAGCGGTACATGTACAAGGTGTGCAGCCGGCACTTCGAGCCCTGCTGCCAGTCGGAGACGGCGCGCCGGCTGAAGCCCTGGAGCGTGCCGACGCTGGAGCTGCCGGCACGCGGGCCGGACGCGGCGCCTGTGTACGCCAATCCCACGGAGGCGGAGTGGCAGCGCATGACGGAGCAACTGGCCGTCGGCGAAGCGCAGCTGGAGCCGCTGGTGGCGGCGCCCGATCCCGTCAAGCTGGAGCCGAAGCTGGAGCCGAAGCGGGAGCCGGAGTGCGAGGCCAGCGCACAGCAGCCGCTGGAAATGGGCCCGCTGGAGGTGCTGCTCGAGGTGGGACGCGTTGTCAAGTGCACCACGTACGAGCAGATGAACACCAAGCCGAGCATCGAGTATGCTCCGTACGCCGTTCAGGCCGCACGGCGGGCCCGCTCGCTGAGCAGCGACTCCGGCGGCAGCATCGGTGGCCAGCACAGTGGACGCTTCTGTTGCGTGCGCGGCTGCGAGGTGACGTCCAAGGATCTGAGCGGCAGCGTCAAGCTGCACATGTTTCCGACGGCGCCGGACGTGCTGCACAAGTGGATGCACAACACCCAGGTGCACGTGGACAGCCGCGTGCCCTGGCGCTTCCGCATCTGCAGCCACCACTTTGCGGCCAAGTGCTTCACCGGCATGCGCATGCGACGTGGCGCCGTGCCCACGCTGCGCCTCGGACCGCGCTGTCCGGCGCACATCTACGACAACGAGGATCTGCCGCCGGATCAGCCGCTGTCGGACACGGATCAGCCGCACGAGCCGCTCGCCATTGTGGCGGTGGCcagcgagcagcagccggcgacGCCGGTGGGCGAGATCAGCCTGCGGCTGCCGTGTCCGGCACCGCCGCGCAAGTCGAGCAAGTTCTGCCAGATCGACGGCTGCTCCAATCATCTGACCAGCGAGAATCTGACGCTGCACAAGTTCCCGCACTCGGCGGACATGTGCGCCAAGTGGCAGCACAACACCCAGGTGCCGTTCGATCCGGAGTACCGCTGGCGCTACCGCATCTGCAGCGCCCACTTCGAGCGCGTCTGCCTGGGCAACATACGGCTGATGCACGGCAGCGTGCCCACGCTGCGCCTGGGTCCCCGGGCGCCCAAGCAGCTGTTCGGCAACGACTTTGCCACGATCAACATGCGCCTGgacaaggagaaggagaagcgCTGCGTCGAGCAGAGCCTGTGGGTCAAGCAGGAGCCGTTCGACGAGGATCAGGAGGATCTGAGCCTGCTGGTgccggagctgcagctgcacgaGGACGACGACACCGGCGACCACAACAGCGGCTGGCGCGACGAGCTGCGTCTGGCCGGCGTCGGGCAGGAGAAGGGCGCCAGCTACAATCCGGTCAAGTCCGGCTACGACAAGTGCTCCCTGGTGCactgccagcgccagcgctcGCAGCACGGCGTCCATATCTACAAGTTTCCGCGCtcgcgccagctgcagcagcgctggATGCACAACTTGCGCATCCGGTACGACGAGCGGCGGCCCTGGAAGACGATGATCTGCAGCGTGCACTTCGAGCCGCAGTGCATACGGCTGCGCAAGCTGCGTCCGTGGGCGGTGCCCACGCTGCACCTGGGCGACAATGTGCCCCAGCAGCTGTTCACCAACGAgcaggcggaggcggaggcgggcAGCGAGGAGGAGCCGGAGATGGACGTCTTGGAGGAgcgggaggaggaggaggaggacgacgacgacgcggcGGAGTTCGATGACGATGCCGAGCAACTGGCGCCCGAGCCGCACGCGAAGAAGGAGCGTCGCTCGCAAGCCGATCCGCTGCCGCCGGGCCAGCTGCCGCCGTGGAAGATCAAGATGTGCTGCCTGCCCTACTGCCGCAGTCCGCGCGGCGACGGCATCAAGCTATTCCGGCTGCCGAACAACATCGCCGCCATACGCAAGTGGGAGCAGGCCACGGGCATGCGCTTCTACGAGTCGCAGCGCAACACGAAGCTCATCTGCAGCCGGCACTTTGATCCGCTGCTCATCGGCGTGCGCCGGCTCATGTCGAATGCGGTGCCGACGCTCAACCTGGGCCCCAGCAGCGCGGAGCCGGAGCCCGAGCCGGAGCCCGagtcggagccggagccagtGGCCAGTCCGCAGTGCTGCATGCCCGACTGCCGTCAGGAGCCGGATATCAAGCTGCACAAGTTTCCCAGCGAGCCAATGCTGCTGCATCAGTGGTGCCAGGCGCTGGATCTGCCGGAGGTGCAACGCTACGCCGACAAGCACATCTGCGACGCCCACCTGCCCGCCCGGGCGCTCAGCTGCCTCATCTGCGGCGTCGAGGATGTGCAGCTGCCGATGCTGGAGTTCCCCGAGAATCGCAACCAGCGCGTCAAATGGTGCTACAATCTCAAAATCGAGCCCATACCCAAGTGGGACAACTCGAAGCACATCTGCTGCAAGCACTTCGAGAGCCATTGCTTCGTGCGGCCGGGTCGCCCGCTGGCCGACGCGATGCCCACGCTGGAGCTGGGCCACAACGACACCAACATATTCCTCAACGATTATGCCATTGAGAACCGCAAGCTGCTGAGCGTCAAGGACGAGCCCGTCGAGTGCGAGGACCTGACGCTGTAA
Protein Sequence: MSQHNINPHSHHLQQQQQHQLYYQQQQHLQHKQIQQPQQQQHQQQQPQHSWYSHVASYPPHHQPHAGAAFAQPCKTNNNNSSNSHNNNIMNAYGNAGAAAAVAAAGTHYYGAATATAAGVGYNLEANTVAYAHNQLLQYQQQQQQQQQQQQQQLSQRAYMPHSLMHGSYPYIKSEPLELPDDRQRHQQQQQQQIFQNPMAPPPAPAANRHTLDASGEMIIKSEPIDEHAFKSNYIDDNTPFADFSKFPEFGDDMLSPKVELTVKDEAYGNQKNPLNYPRRKLQTDRSAESLPICQRCKEVFFKKQVYLRHVAESSCSIHEYEFKCNICPMSFTGVEELQKHKQLHRADKFFCHKYCGKHFDTIAECESHEYMQHEYDSFVCNMCSMTFATREQLYAHLPQHKFQQRYDCPICRLWYQTALELHEHRLAAPYFCGKYYAAAHQQQQQQQQQQQQQHPQQSQGNYKLQDCHMGTIEMTPSHHKATTLPATAALSSLLQQRQANADGAALYASSLKSEASVKLERSYSNSTSESGYSLHESSGYNNAYGSDNSLHGGGAAIGGPQAHSSTLDESEDALCCVPLCGVRKSTSPTLQFFTFPKDEKYLHQWLHNLKMFHIPASSYASFRICSMHFPKRCINRYSLCYWAVPTFNLGHDDVANLYQNRELTNTFTTGEVARCSMPNCTSQRGESNLKFYNFPKDIKSLIKWCQNARLPVQAKEPRHFCSRHFEERCIGKFRLKPWAVPTLHLGAQYGKIHDNPKNLYVEEKRCCLNFCRRSRSSDFNMSLYRFPRDEVLLRRWCYNLRLDPAVYRGKNHKICSAHFIKEALGLRKLSPGAVPTLHLGHNDTFNIYENELWPPPTPSTPTHNHQQQLQQQQHQLQQPQQHQQQQQPHVHHKYQRHSAASTSSSASSASHYVDPELSASYMGMGAAAGGLNVSDSMDLCCVPSCESKRHNNENITFHTIPRRPEQMRKWCHNLKIPEEKMHKGMRICSLHFEPYCIGGCMRPFAVPTLHLGHDDEDIHRNPDVIKKLNIRETCCVAVCKRNRDRDHANLHRFPSNIALLTKWCANLQRPVPDGSKLFNDAICEVHFEERCLRNKRLEKWAVPTLILGHENIAYPLPSAEQVAEFYARPSAPNNGEEQGECCVESCRRNPSVDDIKLYRPPEESQVLTKWAHNLQLDVAQLPGLRICNLHFESHCIGKRMRPWAIPTLNLAANIENLFENPEHQMLYKRRTHHQASGRGAGGSGGAGSIKPTWVPRCCLPHCRKVRALHNVQLYRFPKLNRATLAKWAHNLQVPPVGSAQRRLCSAHFEPHVLSKKCPVPLAVPTLDLNTPPGYKIYQNPAKLKANKLCLQRVCIVESCRRQRAQGVQLFRLPHSPTQLRKWMHNIRMRPRGAMRQQYRICSLHFETHSFNGKRLSTGAIPTLELGHHDDDIYPNEAQSFVEEHCTVEGCDAAKEQPDVRLFRFPSDDEDLLWKWCNNLKMNPVDCIGVRICNRHFEPDCIGPKHLYKWAIPTLALGHDDGQIELIPNPRPEERYVDPVFKCCVPTCGKTRKFDEVQMNSFPKDATLFERWRHNLRLAHLNFKERERYKICNAHFEDICIGKTRLNIGAIPTLQLGHDETEDLFEVNPDELQSNLFGRQRRIRDSQRLRPRIKQEQEEAEEEEEAEEEEEDDDDIVVNSAQHKNKRSPQELRCCVASCGRGRAEHGARLFPFPSGKQQQSKWRHNLRLSAADVDGSTRVCSAHFNRRCIDGKQLRGWAMPTQQLGHAEQPIYENPKNIPGFFTPTCALAHCRKRRSIDNDLRTYRYPRSADLLEKWRINLCLAPDQCRGRICADHFEPMVRGKLKLRTGAVPTLNLGHDEDVVFDNEAIKAGLQQEEGEEEEASLAELVQVKSEQMEEEPEDDNEEEQEGEAEQEQEEQEAEEEPDEIAAEASLGADVEDEEERQQQEEEEDEDHGYFDPLELVETFAEQHSDDNSAEDDDDDYGNDDNEDDDDEDEDEDGDIPGNDDELLLPDTVPIKLEALPPPRREKAVNNVTPICCLKHCRKERTASHQLSTFGFPKHRQQLVKWSANLQLPLPDCVGRVCIEHFEPAVLGTRKLKQNAVPTLNLGHGAPLAYGCSGQPVAIYDAQPQHSVFRLSSLKHCRKRKPTTVDMTPPPPDLAPSKRSRLPGEEQRTEASVYRCNNSCLVPSCPCARLNLYRCYDLPEHPAVQQAWLDWLHLPRPQLASHAQLCVMHFMQLFEQVPLPPELPTLALRRLRDTYELIAGSSMAMKLRCAVPGCYSKYTDNVRLTKLPMCPELSAKWVHNTKICYEHGRRYAYRICMLHFEPDSLGPVRPKPWAVPTLRLNHTDDDIYHNPAQPPPDVVEAASVPLELPLRIKTDLPPALSISPSVSASASPSPRGKLRTCCIPGCGQQANALTRLYRFPSAETTLLKWLVNTQQQPRLVDPLSLFVCQAHFEPEAICQQQLRSWALPTLRLGHDGHVIPNAKHNGNIADGQANRLALQHIWANYCSVLSCFQRRSEQLRLFAYPTDRPAIRRWAANCKHRSMQASSDGFQVCQLHFAPDCFDPATGELTAEAVPTLELSRAVPELRCVVSGCNLGRGEDATRRRLFRMPKRSAQLDDWCHNLRLDAAALSGQEPHVCERHFEANCFSLQKLLRVGARPTLHLGHDEPLRPNPACWEEEALVCCVPRCGRAKSDDDDDDVQLFGLPYLRVHLEKWLHNLRIEPSREQLHGLRVCSVHFEPACMENGRPHLGAMPTRHLGHDDLEGIHQNPEPPSGALKAAAKQARLASSLDCCYPQCVELQKSYQRITYELPRRAALRDLWLAYLGLDQLLASQAPKLCPLHLIELYEHSEEHFEQCAGEEPLLDANYEAARSSVRIRVVSCAVRGCKTLKPRDPQRLHSLPTRRDVFEMWVENMQLVYNEQQRYMYKVCSRHFEPCCQSETARRLKPWSVPTLELPARGPDAAPVYANPTEAEWQRMTEQLAVGEAQLEPLVAAPDPVKLEPKLEPKREPECEASAQQPLEMGPLEVLLEVGRVVKCTTYEQMNTKPSIEYAPYAVQAARRARSLSSDSGGSIGGQHSGRFCCVRGCEVTSKDLSGSVKLHMFPTAPDVLHKWMHNTQVHVDSRVPWRFRICSHHFAAKCFTGMRMRRGAVPTLRLGPRCPAHIYDNEDLPPDQPLSDTDQPHEPLAIVAVASEQQPATPVGEISLRLPCPAPPRKSSKFCQIDGCSNHLTSENLTLHKFPHSADMCAKWQHNTQVPFDPEYRWRYRICSAHFERVCLGNIRLMHGSVPTLRLGPRAPKQLFGNDFATINMRLDKEKEKRCVEQSLWVKQEPFDEDQEDLSLLVPELQLHEDDDTGDHNSGWRDELRLAGVGQEKGASYNPVKSGYDKCSLVHCQRQRSQHGVHIYKFPRSRQLQQRWMHNLRIRYDERRPWKTMICSVHFEPQCIRLRKLRPWAVPTLHLGDNVPQQLFTNEQAEAEAGSEEEPEMDVLEEREEEEEDDDDAAEFDDDAEQLAPEPHAKKERRSQADPLPPGQLPPWKIKMCCLPYCRSPRGDGIKLFRLPNNIAAIRKWEQATGMRFYESQRNTKLICSRHFDPLLIGVRRLMSNAVPTLNLGPSSAEPEPEPEPESEPEPVASPQCCMPDCRQEPDIKLHKFPSEPMLLHQWCQALDLPEVQRYADKHICDAHLPARALSCLICGVEDVQLPMLEFPENRNQRVKWCYNLKIEPIPKWDNSKHICCKHFESHCFVRPGRPLADAMPTLELGHNDTNIFLNDYAIENRKLLSVKDEPVECEDLTL

Similar Transcription Factors

Sequence clustering based on sequence similarity using MMseqs2

100% Identity: iTF_00598188; iTF_00567569; iTF_00541793; iTF_00561070; iTF_00495892;
90% Identity: -
80% Identity: -