Basic Information

Insect: Drosophila subsilvestris
Gene Symbol: -
Assembly: GCA_035043285.1
Location: JAWNNB010001178.1:23070-45589[-]

Transcription Factor Domain

TF Family: THAP
Domain: THAP domain
PFAM: PF05485
TF Group: Zinc-Coordinating Group
Description: The THAP domain is a putative DNA-binding domain (DBD) and probably also binds a zinc ion. It features the conserved C2CH architecture (consensus sequence: Cys - 2-4 residues - Cys - 35-50 residues - Cys - 2 residues - His). Other universal features include the location of the domain at the N-termini of proteins, its size of about 90 residues, a C-terminal AVPTIF box and several other conserved residues. Orthologues of the human THAP domain have been identified in other vertebrates and probably worms and flies, but not in other eukaryotes or any prokaryotes [1].
Hmmscan Out: # of c-Evalue i-Evalue score bias hmm coord from hmm coord to ali coord from ali coord to env coord from env coord to acc

1 29 8.7 1e+04 -2.5 3.0 44 62 366 387 351 403 0.55

2 29 1.1e-14 1.3e-11 45.2 3.5 1 86 603 675 603 676 0.85

3 29 2.5e-14 2.8e-11 44.1 4.8 1 87 703 772 703 772 0.82

4 29 2.1e-15 2.4e-12 47.6 0.2 1 87 794 866 794 866 0.85

5 29 1.3e-15 1.4e-12 48.3 5.0 1 86 975 1044 975 1045 0.82

6 29 7.9e-15 9e-12 45.7 3.1 1 86 1070 1141 1070 1142 0.82

7 29 1.4e-12 1.6e-09 38.5 0.4 1 87 1177 1247 1177 1247 0.83

8 29 3.9e-11 4.5e-08 33.9 2.0 1 86 1287 1356 1287 1357 0.77

9 29 8.8e-17 1e-13 52.0 0.4 1 86 1384 1453 1384 1454 0.82

10 29 3.1e-12 3.6e-09 37.4 0.6 1 86 1475 1544 1475 1545 0.79

11 29 9.9e-14 1.1e-10 42.2 1.1 1 86 1572 1643 1572 1644 0.85

12 29 2e-12 2.3e-09 38.0 1.9 1 85 1718 1786 1718 1788 0.83

13 29 3.6e-11 4.1e-08 34.0 0.0 1 86 1811 1879 1811 1880 0.81

14 29 4e-13 4.5e-10 40.2 0.8 1 87 2033 2102 2033 2102 0.79

15 29 4.5e-10 5.2e-07 30.5 0.0 1 85 2191 2260 2191 2264 0.78

16 29 0.0054 6.2 7.8 0.0 1 58 2282 2326 2282 2346 0.80

17 29 6.4e-12 7.3e-09 36.4 0.2 1 86 2362 2431 2362 2432 0.80

18 29 1.6e-14 1.8e-11 44.7 0.4 1 86 2512 2581 2512 2582 0.83

19 29 1.1e-10 1.3e-07 32.4 0.1 1 85 2617 2689 2617 2690 0.78

20 29 3.7e-10 4.2e-07 30.7 0.9 1 87 2704 2774 2699 2774 0.71

21 29 8.6e-16 9.9e-13 48.8 0.3 1 86 2800 2877 2800 2878 0.81

22 29 0.00047 0.53 11.2 0.1 1 58 2905 2960 2905 2978 0.78

23 29 9.1e-12 1e-08 35.9 0.7 1 87 2999 3071 2999 3071 0.78

24 29 1e-11 1.2e-08 35.7 0.0 1 86 3202 3272 3202 3273 0.78

25 29 1.4e-11 1.6e-08 35.3 4.4 1 86 3336 3406 3336 3407 0.80

26 29 3.4e-14 3.9e-11 43.7 5.5 1 86 3541 3611 3541 3612 0.84

27 29 5.9e-12 6.8e-09 36.5 0.2 1 86 3701 3770 3701 3771 0.84

28 29 5.1e-09 5.8e-06 27.1 0.6 1 58 3795 3844 3795 3852 0.86

29 29 3.6e-09 4.1e-06 27.6 0.6 18 87 3863 3921 3849 3921 0.75

#	of	c-Evalue	i-Evalue	score	bias	hmm coord from	hmm coord to	ali coord from	ali coord to	env coord from	env coord to	acc
1	29	8.7	1e+04	-2.5	3.0	44	62	366	387	351	403	0.55
2	29	1.1e-14	1.3e-11	45.2	3.5	1	86	603	675	603	676	0.85
3	29	2.5e-14	2.8e-11	44.1	4.8	1	87	703	772	703	772	0.82
4	29	2.1e-15	2.4e-12	47.6	0.2	1	87	794	866	794	866	0.85
5	29	1.3e-15	1.4e-12	48.3	5.0	1	86	975	1044	975	1045	0.82
6	29	7.9e-15	9e-12	45.7	3.1	1	86	1070	1141	1070	1142	0.82
7	29	1.4e-12	1.6e-09	38.5	0.4	1	87	1177	1247	1177	1247	0.83
8	29	3.9e-11	4.5e-08	33.9	2.0	1	86	1287	1356	1287	1357	0.77
9	29	8.8e-17	1e-13	52.0	0.4	1	86	1384	1453	1384	1454	0.82
10	29	3.1e-12	3.6e-09	37.4	0.6	1	86	1475	1544	1475	1545	0.79
11	29	9.9e-14	1.1e-10	42.2	1.1	1	86	1572	1643	1572	1644	0.85
12	29	2e-12	2.3e-09	38.0	1.9	1	85	1718	1786	1718	1788	0.83
13	29	3.6e-11	4.1e-08	34.0	0.0	1	86	1811	1879	1811	1880	0.81
14	29	4e-13	4.5e-10	40.2	0.8	1	87	2033	2102	2033	2102	0.79
15	29	4.5e-10	5.2e-07	30.5	0.0	1	85	2191	2260	2191	2264	0.78
16	29	0.0054	6.2	7.8	0.0	1	58	2282	2326	2282	2346	0.80
17	29	6.4e-12	7.3e-09	36.4	0.2	1	86	2362	2431	2362	2432	0.80
18	29	1.6e-14	1.8e-11	44.7	0.4	1	86	2512	2581	2512	2582	0.83
19	29	1.1e-10	1.3e-07	32.4	0.1	1	85	2617	2689	2617	2690	0.78
20	29	3.7e-10	4.2e-07	30.7	0.9	1	87	2704	2774	2699	2774	0.71
21	29	8.6e-16	9.9e-13	48.8	0.3	1	86	2800	2877	2800	2878	0.81
22	29	0.00047	0.53	11.2	0.1	1	58	2905	2960	2905	2978	0.78
23	29	9.1e-12	1e-08	35.9	0.7	1	87	2999	3071	2999	3071	0.78
24	29	1e-11	1.2e-08	35.7	0.0	1	86	3202	3272	3202	3273	0.78
25	29	1.4e-11	1.6e-08	35.3	4.4	1	86	3336	3406	3336	3407	0.80
26	29	3.4e-14	3.9e-11	43.7	5.5	1	86	3541	3611	3541	3612	0.84
27	29	5.9e-12	6.8e-09	36.5	0.2	1	86	3701	3770	3701	3771	0.84
28	29	5.1e-09	5.8e-06	27.1	0.6	1	58	3795	3844	3795	3852	0.86
29	29	3.6e-09	4.1e-06	27.6	0.6	18	87	3863	3921	3849	3921	0.75

Sequence Information

Coding Sequence: ATGTCACAGCATAATCCGCATGCCCATCCACACTACCATCACCACCCACTGCACCAgtcgaacaacaacaacaacaacaacgactaTCAATCTGGGATTGGGATGTACTCGGCGCCGCCCAGTGCCCACTATGGATGCCTCGACCagaagcagcaccaccagcagcaacaactacagcaacagcagcagcaacaacaggccCAAATGCCACACAGCAATTGGTACTCACATGTTGCTTCCTACCCGCCAGTGCCACCCCACCACCATGCGACGGCCACCTCCGCATTTGCCGCCACCTCTGCACCTTGCAAGggcagtgtcagtggcagtgtcggcaacaacaacaacaacaataacatgAATGCGTATGGGGCAGGCAGCACGCATGGATATTatgctgctgccgcagccGCCTCCGCCGCTGGCGGTGGGCTCAATGTCAATgctgtgggtggggttggggttggttCAGCCTATAACCTTGAGGCAAACACAGTGGCATATGCACACAACCAGCTGCTGCAGTACCAAcagcaccatcagcagcagcagcagcagcagcttctcaGTCAGCGTTCCTATATGGGGCATGATATAATGTCCGGCACATATCCGTATATCAAAAGCGAACCCATGGAGGCCGTTTATCAGCAGCCACCCCCCAATCCGATGGCCCCACCCCCAGCGCCAGATATGATAATAAAATCGGAACCCATGGATGAACATGCCTACAAGTCCAACTACATTGATGACAACACGCCCTTTGCTGATTTCAACAAGTTCAATGAATTCAGCGGCGATATGCTGAGCCCCAAAGTCGAGCTAACCATCAAGGATGAGACCTATGGAAAGACttccagcggcagcagctttGCACGCCGCAAAgtccagccacagcagcaacagccaacgaCAGATCGTTCGGCCGAGAGTCTGCCCATTTGTCAGCGCTGCAAGGAGGTGTTCTTCAAGAAGCAGTCCTACCTAAGGCATGTGGCCGAGAGCAGTTGTGGCATTCAGGAGTACGATTTCAAGTGCAACATTTGCCCCATGTCCTTCATGAGCAGCGAGGAGCTGCAGCGGCACAAGCATCTGCATCGTGCGGACAAGTACTTTTGCCACAAATACTGCGGCAAGCATTTCGATACGATAGCCGAGTGCGAAACGCATGAGTACATGCAGCACGAGTACGAGAGTTTTGTTTGTAATATGTGCTCGGGTACCTTTGCCACACGTGAGCAGCTGTACGCCCACTTGCCGCAGCACAAGTTCCAGCAGCGTTACGACTGTCCCATCTGTCGCTTGTGGTATCAAACGGCCGTCGAATTGCATGAACATCGACTGGCGGCTCCATACTTTTGCGGCAAGTACTACAccaatcaacagcagcagcgacagcagcaacaggggAACTACAAGCTGCAGGACTGCCATATGGCCACCATGGAATTGCCCACAGCACCGCTTCTTAAGGCACCAACGCCCTCCAATGCCTCGGCGCTGCCAGCCACAGCAGCTTTGAGTtctctgctgcagcagcggcaggcgaATGCCGATGGAGCAGCGGTCATGTTTGCTgcggcctcctcctccgccgccgccgccgcagcctCTGCAACGCTGAAGAGCGAGGTGAACGTGAAGCTGGAGCGCAGCTACAGCAACTCCACCAGCGAGTCCTCGTACAGCCATCAGGACAACAGCAGCTACAACAATGCCTACGGCAGCGACAGCTCCATCCATGGCGGTGCACTGGCCGGACCACAGGCGCACTCCTCAACGCTGGACGACTCTGAGGAtgcgctgtgctgtgtgccgcTGTGTGGCGTGCGTAAGAGCACCAGTCCCACGCTGCAGTTCTTTACGTTCCCGAAGGACGACAAGTATCTGAATCAGTGGCTGCACAACCTCAAGATGTTCCACATACCGGCCGCGAGCTATGCGACATTTCGCATCTGCAGCATGCACTTCCCGAAGCGTTGCATCAATCGGTATTCGCTGTGCTATTGGGCGGTGCCCACCTTCAATTTGGGCCACGACGATGTCGCCAATCTGTACCAGAATCGCGAGCTGACCAACACCTTCACCACCGGCGAGGTGGCCCGCTGCAGCATGCCCCACTGCACCAGCCAGCGGGGCGAAAGCAATCTAAAGTTCTACAATTTCCCCAAGGACATCAAGAGCCTGATCAAGTGGTGCCAGAATGCCCGCCTGCCGGTGCAGGCCAAGGAACCGCGTCACTTTTGCAGCCGCCACTTTGAGGATCGCTGCATTGGCAAGTTCCGTCTGAAGCCCTGGGCGGTGCCCACGCTCCATCTGGGTGCGCAGTACGGCAAGATCCATGACAATCCCAAAAATCTGTATGTGGAGGAGAAGCGATGCTGCCTGAACTTTTGCCGTCGCAGCCGCTCCTCGGACTTTAATATGTCGCTGTATCGCTTTCCCCGCGATGAGGTGCTCCTGCGACGCTGGTGCTATAATTTAAGGCTCGATCCGGGCGTCTATCGTGGCAAGAATCACAAAATATGCAGTGCACATTTCATCAAGGAGGCGCTGGGCCTAAGGAAGCTATCGCCAGGCGCTGTGCCCACATTGCATTTGGGACACAATGACACGTTTAACATCTATGAGAACGAGCTGTGGCCACCGCCCTCGCCCACTGGACAGCATGGCCAGCTTctaccgcagcagcagcagcagccgtcgcAGCATCAACACTCcgcccagcaacaacagcagcagcagcaacagcatcagtcAATGCATAGCAAATCCTCCTATCAACGGCATTCGGCAGCCTCCACATCATCCTCTGCCAGTTCGGCGTCGCATTATGTGGATCCCGAGATGAGTGCCTCGTATTTGAGTCTCTCGGCGGCTGGCTCCTCGGGCGGCATGAATGCCAGCGACTGCATGGACGTGTGCTGTGTGCCGAGCTGCGAGAGCAAGCGGCACAACAGCGAGAACATCACATTCCACACGATACCGCGCCGGCCGGAGCAGATGCGCAAGTGGTGTCACAATCTGAAGATACCCGAGGACAAGATGCACAAGGGGATGCGGATATGCAGCCTGCACTTTGAGCCCTACTGCATTGGCGGCTGCATGCGTCCGTTTGCCGTTCCCACGTTGCAGTTGGGGCACGACGATCTGGAGGACATACACCGCAATCCGGATGTGATCAAGAAGCTGAACATACGCGAGACCTGCTGCGTGGCGGTGTGCAAGCGGAACCGCGACCGCGACCATGCCAATCTGCATCGTTTCCCCAGCAATGTGGCGCTGCTGGCCAAGTGGTGTGCGAATCTGCAGCGGCAAGTCCCCGATGGCAGCAAACTGTTCAACGATGCCATCTGCGAGGTGCACTTCGAGGATCGTTGTCTGCGCAACAAGCGGCTGGAGAAGTGGGCGGTGCCCACGCTGATACTCGGCCACGAGGACCTGGCCTATCAGCTCCCCACACCGGAGCAGGTGGCCGAGTTCTATGCCAGGCCCACCGCCCCCAACAATGGCGACGAGCAGGGCGAGTGCTGTGTGGAGACGTGCAAACGGAACCCCAGCGTGGATGACATCAAGCTGTACCGGCCGCCGGAGGACAGCTCAGTGATGGCCAAATGGGCCCACAATCTGCAAACGGAGGCGGCCGCAATCCTCGCCAAGGGACTGCGGATATGCAATCTGCACTTTGAGGCCCACTGCATTGGCAAGCGGATGCGTCCGTGGGCCATACCCACCCTCAATCTGGCCGGCAACATTGAGAATCTCTACGAGAACCCGGAGCACTCGATGCTGTACAAGCGACGGACGCAGCACCCCAAGCAGAAGGTGCCCGTGGCGAAGCCCACGTGGGTGCctcgctgctgcctgccgcacTGCCGCAAGGTGCGTGCCCTGCACAATGTCCAGCTGTATCGCTTCCCCAAACTCAACCGCTCCACGTTGGCCAAGTGGGCGCACAATCTGCAAGTGCCGCAGGTGGGCAGTGCCCAGCGGCGTGTCTGTTCCGCACACTTTGAGCCGCATGTCCTCAGTAAAAAGTGCCCGGTGCCGCTGGCGGTGCCCACACTGGACTTGAACTCGCCCGCTGGCCACAAGATCTACCAGAATCCGGCCAAACTAAAGGCCAACAAACTGTGCCTGCAGCGGGTGTGCATTGTGGAGAGCTGCCGAAAGACCAGGGCCCAGGGCGTTCAGCTCTTCCGTCTGCCGCACAGCCCCACGCAGCTGCGCAAGTGGATGCACAACATCAGGACACGTCCGAGGGCGGCCATGAGGAGCCAGTATCGCGTGTGTTCGCGTCACTTTGAGACGCACTCCTTCAACGGGCGTCGACTGAGCGCGGGGGCCATTCCCACACTGGAGTTGGGCCACGACGACGATGACATCTTTCCGAACGAAGCGCAGGCCTTTGCGGACGAGCACTGTGCCGTGGAGGGCTGTGAGTCGTCTAAGGAGCAGGCCGAAGTGCGTCTCCTGCGGTTCCCCacggacgacgacgacatgcTGTGGAAGTGGTGCAACAATCTGAAGATGAATCCCGTCGACTGCATCGGTGTGCGGATATGCAACAAGCACTTCGATGCGGACTGCATTGGGCCGAAGCACCTGTACAAGTGGGCCATACCCACGATGATGCTCGGCCACGACGACTCCCAGATCGAGCTGATACTCAATCCGAAGCCGGAGGAGCGCTATGTGGATCCCGTGTTCAAGTGCATTGTGCCCACGTGCGGCAAGACGCGTCGCTTCGATGAGGTGCAAATGAACAGCTTCCCCAAGGATGCGGATCTCTTTCAGCGCTGGCGGCACAATCTCCGCCTGGAGCATCTCTGCTTCAAGGATCGCGAGAAGTACAAGATATGCAATGCCCACTTCGAGGAGATGTGCATTGGCAAGACGCGTCTGAACATTGGTTCGATACCCACCCTGGAGCTGGGGCACGCCGAAACGGAGGACCTGTTCCAGGTGAATCCGGCAGAGCTGCAGAGCAACCTGTTTGGGCGTCCGCGTCGACTGTTGCGAGGATACAATAGTGTGAGCATCAAGCAGGAGCTGCCAGAGACgcgggaggaggagcagcaggacgTGAAGCCCGATCTAGGCACGGACTTTACAcagGTGAAAATCAAGAAATCTCTGGGGGACATCAAGTGTTGTGTGCGCACCTGCGGCCGCAGCCGACTGGAGCATGGGGCGCgtctctttccctttcccaacggcaagcagcagcacctcaaGTGGCGCCACAATCTGCGCCTCGAGCCGGACGAAGTGGACAAAACGACGCGCCTGTGCAGCGCCCACTTCAACAGGCGCTGCATCGATGGCAAACAGCTTCGCGGCTGGGCCATGCCCACACAGCAGTTGGGCCACCAGGAGCATCCCATCTACGAGAATCCCAAGAATATTCCGGGCTTCTTTACGCCCACCTGTGCGCTGGGGCACTGTCGCAAGCGGCGCAGCATTGACAACGATTTGCGCACGTATCGGTATCCCCGCAGCGAGGATCTGCTCGAGAAGTGGCGTGCGAATCTGGGCCTGTCGCTGGACCAGTGCCGTGGCAGGATCTGTGCGGATCACTTTGAGCCGCTGGTGCGGGgcaaactgaagctgaagacgGGCGCTGTGCCGACGCTTAAGCTCGGCCATGACGAGCCTCTCATCTACGACAATGAGGCTATAAAGGCGGGCGGGgtcgaggaggaggcggcagcggcgggtAGTGTCTCACCTCTGGTGACACCCAAAACGGAAGTGCTGGATGAAGAGGAGCACGAGGAAGATGACACGCACGAAGAAGCAGAGCAGTTGAGGGATGAGGATGACGATGAAGATGAGGATCCAGGCAACTATTTTGATCCTTTGGAGCTGGTGGAGACGTATGCAGAGCCTcccagcgacgacgacgacgacgacgaggcaggagaggatgaggatgaagaGGAGGCAGAAACTCTACTGCCTGATACACCACCCCAACCGTCGGCAGTTCTTCGCATTCCGAAACCATTTGACagacctgctgctgccgccgccaccgccgccgctgtaGTTGTGCCACGCCGCGAGAAACGTCCGAATAATGTGGATCCCATCTGCTGCCTCAAGCACTGCCGCAAGGAACGCTCCGCCGTGTATCTGCTGAGCACCTTCGGCTTccccaaggagcagcagctgctgctcaagtGGTGCGCCAATCTCCAAATGAATCCCGCCGGCTGCATTGGTCGCGTCTGCATCGAGCACTTTCAGTCGGAGGTGTTGGGCACGCGCAAACTCAAACAGAATGCGGTGCCAACGCTGAATGTGGGGCACGATGTGCCGCTGCGTTACAGCTGCAACGGCCAGGAGATCCCcaccagtagcagcagcagcagcagctttccGGATGAAATGCCACAGCATTCGGTTTTTCGGCTTTGGAGCCTGAAACACTGCCGCAAGAGGAAGCTGTCGGAgagtccagctccagctccagcagcgatcaagaaggaggagcagcagcagcagcagcatcacacaCCGATGGAGATGcagctggaactggagctggagactAAACCAAAGATTTGCTGCCTCCCCAGCTGCGGCAATGTGGAGGGCTATGGACCGTCCGGGCACTTTCAGCCGCTGCCCATGGACCAAAAACTTCTCAAAAAGTGGCAGCACAACCTGAGGCTACCCACCCTCGATTCGGACACGGATCTTCGACTGTGCCTGGAGCACTTTGAGCCGCAACAAATCGAGAATGGATGCCCCGTGCGGATGGCAGTGCCCACTGTCAAGCTGGGCCACTCCAGTCCGAATATCTTCAGGAACAGCGAGGGCTCCCGGCTGCCCGGCTGCCTGTGGCCCTCGTGTCCGCCAAATCGCAAGCTGTGCTACGATCTGCCGGAGCATGAGGCTGTCCGCGAGTCCTGGTTGTCGTATCTGCGACTGCCAGTGGACAGTCAGGGACGCCTCTGTGGCCTACACTTTCTGCAGCTGTTCGAGGAGGTGGAGCTGCCGGCGGATGTGCCCGAAACGGTGCTCGAGCAGATGCAGGACACCTACGATCAGGCCTCCATCTCGTTGAAGTTTCAGTGCTCCGTGCTGGGCTGTGGATCCAAGTACAAGCAGGACACGCATCTGGCGAAGTTGCCACGCGACGCCCAGCTGCTGACCAAGTGGCTACACAACACCAGAATCTCATACGATCGCTCGCTGCACTTTAGCTATCGCATTTGCCTGCTACACTTTGAGACGTTCTGCCTGAATGGCCACAGACCACAGACTTGGGCCATACCTACACTGCAGCTGAACCACGACGGGAAGATCTACCAGAATAGTGTCAAACAGGAGGTGCACGAGCAGCCCTTGAAGCAGGAGGTGCCCGATAAGCGGGAGACTCACTTTGGCAGCCTCAGTCTCTCCATTCCGCTGCACATCAAGACGGAGCAGGGCACGGGCACTCCCGTGCTTCGTGGCACATCCTCACTGAGCAGTCCCTGCCTCACAAGTGCCAGCTCCAGTCCCCGCACGAAGAACAGGATTTGCTGCATACCCAACTGCGGTGAGACGCCATCCAGATCGCAGCGGCTACATCGCTTTCCCACCGCCGAACCGACGCTGCTGAAATGGCTGGTGAACACGCAGCAAAAGCCGGCACTGGTGGATATCCAGAGTCTGTTTGTGTGCCAACTACACTTTGAGGCTGATGCCATTAATCAGACGCAGCTGAGGAGCTGGGCCGTGCCCACTCTGCGGCTGGGCCACGATGGCCATGTCATACCGAATGCCCGGCACAATGGGAACATTGCCAACAGCCAGGAGACGGAGCAGGCCATGGAGTTCATTCGGGCCAACTACTGTTCGGTGCTTAGTTGCTTCCAGCCGAAAGGCGAGGGCGAGGGTGTGCGCTTCCACAAGTATCCCAGCGACATTGCCATGGTGCGCAAGTGGGCCACAAATCTCAAGCATCGCTCCATGCAGGCCAGCAGTCACGGCTTTCTCGTCTGCCAATCCCACTTTCCGGCCGAATGCTTCGATCCGGAGACAGGAGACCTGCGCGACGACGCCATACCCGTTGCGGGTAGTGTGACCCTGCCGCTCCATTGCCTAGTTAGGGGCTGCTCGGTGGATAGCTGCGGAAAAGGGGCTCCGCGGCGGCTGCTGTTCAAGGTGCCAAAGAAGAATAATCGTGTGCGGGATGCGTGGGCCCACAATCTGTGGATGCATCCGATCGAGCTGATGGGCGAGCAACACATCTGCGAGCGTCACTTCGAGGCGCACTGCGTGAACGAACAGAAACTGCTGCACGCGGGCTCAGTGCCCACGCTCCACCTGGGACACACTGAGCCGCTGGAGCTTCTGCCCAATCCACATACCTTCAACGAGTGCCGCCAGGAGGAGTGCGTGTGCTGTGTGCCCGGCTGCGGGCGCACCAATCGAAAGGATCTGCTGGCGGAGCTGCAGTTCAGCAAGTTTCCCAAGTGGCGGGTGCTCTATGACAAGTGGCTCCacaacttccgcctggaagtGTCCAAGGAGCAACGCATTGCGACGCTGCGCGTCTGTCACACGCACTTTGAGGAGAGTTGCTTTGAGCCGGGTGGCCAGGGGACCGTGCGACGCGGGGCCATGCCCACCCTGCAGCTGGGACACTCGCATCCGGACATTTATCGCACGGACAAGGGATCGCTGTGGAAGAAGGTGCACAAGAGATTCAGCGACTGCTGCTATCCGGACTGCTACGAGGAGTGCCACAAGGCCAACACCAATCGCATGGTCTACGAACTGCCCGGCGAGGGGCCGCTGCGTGAGGCCTGGCAGCAGCACTTGGGCATCCGTATCCCCGACAGCTGCTCCTCGGTGCTACTCAGGCTCTGTGCCCTCCACTACATCATGCTGTACGAGCACAGCGAGCAGAACCTGCCCGAGCACGCAGCAGATCTCCTGCCGCTGGCCTCGAACTACGCGCACGCCCGCCAGTTGGCCTATCTGCGGCGCTTCATGTGCGCCGTGCAAGGCTGCCGCCACCTGCAGCCGCGGGACGGCGGCTCAATGCATGGCATACCCAGGCGGCGGCAGATCCTGCGCATGTGGGTGGAGAACGCGCAGCTGCGGCTGAACGAGCACGAGATTTACATGACGAAGCTGTGTAGCAAACACTTTGAGACGCACTGCCTGTTCGAGGGCAAGAAGTGCTACCCGTGGAGTGTCCCCACGCTCCATCTGCCCGAGCTACCGCCGGGTCAGGTGCTGCATCAGAACCCCACCACCGAGGAGTGGCAGGAGATGAAGCAGCGCATGAAGATGGAGGAGCAGACGCTGCAGGCGGAACAGCAGGTGGATGGAGGCAGACTGCAAGTGGAGCCCTACGTGAAGATGGAACcgcacgacgacgacgacgacgacaatggATCACAAACGGAGTCGGAATTGCACATAAATGAGAGCACCATGGACGACTCGCAGGAGATGGACTTTCACGCGAATGAGCCACTCGAGGTGCTGCTGGAGGTGGGCCATGTGGAGCGGCTGGAGAGCTACGAGAAGAAGGATTACCCCGCCGTCAGCTATGAGCCGCCCAAACGATTCCGCCATCCGTATAGTGCCCACAAGTGCAGTGTCGCGGGCTGTGGCGTCTCGCTGGAGGATGTGGGCGGCAATCTGAAGCTACACAAGCTGCCCAGCGGCACGGAGGCGGCCCGCAAGTGGCTGTACAACATACAGGTGGACATCGAGGACAAATGGCGGATACGCGTCTGCAGCCATCACTTTGACGGGCAATGCCTGAATGGGTCGCGACTCAGGCGCGGATCGATGCCCACGCTGCTTCTGGGGCCACGTGTCCCAACGACTATCCCTATCCACCAGAATGAGTTTGCGCAGCTGCAACTGGACGATGCGacgccagaagcagcagcagtaccgaATGGAGCGATCCACGTGGAGCCATCCATTGGCAAGGTGTTGCATCCGTGCGTGCCGCGACCCTCGCCGCCGCGCAAGTCCAGCAAGTTCTGCCAGATCGAGGGATGTGCGAACCATTTGACCAGCGAGCATATGACGCTGCACAAATTCCCGCACTCCTCGTGGATCTGCACCAAGTGGCAGCACAACACACAGGTGCCGTTCGATCCGGAGTACCGCTGGCGCTATCGCATCTGCAGCGCCCACTTCCATCCCGTGTGCATGGTCAATATGCGACTGCTGCACGGCAGTGTGCCCACCCTCAAACTGGGTCCGCGGGCACCCGCCGAACTCTTTGACAGTGACTTTGAGGCCATCAACATAAAGATTGAGAAGCTGGAGAAGATGGAGCGCAAGGCGGAGGCTCGGAGAGTCAGCACCAGTTACAGTCACCATCCCACCATGCCGGACATGGGGGAGGTCAGACTGAAGGTCAAGACTGAGGAGCTGGAAGATGGTGGTGAAGCaatgcaggaggagcaggaggaggaggatgccaTGCTCTATCTGGAGCCAGAGATGCAGCTATACGAGGAtcaggaagaggaggagcagcagcagcagcagcaagagaagCCACAGGTAAATGGTGGCTGGAAAACGGAACTCCGTTTGCCAACAAAGGGCAGGGTGGCCTTCAATCCGGTGCGTTCGGGCTACGACAAGTGCTCGCTGATGCATTGCCAGCGCCAGCGATCGAAGCACGGCGTCCACATCTACAAGTTTCCCCGCTCGcaggagcaccagcagcggTGGATGCACAATCTTCGCATCCGCTACGACGAGAAGCGCCCCTGGAAGTTCATGGTGTGTAGCGTGCACTTTGAGCCGCACTGCATACGGCTGCGGAAGCTGCGTCCTTGGGCAGTGCCCACACTGGAGCTGGGCGACAATGTGCCCGAGGATATCTACACGAACGAGCAGTGCCAGATGTTTGCCAGTGGACAGACAGGAGGCGAGATCAATGGCATCAATGACAGCGatgcggaggcggaggcggagagCGACGATGGCCTGCAagaggacgaggatgaggagacAGATGACCAGGAGCCGAGCACCGCTAAAaagcgtcgtcgtcgtcgttcgCGGCTGGATGCTGCTGGTTGGCCGGCCGGCCAGGTGCCACCGTGGAAGGTGAAGCAATGCTGTCTGCCCTACTGCCGCAGTCCACGTGGCGATGGCATCAAGCTCTTCCGACTGCCCAACAAAGTCAACTCTATACGCAACTGGGAGCTGGCCACGGGCATGAAGTTCAAGGAGTCGCAGCGCAACACGCGGCTCATCTGCAGCCGCCACTTTGAGCCGGAGCTGATCGGAGTGCGTCGTCTCATGCGCAATGCCATTCCCACCCGGCACTTGGGACCCACGGCCGTCACGGGCGATGTGAAGCCAGTGGTGGCGCCACCGAGCACAGCTGGCCCCAAATGCTGCATGGCCGATTGCGCCTACGATGTGGCCGATGTGAAGCTGCACAAGTTTCCCAGCAATCCCAAGCTACTGAGGGAGTGGTGCCAGGCGTTGAGGGTCACCGATATGCAAAGGTATCGTGGCAAGCACATTTGCTCCGCCCATCTGCCCGTGCACAAGGCCGTGGACTGCCTTGTGTGTGGCACGGACAGCGTCCCACTGCTGCCGATGCTCAACTTTCCCGCCAATCGGAATCAGCGGGCCAAATGGTGCTACAATCTGAAGATCGAAACGATACCCAAGTGGGACATATCCAAGCACATTTGCTGCAAACACTTTGAGCCATATTGCTTTGCGGCGGCGGGTCTGCTCAAGCCAGAGGCGGCGCCCACACTGCATTTGAATCACAACGATACAAACATATTCCTTAACGATTGTGCCATAAATCCCGCCGCAGGAGTGCTGCGGGTAAAGGATGAGCCCATGGACAATCAGGTCCTATCGTTGTTGTAG
Protein Sequence: MSQHNPHAHPHYHHHPLHQSNNNNNNNDYQSGIGMYSAPPSAHYGCLDQKQHHQQQQLQQQQQQQQAQMPHSNWYSHVASYPPVPPHHHATATSAFAATSAPCKGSVSGSVGNNNNNNNMNAYGAGSTHGYYAAAAAASAAGGGLNVNAVGGVGVGSAYNLEANTVAYAHNQLLQYQQHHQQQQQQQLLSQRSYMGHDIMSGTYPYIKSEPMEAVYQQPPPNPMAPPPAPDMIIKSEPMDEHAYKSNYIDDNTPFADFNKFNEFSGDMLSPKVELTIKDETYGKTSSGSSFARRKVQPQQQQPTTDRSAESLPICQRCKEVFFKKQSYLRHVAESSCGIQEYDFKCNICPMSFMSSEELQRHKHLHRADKYFCHKYCGKHFDTIAECETHEYMQHEYESFVCNMCSGTFATREQLYAHLPQHKFQQRYDCPICRLWYQTAVELHEHRLAAPYFCGKYYTNQQQQRQQQQGNYKLQDCHMATMELPTAPLLKAPTPSNASALPATAALSSLLQQRQANADGAAVMFAAASSSAAAAAASATLKSEVNVKLERSYSNSTSESSYSHQDNSSYNNAYGSDSSIHGGALAGPQAHSSTLDDSEDALCCVPLCGVRKSTSPTLQFFTFPKDDKYLNQWLHNLKMFHIPAASYATFRICSMHFPKRCINRYSLCYWAVPTFNLGHDDVANLYQNRELTNTFTTGEVARCSMPHCTSQRGESNLKFYNFPKDIKSLIKWCQNARLPVQAKEPRHFCSRHFEDRCIGKFRLKPWAVPTLHLGAQYGKIHDNPKNLYVEEKRCCLNFCRRSRSSDFNMSLYRFPRDEVLLRRWCYNLRLDPGVYRGKNHKICSAHFIKEALGLRKLSPGAVPTLHLGHNDTFNIYENELWPPPSPTGQHGQLLPQQQQQPSQHQHSAQQQQQQQQQHQSMHSKSSYQRHSAASTSSSASSASHYVDPEMSASYLSLSAAGSSGGMNASDCMDVCCVPSCESKRHNSENITFHTIPRRPEQMRKWCHNLKIPEDKMHKGMRICSLHFEPYCIGGCMRPFAVPTLQLGHDDLEDIHRNPDVIKKLNIRETCCVAVCKRNRDRDHANLHRFPSNVALLAKWCANLQRQVPDGSKLFNDAICEVHFEDRCLRNKRLEKWAVPTLILGHEDLAYQLPTPEQVAEFYARPTAPNNGDEQGECCVETCKRNPSVDDIKLYRPPEDSSVMAKWAHNLQTEAAAILAKGLRICNLHFEAHCIGKRMRPWAIPTLNLAGNIENLYENPEHSMLYKRRTQHPKQKVPVAKPTWVPRCCLPHCRKVRALHNVQLYRFPKLNRSTLAKWAHNLQVPQVGSAQRRVCSAHFEPHVLSKKCPVPLAVPTLDLNSPAGHKIYQNPAKLKANKLCLQRVCIVESCRKTRAQGVQLFRLPHSPTQLRKWMHNIRTRPRAAMRSQYRVCSRHFETHSFNGRRLSAGAIPTLELGHDDDDIFPNEAQAFADEHCAVEGCESSKEQAEVRLLRFPTDDDDMLWKWCNNLKMNPVDCIGVRICNKHFDADCIGPKHLYKWAIPTMMLGHDDSQIELILNPKPEERYVDPVFKCIVPTCGKTRRFDEVQMNSFPKDADLFQRWRHNLRLEHLCFKDREKYKICNAHFEEMCIGKTRLNIGSIPTLELGHAETEDLFQVNPAELQSNLFGRPRRLLRGYNSVSIKQELPETREEEQQDVKPDLGTDFTQVKIKKSLGDIKCCVRTCGRSRLEHGARLFPFPNGKQQHLKWRHNLRLEPDEVDKTTRLCSAHFNRRCIDGKQLRGWAMPTQQLGHQEHPIYENPKNIPGFFTPTCALGHCRKRRSIDNDLRTYRYPRSEDLLEKWRANLGLSLDQCRGRICADHFEPLVRGKLKLKTGAVPTLKLGHDEPLIYDNEAIKAGGVEEEAAAAGSVSPLVTPKTEVLDEEEHEEDDTHEEAEQLRDEDDDEDEDPGNYFDPLELVETYAEPPSDDDDDDEAGEDEDEEEAETLLPDTPPQPSAVLRIPKPFDRPAAAAATAAAVVVPRREKRPNNVDPICCLKHCRKERSAVYLLSTFGFPKEQQLLLKWCANLQMNPAGCIGRVCIEHFQSEVLGTRKLKQNAVPTLNVGHDVPLRYSCNGQEIPTSSSSSSSFPDEMPQHSVFRLWSLKHCRKRKLSESPAPAPAAIKKEEQQQQQHHTPMEMQLELELETKPKICCLPSCGNVEGYGPSGHFQPLPMDQKLLKKWQHNLRLPTLDSDTDLRLCLEHFEPQQIENGCPVRMAVPTVKLGHSSPNIFRNSEGSRLPGCLWPSCPPNRKLCYDLPEHEAVRESWLSYLRLPVDSQGRLCGLHFLQLFEEVELPADVPETVLEQMQDTYDQASISLKFQCSVLGCGSKYKQDTHLAKLPRDAQLLTKWLHNTRISYDRSLHFSYRICLLHFETFCLNGHRPQTWAIPTLQLNHDGKIYQNSVKQEVHEQPLKQEVPDKRETHFGSLSLSIPLHIKTEQGTGTPVLRGTSSLSSPCLTSASSSPRTKNRICCIPNCGETPSRSQRLHRFPTAEPTLLKWLVNTQQKPALVDIQSLFVCQLHFEADAINQTQLRSWAVPTLRLGHDGHVIPNARHNGNIANSQETEQAMEFIRANYCSVLSCFQPKGEGEGVRFHKYPSDIAMVRKWATNLKHRSMQASSHGFLVCQSHFPAECFDPETGDLRDDAIPVAGSVTLPLHCLVRGCSVDSCGKGAPRRLLFKVPKKNNRVRDAWAHNLWMHPIELMGEQHICERHFEAHCVNEQKLLHAGSVPTLHLGHTEPLELLPNPHTFNECRQEECVCCVPGCGRTNRKDLLAELQFSKFPKWRVLYDKWLHNFRLEVSKEQRIATLRVCHTHFEESCFEPGGQGTVRRGAMPTLQLGHSHPDIYRTDKGSLWKKVHKRFSDCCYPDCYEECHKANTNRMVYELPGEGPLREAWQQHLGIRIPDSCSSVLLRLCALHYIMLYEHSEQNLPEHAADLLPLASNYAHARQLAYLRRFMCAVQGCRHLQPRDGGSMHGIPRRRQILRMWVENAQLRLNEHEIYMTKLCSKHFETHCLFEGKKCYPWSVPTLHLPELPPGQVLHQNPTTEEWQEMKQRMKMEEQTLQAEQQVDGGRLQVEPYVKMEPHDDDDDDNGSQTESELHINESTMDDSQEMDFHANEPLEVLLEVGHVERLESYEKKDYPAVSYEPPKRFRHPYSAHKCSVAGCGVSLEDVGGNLKLHKLPSGTEAARKWLYNIQVDIEDKWRIRVCSHHFDGQCLNGSRLRRGSMPTLLLGPRVPTTIPIHQNEFAQLQLDDATPEAAAVPNGAIHVEPSIGKVLHPCVPRPSPPRKSSKFCQIEGCANHLTSEHMTLHKFPHSSWICTKWQHNTQVPFDPEYRWRYRICSAHFHPVCMVNMRLLHGSVPTLKLGPRAPAELFDSDFEAINIKIEKLEKMERKAEARRVSTSYSHHPTMPDMGEVRLKVKTEELEDGGEAMQEEQEEEDAMLYLEPEMQLYEDQEEEEQQQQQQEKPQVNGGWKTELRLPTKGRVAFNPVRSGYDKCSLMHCQRQRSKHGVHIYKFPRSQEHQQRWMHNLRIRYDEKRPWKFMVCSVHFEPHCIRLRKLRPWAVPTLELGDNVPEDIYTNEQCQMFASGQTGGEINGINDSDAEAEAESDDGLQEDEDEETDDQEPSTAKKRRRRRSRLDAAGWPAGQVPPWKVKQCCLPYCRSPRGDGIKLFRLPNKVNSIRNWELATGMKFKESQRNTRLICSRHFEPELIGVRRLMRNAIPTRHLGPTAVTGDVKPVVAPPSTAGPKCCMADCAYDVADVKLHKFPSNPKLLREWCQALRVTDMQRYRGKHICSAHLPVHKAVDCLVCGTDSVPLLPMLNFPANRNQRAKWCYNLKIETIPKWDISKHICCKHFEPYCFAAAGLLKPEAAPTLHLNHNDTNIFLNDCAINPAAGVLRVKDEPMDNQVLSLL

Similar Transcription Factors

Sequence clustering based on sequence similarity using MMseqs2

100% Identity: iTF_00536072;
90% Identity: iTF_00563936;
80% Identity: -