Basic Information

Insect: Drosophila tsacasi
Gene Symbol: -
Assembly: GCA_018904565.1
Location: JAEIHY010016591.1:27421-40713[-]

Transcription Factor Domain

TF Family: THAP
Domain: THAP domain
PFAM: PF05485
TF Group: Zinc-Coordinating Group
Description: The THAP domain is a putative DNA-binding domain (DBD) and probably also binds a zinc ion. It features the conserved C2CH architecture (consensus sequence: Cys - 2-4 residues - Cys - 35-50 residues - Cys - 2 residues - His). Other universal features include the location of the domain at the N-termini of proteins, its size of about 90 residues, a C-terminal AVPTIF box and several other conserved residues. Orthologues of the human THAP domain have been identified in other vertebrates and probably worms and flies, but not in other eukaryotes or any prokaryotes [1].
Hmmscan Out: # of c-Evalue i-Evalue score bias hmm coord from hmm coord to ali coord from ali coord to env coord from env coord to acc

1 29 7 2.2e+04 -3.7 2.0 49 60 321 334 306 351 0.58

2 29 2.4e-15 7.5e-12 46.1 4.0 1 86 547 619 547 620 0.85

3 29 9e-15 2.8e-11 44.3 5.0 1 87 647 716 647 716 0.83

4 29 8.2e-16 2.6e-12 47.6 0.2 1 87 738 810 738 810 0.85

5 29 5.6e-16 1.8e-12 48.1 5.3 1 87 909 979 909 979 0.82

6 29 1.9e-15 6.1e-12 46.4 3.6 1 86 1003 1074 1003 1075 0.82

7 29 2.2e-13 7e-10 39.8 1.1 1 87 1110 1178 1110 1178 0.81

8 29 6.3e-11 2e-07 32.0 1.6 1 86 1220 1289 1220 1290 0.77

9 29 4.4e-17 1.4e-13 51.7 0.4 1 86 1317 1386 1317 1387 0.82

10 29 7.2e-13 2.3e-09 38.2 1.4 1 85 1408 1476 1408 1478 0.79

11 29 6.8e-15 2.1e-11 44.7 0.5 1 86 1505 1576 1505 1577 0.85

12 29 1.6e-12 5e-09 37.1 3.7 1 85 1654 1722 1654 1724 0.82

13 29 1.5e-12 4.9e-09 37.1 0.1 1 86 1747 1815 1747 1816 0.83

14 29 3.9e-13 1.3e-09 39.0 2.2 1 87 1963 2032 1963 2032 0.80

15 29 1.3e-12 4.1e-09 37.4 0.0 1 87 2127 2201 2127 2201 0.83

16 29 0.00013 0.42 11.7 0.4 1 61 2216 2268 2216 2283 0.73

17 29 1.2e-12 3.9e-09 37.4 0.2 1 87 2295 2366 2295 2366 0.79

18 29 1.4e-12 4.5e-09 37.2 0.3 1 87 2418 2488 2418 2488 0.81

19 29 6e-12 1.9e-08 35.2 0.1 1 86 2523 2597 2523 2598 0.80

20 29 1.1e-12 3.4e-09 37.6 0.0 1 86 2608 2681 2608 2682 0.81

21 29 4.1e-11 1.3e-07 32.6 0.0 1 85 2707 2779 2707 2781 0.68

22 29 5.7e-05 0.18 12.9 0.1 1 58 2810 2860 2810 2881 0.81

23 29 6.1e-12 1.9e-08 35.2 1.0 1 86 2900 2971 2900 2972 0.83

24 29 3.8e-16 1.2e-12 48.7 0.3 1 86 3084 3156 3084 3157 0.81

25 29 2.9e-12 9.1e-09 36.3 3.5 1 86 3220 3290 3220 3291 0.80

26 29 2.6e-14 8.2e-11 42.8 5.0 1 86 3383 3453 3383 3454 0.84

27 29 3.8e-12 1.2e-08 35.9 0.2 1 86 3533 3602 3533 3603 0.85

28 29 1.7e-10 5.3e-07 30.6 0.6 1 58 3628 3676 3628 3685 0.83

29 29 3.2e-10 1e-06 29.7 1.0 18 87 3694 3752 3683 3752 0.77

#	of	c-Evalue	i-Evalue	score	bias	hmm coord from	hmm coord to	ali coord from	ali coord to	env coord from	env coord to	acc
1	29	7	2.2e+04	-3.7	2.0	49	60	321	334	306	351	0.58
2	29	2.4e-15	7.5e-12	46.1	4.0	1	86	547	619	547	620	0.85
3	29	9e-15	2.8e-11	44.3	5.0	1	87	647	716	647	716	0.83
4	29	8.2e-16	2.6e-12	47.6	0.2	1	87	738	810	738	810	0.85
5	29	5.6e-16	1.8e-12	48.1	5.3	1	87	909	979	909	979	0.82
6	29	1.9e-15	6.1e-12	46.4	3.6	1	86	1003	1074	1003	1075	0.82
7	29	2.2e-13	7e-10	39.8	1.1	1	87	1110	1178	1110	1178	0.81
8	29	6.3e-11	2e-07	32.0	1.6	1	86	1220	1289	1220	1290	0.77
9	29	4.4e-17	1.4e-13	51.7	0.4	1	86	1317	1386	1317	1387	0.82
10	29	7.2e-13	2.3e-09	38.2	1.4	1	85	1408	1476	1408	1478	0.79
11	29	6.8e-15	2.1e-11	44.7	0.5	1	86	1505	1576	1505	1577	0.85
12	29	1.6e-12	5e-09	37.1	3.7	1	85	1654	1722	1654	1724	0.82
13	29	1.5e-12	4.9e-09	37.1	0.1	1	86	1747	1815	1747	1816	0.83
14	29	3.9e-13	1.3e-09	39.0	2.2	1	87	1963	2032	1963	2032	0.80
15	29	1.3e-12	4.1e-09	37.4	0.0	1	87	2127	2201	2127	2201	0.83
16	29	0.00013	0.42	11.7	0.4	1	61	2216	2268	2216	2283	0.73
17	29	1.2e-12	3.9e-09	37.4	0.2	1	87	2295	2366	2295	2366	0.79
18	29	1.4e-12	4.5e-09	37.2	0.3	1	87	2418	2488	2418	2488	0.81
19	29	6e-12	1.9e-08	35.2	0.1	1	86	2523	2597	2523	2598	0.80
20	29	1.1e-12	3.4e-09	37.6	0.0	1	86	2608	2681	2608	2682	0.81
21	29	4.1e-11	1.3e-07	32.6	0.0	1	85	2707	2779	2707	2781	0.68
22	29	5.7e-05	0.18	12.9	0.1	1	58	2810	2860	2810	2881	0.81
23	29	6.1e-12	1.9e-08	35.2	1.0	1	86	2900	2971	2900	2972	0.83
24	29	3.8e-16	1.2e-12	48.7	0.3	1	86	3084	3156	3084	3157	0.81
25	29	2.9e-12	9.1e-09	36.3	3.5	1	86	3220	3290	3220	3291	0.80
26	29	2.6e-14	8.2e-11	42.8	5.0	1	86	3383	3453	3383	3454	0.84
27	29	3.8e-12	1.2e-08	35.9	0.2	1	86	3533	3602	3533	3603	0.85
28	29	1.7e-10	5.3e-07	30.6	0.6	1	58	3628	3676	3628	3685	0.83
29	29	3.2e-10	1e-06	29.7	1.0	18	87	3694	3752	3683	3752	0.77

Sequence Information

Coding Sequence: ATGTCACAACACAACCCCAATCACGCCCACCCACACTACCACTACCCGTCCCATACGACGCCGCTGGCTNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNGTACTCACATGTTGCTTCCTACCCAACAGCCTCCCACTCCCACCCCCTCTCTCACTCGGCCTTTGGCCCTGCGCCCCCTTGCAAGGCCAGCATAAGCAACAACAACTCAAACAACATTATGGGTGGCTACGGAGCAGTGGGAGGGGGTGGAGGCTCGCATGGATATTTCGGCGCCGCTGGCGGTGGCCTCAATGTCAGCGGGGCGGGGGGTGGTGCTGGGTCGTCCTACGGCCTTGGGGCCAACACGGTGGCATATGCTCACAACNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNCCTCGGCCTGGGCCAGCGATCCTATATGGGCCACGATGTCATGGCCGGGAGCTATCCCTATATCAAGAGCGAACCCCTGGAGGGGTTCCAGCAGCCGGCCAATCCAATGGCCCCACCCCCGGCCCCAGAAATGATAATAAAATCGGAACCCATTGACGACCTGGCCTACAAGTCAAACTACATAGACGACAATACGCCATTCGCGGACTTCAGTAAGTTTAGCGAATTCAGCGAAGACATGCTGAGTCCCAAAGTCGAGCTGACAGTCAAGGATGAATCCTTTGTCAGGAACCCCAATAACTTCTTACGCCGCAAGCAGCAATCGGATCTGACGACAGCAGAGAGCCTGCCCGTCTGCCAGCGCTGCAAGGAGGTGTTCTTCAAAAAGCAGACCTATCTGCGGCACGTCGCCGAAAGCAACTGCGGCATCCAGGAGTACGACTTTAAGTGCACCATCTGCCCCATGTCCTTCATGAGCGCCGAGGAACTACACCTGCATAAGCAGCAGCATCGAGCGGACAGGTTTTTTTGCCACAAGTACTGCGGAAAGCACTTCGGCACGATCACAGAGTGCGAGGCACACGAGTACATGCAGCACGAATACGAAAACATTGTTTGCAACATGTGCTCGGGATCTTTCTCCACGCGGGAACAGCTGTATGCCCACTTGCCGCAGCACAAGTTCCAGCAGCGCTTCGACTGTCCCGTATGCCGCTTGTGGTACCAAACAGCTCTGGAGTTGCACGAGCACCGCCTGGCTGCACCCTACTTCTGCGGTAAATACTACGCGGGCGGACAGTCTCCGTCCCCGTCCGCCCAACAGCAACAGCATCAAAACCAGACGAACTACAAGCTGCAGGACTGTCATATGGCCACCATGGAAATGCCAAGCGTACCGCTTCTTAAGGCGAACCCATCCAACTCGCCTGCCTTGCCCGCGACTGCAGCGCTAAATTCACTGCTGCAACAGCGCCAGGCCAATGCCGATGGAGCGGCCATTTTTGCCGCATCTTCGCTGAAGAACGAGGTCGCTGTGAAGCTGGAGCGCAGCTACAGTAACTCGACGAATGAATCCTCCTATAGCGTCCAGGAGAGCAGCTACAATAATGTGTATGGCAGCAGCGACAGCTCAGCACACGGTGCCATCGCCGGACCACAGGCACACTCTTCGACGCTGGACGACTCCGAAGATGCGCTGTGCTGTGTGCCACTGTGTGGGGTGCGGAAGAGCACGAGTCCCACCTTGCAGTTTTTCACGTTCCCGAAGGACGAGAAGTATCTCAACCAGTGGCTGCATAACCTCAAGATGTTCCACATACCCGCGTCCAGCTACGTTAGTTTCCGGATCTGCAGCATGCACTTCCCCAAGCGATGCATCAACCGCTACTCGCTGTGCTACTGGGCGGTGCCGACGTTCAACCTCGGACACGACGACGTAGCCAATCTCTACCAGAACCGAGAGCTGACCAACACATTTACCACTGGCGAAGTGGCGCGGTGTAGCATGCCGCACTGCACAAGCCAGCGGGGTGAGAGCAACCTCAAGTTTTACAACTTTCCCAAGGACATCAAAAGCCTGATTAAGTGGTGCCAAAACGCCCGCCTCCCAGTGCAGGCGAAGGAGCCGCGACATTTCTGCAGCCGCCATTTTGAGGAGCGGTGCATTGGCAAGTTCCGACTGAAGCCTTGGGCGGTGCCCACCCTGCACCTGGGCGCCCAGTACGGCAAGATCCACGACAATCCAAAGAATCTGTATGTGGAAGAGAAGCGCTGCTGCCTCAACTTTTGCCGTCGGAGCCGCTCCTCTGACTTCAATATGTCGCTATATCGATTTCCCAGAGACGAAGTCCTGCTTCGTCGCTGGTGCTACAATCTTCGCCTCGATCCGGGAGTGTACCGCGGAAAGAATCACAAAATATGCAGCGCCCACTTTATAAAGGAGGCGTTGGGTCTCCGTAAACTATCTCCTGGTGCCGTGCCCACACTTCACCTGGGCCACAATGATACCTTCAACATCTACGAGAACGAACTGTGGCCACCGCCAACACCGACACCCTCCTCTTGTCACCTCCAACAGCAGCAGCAGCAGCCATCCCTGCATTCGCTGCAACAGCAGATGCACAGCAAGTCCTACCAGCGCCGTTCGGTGGCATCCACTTCATCGTCGGCGAGCTCGGCAGCCTCGCATTACGTAGACCCGGAGATGAGCGCCTCTTACCATCTGGCCATGTCCGCCTCCGCCGGTGGCTCGGCGACGATCAACGCCAGCGACAGCATGGACGTCTGTTGCGTGCCAAGTTGCGAGAGCAAGCGACACAATAGCGAGAACATTACATTCCACACGATTCCGCGACGGCCCGAGCAGATGCGCAAGTGGTGTCACAACCTTAAGATTGCCGAGGACAAGATGCACAAGGGCATGCGAATCTGTAGCCTGCACTTCGAGCCCTACTGCATCGGCGGCTGTATGCGACCGTTTGCAGTGCCCACCCTTCACTTGGGCCACGACGACGACGATATTCACCGCAATCCGGACGTGATCAAAAAGCTGAACATCCGGGAAACGTGCTGCGTGGCTGTGTGCAAGAGGAATAGGGACAGAGACCACGCCAACCTGCATCGTTTCCCTAGCAACGTGGCGTTACTGAAGAAGTGGTGCGCTAATTTACAGCGCAGCGTTCCCGATGGCAGCAAACTCTTCAATGATGCCATCTGTGAGGTGCACTTTGAGGATCGGTGCCTGCGCAACAAGAGACTGGAGAAGTGGGCAGTGCCCACATTGATCCTGGGACACGAGGACATTCCCTATCCGCTGCCCACGCCGGAGCAAGTGACCGAGTTCTATGCCCGCCCCTCGGCTCCGAACAATGGAGAGGAACAGGGCGAGTGCTGTGTGGAGACCTGCAAGAGGAATCCCAGCGTCGACGATATAAAGCTGTACCGCCCTCCGGAGGACGCTGCCGTGCTGGCCAAGTGGGCGCACAACCTGCAAACGGAGGCCAACCAACTGACAAGCATGAGGATCTGCAATCTTCACTTCGAGGCGCATTGCATCGGCAAGAGGATGCGACAGTGGGCCATACCGACTTTGAATCTAGCCGGCAACATCGAAAATCTTTACGAGAATCCAGAGCAATCGTTGCTCTACAGGCGACGCACGACCCACTTGAAGGCGAAGCTGCCGCCAACCTCCGTGAAACCCACCTGGGTGCCCAGGTGCTGTCTTCCGCATTGTCGCAAGGTCAGAGCCCTGCACAATGTCCAGCTATATCGCTTCCCCAAGCTCAATCGGTCCACATTGGCCAAGTGGGCTCATAATCTCCAGGTTCCAATGGTGGGCAGTGCCCAGCGCAGGCTGTGCTCGGCCCATTTCGAGCCTCATGTACTCAGTAAAAAGTGTCCGGTGCCGCTGGCGGTGCCTACGATCGACCTAAATTCACCACCCGGCTTGAAAATCTACCAGAATCCGGCCAAGCTGAAGGCCAGCAAACTATGCCTGCAGCGGGTTTGCATCGTCGAGAGCTGCCGCAAGACGCGGGCGCAAGGCGTGCAGCTTTTCCGGCTGCCGCACAGCCCCACACAGCTACGGAAGTGGATGCATAACATAAGGACGCGGCCACGAGCAGCTATGCGGGCTCAGTACCGGGTCTGTTCCCGCCACTTTGAGACGCATTCATTCAATGGCCGAAGACTGAGTGCAGGTGCCATTCCGACGCTAGAACTGGGCCACGATGGCGACGATATCTATCCGAATGAAGCGCAGGCATTTGTGGACGAGCATTGTGCTGTCGAGGGCTGCGAGGCATCCAAGGAGCAGCCGGAGGTGCGACTGTTCCGCTTCCCCACCGACGACGACGATATGTTGTGGAAGTGGTGCAATAACCTGAAAATGAATCCTGTGGACTGCATTGGGGTACGCATCTGCAACAAGCACTTTGAGGACGATTGCATCGGTCCCAAGCACCTGTACAAGTGGGCCATTCCCACGCAGGAGCTGGGCCACGACGACGCGCAGATCGAGCTGATCCCGAATCCTAAGCCAGAGGAGAGGTATGTGGATCCCGTCTTCAAGTGCATCGTTCCCACTTGCGGCAAGACTCGACGGTTCGACGAGGTGCAAATGAACAGCTTTCCCAAGGACCCGGATCTTTTTCAGCGATGGCGGCACAACCTGCGCCTGGAACATCTCAGTTTCCAGGAGCGCGAGCGCTACAAGATCTGCAACGCTCACTTCGAGGAGATCTGTATTGGGAAGACACGGCTAAACATCGGCTCCGTTCCAACCTTGGAACTTGGTCATGACGATGAGAATGATATCTTCCAAGTAAATCCAGCGGAGCTGCAGAGCAATTTATTCGGGCGACAGCGTCGACTGCTGCTCGAGAAATCCGGCGAACTGAGTGTCAAGCAAGAGCTGTCAGAGACGGAGGACAACAACCAAGCGGATGATGCGGGTGTGACGTCCACAGGATCCATTTCCAAGCAGGTCAAGATCAAGAGATCTACTTCGGATCTAAAGTGTTGTGTGCACAGTTGTGGAAGAAGTCGCTTGGAGCACGGGGCACGGCTGTTCCCCTTCCCTACCGGCAAGCAGCAGCACCTAAAGTGGCGTCACAACCTGCACCTGGAACCAGAGGAGGTGGACCGGTCGACCCGCGTTTGCAGCGCCCACTTTAATCGACGTTGCATCGAGGGCAAACAACTAAGGAGCTGGGCGATGCCCACCCAACAGTTGGGTCACAACGACCAACCGATCTACGAAAACCCAAAGAACATACCGGGATTCTTCACACCCACCTGTGCCCTAGGACACTGTCGCAAGCGAAGGAGTATTGACAACGATCTGCGTACCTATCGGTATCCCAGGAGCGAGGATCTTTTGGAAAAATGGCGAGCTAATCTACGGTTGGCTCCGGATCAGTGCCGTGGTCGGATCTGTGCAAATCACTTCGAACCGCAGGTGCGAGGAAAGCTAAAGTTAAAGACGGGAGCGGTTCCCACACTACAACTGGGACACGATGAGGGATTAATCTATGACAATGAAGCTATTAAGGCTGGCATGGCCGAAGAAGAGGAGGGCATAACCACAGAGTTCCCGAGACTGAAACTGAAAAAAGAGGTGTTCAATGAGGAGGAGGAGGAGGGCGAAGGTAATGATGGCGAGCATCAGAACCCCGATGACCTGGATGATAATGCAGATGAAGAAGACAAAGATGATGAGTATTTCGATCCCCTTGAGCTGGTCGAGACTTTTGCTGAACATCGCAGCGATGACGAAGCTCAAGACTATGAGGCTGAAGAAGACGAGGCTCGTATTGAGGACGCTCCCTCCGGGTACGATGTTAATGCGGAGATAGAGAAGCTTCGAAGCTCCCCACCTTCCCCTCTTCCTCGACGGCACCAAGCTCCGCGGCGTGACAAGCCGGCTAACAATGTAACGCCCATTTGCTGCCTCAAGCACTGCAGAAAGGAACGCACTGCCTTCCACCTGCTGAGCACTTTCGGCTTCCCAAAGGACCGTCAGTTGCTGCTAAAATGGTGTGTCAATTTGCACCTAAACCCGGACGACTGTATCGGTAGGGTTTGCATCGAGCACTTCCAGCCGGAAGTACTCGGCACCCGTAAGCTCAAGCAGAATGCGGTGCCCACTCTTAACGTGGGACATGAGGAACCGCTTAGGTACTCGTGCCATGGCGTGGACCTGAATCTCGAGGAGCGGGACCCCCAGCCACAGCATTCGGTTTTTCGGCTTTGGAGCCTGAAACACTGTCGGAAAAGGAAGCTAACGGAGCCACCGGATATTCCCCTAGCCAAGAGGAGAGCACTGGAGATGCCGATAATGAAGCGAGAGTGGGAGATGGAGATGGAGATGCAAACGCAGATGGAGAGGAAGAAAGAGGCAAAGAGAATGACTCAAACTGAAAGTGAATCTCATATATGCTGTATAGGCAGTTGCGGAAGCAAGGAAGTTAGTCAATTGCTGCCTTTTCCCGAGGAGAAGACCCTGCTAAGAAAGTGGAGCCATAATTTAAGGCTGCCGCCTGAGACTGACAGCACTGCTCTAAGCCTGAAAAGAGTTTGCTTGGCTCACTTCGAATCACAGCTGTTAGAGAATGGCAAGCTCACGAGGCAAGCAGAGGCAGAGGCTGTGCCCACCTTGAACCTGGGTCACAGCAGCTGGAACCTATACAGGACCAATGGGATCTGCCTAGTGCCTGACTGCAACCACAATACCTTCGGACGCATGAGCTTCTTCGATCTACCGGATAATAGTATAATTAGAGACGCTTGCTTTTCCTGCCTCAACCTACCTGAACCCTACGAGGAGCAGGCAAGACTATGTCGTATCCACTTTATGGAGGCATACAAGAAGTTTGACCTTCCTAACGTTCTGCACCCTCAAGTCATAATGGCGGTACAAAGTGCTGTGGACGAACTACAATGCGCGGTGCCCGGCTGCTGTTTCGAAAATGCTGATAAGGATTTTCACCTAATCCAGCTTCCCAATAACAAGGAGGTGCTGTCGAAATGGCTGCGCAACACCAAGGTTCCATATGATCCTTCAAGGCACCAAAGCTATCGCATTTGCACGCTCCACTTTGAATCAGAGTACTTGGATTCGAATGGCCCGCTAAAAGGGGCTATACCGACGCTGCATCTAAACCATGAAGATGAGATTCTCTTGAACACCAGACCTTTGCCAGAGGAGCAGGACTCTATGTTGAGTCCACTGCGGATAAAGACGGACCTAGCTTTCCTGGGCAGTCCCTGTGCAAGTGCAAGCCCCAGTCCCCGGGGCAGGATTCGAATATGCTGCATTCCCACATGTGGACAGTTTGGAAGCAGTCAAGTGAGGCTGTTTCGTTTTCCCACCGAGGAGCAGGCTTTGCTTCGGTGGCTGGTGAATACACAACAGCAGCCAAGACTGGTAGATCCCATGGACTTGTATGTGTGCCAGTTGCATTTTGAGCCCGAGGCTATTTGCCTGAAGCAACTTCGAAGCTGGGCTGAGCCCACCTTAAACCTGGGACACGACGGATATGTAATCCCAAATGCAAAACACAATGGAAATATTTCCGACAGCCAAGATACAGAGCAAGCCATGAGGTTTATTCGCGAACGCTTCTGCTCCGTCATTTCCTGCTTTCAAGCAGGAGGACAGGAGGAGGAGGGGGTGAGACTATTTGATTATCCCGAGGACATGGCGACCACTCGAAAGTGGGCAGCGGCGTGCAGACATCGCTCCATGCAGGCCAGGAGCCATGGGTTCAAGGTGTGCCAGTTTCACTTCGCTAAGGAATGCTTTGACCCCAACACTGGAGAATTGATTGAGGGCGCGGTCCCCACCCTGGAGTTGAGCAGAGATGAAATGGAGCGGCAATGTCTTGTGGCTGGATGTGTAAAAAATGATGCCAATGGAGCCCGTCTCCGCTACTTTAAGATACCAAAAGTTGCTGCTCAATTGGAAGCGTGGAGCAACAACCTTAAAGTCCATCCAACGGATCTCATGCAGGGGGAGCAGCAGTACATCTGCGAGAAACATTTTGAGCCGTTCTGCTTTGGGGCCAACAAGGGCCTGCGTTCTGGTGCTCTTCCAACCCTCCTGCTGGGTCATGATGAGGGGGTGGATATGCTTCCAAATCCGGAAAGCCTCTTCTGCCAAAATAAGACGGATAAGTGCTGCGTACCAGGCTGCGGGCGTGTTTGGCAGAATGGGGACCGTAAGTTTCGTGGATTTCCCAAATTGTTGGCCATGGCCAAAAAATGGCAGCATAACCTTCGTTTGGAAGCGCCCGTGGAGCAACTCGGCAAGCTGAAGGTCTGCAATGCTCATTTTGATACCACATCACCCAACATGGGTACAAATGGACTAAGCTCTAGTGCCTCGATACCAACATTGGATTTGGGTCATTCTTCTCCGGATATTTACCCAGCGGACTTGAACTTAAAGTTCCAAAAGCGGTCGGGAATACCGGCAAAAATTTATTGTGGTTATCCCAAATGCGAGGAAACCTGTTTGCCCAAAAACCATTCCTACGGACTTCCCCAGGAGGAGCATCTGAGGAATGCCTGGCTAAACCATATGGAAATAGAAAATCCGAAAGACGAAGGAGTCGTACTGCTTTGCCCGCTGCACTTTGTCATCCTCTACCAGTACAGTGCCACACACTACCCGGAGCATCATGCTTTAAGTCGGATTATTCTTGATGACAATTACAAGGAAGCGCGGAACAACAGGCGCGTGAAGATTGTGAGTTGTACGATCAAGGGCTGCGACACGGTTAAACCCCGGGATGGAGTACCACTGCACGGCATGCCGCAAAGCAAAGAAATCCTGCAGATGTGGATAGACAATGGCCAGTTTGATTTCTTAGAGCAACAGCGGTATATGTTCAAGGTGTGTCACAATCATTTTGAGCCACGCTGCTTCTTTGACGACAGACGTTTGCATTCATGGAGCGTGCCCACTTTGTGTCTACCTGGCGAAGTAATTCACCAAAATCCTACCGCCGAACAATGGCAGAACATGATCAACAAGCAAGCAGCAGCAAAAACATGCGCAGAAGATCCCGAGGAGCCCGATCTATATGGGGCTGTGGTTAAAACCGAACCCATTTTAAAGATGGAGCATATCGAATCGGAATATGAAGATGAGACCCCAGAGATGCAGGCCCTTGAGGTCCTCCTGGAAGTTGGCCATGTCGAGCGAATGGAGAGCTATGAGAAAGTGGATAAATCGCCGCTGATCTATACCGATAATGCACCCTTCCGATCATCACCCATACGTTGCCCATACAATGCTAATCACTGTGCCGTAGATGGATGTCAGGTGACCGCCGAGGATGTGGACGGCACGATCAAGCTGCACAAATTCCCTGCGTCACAAGAAGCCTCACAAAAGTGGATGCACAACACCCAAGTTGACATGGACGAAAAGTACTGGTGGCGTTACCGCATATGCAGTTACCACTTCGATCAAGAGTGCTTTCAGAGCGCTAGGATTCGAAAGGGAGCGATGCCCACGCTTTTATTAGGCCCTCGGCGACCGGACAAGGTGTACGATAATGAGTTTTCACTACCAGAGGGGGAAGAGCCTTTTCTAGAGTCACCGGACACTCAGCTGGAGGAAGATACGACTGTAGTATCAAGAGTTCGAAAGGAGGTGTCCAATTTATGCCTGCCCCCAAAGGCACCGCCTCGAAAGTCAAGCAAGTTTTGCCAGATTGATTCCTGCACGAACCACTTAACCACTGAGAATATGACACTTCACAAGTTTCCCCACTCGGAGGACATGTGCCTCAAGTGGCAGCACAACACGCAAGTGCCATTTGACCCCTACTACCGTTGGCGTTACCGCATCTGCAGTGCGCATTTCCATCCGGTGTGTTTGGTCAACATGCGTCTAGTCCACGGAAGCGTTCCCACTTTAAAGCTGGGTCCCAAGGCTCCTTCAGAGCTGTTTGACAACGATTTTGAAGCCATTAACCTAAGGCTGGATAAAAGGTTGACAGAGTCCAATGCTAATGTGTATATCAAGCATGAAAGAAGGGAGGAGGATGAGGACTCGATGATGTTCCCCGAGCCCGAGCTCCAGGTACACGAGGATCAAGACGATAAGATATCAAGCTGGAACAGCAAACTGCAATTACCACCTGTGAAGCAAGAGAAAATTATATACAGCCAAATCAAGTCTGGCTATGATAAGTGTTCGCTGGCTCATTGCCAGCGGCAAAGGTCCCAGCATGGCGTCCACATTTATAAGTTTCCTAGATCGAAACATCAACAGGAACGTTGGATGCACAACCTTCGCATCCGCTATGATGAGCGGACACCGTGGAAATTCATGATCTGCAGCGTGCACTTCGAACCACACTGCGTCAGCCTAAGGAAACTGCGACCTTGGGCGGTTCCCACACTGGAACTGGGTGACAATGTACCAGAGACAATCTTTACCAACGAACAGTGCGAGGAGGAGCTGGTGACCGATCGCAGTGAGCTTGATAGCGACGTGGACGAAGAGGACGGCTTACAGGAGGACGACGATGATGACGACGAAGACGATGTTAAGCCGGATGTTATTGGCATAAAAAGGAGGAGGCGTTTCAAGATAGACTCCGGCTGCCCTAGCCAGATTCCACCCTGGAAAGTCAAACAATGCTGCCTCCCCTATTGCCGTGCCTTCCGAGGCGATGGCATCAAGCTATTTCGGCTTCCGAACAACCGAAACTCCATTAGCAACTGGGAAAGGGCCACCGGAATGGTATTTAAGGAGTCTCAACGAAACACTCGCCTGATATGCAGCCGTCACTTCGAGCCAGAGCTAATTGGAGTCAGGCGTCTAATGCGTAACGCCATTCCCACGAAGCACTTGAACCCTCAATCAGTTGACCAGATCCGTACTAAGAAGGAAAAGAATCCTCCTGCCACTATTTTACCCATATGCTGCATGGCTGACTGCCACTACAACGGAAATGTGAAGCTGCACAAGTTTCCAAGCGATCCCACTCTTCTTAAACAGTGGTGCCAGGCTCTCCGGCTCACTGATACACAGCGGTATTTGGGCAAGCACATTTGCTCCATGCACCTGCCAATGAACAAGACGCTGAGCTGTGTCATTTGCGGTGGGGACAACGTAGAGTTGCCGATGCTAGGGTTTCCGGAAAACCGCAACCAGCGCGCCAAATGGTGTTACAATCTCAAAATTGAGGCAATACCAAAGTGGGACCACTCAAAGCACATTTGCTGCCGGCACTTTGAGCCCCATTGCTTTGACACCCCGGGTGAGCTGCGTCCAGGAGCGGCTCCCACGCTCCATCTCAATCACGACGACACAAACATATTCTTCAGCGACTATGCCACTGGTCTTCCGTCCTCGCCACTAGGCAATCAAATTAAAGACGAGCCCCAGGAATCGGAGTCCGACGAGACGCTGCTGGTGTAG
Protein Sequence: MSQHNPNHAHPHYHYPSHTTPLAXXXXXXXXXXXXXXXXXYSHVASYPTASHSHPLSHSAFGPAPPCKASISNNNSNNIMGGYGAVGGGGGSHGYFGAAGGGLNVSGAGGGAGSSYGLGANTVAYAHNXXXXXXXXXXXXXXXXXXXLGLGQRSYMGHDVMAGSYPYIKSEPLEGFQQPANPMAPPPAPEMIIKSEPIDDLAYKSNYIDDNTPFADFSKFSEFSEDMLSPKVELTVKDESFVRNPNNFLRRKQQSDLTTAESLPVCQRCKEVFFKKQTYLRHVAESNCGIQEYDFKCTICPMSFMSAEELHLHKQQHRADRFFCHKYCGKHFGTITECEAHEYMQHEYENIVCNMCSGSFSTREQLYAHLPQHKFQQRFDCPVCRLWYQTALELHEHRLAAPYFCGKYYAGGQSPSPSAQQQQHQNQTNYKLQDCHMATMEMPSVPLLKANPSNSPALPATAALNSLLQQRQANADGAAIFAASSLKNEVAVKLERSYSNSTNESSYSVQESSYNNVYGSSDSSAHGAIAGPQAHSSTLDDSEDALCCVPLCGVRKSTSPTLQFFTFPKDEKYLNQWLHNLKMFHIPASSYVSFRICSMHFPKRCINRYSLCYWAVPTFNLGHDDVANLYQNRELTNTFTTGEVARCSMPHCTSQRGESNLKFYNFPKDIKSLIKWCQNARLPVQAKEPRHFCSRHFEERCIGKFRLKPWAVPTLHLGAQYGKIHDNPKNLYVEEKRCCLNFCRRSRSSDFNMSLYRFPRDEVLLRRWCYNLRLDPGVYRGKNHKICSAHFIKEALGLRKLSPGAVPTLHLGHNDTFNIYENELWPPPTPTPSSCHLQQQQQQPSLHSLQQQMHSKSYQRRSVASTSSSASSAASHYVDPEMSASYHLAMSASAGGSATINASDSMDVCCVPSCESKRHNSENITFHTIPRRPEQMRKWCHNLKIAEDKMHKGMRICSLHFEPYCIGGCMRPFAVPTLHLGHDDDDIHRNPDVIKKLNIRETCCVAVCKRNRDRDHANLHRFPSNVALLKKWCANLQRSVPDGSKLFNDAICEVHFEDRCLRNKRLEKWAVPTLILGHEDIPYPLPTPEQVTEFYARPSAPNNGEEQGECCVETCKRNPSVDDIKLYRPPEDAAVLAKWAHNLQTEANQLTSMRICNLHFEAHCIGKRMRQWAIPTLNLAGNIENLYENPEQSLLYRRRTTHLKAKLPPTSVKPTWVPRCCLPHCRKVRALHNVQLYRFPKLNRSTLAKWAHNLQVPMVGSAQRRLCSAHFEPHVLSKKCPVPLAVPTIDLNSPPGLKIYQNPAKLKASKLCLQRVCIVESCRKTRAQGVQLFRLPHSPTQLRKWMHNIRTRPRAAMRAQYRVCSRHFETHSFNGRRLSAGAIPTLELGHDGDDIYPNEAQAFVDEHCAVEGCEASKEQPEVRLFRFPTDDDDMLWKWCNNLKMNPVDCIGVRICNKHFEDDCIGPKHLYKWAIPTQELGHDDAQIELIPNPKPEERYVDPVFKCIVPTCGKTRRFDEVQMNSFPKDPDLFQRWRHNLRLEHLSFQERERYKICNAHFEEICIGKTRLNIGSVPTLELGHDDENDIFQVNPAELQSNLFGRQRRLLLEKSGELSVKQELSETEDNNQADDAGVTSTGSISKQVKIKRSTSDLKCCVHSCGRSRLEHGARLFPFPTGKQQHLKWRHNLHLEPEEVDRSTRVCSAHFNRRCIEGKQLRSWAMPTQQLGHNDQPIYENPKNIPGFFTPTCALGHCRKRRSIDNDLRTYRYPRSEDLLEKWRANLRLAPDQCRGRICANHFEPQVRGKLKLKTGAVPTLQLGHDEGLIYDNEAIKAGMAEEEEGITTEFPRLKLKKEVFNEEEEEGEGNDGEHQNPDDLDDNADEEDKDDEYFDPLELVETFAEHRSDDEAQDYEAEEDEARIEDAPSGYDVNAEIEKLRSSPPSPLPRRHQAPRRDKPANNVTPICCLKHCRKERTAFHLLSTFGFPKDRQLLLKWCVNLHLNPDDCIGRVCIEHFQPEVLGTRKLKQNAVPTLNVGHEEPLRYSCHGVDLNLEERDPQPQHSVFRLWSLKHCRKRKLTEPPDIPLAKRRALEMPIMKREWEMEMEMQTQMERKKEAKRMTQTESESHICCIGSCGSKEVSQLLPFPEEKTLLRKWSHNLRLPPETDSTALSLKRVCLAHFESQLLENGKLTRQAEAEAVPTLNLGHSSWNLYRTNGICLVPDCNHNTFGRMSFFDLPDNSIIRDACFSCLNLPEPYEEQARLCRIHFMEAYKKFDLPNVLHPQVIMAVQSAVDELQCAVPGCCFENADKDFHLIQLPNNKEVLSKWLRNTKVPYDPSRHQSYRICTLHFESEYLDSNGPLKGAIPTLHLNHEDEILLNTRPLPEEQDSMLSPLRIKTDLAFLGSPCASASPSPRGRIRICCIPTCGQFGSSQVRLFRFPTEEQALLRWLVNTQQQPRLVDPMDLYVCQLHFEPEAICLKQLRSWAEPTLNLGHDGYVIPNAKHNGNISDSQDTEQAMRFIRERFCSVISCFQAGGQEEEGVRLFDYPEDMATTRKWAAACRHRSMQARSHGFKVCQFHFAKECFDPNTGELIEGAVPTLELSRDEMERQCLVAGCVKNDANGARLRYFKIPKVAAQLEAWSNNLKVHPTDLMQGEQQYICEKHFEPFCFGANKGLRSGALPTLLLGHDEGVDMLPNPESLFCQNKTDKCCVPGCGRVWQNGDRKFRGFPKLLAMAKKWQHNLRLEAPVEQLGKLKVCNAHFDTTSPNMGTNGLSSSASIPTLDLGHSSPDIYPADLNLKFQKRSGIPAKIYCGYPKCEETCLPKNHSYGLPQEEHLRNAWLNHMEIENPKDEGVVLLCPLHFVILYQYSATHYPEHHALSRIILDDNYKEARNNRRVKIVSCTIKGCDTVKPRDGVPLHGMPQSKEILQMWIDNGQFDFLEQQRYMFKVCHNHFEPRCFFDDRRLHSWSVPTLCLPGEVIHQNPTAEQWQNMINKQAAAKTCAEDPEEPDLYGAVVKTEPILKMEHIESEYEDETPEMQALEVLLEVGHVERMESYEKVDKSPLIYTDNAPFRSSPIRCPYNANHCAVDGCQVTAEDVDGTIKLHKFPASQEASQKWMHNTQVDMDEKYWWRYRICSYHFDQECFQSARIRKGAMPTLLLGPRRPDKVYDNEFSLPEGEEPFLESPDTQLEEDTTVVSRVRKEVSNLCLPPKAPPRKSSKFCQIDSCTNHLTTENMTLHKFPHSEDMCLKWQHNTQVPFDPYYRWRYRICSAHFHPVCLVNMRLVHGSVPTLKLGPKAPSELFDNDFEAINLRLDKRLTESNANVYIKHERREEDEDSMMFPEPELQVHEDQDDKISSWNSKLQLPPVKQEKIIYSQIKSGYDKCSLAHCQRQRSQHGVHIYKFPRSKHQQERWMHNLRIRYDERTPWKFMICSVHFEPHCVSLRKLRPWAVPTLELGDNVPETIFTNEQCEEELVTDRSELDSDVDEEDGLQEDDDDDDEDDVKPDVIGIKRRRRFKIDSGCPSQIPPWKVKQCCLPYCRAFRGDGIKLFRLPNNRNSISNWERATGMVFKESQRNTRLICSRHFEPELIGVRRLMRNAIPTKHLNPQSVDQIRTKKEKNPPATILPICCMADCHYNGNVKLHKFPSDPTLLKQWCQALRLTDTQRYLGKHICSMHLPMNKTLSCVICGGDNVELPMLGFPENRNQRAKWCYNLKIEAIPKWDHSKHICCRHFEPHCFDTPGELRPGAAPTLHLNHDDTNIFFSDYATGLPSSPLGNQIKDEPQESESDETLLV

Similar Transcription Factors

Sequence clustering based on sequence similarity using MMseqs2

100% Identity: iTF_00525910;
90% Identity: iTF_00490113;
80% Identity: -