Basic Information

Insect: Drosophila bocqueti
Gene Symbol: -
Assembly: GCA_018151655.1
Location: JAECXF010000174.1:895821-910059[-]

Transcription Factor Domain

TF Family: THAP
Domain: THAP domain
PFAM: PF05485
TF Group: Zinc-Coordinating Group
Description: The THAP domain is a putative DNA-binding domain (DBD) and probably also binds a zinc ion. It features the conserved C2CH architecture (consensus sequence: Cys - 2-4 residues - Cys - 35-50 residues - Cys - 2 residues - His). Other universal features include the location of the domain at the N-termini of proteins, its size of about 90 residues, a C-terminal AVPTIF box and several other conserved residues. Orthologues of the human THAP domain have been identified in other vertebrates and probably worms and flies, but not in other eukaryotes or any prokaryotes [1].
Hmmscan Out: # of c-Evalue i-Evalue score bias hmm coord from hmm coord to ali coord from ali coord to env coord from env coord to acc

1 29 7 1.7e+04 -4.2 2.2 49 59 325 337 311 354 0.58

2 29 3.2e-15 7.8e-12 45.7 3.7 1 86 555 627 555 628 0.85

3 29 8.9e-15 2.2e-11 44.3 5.0 1 87 655 724 655 724 0.83

4 29 8.1e-16 2e-12 47.6 0.2 1 87 746 818 746 818 0.85

5 29 5.6e-16 1.4e-12 48.1 5.3 1 87 916 986 916 986 0.82

6 29 1.9e-15 4.8e-12 46.4 3.6 1 86 1010 1081 1010 1082 0.82

7 29 2.2e-13 5.4e-10 39.8 1.1 1 87 1117 1185 1117 1185 0.81

8 29 4.3e-11 1.1e-07 32.5 1.8 1 86 1227 1296 1227 1297 0.77

9 29 4.4e-17 1.1e-13 51.7 0.4 1 86 1324 1393 1324 1394 0.82

10 29 7.9e-13 2e-09 38.1 1.6 1 85 1415 1483 1415 1485 0.79

11 29 4.8e-15 1.2e-11 45.2 0.6 1 86 1512 1583 1512 1584 0.85

12 29 1.6e-12 3.9e-09 37.1 3.7 1 85 1659 1727 1659 1729 0.82

13 29 1.5e-12 3.8e-09 37.1 0.1 1 86 1752 1820 1752 1821 0.83

14 29 4.1e-13 1e-09 39.0 2.1 1 87 1965 2034 1965 2034 0.80

15 29 1.5e-11 3.7e-08 34.0 0.0 1 87 2120 2194 2120 2194 0.81

16 29 1.4e-05 0.034 14.9 0.0 1 68 2209 2262 2209 2279 0.73

17 29 1e-11 2.6e-08 34.5 0.0 1 87 2288 2359 2288 2359 0.78

18 29 6.5e-13 1.6e-09 38.3 0.4 1 87 2411 2481 2411 2481 0.82

19 29 4.6e-12 1.1e-08 35.6 0.2 1 86 2516 2590 2516 2591 0.80

20 29 1.1e-12 2.7e-09 37.6 0.0 1 86 2601 2674 2601 2675 0.80

21 29 5.8e-10 1.4e-06 28.9 0.0 1 86 2700 2773 2700 2774 0.72

22 29 9.3e-05 0.23 12.2 0.4 1 58 2803 2853 2803 2880 0.80

23 29 3.3e-11 8.3e-08 32.8 1.0 1 86 2893 2964 2893 2965 0.81

24 29 5.3e-16 1.3e-12 48.2 0.2 1 86 3076 3148 3076 3149 0.81

25 29 3.1e-12 7.6e-09 36.2 3.5 1 86 3212 3282 3212 3283 0.80

26 29 1.8e-14 4.4e-11 43.3 4.6 1 86 3375 3445 3375 3446 0.84

27 29 3.8e-12 9.3e-09 35.9 0.2 1 86 3526 3595 3526 3596 0.85

28 29 2.3e-10 5.6e-07 30.2 0.5 1 58 3621 3669 3621 3684 0.83

29 29 3.4e-10 8.4e-07 29.6 1.2 18 87 3687 3745 3676 3745 0.77

#	of	c-Evalue	i-Evalue	score	bias	hmm coord from	hmm coord to	ali coord from	ali coord to	env coord from	env coord to	acc
1	29	7	1.7e+04	-4.2	2.2	49	59	325	337	311	354	0.58
2	29	3.2e-15	7.8e-12	45.7	3.7	1	86	555	627	555	628	0.85
3	29	8.9e-15	2.2e-11	44.3	5.0	1	87	655	724	655	724	0.83
4	29	8.1e-16	2e-12	47.6	0.2	1	87	746	818	746	818	0.85
5	29	5.6e-16	1.4e-12	48.1	5.3	1	87	916	986	916	986	0.82
6	29	1.9e-15	4.8e-12	46.4	3.6	1	86	1010	1081	1010	1082	0.82
7	29	2.2e-13	5.4e-10	39.8	1.1	1	87	1117	1185	1117	1185	0.81
8	29	4.3e-11	1.1e-07	32.5	1.8	1	86	1227	1296	1227	1297	0.77
9	29	4.4e-17	1.1e-13	51.7	0.4	1	86	1324	1393	1324	1394	0.82
10	29	7.9e-13	2e-09	38.1	1.6	1	85	1415	1483	1415	1485	0.79
11	29	4.8e-15	1.2e-11	45.2	0.6	1	86	1512	1583	1512	1584	0.85
12	29	1.6e-12	3.9e-09	37.1	3.7	1	85	1659	1727	1659	1729	0.82
13	29	1.5e-12	3.8e-09	37.1	0.1	1	86	1752	1820	1752	1821	0.83
14	29	4.1e-13	1e-09	39.0	2.1	1	87	1965	2034	1965	2034	0.80
15	29	1.5e-11	3.7e-08	34.0	0.0	1	87	2120	2194	2120	2194	0.81
16	29	1.4e-05	0.034	14.9	0.0	1	68	2209	2262	2209	2279	0.73
17	29	1e-11	2.6e-08	34.5	0.0	1	87	2288	2359	2288	2359	0.78
18	29	6.5e-13	1.6e-09	38.3	0.4	1	87	2411	2481	2411	2481	0.82
19	29	4.6e-12	1.1e-08	35.6	0.2	1	86	2516	2590	2516	2591	0.80
20	29	1.1e-12	2.7e-09	37.6	0.0	1	86	2601	2674	2601	2675	0.80
21	29	5.8e-10	1.4e-06	28.9	0.0	1	86	2700	2773	2700	2774	0.72
22	29	9.3e-05	0.23	12.2	0.4	1	58	2803	2853	2803	2880	0.80
23	29	3.3e-11	8.3e-08	32.8	1.0	1	86	2893	2964	2893	2965	0.81
24	29	5.3e-16	1.3e-12	48.2	0.2	1	86	3076	3148	3076	3149	0.81
25	29	3.1e-12	7.6e-09	36.2	3.5	1	86	3212	3282	3212	3283	0.80
26	29	1.8e-14	4.4e-11	43.3	4.6	1	86	3375	3445	3375	3446	0.84
27	29	3.8e-12	9.3e-09	35.9	0.2	1	86	3526	3595	3526	3596	0.85
28	29	2.3e-10	5.6e-07	30.2	0.5	1	58	3621	3669	3621	3684	0.83
29	29	3.4e-10	8.4e-07	29.6	1.2	18	87	3687	3745	3676	3745	0.77

Sequence Information

Coding Sequence: ATGTCACAACACAACCCCAATCACGCCCACCCACACTACCACTACCCGTCCCATGCGNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNTGTTGCTTCCTACCCAGCAGCCTCCCACTCCCACTCCCACCCCCTCTCTCACTCGGCCTTCGGCCCTGCGCCCGCTTGCAAGGCCAGCATCAGCAACAACAACTCCAACAACATTATGGGCGGCTACGGAGCAGTGGGAGGGGGTGGAGGCTCGCATGGATATTTCGGCGCCGCTGGCGGTGGCCTCAATGTCAGCGGGGCGGGGGGTGGTGCTGGGTCGTCCTACGGCCTTGGGGCCAACACGGTGGCATATGCTCACAACCNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNCCTGGGCCTGGGACAGCGGTCCTATATGGGCCACGATGTCATGGCCGGGAGCTATCCCTACATCAAGAGCGAACCCTTGGAGGGGTTCCAGCAGCCGGCCAATCCAATGGCCCCACCCCCGGCCCCCGAAATGATAATAAAATCGGAACCCATTGACGACCTGGCCTACAAGTCAAACTACATAGACGACAATACGCCGTTTGCGGACTTCAGTAAGTTTAGCGAATTCAGCGAAGACATGCTGAGTCCCAAAGTCGAGCTGACAGTCAAGGATGAGTCCTTTGTCAGGAACCCCAATAGCTTTTTACGCCGCAAGCAACAATCGGACCTGGCGACAGCAGAGAGCCTGCCCGTCTGCCAGCGCTGCAAGGAGGTGTTCTTCAAGAAGCAGACTTACCTGCGGCACGTCGCCGAGAGCAGCTGCGGCATCCAGGAGTACGACTTCAAGTGCACCATATGCCCCATGTCCTTCATGACCACCGAGGAGCTGCACCTGCACAAGCAGCAGCATCGAGCGGACAGGTTCTTCTGCCACAAGTACTGCGGAAAGCACTTCGGCACGATCGCGGAGTGCGAGGCACACGAGTACATGCAGCACGAGTACGAGAGCATTGTTTGCAACATGTGCTCGGGGTCCTTCTCCACGCGGGAACAGTTGTGTGCCCACCTGCCGCAGCACAAGTTCCAGCAGCGCTTCGACTGCCCCGTATGCCGCCTGTGGTACCAAACGGCTCTGGAGCTGCACGAGCACCGCCTGGCCGCACCCTACTTCTGCGGTAAATACTACGCGGGCGGCCAGTCTCCGTCCCCGTCCTCCCAGCAGCCACAGCAGCAGCAGCAGCACCAGAGCCAGACGAACTACAAGCTTCAGGACTGTCACATGGGAACCATGGAGATGCCAAGCGCACCGCTCCTTAAGTCGAACCCCTCCAACTCGCCTGCCCTGCCCGCGACAGCAGCGCTGAACTCACTGCTGCAACAGCGCCAGGCCAATGCCGATGGAGCGCCCATTTTTGCGGCATCCTCGCTGAAGAATGAGGTCGCTGTGAAGCTGGAGCGCAGCTACAGTAACTCGACCAATGAATCCTCCTACAGCGTCCAGGAGAGCGGCTACGGTAATGTGTATGGCAGCAGCGACAGCTCGGGCCACGGGGCCATCGCCGGACCACAGGCGCACTCTTCGACGCTGGACGACTCCGAGGACGCGCTGTGCTGTGTGCCACTGTGCGGGGTGCGGAAGAGCACGAGTCCCACCCTGCAGTTCTTCACGTTCCCGAAGGACGAGAAGTACCTCAACCAGTGGCTGCACAACCTCAAGATGTTCCACATACCCGCCGCCAGCTACGTGAGTTTCCGGATCTGCAGCATGCACTTTCCCAAGCGGTGCATCAACCGCTACTCGCTGTGCTACTGGGCGGTGCCGACGTTCAACCTCGGCCACGACGACGTGGCCAATCTCTACCAGAACCGGGAGCTGACCAACACATTCACCACCGGCGAAGTGGCGCGCTGCAGCATGCCGCACTGCACCAGCCAGCGGGGCGAGAGCAACCTCAAGTTCTACAACTTCCCCAAGGACATCAAGAGCCTGATCAAGTGGTGCCAGAACGCCCGCCTTCCCGTGCAGGCGAAGGAGCCGCGCCACTTCTGCAGCCGCCACTTCGAGGAGCGGTGCATTGGCAAGTTCCGACTGAAGCCCTGGGCGGTGCCCACCCTGCACCTGGGCGCCCAGTACGGCAAGATCCACGACAACCCGAAGAACCTGTATGTGGAGGAGAAGCGCTGCTGCCTCAACTTCTGCCGTCGGAGCCGCTCCTCCGACTTCAACATGTCGCTGTATCGGTTTCCCAGAGACGAGGTCCTGCTGCGGCGCTGGTGCTACAACCTCCGCCTCGATCCAGGAGTGTACCGCGGGAAGAATCACAAAATATGCAGCGCCCACTTCATAAAGGAGGCGCTGGGTCTCCGCAAACTATCTCCTGGAGCCGTGCCCACACTTCATCTGGGCCACAATGACACCTTCAACATCTACGAGAACGAGCTGTGGCCACCGCCAACTCCGACGCCCTCCTCTTGCCACCTCNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNGTCCTACCAGCGCCGTTCGGTGGCGTCCACTTCGTCGTCGGCGAGCTCGGCAGCCTCGCACTACGTGGACCCGGAGATGAGCGCCTCTTACCACCTGGCCATGTCCGCCTCCGCCTCCGCGACGCTCAACGCCAGCGACAGCATGGACGTCTGCTGCGTGCCCAGTTGCGAGAGCAAGCGACACAACAGCGAGAACATTACATTCCACACGATCCCGCGGCGGCCCGAGCAGATGCGCAAGTGGTGCCACAACCTGAAGATTGCCGAGGACAAGATGCACAAGGGCATGCGGATCTGCAGCCTCCACTTCGAGCCCTACTGCATCGGCGGCTGCATGCGCCCGTTTGCTGTGCCCACTCTGCACTTGGGCCACGACGACGACGACATCCACCGCAACCCGGACGTGATCAAGAAGCTGAACATCCGGGAGACGTGCTGCGTGGCTGTGTGCAAGCGGAACAGGGACAGAGACCACGCCAACCTGCATCGCTTCCCCAGCAACGTGGCGCTGCTGAAGAAGTGGTGCGCCAACTTGCAGCGCAGCGTGCCCGACGGCAGCAAGCTCTTCAACGATGCCATCTGTGAGGTGCACTTTGAGGACCGCTGCCTGCGCAACAAGAGACTGGAGAAGTGGGCCGTGCCCACCCTCATCCTGGGGCACGAGGACATTCCCTATCCGCTGCCCACGCCGGAGCAGGTGACCGAGTTCTACGCCCGGCCCTCGGCCCCGAACAATGGAGAGGAGCAGGGCGAGTGCTGTGTGGAGACCTGCAAGAGGAACCCCAGCGTGGACGACATAAAGCTGTACCGCCCTCCGGAGGACGCCGCCGTGCTGGCCAAGTGGGCGCACAACCTGCAGACGGAGGCCAACCAACTGACGAGCATGCGGATCTGCAACCTTCACTTCGAGGCGCACTGCATCGGCAAGAGGATGCGGCAGTGGGCCATACCGACGTTGAATCTGGCCGGCAACATTGAGAATCTCTACGAGAATCCAGAGCAATCGCTGCTCTACAGGCGACGCACGACCCACCTGAAGGCGAAGCTGCCGCCAAGCTCCGCGAAGCCCACCTGGGTGCCCAGGTGCTGTCTTCCACATTGTCGCAAGGTCAGGGCCCTGCACAATGTCCAGCTATACCGCTTCCCCAAGCTCAATCGGTCCACGTTGGCCAAGTGGGCGCACAATCTGCAGGTTCCAACGGTGGGCAGTGCCCAGCGCAGGCTCTGCTCGGCCCACTTCGAGCCCCACGTGCTCAGCAAGAAGTGTCCGGTGCCGCTGGCGGTGCCCACGATCGACCTGAACTCACCGCCCGGCTTGAAGATCTACCAGAATCCGGCCAAGCTGAAGGCCAGCAAGCTGTGCCTGCAGCGAGTGTGCATCGTCGAGAGCTGCCGCAAGACGAGGGCGCAGGGCGTGCAGCTCTTCCGGCTGCCGCACAGCCCCACGCAGCTGCGGAAGTGGATGCACAACATCAGGACGCGGCCACGAGCGGCTATGCGGGCTCAGTACCGGGTCTGTTCCCGCCACTTTGAGACGCACTCCTTCAATGGCCGGAGACTGAGTGCAGGCGCCATTCCGACCCTGGAACTGGGCCACGATGGCGACGATATCTATCCGAACGAGGCGCAGGCATTTGTGGACGAGCACTGTGCCGTCGAGGGCTGCGAGGCGTCCAAGGAGCAGCCGGAGGTGCGCCTGTTCCGCTTCCCCACCGACGACGACGACATGTTGTGGAAGTGGTGCAACAACCTGAAGATGAATCCCGTGGACTGCATTGGGGTGCGCATCTGCAACAAGCACTTCGAGGACGACTGCATCGGCCCCAAGCACCTGTACAAGTGGGCGATTCCCACGCAGCAGCTGGGCCACGACGACGCGCAGATCGAGCTGATCCCGAATCCCAAGCCGGAGGAGAGGTACGTGGATCCCGTCTTCAAGTGCGTCGTTCCCACCTGCGGCAAGACGCGACGGTTCGACGAGGTGCAAATGAACAGCTTCCCCAAGGACCCGGATCTCTTCCAGCGATGGCGGCACAACCTGCGCCTGGAACACCTCAGTTTCCAGGAGCGCGAGCGCTACAAGATCTGCAACGCCCACTTCGAGGAGATCTGCATTGGGAAGACGCGGCTCAACATGGGATCCGTGCCAACCCTGGAGCTCGGTCACGACGATGAGGATGACATCTTCCAAGTAAATCCAGCGGAGCTGCAGAGCAATTTGTTCGGGCGACAGCGTCGACTGCTCGAGAGATCCGGCGAACTGACTGTCAAGCAGGAGCTGTCGGAGACAGAGGACAACAACAAAGCGGATGCGGATGTGACGGCCACAGGCTCCAACTCCAGGCAGGTCAAGATCAAGAGGTCTACTTCGGATCTAAAGTGCTGTGTGCACAGCTGTGGCAGAAGTCGCCTGGAGCACGGGGCACGGCTGTTTCCCTTTCCCACCGGCAAGCAGCAACACCTCAAGTGGCGCCACAATCTGCACCTGGAACCAGAGGAGGTGGACCGGTCGACCCGCGTGTGCAGCGCTCACTTCAATCGACGCTGCATTGAGGGCAAGCAACTCAGGAGTTGGGCGATGCCCACCCAGCAGTTGGGACACAACGACCAGCCGATCTACGAGAACCCGAAGAACATTCCGGGCTTCTTCACACCCACCTGTGCCCTGGGGCACTGTCGCAAGCGGAGGAGCATTGACAACGACCTGCGTACCTACCGGTATCCCAGGAGCGAGGATCTCTTGGAGAAATGGCGAGCTAATCTGCGGCTGGCTCCGGATCAGTGTCGTGGTCGGATCTGCGCCAATCACTTCGAGCCGCAGGTGCGGGGAAAGCTAAAGCTGAAGACGGGAGCCGTTCCCACACTGCAACTGGGACACGATGAGGGACTAATCTATGACAACGAAGCCATTAAGGCTGGCATGGGCGAGGAAGAGGAGGGCATAGCCCCAGAGTTCCCGAGACTGAAACTAAAACAAGAGGTGTTCGACGAGGAGGAGGTGGAGGGCGAAGGCAATGACGGTGAGCAGCAGAACCCCGATGACCTGGATGATAATGCAGATGAAGAGGACAAAGACGATCAGTATTTTGATCCCCTTGAACTGGTCGAGACTTTTGCTGAGCATCGCAGCGACGACGAAGCCCAGGACAATGAGGATGAAGAAGACGAGGGTCGAGTTGCAGACGCTCCCTCCGGCGGGTACGATGTCAACGAGGAGATAGAACAGCTTCCAAGCTCCCCACCGCGACGACACCAGGCTCCGCGACGTGACAAGCCGGCCAACAATGTGACGCCCATTTGCTGCCTGAGACACTGCAGAAAGGAGCGCACTGCCTTCCACCTGCTGAGCACTTTCGGCTTCCCAAAGGACCGCCAGTTGCTGCTGAAGTGGTGTGTCAACTTGCACCTAAACCCGGACGACTGCATCGGCAGGGTGTGCATCGAGCACTTCCAGCCGGAGGTACTCGGCACCCGCAAGCTCAAGCAGAATGCGGTGCCCACTCTCAATGTGGGACACGAGGAACCGCTCAGGTACTCGTGCCATGGCGTGGACCAGAACCTCGAGGAGCGGGACCCCCAGCCGCAGCATTCGGTTTTTCGGCTTTGGAGCCTGAAACACTGCCGGAAAAGGAAGCTAACGGAGCCGCCGGATATTCCCCAAGCCAAGAGGAAGGCACTGGAGATGCCGATAATGAAGCGAGAGTGGGAGATGGAGTTGGCGGAGGCAAGGAGCGCGACTCAAACTGAATGTGAATCTCATATATGCTGCATAGGCAGTTGCGGAAGCCGGGAAGTTGGCCATTTGCTGCCTTTTCCCGAGGAGAAGACCCTGCTAAGAAAGTGGAGCCACAACTTAAGGCTGCCGCCTGAGACTGAGGCCACTTCTCTTGGCCTGAAAAGGGTTTGCTTGGCTCACTTCGAGTCGCAGCTGCTGGAGAATGGCAAGCTCTCGAAGGAAGCAGAGGCAGAGGCTGTGCCCACCTTGAACCTGGGTCACAGCAGCTGGAACCTATACAGGGCCAATGGGATCTGCCTAGTGCCTGACTGCAGGCACAATTCCCTCGGACGCTCAAGCTTCATCGATCTGCCGGACAACAGCATAATTAGGGACGCTTACTTCTCCTGCCTCAACCTGCCTGAACCCCGCGAGGAGCAGGCAAGACTGTGTCGTATCCACTTTATGGAGGCCTATAAGAAGTTGGCTCTTCCCAACGTTCTACACCCTCAAGCCATAATGGAGCTACAAAGTGCTGTGGACGAACTGCAATGCGCGGTGCCCGGCTGCTATCTCGAAGATGCCGATATGGATTTGTACCTAATCCAGCTTCCCGATAACAAGGAGCTCCTGGCGAAGTGGCTGCACAACACCAAGCTTCCCTATGACCCTTCAAGGCACCAAAGCTATCGCATTTGCACGCTCCACTTTGAATCAAAGTACTTGGATTCGAGTGGCCCGCTAAACGGGGCTATACCGACGCTCCATCTCCACCATGAAGATGAGGTTCACTTGAACACCAGACCTTCGCCAGAGGAGCAGGACTCTGTGTTGACTCCACTGCGGATAAAGACGGACCTAGCCTCCTTGGGCAGTCCCTGTGCAAGTGCAAGCCCCAGTCCCCGCGGCAGGATTCGAATATGCTGCATTCCCGCATGCGGACAGTTTGGGAGCAGTCAGGTGAGGCTGTTTCGTTTTCCCACCGAGGAGCAGGCGCTGCTTCGGTGGCTGGTGAATACACAACAGCAGCCGAGACTGGTGGATCCAACGGATTTGTATGTGTGCCAGTCGCACTTTGAGCCCGAGGCTATTTGCATGAAGCAACTGCGAAGCTGGGCTGAGCCCACCTTGAACCTGGGACACGACGGACACGTAATCCCGAATGCCAAGCACAATGGAAATATTTCCGACAGCCAGGACACAGAGCAAGCCATGAGGTTTATTCGCGAACGCTTCTGCTCCGTCCTTTCCTGCTTTCAAGCAGGCGGAGAGGAGGAGGAGGGAGTGAGGCTATTTGATTATCCCGAGGATATGGCGACCACTCGGAAGTGGGCGGCCGCATGCAGACATCGCTCCATGCAGGCCAGGAGCCACGGGTTCAAGGTGTGCCAGTTCCACTTCGCCAAGGAATGCTTTGACCCCAACACTGGAGAACTGACTGAGGACGCCGTCCCCACCCTGGAGTTGAGCAGAGATGAAATGGAGAGGCAATGTCTTGTGGCCGGATGTGTGAAAGATGATGCCAATGGAACCCGCCTCCGCTACTTTAAGATACCAAAAGTTGCTGCTCAGCTGGAAGCGTGGAGCAACAACCTTAAAGTCCATCCGACTGATCTCATGCAGGCGGAGCAGCAGTACATCTGCGAGAAACACTTTGAAGCCTTCTGCTTTGGGGCCAACAAGGGCCTGCGGTCCGGTGCTCTGCCAACGCTCCTGCTGGGTCATGATGAGGGGGTGGATATGCTTCCGAATCCTGAAAGCCTCCTCTGCCAGAACAAGACGGAGAAGTGCTGCGTGCCAGGCTGCGGGCTTGTCTGGCAGACTGGGGACCGTAGGTTCCGTGGATTTCCCAAATTGCTGGCCATGGCCAATAAATGGCGGCACAACCTTCGTTTGGAAGTGCCCGTGGAGCAACTCGGCAAACTGAAGGTCTGCAATGCTCATTTCGAGACCACCTCGCCCAACGTGGGTTCCAATGGACTGAGCCCTAGTGCCTCGATACCAACTCTGGAACTGGGTCATTCCTCTCCGGATATTTACCCAGCGGACGTGAGCTTAAAGTTCCAAAAGCGGTCAGGAATACCCCCGAAAATGTATTGTTGTTATCCCAAGTGCGAGGAAACCTGCTTGCCCAGGAACCATTCGTACGGGCTTCCCCAGGAGGAGCATCTGAGGAATGCCTGGCTAAGCCACATGGATATAGAAAATCCGACAGACGAGGGAGGCGCACTGCTTTGCCCGCTGCACTATGCCATCCTCTACCAGTACAGTGCCACCCACCATCCGGAGCATCATGCTCTAAGCCGGATTCATCTCGATGACAATTACAAGGAAGCGCGGAACAACAGGCGCGTGAGGATTGTGAGCTGCACAATCAAGGGCTGCGACGTGGTTAAGCCCCGGGACGGGGTTCCACTGCACGGCATGCCGCAAAGCAGGGAAATCCTGCAGATGTGGATAGACAATGGCCAGTTTGAGTTCTTGGAGCAACAGCGGTATATGTTCAAGGTGTGCCACAATCATTTTGAGCCATGCTGTTTCTTCGACGACAGACGTCTGCACTCGTGGAGCGTGCCCACTTTGCGCCTGCCTGGCGACGCAATCCACCAAAATCCTAGCGCCGAACAGTGGCAGAATATGATCAAGCAAGCAGCAGCAAAGACATACGCAGAGGATGACGAGGAGCCAGATCCACATGGGGTTGTGGTTAAGACCGAACCCATTTTGAAGATGGAGCACATCGAATCGGAATATGAGGATGAGACCCCAGAGATGCAGGCTCTTGAGGTCCTCCTGGAAGTTGGCCATGTGGAGCGAATGGAGAGCTACGAGAAAGTGGATAAATCACCGCTGATCTACACCGATAATGCACCCTTCCGATCGTCACCCATACGTTGCCAATACAATGCTAATCACTGTGCCGTAGATGGGTGCCAGGTGACTGCCGAAGATGTGGGCGGCACGATCAAGCTGCACAAATTCCCCGCGTCGCAGGAAGCCGCACAGAAGTGGATGCACAACACCCAAGTGGACATGGACGAAAAGTACTGGTGGCGCTACCGCATATGCAGTTACCACTTCGCTCAAGAGTGCTTTCAGAGTGCCAGAATCCGAAAGGGCGCGATGCCCACGCTTTTATTAGGACCCCGGCGACCGGACGAGGTGTACGATAATGAGTTTTCACCACCAGAGGGGGAAGAGCCCTTTCCAGAGCCACCGGACACTCAGCTAGAGGAAGCTACGACTGTGGTGTCAAGCGTTCGAAAGGAGGTGTCCAGTTTATGCCTGCCCCCACGGGCGCCGCCTCGAAAGTCAAGCAAGTTTTGCCAGATTGATTCCTGCTCGAACCACTTGACCACTGAGAACATGACACTTCACAAGTTTCCCCACTCGGAGGACATGTGCCTCAAGTGGCAGCACAACACGCAAGTGCCATTTGACCCCTACTACCGTTGGCGCTACCGAATCTGCAGTGCGCACTTCCATCCGGTGTGCTTGGTCAACATGCGTCTGGTCCACGGAAGCGTTCCCACCTTGAAGCTGGGTCCCAAGGCTCCTCCAGAGCTGTTTGACAACGACTTTGAAGCCATTAACCTGAGGTTGGATAAAAGGCTGACAGAGTCCAATGCCAATGTGTATATCAAGCACGAAAGAAGGGAGGAGGATGAGGATTCGATGGTGTTCCCGGAGCCCGAGCTGCAGGTACACGAGGATCAGGACGATGAGACACCAAGCTGGAACAGAAAACTGCAGTTACCACCTGTGAAGCAAGAGAAAATTGTATACGGCCAGATCAAGTCCGGCTATGATAAGTGTTCGCTGGCTCACTGCCAGCGGCAAAGATCCCAGCACGGCGTCCACATCTACAAGTTTCCCAGATCGAAGCGTCAGCAGGAGCGTTGGATGCACAACCTGCGCATCCGCTATGATGAGCGGACACCGTGGAAATTCATGATCTGCAGCGTTCACTTCGAGCCCCACTGCGTCAGCCTGAGGAAGCTGCGACCTTGGGCGGTTCCCACGCTGGAACTGGGTGACAATGTACCGGAGAAGATCTTTACTAACGAGCAGTGCGAGGAGGAGCTGGTGACCGATCGCAGTGAGCTCGATAGCGACGCGGACGAAGAGGACGGCTTGCAGGAGNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNATGAAAAGGAGGAGGCGTTTCAAGACAGATTCCGGCTGCCCTCCTAGCCAGATTCCACCCTGGAAAGTCAAACAATGCTGCCTCCCCTATTGCCGTGCCTTCCGCGGCGATGGCATCAAGCTGTTCCGGCTTCCGAACAACCGAAACTCCATTAGCAACTGGGAACGGGCCACCGGAATGGTCTTCAAGGAGTCTCAGCGGAACACTCGTCTGATATGCAGCCGTCACTTCGAGCCGGAGCTGATTGGAGTCAGGCGTCTGATGCGCAACGCCATTCCCACGAAGCACTTGAACCCCCATGCAGCTGACCAGATCCGCACGAAGAAGGAAAGGAATCCTCCTGCCACTAAGACACCCATATGCTGCATGGCCGACTGCCACTACAACGGAAATGTGAAGCTGCACAAGTTTCCAAGTGATCCCACTCTTCTTAGACAGTGGTGCCAGGCCCTCCGGCTCACTGATACACAGCGGTATTTGGGGAAGCACATCTGCTCCATGCACCTGCCAATGAACAAGACGCTGAGCTGTGTCATCTGCGGTGGGGACAACGTGGAGTTGCCGATGCTTGGGTTTCCGGAGAACCGCAACCAGCGCGCCAAATGGTGTTACAATCTCAAAATTGAGACAATACCCAAGTGGGACCACTCGAAGCACATTTGCTGCCGGCACTTTGAGCCCCATTGCTTCGACACCCCGGGTGAGCTACGTCCAGGAGCGGCTCCCACGCTCCATCTCAATCACGATGACACGAACATATTCCTCAGCGACTATGCCACTGGTCTTCCGTCCTCGCCACTAGGCAATCGGATCAAAGACGAGCCCCTGGAATCGGAGTCCGACGAGACGCTGCTGGTGTAG
Protein Sequence: MSQHNPNHAHPHYHYPSHAXXXXXXXXXXXXXXXXXXXXXXXXXXVASYPAASHSHSHPLSHSAFGPAPACKASISNNNSNNIMGGYGAVGGGGGSHGYFGAAGGGLNVSGAGGGAGSSYGLGANTVAYAHNXXXXXXXXXXXXXXXXXXXLGLGQRSYMGHDVMAGSYPYIKSEPLEGFQQPANPMAPPPAPEMIIKSEPIDDLAYKSNYIDDNTPFADFSKFSEFSEDMLSPKVELTVKDESFVRNPNSFLRRKQQSDLATAESLPVCQRCKEVFFKKQTYLRHVAESSCGIQEYDFKCTICPMSFMTTEELHLHKQQHRADRFFCHKYCGKHFGTIAECEAHEYMQHEYESIVCNMCSGSFSTREQLCAHLPQHKFQQRFDCPVCRLWYQTALELHEHRLAAPYFCGKYYAGGQSPSPSSQQPQQQQQHQSQTNYKLQDCHMGTMEMPSAPLLKSNPSNSPALPATAALNSLLQQRQANADGAPIFAASSLKNEVAVKLERSYSNSTNESSYSVQESGYGNVYGSSDSSGHGAIAGPQAHSSTLDDSEDALCCVPLCGVRKSTSPTLQFFTFPKDEKYLNQWLHNLKMFHIPAASYVSFRICSMHFPKRCINRYSLCYWAVPTFNLGHDDVANLYQNRELTNTFTTGEVARCSMPHCTSQRGESNLKFYNFPKDIKSLIKWCQNARLPVQAKEPRHFCSRHFEERCIGKFRLKPWAVPTLHLGAQYGKIHDNPKNLYVEEKRCCLNFCRRSRSSDFNMSLYRFPRDEVLLRRWCYNLRLDPGVYRGKNHKICSAHFIKEALGLRKLSPGAVPTLHLGHNDTFNIYENELWPPPTPTPSSCHLXXXXXXXXXXXXXXXXXXXXSYQRRSVASTSSSASSAASHYVDPEMSASYHLAMSASASATLNASDSMDVCCVPSCESKRHNSENITFHTIPRRPEQMRKWCHNLKIAEDKMHKGMRICSLHFEPYCIGGCMRPFAVPTLHLGHDDDDIHRNPDVIKKLNIRETCCVAVCKRNRDRDHANLHRFPSNVALLKKWCANLQRSVPDGSKLFNDAICEVHFEDRCLRNKRLEKWAVPTLILGHEDIPYPLPTPEQVTEFYARPSAPNNGEEQGECCVETCKRNPSVDDIKLYRPPEDAAVLAKWAHNLQTEANQLTSMRICNLHFEAHCIGKRMRQWAIPTLNLAGNIENLYENPEQSLLYRRRTTHLKAKLPPSSAKPTWVPRCCLPHCRKVRALHNVQLYRFPKLNRSTLAKWAHNLQVPTVGSAQRRLCSAHFEPHVLSKKCPVPLAVPTIDLNSPPGLKIYQNPAKLKASKLCLQRVCIVESCRKTRAQGVQLFRLPHSPTQLRKWMHNIRTRPRAAMRAQYRVCSRHFETHSFNGRRLSAGAIPTLELGHDGDDIYPNEAQAFVDEHCAVEGCEASKEQPEVRLFRFPTDDDDMLWKWCNNLKMNPVDCIGVRICNKHFEDDCIGPKHLYKWAIPTQQLGHDDAQIELIPNPKPEERYVDPVFKCVVPTCGKTRRFDEVQMNSFPKDPDLFQRWRHNLRLEHLSFQERERYKICNAHFEEICIGKTRLNMGSVPTLELGHDDEDDIFQVNPAELQSNLFGRQRRLLERSGELTVKQELSETEDNNKADADVTATGSNSRQVKIKRSTSDLKCCVHSCGRSRLEHGARLFPFPTGKQQHLKWRHNLHLEPEEVDRSTRVCSAHFNRRCIEGKQLRSWAMPTQQLGHNDQPIYENPKNIPGFFTPTCALGHCRKRRSIDNDLRTYRYPRSEDLLEKWRANLRLAPDQCRGRICANHFEPQVRGKLKLKTGAVPTLQLGHDEGLIYDNEAIKAGMGEEEEGIAPEFPRLKLKQEVFDEEEVEGEGNDGEQQNPDDLDDNADEEDKDDQYFDPLELVETFAEHRSDDEAQDNEDEEDEGRVADAPSGGYDVNEEIEQLPSSPPRRHQAPRRDKPANNVTPICCLRHCRKERTAFHLLSTFGFPKDRQLLLKWCVNLHLNPDDCIGRVCIEHFQPEVLGTRKLKQNAVPTLNVGHEEPLRYSCHGVDQNLEERDPQPQHSVFRLWSLKHCRKRKLTEPPDIPQAKRKALEMPIMKREWEMELAEARSATQTECESHICCIGSCGSREVGHLLPFPEEKTLLRKWSHNLRLPPETEATSLGLKRVCLAHFESQLLENGKLSKEAEAEAVPTLNLGHSSWNLYRANGICLVPDCRHNSLGRSSFIDLPDNSIIRDAYFSCLNLPEPREEQARLCRIHFMEAYKKLALPNVLHPQAIMELQSAVDELQCAVPGCYLEDADMDLYLIQLPDNKELLAKWLHNTKLPYDPSRHQSYRICTLHFESKYLDSSGPLNGAIPTLHLHHEDEVHLNTRPSPEEQDSVLTPLRIKTDLASLGSPCASASPSPRGRIRICCIPACGQFGSSQVRLFRFPTEEQALLRWLVNTQQQPRLVDPTDLYVCQSHFEPEAICMKQLRSWAEPTLNLGHDGHVIPNAKHNGNISDSQDTEQAMRFIRERFCSVLSCFQAGGEEEEGVRLFDYPEDMATTRKWAAACRHRSMQARSHGFKVCQFHFAKECFDPNTGELTEDAVPTLELSRDEMERQCLVAGCVKDDANGTRLRYFKIPKVAAQLEAWSNNLKVHPTDLMQAEQQYICEKHFEAFCFGANKGLRSGALPTLLLGHDEGVDMLPNPESLLCQNKTEKCCVPGCGLVWQTGDRRFRGFPKLLAMANKWRHNLRLEVPVEQLGKLKVCNAHFETTSPNVGSNGLSPSASIPTLELGHSSPDIYPADVSLKFQKRSGIPPKMYCCYPKCEETCLPRNHSYGLPQEEHLRNAWLSHMDIENPTDEGGALLCPLHYAILYQYSATHHPEHHALSRIHLDDNYKEARNNRRVRIVSCTIKGCDVVKPRDGVPLHGMPQSREILQMWIDNGQFEFLEQQRYMFKVCHNHFEPCCFFDDRRLHSWSVPTLRLPGDAIHQNPSAEQWQNMIKQAAAKTYAEDDEEPDPHGVVVKTEPILKMEHIESEYEDETPEMQALEVLLEVGHVERMESYEKVDKSPLIYTDNAPFRSSPIRCQYNANHCAVDGCQVTAEDVGGTIKLHKFPASQEAAQKWMHNTQVDMDEKYWWRYRICSYHFAQECFQSARIRKGAMPTLLLGPRRPDEVYDNEFSPPEGEEPFPEPPDTQLEEATTVVSSVRKEVSSLCLPPRAPPRKSSKFCQIDSCSNHLTTENMTLHKFPHSEDMCLKWQHNTQVPFDPYYRWRYRICSAHFHPVCLVNMRLVHGSVPTLKLGPKAPPELFDNDFEAINLRLDKRLTESNANVYIKHERREEDEDSMVFPEPELQVHEDQDDETPSWNRKLQLPPVKQEKIVYGQIKSGYDKCSLAHCQRQRSQHGVHIYKFPRSKRQQERWMHNLRIRYDERTPWKFMICSVHFEPHCVSLRKLRPWAVPTLELGDNVPEKIFTNEQCEEELVTDRSELDSDADEEDGLQEXXXXXXXXXXXXXXXXMKRRRRFKTDSGCPPSQIPPWKVKQCCLPYCRAFRGDGIKLFRLPNNRNSISNWERATGMVFKESQRNTRLICSRHFEPELIGVRRLMRNAIPTKHLNPHAADQIRTKKERNPPATKTPICCMADCHYNGNVKLHKFPSDPTLLRQWCQALRLTDTQRYLGKHICSMHLPMNKTLSCVICGGDNVELPMLGFPENRNQRAKWCYNLKIETIPKWDHSKHICCRHFEPHCFDTPGELRPGAAPTLHLNHDDTNIFLSDYATGLPSSPLGNRIKDEPLESESDETLLV

Similar Transcription Factors

Sequence clustering based on sequence similarity using MMseqs2

100% Identity: iTF_00525910;
90% Identity: iTF_00561794; iTF_00613541; iTF_00485173; iTF_00492264; iTF_00524447;
80% Identity: -