Basic Information

Insect: Drosophila ficusphila
Gene Symbol: -
Assembly: GCA_018152265.1
Location: JAECXK010000127.1:851224-865592[+]

Transcription Factor Domain

TF Family: THAP
Domain: THAP domain
PFAM: PF05485
TF Group: Zinc-Coordinating Group
Description: The THAP domain is a putative DNA-binding domain (DBD) and probably also binds a zinc ion. It features the conserved C2CH architecture (consensus sequence: Cys - 2-4 residues - Cys - 35-50 residues - Cys - 2 residues - His). Other universal features include the location of the domain at the N-termini of proteins, its size of about 90 residues, a C-terminal AVPTIF box and several other conserved residues. Orthologues of the human THAP domain have been identified in other vertebrates and probably worms and flies, but not in other eukaryotes or any prokaryotes [1].
Hmmscan Out: # of c-Evalue i-Evalue score bias hmm coord from hmm coord to ali coord from ali coord to env coord from env coord to acc

1 28 2.8e-15 5e-12 46.3 3.9 1 86 564 636 564 637 0.85

2 28 1.1e-14 2e-11 44.3 5.0 1 87 664 733 664 733 0.83

3 28 1e-15 1.9e-12 47.6 0.2 1 87 755 827 755 827 0.85

4 28 6.5e-16 1.2e-12 48.3 5.4 1 86 926 995 926 996 0.82

5 28 1.4e-14 2.4e-11 44.0 2.8 1 86 1020 1091 1020 1092 0.82

6 28 4.8e-13 8.5e-10 39.1 1.1 1 87 1127 1195 1127 1195 0.80

7 28 1.4e-10 2.4e-07 31.2 1.6 1 86 1235 1304 1235 1305 0.76

8 28 5.1e-17 9e-14 51.8 0.4 1 86 1332 1401 1332 1402 0.83

9 28 5.4e-13 9.6e-10 38.9 1.5 1 85 1423 1491 1423 1493 0.80

10 28 3e-14 5.4e-11 42.9 0.5 1 86 1520 1591 1520 1592 0.85

11 28 5.6e-13 1e-09 38.9 3.1 1 85 1669 1737 1669 1739 0.82

12 28 8.4e-13 1.5e-09 38.3 0.1 1 86 1762 1830 1762 1831 0.81

13 28 2.9e-13 5.2e-10 39.8 2.2 1 87 1969 2038 1969 2038 0.79

14 28 1.4e-10 2.4e-07 31.2 0.5 1 86 2131 2197 2131 2198 0.76

15 28 0.00025 0.44 11.2 0.0 1 59 2213 2259 2213 2275 0.78

16 28 6.6e-13 1.2e-09 38.7 0.7 1 87 2288 2358 2288 2358 0.83

17 28 3.6e-13 6.4e-10 39.5 0.7 1 87 2414 2484 2414 2484 0.83

18 28 3.5e-11 6.3e-08 33.1 0.2 1 86 2519 2590 2519 2591 0.81

19 28 3e-12 5.4e-09 36.5 0.0 1 87 2601 2673 2601 2673 0.80

20 28 6.9e-13 1.2e-09 38.6 0.0 1 86 2697 2767 2697 2768 0.79

21 28 1.2e-06 0.0022 18.6 0.1 1 58 2801 2848 2801 2872 0.77

22 28 1.7e-13 3.1e-10 40.5 0.4 1 86 2886 2958 2886 2959 0.83

23 28 5.7e-16 1e-12 48.5 0.4 1 86 3072 3144 3072 3145 0.81

24 28 6.7e-13 1.2e-09 38.6 2.4 1 86 3204 3274 3204 3275 0.80

25 28 4.8e-14 8.5e-11 42.3 4.2 1 86 3375 3445 3375 3446 0.85

26 28 1.3e-11 2.4e-08 34.5 0.1 1 86 3526 3595 3526 3596 0.84

27 28 2.5e-10 4.5e-07 30.4 1.0 1 58 3617 3665 3617 3680 0.84

28 28 3.3e-10 5.9e-07 30.0 2.1 19 87 3684 3741 3671 3741 0.77

#	of	c-Evalue	i-Evalue	score	bias	hmm coord from	hmm coord to	ali coord from	ali coord to	env coord from	env coord to	acc
1	28	2.8e-15	5e-12	46.3	3.9	1	86	564	636	564	637	0.85
2	28	1.1e-14	2e-11	44.3	5.0	1	87	664	733	664	733	0.83
3	28	1e-15	1.9e-12	47.6	0.2	1	87	755	827	755	827	0.85
4	28	6.5e-16	1.2e-12	48.3	5.4	1	86	926	995	926	996	0.82
5	28	1.4e-14	2.4e-11	44.0	2.8	1	86	1020	1091	1020	1092	0.82
6	28	4.8e-13	8.5e-10	39.1	1.1	1	87	1127	1195	1127	1195	0.80
7	28	1.4e-10	2.4e-07	31.2	1.6	1	86	1235	1304	1235	1305	0.76
8	28	5.1e-17	9e-14	51.8	0.4	1	86	1332	1401	1332	1402	0.83
9	28	5.4e-13	9.6e-10	38.9	1.5	1	85	1423	1491	1423	1493	0.80
10	28	3e-14	5.4e-11	42.9	0.5	1	86	1520	1591	1520	1592	0.85
11	28	5.6e-13	1e-09	38.9	3.1	1	85	1669	1737	1669	1739	0.82
12	28	8.4e-13	1.5e-09	38.3	0.1	1	86	1762	1830	1762	1831	0.81
13	28	2.9e-13	5.2e-10	39.8	2.2	1	87	1969	2038	1969	2038	0.79
14	28	1.4e-10	2.4e-07	31.2	0.5	1	86	2131	2197	2131	2198	0.76
15	28	0.00025	0.44	11.2	0.0	1	59	2213	2259	2213	2275	0.78
16	28	6.6e-13	1.2e-09	38.7	0.7	1	87	2288	2358	2288	2358	0.83
17	28	3.6e-13	6.4e-10	39.5	0.7	1	87	2414	2484	2414	2484	0.83
18	28	3.5e-11	6.3e-08	33.1	0.2	1	86	2519	2590	2519	2591	0.81
19	28	3e-12	5.4e-09	36.5	0.0	1	87	2601	2673	2601	2673	0.80
20	28	6.9e-13	1.2e-09	38.6	0.0	1	86	2697	2767	2697	2768	0.79
21	28	1.2e-06	0.0022	18.6	0.1	1	58	2801	2848	2801	2872	0.77
22	28	1.7e-13	3.1e-10	40.5	0.4	1	86	2886	2958	2886	2959	0.83
23	28	5.7e-16	1e-12	48.5	0.4	1	86	3072	3144	3072	3145	0.81
24	28	6.7e-13	1.2e-09	38.6	2.4	1	86	3204	3274	3204	3275	0.80
25	28	4.8e-14	8.5e-11	42.3	4.2	1	86	3375	3445	3375	3446	0.85
26	28	1.3e-11	2.4e-08	34.5	0.1	1	86	3526	3595	3526	3596	0.84
27	28	2.5e-10	4.5e-07	30.4	1.0	1	58	3617	3665	3617	3680	0.84
28	28	3.3e-10	5.9e-07	30.0	2.1	19	87	3684	3741	3671	3741	0.77

Sequence Information

Coding Sequence: ATGTCACAACAACACCCCCATCACGCCCACCCGCATTACGCCCATCACTANNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNTGTTGCTTCCTACCCCACACCCCACTCGGCCTTCGGCCACCCCGCTCCAACACCACCGCCCGCACCCCCCTGCAAGGCCGCCAACAGCAGTAACAGCAACAACAACAACATGGGAGGAGGGGCCTATGGGCCGGGGGGCGGCGGTGGCAATGGGGTGCAGGGTTATTATGGCGCCGCTGGCGGTGGCCTCAATGTCAGTGGGGCGGTGGGCGTGGGAGTGGGCGGTGGGCCGAGTTATGGCCTTGGGGCCAATANNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNCAACCCGCAGAGGTCCTATATGGGCCACGATATCATGACCACCGGCAGCTATCCCTATATCAAGAGCGAACCAATGGAAGCCTTCCAGCAGCCCCCAAATCCCATGGCCCCGCCCCCGGCGCCAGAAATATTAATTAAATCGGAACCCATTGACGAACATTCCTACAAGTCCAACTATATAGACGACAATACGCCATTTGCTGACTTTAGCAAGTTTAGCGAATTCAGCGAGGACATGCTGAGTCCCAAAGTGGAGCTGACCGTCAAGGATGAGTCCTATGGAAGAAATTCCAACAGCTTTATGCGGCGAAAGCAGCAATCCGATCGCAGTGCCGAAAGCTTACCAATTTGCCAGCGCTGCAAGGAGGTCTTCTTCAAGAAACAGATCTACCTGCGGCATGTGGCCGAAAGCAATTGTGGCATACAGGAGTACGACTTCAAGTGCAGCACCTGTCCCATGTCCTTCATGACCGCCGAGGAGCTGCAAAGGCACAAGCACCTCCACCGATCGGACAGATTCTTCTGCCACAAATACTGTGGCAAGTATTTCGATACGATCGCAGAGTGCGAGGCACACGAGTACATGCAGCACGAGTACGACAGCTTTGTCTGCAACATGTGCTCGGGAACCTTTGCCACTCGAGAGCAGCTTTACGCCCACCTGCCGCAGCACAAGTTCCAGCAGCGGTTCGACTGTCCCATCTGCCGATTGTGGTACCAAACGGCCCTCGAACTCCACGAACACCGACTGGCAGCTCCTTACTTTTGTGGCAAGTACTACACGGGAGGACAGTCGTCTGCTGCTTCCCAGTCGCAGACGCAGCAGCATCAGAATCAAACGAACTACAAGCTGCAGGATTGCCATATGGCCACTATGGAAATGCCCACCGCCCCGCACCACAAATCGAATCCATCCAGTTCATCTTTGCCTGCGACGGCTGCTCTGAATTCGCTGCTTCAGCAGCGTCAAGCAAACGCGGATGGAGCGGCCATGTTTGCCGCATCCGCCATGAAGAACGAGGTGAATGTAAAGCTGGAGCGCAGCTACAGCAATTCGACCAGCGAGTCGTCGTACAGCGTTCAGGAGAACAACTACAACAATGCCTATGGCAGCGATAGTTCAATCCACGGCGGAGCCATCGCTGGACCACAGGCACATTCGTCAACGCTGGACGATTCGGAGGACGCCTTGTGCTGTGTGCCGCTGTGCGGCGTGCGGAAGAGCACGAGCCCAACGCTGCAGTTCTTTACGTTTCCCAAGGACGAGAAGTACCTCAACCAGTGGCTGCACAACCTCAAGATGTTCCACATACCCGCCGCCAGTTATGCCAACTTTCGGATCTGTAGCATGCACTTTCCGAAGCGCTGCATCAACCGATACTCTCTGTGCTATTGGGCTGTGCCCACGTTTAATCTCGGCCACGACGACGTGGCGAATCTCTACCAGAATCGGGAGCTGACCAACACCTTCACCACCGGCGAAGTGGCGCGCTGCAGCATGCCGCATTGCACCAGTCAGCGGGGCGAGAGCAACCTGAAGTTCTACAACTTCCCCAAGGACATCAAGAGCCTGATCAAGTGGTGCCAGAACGCACGACTTCCCGTACAGGCGAAGGAGCCGCGCCACTTCTGCAGTCGCCACTTCGAGGAGCGCTGCATCGGCAAGTTCCGACTGAAGCCCTGGGCGGTGCCTACTTTGCACCTGGGTGCGCAATATGGGAAGATCCACGACAACCCCAAGAACTTGTATGTGGAGGAGAAGCGCTGCTGCTTGAACTTTTGCCGCAGGAGCAGATCCTCTGACTTCAATATGTCGCTATATCGATTTCCCAGAGATGAGGTGCTCCTGCGCCGCTGGTGCTACAATCTTCGCCTGGATCCGGGCGTATATCGCGGGAAGAATCACAAGATATGCAGCGCTCACTTCATTAAGGAAGCCCTGGGTCTTAGGAAACTTTCACCGGGTGCTGTTCCTACGCTTCATTTAGGCCACACTGACACCTTCAACATCTACGAGAATGAGCTTTGGCCACCGCCAACGCCCTCAAACAGTCACGGCAGTGGCCTCCAGCAGCTGCAGTCGCAGCATCACACTTCGCAGCACTCGCTGCAACAGCAGCTGCACAGCAAATCCTACCAGCGCCATTCGGCGGCCTCCACCTCGTCCTCGGCCAGTTCGGCCACCTCTCACTACGTGGATCCGGAGCTGAGTGCCTCCTATTTGGCCATGGGTGCCGGTGGATCAGCGGCTTTGAATGCCAGCGACAGCATGGACATCTGTTGCGTGCCCAGTTGCGAGAGCAAGCGGCACAACAACGAGAACATCACATTCCACACCATCCCGCGGCGGCCGGAGCAGATGCGCAAGTGGTGCCACAACCTGAAGATTCCCGAGGAGAAGATGCACAAGGGCATGCGGATCTGCAGTCTGCATTTCGAGCCCTACTGCATCGGGGGCTGCATGCGTCCGTTTGCGGTGCCCACACTGCAGTTGGGTCACGACGACGATGATATCCACCGCAATCCGGATGTTATCAAGAAGCTGAACATCAGGGAAACCTGCTGCGTGGCCGTCTGCAAGAGGAATCGCGACAGGGATCATGCCAATCTGCATCGCTTCCCCAGCAACGTCTCCCTGCTGACCAAGTGGTGTGGCAATCTTCAGCGTCCCGTTCCGGATGGCAGCAAGCTCTTCAACGACGCCATCTGCGAGGTGCACTTCGAGGATCGCTGCCTGCGCAACAAGAGGCTAGAGAAGTGGGCCGTGCCCACACTGATTCTGGGTCACGAGAACATCCCCTACCCGCTGCCCACTCCAGAGCAAGTGGCCGAGTTCTATGCTCGTCCAACTGCACCAAATAATGGCGAGGAGCAGGGCGAGTGCTGTGTGGAGACCTGCAAGCGAAATCCCAGTGTGGATGACATTAAGTTGTACAGACCGCCGGAGGAGGCTTCCGTGCTGGCCAAGTGGGCGCACAACCTGCAGACGGAGGCCAGTCAGCTGACGAGCATGCGGATCTGCAATCTGCACTTCGAAGCCCACTGCATTGGCAAGCGGATGAGACCCTGGGCGATACCCACTCTAAATTTGGCCGGCAACATAGAGAATCTCTACGAGAACCCGGAGCACTCGATGCTGTACAAGCGGCGTACCCACACAAAGACCAAACTGCCCGCTTCGGTTAAGCCCACCTGGGTGCCCAGATGCTGTCTTCCACACTGCCGAAAGGTTCGAGCTCTCCACAATGTCCAACTCTACCGCTTTCCCAAGGTGAATCGCTCGACGCTGGCGAAGTGGGCGCACAATCTGCAGGTTCCCATGGTGGGCAGTGCTCAGAGGCGGCTATGTTCGGCTCACTTCGAGCCGCATGTGCTGAGCAAAAAGTGTCCGGTGCCGCTGGCGGTGCCCACACTCGATTTGAACTCCCCACCTGGGCTGAAGATCTACCAGAATCCCGCCAAGCTGAAGGCCAGCAAGCTGTGCCTGCAGCGCGTGTGCATTGTAGAGAGTTGCCGCAAGACGCGGGCGCAGGGCGTCCAGCTCTTTCGGCTGCCGCACAGTCCCACGCAGCTGCGCAAGTGGATGCACAACATCAAGACGCGTCCGCGGGCGGCGATGAGGGCTCAGTACCGTGTCTGCTCCCGCCACTTTGAGACGCATTCCTTTAATGGAAGGAGATTGAGTGCTGGTGCGATTCCCACTTTGGAATTGGGCCACGACGACGACGACATCTATCCCAACGAGGCGCAGGCCTTCGTGGACGAGCACTGTGTGGTGGAGGGATGCGAGGCGTCCAAGGAGCAGTCGGAGGTGCGACTGTTCCGCTTCCCCACCGACGACGACGACATGCTGTGGAAGTGGTGCAACAACCTCAAGATGAACCCGGTGGACTGTGCGGGAGTGCGCATCTGCAACAAGCACTTCGAGGCGGACTGCATTGGACCCAAGCACCTGTACAAGTGGGCCATTCCCACCCAGGAGCTGGGCCACGACGATGCGCAGATCGAACTGATACCGAACCCGAAGCCAGAGGACCGGTACGTGGATCCGGTGTTCAAGTGCATTGTGCCCACCTGCGGAAAGACGCGTCGCTTCGACGAGGTGCAGATGAACAGCTTTCCCAAGGATCCGAAGCTCTTCCAGCGCTGGCAGCACAACCTCCGCCTGGAGCACCTCAACTTCCTGGAACGCGAGCGGTACAAGATCTGCAACGCCCACTTCGAGGACATCTGCATTGGCAAGACGCGGCTGAACATAGGATCGATTCCCACTTTGGAGCTGGGTCACGACGAGACGGAGGACTTGTTCCAGGTTAATCCAGCCGAGCTGCAGAGTAACCTCTTTGGACGCCAGAGGCGAGTGCATGAGGAATCGGGAAGCATAAGCAGCATCAAGCAGGAGCTCTCCGAGTCGGAAGATGTGAAGCCGGATGTGGCGATCTTGTCGCAGGATAGAGATTCTCATCCCAGACAGGTGAAGTTAAGGAAAATCATTTCCGATTTGAAGTGCTGTGTGCACAGCTGTGGACGCAGTCGCATGGAGCACGGAGCACGACTCTTCCCGTTTCCCACCGGCAAGCAGCAGCACCTCAAGTGGCGCCACAACCTGCGACTGGAACCCGATGAAGTGGATCGCTCGACGCGGGTGTGCAGTGCTCACTTTAATCGGCGCTGCATCGACGGCAAGCAGCTGAGGAGCTGGGCCATGCCCACTCAGCAGTTGGGCCACCAGGAGCAGCCGATCTACGAGAACCCGAAGAACATACCGGGCTTCTTTACGCCCACCTGTGCGCTGAATCACTGCCGCAAGCGGCGGAGCATCGACAACGATCTGCGCACGTATCGCTATCCACGAAGTGAGGATCTCCTGGAGAAGTGGCGCGCGAATCTCAGATTGGCGCCGGATCAATGCCGCGGCAGGATTTGTGCGGATCACTTTGAGGCCCAAGTGCGGGGCAAACTGAAGCTGAAAACCGGAGCGGTGCCCACATTGAAACTGGGTCACGATGAGGGATTAATCTACGACAATGAGGCTATTAAAGTGGGCGTGACTGAGGATGAGGAGGGCAGCTCGGAGTTGCCGCGACTGAAACCCAAAATGGAGCCGATCGATGATGAGGAGGAGGACGCTGTGGCTGAGGCTGAGGCTGAGGAGGATCACCACGACCGGGACAACGAGGATGAAGATGAGAAGGAGGAGCACTATTTCGATCCCCTCGAATTGGTCGAGACCTTTGCCGAACATCCAAGCGATGATGAAGCCGAATATCGAGGGGAAGAGGACGATGAACGGGAGGATGAGGAAGAGGAATTGGACGATGCGGAGCACTTCCTGCCCGACTTGCCACCCGCTCCTCCAGTGGCTCCTCTGCGCCGTGAAAAGCCTGCCAACAATGTGACTCCCATTTGCTGTCTGAAGCACTGCAGAAAGGAGCGCACTGCTTTCCACCTTTTAAGCACCTTTGGTTTCCCCAAGGATCGCCAGCTGCTGCTCAAGTGGTGCGCCAATCTGCACCTGAATCCCGATGACTGCATCGGTCGCGTGTGCATTGAGCACTTTCAGTCGGAGGTTCTGGGAACGCGTAAGCTGAAGCAAAATGCGGTGCCCACTTTGAATGTGGGACACGATGAGCCGCTGAAGTACTCTTGTAATGGCAGGGATCTGGATCAGGAGCAGGCGCAGCCACAGCACTCGGTTTTTCGGCTTTGGAGCCTGAAACACTGCCGCAAGAGGAAGCTGACGGAGCCGCCGGACATCCGGCCGAACAAGTGGCAGATGATGCAGCGGCTGAAGCTGGAGATGCAGATGGAGCGGGAGCGGGAGATCAAGCTGGAGATGAAGACGGAGGCGATGACTCCAACGGGGAATCCGAGGGAGAGTAGGCTGGAGAAGTGTTGCATCAGCAGTTGCGGAAACGAGGAAGTTAGTCAGTTAGTTGCAATGCCCGAGGAGCGAACTCTTCTAAGAAAGTGGCAGCACAATTTAAAGCTTCCTTTTGACTCGATTCCCAGCGAAAGTTGCGTGTGTCTGGAGCATTTCGAGGAGCAGGTTGTGCCAAATGGAAAGCCTGACGAGCAGGCAGTACCCACCCTCAAATTGGATCAAAGGAGTTGGAATATCTACAGAAACAAAGGAGAGTGCCTGGTGGAAAGCTGTGCAAGTGACCTTTGCTCAACCTTTGTGGATTTGCCTTTAAATACGATCATAAGAGAGGAATGGATGTCCTATTTCCAGTTGCCTGAAAGCAGTGAGGGTCTTCTATGTGGAAATCACTTTGTGGAACTGTTTGAGAATGTAGATTTGCCAAAAGTGTTATCCCCAGATAATCTGGAGGAGCTACAGTGGATTGCTCAAGAACTGAAATGCGCTGTGCCTGGATGCTCTTCGAAAAATGAACAGAATCTCCAGCTCATCCAACTTCCCGACAAGGAAGTGGAACTTTTCAAATGGTTGCACAACACAAAGATAACCTACGATCCTGCGAGGCATAAGAGCTATCGCATCTGCCTGCACCACTTTGAAGCATCCTGCCTAGAATCGGATTACCCCAAGTCTTGGGCCATTCCCACTTTAAATCTCAGTCACGAGGACAGGATTCATTTGAATCCCAGGCAGGAGTCACGCAGTGGAACTCCAAACAGCCACTCTAGACTGACTCCCCTGAGGATCAAAACGGATCTCGCCTCTCTGGGAAGTCCTTGTGCGAGTGCGAGTCCCAGTCCGCGGGGAAGGATCAGGATATGCTGTATTCCCACGTGCGGACAGTTCGGGAACAGTCAAGTTCGGCTCTACCGCTTTCCCAGCGAGGAACAGGCATTGCTCCGCTGGCTGGTGAACACGCAGCAGCAGCCGCGCCTCGTGGATCCCCAGGAGCTCTACGTGTGCCAGTCCCACTTCGAACCGGATGCCATTTGCAAGAAGCAGCTGCGCAGCTGGGCGGAACCCACCTTGAACCTCGGTCACGACGGTCATGTGATCCCGAATGCCAGGCACAATGGAAATATCGCTGATAGCCAGGAAACCGAACAGGCAATGAAGTTCATTCGGGAACGCTACTGCTCCGTGCTCACCTGCTTCCAGGCGGAGGATAAGGGGGTGCGGCTCTACGATTATCCCAGGGACATGGCCACCATACGGAAGTGGGCAGCCGCCTGTCGACACCGCTCCATGCAGGCCAGCAGTCACGGATTCAAGGTGTGCCAGTCTCACTTTGCACCCGAGTGTTTCGATTCTGAATCCTTGGATCTGATTGAGGGATCGGTTCCCACGCTCGAGTTGAGCCGGGATGACATTGAGAGGCACTGCTTGGTGCCGGGATGTGTAAAGGATGCAAGTGGGGAACGGATCAGGCACTACAAGGTGCCAAGGACCGCTGCTCAACTGGAAGCCTGGAGCAACAACCTGAAGATCGGCGCAATGGAACTCATTCAGGGAGAGCAGTTCATCTGCGAGCGTCACTTTGAGTCGTTTTGCTTTGGCGCCAGCAAGGGATTGCGTCCTGGTGCGATTCCCACTCTCCATTTGGGACATGATGAGGAGGTAGAGATGTTGCCCAATCCCGAAAATCTTTGGCAAAGCAAAGTGGAGGTTTGTTGTGCACCTGGTTGTGGAAACATCTGGCAGCTTGGAGAGACACCATTCAATGGGTTTCCCAAAATATTCTCATTGGCCGAGAAATGGATGCATAACCTCCGATTGAAAGCCAACAAGGAGCAGTTGGGCAGGCCGAAGGTCTGCAGTAGGCACTTTGAGGACTCCCTCTTTGATAAAAGTGGTTTGATACCGGGTGCAATGCCAACTTTGGAACTGGGTCATTCCTCTCCGGATATTTTCCAAACGGACAAGCAAAGTCTGGGCAGGAATTTAAAGTTCTCAAAGCGCTCTCTTAACTCGGATGTGGATTGCTGTTACCCCGAGTGCATGGAACTCTCCAAGAACCTCACCTTTAATCTGCCACAGGATGAGCAACTGAGGAGAGCTTGGCTGCACCATTTGGACATTGAGGAGCCACCGAATGGCGTCGCACTGCTGTGCCCGCTGCACTTCGTCATTCTCTACGAGCTGAGTGAAAATAGTTTTCCCGAACACACACCGAATCGATTCCTCGAGGATGATTACCATTCTGCGCGGAGCAACAGGCGGGTGAAGATCGTGAGCTGTGCGGTTAGAGGTTGTAGGATGATTCGTCCCCGGGATAAGGTTCTCCTGCACGGATTGCCGCAGAGGAAGGACATGCTGCGGATGTGGGTGGAGAATGGCCAGCTGGAGATCACCGAGCAGCAGCAGCAATACATGCTCAAGGTGTGCCGCAATCACTTCGAGTCGAAGTGCTCCTTTGACGAGAGAAGGCTGCATCCCTGGAGCGTTCCCACTTTGCAGTTGCCAGCGGAGCCGGTGCACCAGGTGCCCAGCAAAGAGGTGTGGCTGGAAATGACCGCGAAACTGAACCAGGAGATCGGGGACATCGATCAAGAGGAGGATCAGGAAACAGAGTATCGGGAAGATGGTGAAACGGAGAACTCCCTTTTGGAACCCATCGTGAGGATGGAGCACATTGAATCCGAGGAGGAAGGCTCGGAAATGCAGGCACTGGAGGTGCTACTGGAGGTGGGCCACGTGGAGCGAATGGACAGCTACGAGAAAATGGACGAGTCCTACAACGATCATATCAGCTACCAATCCTCTGGCATTCGGAACCAATACAATGCCAATCACTGCGCCGTTGAAGGATGCCAGGTGACAATCGAGGACGTGGACGGGACCATCAAGCTGCACAAGTTCCCCGCATCTTCGGAAGCGGCCAAAAAGTGGATGCACAACACCCAGGTGGACATGGACGAGAAGTTCTGGTGGCGCTATCGCATTTGCAGCTACCACTTCGATCAGGAGTGCTTCCAGAGTGCCAGGATCAAGAAGGGAGCGATGCCGACGCTTCTTTTGGGACCCAAAAGGCCGGACAAGTTGTACGACAACGAATTCGCGTTGCAGGAAACGGAAGAGCTTTCCTTGCCAGCTGAAATCCAGCAGGGGGATCGTAAGGAACCGAAAGTTCAGGAGGTGACCAAACTCTGCCTGCCACCGCCAGCTCCGCCACGAAAGTCGAGTAAGTTCTGCCAGATAGACGGATGCACCAACCACCTGACCACCGAGAACATGACGCTGCACAAGTTCCCCCACTCCGAGGACATGTGCCTCAAGTGGCAGCACAACACGCAGGTGCCCTTCGATCCCTACTACAGATGGAGGTACCGCATCTGCAGTGCCCACTTCCATCCGGTTTGCCTGCTGAACATGCGACTGGTCCATGGAAGTGTGCCCACATTGAAGCTGGGCGAGAAGGCGCCCGCCGAGCTCTTCGACAACGACTTCGAGGCCATCAACCTGAGACTGGACAAGCGGTCTGGAGCAGAGCAGTGTGCCGTCCAAATCAAAGAGGAGAGGGAGGAGGACGAGGAGCCCATGCTCTTTTTGGAGCCCGAACTGCAGCTGCACGAGGATCAGGAGATGGAGAAGATGAGGGTGGTGTCGATGCCCTTCAACCCGTCCAACTGGAAGGGCCAACTGCGCCTGCCCGTCAAGCAGGAGAAGGTGTCCTACAACCAGGTGAAGTCCGGCTACGACAAGTGCTCCCTGAGCCACTGCCAGCGGCAGAGATCGCTGCACGGCGTGCACATCTACAAGTTCCCCAAGTCGCGGCAACAGCAGGAGCGTTGGATGCACAACCTGCGCATCCGCTACGACGAGCGGCGTCCCTGGAAGTTCATGATCTGCAGCGTCCACTTCGAGCCGCACTGCATCAGCCTGAGGAAGCTGCGCCCCTGGGCGGTGCCCACTCTGGAGCTGGGCGACAATGTGCCGGAGAAGCTCTTCACCAACGAACAGTGCCAGGAACTCAGCACCGATCGCAGCGAGGCGGGCAGCGACGAGGAGGAGGACGGCCTGCAGGAGGACGAGGAAGAGGAGGAGGAGGACGAGTGCAACGAGGATGTGGAGCCGGAGGTTCGCATCAAGCGGGAGCGCCGTTCCAAGCTGGATCCCTGGCCACCTGGGCAGCTGCCTCCCTGGAAGGTGAAGCAGTGTTGTCTGCCTTATTGTCGCGCCTTCCGCGGCGATGGCATCAAGCTGTTCCGGCTGCCCAACAACCGCACCTCCATCCGCAACTGGGAGATTGCCACGGGAATGGTGTTCAAGGAGTCCCAGAGAAACACTCGCCTCATTTGCAGTCGCCACTTCGAGCCGGAGTTGATTGGCGTGAGGCGTCTCATGCGCAACGCCATACCCACGCGGCATTTGAGTGCCCAAGGAGTCAAGGAGGAGGTGAAGAAAAAGCCTCCAGCGCCCCTGCCCACCTGCTGCATGGCCGACTGTCATCACAATGGAAATGTGAAGCTGCACAAGTTTCCCGGTGATCCTTCGCTGCTTAGGCAGTGGTGCCAGGCTCTCAGGCTCACCGACACGCAGCGTTACAGGGGTAAACATATCTGCTCGGTCCACCTGCCCACTGACAGGACGATCAGCTGCGTCCTCTGCGGCGCCGACAATGCGGAACCGCCGCTGCTGGACTTTCCGGAGCAGCGCAACCAGCGCGCCAAATGGTGCTACAATCTCAAGATCGAGGCCATACCAAAGTGGGACCACTCCAAGCACATCTGCTGTCGTCACTTCGAGCCGCATTGCTTTGCCCAGCCGGGTGAACTGCGTCCAGGAGCGATACCCACGCTGCATCTGAGTCACGAGGACACGAACATTTTCCTCAGCGATTACGGCACTGGTCCGACCAGCAATCGCTTCAAGGACGAGCCCATGGACAACGACGAGATGCTGCTGGTTTAG
Protein Sequence: MSQQHPHHAHPHYAHHXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXVASYPTPHSAFGHPAPTPPPAPPCKAANSSNSNNNNMGGGAYGPGGGGGNGVQGYYGAAGGGLNVSGAVGVGVGGGPSYGLGANXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXNPQRSYMGHDIMTTGSYPYIKSEPMEAFQQPPNPMAPPPAPEILIKSEPIDEHSYKSNYIDDNTPFADFSKFSEFSEDMLSPKVELTVKDESYGRNSNSFMRRKQQSDRSAESLPICQRCKEVFFKKQIYLRHVAESNCGIQEYDFKCSTCPMSFMTAEELQRHKHLHRSDRFFCHKYCGKYFDTIAECEAHEYMQHEYDSFVCNMCSGTFATREQLYAHLPQHKFQQRFDCPICRLWYQTALELHEHRLAAPYFCGKYYTGGQSSAASQSQTQQHQNQTNYKLQDCHMATMEMPTAPHHKSNPSSSSLPATAALNSLLQQRQANADGAAMFAASAMKNEVNVKLERSYSNSTSESSYSVQENNYNNAYGSDSSIHGGAIAGPQAHSSTLDDSEDALCCVPLCGVRKSTSPTLQFFTFPKDEKYLNQWLHNLKMFHIPAASYANFRICSMHFPKRCINRYSLCYWAVPTFNLGHDDVANLYQNRELTNTFTTGEVARCSMPHCTSQRGESNLKFYNFPKDIKSLIKWCQNARLPVQAKEPRHFCSRHFEERCIGKFRLKPWAVPTLHLGAQYGKIHDNPKNLYVEEKRCCLNFCRRSRSSDFNMSLYRFPRDEVLLRRWCYNLRLDPGVYRGKNHKICSAHFIKEALGLRKLSPGAVPTLHLGHTDTFNIYENELWPPPTPSNSHGSGLQQLQSQHHTSQHSLQQQLHSKSYQRHSAASTSSSASSATSHYVDPELSASYLAMGAGGSAALNASDSMDICCVPSCESKRHNNENITFHTIPRRPEQMRKWCHNLKIPEEKMHKGMRICSLHFEPYCIGGCMRPFAVPTLQLGHDDDDIHRNPDVIKKLNIRETCCVAVCKRNRDRDHANLHRFPSNVSLLTKWCGNLQRPVPDGSKLFNDAICEVHFEDRCLRNKRLEKWAVPTLILGHENIPYPLPTPEQVAEFYARPTAPNNGEEQGECCVETCKRNPSVDDIKLYRPPEEASVLAKWAHNLQTEASQLTSMRICNLHFEAHCIGKRMRPWAIPTLNLAGNIENLYENPEHSMLYKRRTHTKTKLPASVKPTWVPRCCLPHCRKVRALHNVQLYRFPKVNRSTLAKWAHNLQVPMVGSAQRRLCSAHFEPHVLSKKCPVPLAVPTLDLNSPPGLKIYQNPAKLKASKLCLQRVCIVESCRKTRAQGVQLFRLPHSPTQLRKWMHNIKTRPRAAMRAQYRVCSRHFETHSFNGRRLSAGAIPTLELGHDDDDIYPNEAQAFVDEHCVVEGCEASKEQSEVRLFRFPTDDDDMLWKWCNNLKMNPVDCAGVRICNKHFEADCIGPKHLYKWAIPTQELGHDDAQIELIPNPKPEDRYVDPVFKCIVPTCGKTRRFDEVQMNSFPKDPKLFQRWQHNLRLEHLNFLERERYKICNAHFEDICIGKTRLNIGSIPTLELGHDETEDLFQVNPAELQSNLFGRQRRVHEESGSISSIKQELSESEDVKPDVAILSQDRDSHPRQVKLRKIISDLKCCVHSCGRSRMEHGARLFPFPTGKQQHLKWRHNLRLEPDEVDRSTRVCSAHFNRRCIDGKQLRSWAMPTQQLGHQEQPIYENPKNIPGFFTPTCALNHCRKRRSIDNDLRTYRYPRSEDLLEKWRANLRLAPDQCRGRICADHFEAQVRGKLKLKTGAVPTLKLGHDEGLIYDNEAIKVGVTEDEEGSSELPRLKPKMEPIDDEEEDAVAEAEAEEDHHDRDNEDEDEKEEHYFDPLELVETFAEHPSDDEAEYRGEEDDEREDEEEELDDAEHFLPDLPPAPPVAPLRREKPANNVTPICCLKHCRKERTAFHLLSTFGFPKDRQLLLKWCANLHLNPDDCIGRVCIEHFQSEVLGTRKLKQNAVPTLNVGHDEPLKYSCNGRDLDQEQAQPQHSVFRLWSLKHCRKRKLTEPPDIRPNKWQMMQRLKLEMQMEREREIKLEMKTEAMTPTGNPRESRLEKCCISSCGNEEVSQLVAMPEERTLLRKWQHNLKLPFDSIPSESCVCLEHFEEQVVPNGKPDEQAVPTLKLDQRSWNIYRNKGECLVESCASDLCSTFVDLPLNTIIREEWMSYFQLPESSEGLLCGNHFVELFENVDLPKVLSPDNLEELQWIAQELKCAVPGCSSKNEQNLQLIQLPDKEVELFKWLHNTKITYDPARHKSYRICLHHFEASCLESDYPKSWAIPTLNLSHEDRIHLNPRQESRSGTPNSHSRLTPLRIKTDLASLGSPCASASPSPRGRIRICCIPTCGQFGNSQVRLYRFPSEEQALLRWLVNTQQQPRLVDPQELYVCQSHFEPDAICKKQLRSWAEPTLNLGHDGHVIPNARHNGNIADSQETEQAMKFIRERYCSVLTCFQAEDKGVRLYDYPRDMATIRKWAAACRHRSMQASSHGFKVCQSHFAPECFDSESLDLIEGSVPTLELSRDDIERHCLVPGCVKDASGERIRHYKVPRTAAQLEAWSNNLKIGAMELIQGEQFICERHFESFCFGASKGLRPGAIPTLHLGHDEEVEMLPNPENLWQSKVEVCCAPGCGNIWQLGETPFNGFPKIFSLAEKWMHNLRLKANKEQLGRPKVCSRHFEDSLFDKSGLIPGAMPTLELGHSSPDIFQTDKQSLGRNLKFSKRSLNSDVDCCYPECMELSKNLTFNLPQDEQLRRAWLHHLDIEEPPNGVALLCPLHFVILYELSENSFPEHTPNRFLEDDYHSARSNRRVKIVSCAVRGCRMIRPRDKVLLHGLPQRKDMLRMWVENGQLEITEQQQQYMLKVCRNHFESKCSFDERRLHPWSVPTLQLPAEPVHQVPSKEVWLEMTAKLNQEIGDIDQEEDQETEYREDGETENSLLEPIVRMEHIESEEEGSEMQALEVLLEVGHVERMDSYEKMDESYNDHISYQSSGIRNQYNANHCAVEGCQVTIEDVDGTIKLHKFPASSEAAKKWMHNTQVDMDEKFWWRYRICSYHFDQECFQSARIKKGAMPTLLLGPKRPDKLYDNEFALQETEELSLPAEIQQGDRKEPKVQEVTKLCLPPPAPPRKSSKFCQIDGCTNHLTTENMTLHKFPHSEDMCLKWQHNTQVPFDPYYRWRYRICSAHFHPVCLLNMRLVHGSVPTLKLGEKAPAELFDNDFEAINLRLDKRSGAEQCAVQIKEEREEDEEPMLFLEPELQLHEDQEMEKMRVVSMPFNPSNWKGQLRLPVKQEKVSYNQVKSGYDKCSLSHCQRQRSLHGVHIYKFPKSRQQQERWMHNLRIRYDERRPWKFMICSVHFEPHCISLRKLRPWAVPTLELGDNVPEKLFTNEQCQELSTDRSEAGSDEEEDGLQEDEEEEEEDECNEDVEPEVRIKRERRSKLDPWPPGQLPPWKVKQCCLPYCRAFRGDGIKLFRLPNNRTSIRNWEIATGMVFKESQRNTRLICSRHFEPELIGVRRLMRNAIPTRHLSAQGVKEEVKKKPPAPLPTCCMADCHHNGNVKLHKFPGDPSLLRQWCQALRLTDTQRYRGKHICSVHLPTDRTISCVLCGADNAEPPLLDFPEQRNQRAKWCYNLKIEAIPKWDHSKHICCRHFEPHCFAQPGELRPGAIPTLHLSHEDTNIFLSDYGTGPTSNRFKDEPMDNDEMLLV

Similar Transcription Factors

Sequence clustering based on sequence similarity using MMseqs2

100% Identity: iTF_00605601;
90% Identity: -
80% Identity: -