Basic Information

Insect: Drosophila sucinea
Gene Symbol: -
Assembly: GCA_018150745.1
Location: JAECWP010000045.1:493546-508489[-]

Transcription Factor Domain

TF Family: THAP
Domain: THAP domain
PFAM: PF05485
TF Group: Zinc-Coordinating Group
Description: The THAP domain is a putative DNA-binding domain (DBD) and probably also binds a zinc ion. It features the conserved C2CH architecture (consensus sequence: Cys - 2-4 residues - Cys - 35-50 residues - Cys - 2 residues - His). Other universal features include the location of the domain at the N-termini of proteins, its size of about 90 residues, a C-terminal AVPTIF box and several other conserved residues. Orthologues of the human THAP domain have been identified in other vertebrates and probably worms and flies, but not in other eukaryotes or any prokaryotes [1].
Hmmscan Out: # of c-Evalue i-Evalue score bias hmm coord from hmm coord to ali coord from ali coord to env coord from env coord to acc

1 32 5.2 1.2e+04 -2.8 3.3 40 62 282 307 272 323 0.58

2 32 3.8e-15 8.7e-12 45.7 4.3 1 86 533 605 533 606 0.85

3 32 9.8e-15 2.2e-11 44.4 5.2 1 87 633 702 633 702 0.83

4 32 2.8e-15 6.4e-12 46.1 0.3 1 87 725 797 725 797 0.84

5 32 0.0021 4.7 8.1 0.1 50 87 804 830 798 830 0.74

6 32 4.9e-15 1.1e-11 45.3 3.2 1 86 854 925 854 926 0.82

7 32 6.8e-13 1.5e-09 38.4 0.6 1 87 961 1029 961 1029 0.80

8 32 7.6e-11 1.7e-07 31.9 1.6 1 86 1073 1142 1073 1143 0.77

9 32 1.8e-16 4.1e-13 49.9 0.4 1 86 1170 1239 1170 1240 0.83

10 32 8.3e-13 1.9e-09 38.2 1.7 1 86 1261 1330 1261 1331 0.80

11 32 3e-15 6.9e-12 46.0 2.0 1 86 1358 1429 1358 1430 0.85

12 32 2.8e-13 6.4e-10 39.7 1.4 1 85 1506 1574 1506 1576 0.84

13 32 3e-12 6.8e-09 36.4 0.1 1 86 1600 1668 1600 1669 0.82

14 32 1.1e-13 2.5e-10 41.0 2.6 1 87 1794 1863 1794 1863 0.80

15 32 2.9e-10 6.5e-07 30.0 0.1 1 86 1949 2015 1949 2016 0.82

16 32 0.0012 2.7 8.8 0.1 1 59 2035 2083 2035 2105 0.73

17 32 5e-13 1.1e-09 38.9 0.6 1 86 2112 2181 2112 2182 0.84

18 32 2.5e-13 5.6e-10 39.8 1.7 1 87 2243 2313 2243 2313 0.83

19 32 5.5e-13 1.2e-09 38.7 0.9 1 86 2348 2419 2348 2420 0.81

20 32 3.8e-12 8.6e-09 36.0 0.4 1 87 2432 2505 2432 2505 0.80

21 32 5e-15 1.1e-11 45.3 0.8 1 86 2531 2603 2531 2604 0.81

22 32 1.9e-07 0.00044 21.0 0.4 1 58 2630 2680 2630 2702 0.84

23 32 1.5e-13 3.4e-10 40.6 0.2 1 87 2718 2790 2718 2790 0.83

24 32 2.6e-14 5.8e-11 43.0 0.2 1 86 2842 2913 2842 2914 0.80

25 32 0.00024 0.54 11.1 0.1 1 58 2945 2994 2945 3009 0.79

26 32 4.9e-13 1.1e-09 38.9 0.3 1 87 3032 3104 3032 3104 0.82

27 32 8e-15 1.8e-11 44.6 0.4 1 87 3249 3322 3249 3322 0.82

28 32 1.1e-11 2.5e-08 34.6 3.2 1 85 3389 3458 3389 3460 0.79

29 32 7.9e-15 1.8e-11 44.7 5.4 1 86 3564 3634 3564 3635 0.85

30 32 4.3e-13 9.8e-10 39.1 0.1 1 86 3714 3783 3714 3784 0.85

31 32 2e-11 4.6e-08 33.7 0.6 1 58 3810 3859 3810 3864 0.86

32 32 5e-11 1.1e-07 32.5 0.4 18 87 3876 3935 3865 3935 0.76

#	of	c-Evalue	i-Evalue	score	bias	hmm coord from	hmm coord to	ali coord from	ali coord to	env coord from	env coord to	acc
1	32	5.2	1.2e+04	-2.8	3.3	40	62	282	307	272	323	0.58
2	32	3.8e-15	8.7e-12	45.7	4.3	1	86	533	605	533	606	0.85
3	32	9.8e-15	2.2e-11	44.4	5.2	1	87	633	702	633	702	0.83
4	32	2.8e-15	6.4e-12	46.1	0.3	1	87	725	797	725	797	0.84
5	32	0.0021	4.7	8.1	0.1	50	87	804	830	798	830	0.74
6	32	4.9e-15	1.1e-11	45.3	3.2	1	86	854	925	854	926	0.82
7	32	6.8e-13	1.5e-09	38.4	0.6	1	87	961	1029	961	1029	0.80
8	32	7.6e-11	1.7e-07	31.9	1.6	1	86	1073	1142	1073	1143	0.77
9	32	1.8e-16	4.1e-13	49.9	0.4	1	86	1170	1239	1170	1240	0.83
10	32	8.3e-13	1.9e-09	38.2	1.7	1	86	1261	1330	1261	1331	0.80
11	32	3e-15	6.9e-12	46.0	2.0	1	86	1358	1429	1358	1430	0.85
12	32	2.8e-13	6.4e-10	39.7	1.4	1	85	1506	1574	1506	1576	0.84
13	32	3e-12	6.8e-09	36.4	0.1	1	86	1600	1668	1600	1669	0.82
14	32	1.1e-13	2.5e-10	41.0	2.6	1	87	1794	1863	1794	1863	0.80
15	32	2.9e-10	6.5e-07	30.0	0.1	1	86	1949	2015	1949	2016	0.82
16	32	0.0012	2.7	8.8	0.1	1	59	2035	2083	2035	2105	0.73
17	32	5e-13	1.1e-09	38.9	0.6	1	86	2112	2181	2112	2182	0.84
18	32	2.5e-13	5.6e-10	39.8	1.7	1	87	2243	2313	2243	2313	0.83
19	32	5.5e-13	1.2e-09	38.7	0.9	1	86	2348	2419	2348	2420	0.81
20	32	3.8e-12	8.6e-09	36.0	0.4	1	87	2432	2505	2432	2505	0.80
21	32	5e-15	1.1e-11	45.3	0.8	1	86	2531	2603	2531	2604	0.81
22	32	1.9e-07	0.00044	21.0	0.4	1	58	2630	2680	2630	2702	0.84
23	32	1.5e-13	3.4e-10	40.6	0.2	1	87	2718	2790	2718	2790	0.83
24	32	2.6e-14	5.8e-11	43.0	0.2	1	86	2842	2913	2842	2914	0.80
25	32	0.00024	0.54	11.1	0.1	1	58	2945	2994	2945	3009	0.79
26	32	4.9e-13	1.1e-09	38.9	0.3	1	87	3032	3104	3032	3104	0.82
27	32	8e-15	1.8e-11	44.6	0.4	1	87	3249	3322	3249	3322	0.82
28	32	1.1e-11	2.5e-08	34.6	3.2	1	85	3389	3458	3389	3460	0.79
29	32	7.9e-15	1.8e-11	44.7	5.4	1	86	3564	3634	3564	3635	0.85
30	32	4.3e-13	9.8e-10	39.1	0.1	1	86	3714	3783	3714	3784	0.85
31	32	2e-11	4.6e-08	33.7	0.6	1	58	3810	3859	3810	3864	0.86
32	32	5e-11	1.1e-07	32.5	0.4	18	87	3876	3935	3865	3935	0.76

Sequence Information

Coding Sequence: ATGTCACAACATAATCCACATTATCATCACCCCCATCCGCACCCTCTGCACTATCAACAACAACAACAACAACAGCAGCAGCAGCTGCACCACCATCTTTCCCCTCTTCAGCAGCAACAACATAAACAAATACAACACAGCAATTGGTATTCACATGTTGCTTCCACCTCTTCCACCTCCTACCCGCATCACCCCTCATCAGCAGCCACCTCATCCTCCTCTTCGGTGGTGGCGGCGGCGGCGGCATCAACTTCAGGCTCTAACAACAATCACATAATGAATGCCTATGGAACACATGGATATTATGGTGCCGCTGGCGGTGGCCTCAATGTCAATGCTGTGGGTGTTGGTGTTGGGGGTGGTCATCATCAACATCATCATCATGGTATATATCCCTATATCAAAAGTGAACCCATGGAATATAGCCATAATACAATGGCTCCACCGCCAGCACCTACTGGACCCAACACAGAGATGAGAATTAAATCGGAACCCATTGACGAACTTGCCTACAAATCGTCCAACTATATTGATGATAATACTCCATTTGCTGATTTTACTAAATATAATGAATTTAGCGAAAATATGTTGAATCCCAAAGTGGAATTGACTGTAAAAAATGAGTCGTCCTATGGCAAGAATATTAACAATTATCCAAGACGTAAATTACAAACGGAACGTTCTTCAGAGAATTTACCCATTTGTCAACGATGTAAAGAAGTCTTCTTCAAGAAACAATCCTATCTACGCCATGTGGCCGAGAGCAGTTGTAGCATCCATGAATATGAATTCAAATGCAACATTTGTCCCATGTCCTTTATGAGTGGCGAAGAGCTGCAAAGACATAAACATCTCCATCGAACAGATAAATTCTTTTGTCATAAATATTGTGGAAAACATTTCGATACCATAGCCGAGTGTGAATCCCATGAGTATATGCAGCATGAATATGATAGTTTTGTTTGTAATATGTGTTCGATGACATTTGCCTCGCGGGAGCAGCTTTATACCCATTTACCGCAGCATAAATTCCAGCAGCGTTATGATTGTCCCATTTGTCGCTTGTGGTATCAGACGGCTCTGGAGCTGCATGAGCATAGATTGGCGGCACCGTATTTCTGTGGTAAATACTACAATACGGCACATCAGTCACAGCAGCACCAGCAGCACCATCACCCACAACAACAACAACAGTCGAATCAGGCAAATTATAAATTACAGGATTGTCATATGGCTACAATGGAAATGCCCACAGCGACGCCACCATCGGTGTCCAACGCAAGCAGTTCATCCTCAGCCTTACCAGCAACGGCGGCGTTAAGTTCGCTGCTTCAACAGCGTCAGGCTAATGCCGATGGAGCGGCTATGTTTGCTGCCGCTGCCTCCACCTCTACTACGTCACATAAGAGCGACGTGAATGTGAAGCTTGAACGCAGCTATAGCAATTCGACAAGTGATTCGTCATTTGGAATGCACGAGTCCTCCAACTATAATAATAATAATGCTTATGGCAGTGATAATTCCATTCATGGGGCAGGAGCCATTGGTGGTCCCCAAGCTCATTCCTCAACGCTGGATGACTCCGAGGATGCTCTATGTTGTGTACCCATGTGCGGGGTAAGCAAGAGCACTAGTCCCACTCTCCAGTTCTTCACATTCCCCAAAGATGATAAATACCTCCATCAATGGTTGCACAATTTGAAGATGTTTCACATACCCGCCTCAAGCTATACGACTTTTCGCATCTGTAGCATGCATTTCCCGAAACGTTGCATCAATCGGTATTCGTTGTGCTATTGGGCAGTGCCTACATTCAATCTGGGTCATGATGATGTTGCCAATCTCTATCAGAATCGCGAGCTAACCAATACCTTTACCACTGGCGAAGTGGCACGCTGCAGCATGCCACACTGTAACAGTCAGAGGGGCGAGAGTAATCTCAAGTTCTACAACTTTCCCAAGGACATTAAAAGTCTGATCAAATGGTGTCAGAATGCTCGTCTGCCGGTTCAGGCCAAGGAGCCCCGGCACTTTTGTAGCCGTCACTTTGAAGAGCGATGTATTGGCAAGTTTCGGTTGAAACCGTGGGCAGTGCCCACACTACATCTCGGTGGTGCGCAATATGGCAAGATCCATGACAATCCAAAGAATTTGTATGTGGAGGAGAAGCGTTGTTGCCTTAATTTCTGTCGCCGTAGCCGCTCAACGGATTTCAATATGTCCCTATATCGTTTCCCAAGGAATGAGGTCTTATTACGACGCTGGTGCTATAATCTACGTCTCGATCCGGGTGTCTATCGCGGCAAGAATCACAAAATATGCAGTGCTCATTTTATTAAAGAGGCATTGGGTTTACGCAAATTGTCGCCAGGCGCTGTACCTACACTTCATTTGGACAAAATGCACAAGGGAATGCGGATTTGCAGTCTACATTTCGAACCGTATTGCATTGGCGGATGCATGCGTCCATTTGCAGTGCCCACTCTACACTTGGGTCACGACGATACGGACATACATCGGAATCCGGATGTGATTAAGAAGCTAAACATCAGGGAAACATGCTGTGTGGCAGTTTGCAAGCGGAATCGTGATCGTGATCATGCAAATCTCCATCGATTCCCCAGCAATGTGGCCCTCTTGTCGAAATGGTGTGCGAATCTGCAACGACCTGTACCCGATGGCAGTAAACTCTTTAACGATGCCATTTGCGAAGTGCATTTCGAAGATCGTTGTTTGCGTAACAAGAGATTGGAGAAATGGGCGGTGCCCACCTTAATATTGGGTCATGAGGACATTGCATATGAATTGCCCACATCCGAGCAAGTGGCTGAATTCTATGCGCGTCCAAATGCCCCAAATAACGGCGAAGAGCAGGGCGAATGCTGTGTGGAAAGCTGTAAACGTAATCCCAGTGTGGATGATATCAAACTATATCGACCACCTGAAGAATCAGATGTTCTTGCAAAATGGGCTCACAATCTGGAATTGGATGTCGCTGATTTACCAAACATGAGAATATGCAATTTACATTTCGAATCCCATTGCATTGGCAAACGGATGAGACCGTGGGCCATACCCACATTGAATCTATCTTCGAACATAGAGAATCTCTATGAGAATCCAGAGCACTCCATGTTGTACAAGAGGAGAACGAAGAGGGATCCAAATCGAGATTTATCGCTGGGCACAGCGACGAAACCCACTTGGGTGCCCAGATGCTGTTTGCCTCATTGTCGCAAGGTCCGAGCTCTCCACAATGTTCAGCTCTATCGTTTCCCCAAACTCAATCGGTCTACATTGGCCAAATGGGCTCACAATTTGCAAGTGCCAATGGTGGGCAGTGCTCAGAGAAGACTATGTTCAGCTCATTTCGAACCGCATGTCTTGAGTAAAAAGTGTCCAGTGCCCTTGGCCGTGCCCACCATTGATTTAAATGCACCGCCTGGCTATAAAATCTATCAGAATCCAGCCAAACTCAAGGCGACAAAATTGTGCCTGCAGAGAGTTTGCATTGTGGAGAGCTGCCGACGCACAAGGGCTCAGGGAGTGCAACTCTTCCGTTTGCCTCACAGTCCCACGCAGCTAAGAAAATGGATGCACAACATAAAGACTCGTCCACGGGCGGCTACAAGGACCCAGTATCGCATCTGCTCAATACATTTTGAGTCGCATTCGTTTAATGGCAAGAGATTGAGTGCTGGAGCCATTCCCACACTGCAATTGGGTCATGACGATGATGATATCTATCCGAATGAGGCTCAAGCTTTCGTGGATGAGCATTGTGCGGTCGAGAGTTGTGAATCATCGAAAGATCAACCCGAAGTACGTCTCTTCCGTTTCCCAACCGAAGATGATGATTTACTCTGGAAATGGTGCAATAATCTTAAAATGAATCCAGTCGATTGTGTGGGTGTCCGGATATGTAATAAGCACTTTGAAGGCGATTGCATTGGTCCCAAGCACTTATTCAAGTGGGCCATACCTACGCTGGAACTGGGACATGATGATGCCCAAATCGAACTCATTCCGAATCCCAAGCCAGAAGAGCGATATGTAGATCCAGTGTTTAAATGCTGTGTGCCCACTTGCGGCAAGACCAGAAAATTCGATGAGGTGCAAATGAATAGTTTCCCCAAGGATCCGGTGCTCTTCCAGCGTTGGCGACACAATCTTCGGCTGGAGCACCTGAACTTCAAGGAACGAGAACGTTATAAGATTTGCAATGATCATTTTGAGGATGTTTGCATTGGTAAGACCCGGCTGAATATAGGCTCCATACCCACCATTCAATTGGGTCACGACGAGACGGAGGACCTCTACCAGGTGGATCCCGCAGACCTGCAAAGCAATCTTTTCGGTCGACCTCGTAGATTACATGGATCAGTTGACATTAAGGTCGAACTACTCGAAGAGAACGAACAGGAGGATGTGAAACCAAATATCTATGCTATGGCTGAAGCCACCGATATGAACACCAGGCAGGTGAAGATTAAGAAATCTCTCGCTGATCTTAAGTGTTGTGTGCGAAGCTGTGGACGCAGTCGCCTGGAGCATGGAGCCCGTCTCTTTCCCTTTCCGAGCGGCAAGCAGCAGCAACTGAAATGGCGGCACAATCTCCAACTTGAACCGGATGAGGTGGATAAATTGACACGCGTCTGCAGTGCTCATTTCAATCGTCGTTGCGTTGATGGAAAACAACTGAGGGGATGGGCCATGCCCACTCAACAATTGGGCCATCATCAAGAACAGCCCATCTATGAGAATCCCAAGAATATACCGGGTTTCTTTACACCAACATGTGCCCTCAGTCATTGTAGGAAAAGGCGAAGTATTGATAATGACTTGCGCACCTATCGCTATCCGAGGAGTGAGGATCTATTGGAGAAATGGCGAGCCAATTTGCGATTGGCTCCCGATCAATGTCGCGGACGGATTTGTGCCGATCACTTCGAGCCTCTGGTTAGGGGCAAGTTGAAATTGAAGACGGGGGCAGTGCCCACTCTTAAATTGGGTCACGATGAAGATTTAGTCTATGACAATGAAGCCATTAAAGCTAGCATGGCGGATGAGGAAGATGGCAGCATAGAATCAACACCACCGCAAATAATACCGAAAAAAGAAATTTTGGAAGATGAAGACGATGAGGATGGTGCCCCCCAAGAGGGGGAGAATGAGGAGGATGATGATGATCCACCCCAAGAAGCAGATCAGGACGATTCACATTCTGATTATTTTGATCCCTTGGAACTGGTAGAGACATACGCCGATGATGCAGTACAAGAAGATGAATATACATCTCCTCTTCTCCCGCCACCCCCGTCATTAGCCGCTCCTCCTACTGCACGGCGTGAGAAACCGGCGAATAATGTAACTCCGATTTGTTGTCTAAAGCATTGCCGTAAGGAACGCACACCCACTCATCAGTTGAGTACTTTCGGCTTTCCCAAAGATCATCAACTGCTGCTGAAATGGTGTGCCAATCTTCACCTGGAACCAGTGGACTGTGTGGGACGCGTTTGCATTGAGCATTTCGAAGCGGAAATGTTGGGAACGCGCAAGCTTAAGCAGAATGCAGTGCCCACCGTAAATGTGGGTCATCAGATGCCCTTACCCTACACGTGCAACGGACAGGAGCGAAGCGATGAGGACGAGGATCATTCGGATTTTCGGCTTTGGAGCCTGAAACATTGTCGCAAGAGGAAGCTAACGGAACCACCAGACATTCGCCCAAAACTGGAGAAGAACGAGGTGATTCCAATGATGATGATGAGTATGGGAGTGAGAGTGAAGAAGGAGAAAATGGAGGATGGGGAAGAACTGGAGATGATGACTAAACCAAAGAAGTGTTGCCTTATCCAATGCGGAAAAGAGATGAACTTGCAAAAATTCCCAAGAGATTTCCATTTGCTTCGCAAATGGTTACACAATCTGAAGTTAAACCTAGACGAGTATTTGGATCCTACCGCACTTCGTGTGTGCTTGGACCACTTTGAGCCGCATTTAGTGCCTAATGGTCAACTATTGAGAGAGGCATTGCCCACTCTCAAATTGGGTCATCAGGATACGAATATTTACCAGACCACTGTGGCAACTTCGGGAGGTTGTTTGGTGGCCAGTTGTCCGTGTGCTCGTCTCAATTTGTATCGAAGTTATGCTTTACCCAAGAATCCCCACATTAAAGAGGTCTGGTTAACATATCTGAAGCTTCCATTCACTACCCAAGGACAGTTGTGTGTAATGCACTTTATGCAGCTCTATGAGGAGATGCCCTTTAAGGAGCTGCGACATATCTACGAGACCATTGCCAACTCCACACAAGCCCTGAAACTGCGTTGTGCCGTCCCTGGATGCCATTCCAAATACACGGATAATATACATTTGACAAAGCTACCGCTGAATAAGAACCTACTCCATAAATGGTTGCACAACACCACGTTAAACTATGATCCCACTAAGCATTCGATATATCGTGTTTGCCTGCTGCACTTTGAGCCGCACGCCTTAGGCCCGGCATGCCCGAAGCCCTGGGCAGTGCCCACCTTGGAATTGAATCATCAAGATGACATTTACTTTAATCCCACAAAAGAGGAAATGGTTAATCTAACCAATGTTCCGTTGCAAATTAAAACGGAATTAACTCTGCCGTTGCGAATAAAAACCGAACTTGCCGCCTTGAGCAGTCCCAGCATTGGTTCCACTCCGAGTCCAAGGGGCAAGGTGCGAATTTGCTGCATACAGTCGTGTCAGCAACAGGCCAATTCCCAGTTGCGTCTCTATTGGTTTCCCAATGCGGAGACCGCTCTGCTCAAGTGGCTGGTCAATACGCAACAGCAACCACGTCTGGTGGATCCCCTGCAGTTGTATGTCTGTCAATCTCATTTCGAACCCGAAGCCATTTGTAAGAAGCAGCTGAGAAGTTGGGCAGTACCCACCTTGAATTTGGGTCACGATGGTTATGTTATACCCAATGCCAGGCACAATGGAAATATTGCCGATAGCCAGGAAACGGAACATGCAATGGAATTCATCAGGGAGAACTATTGTTCCGTACTCACGTGCTTTCAGCGGAAGAGTGAAGCTGTGCGTCTGCATGCCTATCCCAAGGATATGCCAACTATACGAAGATGGGCAGCCAATTGCAAGCATCGATCCATGCAGGCCAGCAGTCATGGATTCAAGGTCTGTCAATTGCATTTTGAATCAGAGTGCTTTGATCCGGATACTGGAGACTTACGTGAAGGATCTGTGCCCACTCTGGATCTAACAGTTAGTCGGCTGAGCAACGAATCGCGTTGCCTGGTCGCTGGTTGTGTGAAGGATGAGTCCCAGCCGCGACGACGTTACTACAAATTGCCCAAGCGGCCAGCTCTGCTCAACGATTGGTGCGTGAATCTCGCTCTGGATCCTTCTGGACTGCCCCAAAATGCTGATCATAATATATGTGAACGACATTTCGAATCTCGCTGCTTCAATAGCTACAAACAATTGCGTACTGGAGCACGACCGACATTGCATTTGGGTCACACTCAAGATATCAAGTTGCTACCCAATCCGGAGAGTTTCAGTGACGAGGCGGAAGATATCGGGCTCTGCTGTGTGCCGCAATGTGGTGGCTCCAAGCAATCGGATGATTTAATTCAACTAAGCCATTTTCCCCGAATGCGTAAGCTGGCTGAGAAATGGATACATAATTTACATCTTCCTTCCTTTAACCGGGATCAGTTGGCCAAGCTTCGCGTGTGTCATAGGCATTTTGATGCGACTTGTTTTGAAAATGGCCAATTGCGACAGGGAGCCATGCCCACCATGGAGTTGGGTCACACGGATGCGGACATTTATCAAACAGATGAACCAAATTTGGGCAAGCTTCGAAAGCCCGGACTGGATTGCTGTTATCCTCAGTGTGTCCAATTGCAGAAGAACTACCAGCGGGTGGTCCACGATCTGCCGAAAGAGGAGAAGCTACGTCAGCGATGGCTTCAGCATTTAGAAATCGAAAATACAGAGGAGCGACCGTTGAAATTGTGCCCACTCCATTATATTATCCTGTATGATCATAGTGTGAAAAACTTTGAAGAACACGGTCCGGATGATCTGCTCGAAAAGAACTATGACGATGCACGAAACGGTTCGAGAATCAGGCTTATCAGTTGTGCGGTTCGCGGATGTGGAACTCTTCAGCCGCGTGATGGCGGCAGGCTGCATGGTCTACCCACAAATCCTGAGGTCTTCCAGATGTGGTTAGAGAACACCGAGCTGGTCGTCTATGAGCCGCAGCGTTATATGATTAAAGTGTGCAGTAAACACTTTGAACCTCAGTGTTTTACCGATATTCGCAAATTGAAATGCTGGAGTGTGCCGACACTTCATCTACCCGGTGAGATAGTGCATCAAAATCCCACCGAAGAGGAATGGCAAAAGATGACCGAGCGATTGGCCGTTGTACCCGTCACTCAGAGAGTGGATGCAGGCGACGACACTTTGTTGCTGGAACCGGTCGTTATTATGGAAGAGAACTCTGTCTGCTGTGTCCCCAACTGTGGACGCTACAAGCAGACAGATGAGTCAACTCAATTCACTAGTTTCCCCAAGATAAACATTCTGGCCGAGAAATGGATGCATAACTTCCATCTGAAGGTGGGCAAAGATCAATTGGGCAATCTTCGGGTGTGTTATCGACATTTTGAGGCATCTTTGATAGAAAATGGACGCTTACGTCGCTATGCCATGCCCACCCTGGAGTTGGGTCATGAGGATAGCGAAATCTATCACACAGAGGATCCAGATCTCAACAGGGTGCGAAAGCAGCCCAAGAGATCCAGTGGCCAGGGCTGTTCTTATCCCCAGTGTGTGGAACTGTTGAAGAATTTCCAGCGAATGGTCTATGATCTGCCGAAGGAACCGCAACTGCGAGAATGTTGGCTTCAGTATATGGAATTGACGGAAGAGGAGCAACCACTGAAGTTGTGCCCACTCCACTACATAATTCTCTATGATCATAGTGTGAAAAACTTTGACGCACATGCTCCGGAACAGCTGCTCGACTATAACTACGAGAATGCTAGGAATTGTGTACGTATCCGAATTATCAGCTGTTCGGTTCAAGGATGTAATACACTCCAGCCACGCGATGGCGGACGAATGCATGGTCTGCCGCCGAGATCGGATATCCTCCAGATGTGGCTGGACAATACTAGATTGCTGTTCCATGAGCATCAGCGTTACATGCTTAAAGTGTGTAGCAAACACTTCGAGCCCAAATGTTTCACTGACATTCGCAAATTGAAGAGCTGGAGTATTCCGACCCTTCATCTACCCGAAGAGCCAGTGCATCAGAATCTCACAGAAAAGGAATGGCATCAGATGAATGAGAAATTTGCCGAGCCCATTAATCGGGAAGCGGAAAGTTTCGATGACAATTCAATGCTGGAGCCCATTGTTATGATGGAACATGCCGAATCTGATGGCGAAATGTTGGAGGGGGAGGAGACGGGACGAATCCCTCACACAGAATTTGTGACCAATGATCATTTGCAGGAAGATTCCCAAGATGTGGGTGATGAAGAGATGCAGGCATTGGAAGTCCTTCTCGAAGTCGGTCATGTGGAGAAATGTTCCAGCTATGAAAAAATGGACAACAAATCCCATTTGCCTTACTCCGAGACAAGGCCATTGAGTCCTTCGATTGCTTCTGTGCCTCCTGGACAACGCGGCGGTGGTGGTGGTCATTACAATGCCCGCCACTGCAGTGTCCAGGGTTGTCAGATAACTGCTCATGATGTGGACGGCAATATCAAGCTTCACAAATTCCCCTCCTCCACGGAGGCCACCCAAAAATGGATGCATAACACCCAAGTGGATGTGGATGGGAACTATTCGTGGCGCTATCGCATTTGTAGTTACCATTTCGAGCAGGAATGCTTTAATGGGGCCCGCATACGGCGGGGATCTATGCCCACTTTGCATTTGGGTCCCCTCCGACCTAAGGATATCTATGCTAATGAGTTCACACAAACGGATATAGATGAAAGTGTTGGAGAAGCGATCCCTAATTTGCCACCTGAGCAGGATGAACATGAACCTGTCGTGGCTCCGCATATACGGGGTCAAGTGACGCAATTGTGTCTGCCACGTCCTGCTCCGCCGCGTAAATCAAGTAAATTCTGTCAAATCGATGGATGTTCGAATCACCTGACCAGTGAAAATATGACTCTGCACAAGTTTCCTCACTCGCTGGAAATGTGTGCCCGCTGGCAACACAATACCCAGGTGCCATTCGATCCAGAGTATCGATGGCGCTACCGCATCTGCAGTATTCATTTTCATCCAGTTTGTTTGGTCAATATGCGCTTAGTGCACGGCAGTGTGCCTACCCAGAAACTTGGTCCTCGGGCGCCTGCCCAATTGTTTGACAATGATTTTGAGGCCATTAACATGAGACTGGATAAGCGATCGCACTTGGAGCAGGGAGCTAGGGTGAAGCAAGAGAAGCCGTATTCCCAGCAGCCTGATGAGGGATTCTATCTAGAGCCAGAAATGGAAATGGATGTGGATGAGATGGAAGAGGAGCAAGACCAAGATCAATCACAATCTATGACATCCTTTGAAAATTGGAGGCATCAGCTTCGACTACCGGCCGTTAAGCAAGATAAGACGCCTTATAATCCTATTAAGTCTGGCTACGACAAATGCTCCCTCACGCACTGTCAGCGTCAGAGATCTCAGCATGGTGTCCACATATACAAATTCCCGAGATCGAAGCGCCATCAGCAACGCTGGATGCACAATTTACGCATCCGGTATGATGAGCGAAAACCGTGGAAATACATGATCTGTAGTGTTCACTTTGAGCCGCATTGTATTCGCTTGAGGAAACTACGTCCATGGGCAGTGCCCACTTTGGAGTTGGGTAAGAATGTGGCAGACCAGATCTATACCAATGAACAGTGCAGAGAAATGGCCTCAGATGTCAGTGAGGAAGAGGAGAGTGGACCCGACGAAAGTCTTCTGGAAGATGACGAGGATGAAGCAGATCTAGATGGAGAAACTGGTGTGGAGTCCCACATAAAGCGGGAAAGGCGCTCTTGGGGATCAGGTGGTGCTGCTGGTGGTCAAGCGGCTCCTTGGAAAGTCAAACAATGCTGCTTACCCTATTGCCGCCGACCACGTGGAGATGGCATCAAACTCTTTCGCCTGCCCGGCAATCCGAATTCCATACGAAATTGGGAAAAGGCCACTGGCATGACATTTAAGGCGTCGCAGCGCAACACTCGCTTGATTTGCAGTCGTCACTTTGAGCCTGAGTTGATGGGAGTGCGTCGGTTGATGCGGAATGCGATACCCACGAGACATTTATATCACCAAAGGGAGAGTTATAGCCCAGAGCTGGTGATACCCACAGATACTCCAGCTCCCATTGGTCCCACTTGCTGCATTCCTGATTGCTCTCCACAAGATGGATCGTCTCAACTTCATCGGTTTCCCAGTGATCCACATCAGTTGCAGCAATGGTGCGAGTCTCTAAATCTTACGGATCCTCAACGCTATAGCGGTCAATATGTTTGCTCTAATCATCTTCCAGCCCTCGACTTGGGATGTATTATCTGTGGCGTCGAGGATGTGCAATTGCCGCTACTTGATTTTCCCGAGAATCGTAATCATCGAGCAAAATGGACTTATAATCTGAAAATTGATACCATACCCAAATGGGACAACTCCAAGCATATTTGCTCGAAACATTTCGAATCCTATTGCTTTAGCCAGCAAACCGGGGAACTGCATCCGGAAGCAGCGCCCACACTGCATTTAAAACACAATGATTCGAATATATTCCTCAATGATTATGCCATAGATCAGCCCTGTATGATGCGAATTAAAGATGAGCCCTTGGACAACGATGAAATGTTGTTGGCTTAA
Protein Sequence: MSQHNPHYHHPHPHPLHYQQQQQQQQQQLHHHLSPLQQQQHKQIQHSNWYSHVASTSSTSYPHHPSSAATSSSSSVVAAAAASTSGSNNNHIMNAYGTHGYYGAAGGGLNVNAVGVGVGGGHHQHHHHGIYPYIKSEPMEYSHNTMAPPPAPTGPNTEMRIKSEPIDELAYKSSNYIDDNTPFADFTKYNEFSENMLNPKVELTVKNESSYGKNINNYPRRKLQTERSSENLPICQRCKEVFFKKQSYLRHVAESSCSIHEYEFKCNICPMSFMSGEELQRHKHLHRTDKFFCHKYCGKHFDTIAECESHEYMQHEYDSFVCNMCSMTFASREQLYTHLPQHKFQQRYDCPICRLWYQTALELHEHRLAAPYFCGKYYNTAHQSQQHQQHHHPQQQQQSNQANYKLQDCHMATMEMPTATPPSVSNASSSSSALPATAALSSLLQQRQANADGAAMFAAAASTSTTSHKSDVNVKLERSYSNSTSDSSFGMHESSNYNNNNAYGSDNSIHGAGAIGGPQAHSSTLDDSEDALCCVPMCGVSKSTSPTLQFFTFPKDDKYLHQWLHNLKMFHIPASSYTTFRICSMHFPKRCINRYSLCYWAVPTFNLGHDDVANLYQNRELTNTFTTGEVARCSMPHCNSQRGESNLKFYNFPKDIKSLIKWCQNARLPVQAKEPRHFCSRHFEERCIGKFRLKPWAVPTLHLGGAQYGKIHDNPKNLYVEEKRCCLNFCRRSRSTDFNMSLYRFPRNEVLLRRWCYNLRLDPGVYRGKNHKICSAHFIKEALGLRKLSPGAVPTLHLDKMHKGMRICSLHFEPYCIGGCMRPFAVPTLHLGHDDTDIHRNPDVIKKLNIRETCCVAVCKRNRDRDHANLHRFPSNVALLSKWCANLQRPVPDGSKLFNDAICEVHFEDRCLRNKRLEKWAVPTLILGHEDIAYELPTSEQVAEFYARPNAPNNGEEQGECCVESCKRNPSVDDIKLYRPPEESDVLAKWAHNLELDVADLPNMRICNLHFESHCIGKRMRPWAIPTLNLSSNIENLYENPEHSMLYKRRTKRDPNRDLSLGTATKPTWVPRCCLPHCRKVRALHNVQLYRFPKLNRSTLAKWAHNLQVPMVGSAQRRLCSAHFEPHVLSKKCPVPLAVPTIDLNAPPGYKIYQNPAKLKATKLCLQRVCIVESCRRTRAQGVQLFRLPHSPTQLRKWMHNIKTRPRAATRTQYRICSIHFESHSFNGKRLSAGAIPTLQLGHDDDDIYPNEAQAFVDEHCAVESCESSKDQPEVRLFRFPTEDDDLLWKWCNNLKMNPVDCVGVRICNKHFEGDCIGPKHLFKWAIPTLELGHDDAQIELIPNPKPEERYVDPVFKCCVPTCGKTRKFDEVQMNSFPKDPVLFQRWRHNLRLEHLNFKERERYKICNDHFEDVCIGKTRLNIGSIPTIQLGHDETEDLYQVDPADLQSNLFGRPRRLHGSVDIKVELLEENEQEDVKPNIYAMAEATDMNTRQVKIKKSLADLKCCVRSCGRSRLEHGARLFPFPSGKQQQLKWRHNLQLEPDEVDKLTRVCSAHFNRRCVDGKQLRGWAMPTQQLGHHQEQPIYENPKNIPGFFTPTCALSHCRKRRSIDNDLRTYRYPRSEDLLEKWRANLRLAPDQCRGRICADHFEPLVRGKLKLKTGAVPTLKLGHDEDLVYDNEAIKASMADEEDGSIESTPPQIIPKKEILEDEDDEDGAPQEGENEEDDDDPPQEADQDDSHSDYFDPLELVETYADDAVQEDEYTSPLLPPPPSLAAPPTARREKPANNVTPICCLKHCRKERTPTHQLSTFGFPKDHQLLLKWCANLHLEPVDCVGRVCIEHFEAEMLGTRKLKQNAVPTVNVGHQMPLPYTCNGQERSDEDEDHSDFRLWSLKHCRKRKLTEPPDIRPKLEKNEVIPMMMMSMGVRVKKEKMEDGEELEMMTKPKKCCLIQCGKEMNLQKFPRDFHLLRKWLHNLKLNLDEYLDPTALRVCLDHFEPHLVPNGQLLREALPTLKLGHQDTNIYQTTVATSGGCLVASCPCARLNLYRSYALPKNPHIKEVWLTYLKLPFTTQGQLCVMHFMQLYEEMPFKELRHIYETIANSTQALKLRCAVPGCHSKYTDNIHLTKLPLNKNLLHKWLHNTTLNYDPTKHSIYRVCLLHFEPHALGPACPKPWAVPTLELNHQDDIYFNPTKEEMVNLTNVPLQIKTELTLPLRIKTELAALSSPSIGSTPSPRGKVRICCIQSCQQQANSQLRLYWFPNAETALLKWLVNTQQQPRLVDPLQLYVCQSHFEPEAICKKQLRSWAVPTLNLGHDGYVIPNARHNGNIADSQETEHAMEFIRENYCSVLTCFQRKSEAVRLHAYPKDMPTIRRWAANCKHRSMQASSHGFKVCQLHFESECFDPDTGDLREGSVPTLDLTVSRLSNESRCLVAGCVKDESQPRRRYYKLPKRPALLNDWCVNLALDPSGLPQNADHNICERHFESRCFNSYKQLRTGARPTLHLGHTQDIKLLPNPESFSDEAEDIGLCCVPQCGGSKQSDDLIQLSHFPRMRKLAEKWIHNLHLPSFNRDQLAKLRVCHRHFDATCFENGQLRQGAMPTMELGHTDADIYQTDEPNLGKLRKPGLDCCYPQCVQLQKNYQRVVHDLPKEEKLRQRWLQHLEIENTEERPLKLCPLHYIILYDHSVKNFEEHGPDDLLEKNYDDARNGSRIRLISCAVRGCGTLQPRDGGRLHGLPTNPEVFQMWLENTELVVYEPQRYMIKVCSKHFEPQCFTDIRKLKCWSVPTLHLPGEIVHQNPTEEEWQKMTERLAVVPVTQRVDAGDDTLLLEPVVIMEENSVCCVPNCGRYKQTDESTQFTSFPKINILAEKWMHNFHLKVGKDQLGNLRVCYRHFEASLIENGRLRRYAMPTLELGHEDSEIYHTEDPDLNRVRKQPKRSSGQGCSYPQCVELLKNFQRMVYDLPKEPQLRECWLQYMELTEEEQPLKLCPLHYIILYDHSVKNFDAHAPEQLLDYNYENARNCVRIRIISCSVQGCNTLQPRDGGRMHGLPPRSDILQMWLDNTRLLFHEHQRYMLKVCSKHFEPKCFTDIRKLKSWSIPTLHLPEEPVHQNLTEKEWHQMNEKFAEPINREAESFDDNSMLEPIVMMEHAESDGEMLEGEETGRIPHTEFVTNDHLQEDSQDVGDEEMQALEVLLEVGHVEKCSSYEKMDNKSHLPYSETRPLSPSIASVPPGQRGGGGGHYNARHCSVQGCQITAHDVDGNIKLHKFPSSTEATQKWMHNTQVDVDGNYSWRYRICSYHFEQECFNGARIRRGSMPTLHLGPLRPKDIYANEFTQTDIDESVGEAIPNLPPEQDEHEPVVAPHIRGQVTQLCLPRPAPPRKSSKFCQIDGCSNHLTSENMTLHKFPHSLEMCARWQHNTQVPFDPEYRWRYRICSIHFHPVCLVNMRLVHGSVPTQKLGPRAPAQLFDNDFEAINMRLDKRSHLEQGARVKQEKPYSQQPDEGFYLEPEMEMDVDEMEEEQDQDQSQSMTSFENWRHQLRLPAVKQDKTPYNPIKSGYDKCSLTHCQRQRSQHGVHIYKFPRSKRHQQRWMHNLRIRYDERKPWKYMICSVHFEPHCIRLRKLRPWAVPTLELGKNVADQIYTNEQCREMASDVSEEEESGPDESLLEDDEDEADLDGETGVESHIKRERRSWGSGGAAGGQAAPWKVKQCCLPYCRRPRGDGIKLFRLPGNPNSIRNWEKATGMTFKASQRNTRLICSRHFEPELMGVRRLMRNAIPTRHLYHQRESYSPELVIPTDTPAPIGPTCCIPDCSPQDGSSQLHRFPSDPHQLQQWCESLNLTDPQRYSGQYVCSNHLPALDLGCIICGVEDVQLPLLDFPENRNHRAKWTYNLKIDTIPKWDNSKHICSKHFESYCFSQQTGELHPEAAPTLHLKHNDSNIFLNDYAIDQPCMMRIKDEPLDNDEMLLA

Similar Transcription Factors

Sequence clustering based on sequence similarity using MMseqs2

100% Identity: iTF_00555122; iTF_00571192; iTF_00503302; iTF_00612108; iTF_00618446; iTF_00523731; iTF_00577817; iTF_00555882; iTF_00483726; iTF_00501079; iTF_00591002; iTF_00600351;
90% Identity: iTF_00555122;
80% Identity: -