Basic Information

Insect: Zaprionus kolodkinae
Gene Symbol: GA10450_1
Assembly: GCA_018901885.1
Location: JAEIFM010000247.1:1115156-1131167[+]

Transcription Factor Domain

TF Family: THAP
Domain: THAP domain
PFAM: PF05485
TF Group: Zinc-Coordinating Group
Description: The THAP domain is a putative DNA-binding domain (DBD) and probably also binds a zinc ion. It features the conserved C2CH architecture (consensus sequence: Cys - 2-4 residues - Cys - 35-50 residues - Cys - 2 residues - His). Other universal features include the location of the domain at the N-termini of proteins, its size of about 90 residues, a C-terminal AVPTIF box and several other conserved residues. Orthologues of the human THAP domain have been identified in other vertebrates and probably worms and flies, but not in other eukaryotes or any prokaryotes [1].
Hmmscan Out: # of c-Evalue i-Evalue score bias hmm coord from hmm coord to ali coord from ali coord to env coord from env coord to acc

1 28 8.3e-15 9.7e-12 45.4 4.1 1 86 738 810 738 811 0.85

2 28 5.1e-15 6e-12 46.0 4.7 1 87 838 907 838 907 0.83

3 28 1.1e-15 1.3e-12 48.1 0.4 1 87 929 1001 929 1001 0.85

4 28 7.4e-16 8.6e-13 48.7 5.3 1 87 1101 1171 1101 1171 0.83

5 28 1.4e-14 1.6e-11 44.7 3.5 1 86 1195 1266 1195 1267 0.82

6 28 2.1e-12 2.5e-09 37.6 1.0 1 87 1302 1370 1302 1370 0.81

7 28 1.6e-10 1.8e-07 31.6 1.4 1 86 1417 1486 1417 1487 0.76

8 28 1.1e-15 1.2e-12 48.2 0.1 1 86 1514 1583 1514 1584 0.82

9 28 3.6e-12 4.2e-09 36.9 1.1 1 85 1605 1673 1605 1675 0.81

10 28 5.7e-15 6.6e-12 45.9 1.8 1 86 1702 1773 1702 1774 0.85

11 28 6.5e-13 7.6e-10 39.3 0.9 1 85 1848 1916 1848 1918 0.81

12 28 3.3e-12 3.8e-09 37.0 0.1 1 86 1941 2009 1941 2010 0.81

13 28 2.1e-13 2.5e-10 40.9 2.1 1 87 2150 2219 2150 2219 0.80

14 28 4.4e-13 5.1e-10 39.8 0.6 1 86 2293 2360 2293 2363 0.81

15 28 0.055 63 4.3 0.0 1 58 2380 2430 2380 2452 0.73

16 28 1.2e-11 1.4e-08 35.2 0.2 1 86 2469 2538 2469 2539 0.84

17 28 9.6e-15 1.1e-11 45.2 2.0 1 86 2611 2680 2611 2681 0.82

18 28 9.5e-13 1.1e-09 38.8 1.1 1 86 2716 2787 2716 2788 0.81

19 28 1.4e-11 1.6e-08 35.1 3.2 1 87 2798 2870 2798 2870 0.83

20 28 8.4e-15 9.8e-12 45.3 0.1 1 86 2902 2976 2902 2977 0.80

21 28 0.00046 0.54 10.9 0.1 1 57 3010 3059 3010 3077 0.80

22 28 4.1e-15 4.8e-12 46.3 0.1 1 86 3098 3170 3098 3171 0.81

23 28 3.9e-15 4.5e-12 46.4 1.9 1 87 3310 3383 3310 3383 0.83

24 28 6.1e-14 7.1e-11 42.6 1.4 1 86 3445 3515 3445 3516 0.80

25 28 7.6e-14 8.8e-11 42.3 3.9 1 86 3633 3703 3633 3704 0.85

26 28 3.2e-12 3.7e-09 37.1 0.0 1 87 3797 3867 3797 3867 0.84

27 28 4.8e-08 5.6e-05 23.7 0.3 1 58 3890 3938 3890 3947 0.82

28 28 2.4e-10 2.8e-07 31.0 1.1 18 87 3955 4013 3943 4013 0.74

#	of	c-Evalue	i-Evalue	score	bias	hmm coord from	hmm coord to	ali coord from	ali coord to	env coord from	env coord to	acc
1	28	8.3e-15	9.7e-12	45.4	4.1	1	86	738	810	738	811	0.85
2	28	5.1e-15	6e-12	46.0	4.7	1	87	838	907	838	907	0.83
3	28	1.1e-15	1.3e-12	48.1	0.4	1	87	929	1001	929	1001	0.85
4	28	7.4e-16	8.6e-13	48.7	5.3	1	87	1101	1171	1101	1171	0.83
5	28	1.4e-14	1.6e-11	44.7	3.5	1	86	1195	1266	1195	1267	0.82
6	28	2.1e-12	2.5e-09	37.6	1.0	1	87	1302	1370	1302	1370	0.81
7	28	1.6e-10	1.8e-07	31.6	1.4	1	86	1417	1486	1417	1487	0.76
8	28	1.1e-15	1.2e-12	48.2	0.1	1	86	1514	1583	1514	1584	0.82
9	28	3.6e-12	4.2e-09	36.9	1.1	1	85	1605	1673	1605	1675	0.81
10	28	5.7e-15	6.6e-12	45.9	1.8	1	86	1702	1773	1702	1774	0.85
11	28	6.5e-13	7.6e-10	39.3	0.9	1	85	1848	1916	1848	1918	0.81
12	28	3.3e-12	3.8e-09	37.0	0.1	1	86	1941	2009	1941	2010	0.81
13	28	2.1e-13	2.5e-10	40.9	2.1	1	87	2150	2219	2150	2219	0.80
14	28	4.4e-13	5.1e-10	39.8	0.6	1	86	2293	2360	2293	2363	0.81
15	28	0.055	63	4.3	0.0	1	58	2380	2430	2380	2452	0.73
16	28	1.2e-11	1.4e-08	35.2	0.2	1	86	2469	2538	2469	2539	0.84
17	28	9.6e-15	1.1e-11	45.2	2.0	1	86	2611	2680	2611	2681	0.82
18	28	9.5e-13	1.1e-09	38.8	1.1	1	86	2716	2787	2716	2788	0.81
19	28	1.4e-11	1.6e-08	35.1	3.2	1	87	2798	2870	2798	2870	0.83
20	28	8.4e-15	9.8e-12	45.3	0.1	1	86	2902	2976	2902	2977	0.80
21	28	0.00046	0.54	10.9	0.1	1	57	3010	3059	3010	3077	0.80
22	28	4.1e-15	4.8e-12	46.3	0.1	1	86	3098	3170	3098	3171	0.81
23	28	3.9e-15	4.5e-12	46.4	1.9	1	87	3310	3383	3310	3383	0.83
24	28	6.1e-14	7.1e-11	42.6	1.4	1	86	3445	3515	3445	3516	0.80
25	28	7.6e-14	8.8e-11	42.3	3.9	1	86	3633	3703	3633	3704	0.85
26	28	3.2e-12	3.7e-09	37.1	0.0	1	87	3797	3867	3797	3867	0.84
27	28	4.8e-08	5.6e-05	23.7	0.3	1	58	3890	3938	3890	3947	0.82
28	28	2.4e-10	2.8e-07	31.0	1.1	18	87	3955	4013	3943	4013	0.74

Sequence Information

Coding Sequence: ATGGTGCAACTGTTTAAGTTTCTATTAAAATCAACAAAATTGCCCGCGCGTGCCCATTTTCGTCCCACCTTTTTGGACACACTGCGTCTGACAGTGCGCGGCGGACATGGCGGAAATGGATTGCCGAAATACGGCGGTGTCGGCGGCCAAGGCGGATGTGTTTACTTTCTGGCCAAGGAGGGTCTGACACTGCGCAGGGTAGCCCAGAACTTAAGAGACAAACGGATTCATGCCACAAGTGGCGAGGATAGCAGCAAATTGAGCATATTTGGTAAACGTGGAGCGGATCAGTGTATCGAAGTGCCGGTGGGAGTGCAGGTCTACGATGAGAACAACAAGCTGCTGGCGGATCTGAATGAGAACGATGCCAAGTGTATTGTAGCGGGTGGTGGCACCGGCGGCTGTACTGGTAACAATTTTCTTGGACGTCCTGGTGACCATCGCACAGTGAACTTGGATCTCAAGCTAATTGCCGATGTAGGCCTGGTGGGATTTCCCAATGCTGGAAAAAGCACGTTGTTGAAAGCCGTTTCCAATGCCAAGCCAAAGATAGCTGCATATCCTTTCACCACAATTCGACCACAGATTGGCACAGTTGATTACAGCGATCATAGATTTATCACAATTGCCGATTTACCTGGACTGATTGAAGGCGCCCATGCGAATTTCGGTATGGGACACAAGTTTCTAAAGCACATTGAACGCACGCGTCTGCTGCTCTTCATGGTGGACATATTTGGATTCCAGTTGAGTCCAAAACATCCGCATCGCGACTGCTTAAGTAATATATATGCACTTAACAAGGAGCTGGAGCTTTACGATCCTACACTGCTGGAAAAACCCTGTGTCTTGTTGCTTAATAAAATGGACAAGGACGGAGCGCAGGAGCTGCTGAAAAAGCTCAAACCCAGTATAAAGGACTTGAATAGTGGCCTATCAGAATGTCCCGAAGAAGTACGTCCCAGTAAAGTGCTGAAATTCGAGCGTATCTTACCCATATCTGCCAAGAACTCTGCGCGAATCACGCAAGTAAAGAAACAACTTCGTGAAACACTTGACGCGGTGGCAGCAGAGAGCATGGTAGTCGATAATGAGCTGCTAAAGGAGCAGTTACAGCAACGTGTGGCTGAACCTGTTGACGAACATGCGTACAAGTCCAACTATATTGATGATAATAGACCGTTTGCCGATTTTAGTAAATTCCCAGAATTTGGCGACGACATGCTGAGTCCCAAGATGGAGCTGACCGTCAAGGATGAGGGGTATCAAAAGAACCCGCTCAGCTATCCGCGCCGCAAGCTGCAATCGGAACGTTCGTCGGAGAGTTTACCCATTTGTCAACGTTGCAAGGAGGTATTCTTTAAGAAGCAAATCTACTTGCGGCATGTGGCACAGAGCAGTTGCACCATACAGGAGTATGACTTCAAGTGTAACATATGCCCCATGTCCTTCATGAGCACGGAGGAACTGCAAAAGCACAAGCATATGCATAGGGCCGATAAGTTCTTCTGTCACAAATACTGTGGCAAGTACTATGATACCATCGCAGAATGCGAATCACATGAGTACATGCAGCATGAATATGAAAGCTTTGTTTGCAATATGTGCTCCGTGACGTTTGCCACACGGGAGCAACTCTATGAGCATTTGCCGCAGCACAAGTTCCAGCAACGTTACGATTGTCCCATTTGCCGGCTATGGTATCAAACGGAATTAGAGCTTCATGAGCATCGATTGGCGGCACCCTATTTCTGTGGCANNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNGATTGTCACATGGGCACCATGGAAATGTCTCCGTCACATCATAAGACAGCGGGCAGCGCGTTGCCGGCTACGGCAGCGTTGAGCTCGTTGTTGCAACAACGACAAGCAAATGCCGATGGTGCCGCATTGTTTGCGTCCTCCCTCAAAAACGAGGTGAATGTAAAGTTGGAGCGCAGCTATAGTAATTCTACTACAAGTGAATCTGGGTATAGCCTGCACGACAGCAGCAACTATAATAACACATACGGAAGCGATGCATCGTTGCACAGCGGTGGAGCTATTGGAGGGCCACAAGCGCATTCTTCAACGCTGGACGATTCCGAGGATGCGCTATGCTGTGTGCCATTATGCGGGGTGCGAAAGAGCACCAGCCCCACGCTGCAGTTCTTTACGTTTCCCAAAGATGAGAAATACTTGCATCAATGGCTGCATAATCTCAAGATGTTTCGTGTTCCGGCCTCGAGCTATGCAACTTTTCGAATTTGCAGCATGCATTTCCCGAAGCGTTGTATCAATCGTTATTCATTGTGCTATTGGGCTGTGCCCACATTCAATCTGGGACATGATGATGTTGCCAATCTTTATCAGAATCGTGAGCTAACGAACACCTTCACTACCGGCGAGATTGCGCGTTGCAGTATGCCGAACTGCACCAGTCAGCGAGGTGAAAGTAATCTCAAGTTTTACAACTTCCCCAAGGACATCAAGAGCCTGATCAAGTGGTGCCAGAATGCACGTCTGCCCGTCCAGGCCAAGGAGCCGCGTCACTTCTGCAGCAAACACTTTGAGGAGCGTTGCATTGGCAAGTTTCGCCTGAAGCCATGGGCGGTGCCGACGCTACATTTGGGTGCCCAATATGGCAAGATTCATGACAATCCGAAGAACTTGTATGTGGAAGAGAAACGGTGTTGCCTTAACTTTTGTCGTCGCAGTCGCTCATCGGACTTTAACATGTCACTCTATCGCTTTCCCAGAGATGAGGTACTTCTGCGACGTTGGTGCTATAATTTACGCCTTGATCCTGCAGTTTATCGTGGCAAGAATCATAAAATATGCAGTGCACACTTTATCAAGGAAGCTCTGGGGCTACGCAAACTATCGCCGGGTGCTGTTCCTACGCTTCATTTGGGACACAACGATACGTTTAATATCTATGAGAATGAACTCTGGCCTCCACCGACTGCCTCTACNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNTTCGGCATCTCATTATGTCGATCCGGAGGCGAGTGCCTCGTATATGGGCATTGGCGGTTCGGGTGGATCGGCATCGGGTATGAATGTGAGCGACAGCATGGATGTATGCTGTGTGCCAAGTTGCGAGAGCAAGCGGCACAATAACGAGAACATTACATTCCATACGATACCACGGCGACCAGAGCAGATGCGGAAATGGTGTCACAATCTCAAGATACCCGAGGATAAGATGCACAAGGGAATGCGTATTTGTAGTCTGCACTTTGAACCCTATTGCATTGGCGGCTGTATGCGTCCGTTTGCGGTGCCTACATTGAATCTAGGCCACGACGACGATGATATACATCGCAATCCGGATGTGATTAAAAAGCTGAATATACGTGAAACCTGCTGTGTGGCTGTGTGCAAGCGAAATCGGGATCGAGATCATGCCAATCTGCATCGTTTCCCTAGCAATGTGTCGCTGCTGACCAAATGGTGCGCCAATCTGCAACGTCCTGTGCCGGATGGTACTAAACTATTTAACGATGCCATATGTGAGGTACACTTTGAGGATCGTTGTCTACGCAATAAGCGATTGGAGAAATGGGCAGTGCCTACGCTAGTGTTGGGCCATGACAATATTGCATATCCATTGCCTACGGCAGAGCAAGTCGCCGAGTTCTATGCCCGTCCCAGTGCACCCAATAATGGCGAGGAGCAGGGCGAATGCTGTGTTGAGACCTGTAAGCGTAATCCCAGTGTCGATGATATCAAACTCTATCGCCCGCCCGAGGAATCATCAGTGCTGGCGAAATGGGCGCATAATCTTGAAGTGGATGCCGCCAAGTTGCCAAGCATGCGTATATGTAATCTACACTTTGAATCCCATTGCATTGGCAAGCGAATGCGACCGTGGGCCATTCCCACACTCAATCTGTCCAACAATATTGAGAATATGTATGAAAATCCTGAGCATCATATGATCTATAAGCGTCGCACACAAATCAAAACCGAAAGAGGATCCGCATCGGGTGCTGGTGCGAGCATGTCGAAACCGACTTGGGTGCCACGTTGTTGTCTGCCACATTGTCGCAAGGTGCGTGCCCTACACAATGTGCAGCTATATCGCTTCCCGAAACTCAATCGTTCTACGTTGGCAAAGTGGGCGCATAATCTACAGGTGCCATTGGTGGGCAGTGCCCAGAGAAGACTTTGCTCCGCCCACTTTGAGCCGCATGTGCTGAGCAAAAAGTGTCCGGTACCGCTGGCGGTACCCACACTGGATCTCAATGCGCCACCCGGCTATAAAATCTATCAGAATCCCGCCAAATTAAAGGCCAACAAATTGTGTCTGCAACGTGTCTGCATTGTTGAGAGCTGCCGGCGTCAGCGTGGTCAGGGCGTGCAGCTCTTCCGTCTGCCACACAGTCCCACGCAGCTACGAAAATGGATGTACAACATACGGATGCGACCAAGAGGCGCCATGCGGCAACAGTATCGCATCTGTTCCACACACTTTGAGACGCACTCGTTCAATGGCAAACGATTGAGTGCTGGAGCAATTCCAACACTGGAGCTGGGCCATGACGATGAGGATATCTATCCGAATGAGGCGCAATCATTTGTGGAGGAACACTGTGCCATCGATGGTTGTGATGCATCTAAAGAGCAGCCAGATGTGCGTCTCTTCCGGTTTCCCACTGAAGATGAGGATTTGCTATGGAAGTGGTGTAATAATCTAAAAATGAATCCAGTCGATTGTATTGGTGTGCGCATATGCAACAAACATTTCGAGGCGGACTGCATTGGACCAAAACATCTCTATAAATGGGCCATACCCACACAGGAATTGGGACACGATGATTCTCAGATTGAGCTGATAACGAATCCTAAGCCAGAAGATCGCTATGTTGATCCAGTATTCAAATGTTGTGTTCCCACCTGCGGCAAGACGCGTAAATTCGATGAGGTACAAATGAATAGCTTCCCCAAAGATCCCACACTCTTCCAGCGCTGGCGCCATAATCTGCGACTCGAACATCTCAATTTCAAAGAGCGTGAACGCTATAAGATCTGCAATGCACACTTTGAAGATATATGCATTGGTAAGACACGTCTTAACATTGGCTCCATACCCACACTGGAGTTGGGTCACGATGAAACGGAGGATCTTTTCCAAGTGAATCCCGCAGAGTTACAAAGCAATTTGTTTGGTCGCCAGCGACGGGTACAAGAATCCATGGGTATTAGAATCAAGCAGGAAGAGCATTCTGAGCAGGAGGAGGAGGACAACAAGACCATGTCAGAAGCCACGGATTTGAATACGAAGCAGGTAAAAATAAAGAAAAAGCTGTCTGACTTGAAGTGCTGCGTGCCCAGTTGTGGTCGTAGTCGTCTGGAGCACGGAGCACGTTTGTTTCCCTTCCCAACTGGCAAGCAACAGCAGAGCAAATGGCGTCTCAATTTACGCCTGGAGGCCAGCGACGTGGACAAATCATCGCAAGTATGCAGCGCACACTTCAATCGACGTTGCATCGATGGCAAGCAATTACGTGGATGGGCAATACCCACACAGCAGCTGGGCCATCAGGAACAGCCAATCTATGAGAATCCAAAGAATATACCGGGCTTCTTTACGCCCACCTGTGCGCTGGCGCACTGCCGCAAGCGGCGAAGCATTGACAATGATTTACGCACCTATCGCTATCCGCGAAGTGAGGAATTGTTGGAGAAATGGCGGGTGAATCTACGCCTGGCGCCGGATCAGTGTCGCGGACGCATCTGTGCGGATCACTTTGAGCCAATGGTACGTGGCAAGCTGAAGCTAAAGACTGGTGCGGTTCCAACGCTTAAATTGGGACATGATGAGGGAGTTGTGTTTGACAATGAGGCTATTAAGACGGGACTGCAGTTAGATGGTGCTGAGCCAGAACCGGAAGAGGGTGAGGCCAGCAGAGAATCGCTGATTAAGATTAAAAAGGAGAAAGTAGAGCCGGATGAGGAGTTGGAGCAGACGCAGCTCGACAACGGANNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNCAGCTGCTACTGCCGGAAACGCAGCAAGTGAAGCTGGAACATCCATACCCGCCGATGCCGTTGCGTCGCGAAAAGGCGGTTAATAATGTTACGCCTATTTGTTGTCTAAAGCATTGCCGTAAGGAACGGACTGCCACACATCAGCTCAGCACCTTTGGCTTCCCAAAGGATCGCCTGCAGCTGCGCAAGTGGAGTACCAATTTGCAAATCCCTGAGAGCGACTGTGTGGGTCGCGTTTGCGTAGAGCATTTTGAGTCAGAGGTGCTGGGAACGCGGAAGCTGAAACAGCATGCGGTGCCCACATTGAATCTGGGTCACAACGCACCTCTAATCTATAAATGCAACGGGCAGACTCAACCCATGGGTATCTTCGATGAGCAGCCACAGCATTCGGTTTTTCGGCTTTGGAGCCTGAAACACTGTCGCAAAAGGAAGCTGGAAGTAATGGAACCGCCCGATCATCATCATCATCATCCTCATCATCCACGAGCAGTGATTAAGCAGGAGGAGGAAACGGATGTACACAGCTGTTGCCTTCCGCACTGTGAAAAGCGGTCAGATCTTCATGATGTACAGCTGCATCGGCTGCCCAGTAATCGATTCAGACTTCGAAAATGGTTACACAATCTAAATCTTCCGCAGAGCATTCCAATCGGTAGTCATACTCGAGTCTGCAGCGAACACTTTGAGCTACAGCCTGGTGAGTTAATAGATGATTGTATACCCACATTGAATCTGGGACACAGCGACACGAATATATATCGCAATCAAAGTGCGCCCACCTCATCTTGCTTGGTACCAAGCTGTCCGTGTGCTCGACTCAATCTCTATCGTGGCTACGATTTGCCCGAACATCATTTGGTGCAACAGGCTTGGCTGGAGTTTCTTCGTCAGCCCATACCGCAATCGCCCGGCGATGGTCAGCTCTGTGTGATGCACTATATGCAGCTGTACGAGCAGGTCTCGTTGCCCCAAGAGGTGCCAGCAGCAGTTTTGCGTCAACTGCAGGATACCTACGAACAGATCTCCAACTCTACCATGGCCATGAAGCTACGCTGCGCTGTGCCCGGTTGCTATTCAAAGTACACGGATAACATTAGGTTAACCAAACTGCCCACCTGTGCGGACATGTTTGCCAAATGGCTGCACAATACTAAGATCAAATACGATCCCAACAGGCATTATATATATCGCATTTGTATGCTGCATTTTGAGGCACGTTGTCTGGGTCCAGTGCGTCCCAAATTGTGGGCGGTGCCGACATTGCTATTGAATCACAACGATGCGGATATCTATAGAAATCCTAAGCTAGAAGTTAGCGCGGGCGGTTCTACAGCCCAGTCGCAAGACTTGGCAAACCAAGTTGAGCGACAGCCTGTGCCTGTGCCCGTGGAGCTACCATTACGCATCAAGACTGAGCTAGCTTTCACAGGCAGTCCCTGTGCCAGCGCCAGTCCTAGTCCACGTGGCAAGTTGCGTATTTGCTGCATTCCCAGTTGCGCCCAGCAGGCCAACTCGTTGATACGTCTCTTTAGGTTTCCTACCACCGAGACAATGCTACTCAAATGGTTGGTGAATACACAGCAAAAGCCACGTCTGGCGGATCCACAGCATCTGTTTGTCTGCCAAGATCATTTCGAAAGCGATGCCATTTGCAAGAAGCAGCTAAGTAGTTGGGCTGTGCCTACTCTGAAGCTAGGACACGATGGTCATATCATTCCGAATGCCAAGCACAATGGGAATATTGCGGATACACATGAGAACAGGCATACGCTGCAATTCATTTGGGCCAACTACTGCTCTGTGCTCGACTGCTTTGAGCCACGAAGTGAACAGCTGCGTCTCTTTCCGTATCCCAAAGATCGTCCTACCATACGCAAATGGGCTGCCAATTGCAAACATCGTTCCATGCAAGCCAGCAGCGATGGTTTTCAGGTCTGTCAATCGCATTTCGCGCCACATTGTTTCGATGCGGAAACGGGAGAGTTGCGAGAGGATGCAGTGCCCACGCTGGAGTTAAGTCGTGACAATAATAAAATGGGTTGCATTGTGTCCGGTTGTTTCAAGGAAGAGAATACACCACGTCGTCGCTTTTTCAAGATGCCAAAACGTATGTCACAGATAATGGATTGGTCTCATAATTTTCAACTGGATCCATCAGTCATGACCAACGATAGAAGTGTTGTATGTGATCGGCATTTTGAGCCGCATTGTTTGAACGTGCATAAACAGCTGCGTCGTGCAGCACGTCCCACTTTGCACTTGGGTCACACAGCGGATATTGAGATACTGCAGAATCCGGCAAATTGGACACCATTGGGATCCAATGAAGTGCCTGAATCTTCACCTGATGTTTGCTGTGTGCCCAATTGTGGACGTTACAAGGATGCCGAAGATGCGGAAGATGATATACATTTGTTTAATTTCCCCAAAGTGCGAACAGTGGCGGAGAAATGGTTAAGAAATATTCGCCTGGAAGCAAATAGAATGCAGATGTCCGAGTTGAAAATCTGTAATGTACACTTTGAGATCTATTGTCTGGAAAACGGACGACTTCAATATGGTGCTATGCCCACGCTACAATTGGGACACGATGATCACCATGAGGTATATCGCTCCACTTGTCTGTCGTCATCGAAAATAAAACGTTACTGTAATAGAAACGGATGCAGCTATGATTGTTGTTTTCCTCAATGCGTGGAGTTGCAGAAGAGTTATCTGAGAATAAGCTACGACTTGCCACAGTCGGAGGCCATGCGTAATGCTTGGTTGGCATATATGGAGTTGGAGGAGACACAAGAACAAGAGCTCAAGCTTTGTCCGCTGCACTTGATCATACTCTTTGAGCATAGCATCGATAATATTCCAGAGCACATAACGGAGGAATTGCTGGAGGATAACTATGCTGCGGCAAGGAATAGTGTGCGGATTCGTATCATAAGCTGCGCAGTGCGTGGCTGCAAGACGCTCAAGACACGCGATGGCGGCATACTCCATGGCCTGCCCCAACGACGGGATATACTGCAGATGTGGTTGCACAACATGCAGCTGGTGTTCTACGAGCAGCAGCGATACATGTATAAGATTTGTAGCAAACACTTTGAGTCGAATTGCTTTACGGATACAACACGCCGCCTAAAGCCATGGAGTATGCCGACATTGGAGTTACCGGAACCAGAGCCGGGTGAGCCAGATGTGTATCAGAATCCCACAGAAGCTGAATGGTTGCAGTTGAATGAACAATGGGCAGCTGAGCAATTGCAAAGTGATCAGCCAATGATGGAGGATGAGGAAGTACAAGTGAAATTAGAACCAGAACTAGAGATGGAACATGAAAATCTATTGGAATACGATGAGGATTACTCCCAGCCGGCACTGGAGGATGCCAGCTCACAGCAACCGTTGGAGATGCAACCCCTGGAGGTGCTGCTCGAGGTGGGTCACGTGGAGAAATGCAGAACGTACGAGCAAATGGACACTGAAGCAAATTTCAGTTATGCTGAACAACAGGCGGCGGCTGGACCGCCACCTAGTAATGGAATCCTTCCCAGCAATGAAGAGAAATATAGTGCGGGAAAGTGCAGTGTTCGCGGCTGCGGTGTGACCTTTAAAGATCTCTCTGGCAAAGTGAAGTTGCACAAGTTTCCTACATCATGGGATGCCATGCAAAAGTGGATGCACAATACTCAGGTCAAGGTTTGGCGAAGGGTCGTCTGGCGTTTTCGGATTTGCAGTTATCATTTTGAGGACGATTGTTTTCAAAACTCGCGCTTGCGTCGCGGTGCCATGCCCACATTGCATTTGGGTCCAAGACGACCCTCACACATCTATCAGAGTGAATTCAATGTGAGTTCAGAGCTACCAGTTGCCGATGAGGAGTTGCCCAGCATGGATGAACCAGCACAAATAAAGCCAAAAGTGGGCGGCGATAATATTACATTGTGCCTACCTAATCCAGCACCGCCACGCAAGTCAAGTAAACTCTGCCAAGTCGATGGATGTCCAAATCATCTGACCAGTGAGGGGGTGACGCTGCACAAGTTCCCCCATTCTCCTGACATGTGTTCCAAATGGCAGCATAATACACAAGTGCCATTCGATCCGGTTTACCGTTGGCGCTATCGCATTTGCAGCGCCCACTTTGAACCCATCTGTTTATTGAATATGCGTCTGCTGCACGGCAGTGTGCCCACTCTGAAGTTGGGTGCACGTGCTCCGGCTGAGATCTTCGACAGTGACTTTGAGGCTATAAGCATGCGCCTGGATAAGCAGAAGAGCAGCACAGAGCAGAAGTTATTTATTAAACAAGAGCAGGGAGAGCATTTGTATCAAGAGGATGATGCGGATCAGGACGATGAAATGAGTTTTTTGGTGCCAGAGATGCAACTGCATGAGGATGGTGAACATGAGGCTAACATAAAGACAGAAGAATCGTTGGAAAATTTAGAAAGTTACAACAGCCGGTGGAAACAACAACTGCGTTTGCCCAGCATTAAGCAGGAGGAGACAATGACCTGCTATAATCCTGTCAAGTCCGGCTATGACAAGTGTTCACTTGTACATTGCCAGCGCCAGCGTTCTATGCATGGTGTTCATATCTATAAATTTCCACGCTCCCACCAACTGCAGCAGCACTGGATGCACAACCTGCGGATTCGCTATGATGAACGAAGACCGTGGAAAACAATGATATGCAGTGTGCACTTCGAGCCGCAATGCATTCGTTTGCGTAAATTGCGTCCTTGGGCGGTGCCAACGCTGGAACTGGGCGACAATGTGCCACAGGAGATCTACACGAACGAGCAGAGCCGGCAACAGTTTGAAAAAGAAGAAATGAATGTAGATTTTGACGTGGATCTTAAACAGCCAATGCTGGAGGAGTTCTNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNCGCCAAGCATTAATGCCGCCACTTTGGAAGAAGAAAAAGCAGAAACTTCAGCTTGTGAAAATAAAAACATGCTCATTACCATATTGTCGCAGTCCACGTGGAGATGGTATCAAGCTATTCCGACTGCCGAATAGGGTCAGCGATATACAGAAATGGGAGATGGCAACGGGCATGCGTTTCACTGAATCTCAACGCAACACAAAACTCATTTGTAGCCGTCACTTTGATCCGCAGTTGATTGGCGTGCGGCGTCTCATGTACAATGCTGTACCAACTCTAAACCTGGGCCCAAAGAACTCACCGAGAAGAGAAGAGAAGGTTCCAACTCGTCCTCCAGCTGGACCACGCTGTGCCATGCATAATTGTCCACAGGATATGGAACAAAAGTTGCACAAACTTCCCAGTGATCCTCGGCAGCTTCAAGATTGGTGTGCTGCGCTTAAAGTCTCGGTAACGCAGGAAAATAATAACTTGTACATTTGTGACGACCATTTGCCGTCGCTGGCAGGAAGCTGCCTCATCTGCAGTGTGGAGGAATTGCAGCTGCCCCTGCTCAATTTTCCGGAGAATCGCAATCAACGCGCCAAATGGTGTCATAATCTTAAAATCGATCCCATTCCGAAGTGGGATAACTCAAAGCGCATTTGCAGTCGACACTTTGAGAGCTATTGTTTTATCCAACCCGGTCAGCTGGTCGCCGAGGCTGCTCCCACGTTGCATTTAAGGCACACGGACAGTAACATATTCCTTAACGATTATGCCATGGATTCCAGCAAGATGTTGCGAATTAAGGATGAGCCCTTGGAGAGCGACGATCTGATGCTGTAA
Protein Sequence: MVQLFKFLLKSTKLPARAHFRPTFLDTLRLTVRGGHGGNGLPKYGGVGGQGGCVYFLAKEGLTLRRVAQNLRDKRIHATSGEDSSKLSIFGKRGADQCIEVPVGVQVYDENNKLLADLNENDAKCIVAGGGTGGCTGNNFLGRPGDHRTVNLDLKLIADVGLVGFPNAGKSTLLKAVSNAKPKIAAYPFTTIRPQIGTVDYSDHRFITIADLPGLIEGAHANFGMGHKFLKHIERTRLLLFMVDIFGFQLSPKHPHRDCLSNIYALNKELELYDPTLLEKPCVLLLNKMDKDGAQELLKKLKPSIKDLNSGLSECPEEVRPSKVLKFERILPISAKNSARITQVKKQLRETLDAVAAESMVVDNELLKEQLQQRVAEPVDEHAYKSNYIDDNRPFADFSKFPEFGDDMLSPKMELTVKDEGYQKNPLSYPRRKLQSERSSESLPICQRCKEVFFKKQIYLRHVAQSSCTIQEYDFKCNICPMSFMSTEELQKHKHMHRADKFFCHKYCGKYYDTIAECESHEYMQHEYESFVCNMCSVTFATREQLYEHLPQHKFQQRYDCPICRLWYQTELELHEHRLAAPYFCGXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXDCHMGTMEMSPSHHKTAGSALPATAALSSLLQQRQANADGAALFASSLKNEVNVKLERSYSNSTTSESGYSLHDSSNYNNTYGSDASLHSGGAIGGPQAHSSTLDDSEDALCCVPLCGVRKSTSPTLQFFTFPKDEKYLHQWLHNLKMFRVPASSYATFRICSMHFPKRCINRYSLCYWAVPTFNLGHDDVANLYQNRELTNTFTTGEIARCSMPNCTSQRGESNLKFYNFPKDIKSLIKWCQNARLPVQAKEPRHFCSKHFEERCIGKFRLKPWAVPTLHLGAQYGKIHDNPKNLYVEEKRCCLNFCRRSRSSDFNMSLYRFPRDEVLLRRWCYNLRLDPAVYRGKNHKICSAHFIKEALGLRKLSPGAVPTLHLGHNDTFNIYENELWPPPTASTXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXSASHYVDPEASASYMGIGGSGGSASGMNVSDSMDVCCVPSCESKRHNNENITFHTIPRRPEQMRKWCHNLKIPEDKMHKGMRICSLHFEPYCIGGCMRPFAVPTLNLGHDDDDIHRNPDVIKKLNIRETCCVAVCKRNRDRDHANLHRFPSNVSLLTKWCANLQRPVPDGTKLFNDAICEVHFEDRCLRNKRLEKWAVPTLVLGHDNIAYPLPTAEQVAEFYARPSAPNNGEEQGECCVETCKRNPSVDDIKLYRPPEESSVLAKWAHNLEVDAAKLPSMRICNLHFESHCIGKRMRPWAIPTLNLSNNIENMYENPEHHMIYKRRTQIKTERGSASGAGASMSKPTWVPRCCLPHCRKVRALHNVQLYRFPKLNRSTLAKWAHNLQVPLVGSAQRRLCSAHFEPHVLSKKCPVPLAVPTLDLNAPPGYKIYQNPAKLKANKLCLQRVCIVESCRRQRGQGVQLFRLPHSPTQLRKWMYNIRMRPRGAMRQQYRICSTHFETHSFNGKRLSAGAIPTLELGHDDEDIYPNEAQSFVEEHCAIDGCDASKEQPDVRLFRFPTEDEDLLWKWCNNLKMNPVDCIGVRICNKHFEADCIGPKHLYKWAIPTQELGHDDSQIELITNPKPEDRYVDPVFKCCVPTCGKTRKFDEVQMNSFPKDPTLFQRWRHNLRLEHLNFKERERYKICNAHFEDICIGKTRLNIGSIPTLELGHDETEDLFQVNPAELQSNLFGRQRRVQESMGIRIKQEEHSEQEEEDNKTMSEATDLNTKQVKIKKKLSDLKCCVPSCGRSRLEHGARLFPFPTGKQQQSKWRLNLRLEASDVDKSSQVCSAHFNRRCIDGKQLRGWAIPTQQLGHQEQPIYENPKNIPGFFTPTCALAHCRKRRSIDNDLRTYRYPRSEELLEKWRVNLRLAPDQCRGRICADHFEPMVRGKLKLKTGAVPTLKLGHDEGVVFDNEAIKTGLQLDGAEPEPEEGEASRESLIKIKKEKVEPDEELEQTQLDNGXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXQLLLPETQQVKLEHPYPPMPLRREKAVNNVTPICCLKHCRKERTATHQLSTFGFPKDRLQLRKWSTNLQIPESDCVGRVCVEHFESEVLGTRKLKQHAVPTLNLGHNAPLIYKCNGQTQPMGIFDEQPQHSVFRLWSLKHCRKRKLEVMEPPDHHHHHPHHPRAVIKQEEETDVHSCCLPHCEKRSDLHDVQLHRLPSNRFRLRKWLHNLNLPQSIPIGSHTRVCSEHFELQPGELIDDCIPTLNLGHSDTNIYRNQSAPTSSCLVPSCPCARLNLYRGYDLPEHHLVQQAWLEFLRQPIPQSPGDGQLCVMHYMQLYEQVSLPQEVPAAVLRQLQDTYEQISNSTMAMKLRCAVPGCYSKYTDNIRLTKLPTCADMFAKWLHNTKIKYDPNRHYIYRICMLHFEARCLGPVRPKLWAVPTLLLNHNDADIYRNPKLEVSAGGSTAQSQDLANQVERQPVPVPVELPLRIKTELAFTGSPCASASPSPRGKLRICCIPSCAQQANSLIRLFRFPTTETMLLKWLVNTQQKPRLADPQHLFVCQDHFESDAICKKQLSSWAVPTLKLGHDGHIIPNAKHNGNIADTHENRHTLQFIWANYCSVLDCFEPRSEQLRLFPYPKDRPTIRKWAANCKHRSMQASSDGFQVCQSHFAPHCFDAETGELREDAVPTLELSRDNNKMGCIVSGCFKEENTPRRRFFKMPKRMSQIMDWSHNFQLDPSVMTNDRSVVCDRHFEPHCLNVHKQLRRAARPTLHLGHTADIEILQNPANWTPLGSNEVPESSPDVCCVPNCGRYKDAEDAEDDIHLFNFPKVRTVAEKWLRNIRLEANRMQMSELKICNVHFEIYCLENGRLQYGAMPTLQLGHDDHHEVYRSTCLSSSKIKRYCNRNGCSYDCCFPQCVELQKSYLRISYDLPQSEAMRNAWLAYMELEETQEQELKLCPLHLIILFEHSIDNIPEHITEELLEDNYAAARNSVRIRIISCAVRGCKTLKTRDGGILHGLPQRRDILQMWLHNMQLVFYEQQRYMYKICSKHFESNCFTDTTRRLKPWSMPTLELPEPEPGEPDVYQNPTEAEWLQLNEQWAAEQLQSDQPMMEDEEVQVKLEPELEMEHENLLEYDEDYSQPALEDASSQQPLEMQPLEVLLEVGHVEKCRTYEQMDTEANFSYAEQQAAAGPPPSNGILPSNEEKYSAGKCSVRGCGVTFKDLSGKVKLHKFPTSWDAMQKWMHNTQVKVWRRVVWRFRICSYHFEDDCFQNSRLRRGAMPTLHLGPRRPSHIYQSEFNVSSELPVADEELPSMDEPAQIKPKVGGDNITLCLPNPAPPRKSSKLCQVDGCPNHLTSEGVTLHKFPHSPDMCSKWQHNTQVPFDPVYRWRYRICSAHFEPICLLNMRLLHGSVPTLKLGARAPAEIFDSDFEAISMRLDKQKSSTEQKLFIKQEQGEHLYQEDDADQDDEMSFLVPEMQLHEDGEHEANIKTEESLENLESYNSRWKQQLRLPSIKQEETMTCYNPVKSGYDKCSLVHCQRQRSMHGVHIYKFPRSHQLQQHWMHNLRIRYDERRPWKTMICSVHFEPQCIRLRKLRPWAVPTLELGDNVPQEIYTNEQSRQQFEKEEMNVDFDVDLKQPMLEEFXXXXXXXXXXXXXXXXXXXXXXXXXXXXXRQALMPPLWKKKKQKLQLVKIKTCSLPYCRSPRGDGIKLFRLPNRVSDIQKWEMATGMRFTESQRNTKLICSRHFDPQLIGVRRLMYNAVPTLNLGPKNSPRREEKVPTRPPAGPRCAMHNCPQDMEQKLHKLPSDPRQLQDWCAALKVSVTQENNNLYICDDHLPSLAGSCLICSVEELQLPLLNFPENRNQRAKWCHNLKIDPIPKWDNSKRICSRHFESYCFIQPGQLVAEAAPTLHLRHTDSNIFLNDYAMDSSKMLRIKDEPLESDDLML

Similar Transcription Factors

Sequence clustering based on sequence similarity using MMseqs2

100% Identity: iTF_01558329;
90% Identity: -
80% Identity: -