Basic Information

Insect: Zaprionus ghesquierei
Gene Symbol: -
Assembly: GCA_018904095.1
Location: JAEIGP010000011.1:160005-173417[-]

Transcription Factor Domain

TF Family: THAP
Domain: THAP domain
PFAM: PF05485
TF Group: Zinc-Coordinating Group
Description: The THAP domain is a putative DNA-binding domain (DBD) and probably also binds a zinc ion. It features the conserved C2CH architecture (consensus sequence: Cys - 2-4 residues - Cys - 35-50 residues - Cys - 2 residues - His). Other universal features include the location of the domain at the N-termini of proteins, its size of about 90 residues, a C-terminal AVPTIF box and several other conserved residues. Orthologues of the human THAP domain have been identified in other vertebrates and probably worms and flies, but not in other eukaryotes or any prokaryotes [1].
Hmmscan Out: # of c-Evalue i-Evalue score bias hmm coord from hmm coord to ali coord from ali coord to env coord from env coord to acc

1 28 2.1e-15 3e-12 47.0 4.0 1 86 356 428 356 429 0.85

2 28 3.3e-15 4.7e-12 46.3 4.6 1 87 456 525 456 525 0.83

3 28 7.9e-16 1.2e-12 48.3 0.4 1 87 547 619 547 619 0.85

4 28 5.2e-16 7.6e-13 48.9 5.3 1 87 719 789 719 789 0.83

5 28 1.4e-14 2e-11 44.3 4.0 1 86 813 884 813 885 0.82

6 28 1.3e-12 1.9e-09 38.0 1.0 1 87 920 988 920 988 0.81

7 28 1.1e-10 1.6e-07 31.8 1.4 1 86 1035 1104 1035 1105 0.76

8 28 7.5e-16 1.1e-12 48.4 0.1 1 86 1132 1201 1132 1202 0.82

9 28 1.1e-11 1.6e-08 35.0 1.3 1 85 1223 1291 1223 1293 0.78

10 28 7.6e-15 1.1e-11 45.1 1.6 1 86 1320 1391 1320 1392 0.85

11 28 6.9e-14 1e-10 42.1 2.4 1 85 1469 1537 1469 1539 0.81

12 28 2.1e-12 3.1e-09 37.3 0.1 1 86 1562 1630 1562 1631 0.81

13 28 1.9e-13 2.8e-10 40.7 1.6 1 87 1773 1842 1773 1842 0.81

14 28 7.1e-12 1e-08 35.6 0.3 1 61 1912 1967 1912 1993 0.79

15 28 0.16 2.3e+02 2.5 0.0 1 58 1999 2049 1999 2069 0.72

16 28 7.9e-12 1.2e-08 35.5 0.2 1 86 2088 2157 2088 2158 0.85

17 28 1.8e-14 2.6e-11 44.0 1.0 1 86 2230 2299 2230 2300 0.82

18 28 4.7e-13 6.8e-10 39.4 1.0 1 86 2335 2406 2335 2407 0.81

19 28 1e-11 1.5e-08 35.1 3.1 1 87 2417 2489 2417 2489 0.82

20 28 3.3e-14 4.8e-11 43.1 0.1 1 86 2519 2593 2519 2594 0.80

21 28 1.3e-05 0.019 15.5 0.2 1 58 2631 2685 2631 2701 0.83

22 28 4.5e-15 6.6e-12 45.9 0.1 1 86 2723 2795 2723 2796 0.82

23 28 4.4e-15 6.5e-12 45.9 4.2 1 86 2937 3009 2937 3010 0.84

24 28 6.2e-14 9e-11 42.2 1.9 1 87 3071 3142 3071 3142 0.82

25 28 5.6e-14 8.1e-11 42.4 3.0 1 86 3257 3327 3257 3328 0.85

26 28 9.8e-13 1.4e-09 38.4 0.0 1 87 3412 3482 3412 3482 0.84

27 28 1.2e-08 1.8e-05 25.3 0.6 1 58 3504 3552 3504 3559 0.82

28 28 1.2e-10 1.7e-07 31.7 1.8 6 87 3562 3627 3554 3627 0.73

#	of	c-Evalue	i-Evalue	score	bias	hmm coord from	hmm coord to	ali coord from	ali coord to	env coord from	env coord to	acc
1	28	2.1e-15	3e-12	47.0	4.0	1	86	356	428	356	429	0.85
2	28	3.3e-15	4.7e-12	46.3	4.6	1	87	456	525	456	525	0.83
3	28	7.9e-16	1.2e-12	48.3	0.4	1	87	547	619	547	619	0.85
4	28	5.2e-16	7.6e-13	48.9	5.3	1	87	719	789	719	789	0.83
5	28	1.4e-14	2e-11	44.3	4.0	1	86	813	884	813	885	0.82
6	28	1.3e-12	1.9e-09	38.0	1.0	1	87	920	988	920	988	0.81
7	28	1.1e-10	1.6e-07	31.8	1.4	1	86	1035	1104	1035	1105	0.76
8	28	7.5e-16	1.1e-12	48.4	0.1	1	86	1132	1201	1132	1202	0.82
9	28	1.1e-11	1.6e-08	35.0	1.3	1	85	1223	1291	1223	1293	0.78
10	28	7.6e-15	1.1e-11	45.1	1.6	1	86	1320	1391	1320	1392	0.85
11	28	6.9e-14	1e-10	42.1	2.4	1	85	1469	1537	1469	1539	0.81
12	28	2.1e-12	3.1e-09	37.3	0.1	1	86	1562	1630	1562	1631	0.81
13	28	1.9e-13	2.8e-10	40.7	1.6	1	87	1773	1842	1773	1842	0.81
14	28	7.1e-12	1e-08	35.6	0.3	1	61	1912	1967	1912	1993	0.79
15	28	0.16	2.3e+02	2.5	0.0	1	58	1999	2049	1999	2069	0.72
16	28	7.9e-12	1.2e-08	35.5	0.2	1	86	2088	2157	2088	2158	0.85
17	28	1.8e-14	2.6e-11	44.0	1.0	1	86	2230	2299	2230	2300	0.82
18	28	4.7e-13	6.8e-10	39.4	1.0	1	86	2335	2406	2335	2407	0.81
19	28	1e-11	1.5e-08	35.1	3.1	1	87	2417	2489	2417	2489	0.82
20	28	3.3e-14	4.8e-11	43.1	0.1	1	86	2519	2593	2519	2594	0.80
21	28	1.3e-05	0.019	15.5	0.2	1	58	2631	2685	2631	2701	0.83
22	28	4.5e-15	6.6e-12	45.9	0.1	1	86	2723	2795	2723	2796	0.82
23	28	4.4e-15	6.5e-12	45.9	4.2	1	86	2937	3009	2937	3010	0.84
24	28	6.2e-14	9e-11	42.2	1.9	1	87	3071	3142	3071	3142	0.82
25	28	5.6e-14	8.1e-11	42.4	3.0	1	86	3257	3327	3257	3328	0.85
26	28	9.8e-13	1.4e-09	38.4	0.0	1	87	3412	3482	3412	3482	0.84
27	28	1.2e-08	1.8e-05	25.3	0.6	1	58	3504	3552	3504	3559	0.82
28	28	1.2e-10	1.7e-07	31.7	1.8	6	87	3562	3627	3554	3627	0.73

Sequence Information

Coding Sequence: ATGATAATAAAATCCGAACCCATTGACGAACATGCGTACAAGTCCAACTATATTGATGATAATACGCCTTTTGCCGATTTTAGTAAATTTCCCGAATTCGGGGACGATATGTTGAGCCCCAAGGTAGAGCTAGCTGCCAAGGATGAGGCGTATCAAAAGAACCTGCTGAGTTATCCGCGGCGCAAGCTGCAATCGGAACGTGCGTCGGAGAGCTTGCCTATTTGCCAGCGTTGCAAGGAGGTGTTCTTCAAAAAGCAAATCTACTTGCGACATGTGGCACAGAGCAGCTGTAGCATACAGGAGTATGACTTCAAGTGCAACATATGCCCCATGTCCTTTATGAGCACCGAAGAGCTGCAAAAGCACAAGCAACTGCACAGGGCAGAAAAGTTCTTTTGCCACAAATACTGTGGCAAGTACTTTGACACCATTGCTGAATGCGAATCACATGAGTATATGGAACACGAATATGAGAGCTTTATTTGCAACATGTGCTCCGTAACGTTTGCCACTCGGGAACAGCTCTACGCGCATTTGCCGCAACATAAATTCCAGCAACGTTTCGATTGTCCCATTTGCCGCCTATGGTATCAAACGGCATTAGAGCTGCACGAGCATCGTCTAGCGGCACCCTATTTCTGTGGCAAGTATTACGCAGGCGCACNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNCATGGGCACAATGGAAATGCCGACGCCACATCATAACGCAGCAGGCAGCGCGTTGCCGGCTACGGCAGCGTTGAGCTCGTTGCTGCAACAACGTCAGGCAAACGCTGATGGCGCCGCATTGTTTGCATCGTCTCTCAAAAACGAGGTAAATGTTAAGCTGGAGCGGAATTATAGCAATTCCACAACAAGTGAATCTGGCTACACTCTGCATGACAGCAGCAACTACAACAATGCCTATGGAAGCGATACGTCGCTACACGGTGGGGCAGGTGGAGCTATTGGTGGTCCACAGGCGCATTCCTCAACGCTGGACGATTCAGAGGATGCACTGTGCTGTGTTCCACTATGTGGTGTGCGAAAGAGCACCAGCCCCACGTTGCAGTTCTTTACGTTTCCCAAAGATGAGAAGTATTTGCACCAATGGCTACATAATCTTAAGATGTTTCATGTTCCGGCCTCGAGCTATGCCACTTATCGCATCTGCAGCATGCATTTTCCGAAGCGCTGCATCAATCGTTATTCCTTGTGCTATTGGGCTGTGCCCACATTCAATCTGGGACACGATGATGTTGCCAATCTATATCAGAATCGCGAGTTAACAAACACCTTTACCACCGGCGAGGTGGCACGCTGCAGTATGCCCAATTGCACCAGTCAGCGAGGGGAAAGTAATCTTAAGTTTTACAACTTCCCCAAGGATATAAAGAGCCTGATCAAATGGTGCCAGAACGCACGTCTGCCCGTCCAGGCCAAGGAGCCGCGCCACTTTTGCAGTCGACACTTTGAGGAGCGTTGCATTGGCAAGTTTCGCCTGAAGCCATGGGCGGTGCCGACGCTGCATTTAGGCGCCCAATACGGCAAGATTCATGACAATCCCAAGAACTTGTACGTGGAAGAGAAGCGCTGTTGCCTTAATTTTTGCCGTCGCAGTCGCTCCTCGGACTTTAACATGTCACTCTATCGCTTCCCCAGAGATGAGGTGCTTTTGCGACGTTGGTGCTACAATTTACGCCTTGATCCTGCTGTCTACCGTGGCAAGAATCACAAGATATGCAGTGCACACTTTATTAAAGAAGCGCTAGGATTGCGAAAACTATCGCCGGGTGCTGTTCCTACGTTGCATTTGGGACACAACGATACTTTCAACATCTACGAGAATGAATTGTGGCCCCCGCCGACTTCCTCGACNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNCAGTTCGGCGTCGCATTATGTCGATCCAGAACTGAGTGCAGCGTATATGGGCATGGGAAGTTCGGGTGGATCGGCATCGGGTATGAATGTAAGCGATAGCATGGACGTTTGCTGTGTGCCAAGTTGCGAGAGCAAGCGACACAACAACGAGAACATCACGTTCCATACGATACCACGGCGACCGGAACAAATGCGAAAATGGTGTCACAATCTCAAGATACCTGAGGATAAGATGCACAAGGGCATGCGCATTTGCAGTCTGCACTTTGAGCCCTACTGCATAGGCGGATGCATGCGTCCGTTTGCGGTGCCTACACTGAATTTAGGCCACGACGAAGATGATATTCATCGCAATCCGGATGTGATTAAGAAGCTTAATATACGTGAAACTTGCTGTGTGGCTGTGTGCAAGCGCAATCGGGATCGCGATCATGCGAATTTGCATCGCTTCCCCAGCAATGTGTCGCTGCTGACCAAGTGGTGCGCCAATCTGCAACGGCCTGTGCCCGATGGCACCAAACTCTTCAATGATGCCATTTGTGAGGTACATTTTGAGAATCGTTGCCTGCGCAATAAGCGATTGGAGAAGTGGGCAGTGCCTACGCTAGTGTTGGGCCATGACAATATTGCATATCCATTGCCAACGGCAGAGCAAGTGGCCGAGTTCTATGCCCGTCCCAGTGCACCAAATAATGGCGAGGAGCAGGGCGAATGCTGTGTGGAGACCTGCAAACGTAATCCCAGCGTTGATGATATCAAACTCTATCGTCCGCCCGAGGAATCATCGGTGCTAGCGAAATGGGCGCATAATCTTGAAGTGGATGCCGCTAAGTTATCCAGCATGCGTATATGTAATCTGCACTTTGAATCCCATTGCATTGGCAAACGTATGCGACCCTGGGCCATTCCCACACTTAATCTCTCCAACAATATTGAGAACATGTACGAGAATCCTGAGCATCATATGATCTACAAGCGTCGCACACAAATCAAAACCGAGAGAGGATCTGCCGCTGGTGCGGGTGGAAGCATGTCGAAACCCACTTGGGTGCCACGCTGCTGTTTGCCACATTGCCGCAAGGTACGCGCCCTCCACAATGTGCAGCTGTATCGCTTCCCGAAACTCAATCGCTCTACGCTGGCAAAGTGGGCGCATAATCTGCAAGTGCCACTGGTGGGCAGTGCCCAAAGGCGACTCTGCTCTGCCCACTTTGAACCGCATGTGCTGAGCAAAAAGTGTCCGGTTCCGCTGGCGGTACCCACACTGGATCTCAATGCGCCACCCGGTTATAAAATCTATCAGAATCCCGCCAAGCTTAAGGCGAATAAATTGTGTCTGCAACGCGTTTGCATTGTGGAGAGTTGCCGGCGTCAGCGTGGTCAGGGCGTGCAGCTGTTCCGTCTGCCGCACAGTCCGACGCAGCTGCGCAAGTGGATGTACAACATACGAATGCGACCTAGGGGCGCCATGCGGCAACAGTATCGCATCTGTTCCACACACTTTGAGACGCACTCGTTCAATGGAAAGCGACTGAGTGCTGGGGCGATTCCAACGCTTGAGCTGGGCCATGTCGATGAGGATATCTATCCGAATGAGGCGCAATCGTTTGTGGAGGAACACTGTGCCATCGAGGGTTGTAATGCATCCAAAGAGCAGCCTGATGTGCGTCTTTTCCGGTTTCCCACCGACGATGAAGATCTGTTGTGGAAATGGTGCAACAATCTAAAAATGAATCCTGTCGATTGTATTGGTGTACGCATATGCAACAAACATTTTGAGGTAGACTGCATTGGGCCAAAGCACCTATACAAATGGGCGCTGCCCACGCAGGAGTTGGGCCACGATGATTCTCAAATCGAGTTGATAAACAATCCTAAGCCCGAGGATCGCTATGTCGATCCAGTGTTCAAGTGTTGTGTGCCCACCTGTGGCAAGACGCGTAAATTCGATGAAGTGCAAATGAATAGCTTTCCCAAAGATCCCACACTCTTCGAGCGCTGGCGGCACAATCTACGTCTCGAGCATCTTAACTTCAAGGAGCGTGAGCGCTATAAGATCTGCAATGCACACTTTGAGGATATTTGCATTGGCAAGACACGTCTTAATATCGGCTCCATACCCACCCTGGAGTTGGGATACGACGATACGGAAGATCTCTTCCAAGTGAATCCCGCAGAGTTGCAAAGCAATTTGTTTGGTCGCCAACGACGCGTACAGGATTCCATCGGCATTAGAATTAAGCAAGAGGAGCACTCCGAGCAGGAGGAGGACAACATTAAGACGGAGAGCACCATGTCAGAGGCCACGGATTTCAATACCAAGCAGGTTAAAATAAAGAAGAGGCTTGCTGACTTGAAGTGCTGCGTGCCCAGCTGCGGTCGTAGTCGTCTGGAACACGGTGCACGTCTGTTCCCCTTCCCAAGTGGCAAACAACAGCAAAGCAAGTGGCGTCACAATTTGCGTCTAGATGCCAATGACGTAGACAAATCTTCGCAAGTGTGCAGCGCACACTTTAATCGACGTTGCATCGATGGAAAGCAATTGCGTAGCTGGGCGATACCCACACAGCAGCTCGGCCATCAGGAGCAGCCAATCTATGAGAATCCAAAGAATATACCAGGCTTCTTTACACCCACATGTGCGCTGGCGCACTGCCGCCAGCGGCGGAGTATTGACAATGATTTACGCACCTATCGTTATCCGCGAAGCGAGGAGCTTTTGGAGAAATGGCGGGTAAATTTACGCTTGGCACCGGATCAGTGTCGCGGACGCATCTGTGCGGATCACTTTGAGCCGATGGTACGGGGCAAACTGAAGCTAAAGACTGGTGCGGTTCCAACGCTTAAATTGGGACATGACGAAGGCGTCGTGTTTGACAATGAGGCCATTAAGGCGGGACTGCAGCTAGACGGAACAGAGCCAGAGCCGGCAGAGGGTGAGGGTGAGGTCAGCAGTGAACCACTGATTAAGATTAAAAAGGAGAAACTAGAACCAGACGAGGAAGAGACGGAGCAGTCGCTGCTCGGCANNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNGCTGCTGCTGCCGGATACGCCGCAGGTGAAGCTAGAGCATCCGCTCCCACCGCTACGTCGCGAAAAGACCGTAAACAATGTAACGCCAATCTGCTGTCTGAAGCATTGCCGCAAGGAACGCACGGCTACACATCAGCTGAGCACCTTTGGCTTTCCCAAAGATCGCCTGCAGCTGCGTAAGTGGAGCACTAATTTGCAAATCCCCGAGGCCGATTGCGTGGGACGCGTTTGCATTGAGCATTTTGAGGCGGAGGTTCTGGGAACGCGTAAGCTAAAACAGCATGCGGTGCCCACGTTAAATCTTGGTCACGACACACCCCTTATCTACAAATGTAACGGCCAGACTCAGCCTTTGGGCAACTTTGACGAGCAGCCGCAGCATTCGGTTTTTCGGCTTTGGAGCCTGAAACACTGTCGCAAAAGGAAGCCGGAAGTAATGGAACCACCCGATCATCATCAGCGAGCAGTGATTAAGCAGGAGAAGGAGGAGTCAAAGAATGTGCCCAACTGTTGTCTGCCCCACTGTGGCAAGCAGGCAGATCTACATGGCGTGCAGCTGCATCGTCTGCCCAGCAATCGCATCACACTGCGGAAATGGTTGTACAATCTAAAACTTCCCCAAAACATTACAATTGGCAGTCAGACTCGGGTCTGTAGCGAACACTTTGAGCTTCAACCGGGTGATCTACTAGAGCATTGTTTTCCCACCTTAAAACTGGGTCACAACGATACCAATATTTATCGCAATCAGACTTCATTCACCTCATCCTGCTTGATACCAAGCTGCCCGTGTGCTCGGCTCAACCTTTATCGTGGCTATGACTTGCCCGAATATCATCTGGTGCAGCAAGCTTGGCTAAAATTCCTGCAACAACCCATGCCCCAATTGCCCGGTGATGGTAAGCTCTGTGTAATGCACTACATGCAGCTGTACGAGCAGGTCTCGTTGCCGCAGGAGGTGCCAGCCGCAGTGTTGCGTCAACTGCAGGAAACCTACGAACAGATCGCCAACTCCACCATGGCCATGAAGCTGCGTTGCGCTGTGCCCGGCTGCTATTCAAAGTACACAGATAATATAAGGTTAACCAAGCTGCCCACCTGCGCGGATATGCTCTCCGAATGGTTGCACAATACAAAGATTAAATACGATCCCAACAGGCATTATATATATCGCATTTGTATGCTGCACTTTGAACCACGTTGCCTTGGTCCAGTGCGTCCTAAATTGTGGGCAGTGCCGACGCTACAACTGAATCACAACGATGTGGATATCTATACCAATCCCAAGGCGGAAGTCGGCGACGTAAGCGTTGCCCCAGCCCTGTTGCAAGAGCCACAAAAAGTTGTGCCACAACCTTTGTCTGCGCCTGTGCCCATAGAATTGCCATTGCGTATTAAGACTGAGTTGGTTTACCCCGGCAGTCCCAGCGCCAGTCCTAGTCCACGTGGCAAATTGCGCATTTGCTGCATTTCCAGCTGTGGTCAGCAGGCCAACTCGTTAATACGTCTCTTTCGCTTTCCCACCGCTGAAACGTTGCTGCTTAAGTGGTTGGTAAATACGCAGCAAAGGCCACGTCTGGCGGATCCCCAGCGTCTGTTTGTTTGTCAGGATCATTTTGAAACCGAAGCTATTTGCAAGAACCAGCTAAGCAGTTGGGCTGTGCCCACCTTGAAGCTTGGACATGATGGCCATGTCATACCGAATGCCAAGCACAATGGGAATATTGCGGATACACATGAAAACAAGCGCACGATGCAATTCATTTGGGCCAACTACTGCTCCGTGCTGGACTGCTTCGAACCGCGAAGTGAGCAGCTGCGTCTCTTTGCCTATCCCAAAGATCGCCCCACCATACGCCAGTGGGCAGCAAATTGTAAGCATCGTTCCATGCAGGCCAGCAGCGATGGCTTTCAGATTTGTCAATCACATTTTGAACCCCATTGTTTTGATCCGGAAACGGGAGAGTTGCGAAAGAATGCCGTTCCCACGCTGGGGTTAAGTCGTGGCATCAACAAGACAGGCTGCATTGTCCGCGGTTGTTTCAAGTTAGAGAATACGCCACGTCGTCGTTTTTTCAAAATGCCCAAACGTTGGTCGCAGCGTATGGATTGGTGTCACAATCTCCAACTGGATCAGGCTATCGTGGGCAACGAAATAAGTGTTATATGCGATCGTCACTTTGAGACGCATTGTTTGAATGTGCACAAACAGCTGCGTCGTGGAGCACGTCCCACACTCCACTTGGGTCACACTGCAGATATCGAGATACTACAGAATCTAGCAAGTTGGACACGATGCACTGAGGTGCCTGATACCCCGGCTGACGAATGCTGTGTGCCCAACTGCGGACGTTTCAAGGATGCCGAAGAGGAGGATGATACGCCGCTGCTCTTTAGCTTTCCCAAGGTGCGAACACTGGCGGAGAAATGGTTAAGAAACATTCGCCTCGAGGCAAACAAGGAGCAGTTGGCCGAATTGAAAGTCTGCAATGCGCACTTTGAGATTTACTGTGTGCAAAATGGTCGTCTTCAGCTGGGTGCCATGCCCACTCTGCAATTGGGACACAATGATCTTTGGGATGTACACCGACCCACTTGTCTGGCGGGCTCGTTGTCGTCCTGCAAGATGAAACGTTACTGCAATAGAAACGGACTCAGCTATGACTGTTGTTTTCCTCAGTGCATGGAGCTGCAGAAGAGTTATCTGAGAATAAGCTTTGATTTGCCACAAACGGAGACAATGCGTAACGCTTGGTTGGCATATATGAACTTGGACGAATCACAGGAGCAAAAGGAGACGCAAGAGCTGAAGCTTTGCCCGCTGCACTTGATCATACTATATGAGCACAGCGCCGACAATTTTCCAGAGCACACACCGGAGGAGCTACTGGAGGACAACTATGCAGCTGCACGGAATAGTGTTAGGATTCGTATTATCAGCTGCGCAGTGCGTGGCTGCAAGACGCTCAAGACACGCGATGGCGGCATACTTCATGGTCTGCCCCAACGACGGGATATACTGCAAATGTGGCTGCACAACATGCAGCTGGTTTTTTACGAGCAGCAGCGTTACATGTACAAGATCTGTAGCAAACACTTTGAGCCCAATTGCTTTACGGACACAATTCGCCGCCTCAAGCCATGGAGTATGCCAACACTGGAGATGCCGGAACCAGAGCTGGGTGAAGATATCTATCCCAATCCCACAGAAGCCGAATGGTTGCAAATGAATGAGCAATGGGCAGCGGAACATTTGCAACAAGATCAGCCAATAATGGAGGATGAGGTACCGCAAGTGAAGCTAGAGGTGAACCCAGAACTGAAAGCGGACCATGAAAATCTATTGGCATACGATGAAGAATACTTACAGCCAGCACTGGAGGATGCCAACTCACAGCAGCCACTAGAAATGCAACCACTCGAGGTGCTGCTCGAGGTGGGTCGTGTCGAAAAATGCAAAACCTACGAGCCAATAAACACAAAGGCAAATTACAGTTATGCAGAGCAACAGTCAGCGGCTAGACTGACACCTAGCAATGAAATCTATTCCAGCGATAAAAAGAAAAAATATAGTGCGGGAAAATGCAGTGTACCTGGCTGTAGTATCACCTCGAGGAATGTTTGTCGCAATTTAAAATTGCACAAGTTCCCTACTTCGTTGGATGCGATGCAAAAGTGGATGCACAATACCCAGGTGACTGTGTGCAAGAAGGTCTCATGGCGTTTTCGCATCTGCAGTTATCATTTTAAGGACGATTGCTTTCAAGCCTATCGCCTGAGGCGTGGTGCCATGCCCACATTAAAACTGGGACCAAAACCGCCGTCGCATGTCTATGAGAGTGAATTTAATGGGAACTCGGAACTTTCTGGCGGCGAAGAGGATCAGCCTATTGAGGAGCCAGTAAATGCACAGCCTCAAGTGGGGGGCGATAATATTAGTCTCTGCTTACCTAGTCCAGCACGGCCCCGCAAGTCAAGTAAATTCTGCCAAGTCGATGGATGTCCCAATCATTTGACCAGTGAGAATCTGACGCTGCACAAGTTTCCCCATTCGCCGGACATGTGTGCCAAATGGCAGCATAATACACAGGTGCCATTCGATCCGATTTTCCGTTGGCGCTATCGTATATGCAGCGCCCACTTTGACCCCATCTGTTTGTTAAATATGCGCCTACTGCACGGCAGCGTGCCTACACTCAATTTGGGCCCACATGCTCCACCCCAGATCTTCGACAGCGACTTTGAAGCCATAAACATGCGTTTGGACAAACAAAAGAGCAGCTCCGAGCAGCAGCTGTTTATTAAACAGGAGCAGGGCGAACAGTTCTATGAAAAGGATGATGAAGAACAGGATGATGAGCTAAGTTATCTGGTGCCAGAGATGCAGCTGCATGAGGATGCCGAACATGAGGCTAACATAAAGACAGAGAAGCTGCCGGAGAGTCGAATTTATACCAGCCGTTGGAAGGATTTGCGTTTGCCCAGCATAAAGCAGGAACAGACAATGACGTGCTATAATCCTGTCAAGTCTGGCTATGACAAGTGCTCGCTGGTGCATTGCCAGCGTCAGCGAACGCTGCATGGTGTTCATATCTATAAATTTCCCCGCTCCCGTCAGCTGCAGCAGCACTGGATGCGCAATCTACGGATTCGGTATGACGAGCGACGACCCTGGAAAACAATGATATGCAGTGTGCACTTCGAGCCGCAATGTATTCGTCTGCGTAAGCTGCGTCCTTGGGCGGTACCTACGCTGGAGCTAGGCAAAAATGTGCCACAAGAGATCTACACAAATGAGCAGAGCCGGCAGCAGTTTGAGAACGACGAACTGGATCTGGATTTTGACTTGAATCTTAAGGAGCCAATGCTAAAAGAGCTCTACGGCGTTGAGGAGGATAATGATGACGACGATAATGATTTTGCGGAAGATGGAAATGGTAGAAGTCAAGCGTTGTTGCCCTTCTGGAAAAAGAAAAAGCAAATTCATCAGATGATCAAAATTAAGACTTGCTCCTTACCCTATTGTCGTAGTCCACGTGGAGATGGCATCAAGTTATTCCGACTGCCGAGTAGACTGAGCGATATACAGAAATGGGAGGTGGCAACGGGTATGCAGTTTACTGAATCCCAACGCAACACAAAACTCATCTGCAGTCGTCACTTTGAGCCGCAGTTAATTGGCGTGCGTCGTCTTATGTACAATGCGGTACCCACTCTTAACCTGGGCCCAGAGACCCAGGCGCAAGAAGAGAAAGTTCCAGTTCGTCCTCCAGCTGGGCCACGTTGTTTTATGCCCAATTGTCCACAGGATTTGCAGCAAAAGCTGCATAAATTTCCCAATGATCACCAGCAGCTTCAAGAATGGTGTGCGGCGCTCGAAGTCTCGGTTACGCAGGACTACAGTAACGTGTACATTTGTGACGATCATTTGCCAATGATGGCCAGAAGCTGCCTCATCTGCAGTGCGAAGGAAGTGCAGCTGCCTCTGCTTAACTTTCCCGAGAATCGCAATCAGCGCGCAAAATGGTGTCATAATCTCAAAATCGATCCCCTTCCGAAGTGGGATAACTCAAAACGCATTTGCAGTCGCCACTTTGAGAGCTACTGCTTTGTCCAACCCGGTCACCTGGTTGCCGAAGCAGCACCTACATTGCATTTAAAGCACACGGACAGCAATATATTCCTTAACGATTATGCCATAGATCCCAGCAAGATGTTGCGAATGAAGAACGAGCCCTTGGAGAACGACGATCTTAAGCTGTAA
Protein Sequence: MIIKSEPIDEHAYKSNYIDDNTPFADFSKFPEFGDDMLSPKVELAAKDEAYQKNLLSYPRRKLQSERASESLPICQRCKEVFFKKQIYLRHVAQSSCSIQEYDFKCNICPMSFMSTEELQKHKQLHRAEKFFCHKYCGKYFDTIAECESHEYMEHEYESFICNMCSVTFATREQLYAHLPQHKFQQRFDCPICRLWYQTALELHEHRLAAPYFCGKYYAGAXXXXXXXXXXXXXXXXXXXXXXXXMGTMEMPTPHHNAAGSALPATAALSSLLQQRQANADGAALFASSLKNEVNVKLERNYSNSTTSESGYTLHDSSNYNNAYGSDTSLHGGAGGAIGGPQAHSSTLDDSEDALCCVPLCGVRKSTSPTLQFFTFPKDEKYLHQWLHNLKMFHVPASSYATYRICSMHFPKRCINRYSLCYWAVPTFNLGHDDVANLYQNRELTNTFTTGEVARCSMPNCTSQRGESNLKFYNFPKDIKSLIKWCQNARLPVQAKEPRHFCSRHFEERCIGKFRLKPWAVPTLHLGAQYGKIHDNPKNLYVEEKRCCLNFCRRSRSSDFNMSLYRFPRDEVLLRRWCYNLRLDPAVYRGKNHKICSAHFIKEALGLRKLSPGAVPTLHLGHNDTFNIYENELWPPPTSSTXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXSSASHYVDPELSAAYMGMGSSGGSASGMNVSDSMDVCCVPSCESKRHNNENITFHTIPRRPEQMRKWCHNLKIPEDKMHKGMRICSLHFEPYCIGGCMRPFAVPTLNLGHDEDDIHRNPDVIKKLNIRETCCVAVCKRNRDRDHANLHRFPSNVSLLTKWCANLQRPVPDGTKLFNDAICEVHFENRCLRNKRLEKWAVPTLVLGHDNIAYPLPTAEQVAEFYARPSAPNNGEEQGECCVETCKRNPSVDDIKLYRPPEESSVLAKWAHNLEVDAAKLSSMRICNLHFESHCIGKRMRPWAIPTLNLSNNIENMYENPEHHMIYKRRTQIKTERGSAAGAGGSMSKPTWVPRCCLPHCRKVRALHNVQLYRFPKLNRSTLAKWAHNLQVPLVGSAQRRLCSAHFEPHVLSKKCPVPLAVPTLDLNAPPGYKIYQNPAKLKANKLCLQRVCIVESCRRQRGQGVQLFRLPHSPTQLRKWMYNIRMRPRGAMRQQYRICSTHFETHSFNGKRLSAGAIPTLELGHVDEDIYPNEAQSFVEEHCAIEGCNASKEQPDVRLFRFPTDDEDLLWKWCNNLKMNPVDCIGVRICNKHFEVDCIGPKHLYKWALPTQELGHDDSQIELINNPKPEDRYVDPVFKCCVPTCGKTRKFDEVQMNSFPKDPTLFERWRHNLRLEHLNFKERERYKICNAHFEDICIGKTRLNIGSIPTLELGYDDTEDLFQVNPAELQSNLFGRQRRVQDSIGIRIKQEEHSEQEEDNIKTESTMSEATDFNTKQVKIKKRLADLKCCVPSCGRSRLEHGARLFPFPSGKQQQSKWRHNLRLDANDVDKSSQVCSAHFNRRCIDGKQLRSWAIPTQQLGHQEQPIYENPKNIPGFFTPTCALAHCRQRRSIDNDLRTYRYPRSEELLEKWRVNLRLAPDQCRGRICADHFEPMVRGKLKLKTGAVPTLKLGHDEGVVFDNEAIKAGLQLDGTEPEPAEGEGEVSSEPLIKIKKEKLEPDEEETEQSLLGXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXLLLPDTPQVKLEHPLPPLRREKTVNNVTPICCLKHCRKERTATHQLSTFGFPKDRLQLRKWSTNLQIPEADCVGRVCIEHFEAEVLGTRKLKQHAVPTLNLGHDTPLIYKCNGQTQPLGNFDEQPQHSVFRLWSLKHCRKRKPEVMEPPDHHQRAVIKQEKEESKNVPNCCLPHCGKQADLHGVQLHRLPSNRITLRKWLYNLKLPQNITIGSQTRVCSEHFELQPGDLLEHCFPTLKLGHNDTNIYRNQTSFTSSCLIPSCPCARLNLYRGYDLPEYHLVQQAWLKFLQQPMPQLPGDGKLCVMHYMQLYEQVSLPQEVPAAVLRQLQETYEQIANSTMAMKLRCAVPGCYSKYTDNIRLTKLPTCADMLSEWLHNTKIKYDPNRHYIYRICMLHFEPRCLGPVRPKLWAVPTLQLNHNDVDIYTNPKAEVGDVSVAPALLQEPQKVVPQPLSAPVPIELPLRIKTELVYPGSPSASPSPRGKLRICCISSCGQQANSLIRLFRFPTAETLLLKWLVNTQQRPRLADPQRLFVCQDHFETEAICKNQLSSWAVPTLKLGHDGHVIPNAKHNGNIADTHENKRTMQFIWANYCSVLDCFEPRSEQLRLFAYPKDRPTIRQWAANCKHRSMQASSDGFQICQSHFEPHCFDPETGELRKNAVPTLGLSRGINKTGCIVRGCFKLENTPRRRFFKMPKRWSQRMDWCHNLQLDQAIVGNEISVICDRHFETHCLNVHKQLRRGARPTLHLGHTADIEILQNLASWTRCTEVPDTPADECCVPNCGRFKDAEEEDDTPLLFSFPKVRTLAEKWLRNIRLEANKEQLAELKVCNAHFEIYCVQNGRLQLGAMPTLQLGHNDLWDVHRPTCLAGSLSSCKMKRYCNRNGLSYDCCFPQCMELQKSYLRISFDLPQTETMRNAWLAYMNLDESQEQKETQELKLCPLHLIILYEHSADNFPEHTPEELLEDNYAAARNSVRIRIISCAVRGCKTLKTRDGGILHGLPQRRDILQMWLHNMQLVFYEQQRYMYKICSKHFEPNCFTDTIRRLKPWSMPTLEMPEPELGEDIYPNPTEAEWLQMNEQWAAEHLQQDQPIMEDEVPQVKLEVNPELKADHENLLAYDEEYLQPALEDANSQQPLEMQPLEVLLEVGRVEKCKTYEPINTKANYSYAEQQSAARLTPSNEIYSSDKKKKYSAGKCSVPGCSITSRNVCRNLKLHKFPTSLDAMQKWMHNTQVTVCKKVSWRFRICSYHFKDDCFQAYRLRRGAMPTLKLGPKPPSHVYESEFNGNSELSGGEEDQPIEEPVNAQPQVGGDNISLCLPSPARPRKSSKFCQVDGCPNHLTSENLTLHKFPHSPDMCAKWQHNTQVPFDPIFRWRYRICSAHFDPICLLNMRLLHGSVPTLNLGPHAPPQIFDSDFEAINMRLDKQKSSSEQQLFIKQEQGEQFYEKDDEEQDDELSYLVPEMQLHEDAEHEANIKTEKLPESRIYTSRWKDLRLPSIKQEQTMTCYNPVKSGYDKCSLVHCQRQRTLHGVHIYKFPRSRQLQQHWMRNLRIRYDERRPWKTMICSVHFEPQCIRLRKLRPWAVPTLELGKNVPQEIYTNEQSRQQFENDELDLDFDLNLKEPMLKELYGVEEDNDDDDNDFAEDGNGRSQALLPFWKKKKQIHQMIKIKTCSLPYCRSPRGDGIKLFRLPSRLSDIQKWEVATGMQFTESQRNTKLICSRHFEPQLIGVRRLMYNAVPTLNLGPETQAQEEKVPVRPPAGPRCFMPNCPQDLQQKLHKFPNDHQQLQEWCAALEVSVTQDYSNVYICDDHLPMMARSCLICSAKEVQLPLLNFPENRNQRAKWCHNLKIDPLPKWDNSKRICSRHFESYCFVQPGHLVAEAAPTLHLKHTDSNIFLNDYAIDPSKMLRMKNEPLENDDLKL

Similar Transcription Factors

Sequence clustering based on sequence similarity using MMseqs2

100% Identity: iTF_01558329;
90% Identity: -
80% Identity: -