Basic Information

Insect: Zaprionus gabonicus
Gene Symbol: GA10450_1
Assembly: GCA_018903695.1
Location: JAEIFO010001553.1:18789435-18805425[-]

Transcription Factor Domain

TF Family: THAP
Domain: THAP domain
PFAM: PF05485
TF Group: Zinc-Coordinating Group
Description: The THAP domain is a putative DNA-binding domain (DBD) and probably also binds a zinc ion. It features the conserved C2CH architecture (consensus sequence: Cys - 2-4 residues - Cys - 35-50 residues - Cys - 2 residues - His). Other universal features include the location of the domain at the N-termini of proteins, its size of about 90 residues, a C-terminal AVPTIF box and several other conserved residues. Orthologues of the human THAP domain have been identified in other vertebrates and probably worms and flies, but not in other eukaryotes or any prokaryotes [1].
Hmmscan Out: # of c-Evalue i-Evalue score bias hmm coord from hmm coord to ali coord from ali coord to env coord from env coord to acc

1 28 1.4e-15 2.9e-12 47.0 3.8 1 86 735 807 735 808 0.85

2 28 2.6e-15 5.3e-12 46.2 4.6 1 87 835 904 835 904 0.83

3 28 6.4e-16 1.3e-12 48.1 0.4 1 87 926 998 926 998 0.85

4 28 4.2e-16 8.5e-13 48.7 5.3 1 87 1101 1171 1101 1171 0.83

5 28 6.6e-08 0.00013 22.5 3.0 1 86 1195 1266 1195 1267 0.68

6 28 1e-12 2.1e-09 37.9 1.0 1 87 1302 1370 1302 1370 0.81

7 28 9e-11 1.8e-07 31.6 1.4 1 86 1418 1487 1418 1488 0.76

8 28 2.4e-16 4.9e-13 49.5 0.1 1 86 1515 1584 1515 1585 0.82

9 28 4.2e-13 8.5e-10 39.1 0.9 1 86 1606 1675 1606 1676 0.80

10 28 2.8e-14 5.6e-11 42.9 1.0 1 86 1703 1774 1703 1775 0.84

11 28 3.1e-14 6.2e-11 42.8 1.8 1 85 1849 1917 1849 1919 0.82

12 28 1.9e-12 3.8e-09 37.0 0.1 1 86 1942 2010 1942 2011 0.81

13 28 3e-13 6.1e-10 39.6 1.4 1 87 2157 2226 2157 2226 0.80

14 28 1.7e-12 3.3e-09 37.2 0.5 1 61 2300 2353 2300 2378 0.79

15 28 0.03 60 4.4 0.0 1 58 2386 2436 2386 2458 0.75

16 28 2.3e-12 4.7e-09 36.7 0.4 1 86 2475 2544 2475 2545 0.86

17 28 2.1e-15 4.2e-12 46.5 2.3 1 86 2609 2678 2609 2679 0.83

18 28 2e-12 4e-09 37.0 1.4 1 86 2714 2785 2714 2786 0.81

19 28 1.5e-12 3e-09 37.4 1.9 1 87 2796 2868 2796 2868 0.80

20 28 4.5e-16 9e-13 48.7 0.1 1 86 2898 2972 2898 2973 0.79

21 28 5.8e-06 0.012 16.2 0.2 1 58 3009 3063 3009 3085 0.84

22 28 7.3e-15 1.5e-11 44.8 0.3 1 86 3101 3173 3101 3174 0.82

23 28 4.5e-14 9.2e-11 42.2 3.3 1 86 3321 3393 3321 3394 0.82

24 28 1.1e-13 2.2e-10 41.0 2.8 1 87 3454 3525 3454 3525 0.82

25 28 8.3e-14 1.7e-10 41.4 3.6 1 86 3638 3708 3638 3709 0.84

26 28 1.6e-12 3.2e-09 37.3 0.0 1 87 3789 3859 3789 3859 0.84

27 28 1.3e-08 2.7e-05 24.7 0.3 1 58 3881 3929 3881 3937 0.82

28 28 1.7e-10 3.4e-07 30.8 1.9 17 87 3945 4004 3932 4004 0.73

#	of	c-Evalue	i-Evalue	score	bias	hmm coord from	hmm coord to	ali coord from	ali coord to	env coord from	env coord to	acc
1	28	1.4e-15	2.9e-12	47.0	3.8	1	86	735	807	735	808	0.85
2	28	2.6e-15	5.3e-12	46.2	4.6	1	87	835	904	835	904	0.83
3	28	6.4e-16	1.3e-12	48.1	0.4	1	87	926	998	926	998	0.85
4	28	4.2e-16	8.5e-13	48.7	5.3	1	87	1101	1171	1101	1171	0.83
5	28	6.6e-08	0.00013	22.5	3.0	1	86	1195	1266	1195	1267	0.68
6	28	1e-12	2.1e-09	37.9	1.0	1	87	1302	1370	1302	1370	0.81
7	28	9e-11	1.8e-07	31.6	1.4	1	86	1418	1487	1418	1488	0.76
8	28	2.4e-16	4.9e-13	49.5	0.1	1	86	1515	1584	1515	1585	0.82
9	28	4.2e-13	8.5e-10	39.1	0.9	1	86	1606	1675	1606	1676	0.80
10	28	2.8e-14	5.6e-11	42.9	1.0	1	86	1703	1774	1703	1775	0.84
11	28	3.1e-14	6.2e-11	42.8	1.8	1	85	1849	1917	1849	1919	0.82
12	28	1.9e-12	3.8e-09	37.0	0.1	1	86	1942	2010	1942	2011	0.81
13	28	3e-13	6.1e-10	39.6	1.4	1	87	2157	2226	2157	2226	0.80
14	28	1.7e-12	3.3e-09	37.2	0.5	1	61	2300	2353	2300	2378	0.79
15	28	0.03	60	4.4	0.0	1	58	2386	2436	2386	2458	0.75
16	28	2.3e-12	4.7e-09	36.7	0.4	1	86	2475	2544	2475	2545	0.86
17	28	2.1e-15	4.2e-12	46.5	2.3	1	86	2609	2678	2609	2679	0.83
18	28	2e-12	4e-09	37.0	1.4	1	86	2714	2785	2714	2786	0.81
19	28	1.5e-12	3e-09	37.4	1.9	1	87	2796	2868	2796	2868	0.80
20	28	4.5e-16	9e-13	48.7	0.1	1	86	2898	2972	2898	2973	0.79
21	28	5.8e-06	0.012	16.2	0.2	1	58	3009	3063	3009	3085	0.84
22	28	7.3e-15	1.5e-11	44.8	0.3	1	86	3101	3173	3101	3174	0.82
23	28	4.5e-14	9.2e-11	42.2	3.3	1	86	3321	3393	3321	3394	0.82
24	28	1.1e-13	2.2e-10	41.0	2.8	1	87	3454	3525	3454	3525	0.82
25	28	8.3e-14	1.7e-10	41.4	3.6	1	86	3638	3708	3638	3709	0.84
26	28	1.6e-12	3.2e-09	37.3	0.0	1	87	3789	3859	3789	3859	0.84
27	28	1.3e-08	2.7e-05	24.7	0.3	1	58	3881	3929	3881	3937	0.82
28	28	1.7e-10	3.4e-07	30.8	1.9	17	87	3945	4004	3932	4004	0.73

Sequence Information

Coding Sequence: ATGGTGCAACTGTTTAAGTTTCTTTTAAAATCGACAAAATTGCCAGCGCGTGCTCATTTTCGTCCAACTTTTCTGGATACACTGCGTCTGACAGTGCGTGGCGGACATGGCGGAAACGGGTTGCCGAAGTACGGCGGAGTCGGCGGCCAAGGTGGCTGTGTTTACTTCGTTGCCAAGGAGGGACTCACGCTGCGCAGGGTGGCCCAGAACCTGAAAGACAAACGGGTGCAGGCCTCAAGTGGCGAGGATAGCAGCAAAGTAAGCATCTTCGGGAAACGTGGAGTGGATCAGTGCATCGAAGTGCCGGTGGGCGTGCAGGTCTATGATGAGAACAACAAGTTGCTGGCGGATTTGAATGAGAACGATGCCAAGTGCATTGTAGCAGGTGGTGGCACTGGTGGCTGCATTGGCAACAATTTCCTTGGACGTCCTGGCGACCATCGCACAGTGAATTTGGATCTAAAGCTGATTGCCGATGTGGGCATGGTGGGTTTTCCCAATGCTGGCAAGAGCACGTTGCTAAAAGCCATTTCCAATGCCAAGCCAAAGATAGCCGCATATCCTTTCACCACAATTCGACCACAGATCGGCACAATTGATTACAGCGATCTAAGATCCATCACCGTTGCCGATTTGCCTGGACTAATTGAAGGGGCTCATGCCAATTTCGGAATGGGTCACAAGTTTCTGAAGCATATTGAACGCACACGTTTGCTGCTCTTCATGGTGGACATATTTGGATTCCAGTTAAGTCCCAAGCATCCACATCGTGATTGCTTGAGCAATATCTATGCACTGAACAAGGAGCTGGAACTATACGATCCTACTCTACTGGAGAAACCCTGCGTCTTATTACTAAACAAAATGGATAAGGAAGGGGCGCAGGATCTGCTGAAAAGGCTCAAACCAAGCATTCGGGATTTAAAGAGTGGTCTGTCCGAGTGTCCCGAGGAAGTTCGTCCCAACAGAGTGCTCAAATTCGAGCATATACTGCCCATATCCGCCAAGAACTCAACACGAATAACGCAAGTAAAACAACTACTGCGCGATACACTGGACACCATAGCAGCAGAACACATGGTGGTCGACAATGAGGTCCTCAAGGAGCAACTGCGCCAACGTGTGGGTGTCAGAGCGGAACCCATTGACGAACATGCGTATAAAACCAACTATATTGATGATAATACGCCGTTCGCTGATTTTAGTAAATTTCCGGAATTTGGCGACGATATGCTGAGTCCCAAGGTAGAGCTGACCGTCAAGGATGAGGCGTATCAAAAGAACCCGCTTAGTTATCCGCGGCGCAAGCTGCAATCGGAACGATCCTCGGAGAGCTTGCCGATTTGTCAGCGCTGCAAGGAGGTGTTCTTCAAGAAGCAAATCTACTTGCAGCATGTGGCAGAGAGTAGTTGCACCATACAGGAGTATGACTTCAAGTGCAACATATGTCCCATGTCTTTTATGAACACCGAAGAACTGCAAAAGCACAAGCATCTTCACAGGGCCGATAAGTTCTTTTGCCATAAATATTGTGGCAAGTACTTTGATACCATTGCAGAGTGCGAGTCACATGAGTACATGCAGCACGAGTATGAGAGCTTTGTTTGCAACATGTGCTCGGTTACATTTGCCACACGGGAGCAGCTCTATGCGCACTTGCCACAGCATAAGTTCCACCAACGTTTCGATTGTCCCATTTGCCGGCTATGGTATCAAACAGCATTAGAGCTGCACGAGCATCGTCTGGCGGCGCCCTATTTCTGTGGCAAGTATTACGCAGGCGCACAGGCCACACAGGCGCTTCAGCAGCAGCACACACAGCAACAGCATCAGCAGAGCGCCAACTACAAGTTGCAGGATTGTCACATGGGCACCATGGAAATGCCGACCCCACATCAAAAGGCAACTGCTGGCAGCGCATTACCGGCAACGGCGGCATTGAACTCGCTGTTGCAACAACGTCAGGCAAACGCCGATGGTGCCGCATTGTTTGCATCTTCTCTGAAGAACGAAGTGAACGTCAAACTGGAGCGAAGCTACAGCAATTCTACAACAAGCGAATCTGGCTACAGTCTGCATGACAGCAGCAACTACAACAATGCATACGGAAGCGATGCCTCGTTGCATGGCGGTTCAGGAGCCGGGGCTATTGGAGGTCCACAGGCGCATTCCTCAACGCTGGACGATTCAGAGGATGCTCTTTGCTGTGTGCCCTTATGTGGTGTGCGCAAGAGCACCAGCCCCACGCTGCAGTTCTTTACGTTTCCCAAAGACGAGAAGTACTTGCATCAATGGCTGCATAACCTTAAGATGTTTCATATTCCGGCCTCGAGTTATGCCACTTATCGCATCTGCAGCATGCATTTTCCGAAGCGCTGCATCAATCGATATTCATTGTGCTATTGGGCTGTGCCCACGTTCAATTTGGGACACGATGATGTTGCCAATCTATATCAGAATCGCGAGCTAACGAACACCTTTACCACCGGCGAGGTGGCGCGTTGCAGCATGCCCAACTGTACCAGTCAACGAGGGGAAAGCAATCTCAAGTTTTACAACTTCCCGAAGGACATAAAGAGTCTTATCAAGTGGTGCCAAAACGCACGTTTGCCCGTCCAGGCCAAGGAGCCGCGTCACTTCTGCAGTCGACACTTTGAGGAGCGATGCATTGGCAAGTTCCGGTTAAAGCCATGGGCGGTGCCAACACTGCATTTGGGTGCCCAATACGGCAAGATTCATGACAATCCCAAGAACTTGTATGTGGAAGAGAAGCGCTGTTGCCTTAACTTTTGTCGACGGAGCCGCTCCTCGGACTTTAACATGTCGCTGTATCGCTTCCCCAGAGATGAAGTTCTCTTGCGACGTTGGTGCTACAATTTACGCCTTGATCCTGCCGTCTATCGTGGCAAGAATCACAAGATATGTAGTGCACACTTCATCAAAGAAGCACTGGGATTGCGAAAACTATCGCCGGGTGCCGTTCCTACGCTTCATTTGGGTCACAACGATACGTTTAACATCTATGAGAACGAACTGTGNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNGCATCGCACTATGTCGACCCAGAGTTGAGTGCATCGTATATGGGCATGGGAAGTGGATCGGGTGGATCCGCGTCGGGCCTGAATGTGAGCGACAGCATGGATGTGTGCTGTGTGCCAAGTTGTGAGAGCAAGCGACACAACAACGAGAACATCACATTCCATACGATACCGAGGCGACCCGAACAGATGCGCAAATGGTGTCACAATCTTAAGATACCCGAGGATAAGATGCATAAGGGAATGCGGATTTGTAGTCTACATTTTGAGCCCTATTGCATTGGCGGCTGTATGCGTCCGTTCGCGGTACCCACACTGAATCTCGGGCACGACGACGATGATATACATCGCAATCCTGATGTAATTAAGAAGCTGAATATACGTGAAACCTGCTGTGTGGCTGTGTGCANNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNTCTCGCTGCTGACCAAATGGTGCGCCAATCTGCAGCGACCTGTGCCCGATGGCACTAAACTCTTCAACGATGCCATCTGTGAGGTGCACTTTGAGGATCGTTGCCTGCGCAACAAGAGATTGGAGAAATGGGCAGTGCCTACGCTGGTGCTGGGACATGACAACATTGCATATCCACTGCCAACGCCGGAGCAGGTGGCCGAGTTCTATGCCCGCCCCAGTGCACCCAACAATGGTGAGGAACAGGGCGAGTGCTGTGTGGAGACCTGTAAACGTAATCCTAGTGTCGATGATATCAAACTCTATCGCCCGCCCGAGGAGTCGTCCGTGCTGGCGAAATGGGCACATAATCTCGAAGTGGATGCCGCCAAGTTGTCCAGCATGCGTATATGTAATCTACACTTTGAATCCCATTGCATTGGCAAGCGTATGCGTCCTTGGGCCATACCCACACTGAATCTGTCCAACAATGTTGAAAATATGTACGAGAATCCCGAGCATCATATGATCTACAAGCGTCGCACACAAATTAAGACCGAGAGAGGATCAGGTGCATCGGGAGCGGGAGCAAGCATGTCGAAACCCACTTGGGTGCCACGTTGCTGTTTGCCACATTGCCGCAAGGTGCGTGCTCTGCACAATGTGCAGCTCTATCGCTTCCCCAAACTGAATCGTTCCACGTTGGCAAAGTGGGCGCATAATCTGCAAGTGCCACTGGTGGGCAGTGCCCAGAGGCGACTCTGCTCTGCCCACTTTGAGCCGCATGTGTTGAGTAAAAAGTGTCCTGTACCGCTGGCGGTGCCCACACTGGACCTCAATGCGCCACCCGGCTATAAAATCTATCAGAATCCCGCCAAGCTCAAGGCCAACAAGCTGTGTCTGCAGCGAGTCTGCATTGTGGAGAGCTGCCGTCGTCAACGTGGTCAGGGCGTGCAGCTCTTCCGACTGCCGCACAGTCCCACGCAGCTGCGCAAATGGATGTACAACATACGGATGCGACCCAGAGGTGCAATGCGGCAACAGTATCGCATCTGCTCTAAACACTTTGAGACGCATTCGTTCAATGGAAAGCGACTGAGTGCGGGAGCGATACCAACACTGGAGTTGGGCCACGACGACGAGGACATCTATCCAAATGAGGCGCAATCATTTGTAGAGGAACACTGTGCCATCGAAGGATGCGAGTCATCCAAAGAGCAGCCAGATGTGCGTCTCTTCCGCTTTCCCACCAATGATGAGGATTTGCTCTGGAAATGGTGTAACAATCTGAAAATGAATCCTGTCGATTGTATCGGCGTGCGCATCTGTAACAAACACTTCGATGGAGATTGCATAGGACCGAAGCATCTTTACAAGTGGGCGATACCCACGATGGAGTTGGGCCACGATGACTCTCAGATTGAGCTTATTACGAATCCCAAGCCAGAGGAACGTTATGTTGATCCCGTGTTCAAGTGTTGTGTTCCCACCTGCGGCAAGACGCGTAAATTCGATGAAGTACAAATGAATAGCTTTCCCAAAGATCCTACACTTTTCGAGCGCTGGAAACACAATCTGCGACTGGAGCATCTCCAGTTTAAGGAGCGCGAACGTTATAAGATCTGTGATGCACACTTTGAGGACATTTGCATTGGCAAGACACGTCTTTATATTGGTTCCATACCCACATTAGAGTTGGGACACGACGATACGGAAGATCTATTCCGGGTAAATCCTGCAGAGTTGCAAAGCAACTTGTTTGGTCGTCAGCGACGTGTACAGGAATCAGGTCTGAGGGTCAGAATAAAGCAGGAGGAGCACTCCGAGCAAGAGGAGACGGATGTTACTATGTCAGAGGCTACGGATTTAAATACCAAGCAGGTAAAAATAAAGAAACGCCTTGCGGACTTGAAGTGCTGCGTGCCCAATTGTGGTCGCAGTCGACTGGAGCACGGCGCACGTTTATTTCCCTTTCCAACTGGCAAACAACAGCAGAGCAAGTGGCGCCACAACTTGCGTCTGGATGCCAGCGAAGTGGACAAGACGTCGCAAGTTTGCAGCGCACACTTCAATCGACGTTGCATCGATGGCAAGCAGCTGCGTGGCTGGGCAATCCCCACACAGCAGCTGGGACATCAAGAGCAACCGATTTATGAGAATCCAAAGAATATACCGGGCTTCTTTACGCCCACCTGTGCGCTGGCGCACTGCCGCAAGCGGCGAAGTATTGACAATGACTTGAGGACTTATCGTTATCCCCGCAGCGAGGAGTTGCTGGAAAAATGGCGAGTGAATTTACGCTTGGCTCCAGATCAGTGTCGCGGACGCATTTGTGCCGATCATTTCGAGCCAATGGTGCGTGGCAAGCTGAAGCTTAAGACGGGTGCAGTGCCAACACTTAAGCTGGGACATGATGAGGGCGTGGTCTTTGACAACGAGGCCATTAAGGCGGGACTGCAGATGGATGGAGTCGCAGAGCCAGAGGTGGAGGAGGGTGAGGCAAGCAGAGAATCGCTGATTAAGATTAAAAAGGAAAAAATTGAACCAGATGAGGAGGAGGCGGAGGCAGAGCAGACACAGCTGGAAAATGGAGATGATGATGATGATGAGCAGGAAGAAGATGTGGATGCAGATGAGGATGATGATCATGGTTACTTCGATCCATTGGAACTGGTTGAAACCTTTGCTGACGACCATGCAGCCGATGATGATGAAGGTGATATTCCTGGCAATGATGATGAGCTTCTGTTGCTGCCTGATACGCCGCAAGTGAAGCTAGAGCATCCGCTCCCGCCGCTGCTACGTCGCGAGAAGCCCGTGAATAATGTGACGCCAATTTGTTGTCTAAGGCATTGCCGCAAAGAACGCACTGCAACACATCAGCTGAGCACCTTTGGTTTTCCCAAGGATCGCCTGCAGCTGCGCAAGTGGAGTATCAATCTACAAATTCCCGAGAGCGATTGCGTGGGACGTGTTTGCATTGAGCATTTCGAGGCGGAGGTGCTGGGCACGCGTAAGCTCAAACAGCATGCAGTGCCCACATTGAATTTGGGCCATGACACACCCCTAATCTACAGATGCAACGGACAAGCGCAGCCCATGGGAGGCATCTTCGATGAGCAGCCGCAGCATTCGGTTTTTCGGCTTTGGAGCCTGAAACACTGTCGCAAAAGGAAGCTGGAAGCAATGGAACCGCCCGATCATCATCATCATCAACGAGCAGTGATTAAGCAGGAGATGGAGGAGGAGCAGGAGGATGGGCTCAGCTGTTGCCTGCCCCACTGTGGCAAGCGGGCAAATGACGTACAGCTACATCGTCTGCCCAGCAATCGCTTTCGACTGCGCAAATGGTTGCACAATCTCAATCTACCCCAGAGCATTCCCATCGGCAGTCAGACACGTGTCTGCAGCGAACACTTTGATGTGCAACCGGGTGAGGCACTTGAGGATTGTATGCCAACCTTGAACCTGGGTCACAATGACACCAATCTATATAGGAATCAAAACTCCACCGCTTCATCTTCCTGCTTGGTGCCAAGCTGCCCGTGTGCACGCCTCAATCTCTATCGTGGCTATGATTTGCCTGAGCATCATCTTGTACAGCAGGCTTGGCTTGAGTTCCTTCGGCAACCCATGCCTCAGCTGCCCAGTGATGGTCAGCTCTGTGTGATGCACTATATGCAGCTGTACGAGCAGGTCTCGCTGCCGCAGGAGGTGCCAGCGACAGTGTTGCGTCAACTGCAGGAAACCTACGAACAGATTGCCAACTCCACCATGGCAATGAAATTGCGCTGCGCCGTGCCCGGCTGCTATTCCAAGTATACCGATAACATAAGGTTGACCAAGCTGCCCACCTGCTCGGAGATGTTTGCCAAGTGGCTGCACAATACCAAGATCAAATACGATGCCAATAGACATTATATCTATCGCATTTGTATGCTCCACTTTGAGCCACGTTGTCTGGGTCCAGTGCGTCCCAAATTGTGGGCGGTGCCGACGCTGCAACTACACCACAACGATGCAAATATCTATAGGAATCCCAAGTTGGATGCGAGTGGACAAGAGGTAGAGCAAGTCCTTCCACAACCAGTGCCCGTGCCCTTGGAGCTGCCATTGCGTATCAAGACGGAGCTGGCTTACACTGGCAGTCCGAGTGCCAGCGCCAGTCCAAGTCCACGTGGCAAGTTGCGCATGTGTTGCATTCCCAGCTGTGCCCAGCAGGCTAACTCATCGGTGCGTCTCTTTCGCTTTCCCACCTCTGAAACATTGCTGCTCAAGTGGCTGGTGAACACACAGCAGAAGCCACGTCTGGCGGATCCACAGCATCTGTTTGTCTGCCAGGATCATTTCGAAGCGGAAGCCATTTGCAAGAAGCAGCTAAGCAGTTGGGCTGTGCCCACATTGAAGCTAGGACACGATGGTCATATCATTCCCAATGCCAAGCACAATGGAAACATTGCGGACACACATGAGAATCGACACACGCTGCAATTTATTTGGGCCAACTACTGCTCTGTGCTGGACTGTTTTGAGCCTCGTAGTGAGCATCTGCGTCTCTTTCCATATCCCACAGATCGACCCACCATACGCAAGTGGGCTGCCAATTGCAAGCATCGTTCCATGCAGGCCAGCAGCGATGGCTTTCAGGTTTGTCAATCTCACTTTGAGCCACATTGTTTTAATCCGGATACAGGAGAGTTGCGAGCGGATGCAGTGCCTACGCTGGAGCTTAGTCGTGGCATCAATAAGACGGGTTGCGTGGTGCCCGGTTGTGTAAAAGATGAAAATGGACCGCGTCGCCGCCTGTTCAAGATGCCGAAACGTTTCACGCAGTTGTTAGATTGGTGTCACAATTTGCAGCTGGATCGATCGACCATCTCAATTGAGAAGAGTGTTGTGTGTGATCGTCACTTCGAGTCGCATTGCTTGAATGTGCATAAACAGCTGCGTCGGGGAGCACGTCCCACACTTCATTTGGGTCACACTGCGGATGTTGAGATATTGCAGAACCCTTCGAATTGGGCCCGTTGCACCGAGGTGTCTGAGACTCCTGCTGATGTCTGCTGTGTGCCCAATTGTGGACGGGATAAGGATGCAGAGGAAGAGGATACTGATGTGCAGCTCTTCAGTTTTCCCAAGGTGCGAACACTGGCAGAAAAATGGCTGAGGAACATTCGTCTCGAGGCAAACAAGGAACAGTTGGCGGAGTTGAAAGTCTGCAATGCGCACTTTGAGGTCTACTGTCTGGAGAATGGACGCCTACAGTTGGGTGCCATGCCCACACTGCAGTTGGGACACGATGATCATCAAGATATACATCGCTCCAGTTGTCTGACTTCGTTGTCGGCTTCCAAAATGAAACGTTATTGCAATAGAAATGGATACAGCTATGATTGTTGTTTTCCTCAGTGTGTGGAGTTGCAGAAGAGTTATCTACGGATAAGCTACAATTTGCCACAGTCGCAAGAGATGCGTAACGCCTGGATAGCCTACATGGAGTTGGAGGAACCGAAGGAGCAAGAAAAGAAGCAGCAACTAAAATTGTGCCCGCTCCATTTGATCCTTCTTTACGAGCACAGCGTAGATAATTTCCCCGAGCACACAACAGAGGAACTTCTGCAGGATAACTATGCAGCTGCGAGAAATAGTGTGCGCATACGTATCATTAGTTGTGCCGTGCGTGGCTGCAGGACTCTGAAAACCCGCGATGGCGGCTGCCTTCATGGTCTGCCCACGCGTCGGGATATACTTCAGATGTGGTTGCACAACATGCAATTGGTGTTCTACGAGCAACAGCGTTACATGTACAAGATCTGTAGCAAACACTTTGAGCCCAATTGCTTTACGGACACAACACGCCGCCTCAAGCCATGGAGTATGCCAACGTTGGAGTTGCCAGAGCCCGAACCAGGTGAACCGGAAATATATCAGAATCCCACAGAGGCTGAATGGCAACAAATGAATGAACAATGGGCAGCAGAGCAGGCGCAAATAGCTCAGCCAATGATGGAGGATGAAGAACATGATGAAGCTGTGCAAGTGAAGCTTGAGCCGGAAACAGAGATGGAACAGGAAAATCTGCTGGCATATGAAGAAGAGGATTACTCGCAGCCTCCAGTGGATGGAGGGGAGGATGCTAGTTCGCAGCAGCCGCTGGAGATGCAACCGTTGGAGGTGCTGCTTGAGGTGGGCCATGTGGAGAAGTGCAGAACATACGAGCAAATGGACACAAAGGCAAATCTTAATTATGCCGAACAACAGGCGGCGGCTGGACCGTTGCCTAGCAATGGAATCTTTGCCAGTAATGGCAACAAGTACACTGCACGCAATTGCAGTGTACAAGGCTGCCACGTGACCTTGAACGATATCTGTGGCAGTGTGAAATTACACAAATTTCCCACGTCGTGGGAGTCAATGCAAAAGTGGATGCACAACACCCAAGTGAAGGTGTGCAGAAGTGTCTCGTGGCGTTTTCGCATTTGCAGTTATCATTTTGATGAAGATTGTTTTCAAGGCTCTCGCCTAAGGCGTGGTGCCATGCCCACATTGCAGTTGGGCCCCAACCGACCTTCGAATATCTATGAGAGTGAATTCAATGTTGGCGATGGCGATGAGGAGCAGCCCATTGAGCAGCCATTAGAACAAACACCAAAGTCAAGGGTGGTAGGTGGCGATAATATAAGTCTGTGCCTGCCTAGCCCAGCACCACCTCGCAAGTCGAGCAAGTTCTGCCAAGTCGATGGTTGTCCTAATCATTTGACCACCGAGAACATGACGCTGCACAAATTTCCCCACTCGCAGGACATGTGTGCCAAGTGGCAGCATAATACACAGGTGCCATTTGATCCCGTCTTCCGTTGGCGTTATCGCATATGCAGCGCTCACTTTGAGCCGATCTGTCTCTTGAATATGCGCCTGTTGCACGGCAGTGTGCCCACGCTGCACTTGGGTCCACGTGCTCCCTTGCAGCTCTTCGACAGCGACTTTGAGGCCATCAGCATGCGCTTGGATAAGCAGAAGAGCAGCTCAGAGCAACACTTGTATATCAAAGAGGAGCAGGAAGAGGATCACGATGATGCGATGCAAGATGAGGATGAGTTTAGTTTTCTGGTGCCAGAGATGCAGCTGCATGAGGATGCAGGGGTAGAGGAAGCTAACATAAAGACGGAGCACAGTCAAACCTATAACGGACGCTGGAAGGATCTGCGCTTGCCCAGTATTAAGCAGGAGGATACAACGACCATGACGTGCTATAATCCAGTCAAGTCGGGCTACGACAAGTGCTCGCTGGTGCATTGTCAGCGTCAACGATCTCTGCACGGTGTGCATATCTATAAATTCCCCCGTTCCCATCAACTACAGCAGCACTGGATGCATAATCTGCGAATACGCTATGATGAACGGAGGCCCTGGAAAACAATGATATGCAGTGTACACTTTGAGGCGCAATGTATTCGTCTGCGTAAGCTGCGTCCCTGGGCGGTGCCCACACTGGAGCTAGGTGACAATGTGCCCCAGGAAATCTTTACCAATGAACAGAGTCGGCAACAGTTGGAGAATGATGAAATGGATGTGGATTTTGACTTGGATCTAAAACAGCCAATGCTGGAGGAGGATTATGGCGATGATGATGATGATGCTGATGGTGACATGGAAGATGGAAATGCGTCAGTGCGTCAGCCACATTGGAAAAAAAGAAAGCAAAATCACAATCAGCTTGTAAAGATAAAGACTTGCTCCTTACCCTACTGTCGGAGTCCACGTGGGGATGGCATTAAGCTTTTCCGACTGCCGAACAGGCTGAGCGACATACACAAATGGGAGGCGGCAACGGGAATGCATTTCACCGAATCCCAGCGCAACACGAAGCTCATCTGCAGTCGTCACTTTGATCCGCAGTTGATTGGCGTGCGTCGTCTCATGTACAATGCGGTGCCGACTCTTCATCTGCGACCAGAAACTGTGCGAGAAGAACGGATGCCTCCGCGTTCTCGTCCAGCGGCGCCACGTTGTTTCATGCCCAGTTGTCCACAGGATATGCAGCAAAAGTTACACAAGTTTCCCAGCGATCCTCGGCAGCTTCAGGAATGGTGTGCAGTGCTCAGAGTCTCCGTAACGCAGGACTTTAGTAACTTATACATATGTGACGATCATTTGCCAACGTTAGCGAGAAGCTGCCTCATTTGCAGCGAAGAGGAACTGCAGCTGCCACTGCTCAACTTCCCAGAGCACCGCAATCAACGAGCCAAGTGGTGCCATAATCTTAAAATCGATCCCATTCCCAAGTGGGATAACTCAAAGCATATTTGCAGTCGACATTTTGAGAGCTACTGCTTCATCCAGCCAGGTCAACTGGTTCCCGAGGCTGCTCCCACGTTGCATTTAAAGCACACGGACAGCAACATATTCCTTAACGATTATGCCATGGATTCCAGCAAGATGATGTTGCGAATTAAGGATGAGCCCTTGGAGAGCGACGATTTGATGCTGTAA
Protein Sequence: MVQLFKFLLKSTKLPARAHFRPTFLDTLRLTVRGGHGGNGLPKYGGVGGQGGCVYFVAKEGLTLRRVAQNLKDKRVQASSGEDSSKVSIFGKRGVDQCIEVPVGVQVYDENNKLLADLNENDAKCIVAGGGTGGCIGNNFLGRPGDHRTVNLDLKLIADVGMVGFPNAGKSTLLKAISNAKPKIAAYPFTTIRPQIGTIDYSDLRSITVADLPGLIEGAHANFGMGHKFLKHIERTRLLLFMVDIFGFQLSPKHPHRDCLSNIYALNKELELYDPTLLEKPCVLLLNKMDKEGAQDLLKRLKPSIRDLKSGLSECPEEVRPNRVLKFEHILPISAKNSTRITQVKQLLRDTLDTIAAEHMVVDNEVLKEQLRQRVGVRAEPIDEHAYKTNYIDDNTPFADFSKFPEFGDDMLSPKVELTVKDEAYQKNPLSYPRRKLQSERSSESLPICQRCKEVFFKKQIYLQHVAESSCTIQEYDFKCNICPMSFMNTEELQKHKHLHRADKFFCHKYCGKYFDTIAECESHEYMQHEYESFVCNMCSVTFATREQLYAHLPQHKFHQRFDCPICRLWYQTALELHEHRLAAPYFCGKYYAGAQATQALQQQHTQQQHQQSANYKLQDCHMGTMEMPTPHQKATAGSALPATAALNSLLQQRQANADGAALFASSLKNEVNVKLERSYSNSTTSESGYSLHDSSNYNNAYGSDASLHGGSGAGAIGGPQAHSSTLDDSEDALCCVPLCGVRKSTSPTLQFFTFPKDEKYLHQWLHNLKMFHIPASSYATYRICSMHFPKRCINRYSLCYWAVPTFNLGHDDVANLYQNRELTNTFTTGEVARCSMPNCTSQRGESNLKFYNFPKDIKSLIKWCQNARLPVQAKEPRHFCSRHFEERCIGKFRLKPWAVPTLHLGAQYGKIHDNPKNLYVEEKRCCLNFCRRSRSSDFNMSLYRFPRDEVLLRRWCYNLRLDPAVYRGKNHKICSAHFIKEALGLRKLSPGAVPTLHLGHNDTFNIYENELXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXASHYVDPELSASYMGMGSGSGGSASGLNVSDSMDVCCVPSCESKRHNNENITFHTIPRRPEQMRKWCHNLKIPEDKMHKGMRICSLHFEPYCIGGCMRPFAVPTLNLGHDDDDIHRNPDVIKKLNIRETCCVAVCXXXXXXXXXXXXXXXXXXSLLTKWCANLQRPVPDGTKLFNDAICEVHFEDRCLRNKRLEKWAVPTLVLGHDNIAYPLPTPEQVAEFYARPSAPNNGEEQGECCVETCKRNPSVDDIKLYRPPEESSVLAKWAHNLEVDAAKLSSMRICNLHFESHCIGKRMRPWAIPTLNLSNNVENMYENPEHHMIYKRRTQIKTERGSGASGAGASMSKPTWVPRCCLPHCRKVRALHNVQLYRFPKLNRSTLAKWAHNLQVPLVGSAQRRLCSAHFEPHVLSKKCPVPLAVPTLDLNAPPGYKIYQNPAKLKANKLCLQRVCIVESCRRQRGQGVQLFRLPHSPTQLRKWMYNIRMRPRGAMRQQYRICSKHFETHSFNGKRLSAGAIPTLELGHDDEDIYPNEAQSFVEEHCAIEGCESSKEQPDVRLFRFPTNDEDLLWKWCNNLKMNPVDCIGVRICNKHFDGDCIGPKHLYKWAIPTMELGHDDSQIELITNPKPEERYVDPVFKCCVPTCGKTRKFDEVQMNSFPKDPTLFERWKHNLRLEHLQFKERERYKICDAHFEDICIGKTRLYIGSIPTLELGHDDTEDLFRVNPAELQSNLFGRQRRVQESGLRVRIKQEEHSEQEETDVTMSEATDLNTKQVKIKKRLADLKCCVPNCGRSRLEHGARLFPFPTGKQQQSKWRHNLRLDASEVDKTSQVCSAHFNRRCIDGKQLRGWAIPTQQLGHQEQPIYENPKNIPGFFTPTCALAHCRKRRSIDNDLRTYRYPRSEELLEKWRVNLRLAPDQCRGRICADHFEPMVRGKLKLKTGAVPTLKLGHDEGVVFDNEAIKAGLQMDGVAEPEVEEGEASRESLIKIKKEKIEPDEEEAEAEQTQLENGDDDDDEQEEDVDADEDDDHGYFDPLELVETFADDHAADDDEGDIPGNDDELLLLPDTPQVKLEHPLPPLLRREKPVNNVTPICCLRHCRKERTATHQLSTFGFPKDRLQLRKWSINLQIPESDCVGRVCIEHFEAEVLGTRKLKQHAVPTLNLGHDTPLIYRCNGQAQPMGGIFDEQPQHSVFRLWSLKHCRKRKLEAMEPPDHHHHQRAVIKQEMEEEQEDGLSCCLPHCGKRANDVQLHRLPSNRFRLRKWLHNLNLPQSIPIGSQTRVCSEHFDVQPGEALEDCMPTLNLGHNDTNLYRNQNSTASSSCLVPSCPCARLNLYRGYDLPEHHLVQQAWLEFLRQPMPQLPSDGQLCVMHYMQLYEQVSLPQEVPATVLRQLQETYEQIANSTMAMKLRCAVPGCYSKYTDNIRLTKLPTCSEMFAKWLHNTKIKYDANRHYIYRICMLHFEPRCLGPVRPKLWAVPTLQLHHNDANIYRNPKLDASGQEVEQVLPQPVPVPLELPLRIKTELAYTGSPSASASPSPRGKLRMCCIPSCAQQANSSVRLFRFPTSETLLLKWLVNTQQKPRLADPQHLFVCQDHFEAEAICKKQLSSWAVPTLKLGHDGHIIPNAKHNGNIADTHENRHTLQFIWANYCSVLDCFEPRSEHLRLFPYPTDRPTIRKWAANCKHRSMQASSDGFQVCQSHFEPHCFNPDTGELRADAVPTLELSRGINKTGCVVPGCVKDENGPRRRLFKMPKRFTQLLDWCHNLQLDRSTISIEKSVVCDRHFESHCLNVHKQLRRGARPTLHLGHTADVEILQNPSNWARCTEVSETPADVCCVPNCGRDKDAEEEDTDVQLFSFPKVRTLAEKWLRNIRLEANKEQLAELKVCNAHFEVYCLENGRLQLGAMPTLQLGHDDHQDIHRSSCLTSLSASKMKRYCNRNGYSYDCCFPQCVELQKSYLRISYNLPQSQEMRNAWIAYMELEEPKEQEKKQQLKLCPLHLILLYEHSVDNFPEHTTEELLQDNYAAARNSVRIRIISCAVRGCRTLKTRDGGCLHGLPTRRDILQMWLHNMQLVFYEQQRYMYKICSKHFEPNCFTDTTRRLKPWSMPTLELPEPEPGEPEIYQNPTEAEWQQMNEQWAAEQAQIAQPMMEDEEHDEAVQVKLEPETEMEQENLLAYEEEDYSQPPVDGGEDASSQQPLEMQPLEVLLEVGHVEKCRTYEQMDTKANLNYAEQQAAAGPLPSNGIFASNGNKYTARNCSVQGCHVTLNDICGSVKLHKFPTSWESMQKWMHNTQVKVCRSVSWRFRICSYHFDEDCFQGSRLRRGAMPTLQLGPNRPSNIYESEFNVGDGDEEQPIEQPLEQTPKSRVVGGDNISLCLPSPAPPRKSSKFCQVDGCPNHLTTENMTLHKFPHSQDMCAKWQHNTQVPFDPVFRWRYRICSAHFEPICLLNMRLLHGSVPTLHLGPRAPLQLFDSDFEAISMRLDKQKSSSEQHLYIKEEQEEDHDDAMQDEDEFSFLVPEMQLHEDAGVEEANIKTEHSQTYNGRWKDLRLPSIKQEDTTTMTCYNPVKSGYDKCSLVHCQRQRSLHGVHIYKFPRSHQLQQHWMHNLRIRYDERRPWKTMICSVHFEAQCIRLRKLRPWAVPTLELGDNVPQEIFTNEQSRQQLENDEMDVDFDLDLKQPMLEEDYGDDDDDADGDMEDGNASVRQPHWKKRKQNHNQLVKIKTCSLPYCRSPRGDGIKLFRLPNRLSDIHKWEAATGMHFTESQRNTKLICSRHFDPQLIGVRRLMYNAVPTLHLRPETVREERMPPRSRPAAPRCFMPSCPQDMQQKLHKFPSDPRQLQEWCAVLRVSVTQDFSNLYICDDHLPTLARSCLICSEEELQLPLLNFPEHRNQRAKWCHNLKIDPIPKWDNSKHICSRHFESYCFIQPGQLVPEAAPTLHLKHTDSNIFLNDYAMDSSKMMLRIKDEPLESDDLML

Similar Transcription Factors

Sequence clustering based on sequence similarity using MMseqs2

100% Identity: iTF_01548887;
90% Identity: iTF_01558329;
80% Identity: -