Basic Information

Insect: Drosophila parabipectinata
Gene Symbol: -
Assembly: GCA_018153455.1
Location: JAECYA010000366.1:16152871-16165883[+]

Transcription Factor Domain

TF Family: THAP
Domain: THAP domain
PFAM: PF05485
TF Group: Zinc-Coordinating Group
Description: The THAP domain is a putative DNA-binding domain (DBD) and probably also binds a zinc ion. It features the conserved C2CH architecture (consensus sequence: Cys - 2-4 residues - Cys - 35-50 residues - Cys - 2 residues - His). Other universal features include the location of the domain at the N-termini of proteins, its size of about 90 residues, a C-terminal AVPTIF box and several other conserved residues. Orthologues of the human THAP domain have been identified in other vertebrates and probably worms and flies, but not in other eukaryotes or any prokaryotes [1].
Hmmscan Out: # of c-Evalue i-Evalue score bias hmm coord from hmm coord to ali coord from ali coord to env coord from env coord to acc

1 29 2.9 6.6e+03 -2.2 3.3 38 62 336 363 327 379 0.59

2 29 2.4e-15 5.5e-12 46.1 4.1 1 86 572 644 572 645 0.85

3 29 8.9e-15 2e-11 44.3 5.0 1 87 672 741 672 741 0.83

4 29 8.1e-16 1.9e-12 47.6 0.2 1 87 763 835 763 835 0.85

5 29 4.4e-16 1e-12 48.5 5.8 1 87 934 1004 934 1004 0.81

6 29 5.1e-15 1.2e-11 45.1 3.5 1 86 1028 1099 1028 1100 0.81

7 29 8.3e-13 1.9e-09 38.0 1.2 1 87 1135 1203 1135 1203 0.81

8 29 5.7e-11 1.3e-07 32.1 1.6 1 86 1243 1312 1243 1313 0.75

9 29 2e-17 4.6e-14 52.8 0.3 1 86 1340 1409 1340 1410 0.82

10 29 7.1e-13 1.6e-09 38.2 1.3 1 85 1431 1499 1431 1501 0.79

11 29 1.2e-14 2.8e-11 43.9 1.0 1 86 1528 1599 1528 1600 0.85

12 29 4e-14 9.3e-11 42.2 2.0 1 86 1680 1749 1680 1750 0.82

13 29 5.1e-13 1.2e-09 38.7 0.1 1 86 1773 1841 1773 1842 0.82

14 29 1.2e-13 2.9e-10 40.6 1.0 1 87 1969 2038 1969 2038 0.80

15 29 4e-08 9.1e-05 23.0 0.0 1 86 2131 2196 2131 2197 0.77

16 29 1e-06 0.0023 18.5 0.0 1 58 2212 2259 2212 2275 0.81

17 29 1.9e-12 4.4e-09 36.8 0.2 1 87 2289 2361 2289 2361 0.80

18 29 3e-14 7e-11 42.6 0.6 1 87 2421 2491 2421 2491 0.81

19 29 1.1e-10 2.5e-07 31.2 0.0 1 86 2523 2594 2523 2595 0.81

20 29 5.4e-13 1.3e-09 38.6 0.0 1 87 2605 2677 2605 2677 0.79

21 29 1.2e-15 2.9e-12 47.0 0.2 1 85 2694 2764 2694 2766 0.82

22 29 3.8e-06 0.0088 16.6 0.1 1 58 2798 2845 2798 2865 0.86

23 29 4.2e-12 9.7e-09 35.7 0.3 1 87 2883 2955 2883 2955 0.82

24 29 3.4e-15 7.9e-12 45.6 0.2 1 86 3061 3133 3061 3134 0.80

25 29 1.5e-12 3.4e-09 37.2 3.3 1 86 3195 3265 3195 3266 0.82

26 29 1.3e-13 2.9e-10 40.6 2.9 1 86 3336 3406 3336 3407 0.85

27 29 7.9e-12 1.8e-08 34.9 0.1 1 87 3490 3560 3490 3560 0.84

28 29 3.7e-10 8.5e-07 29.5 1.8 1 58 3588 3636 3588 3644 0.85

29 29 2.1e-09 4.8e-06 27.1 1.5 18 86 3654 3711 3643 3712 0.73

#	of	c-Evalue	i-Evalue	score	bias	hmm coord from	hmm coord to	ali coord from	ali coord to	env coord from	env coord to	acc
1	29	2.9	6.6e+03	-2.2	3.3	38	62	336	363	327	379	0.59
2	29	2.4e-15	5.5e-12	46.1	4.1	1	86	572	644	572	645	0.85
3	29	8.9e-15	2e-11	44.3	5.0	1	87	672	741	672	741	0.83
4	29	8.1e-16	1.9e-12	47.6	0.2	1	87	763	835	763	835	0.85
5	29	4.4e-16	1e-12	48.5	5.8	1	87	934	1004	934	1004	0.81
6	29	5.1e-15	1.2e-11	45.1	3.5	1	86	1028	1099	1028	1100	0.81
7	29	8.3e-13	1.9e-09	38.0	1.2	1	87	1135	1203	1135	1203	0.81
8	29	5.7e-11	1.3e-07	32.1	1.6	1	86	1243	1312	1243	1313	0.75
9	29	2e-17	4.6e-14	52.8	0.3	1	86	1340	1409	1340	1410	0.82
10	29	7.1e-13	1.6e-09	38.2	1.3	1	85	1431	1499	1431	1501	0.79
11	29	1.2e-14	2.8e-11	43.9	1.0	1	86	1528	1599	1528	1600	0.85
12	29	4e-14	9.3e-11	42.2	2.0	1	86	1680	1749	1680	1750	0.82
13	29	5.1e-13	1.2e-09	38.7	0.1	1	86	1773	1841	1773	1842	0.82
14	29	1.2e-13	2.9e-10	40.6	1.0	1	87	1969	2038	1969	2038	0.80
15	29	4e-08	9.1e-05	23.0	0.0	1	86	2131	2196	2131	2197	0.77
16	29	1e-06	0.0023	18.5	0.0	1	58	2212	2259	2212	2275	0.81
17	29	1.9e-12	4.4e-09	36.8	0.2	1	87	2289	2361	2289	2361	0.80
18	29	3e-14	7e-11	42.6	0.6	1	87	2421	2491	2421	2491	0.81
19	29	1.1e-10	2.5e-07	31.2	0.0	1	86	2523	2594	2523	2595	0.81
20	29	5.4e-13	1.3e-09	38.6	0.0	1	87	2605	2677	2605	2677	0.79
21	29	1.2e-15	2.9e-12	47.0	0.2	1	85	2694	2764	2694	2766	0.82
22	29	3.8e-06	0.0088	16.6	0.1	1	58	2798	2845	2798	2865	0.86
23	29	4.2e-12	9.7e-09	35.7	0.3	1	87	2883	2955	2883	2955	0.82
24	29	3.4e-15	7.9e-12	45.6	0.2	1	86	3061	3133	3061	3134	0.80
25	29	1.5e-12	3.4e-09	37.2	3.3	1	86	3195	3265	3195	3266	0.82
26	29	1.3e-13	2.9e-10	40.6	2.9	1	86	3336	3406	3336	3407	0.85
27	29	7.9e-12	1.8e-08	34.9	0.1	1	87	3490	3560	3490	3560	0.84
28	29	3.7e-10	8.5e-07	29.5	1.8	1	58	3588	3636	3588	3644	0.85
29	29	2.1e-09	4.8e-06	27.1	1.5	18	86	3654	3711	3643	3712	0.73

Sequence Information

Coding Sequence: ATGTCACAACATAACCAACCCCACCAAGTGCCCCCGCAACCCCATCCGCACTATCCCTACCANNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNCTATATGGGCCACGAAGTGATGGCCGGCAGCAGCTATCCCTACATTAAAAGCGAACCCATGGAGGCATTCCAGCACCCGCCAAACCCCATGGCACCGCCGCCACCCCTGCCTCCGGCCCCGGAAATGATCATAAAATCGGAACCCATGGACGAACAGGCCTACAAGTCCAACTATATAGACGACAACACCCCGTTTGCGGACTTCAGCAAGTTTAACGATTACAACGAGGACATGCTGAGTCCTAAAGTGGAGCTAACCGTTAAGGACGAGTCCTACGGCAAGAACCACCATAATAGTTTTCCTCGTCGCAAGCCACCAAACGATCGTCTCGCCGGCAATGAGAGCTTGCCGATCTGCCAGCGCTGCAAGGAGGTGTTCTTCAAGAAGCAGACCTACTTGCGCCACGTTGCCGAGAGCAGTTGCACCATCCAGGAGTATGACTTCAAGTGCAACATCTGCCCCATGTCCTTCGTGAGCGCTGAGGAGCTGCAGCGCCACAAAAACCATCATCGGGCCGACCGATTCTTCTGCCACAAGTACTGTGGCAAGCACTTTGAAACGATTGCCGAGTGTGAGGCGCATGAGTACATGCAGCACGAATACGACAGCTTTGTCTGCAACATGTGCTCTGCCACTTTTGCCACAAGGGATCAGCTTTACTCCCACCTGCCGCAGCACAAGTTTCAGCAGCGTTTCGACTGCCCCATATGCCGCCTGTGGTATCAGACCGCTCTCCAGCTGCACGAGCATCGGCTGGCAGAACCCTATTACTGCGGGAAGTATTACGGGGCAGGGCTGAACACGGCAACACCTCAGCAGCAGCATCACCACCAGAGCCAGACCAACTACAAGCTACAGGATTGCCACATGGCCACTATGGAGATGCCCAACGCATCGCAGCACAAGCCAAACTCCTCCAACTCCACCTTGCCGGCCACGGCGGCACTCAGTTCCTTGCTGCAGCAGCGGCAGGCGAATGCTGATGGCGCTGCCATGTTTGCTGCCTCGGCGGCGGTCAAGGCGGAGATGAACGTGAAGCTGGAGCGGAGCTACAGTAACTCGACCAGTGATTCATCGTACGGGGTGCAGGATGGCGGCTACAACAACTCCTTCTCCGGAGAAACTGCGATGCACAGTGGGGCCATCGCCGGACCACAGGCGAACTCCTCGACGCTGGACGACTCCGAGGACGCGCTGTGCTGTGTGCCATTGTGTGGAGTGCGCAAGAGCACCAGTCCGACGCTGCAGTTCTTCACGTTCCCCAAAGACGAAAAATACCTCAACCAGTGGCTGCACAACCTCAAGATGTTCCACGTGCCGGCCTCCAGCTACGCCAGCTTCCGCATCTGCAGCATGCACTTCCCAAAGCGCTGCATTAACCGATACTCGCTGTGCTATTGGGCAGTTCCGACATTCAACCTGGGCCACGACGACGTGGCCAATCTCTACCAGAACCGAGAGCTGACCAACACCTTCACCGTCGGTGAAGTGGCCAGGTGCAGCATGCCCCATTGCACCAGCCAGCGGGGCGAGAGCAACCTCAAGTTCTACAACTTTCCCAAGGACATCAAGAGCCTGATCAAGTGGTGTCAGAACGCCCGTCTCCCTGTCCAGGCCAAAGAGCCGCGACACTTCTGCAGCCGCCACTTTGAGGAGCGTTGTATTGGCAAGTTCCGCCTTAAGCCCTGGGCTGTGCCCACTCTCCATCTGGGCGCCCAGTACGGAAAAATCCACGACAATCCAAAGAACCTGTATGTGGAGGAGAAACGATGCTGTCTCAACTTCTGCCGCAGGAGCAGGTCCTCCGACTTTAATATGTCCCTCTATAGGTTTCCCAGAGACGAAGTCCTCCTCCGCCGTTGGTGCTATAACCTTCGCCTAGATCCCGGAGTATATCGCGGCAAGAATCACAAAATATGCAGTGCCCACTTCATCAAGGAGGCGTTGGGCTTGCGGAAGCTATCACCTGGGGCGGTGCCAACATTGCATTTGGGCCACAACGACACTTTCAACATCTACGAGAACGAGCTGTGGCCGCCGCCGACTCCCTCCACCAGCCACGGCAGTGGCCAGGTGCACATGCAGCATCAGCAACACATCCCGTCGCACCACTCGCTACAGCACCAGCTGCATCTTGGACAAGGCAAGTCCTATCAACGGCACTCGGCCGCATCCACTTCGTCCTCGGCGAGCTCCACCTCGCACTACGTGGATCCGGAGGTGAGTGCTTCGTACCTGGCGATGGGCGGATCCTCGGCGAACGCCAGCGACAGTATGGATGTCTGCTGTGTGCCCAGCTGCGAGAGCAAACGGCACAACGCCGAGAACATTACCTTCCACACGATTCCCCGAAGGCCCGAGCAGATGCGCAAGTGGTGCCACAACCTGAAGATACCCGAGGACAAGATGCACAAGGGCATGCGGATCTGCAGCCGGCACTTCGAGGCCTACTGCATCGGCGGGTGCATGCGCCCGTTCGCAGTGCCCACACTGCATCTGGGTCACGACGACGAGGACATCCACCGGAATCCGGACGTTATAAAGAAGCTAAACATCCGCGAGACCTGCTGCGTGGCTGTCTGCAAACGAAACCGGGACCGGGACCATGCCAACCTGCACCGCTTCCCCAGCAACGTGGCGTTGCTGACCAAGTGGTGTGCCAATCTCCAGCGTCCCGTGCCGGACGGCAGCAAGCTCTTCAACGACGCCATTTGCGAGGTGCACTTCGAGGACCGCTGCCTGCGGAACAAGCGCCTGGAAAAGTGGGCAGTACCTACCCTGACCCTGGGCCACGACGACATTGCCTATCCCCTGCCCACGCCGGAACAGGTTGCCGAGTTCCACTCTCGGCCCTCAGCTCCCAACAACGGGGAGGAGCAGGGTGAGTGCTGCGTGGAGACCTGCAAGCGCAATCCCAGCGTGGATGACATTAAACTGTACCGCCCTCCGGAGGAGGCCTCTGTGCTGGCCAAGTGGGCGCACAACCTACAGACGGAGGCGGCACAGCTGGTAAGCCAGCGAATCTGCAATCTGCACTTCGAGGCCCACTGCATCGGCAAGCGGATGCGGCCATGGGCCATTCCCACCCTCAACCTGGCCGGCAACATTGAGAATCTCTACGAGAATCCGGAGCCTTCGATGCTCTACAAGCGGCGGATGCACACCAAAGCGAAACTGTCGGTCTCTGCGAAACCCACCTGGGTGCCGCGTTGCTGTCTGCCACATTGCCGCAAGGTGCGGGCCCTCCACAATGTCCAGCTCTACCGCTTCCCCAAGCACAACCGCTCCACGCTGGCCAAGTGGGCGCATAACCTGCAGGTGCCCATGGTGGGCAGTGCCCAACGCCGGGTGTGCTCGGCCCATTTTGAGCCTCTTGTGCTGAGCAAAAAGTGCCCGGTGCCGCTGGCGGTGCCCACACTGGACCTGAACGCCCCGGCAGGGCATATGGTGTACCAGAATCCGGCCAAGCTGAGGGCCAGTAAGCTGTGCCTGCAGCGCGTGTGCATCGTAGAGAGCTGTCGCAAGACTCGGGCGCAAGGAGTGCAACTCTTCCGGCTCCCGCATAATCCATCCCAGCTACGGAAGTGGATGCACAACATCCGGACACGTCCGCGCGGTTCCATGCGGTCTCAGTACCGGATCTGCTCGCGGCACTTTGAGACGCACTCGTTTAACGGGCGAAGGCTCAGTGCTGGCGCCATTCCCACGCTGGAGCTGGGCCACGACGACGACGACATCTACCCCAATGAGGCGCAGGCTTTTGTGGACGAACACTGCGCCGTGGAGGGATGCGGGGCATCCAAGGAACAGCCGGAAGTGCGACTGTTCCGCTTCCCCACTGACGACGATGACATGTTGTGGAAGTGGTGCAACAACCTGAAGATGAACCCCGCGGACTGCACGGGCGTGCGCATCTGCAACAAGCACTTCGAGGCGGACTGCATTGGACCCAAGCACCTGTTTAAGTGGGCCATTCCCACCGAAGAGCTGGGCCACGACGATGCCCAGATAGAACTCATTCCAAACCCCAAGCCGGAGGATCGGTACGTGGATCCAGTTTTTAGGTGTGTTGTTCCCACCTGTGGCAAGACGCGCCGCTTTGACGAAGTCCAGATGAATAGTTTCCCCAAGGACCCGGAGCTCTTCCAGCGGTGGCGGCACAACCTCCGCTTGGACCACTTGCACTTCCACGAGCGGGAGCGCTACAAGATCTGCAACGCCCACTTCGAGGACGTGTGTATTGGGAAGACCCGGTTGAACATCGGCTCGATACCCACACTAGAGCTGGGCCACGACGAGACCGAGGACCTGTTCCAAGTCAATCCCGCGGAGTTGCAGAGCAACTTGTTTGGTCGCCAACGGCGGCTGCTCGACGGATCGGAGTCCGGCGAGGTGGTGGTCAAGCAGGAGCTTCCGGATGAGGAGACCGAGCCCGAGGACATCAAGCCGGACATTCGAGAACTATTAGTGTCCAGACCCAGACAGGTAAAGTCCAAAAAAGGAACGCTGGGGAATCTGAAGTGCTGTGTCCGGAGCTGCGGAAGGAGCCGGCTCCAACATGGTGCTCGTCTGTTTGCCTTTCCCACGGGCAAGCAGCAGCACCTTAAGTGGCGCCACAATCTGCGCCTGGAGCCAGAGGACGTGGACAGGTCCACGCGGGTGTGCAGCGCTCACTTCAATCGCCGTTGCATAGACGGCAAGCAGCTTCGGAGCTGGGCCATGCCCACCCTGCAGCTGGGCCATCGGGAGCAGCCCATCTACGAGAACCCCAAGAACATACCGGGCTTCTTCACACCCACCTGTGCCCTGAGCCACTGCCGCCAGAGAAGGAGCATCGACAACGACCTACGAACATACCGGTACCCGCGGACGGAAGACCTGCTGGAGAAGTGGCGGGCAAATCTCCGCCTGACTCCGGATCAGTGCCGCGGTCGTATCTGTGCGGATCACTTTGAACCTATGGTGCGTGGCAAGCTGAAGCTGAAAACCGGAGCGGTGCCCACCTTGAAGCTCGGCCACGATGAGGGACTGATCTACGATAATGAGGCGATCAAGGCTGGCATGGCGGAGGAGGAGGAGGTCACCTGCAAGCAGGAGATGGTCGAAGAGGAGGAAGAGGGTGAGGGAGAGCAGTCGCCCGAAGGAGTTCCCGCTGTCAACGAGGATGACGACGACAAAGACGACAGCTACTTCGATCCTTTGGAGCTGGTAGAGACGTTCGCAGAGCGCGCCAGCGACGAAGAAGCGGAAGACCACGAACTGGAGGAGAAGAATGAGCCGGAGGAGGGGGATGAGGAGGAGGCAGAGGAGCTCCTGCCAGACCTGCCACCCACGCCGCCACCTGTACCCCAGCGTCGCGAAAAGCCAGCCAACAATGTGACCCCCATTTGCTGTCTGAAGCACTGTCGCAAGGAGCGCACGGCCTTCCATCTGCTGAGCACATTTGGTTTCCCGAAGGACCGCAAGCTCTTGCTGAAGTGGTGCGCCAATCTCCACCTGCTTCCGAATGACGTTGTCGGGCGGGTCTGCATCGAGCACTTCGAGCCGGAGGTGCTCGGCACTCGGAAGCTGAAACAGAATGCAGTGCCCACCTTGAACGTGGGCCACGACGACCCGTTGCGGTACACCTGCCATGGTGTGGAGCAGGATCTGGACTTGGAGCAGGGACAGCCGCAGCACTCGGTTTTTCGGCTTTGGAGCCTGAAACACTGTCGCAAGAGGAAGCTATCGGATCCGCCGGACATTCGCCCCAGCCACTGGAAGGAGCTGAAGCTGCACATGCAGAAGCAGCGGCAGATGGAAATGGTAGAGATGGAGACCGACATACTGATGAGCACTCCTCCTCAGACACCGGTGAAGATTAAACCCAAAAGATGCTGCGTCATCAGCTGCGGGAGCGAGGATCCTAGAAAATTGGTGGCGCTGCCGGAAGAGCGCAGCCTTCTCCGCCGGTGGCAGCACAACCTGAAGCTGTCGGTGCTGACGGATCCAGGTCTTGGCTTGTGCCTGGACCATTTCGAAGAGTCTCTGGTGCAATATGGAAAGCCCATGGAGAGGGCAGTGCCCACCCTGAAGTTGGGTCACACGAGCGGTAATCTCTACCGGAACAATGCTACTTGTCTGGTCCCCAGCTGTCCCAGTTCCGACTCCGATAGCACTAGTTTCGTGGGTCTGCCCCTCAATCCGGTGATGAAAAGGGCCTGGCTCTCCTACCTCCAACTGCCATTCACTAACGACGGTCTTCTATGTGGCAACCACTTCGTGGAGCTCTACGAGCAGGTGGACTTGCCTGAGGACTTGCCCGTCCAGGATTTGGAGGAGCTGGAACGAACTGTCGATGAGCTGCAGTGCGCTGTGCCCGGGTGTGCGTCAAAGAACGCCCGTGAGATTCCCGTCCAGCTGGTCCAGTTACCCCACAACGAGAAGGAACTATCCAAGTGGCTGCATAACACAAAGATCACTTATGACTATTCCCGGCACGGCAGCTATCGGATTTGCCTGCTCCACTTCGACCCGATCTGCCTCGATGAGGACTTTCCCCAGAGTTGGGCAGTGCCTACTCTAAACCTGGGCCACGATGACCAAATCCACTTGAATCCCGTCCAGAATCAGGTTGCTGAGGCCCTAAACGGAACGTCCAATAGCCATCATAGCCATAGCCTGAGACCTCTGAGGATTAGGACAGAACTAGCATCCAGCCCGAGTGTGAGTGCCAGTCCCAGTCCGAGAGGAAACATCCGGATTTGTTGCATCCCCACTTGCAACCAGTTTGGGAACAGCCAGGTGCGACTCTATCGCTTTCCCAGCGAGGAGCAGTTCCTCCTCCAGTGGCTGGTCAACACGCAGCAGCAGCCCCGTCTGGTGGATCCCATGGAGCTCTACGTGTGTCAGGCACACTTTGAAACCGAAGCCACCTACAAGAAGCACCTTCGCAGCTGGGCCTTGCCGACCCTGAATCTTGGCCATGACGGGCATGTCTTTCAGAACGCCAGGCACAACGGGAACACTGCCGATGTCGAGGAGGCATTGAAGTTTATCCGGGAGCGCTACTGTTCGGTGCTGAGTTGCTTTCAACTCGGAGGAGAGGGAGTCCGCCTGTTCGAGTACCCCGAGGACATGGCCATGATCCGAAAGTGGGCAGTTGCCTGCAAACATCGTTCCATGCACGCCAGGAGCCATGGCCTCCTGGTGTGCCAGGCGCACTTTGCTCCCGACTGCTTTGATCCCGACACTGGACACCTACAAGAGGGCTCAGTACCCACGCTGGAACTCAGCCGCGAAGACATCGAGAGACACTGCTTGGTGCCAGGTTGTGAGCAGGACGATGCGGGCCCCCGGCTGCGATTCTACAAGCTGCCCAAGATCGGCGAACAGCTCGAGGCGTGGAGCACCAATATAAAGATTCCGGTCTCAGAACTGAAGCGCGGAGACCAGCGCATCTGTGAGCGCCACTTCGAGACGTACTGCTTCGGACCTAGCCGGGGTCTGCGGCTGGGAGCCTTACCCACTCTGTTCCTGGGTCACGAGGACCTGCTTCTTAATCCCGACAACTTGCGGGAGAACTGCTGCGTACCGGGATGCGGGCGTATCCGGCAGACTGATGACATTCCCTTCTACGGCTTCCCGAAGCATTGGTCCTTGGCCAGGAAGTGGCTGCACAACATCCGCTTGGAAAAGACCAGCAAGGATCAGCTAAACAAACTGAGGGTTTGCCCGGCGCACTTTGAGTCGGATGTGCGGGAAAACGACGGACTCCTGCCAGAAGCCATGCCCACCAAGCAGCTGGGGCACTCCTCCGAAGGGATTTTCCTCACGGACAAGGGTACGCAGGCTAGAAGTCTTCCGAATCTCAAAAGATCCTCTCCGGAGGTCACATGCTGTTATCCGGACTGCACTGATTCGTCGAGATTCCAGTTATTGGATTTTCCCGACCAGGCAGAGCTTCGCGATGCATGGTTGGGTCACTTGAAACTCAGGGAGCTACATGATGAAGCGCCACAGCTCTGTCCCCTCCATTATGTGATTCTATATGAGCACAGTGTCAAGGAGTTTCCGGAGCACGTTCCAGACCAGTTGATGGAAGTAAACTACACTAACGCCCGCGCCAACCGGCGGGTCAAGATCGTCAGTTGCGCCATCAAGGGCTGCACAACGGTGAGGCCTAGGGATGGAGTGCCGCTGCACGGCATGCCCACGTACAAGGATATCCTGCAGATGTGGGTGGACAACGGGCAGGTGGACTTCTCCGAACCGCAACGGTACATGCTCAAGGTGTGTCACAGGCACTTCGAGCCACGCTGCTTCGTCGATGAACGGCGGCTCTGCTCCTGGAGTGTTCCTACCCTGCATCTTCCCGGCGAGACTATCCACCAGAATCCCAGCAAAGAGGAGTGGGAGGCCATCAAGCGAGAGAACAGGGAAGAGCCAGAAATCAAGGAGGAACCTCTAGAGACGGAGCCAGAGATGGAGATGGAAACGGAAAACTCTCTACTGGAGCCCATTGTCAAGATGGAACACCTGGAATCCGAGGAGGAGGACTCAGAAATGCAGGCGTTGGAGGTGCTGCTGGAGGTCGGACACGTGGAGCGGCTGGACAGCTATGAAAAGATCGACGAATCCCCCATTGCCTACAAGTCCAATCGAGGGCAGTACAACGCCAACAGCTGTGCCGTGGAAGGGTGTGACGTCACAGCCGAGGACGTGGGCGGAACTATCAAGCTGCACAAGTTTCCCGCCCCAGCGGAAGCCGCCCGCAAGTGGATGCACAACACCCAGGTGGACATGGAGGAGAAGTTCTGGTGGCGATATCGCATTTGCAGCTACCACTTTCACCAGGACTGCTTCCAGGGGTCTAGAATCCGAAAGGGAGCCATGCCCACGCTGCTCTTGGGACCTCGGAGACCGGATGAGGTCTACGACAATGAGTTCGCATCTCAGCCGGAGGTTAAGGACCCACCTCCGCCGGTCGAGATCGTCGCAGTGACCAGTGTGACTGAACGGACAGCGCCCGATGTTACCAATCTCTGCCTTCCTCCGCCGGCTGCGCCCCGGAAATCCAGCAAGTTCTGCCAAATCGAAGGCTGCTCGAATCACCTGACCACCGACAACATAACCCTCCACAAGTTTCCGCACTCGGAGGACATGTGCGTCCGATGGCAGCACAACTCTCAAGTTCCATTCGATCCGAACCATCGCTGGCGATACAGGATCTGCACCGCCCACTTCGAACCCGTGTGCCTGTCTAACTTGCGCCTGCTCCACGGAAGTGTGCCCACCCTGAAGCTAGGACCCAAAGCTCCCGCGGAGCTCTTCGACAACGATTTTGAGGCCATCAACCAGCGGCTGGATAAGAGATCGGCGGCAGAGGTGAAACAGGAACGGGTGGATATGGAAGACGAGCTGCACGAGGACCAAATGGATGTGGCTAGCTTGATGCCTGTGAAGCAGGAGAAGGTTTCCTTCAACCAGATCAAGTCTGGCTACGACAAGTGCTCACTGGCCCACTGCCAGCGCCAAAGATCTCTGCACGGCGTCCACATCTACAAGTTCCCCAGGTCGCAGCTCCAGCAGGAGCGATGGATGCACAACCTCCGCATCCGGTACGATGAGCGCCGTCCCTGGCGATTCATGATCTGTAGCGTCCACTTCGAGCCCCACTGCATCAGCCTAAGGAAGCTGCGTCCCTGGGCAGTTCCTACGCTGGAGCTGGGCACGAATGTGCCGGAGATACTCTTCACCAACGAACAGTGCCTGGAACTGGAGGTGGAACATCCCAGCGATCGTAGCGAAGCGGAGAGCGAAGAGGAGGATGGCCTGGAAGAAGACGACGATGGTGAGGAGGACGAGGCGGAGGAAGAAGGACATGACTCCAATGTCCGCATCAAAAAGGAACGGCGTTCGAGACTGGATCCATATCCTGCTGGTCAGGTTCCGCCCTGGAAAGTGAAGCAGTGCTGCCTTCCGTACTGTCGTGCCTTTCGAGGAGATGGCATCAAGCTCTTCCGGCTCCCCAACAACCGAACCTCTATTCACAATTGGGAGTTGGCCACGGGCATGGTGTTCAAGGAGTCGCAGCGAAACACGCGACTCATTTGTAGTCGACATTTCGATCCGGAGCTTATCGGAGTCCGTCGCCTCATGCGCAACGCTATTCCAACTCTGCATCTGAATCCGGAAGCCGTTAAGGGCAAGGAGAAAAAGGTTTGGCAGGGCAAACCCAAGGAAACTCCCACACCCATCCCAACCTGCTGCATGGCGGACTGCCATCACAACGGAAATGCCAAGCTGCACAAGTTCCCCAATGATTCCACACACCTGAGGCAGTGGTGCCAGGCCCTCAGACTCACGGATATACAACGTTATCGTGGCAAGTACATCTGCTCGGCCCACCTGCCGACCAACATGACCGTAAGCTGCGTCGTCTGCGGGGTGGATGACGTTCAGCTACCGATGCTGGACTTTCCAGAGAACCGCAACCAGCGGGCCAAATGGTGCTACAACCTTAAAATCGAGACCATACCCAAGTGGGATCGCTCCAAGCACATCTGTTGCCGGCACTTTGAGTCCCACTGCTTTGTCCGGCCGGGTGAACTTCGTCCAGGAGCGACCCCAACAGTGGCATTGAACCACAACGATACAAACATATTCCTCAGCGACTACGCCACCGATCCGACGACCTCCTATGCGGGTAATCAGATCAAGGACGAGCCCATGGACGGCGACGAGACGCTCCTGGTCTAG
Protein Sequence: MSQHNQPHQVPPQPHPHYPYXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXYMGHEVMAGSSYPYIKSEPMEAFQHPPNPMAPPPPLPPAPEMIIKSEPMDEQAYKSNYIDDNTPFADFSKFNDYNEDMLSPKVELTVKDESYGKNHHNSFPRRKPPNDRLAGNESLPICQRCKEVFFKKQTYLRHVAESSCTIQEYDFKCNICPMSFVSAEELQRHKNHHRADRFFCHKYCGKHFETIAECEAHEYMQHEYDSFVCNMCSATFATRDQLYSHLPQHKFQQRFDCPICRLWYQTALQLHEHRLAEPYYCGKYYGAGLNTATPQQQHHHQSQTNYKLQDCHMATMEMPNASQHKPNSSNSTLPATAALSSLLQQRQANADGAAMFAASAAVKAEMNVKLERSYSNSTSDSSYGVQDGGYNNSFSGETAMHSGAIAGPQANSSTLDDSEDALCCVPLCGVRKSTSPTLQFFTFPKDEKYLNQWLHNLKMFHVPASSYASFRICSMHFPKRCINRYSLCYWAVPTFNLGHDDVANLYQNRELTNTFTVGEVARCSMPHCTSQRGESNLKFYNFPKDIKSLIKWCQNARLPVQAKEPRHFCSRHFEERCIGKFRLKPWAVPTLHLGAQYGKIHDNPKNLYVEEKRCCLNFCRRSRSSDFNMSLYRFPRDEVLLRRWCYNLRLDPGVYRGKNHKICSAHFIKEALGLRKLSPGAVPTLHLGHNDTFNIYENELWPPPTPSTSHGSGQVHMQHQQHIPSHHSLQHQLHLGQGKSYQRHSAASTSSSASSTSHYVDPEVSASYLAMGGSSANASDSMDVCCVPSCESKRHNAENITFHTIPRRPEQMRKWCHNLKIPEDKMHKGMRICSRHFEAYCIGGCMRPFAVPTLHLGHDDEDIHRNPDVIKKLNIRETCCVAVCKRNRDRDHANLHRFPSNVALLTKWCANLQRPVPDGSKLFNDAICEVHFEDRCLRNKRLEKWAVPTLTLGHDDIAYPLPTPEQVAEFHSRPSAPNNGEEQGECCVETCKRNPSVDDIKLYRPPEEASVLAKWAHNLQTEAAQLVSQRICNLHFEAHCIGKRMRPWAIPTLNLAGNIENLYENPEPSMLYKRRMHTKAKLSVSAKPTWVPRCCLPHCRKVRALHNVQLYRFPKHNRSTLAKWAHNLQVPMVGSAQRRVCSAHFEPLVLSKKCPVPLAVPTLDLNAPAGHMVYQNPAKLRASKLCLQRVCIVESCRKTRAQGVQLFRLPHNPSQLRKWMHNIRTRPRGSMRSQYRICSRHFETHSFNGRRLSAGAIPTLELGHDDDDIYPNEAQAFVDEHCAVEGCGASKEQPEVRLFRFPTDDDDMLWKWCNNLKMNPADCTGVRICNKHFEADCIGPKHLFKWAIPTEELGHDDAQIELIPNPKPEDRYVDPVFRCVVPTCGKTRRFDEVQMNSFPKDPELFQRWRHNLRLDHLHFHERERYKICNAHFEDVCIGKTRLNIGSIPTLELGHDETEDLFQVNPAELQSNLFGRQRRLLDGSESGEVVVKQELPDEETEPEDIKPDIRELLVSRPRQVKSKKGTLGNLKCCVRSCGRSRLQHGARLFAFPTGKQQHLKWRHNLRLEPEDVDRSTRVCSAHFNRRCIDGKQLRSWAMPTLQLGHREQPIYENPKNIPGFFTPTCALSHCRQRRSIDNDLRTYRYPRTEDLLEKWRANLRLTPDQCRGRICADHFEPMVRGKLKLKTGAVPTLKLGHDEGLIYDNEAIKAGMAEEEEVTCKQEMVEEEEEGEGEQSPEGVPAVNEDDDDKDDSYFDPLELVETFAERASDEEAEDHELEEKNEPEEGDEEEAEELLPDLPPTPPPVPQRREKPANNVTPICCLKHCRKERTAFHLLSTFGFPKDRKLLLKWCANLHLLPNDVVGRVCIEHFEPEVLGTRKLKQNAVPTLNVGHDDPLRYTCHGVEQDLDLEQGQPQHSVFRLWSLKHCRKRKLSDPPDIRPSHWKELKLHMQKQRQMEMVEMETDILMSTPPQTPVKIKPKRCCVISCGSEDPRKLVALPEERSLLRRWQHNLKLSVLTDPGLGLCLDHFEESLVQYGKPMERAVPTLKLGHTSGNLYRNNATCLVPSCPSSDSDSTSFVGLPLNPVMKRAWLSYLQLPFTNDGLLCGNHFVELYEQVDLPEDLPVQDLEELERTVDELQCAVPGCASKNAREIPVQLVQLPHNEKELSKWLHNTKITYDYSRHGSYRICLLHFDPICLDEDFPQSWAVPTLNLGHDDQIHLNPVQNQVAEALNGTSNSHHSHSLRPLRIRTELASSPSVSASPSPRGNIRICCIPTCNQFGNSQVRLYRFPSEEQFLLQWLVNTQQQPRLVDPMELYVCQAHFETEATYKKHLRSWALPTLNLGHDGHVFQNARHNGNTADVEEALKFIRERYCSVLSCFQLGGEGVRLFEYPEDMAMIRKWAVACKHRSMHARSHGLLVCQAHFAPDCFDPDTGHLQEGSVPTLELSREDIERHCLVPGCEQDDAGPRLRFYKLPKIGEQLEAWSTNIKIPVSELKRGDQRICERHFETYCFGPSRGLRLGALPTLFLGHEDLLLNPDNLRENCCVPGCGRIRQTDDIPFYGFPKHWSLARKWLHNIRLEKTSKDQLNKLRVCPAHFESDVRENDGLLPEAMPTKQLGHSSEGIFLTDKGTQARSLPNLKRSSPEVTCCYPDCTDSSRFQLLDFPDQAELRDAWLGHLKLRELHDEAPQLCPLHYVILYEHSVKEFPEHVPDQLMEVNYTNARANRRVKIVSCAIKGCTTVRPRDGVPLHGMPTYKDILQMWVDNGQVDFSEPQRYMLKVCHRHFEPRCFVDERRLCSWSVPTLHLPGETIHQNPSKEEWEAIKRENREEPEIKEEPLETEPEMEMETENSLLEPIVKMEHLESEEEDSEMQALEVLLEVGHVERLDSYEKIDESPIAYKSNRGQYNANSCAVEGCDVTAEDVGGTIKLHKFPAPAEAARKWMHNTQVDMEEKFWWRYRICSYHFHQDCFQGSRIRKGAMPTLLLGPRRPDEVYDNEFASQPEVKDPPPPVEIVAVTSVTERTAPDVTNLCLPPPAAPRKSSKFCQIEGCSNHLTTDNITLHKFPHSEDMCVRWQHNSQVPFDPNHRWRYRICTAHFEPVCLSNLRLLHGSVPTLKLGPKAPAELFDNDFEAINQRLDKRSAAEVKQERVDMEDELHEDQMDVASLMPVKQEKVSFNQIKSGYDKCSLAHCQRQRSLHGVHIYKFPRSQLQQERWMHNLRIRYDERRPWRFMICSVHFEPHCISLRKLRPWAVPTLELGTNVPEILFTNEQCLELEVEHPSDRSEAESEEEDGLEEDDDGEEDEAEEEGHDSNVRIKKERRSRLDPYPAGQVPPWKVKQCCLPYCRAFRGDGIKLFRLPNNRTSIHNWELATGMVFKESQRNTRLICSRHFDPELIGVRRLMRNAIPTLHLNPEAVKGKEKKVWQGKPKETPTPIPTCCMADCHHNGNAKLHKFPNDSTHLRQWCQALRLTDIQRYRGKYICSAHLPTNMTVSCVVCGVDDVQLPMLDFPENRNQRAKWCYNLKIETIPKWDRSKHICCRHFESHCFVRPGELRPGATPTVALNHNDTNIFLSDYATDPTTSYAGNQIKDEPMDGDETLLV

Similar Transcription Factors

Sequence clustering based on sequence similarity using MMseqs2

100% Identity: iTF_00481571;
90% Identity: iTF_00538995;
80% Identity: -