Basic Information

Insect: Drosophila insularis
Gene Symbol: -
Assembly: GCA_018903935.1
Location: JAEIFP010001084.1:9086097-9101143[+]

Transcription Factor Domain

TF Family: THAP
Domain: THAP domain
PFAM: PF05485
TF Group: Zinc-Coordinating Group
Description: The THAP domain is a putative DNA-binding domain (DBD) and probably also binds a zinc ion. It features the conserved C2CH architecture (consensus sequence: Cys - 2-4 residues - Cys - 35-50 residues - Cys - 2 residues - His). Other universal features include the location of the domain at the N-termini of proteins, its size of about 90 residues, a C-terminal AVPTIF box and several other conserved residues. Orthologues of the human THAP domain have been identified in other vertebrates and probably worms and flies, but not in other eukaryotes or any prokaryotes [1].
Hmmscan Out: # of c-Evalue i-Evalue score bias hmm coord from hmm coord to ali coord from ali coord to env coord from env coord to acc

1 32 5.7 1.5e+04 -3.1 3.0 46 62 252 271 236 286 0.57

2 32 3e-15 7.9e-12 45.8 4.4 1 86 472 544 472 545 0.85

3 32 8.5e-15 2.2e-11 44.4 5.2 1 87 572 641 572 641 0.83

4 32 2.3e-12 6.1e-09 36.5 0.4 1 82 664 731 664 732 0.79

5 32 4.4e-07 0.0012 19.6 0.1 29 87 731 775 725 775 0.79

6 32 4e-15 1e-11 45.4 3.2 1 86 799 870 799 871 0.81

7 32 1.5e-12 4e-09 37.1 0.5 1 87 906 974 906 974 0.80

8 32 6.6e-11 1.7e-07 31.9 1.6 1 86 1016 1085 1016 1086 0.77

9 32 1.7e-16 4.3e-13 49.8 0.4 1 86 1113 1182 1113 1183 0.83

10 32 2.6 6.9e+03 -2.1 0.0 56 86 1205 1225 1204 1226 0.72

11 32 5.4e-15 1.4e-11 45.0 1.3 1 87 1253 1325 1253 1325 0.85

12 32 2.4e-13 6.2e-10 39.7 1.7 1 85 1402 1470 1402 1472 0.83

13 32 2.6e-12 6.7e-09 36.4 0.1 1 86 1496 1564 1496 1565 0.82

14 32 4.3e-14 1.1e-10 42.1 2.3 1 87 1703 1772 1703 1772 0.81

15 32 1.1e-10 2.8e-07 31.2 0.2 1 87 1876 1943 1876 1943 0.82

16 32 0.00014 0.36 11.7 0.0 1 59 1962 2010 1962 2031 0.75

17 32 1.1e-13 2.8e-10 40.8 0.1 1 86 2039 2108 2039 2109 0.85

18 32 4e-14 1e-10 42.2 1.4 1 87 2171 2241 2171 2241 0.83

19 32 1.9e-12 4.8e-09 36.9 0.4 1 86 2276 2347 2276 2348 0.80

20 32 5.9e-13 1.5e-09 38.5 0.3 1 87 2360 2433 2360 2433 0.82

21 32 1.9e-13 4.8e-10 40.1 0.7 1 86 2461 2533 2461 2534 0.80

22 32 1.5e-08 4e-05 24.3 0.5 1 58 2570 2620 2570 2643 0.80

23 32 1.4e-13 3.8e-10 40.4 0.2 1 87 2658 2730 2658 2730 0.83

24 32 4.6e-15 1.2e-11 45.2 2.6 1 86 2782 2854 2782 2855 0.73

25 32 7.7e-05 0.2 12.5 0.0 1 58 2887 2936 2887 2956 0.78

26 32 1.2e-13 3.2e-10 40.7 0.5 1 87 2974 3046 2974 3046 0.82

27 32 2.1e-15 5.4e-12 46.3 0.4 1 87 3205 3278 3205 3278 0.83

28 32 4.3e-12 1.1e-08 35.7 3.3 1 85 3345 3414 3345 3416 0.80

29 32 1.5e-15 4e-12 46.8 4.9 1 86 3525 3595 3525 3596 0.85

30 32 1.4e-13 3.6e-10 40.5 0.2 1 86 3680 3749 3680 3750 0.85

31 32 3.7e-12 9.7e-09 35.9 0.1 1 58 3776 3825 3776 3833 0.84

32 32 2.2e-11 5.7e-08 33.4 0.7 6 87 3837 3903 3832 3903 0.74

#	of	c-Evalue	i-Evalue	score	bias	hmm coord from	hmm coord to	ali coord from	ali coord to	env coord from	env coord to	acc
1	32	5.7	1.5e+04	-3.1	3.0	46	62	252	271	236	286	0.57
2	32	3e-15	7.9e-12	45.8	4.4	1	86	472	544	472	545	0.85
3	32	8.5e-15	2.2e-11	44.4	5.2	1	87	572	641	572	641	0.83
4	32	2.3e-12	6.1e-09	36.5	0.4	1	82	664	731	664	732	0.79
5	32	4.4e-07	0.0012	19.6	0.1	29	87	731	775	725	775	0.79
6	32	4e-15	1e-11	45.4	3.2	1	86	799	870	799	871	0.81
7	32	1.5e-12	4e-09	37.1	0.5	1	87	906	974	906	974	0.80
8	32	6.6e-11	1.7e-07	31.9	1.6	1	86	1016	1085	1016	1086	0.77
9	32	1.7e-16	4.3e-13	49.8	0.4	1	86	1113	1182	1113	1183	0.83
10	32	2.6	6.9e+03	-2.1	0.0	56	86	1205	1225	1204	1226	0.72
11	32	5.4e-15	1.4e-11	45.0	1.3	1	87	1253	1325	1253	1325	0.85
12	32	2.4e-13	6.2e-10	39.7	1.7	1	85	1402	1470	1402	1472	0.83
13	32	2.6e-12	6.7e-09	36.4	0.1	1	86	1496	1564	1496	1565	0.82
14	32	4.3e-14	1.1e-10	42.1	2.3	1	87	1703	1772	1703	1772	0.81
15	32	1.1e-10	2.8e-07	31.2	0.2	1	87	1876	1943	1876	1943	0.82
16	32	0.00014	0.36	11.7	0.0	1	59	1962	2010	1962	2031	0.75
17	32	1.1e-13	2.8e-10	40.8	0.1	1	86	2039	2108	2039	2109	0.85
18	32	4e-14	1e-10	42.2	1.4	1	87	2171	2241	2171	2241	0.83
19	32	1.9e-12	4.8e-09	36.9	0.4	1	86	2276	2347	2276	2348	0.80
20	32	5.9e-13	1.5e-09	38.5	0.3	1	87	2360	2433	2360	2433	0.82
21	32	1.9e-13	4.8e-10	40.1	0.7	1	86	2461	2533	2461	2534	0.80
22	32	1.5e-08	4e-05	24.3	0.5	1	58	2570	2620	2570	2643	0.80
23	32	1.4e-13	3.8e-10	40.4	0.2	1	87	2658	2730	2658	2730	0.83
24	32	4.6e-15	1.2e-11	45.2	2.6	1	86	2782	2854	2782	2855	0.73
25	32	7.7e-05	0.2	12.5	0.0	1	58	2887	2936	2887	2956	0.78
26	32	1.2e-13	3.2e-10	40.7	0.5	1	87	2974	3046	2974	3046	0.82
27	32	2.1e-15	5.4e-12	46.3	0.4	1	87	3205	3278	3205	3278	0.83
28	32	4.3e-12	1.1e-08	35.7	3.3	1	85	3345	3414	3345	3416	0.80
29	32	1.5e-15	4e-12	46.8	4.9	1	86	3525	3595	3525	3596	0.85
30	32	1.4e-13	3.6e-10	40.5	0.2	1	86	3680	3749	3680	3750	0.85
31	32	3.7e-12	9.7e-09	35.9	0.1	1	58	3776	3825	3776	3833	0.84
32	32	2.2e-11	5.7e-08	33.4	0.7	6	87	3837	3903	3832	3903	0.74

Sequence Information

Coding Sequence: ATGTCACAGCATAATCCACATTATCATCACCCCCATCCGCATCCTCTNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNAATACAACATAACCAATGGTATTCACATGTTGCTTCCACCTCTTCCACCACCCCCTACCCGCATCACTCATCATCAGCAGGCGCCTCCTCCTCGGCGGCAGGGGCAACAACTTCAGGCTCTAACAACAATCACATAATGAATGCCTATGGAACACATGGATATTATGGTGCCGCTGGCGGTGGCCTCAATGTCAATGCTGTGGGTGTCGCTGCACCAAGCGGATCCACAGAAATGAGAATTAAATCGGAACCCATGGACGAACTTGCCTATAAATCGTCCAACTATATTGATGATAATACTCCATTTGCTGATTTTACTAAATACAATGAATTTAATGAAAATATGTTGAGCCCCAAAGTGGAAATGTCTGTAAAAAATGAATCTACACCATACAGCAAGAATTCGAATAACTATCCAAGACGTAAATTACAAACGGAACGTTCTTCAGAGAATTTACCTATTTGTCAACGTTGTAAAGAAGTCTTCTTTAAGAAACAATCCTATCTACGTCATGTGGCCGAAAGTAGTTGCAACATTCATGAATATGAATTCAAATGCAATATTTGCCCCATGTCATTTATGAGTGGCGAAGAATTGCAACGACATAAACATTTACATCGTGCAGATAAATTTTTTTGTCATAAATATTGTGGTAAACATTTTGATACAATTGCCGAATGTGAATCCCATGAATATATGCAACATGAATATGATAGTTTTGTTTGCAATATGTGTTCAATGACATTTGCCACACGAGAGCAGCTTTATACCCATTTGCCGCAACATAAATTCCAGCAACGTTACGATTGTCCCATTTGTCGTTTGTGGTATCAGACGGCTTTGGAGTTGCATGAGCATCGTTTGGCGGCACCATATTTTTTGCCCACAGGACCGCCACCATCTGTGTCAGCAGCTACTGGATCACATCACAAGACAAACGCCAACAGTTCATCCAGTTCAAGTTCAACATTACCTGCCACGGCGGCATTGAGTTCGCTGCTTCAACAGCGACAGGCAAATGCCGATGGATCGGCTATATTTGCTGCCGCCGCCTCCTCCTCCTCTTCCAAGGGTGAGGTGAATGTAAAGTTGGAACGGAGCTATAGCAATTCGACAAGTGACTCTTCATACGGAATGCATGACATCTCCAACACCAATTATAATAATAATAATAGCAGTAATAATAATGCTTACGGCAGTGATAATTCCATACATGGGTCAGGAGCCATTGGTGGACCCCAAGCTCATTCCTCAACACTGGATGACTCCGAGGATGCTCTGTGCTGTGTACCCATGTGCGGGGTAAGCAAGAGCACAAGTCCCACACTCCAGTTCTTCACATTCCCCAAAGATGATAAATACCTGCATCAATGGCTACACAATTTAAAAATGTTTCATATACCCGCTTCGAGTTATACAAGTTTTCGCATCTGTAGCATGCATTTTCCGAAACGTTGCATCAATCGGTATTCCTTGTGCTATTGGGCAGTGCCCACATTCAATCTGGGTCACGATGATGTAGCCAATTTATATCAAAATCGCGAACTAACGAATACCTTTACCACCGGCGAAGTGGCACGCTGCAGTATGCCACATTGTAATAGCCAGCGGGGTGAGAGTAATCTCAAGTTTTACAATTTTCCCAAGGATATTAAAAGTTTAATCAAATGGTGTCAAAATGCACGTCTGCCTGTTCAGGCCAAGGAGCCGCGTCATTTTTGTAGTCGTCACTTTGAAGAGCGGTGCATTGGTAAATTTCGTTTGAAACCATGGGCAGTACCCACATTGCATCTGGGTGGTGCACAATATGGCAAGATACATGACAATCCCAAGAATTTGTATGTGGAGGAAAAGCGTTGTTGCCTCAATTTTTGTCGCCGAAGTCGTTCGACGGATTTCAATATGTCGCTATATCGTTTTCCAAGGAATGAGGTCTTACTACGACGCTGGTGTTATAATCTACGCCTCGATCCGGCTGTATATCGTGGCAAAAATCATAAAATATGCAGTGCACATTTTATTAAAGAGGCATTGGGTTTGCGTAAATTATCACCAGGCGCTATGAGGAAATGGTGTCATAATTTGAAAATACCCGAAGATAAAATGCACAAGGGAATGCGTATATGTAGTCTACATTTCGAACCATATTGCATTGGCGGTTGCATGCGTCCATTTGCAGTGCCCACTTTGCATTTGGGTCACGATGATACGGATATCCATCGAAATCCTGATGTCATTAAGAAGCTAAACATAAGGGAAACATGCTGTGTGGCAGTCTGTAAAAGGAATCGTGATCGAGATCATGCAAATCTTCATCGTTTCCCCAGCAATGTGGCCCTCTTGACGAAATGGTGTGCCAATCTTCAAAGACCTGTCCCTGATGGCAGTAAACTGTTCAATGATGCCATTTGTGAGGTGCATTTTGAGGATCGTTGTTTGCGTAACAAGAGATTAGAGAAATGGGCAGTGCCCACTCTGATGTTGGGTCATGAGGATATTGCCTATGAATTACCAACATCGGAGCAAGTGGCGGAGTTCTATGCACGTCCACATGCTCCCAATAATGGTGAGGAGCAAGGCGAATGCTGTGTGGAAAGTTGTAAACGTAATCCCAGTGTGGATGATATTAAATTATATCGCCCACCTGAAGAATCCGATGTTCTGGCAAAATGGGCACACAATCTGGAAATTGGTGTGGCCGAGTTACCCAACATGAGAATCTGTAATTTACATTTCGAATCGCATTGCATTGGCAAACGTATGAGACCTTGGGCCATACCAACATTGAATCTATCCTCGAACATTGAGAATCTCTATGAGAATCCAGAGCACTCGATGTTGTACAAGAGGAGAACGAGGCGCGATCCAAATCGAGAGATATCATCCATGACGAAACCCACCTGGGTGCCCAGATGTTGTTTGCCACATTGTCGCAAGGTTCGAGCTCTGCACAATGTTCAGCTTTATCGTTTCCCCAAACTCAATCGTTCCACATTGGCCAAATGGGCACACAATTTGCAAGTGCCCATGGTGGGTAGTGCCCAGAGAAGACTCTGTTCGGCGCATTTCGAACCTCATGTGTTGAGTAAGAAGTGTCCAGTGCCCTTGGCAGTGCCCACCATAGATTTGAATGCTCCTCCTGGTTATAAAATCTATCAGAATCCAGCTAAACTAAAGGCCACCAAATTGTGCCTGCAGAGAGTTTGTATTGTGGAGAGTTGCCGACGCACCAGAGCTCAGGGAGTGCAACTGTTCCGTTTGCCCCATAGCCCTACCCAGTTAAGGAAATGGATGCATAACATCAAGACACGTCCAAGGGCAGCTACAAGGTCTCAGTATCGCATCTGTTCGATACACTTTGAATCGCATTCGTTTAATGGCAAGAGATTGAGTGCCGGAGCTATACCCACTCTAGAATTGGGTCACGACGATGACGATATTTATCCGAACGAGGCTCAAGCTTTTGTCGACGAACACTGCGCGCACTTTGAAGTCGATTGCATTGGCCCGAAACATTTATTCAAATGGGCCATACCCACTCTAGAGCTGGGACACGATGATGCCCAAATTGAACTCATACCTAATCCAAAGCCAGAGGAACGTTATGTAGATCCAGTGTTTAAGTGTTGTGTACCGACTTGTGGCAAGACCAGGAAATTCGATGAAGTGCAAATGAATAGTTTCCCCAAGGATCCGTTACTCTTCCAACGTTGGCGACACAATCTACGGCTAGAGCACTTAATCTTCAAGGAACGCGATCGCTATAAGATCTGCAATGATCATTTTGAAGATGTTTGCATTGGCAAGACACGCCTGAACATTGGTTCCATACCGACCATTAATTTGGGTCACAATGAGACGGAGGATCTCTATCAAGTTGATCCAGCGGAACTGCAAAGTAATCTCTTTGGTCGTCCGCGAAGATTACATGGATCAGTCGATATCAAATTAGAACCAATGGACGATACCGACATGCAGCATGATGTAAAACCAAATCTCAATGCTATGGCCGAAGCTACCGATATCAACACTAGGCAGGTGAAAATTAAGAAATCTCTTGCTGATCTTAAGTGCTGTGTGCGTAGCTGTGGACGCAGTCGCCTGGAGCATGGAGCACGCCTGTTTCCCTTTCCCAGTGGCAAGCAGCAGCAACTTAAATGGCGGCACAATCTTCAGCTGGAACCCGATGAGGTGGACAAACTGACACGGGTCTGCAGTGCCCATTTCAATCGTCGTTGCATTGATGGTAAGCAATTGCGTGCATGGGCCATGCCGACCCAGCAATTGGGACATCATCAGGAGCAGCCCATCTATGAGAATCCCAAGAATATACCGGGTTTCTTTACGCCGACATGTGCTCTGAGTCATTGTAGGAAAAGGCGGAGTATTGATAATGATTTGCGCACCTATCGTTATCCCAGGAGTGAGGATCTATTGGAGAAATGGCGGGCTAATTTACACCTGACTCCAGATCAATGCCGCGGACGGATTTGTGCTGATCACTTTGAGCCTCTGGTTAGGGGCAAATTGAAATTGAAGACGGGAGCAGTGCCTACTCTTAAATTGGGTCATGACGAGGAATTGGTTTATGATAATGAAGCCATTAAGGCTAGCATGGCGGATGAGGAAGAGGGCAGCCTGGAATCATCACCAAAAATAATACCGAAAAAAGAAATTTTCGAAGATGAAGACGACGAGGATGATCCTCATCACGAAGCAGATGCCGGAGACGATGATGAAGAGGAGGACGACGCTCACGAAAATGCTGAGGATCATGAGGATTCACATTCTGATTACTTTGACCCCTTGGAACTGGTTGAGACATATGCAGACGATCCAGTACCAGACGATGAATATACCTCGCCTGCTCCGCATCGACCTCATCATCATCAACATCATCATCATCTACTTCCCCCGCCGCCCCCGTCTATAGGTGTGAGGCGTGAGAAACCAGCGAATAATGTTACACCAATTTGTTGTCTCAGGCATTGCCGCAAGGAACGAACACCCACCCATCAGTTAAGTACTTTTGGCTTTCCCAAAGATCATCAGCTTTTGCTTAAATGGTGTGCCAATCTTCATCTGGAGCCCGTTGATTGTGTGGGACGAGTTTGCATTGAGCATTTCGAAGCGGAAATGTTGGGAACACGAAAACTAAAGCAGAATGCTGTTCCCACCATTAATGTGGGACATCAGATGCCACTGCCCTATACATGCAACGGACAGGAGAGAATCAATGATGATGATGATGACGATAATGGTGATGATGAAGTTGAAGATCACTCGGATTTTCGGCTTTGGAGCCTGAAACATTGTCGCAAGAGGAAGCTAACGGAACCGCCAGACATTCGCCCAAAACTGGAGAAGAACGATGTGATTCCCATGATGATGATGAGTATGGGAGTGAGAGTGAAGAAGGAGAAGATGGAGGATGGGGAGGAGCAGCAGCAGCAGCAACAGATGATGATGACGACGATGAATAAACCAAAGAAGTGTTGCCTTAGTCAATGCGGTAAAATGATGGATTTGCAAAAATTCCCAAGAGATTTTCATTTGCTAAGAAAATGGTTGCACAATCTCAAATTGAGTCTACGCGAGGATTTGGATCCGGCACAACTTCGTGTATGTTTGGAGCACTTTGAGCCACATTTGGTGCGCAATGGCCAACTTGCTCGCGAGGCATTACCCACTTTAAATTTGGGCCATAATGATAAGAATATTTACCAAACAACGGTGGCCACTTCTGGTGGTTGCTTGGTAGCAAGTTGTCCGTGTGCTCGACTTAATCTATACAGAAGTTATGCCTTGCCACAAAATCCCCATGTCAGGGAGGCGTGGCTAACCTATCTGAAACAGCCCCCAACTACCCAAGGACAATTGTGTGTGATGCACTTTATGCAGCTCTACGAGGACATGCCTTTTGAAGAGCTACGACCTATTTACGAGTCCATTGCCAACTCCACACAAGCTCTGAAATTACGTTGTGCCGTACCCGGATGCAACTCAAAGTATACGGATAACATACATTTGACGAAACTGCCACAGAATCAAAATCTTCTCGAGAAATGGTTGCACAATACCATGTTGAACTATGATCCTGGCAAGCATTCGATTTATCGTATATGTCTACTGCATTTCGAACCAGATGCCTTGGGGCCAGCGTGTCCAAAGCCGTGGGCAGTGCCCACTTTGGAATTGAATCATCAGGATGACATTTTCTTCAATCCAACGAAAGAGGAAATAATGCATCTTCACTCCGAGACTCCGTTGCAAATTAAAACCGAACTTACGCTGCCATTGAGAATAAAAACTGAACTGGCTGCTATGAGCAGTCCCAGTCTTGGTTCGTCACCCAGTCCACGGGGCAAGGTGAGAATCTGCTGTATCCAGTCGTGCCTGCAACAGGCCAATTCCCAATTACGTCTCTATCGTTTTCCAAATACGGAGACTGCGCTGCTCAAGTGGCTAGTGAATACACAACAGCATCCACGTCTGGTGGATCCACTGCAATTGTATGTCTGTCAAACGCATTTCGAACCCGAAGCCATTTGTAAGAAACAATTGAGAAGTTGGGCTATTCCCACCTTGAATTTGGGACACGATGGTCATGTTATACCAAATGCCAGGCACAATGGAAACATTGCCGATAGCCAGGAGACGGAACAAGCTATGGAATTCATTAGGGCCAACTATTGTTCGGTACTCACATGTTTCCAGCCAAAGAGTGAGGCTCTGCGTTTGCATCCCTATCCCAAGGATATGCCTACCATACGAAGATGGGCAGCCAATTGCAAGCATCGCTCCATGCAGGCCAGCAGCCATGGTTTTCAGGTCTGTCAGTTGCATTTCGAAACGGATTGCTTCGATCCGGATTCAGGAGACTTGCTGAAAGGAGCTGTGCCCACTCTGGATCTAACAGTTAGTCGGGTTAGCTGCGAATTGCGTTGCCTGGTCGCTGGTTGCATTAAAGATGAATCCCTGCCGCGTCGTCGTTACCACAAACTACCAAAGCGATCAGCTCTGCTCGGTGAATGGTGTGTGAATCTTGGCCTAGATCCAGCTACCCTGCCGCAAAATGTTGAACATAATGTGTGTGAGCGACATTTTGAATCTCGTTGCTTCAATACCGCCAAACAATTGCGACCTGGAGCACGACCAACATTGCATTTAGGGCACACGGAAGATATTAAACTGTTACCCAATCCGGAGATTTTCAGTGATGAAGTCGGTGAGGAAGTCGGCTGTGTCTGCTGTGTGCCAGAATGTGGCGCCTCTCGGGAGTCGGATGAAACACTTCAATTTAGCAGTTTTCCCAAAATGAGAAAACTCTCGGATAAGTGGATATATAATTTACATCTTCCATTCGTTGGCCGGGATCAATTGGCCAAACTTCGTGTGTGTCATAGGCACTTTGAGGCATCTTGTTTCGAAAATGGCCATTTAAGACAGGTAGCCATGCCCACTTTGGAGTTGGGTCACCAGGATACGGACATTTATCAAACTGATGACCCGAATCTGGGCAAAAATCGCAAATCTAATAAGGTGTTGCCTGGCGTAAGGATTACAGGACTTGATTGCTGTTATCCTCAATGCATACAACTGCAGAAGAATTACCAACGGGTGGTCCACGATTTGCCCAAAGAGGAGAAGCTACGTCGCAGATGGCTGCAGCATTTGGAAATCGAAGACACTGAGGAGAGACCCTTGAAATTGTGTCCTCTACATTTTATCATTGTATATGATTATAGTCAGGATAATTTTAAGGAACATGTTGCGGATGATGTGCTCGAAAGAAACTATGAAGATGCCCGAAATGGTTCGAGAATTCGTCTTATTACGTGTGCGGTGCGAGGATGTGGAACACTCCAGCCTCGTGATGGTGGTAGATTACATGGTCTGCCCACAAATCCCGAGGTCTTCCAAATGTGGTTGGAGAACACCGAATTGGTCATCTATGAGCCGCAGCGTTATATGATCAAAGTGTGTAGCAAACACTTTGAACCGCAATGCTTTACCGATATACGCAAATTGAAATGCTGGAGTGTGCCCACACTCCATCTGCCCGGTGAGGTTGTGCATCAAAATCCCACCGAGGAGGAATGGCAAAAGTTGAACGAAAAATTGGCCGCTGTCCCCGCCATTCAGGCAAGAGAAGATTGCGATGAGAGTTCAATGCTTGAACCCGTGGTCGTCATGGAAGAGAACAGTGTGTGTTGTGTTCCCGATTGTGGACGATCCAAGCAGACGGATGAGTCTATACAATTTACAAGTTTCCCCAAGAGGCAAGTGCTATGCGAGAAATGGTTGTATAACTTCCGTTTGAAAGTCCCCAATGATCAATGGGCCAATCTTCGGGTATGTTATCGTCACTTTGAGCCATCTTGTTTCGAGAACGGACGCATACGCATTCGCTATGCCATGCCCACTTTGGAGCTGGGTCACGAGAACAGCGATATCTATCACACAGAGGAACCAGATTTTCACAAGATACGCAAACCGACCAAGCAAAGAACCGGTGCCCAGGATTGCTCTTATCCTCAGTGTGTGGAGCTGTTGAAGAATTTCCAAAGGATGGTCTATAATTTGCCAAAAGAGCCTCAACTACGACAAAGCTGGCTCGAGTATATGGAATTAAAGGAGACAGGGCAACCATTGAAATTGTGCCCACTCCACTATATAATCCTGTATGATCATAGTGTGAAACATTTCGAGGCACATGCTCCGGAAAAATTGCTTGATTTCAACTATGAGAGTGCAAGGAATTGCGTACGTATACGTATAATTAGCTGTTCGGTTCAAGGATGTAATACACTCCAGCCACGCGATGGTGGACGAATGCATGGTCTGCCACCGAGATCGGATATCCTGCAAATGTGGCTGGATAACACGAGATTGCCATTCCATGAGCATCAGCGTTATATGCTTAAAGTGTGCAGCAAACACTTTGAGCCCAAATGTTTCACTGACATACGCAAATTGAAGAGCTGGAGTATACCGACTCTTCATCTACCCGATGAGCCAGTGCATCAGAATCTCACGGAAAAGGAATGGCAACAGATGAATGAGAGATTTGCCGAGGCCAATAATCGAGAGGCGGAAAGTTTCGATGAAAATTCAATGCTGGAACCCATTGTTATGATGGAACATGCCGAATCTGATGGTGAAATACATGACAAAGTGGTGGAGGAGGAGCAGCAAGAGAACAACACGCAAACTCTCCACACTGAACTGGTTACCAATGAACAACATTTGCAAGAAGATTCCCAAGATATTGGGGATGAGGACGAAATGCAGGCATTGGAAGTTCTACTTGAAGTGGGCCATGTGGAAAAATGTTCCAGCTATGAGAAAATGGACAACAACAAATCGCATTTATCTTACTCCGAGACGGGGCCATTGAGTCCGTCGTTAGCATCTGTGCTTCCAGGACAACGTGGTGGCGGTTATGGCGGAGGTGGTGGTAATTATAATGCCCGGCATTGCAGTGTCCAAGGTTGTCAGATAACTGCCAACGATGTGGACGGCAATATCAAGCTACACAAGTTCCCCACCTCCTTGGAGGCAACCCAGAAATGGATGCACAACACCCAAGTCGATGTGGATGAGAACTATTCGTGGCGCTATCGCATTTGTAGTTATCATTTCGAACAGGATTGCTTTAATGGGGCACGCATACGTAGAGGATCAATGCCCACCTTGCATTTGGGTCCACTGCGGCCAAAGGATATCTATAAGAATGAATTCCCGCAAATGGATATGGATGAAACTGGTCCAACAGAAGCGACTAACTCATCTTTACCTGGGGCCGATGAGGATGAACGAGTTGTGCCGCATATAAAAGGACGTGTGACACAGCTATGCCTGCCACGCCCTGCTCCGCCACGGAAATCCAGTAAATACTGTCAAATCGAAGGCTGCTCGAATCACTTGACCAGTGAGAATATGACGCTTCACAAGTTTCCTCATTCACTGGAGATGTGTGCCCGTTGGCAGCATAATACCCAGGTGCCATTTGATCCGGAGTATCGTTGGCGTTATCGTATATGTAGTATACATTTCCATCCGGCTTGTTTGGTCAATATGCGTCTGGTCCATGGCAGTGTGCCTACACGCAAACTTGGTCCTCGAGCGCCAGCCCAATTGTTTGACAATGATTTCGAGGCTATCAATATGCGTTTGGACAAGAGATCGCAATTGGAGCAGGGTACACGGATCAAGCAGGAAAAGCCGCAGCCCCAACAGCAACAACAACAACAGACAGAGGGATTACATTTAGAGCCAGAAATGGAAATGGAAGTAGATGAGGATGAGGACGATGAACAAGATCAAGATCAATCACAGTCGATGACATCTTTTGACAGCTGGAGGCATCAGCTGCGTCTACCGGCAGTTAAACCTGAAAAGACACCGTATAATCCCATTAAATCTGGTTACGACAAATGCTCTCTACCCCATTGCCAGCGTCAGAGATCTCAGCATGGTGTTCATATATATAAATTCCCAAAATCGAGACGTCATCAGCAACGTTGGATGCATAATTTACGGATACGCTATGACGAGCGTAAGCCATGGAAATACATGATCTGTAGTGTACACTTTGAGCCGAATTGTATACGCCTAAGGAAACTACGGCCATGGGCAGTGCCCACATTGGAATTGGGTAAGAATGTGGCAGATCAAATCTATACCAATGAACAGTGCCAAGAAATGGCCTCAGATGTGAGCGAGGAAGAGGAAGAGGAGGAAAGTGGCCACGAAGAGAGCCTGCAGGAAGATGACGACGATGAAGCTGATCTAGATGGAGATACTGCTGGTGTAGAGACGCACGTAAAGCGTGAAAGACGTCCTTGGGGATCGGGTGCAGCTGCTGGTGGTGGTCAAATGGCTCCTTGGAAAGTCAAACAATGCTGTCTACCCTATTGCCGAAGACCGCGTGGAGATGGCATCAAACTCTTTCGCCTGCCCAGCAATCCGAATTCGATAAGGAATTGGGAAAAGGCCACTGGGATGACATTTAAAGCCTCACAGCGTAATACTCGCCTGATCTGTAGTCGTCACTTTGAGCCCGAATTGATGGGAGTACGCCGCCTGATGCGGAATGCCATACCCACAAGGCATTTGTATCATCAGAGGGAGAGCTACAGCCCCGAATTGGTAATACCCACAGATACACCTGCACCCATTGGTCCCACATGCTGTATTCCTGATTGTCCAGCGCAAGATGGATCCGCCCAACTTCATCGATTTCCTAGTGATCCACAACTGCTGCAGCAATGGTGCGAATCACTGAAACTAGGGGATCCCCAGCAGTATAGCGAACAATATGTTTGCTCTAATCACTTACCCGGACAGGAAGCAACATCGGGATGCATTGTCTGTGGCGCTGAGGATGGGCAATTGCCGCTTCTGGACTTTCCCGAGAATCGCAATCATCGAGCCAAATGGTGTTATAATCTCAAAATTGATACCATACCCAAATGGGACAACTCCAAGCAAATATGCTCGAAACATTTCGAATCCTATTGCTTTAACCAGCAAACCGGTGAACTGAATCCGGAGGCAGCGCCCACATTGCATTTAAATCACAATGATTCGAATATATTTCTCAATGATTATGCCATAGATCAGCACTCCATGATGCGTATTAAGGATGAGCCCTTGGACAATGATGAAATGTTATTGGCCTGA
Protein Sequence: MSQHNPHYHHPHPHPLXXXXXXXXXXXXXXXXXXXXXXXXXXXXIQHNQWYSHVASTSSTTPYPHHSSSAGASSSAAGATTSGSNNNHIMNAYGTHGYYGAAGGGLNVNAVGVAAPSGSTEMRIKSEPMDELAYKSSNYIDDNTPFADFTKYNEFNENMLSPKVEMSVKNESTPYSKNSNNYPRRKLQTERSSENLPICQRCKEVFFKKQSYLRHVAESSCNIHEYEFKCNICPMSFMSGEELQRHKHLHRADKFFCHKYCGKHFDTIAECESHEYMQHEYDSFVCNMCSMTFATREQLYTHLPQHKFQQRYDCPICRLWYQTALELHEHRLAAPYFLPTGPPPSVSAATGSHHKTNANSSSSSSSTLPATAALSSLLQQRQANADGSAIFAAAASSSSSKGEVNVKLERSYSNSTSDSSYGMHDISNTNYNNNNSSNNNAYGSDNSIHGSGAIGGPQAHSSTLDDSEDALCCVPMCGVSKSTSPTLQFFTFPKDDKYLHQWLHNLKMFHIPASSYTSFRICSMHFPKRCINRYSLCYWAVPTFNLGHDDVANLYQNRELTNTFTTGEVARCSMPHCNSQRGESNLKFYNFPKDIKSLIKWCQNARLPVQAKEPRHFCSRHFEERCIGKFRLKPWAVPTLHLGGAQYGKIHDNPKNLYVEEKRCCLNFCRRSRSTDFNMSLYRFPRNEVLLRRWCYNLRLDPAVYRGKNHKICSAHFIKEALGLRKLSPGAMRKWCHNLKIPEDKMHKGMRICSLHFEPYCIGGCMRPFAVPTLHLGHDDTDIHRNPDVIKKLNIRETCCVAVCKRNRDRDHANLHRFPSNVALLTKWCANLQRPVPDGSKLFNDAICEVHFEDRCLRNKRLEKWAVPTLMLGHEDIAYELPTSEQVAEFYARPHAPNNGEEQGECCVESCKRNPSVDDIKLYRPPEESDVLAKWAHNLEIGVAELPNMRICNLHFESHCIGKRMRPWAIPTLNLSSNIENLYENPEHSMLYKRRTRRDPNREISSMTKPTWVPRCCLPHCRKVRALHNVQLYRFPKLNRSTLAKWAHNLQVPMVGSAQRRLCSAHFEPHVLSKKCPVPLAVPTIDLNAPPGYKIYQNPAKLKATKLCLQRVCIVESCRRTRAQGVQLFRLPHSPTQLRKWMHNIKTRPRAATRSQYRICSIHFESHSFNGKRLSAGAIPTLELGHDDDDIYPNEAQAFVDEHCAHFEVDCIGPKHLFKWAIPTLELGHDDAQIELIPNPKPEERYVDPVFKCCVPTCGKTRKFDEVQMNSFPKDPLLFQRWRHNLRLEHLIFKERDRYKICNDHFEDVCIGKTRLNIGSIPTINLGHNETEDLYQVDPAELQSNLFGRPRRLHGSVDIKLEPMDDTDMQHDVKPNLNAMAEATDINTRQVKIKKSLADLKCCVRSCGRSRLEHGARLFPFPSGKQQQLKWRHNLQLEPDEVDKLTRVCSAHFNRRCIDGKQLRAWAMPTQQLGHHQEQPIYENPKNIPGFFTPTCALSHCRKRRSIDNDLRTYRYPRSEDLLEKWRANLHLTPDQCRGRICADHFEPLVRGKLKLKTGAVPTLKLGHDEELVYDNEAIKASMADEEEGSLESSPKIIPKKEIFEDEDDEDDPHHEADAGDDDEEEDDAHENAEDHEDSHSDYFDPLELVETYADDPVPDDEYTSPAPHRPHHHQHHHHLLPPPPPSIGVRREKPANNVTPICCLRHCRKERTPTHQLSTFGFPKDHQLLLKWCANLHLEPVDCVGRVCIEHFEAEMLGTRKLKQNAVPTINVGHQMPLPYTCNGQERINDDDDDDNGDDEVEDHSDFRLWSLKHCRKRKLTEPPDIRPKLEKNDVIPMMMMSMGVRVKKEKMEDGEEQQQQQQMMMTTMNKPKKCCLSQCGKMMDLQKFPRDFHLLRKWLHNLKLSLREDLDPAQLRVCLEHFEPHLVRNGQLAREALPTLNLGHNDKNIYQTTVATSGGCLVASCPCARLNLYRSYALPQNPHVREAWLTYLKQPPTTQGQLCVMHFMQLYEDMPFEELRPIYESIANSTQALKLRCAVPGCNSKYTDNIHLTKLPQNQNLLEKWLHNTMLNYDPGKHSIYRICLLHFEPDALGPACPKPWAVPTLELNHQDDIFFNPTKEEIMHLHSETPLQIKTELTLPLRIKTELAAMSSPSLGSSPSPRGKVRICCIQSCLQQANSQLRLYRFPNTETALLKWLVNTQQHPRLVDPLQLYVCQTHFEPEAICKKQLRSWAIPTLNLGHDGHVIPNARHNGNIADSQETEQAMEFIRANYCSVLTCFQPKSEALRLHPYPKDMPTIRRWAANCKHRSMQASSHGFQVCQLHFETDCFDPDSGDLLKGAVPTLDLTVSRVSCELRCLVAGCIKDESLPRRRYHKLPKRSALLGEWCVNLGLDPATLPQNVEHNVCERHFESRCFNTAKQLRPGARPTLHLGHTEDIKLLPNPEIFSDEVGEEVGCVCCVPECGASRESDETLQFSSFPKMRKLSDKWIYNLHLPFVGRDQLAKLRVCHRHFEASCFENGHLRQVAMPTLELGHQDTDIYQTDDPNLGKNRKSNKVLPGVRITGLDCCYPQCIQLQKNYQRVVHDLPKEEKLRRRWLQHLEIEDTEERPLKLCPLHFIIVYDYSQDNFKEHVADDVLERNYEDARNGSRIRLITCAVRGCGTLQPRDGGRLHGLPTNPEVFQMWLENTELVIYEPQRYMIKVCSKHFEPQCFTDIRKLKCWSVPTLHLPGEVVHQNPTEEEWQKLNEKLAAVPAIQAREDCDESSMLEPVVVMEENSVCCVPDCGRSKQTDESIQFTSFPKRQVLCEKWLYNFRLKVPNDQWANLRVCYRHFEPSCFENGRIRIRYAMPTLELGHENSDIYHTEEPDFHKIRKPTKQRTGAQDCSYPQCVELLKNFQRMVYNLPKEPQLRQSWLEYMELKETGQPLKLCPLHYIILYDHSVKHFEAHAPEKLLDFNYESARNCVRIRIISCSVQGCNTLQPRDGGRMHGLPPRSDILQMWLDNTRLPFHEHQRYMLKVCSKHFEPKCFTDIRKLKSWSIPTLHLPDEPVHQNLTEKEWQQMNERFAEANNREAESFDENSMLEPIVMMEHAESDGEIHDKVVEEEQQENNTQTLHTELVTNEQHLQEDSQDIGDEDEMQALEVLLEVGHVEKCSSYEKMDNNKSHLSYSETGPLSPSLASVLPGQRGGGYGGGGGNYNARHCSVQGCQITANDVDGNIKLHKFPTSLEATQKWMHNTQVDVDENYSWRYRICSYHFEQDCFNGARIRRGSMPTLHLGPLRPKDIYKNEFPQMDMDETGPTEATNSSLPGADEDERVVPHIKGRVTQLCLPRPAPPRKSSKYCQIEGCSNHLTSENMTLHKFPHSLEMCARWQHNTQVPFDPEYRWRYRICSIHFHPACLVNMRLVHGSVPTRKLGPRAPAQLFDNDFEAINMRLDKRSQLEQGTRIKQEKPQPQQQQQQQTEGLHLEPEMEMEVDEDEDDEQDQDQSQSMTSFDSWRHQLRLPAVKPEKTPYNPIKSGYDKCSLPHCQRQRSQHGVHIYKFPKSRRHQQRWMHNLRIRYDERKPWKYMICSVHFEPNCIRLRKLRPWAVPTLELGKNVADQIYTNEQCQEMASDVSEEEEEEESGHEESLQEDDDDEADLDGDTAGVETHVKRERRPWGSGAAAGGGQMAPWKVKQCCLPYCRRPRGDGIKLFRLPSNPNSIRNWEKATGMTFKASQRNTRLICSRHFEPELMGVRRLMRNAIPTRHLYHQRESYSPELVIPTDTPAPIGPTCCIPDCPAQDGSAQLHRFPSDPQLLQQWCESLKLGDPQQYSEQYVCSNHLPGQEATSGCIVCGAEDGQLPLLDFPENRNHRAKWCYNLKIDTIPKWDNSKQICSKHFESYCFNQQTGELNPEAAPTLHLNHNDSNIFLNDYAIDQHSMMRIKDEPLDNDEMLLA

Similar Transcription Factors

Sequence clustering based on sequence similarity using MMseqs2

100% Identity: iTF_00604131;
90% Identity: iTF_00503302;
80% Identity: -