Basic Information

Insect: Drosophila littoralis
Gene Symbol: GA10450_1
Assembly: GCA_018903485.1
Location: JAEIGF010000059.1:5046290-5062243[+]

Transcription Factor Domain

TF Family: THAP
Domain: THAP domain
PFAM: PF05485
TF Group: Zinc-Coordinating Group
Description: The THAP domain is a putative DNA-binding domain (DBD) and probably also binds a zinc ion. It features the conserved C2CH architecture (consensus sequence: Cys - 2-4 residues - Cys - 35-50 residues - Cys - 2 residues - His). Other universal features include the location of the domain at the N-termini of proteins, its size of about 90 residues, a C-terminal AVPTIF box and several other conserved residues. Orthologues of the human THAP domain have been identified in other vertebrates and probably worms and flies, but not in other eukaryotes or any prokaryotes [1].
Hmmscan Out: # of c-Evalue i-Evalue score bias hmm coord from hmm coord to ali coord from ali coord to env coord from env coord to acc

1 29 3.4 4.7e+03 -1.8 2.4 49 63 529 547 510 562 0.55

2 29 5.8e-15 8.1e-12 45.5 4.3 1 86 755 827 755 828 0.85

3 29 3.6e-15 5e-12 46.2 4.6 1 87 855 924 855 924 0.83

4 29 8.7e-16 1.2e-12 48.2 0.4 1 87 946 1018 946 1018 0.85

5 29 7.7e-16 1.1e-12 48.3 5.7 1 87 1115 1185 1115 1185 0.83

6 29 8.1e-15 1.1e-11 45.1 3.3 1 86 1209 1280 1209 1281 0.82

7 29 7.4e-13 1e-09 38.8 0.9 1 87 1316 1384 1316 1384 0.80

8 29 1.1e-10 1.5e-07 31.8 1.2 1 86 1433 1502 1433 1503 0.76

9 29 5.1e-15 7.2e-12 45.7 0.1 1 86 1530 1599 1530 1600 0.81

10 29 7.4e-14 1e-10 42.0 0.9 1 86 1621 1690 1621 1691 0.81

11 29 9.3e-15 1.3e-11 44.9 1.8 1 86 1702 1773 1702 1774 0.86

12 29 2.1e-13 3e-10 40.5 1.4 1 85 1846 1914 1846 1916 0.82

13 29 1.1e-12 1.6e-09 38.2 0.1 1 86 1939 2007 1939 2008 0.81

14 29 3.9e-14 5.4e-11 42.9 0.7 1 87 2168 2237 2168 2237 0.80

15 29 3e-11 4.3e-08 33.6 0.0 1 62 2292 2351 2292 2369 0.78

16 29 0.0026 3.6 8.2 0.0 1 58 2373 2423 2373 2447 0.81

17 29 5.5e-13 7.8e-10 39.2 1.8 1 87 2462 2532 2462 2532 0.86

18 29 3.4e-14 4.7e-11 43.1 1.1 1 86 2591 2660 2591 2661 0.82

19 29 7.5e-13 1.1e-09 38.8 0.6 1 86 2696 2767 2696 2768 0.81

20 29 1.4e-12 2e-09 37.9 1.8 1 87 2778 2849 2778 2849 0.82

21 29 5.6e-13 7.8e-10 39.2 0.0 1 86 2872 2942 2872 2943 0.81

22 29 0.00018 0.26 11.9 0.1 1 58 2974 3024 2974 3048 0.81

23 29 2.6e-15 3.6e-12 46.7 0.4 1 86 3063 3135 3063 3136 0.80

24 29 8.4e-14 1.2e-10 41.8 0.2 1 86 3276 3348 3276 3349 0.84

25 29 3.4e-14 4.8e-11 43.1 1.5 1 86 3410 3480 3410 3481 0.82

26 29 4.4e-14 6.2e-11 42.7 4.5 1 86 3593 3663 3593 3664 0.85

27 29 3.4e-13 4.8e-10 39.9 0.0 1 87 3755 3825 3755 3825 0.85

28 29 1.3e-09 1.9e-06 28.4 1.2 1 58 3842 3890 3842 3908 0.85

29 29 3.7e-08 5.2e-05 23.7 2.4 19 87 3908 3965 3896 3965 0.76

#	of	c-Evalue	i-Evalue	score	bias	hmm coord from	hmm coord to	ali coord from	ali coord to	env coord from	env coord to	acc
1	29	3.4	4.7e+03	-1.8	2.4	49	63	529	547	510	562	0.55
2	29	5.8e-15	8.1e-12	45.5	4.3	1	86	755	827	755	828	0.85
3	29	3.6e-15	5e-12	46.2	4.6	1	87	855	924	855	924	0.83
4	29	8.7e-16	1.2e-12	48.2	0.4	1	87	946	1018	946	1018	0.85
5	29	7.7e-16	1.1e-12	48.3	5.7	1	87	1115	1185	1115	1185	0.83
6	29	8.1e-15	1.1e-11	45.1	3.3	1	86	1209	1280	1209	1281	0.82
7	29	7.4e-13	1e-09	38.8	0.9	1	87	1316	1384	1316	1384	0.80
8	29	1.1e-10	1.5e-07	31.8	1.2	1	86	1433	1502	1433	1503	0.76
9	29	5.1e-15	7.2e-12	45.7	0.1	1	86	1530	1599	1530	1600	0.81
10	29	7.4e-14	1e-10	42.0	0.9	1	86	1621	1690	1621	1691	0.81
11	29	9.3e-15	1.3e-11	44.9	1.8	1	86	1702	1773	1702	1774	0.86
12	29	2.1e-13	3e-10	40.5	1.4	1	85	1846	1914	1846	1916	0.82
13	29	1.1e-12	1.6e-09	38.2	0.1	1	86	1939	2007	1939	2008	0.81
14	29	3.9e-14	5.4e-11	42.9	0.7	1	87	2168	2237	2168	2237	0.80
15	29	3e-11	4.3e-08	33.6	0.0	1	62	2292	2351	2292	2369	0.78
16	29	0.0026	3.6	8.2	0.0	1	58	2373	2423	2373	2447	0.81
17	29	5.5e-13	7.8e-10	39.2	1.8	1	87	2462	2532	2462	2532	0.86
18	29	3.4e-14	4.7e-11	43.1	1.1	1	86	2591	2660	2591	2661	0.82
19	29	7.5e-13	1.1e-09	38.8	0.6	1	86	2696	2767	2696	2768	0.81
20	29	1.4e-12	2e-09	37.9	1.8	1	87	2778	2849	2778	2849	0.82
21	29	5.6e-13	7.8e-10	39.2	0.0	1	86	2872	2942	2872	2943	0.81
22	29	0.00018	0.26	11.9	0.1	1	58	2974	3024	2974	3048	0.81
23	29	2.6e-15	3.6e-12	46.7	0.4	1	86	3063	3135	3063	3136	0.80
24	29	8.4e-14	1.2e-10	41.8	0.2	1	86	3276	3348	3276	3349	0.84
25	29	3.4e-14	4.8e-11	43.1	1.5	1	86	3410	3480	3410	3481	0.82
26	29	4.4e-14	6.2e-11	42.7	4.5	1	86	3593	3663	3593	3664	0.85
27	29	3.4e-13	4.8e-10	39.9	0.0	1	87	3755	3825	3755	3825	0.85
28	29	1.3e-09	1.9e-06	28.4	1.2	1	58	3842	3890	3842	3908	0.85
29	29	3.7e-08	5.2e-05	23.7	2.4	19	87	3908	3965	3896	3965	0.76

Sequence Information

Coding Sequence: ATGGTGCAGTTATTTAAATTCCTATTAAAATCCACAAAATCGCCTGCGCGCGCCCACTTTCGTTCCAACTTCCTGGACACGTTGCGTTTGACGGTGCGCGGTGGCCATGGCGGCAATGGCTTACCCAAATACGGCGGCGTCGGTGGCCAGGGCGGCTGTGTCTACTTTGTGGCCAAGGAAGGGCTGACGTTGCGCAAGGTGGCACAGAACCTAAGGGATAAACGCGTGCAGGCCACCAGCGGCGAAGATAGCAGCAAAGTGAGCATCTTTGGTCGACGCGGCGTGGATCAACGCATTGAGGTGCCGCTGGGTGTGCAGGTGTACGATGAGCAGCAAAAGCTGCTGGCCGATCTGAATGAGCACGAGGCCAGCTGCATTGTGGCAGGCGGCGGCACAGGTGGCTGCACGGGCAACAATTTCCTGGGACGGCCTGGCGAGAGTCGCACAGTGCATCTGGATCTCAAGCTGATAGCGGATGTGGGCCTGGTGGGTTTTCCCAATGCCGGCAAGAGCACGCTGCTAAAAGCCATTTCCAATGCCAAGCCCAAGATTGCCGCCTATCCGTTTACCACAATACGCCCGCAAATCGGCACCGTTGAATACAGCGATCTGCGCTCCATTAGCATCGCCGATCTGCCAGGTCTGATAGAAGGCGCCCATGCCAACTTTGGTATGGGCCACAAGTTCTTAAAGCACATCGAACGCACACGTTTGCTGCTGTTCATGGTGGATATATTTGGCTTTCAGCTGAGTCCGCGTCATCCGCATCGGGACTGCCTGAGCAACATTTATGCCCTGAACAAGGAACTAGAGCTGTACGATCCCACGCTGCTGGAGAAGCCCTGCGTGCTGCTGCTCAACAAAATGGACAAGGAGGGCGCCCAGCAGATCCTACAAAATCTAAAGCCAAGCATTAAAGATCTCTCCAACGGTCTAGCCGCGTGTCCTGAGGAACTGCGCCCCAGCAGAGTACTCAAATTCGAGCACATTCTGCCCATATCAGCCAAAAACTCGGCGCGCATAACGCAAGTAAAGCAACAGCTGCGCGAAACGCTAGACGAGCTGGCGGAACAGCATCTGGTAGCAGATAATCAGCAGCTGAAAGAGCAGCTGCAGCAACGAGTAGGCAATCCAATGGCCCCGCCACCAGCGCCCGCCGTAAACCGTCACACGCTCGATGCCAGCGGTGAAATGATAATAAAATCGGAACCCATTGACGAACATGCGTTCAAGTCCAACTATATCGATGACAACACGCCCTTTGCCGATTTTAGTAAATTTACCGAATTTGCCGACGACATGCTAAGCCCCAAGGTTGAGCTATCGGTTAAGGACGAGGCTTATGGCAGCCAAAAGAACCCGCTCAGCTATCCGCGCCGCAAGCTGCAAACTGAGCGCCCATCGGAGAGTCTGCCCATTTGCCAACGCTGCAAGGAGGTCTTCTTCAAGAAGCAGGTCTATCTGCGTCATGTGGCCGAGAGCAGCTGCAGCATACACGAGTATGACTTTAAGTGCAACATCTGCCCTATGTCCTTCATGGGCGCTGAGGAGCTGCAGAAGCACAAGCAACTGCATCGCGCGGATAAGTTCTTTTGCCACAAATACTGTGGCAAGCACTTTGACAACATTGCCGAATGCGAGTCGCATGAGTATATGCAGCATGAATACGATAGCTTTGTGTGCAATATGTGCTCTGTAACGTTTTCAACGCGGGAACAGCTTTATGCTCATCTGCCGCAGCACAAGTTTCAGCAGCGTTACGATTGCCCTATTTGCCGCTTGTGGTATCAAACGGCACTAGAGTTGCACGAGCATCGACTGGCGGCGCCCTACTTTTGTGGCANNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNTAGAAATGACAGCACCGCACCACAAGACAAATGCCTTGCCTGCAACGGCGGCGCTTAGTTCCTTGCTGCAGCAGCGCCAGGCGAATGCTGATGGTGCCGCGCTATATGCCTCGACGTTGAAGAGCGAGGCTAATGTCAAGTTGGAGCGCAGCTATAGCAACTCCACCAGCGAGTCTGGTTACAGTCTGCACGAGAGTAGTTATAATAATGCCTACGGCAGCGATAATTCGTTGCATGGTGGCAGCGCACCAATTGGTGGTCCGCAGGCACACTCCTCCACGCTGGACGAATCGGAGGATGCGCTGTGCTGTGTGCCGCTGTGCGGTGTGCGCAAAAGCACCAGCCCCACGCTGCAGTTCTTTACGTTTCCCAAGGATGAAAAGTATCTGCACCAGTGGCTGCACAATCTCAAAATGTTCCATATTCCGGCCTCAAGCTATGCCAGCTTTCGTATCTGCAGTATGCATTTTCCTAAGCGATGCATTAATCGTTATTCGTTGTGTTATTGGGCGGTGCCCACATTCAACCTGGGTCACGATGATGTAGCCAATCTGTATCAGAATCGCGAGCTGACTAACACATTTACCACAGGCGAGGTGGCGCGCTGCAGCATGCCCAATTGCACCAGCCAACGCGGCGAGAGCAATCTCAAGTTTTATAATTTTCCCAAGGACATCAAGAGCCTGATCAAGTGGTGCCAAAATGCACGTTTACCCGTCCAGGCCAAGGAGCCGCGTCATTTTTGCAGTCGCCATTTCGAGGAGCGCTGCATTGGCAAGTTCCGGCTGAAGCCCTGGGCTGTGCCCACTCTACATCTGGGCGCCCAGTACGGCAAGATTCATGACAATCCCAAGAACCTGTATGTGGAAGAGAAACGCTGCTGCCTTAACTTTTGCCGTCGCAGTCGTTCGTCGGACTTTAACATGTCATTGTATCGCTTTCCCAGAGATGAAGTACTGCTGCGACGCTGGTGCTATAATCTGCGCCTCGATCCGGCTGTCTATCGCGGCAAGAACCACAAAATTTGCAGCGCTCACTTCATCAAGGAAGCCCTCGGATTGCGCAAACTGTCACCAGGCGCTGTGCCCACACTGCATCTGGGCCACAATGACACCTTCAACATCTACGAGAACGAACTGTGGCCACCACCGACGCCCTCTACGCCCACCNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNGCCTCTCACTATGTGGATCCAGAGCTGAGTGCCTCCTACATGGGCATGAGCGCTTCATCCTCTGGCCTGAATGTCAGCGACAGCATGGACGTGTGCTGTGTGCCCAGCTGCGAGAGCAAACGGCACAACAATGAGAACATCACATTCCATACAATACCCAGACGACCAGAGCAGATGCGTAAATGGTGCCACAATCTGAAGATACCCGAGGACAAGATGCACAAGGGCATGCGGATATGCAGTCTACACTTTGAACCTTACTGCATTGGCGGCTGTATGCGACCGTTCGCGGTGCCCACTTTGCATCTGGGCCACGATGACGAAGACATTCATCGTAATCCGGATGTGATTAAGAAGCTGAACATACGCGAAACCTGTTGCGTTGCCGTTTGCAAGCGCAATCGAGATCGAGATCATGCCAATCTCCATCGTTTCCCCAGCAATGTCGCCCTGCTGACCAAGTGGTGCGCCAATCTGCAGCGACCCGTACCGGATGGCACCAAACTTTTCAATGATGCCATCTGCGAGGTGCACTTCGAGGATCGCTGTCTGCGCAACAAGCGGCTGGAGAAGTGGGCAGTGCCCACGCTTGTGCTGGGCCACGAGAATATTGCCTATCCGCTGCCCACGCCCGAGCAGGTGGCCGAGTCCTATGCGCGTCCCAGTGCGCCCAACAATGGCGAGGAGCAGGGTGAATGCTGCGTGGAGACCTGTAAGCGTAATCCTAGCGTAGATGACATAAAGCTCTATCGTCCGCCCGAAGAATCACAGGTGCTTGCCAAATGGGCGCACAATCTGCAGCTGGACATTGCCCAGCTTCCTAGCATGCGAATCTGTAATCTGCACTTTGAATCCCACTGCATTGGCAAACGCATGCGACCCTGGGCCATACCCACCCTCAATTTGGCCAGCAACATTGAGAATCTCTTCGAGAATCCCGAACACCAGATGCTCTACAAGCGTCGCACGCATCTCAACGCGGACAGAGCCGCTGCCCGCAGCGCTGGCGCTGACGGAGCCACCATGAAGGCCTCTTGGGTGCCACGTTGTTGCCTGCCGCACTGCCGCAAGGTGCGTGCTCTGCACAATGTCCAGCTGTATCGCTTCCCCAAGGTCAATCGCACAACGTTGGCTAAATGGGCGCATAATCTACAAGTGCCGCTGGTCGGCAGCGCCCAAAGGCGTTTATGCTCCGCCCACTTTGAACCGAATGTGCTGAGCAAGAAATGCCCGGTGCCGTTGGCGGTGCCCACGCTAGATCTCAATACGCCGCCGGGCTACAAGATTTACCAAAACCCAGCCAAGGTGAGGGCTAACAAGCTGTGTTGGCAGCGCGTCTGCATTGTGGAGAGCTGCCGTCGACAGCGGGCACAGGGCGTACAGCTATTCCGGCTGCCGCACAGTCGCACCCAGTTGCGCAAGTGGATGCACAATCTTCGCATGCTGCCGAGAGGCGCCATGCGGCAACAGTATCGCATCTGCTCGCTGCATTTTGAGGCGCACTCTTTTAACGGCAAGCGTCTGAGCACAGGCGCAATTCCAACGCTGGAACTGGGCCATCAGGATGACGATATTTATCCCAATGAGGCGCAGTCGTTTGTCGAGGAACACTGCGCCGTAGAGGGCTGCGATGCGTCCAAGGAGCAGCCGGATGTGCGTCTCTTCCGCTTTCCCAACGACGACGAGGATCTGCTCTGGAAGTGGTGCAACAATCTTAAAATGAATCCCGTTGACTGCTATGGCATGCGCATCTGCAACAGGCACTTCGAGCCGGACTGCATTGGGCCCAAACACCTGTACAAGTGGGCCATACCCACTTTGCCGGAGGAACGCTATGGTGATCCTGTCTTCAAGTGCTGTGTGCCCACCTGCGGCAAAACGCGCAAATTTGATGAGGCGCAAATGAATAGCTTTCCCAAGGACCCATCGCTCTTCCAGCGCTGGCGACACAATCTGCGGTTGGAACATCTCAACTTCAAGGAGCGCGAGCGCTACAAGATATGCAATGCGCATTTTGAGGACATTTGCATTGGCAAGACGCGTCTCAATATTGGCTCCATACCCACGCTGGAGCTGGGCCATGAAGAGACCGAAGATCTGTATCAGGTTAATCCCGAGGAGCTGCAGAGCAACTTGTTTGGCCGGCCCCGACGTGTGCATGAGAATCAGCGACTGAGCATCAAGCAGGAGCTGGATGAGGACATCAAGCCGGACATAACCATGTCAGAGGCCACGGATACAAACACAACACAGGTGAAGATCAAGAAATCTGTGTTGGACTTGAAGTGCTGCGTGCCCAGCTGCGGTCGCAGCCGGCTGGAGCATGGTGCTCGCCTGTTTCCCTTTCCCACTGGCAAGCAGCAGCAGACCAAGTGGCGCCACAATCTCCGCCTTAGCGCCGCCGATGTGGACAGGACAACGCGCGTTTGCAGCGCTCACTTCAATCGACGCTGCATCGATGGCAAACAGCTGCGTGGCTGGGCCATGCCCACACAGCAGCTGGGCCACCAGGAACAAAACATATATGAGAATCCAAAGAATATACCGGGCTTCTTTACGCCCACCTGTGCGCTGGCGCACTGTCGTAAACGACGAAGCATTGACAATGATTTGCGTACCTACCGCTATCCGCGCAACGAGGAGCTGCTCGAGAAATGGCGCGTCAATTTGCGTCTGGCGCCGGATCAATGTCGCGGACGCATTTGTGCGGATCACTTCGAGCCCATGGTGCGCGGCAAGCTGAAGCTGAAGACGGGCGCAGTGCCCACGCTGAAGCTAGGCCATGATGAGGGCGTAGTCTTTGACAACGAGGCCATTAAAGTAGGAATGCAGCAGGAGGATGAAGAGGAGGAGGAGGCGGGCAGCTTGGAGTCGCTGGGGAAGATAAAAATTGAGAAGCAGGAGAAGGAACCCCTAGAGCAGGAGTTAGAAAATGATGATGAGGATGAAGAGCAAGAGCAACAGCAAAAGGTGGAAGATCCTGATGATGATATGGAGCAGGAGCAGGATGAGGAGGAAGAGGAGCTGCAGGAGCATGAATATTTTGATCCCCTAGAGCTAGTGGAAACCTTTGCCGAACAGCACAGNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNACTGCTGCTGCCAGACACTGTTCCAATACAGCTGCCGCCACGCCGCGAAAAGGCAGTGAACAATGTGACACCTATTTGTTGCTTGAAACATTGCCGCAAGGAGCGCACCGCAAGTCATCAGCTGAGTACTTTTGGCTTTCCCAAGGATCAGCAGCAGCTGCTTAAATGGAGCGCCAATCTGCAGCTGGATCTCGTCGATTGTGTGGGACGCGTGTGCATCGAACATTTCGAGGCGGAGATGCTAGGCACACGCAAACTGAAGCAGAATGCGGTGCCGACATTGAATCTGGGGCATGGCACGCCGTTGAGCTATAGCTGCAATGGCCAATCCTTGAGCATATATGATGCTCAGCCGCAGCATTCGGTTTTTCGGCTTTGGAGCCTAAAACACTGCCGCAAAAGGAAACTGCTGACGATGCCTCCGGATCCGGCGACGACTAAACGACGCTGTTGCCTTCCCAGCTGTGGCAAGGAGCCGGAGCTGCATGGCGTTCAGTTGAAGCGACTGCCCAAGGATCGTCTGCTGCTGCGCAAGTGGCTGCACAATCTGAAGCTGCCGGCTCCCATGGACACCAGACACGCGTTTCTTTGCGAGGAGCACTTTGAGCCACAGGCGACGCTGCCTACCCTGAAGCTGGGCCACGCGGCTAACAACATTTATCGCAATGGCAGCTCGGCCTTATCCAGTGGCTGCCTGGTGCCTAGCTGTCCGTGTGCACGGCTCAATCTATATCGCTGCTATGCACTGCCCGAGCATCCGCAGGTGCAGCAGGCGTGGTTGCAGTGGCTGCAACTGCCGCCGCCGCAGCTGGCTAGCGTTGCCCAGCTCTGTGTTATGCATTATATGCAGCTGTTTGAACAGGTGCCGCTACCTGCGGATCTGCCTGAGTCTGTGCTGCGCCAACTGCAGGAAACCTACGAACAAATATCCAGCTCCAGCATGGCCATGAAATTGCGCTGTGCTGTGCCCGGCTGCTACTCCAAATACACGGACAATGTGCGTCTCACCAAGCTGCCCGTGTGCCCGCAAACCTGCGCCCAGTGGGTGCACAATACCAAAATTAAGTACGATCCGGAGCGCCATTACATGTATCGCATCTGCATGCGGCACTTTGAGCCGCAGTGCCTGGGTGCAGTACGTCCTAAGCTGTGGGCGGTGCCTACGCTGCATCTTAACCATAACGATGCGGATATATATCAGAATACCATGTTGGATAGCTCGGATGTCATGCCGGTAGCCGAGTCTGTACCGCTGACGTTGCCGCTGCGCATCAAGACAGAGCTGCCGCTAACGTTATCAGTCAGTCCGAGTGCCAGCCCCAGTCCACGCGGCAAATTGCGCACCTGTTGCATTCCCACCTGCGGCCAGCAGGCCAATGCCCTAACGCGTCTGTTTCGCTTTCCCAGCGCCGAGACGGCCCTACTTAAATGGCTGGTGAACACGCAACAGCAGCCACGCCTCGTTGATACGCAGAATCTTTTTGTATGCCAGCGTCACTTCGCGGCGGAGGCGATTTGCAAGAAGCAGCTACAAAGTTGGGCAGTGCCTACCCTAAGTCTGGGCCATCAAGGCCACATCATACCGAATGCCAAGCACAATGGCAATATTGCCGACAGCCAGGAGAACAAGCAGGCGCTGCAATACATCTGGGCCAATTACTGCTCGGTGCTCACCTGCTTCCAACAGCGCAGCGAGCAGATTCGTCTCTATGCCTATCCCACAGATCGGCCCACCATACGCAGGTGGGCGGCCAACTGCAAACATCGCTCCATGCAGGCCAGCAGCGATGGATTTCAGGTCTGCCAGTCACATTTTACGGCAGATTGCTTTGACCCTGATACCGGGGAGCTGAAGGAAGACGCGGTGCCCACACTGGAGTTGAGCCGGCCTGTCCATGAGTTGCGCTGCTTGGTCAATGGCTGCGTTAGGGAGAAGGATGCAGCGCGTTGTCGTTTTTTCAAAGTGCCCAAGCGTGCCTCACAGTTGGAGGACTGGTGTTACAATCTACGCATCGATGCTGCGTCAATAAGCGGCCAGGAGGTGCATGTGTGTGAGCGACACTTCGAGACGCATTGTTTCAGTGCGTACAAGCTGCGTCCGGGTGCACGACCTACACTTCATTTGGGCCACGATGATGATTTGGATTTGTTGCCCAATCCGGCAAAATGGGAGGAGGATGTGAATGTATGCTTTGTGCCCAGCTGTGGACGCTCCAAAGATGTGGATAATGTGGAGCTATTCGGACTGCCCAGGATTAGGGGGGTCTTGGAGAAATGGCTGCAAAATTTCCGCCTCGAGCCGAGCAGGGAGCAGCTGCAGGGCATGCGGATATGCAGCGCACATTTTGAGGCCAGTTGCATAGAGAACGGCCGTCTACACTTAAATTCTGTGCCCACGCTGCAGCTGGGCCACGATGAGTTGGACAATATACATCAAAGCACGGATCTGCCTTCATCGCAGCTTAAAGGCAAACGATTAGCCATGAGCTACGACTGCTGCTATCCACAGTGTATGGAGCTGCAGAAGAGCTATCAAAGAATCGCATATGAGCTGCCCCAGCAGGAGGCATTGCGTAACTTGTGGATGTCCTATCTTGGTCTGGAGCAGCAAAATCTGCAACCGCTCAAGCTCTGCCCGCTGCACTTGATCATGCTTTATGAACACAGTGTCAACCATTTTCCAGAGCATGCATCGGAGGAGCAGCTGCTGAACGACAATTATGAGGCTGCGCGAAATAGCGTGCGCATACGGATTATCAGCTGTGCGGTGCGTGGCTGCAGGACACTCAAACCACGCGACGACTACCGCCTGCACGCCATGCCTACGCGTCGGGATGTACTCCAGATGTGGCTAAACAACATGCAGCTTGTGTTCTACGAGCAGCAGCGTTATATGTACAAGGTATGCAGCAGACACTTTGAGGCCACCTGCGTAACAGAGACCAATCGCCGTCTTAAACCCTGGAGCATGCCGACGTTGGAGTTGCCGGAACGTGACCCAGACGCGCCGCCGTTGCATCAAAACCCAACGGAGGAGGAGTGGCAGCGCATGAATGAACAGATAGGCAGCAGCGAGGTAGTGCCTTTGCTAGAGCCCGTGGTCAAGCTGGAGCCGGAGCCCATTGTCAAGCAGGAGCTGCACCCTATTGTCAAGCTGGAGCCGAAGCCGCAGCCAGAACAGCTGTATGAAGAGGAGGAGTACGAGGCCAACGATCAGCAGCAAGCACTAGAAGTGCTGCTCGAAGTGGGTCACGTGGAGAAGTGCACCACATACGAGCAAATGGACACAAAACCAGTTATAGGCTATGCCGATACCCTGTCACATAATTCACTAGGCCCAACGACAACAGTGGGCAGCGCCTGTATCGTCGGCAACGGATTCACCTACAGCGCGCGCCACTGCAGCGTGCGGGGTTGCGATGTTACCTCTCTGGATGTGAATGACAGTCTCAAGCTACACAAGTTTCCCACATCGCTGGATGCGATGGAAAAATGGATGCACAACACCCAGGTGAATGTGGACATCAACTTTGCGTGGCGGTTTCGCATTTGCAGTTTGCATTTTCTACCCGAGTGCTTTAATGGTTCGCGTATCAGACGTGGGGCCATGCCCACGCTGCGTCTGGGATCGCGCCGCCTAGGGGATATCTATGACAATGAGTTCAATGTGCAGCCAGAGCAGACGAGTGTGGATCAGCTTGCTGAGGCGTCGGTGCCCACTGAACCGCACGATGGCGCGACGGAGTTTAATATTAATCTGCATTTGCCCTGCCCCGCACCACCGCGCAAGTCTAGCAAATTCTGTCAGATCGATGGATGCTCCAATCATTTGACCAGCGAAAATCTTACGTTGCACAAGTTTCCTCACTCGGCGGACATGTGCGCCAAGTGGCAACACAATACACAGGTGCCGTTCGATCCGGAGTACCGCTGGCGTTATCGTATCTGCAGCGCACACTTCGAGCCCATCTGCCTGGGAAACATGCGGCTGATGCATGGCAGCGTGCCCACACTGAAACTGGGCAGCCGGGCGCCCAAGCAGCTCTTTGGCAATGACTTTGCCGCGATTGGCTTGCGCTTGGATAAGCGCAGCGCCGACCAGAGCTTACCCGTGAAGCAGGAGCAAGTGGAAGATGATCAAGAGCAGTATGATCAGGAGCAGGAGGATCTGAGCATGCTGGTACCAGAGCTGCAGTTGCACGAGGGCGACGACGAGCAAGAAGACAATCAGTTGATATACACCAACAGTTGGAGAGATTCGCAACAACAGCTGCAGCTGCAGCTACGTCTGCCCAGCATTAAGCAGGAGAAGGGCACCATCTACAATCCCGTCAAGTCTGGCTATGACAAGTGCTCGCTGGTGCACTGTCAGCGCCAGCGCTCACAGCATGGCGTCCACATCTATAAATTCCCACGCTCGCGCCAGCTACAGCATCGCTGGATGCACAATTTACGAATCAGATATGACGAGCGGCGACCTTGGAAGACAATGATATGCAGTGTACACTTTGAGCCGCACTGCATACGCCTGCGTAAGCTGCGTCCCTGGGCGGTACCAACACTAGAGCTGGGCGACAATGTTCCGCAGGATTTGTACAGGAACGAGCAAAGCCAACAACAGTTTGTGCAGCAGCGCAGCAGCGACGCAGAAGGGGGCAGTGAGGGCGAGGACTATGATGCGGAGCTAGAGGATACCATACTGGAGGAGTACGACGATGAGTATGATGATAATGATAATGCTGAGCGATTTCCGGCTGAGCCACATATCAAGCGGGAGTATCGCTCACGCTGCGATCCACAGCCGCCGGGTCAGCTGCCACCCTGGAAAATCAAGCAATGCTGTTTGCCCTATTGCCGCAGGCCACGCGGCGATGGCATCAAGCTTTTCCGGCTGCCCAACAATATCGGCGCCATACGCAAATGGGAGCAGGCGACGGGCATGCGCTTCTATGAGTCCCAGCGCAACACAAAACTCATCTGCAGTCGTCACTTTGATCCGCAACTTATTGGTGTGCGTCGTCTTATGTCCAATGCTGTACCCACGCTCAATCTGGGTCCAAACAGCGAGGAATCCGAACTGCCAGCGACCAGTCCACGCTGCTGCATTAAGGATTGCCAACCAGATGGACATGTCAAGCTGCACAAATTTCCCAGCGATCCCCAGCTGCTGCATCAGTGGTGTCAGGCGCTTAATTTGCGGGATGAGCAGCGCCACGCCGGCAAGTACATTTGTGCCGTGCACCTGCCCACCAAAGCGATGAGCTGTCTTATTTGCGGTGTGGAGGATGTGCAGCTACCCATGCAGGACTTTCCCGAGCATCGCAATCAGCGAGTAAAATGGTGCTACAATTTGAAAATCGAACCAATAGCCAAGTGGGACAACTCAAAGCACATTTGCTGCAAGCACTTTGAGAGCTATTGCTTCATTAAGCCGGGTCACCTGTTGCCGGACGCCATGCCCACGCTGCATTTAAAACACAACGACAGCAATATATTCCTCAACGAATCTGGCATAGAGAGCAGCAAGCTGCTGCGCGTCAAGGATGAGCCTATGGAGTGTGAGGATCTGATGCTGTAA
Protein Sequence: MVQLFKFLLKSTKSPARAHFRSNFLDTLRLTVRGGHGGNGLPKYGGVGGQGGCVYFVAKEGLTLRKVAQNLRDKRVQATSGEDSSKVSIFGRRGVDQRIEVPLGVQVYDEQQKLLADLNEHEASCIVAGGGTGGCTGNNFLGRPGESRTVHLDLKLIADVGLVGFPNAGKSTLLKAISNAKPKIAAYPFTTIRPQIGTVEYSDLRSISIADLPGLIEGAHANFGMGHKFLKHIERTRLLLFMVDIFGFQLSPRHPHRDCLSNIYALNKELELYDPTLLEKPCVLLLNKMDKEGAQQILQNLKPSIKDLSNGLAACPEELRPSRVLKFEHILPISAKNSARITQVKQQLRETLDELAEQHLVADNQQLKEQLQQRVGNPMAPPPAPAVNRHTLDASGEMIIKSEPIDEHAFKSNYIDDNTPFADFSKFTEFADDMLSPKVELSVKDEAYGSQKNPLSYPRRKLQTERPSESLPICQRCKEVFFKKQVYLRHVAESSCSIHEYDFKCNICPMSFMGAEELQKHKQLHRADKFFCHKYCGKHFDNIAECESHEYMQHEYDSFVCNMCSVTFSTREQLYAHLPQHKFQQRYDCPICRLWYQTALELHEHRLAAPYFCGXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXEMTAPHHKTNALPATAALSSLLQQRQANADGAALYASTLKSEANVKLERSYSNSTSESGYSLHESSYNNAYGSDNSLHGGSAPIGGPQAHSSTLDESEDALCCVPLCGVRKSTSPTLQFFTFPKDEKYLHQWLHNLKMFHIPASSYASFRICSMHFPKRCINRYSLCYWAVPTFNLGHDDVANLYQNRELTNTFTTGEVARCSMPNCTSQRGESNLKFYNFPKDIKSLIKWCQNARLPVQAKEPRHFCSRHFEERCIGKFRLKPWAVPTLHLGAQYGKIHDNPKNLYVEEKRCCLNFCRRSRSSDFNMSLYRFPRDEVLLRRWCYNLRLDPAVYRGKNHKICSAHFIKEALGLRKLSPGAVPTLHLGHNDTFNIYENELWPPPTPSTPTXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXASHYVDPELSASYMGMSASSSGLNVSDSMDVCCVPSCESKRHNNENITFHTIPRRPEQMRKWCHNLKIPEDKMHKGMRICSLHFEPYCIGGCMRPFAVPTLHLGHDDEDIHRNPDVIKKLNIRETCCVAVCKRNRDRDHANLHRFPSNVALLTKWCANLQRPVPDGTKLFNDAICEVHFEDRCLRNKRLEKWAVPTLVLGHENIAYPLPTPEQVAESYARPSAPNNGEEQGECCVETCKRNPSVDDIKLYRPPEESQVLAKWAHNLQLDIAQLPSMRICNLHFESHCIGKRMRPWAIPTLNLASNIENLFENPEHQMLYKRRTHLNADRAAARSAGADGATMKASWVPRCCLPHCRKVRALHNVQLYRFPKVNRTTLAKWAHNLQVPLVGSAQRRLCSAHFEPNVLSKKCPVPLAVPTLDLNTPPGYKIYQNPAKVRANKLCWQRVCIVESCRRQRAQGVQLFRLPHSRTQLRKWMHNLRMLPRGAMRQQYRICSLHFEAHSFNGKRLSTGAIPTLELGHQDDDIYPNEAQSFVEEHCAVEGCDASKEQPDVRLFRFPNDDEDLLWKWCNNLKMNPVDCYGMRICNRHFEPDCIGPKHLYKWAIPTLPEERYGDPVFKCCVPTCGKTRKFDEAQMNSFPKDPSLFQRWRHNLRLEHLNFKERERYKICNAHFEDICIGKTRLNIGSIPTLELGHEETEDLYQVNPEELQSNLFGRPRRVHENQRLSIKQELDEDIKPDITMSEATDTNTTQVKIKKSVLDLKCCVPSCGRSRLEHGARLFPFPTGKQQQTKWRHNLRLSAADVDRTTRVCSAHFNRRCIDGKQLRGWAMPTQQLGHQEQNIYENPKNIPGFFTPTCALAHCRKRRSIDNDLRTYRYPRNEELLEKWRVNLRLAPDQCRGRICADHFEPMVRGKLKLKTGAVPTLKLGHDEGVVFDNEAIKVGMQQEDEEEEEAGSLESLGKIKIEKQEKEPLEQELENDDEDEEQEQQQKVEDPDDDMEQEQDEEEEELQEHEYFDPLELVETFAEQHXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXLLLPDTVPIQLPPRREKAVNNVTPICCLKHCRKERTASHQLSTFGFPKDQQQLLKWSANLQLDLVDCVGRVCIEHFEAEMLGTRKLKQNAVPTLNLGHGTPLSYSCNGQSLSIYDAQPQHSVFRLWSLKHCRKRKLLTMPPDPATTKRRCCLPSCGKEPELHGVQLKRLPKDRLLLRKWLHNLKLPAPMDTRHAFLCEEHFEPQATLPTLKLGHAANNIYRNGSSALSSGCLVPSCPCARLNLYRCYALPEHPQVQQAWLQWLQLPPPQLASVAQLCVMHYMQLFEQVPLPADLPESVLRQLQETYEQISSSSMAMKLRCAVPGCYSKYTDNVRLTKLPVCPQTCAQWVHNTKIKYDPERHYMYRICMRHFEPQCLGAVRPKLWAVPTLHLNHNDADIYQNTMLDSSDVMPVAESVPLTLPLRIKTELPLTLSVSPSASPSPRGKLRTCCIPTCGQQANALTRLFRFPSAETALLKWLVNTQQQPRLVDTQNLFVCQRHFAAEAICKKQLQSWAVPTLSLGHQGHIIPNAKHNGNIADSQENKQALQYIWANYCSVLTCFQQRSEQIRLYAYPTDRPTIRRWAANCKHRSMQASSDGFQVCQSHFTADCFDPDTGELKEDAVPTLELSRPVHELRCLVNGCVREKDAARCRFFKVPKRASQLEDWCYNLRIDAASISGQEVHVCERHFETHCFSAYKLRPGARPTLHLGHDDDLDLLPNPAKWEEDVNVCFVPSCGRSKDVDNVELFGLPRIRGVLEKWLQNFRLEPSREQLQGMRICSAHFEASCIENGRLHLNSVPTLQLGHDELDNIHQSTDLPSSQLKGKRLAMSYDCCYPQCMELQKSYQRIAYELPQQEALRNLWMSYLGLEQQNLQPLKLCPLHLIMLYEHSVNHFPEHASEEQLLNDNYEAARNSVRIRIISCAVRGCRTLKPRDDYRLHAMPTRRDVLQMWLNNMQLVFYEQQRYMYKVCSRHFEATCVTETNRRLKPWSMPTLELPERDPDAPPLHQNPTEEEWQRMNEQIGSSEVVPLLEPVVKLEPEPIVKQELHPIVKLEPKPQPEQLYEEEEYEANDQQQALEVLLEVGHVEKCTTYEQMDTKPVIGYADTLSHNSLGPTTTVGSACIVGNGFTYSARHCSVRGCDVTSLDVNDSLKLHKFPTSLDAMEKWMHNTQVNVDINFAWRFRICSLHFLPECFNGSRIRRGAMPTLRLGSRRLGDIYDNEFNVQPEQTSVDQLAEASVPTEPHDGATEFNINLHLPCPAPPRKSSKFCQIDGCSNHLTSENLTLHKFPHSADMCAKWQHNTQVPFDPEYRWRYRICSAHFEPICLGNMRLMHGSVPTLKLGSRAPKQLFGNDFAAIGLRLDKRSADQSLPVKQEQVEDDQEQYDQEQEDLSMLVPELQLHEGDDEQEDNQLIYTNSWRDSQQQLQLQLRLPSIKQEKGTIYNPVKSGYDKCSLVHCQRQRSQHGVHIYKFPRSRQLQHRWMHNLRIRYDERRPWKTMICSVHFEPHCIRLRKLRPWAVPTLELGDNVPQDLYRNEQSQQQFVQQRSSDAEGGSEGEDYDAELEDTILEEYDDEYDDNDNAERFPAEPHIKREYRSRCDPQPPGQLPPWKIKQCCLPYCRRPRGDGIKLFRLPNNIGAIRKWEQATGMRFYESQRNTKLICSRHFDPQLIGVRRLMSNAVPTLNLGPNSEESELPATSPRCCIKDCQPDGHVKLHKFPSDPQLLHQWCQALNLRDEQRHAGKYICAVHLPTKAMSCLICGVEDVQLPMQDFPEHRNQRVKWCYNLKIEPIAKWDNSKHICCKHFESYCFIKPGHLLPDAMPTLHLKHNDSNIFLNESGIESSKLLRVKDEPMECEDLML

Similar Transcription Factors

Sequence clustering based on sequence similarity using MMseqs2

100% Identity: iTF_00530983; iTF_00475247; iTF_00563203; iTF_00526609; iTF_00490809; iTF_00506141;
90% Identity: iTF_00490809;
80% Identity: -