Basic Information

Insect: Scaptomyza montana
Gene Symbol: -
Assembly: GCA_018904305.1
Location: JAEIGR010000009.1:215285-229508[-]

Transcription Factor Domain

TF Family: THAP
Domain: THAP domain
PFAM: PF05485
TF Group: Zinc-Coordinating Group
Description: The THAP domain is a putative DNA-binding domain (DBD) and probably also binds a zinc ion. It features the conserved C2CH architecture (consensus sequence: Cys - 2-4 residues - Cys - 35-50 residues - Cys - 2 residues - His). Other universal features include the location of the domain at the N-termini of proteins, its size of about 90 residues, a C-terminal AVPTIF box and several other conserved residues. Orthologues of the human THAP domain have been identified in other vertebrates and probably worms and flies, but not in other eukaryotes or any prokaryotes [1].
Hmmscan Out: # of c-Evalue i-Evalue score bias hmm coord from hmm coord to ali coord from ali coord to env coord from env coord to acc

1 28 1.1e-14 7.8e-12 45.9 4.6 1 86 581 653 581 654 0.85

2 28 8.1e-15 6e-12 46.3 4.6 1 87 681 750 681 750 0.83

3 28 2e-15 1.5e-12 48.2 0.4 1 87 772 844 772 844 0.85

4 28 1.3e-15 9.6e-13 48.8 5.3 1 87 940 1010 940 1010 0.83

5 28 2.1e-14 1.6e-11 44.9 3.6 1 86 1034 1105 1034 1106 0.82

6 28 2.5e-12 1.9e-09 38.3 1.2 1 87 1141 1209 1141 1209 0.80

7 28 1.6e-10 1.2e-07 32.5 2.0 1 86 1256 1325 1256 1326 0.76

8 28 9.1e-17 6.8e-14 52.5 0.3 1 87 1353 1423 1353 1423 0.83

9 28 3.4e-12 2.5e-09 37.9 2.2 1 86 1444 1513 1444 1514 0.82

10 28 3.8e-14 2.8e-11 44.1 2.1 1 86 1541 1612 1541 1613 0.85

11 28 1.1e-13 8e-11 42.7 1.8 1 85 1689 1757 1689 1759 0.82

12 28 5.5e-12 4.1e-09 37.2 0.1 1 86 1782 1850 1782 1851 0.82

13 28 3.9e-13 2.9e-10 40.9 0.7 1 86 1997 2065 1997 2066 0.81

14 28 5.4e-13 4e-10 40.4 1.3 1 62 2135 2194 2135 2211 0.79

15 28 0.00044 0.32 11.9 0.1 1 59 2217 2269 2217 2292 0.76

16 28 1.1e-10 7.9e-08 33.1 0.9 1 86 2307 2376 2307 2377 0.84

17 28 4.5e-14 3.4e-11 43.9 1.2 1 87 2437 2507 2437 2507 0.82

18 28 4.8e-12 3.5e-09 37.4 0.3 1 86 2542 2613 2542 2614 0.80

19 28 2.8e-12 2.1e-09 38.1 0.9 1 87 2624 2695 2624 2695 0.80

20 28 8.9e-13 6.6e-10 39.7 0.3 1 87 2718 2789 2718 2789 0.78

21 28 4.5e-05 0.034 15.0 0.1 1 57 2822 2873 2822 2887 0.83

22 28 3.9e-14 2.9e-11 44.1 0.1 1 86 2912 2984 2912 2985 0.81

23 28 6.1e-14 4.5e-11 43.5 1.8 1 86 3119 3191 3119 3192 0.83

24 28 1.9e-13 1.4e-10 41.9 1.9 1 87 3258 3329 3258 3329 0.81

25 28 3.6e-14 2.7e-11 44.2 3.3 1 86 3436 3506 3436 3507 0.85

26 28 7.9e-13 5.9e-10 39.9 0.1 1 87 3602 3672 3602 3672 0.85

27 28 1.4e-08 1.1e-05 26.2 0.2 1 58 3689 3737 3689 3745 0.88

28 28 6.4e-09 4.8e-06 27.4 1.5 18 87 3754 3812 3743 3812 0.76

#	of	c-Evalue	i-Evalue	score	bias	hmm coord from	hmm coord to	ali coord from	ali coord to	env coord from	env coord to	acc
1	28	1.1e-14	7.8e-12	45.9	4.6	1	86	581	653	581	654	0.85
2	28	8.1e-15	6e-12	46.3	4.6	1	87	681	750	681	750	0.83
3	28	2e-15	1.5e-12	48.2	0.4	1	87	772	844	772	844	0.85
4	28	1.3e-15	9.6e-13	48.8	5.3	1	87	940	1010	940	1010	0.83
5	28	2.1e-14	1.6e-11	44.9	3.6	1	86	1034	1105	1034	1106	0.82
6	28	2.5e-12	1.9e-09	38.3	1.2	1	87	1141	1209	1141	1209	0.80
7	28	1.6e-10	1.2e-07	32.5	2.0	1	86	1256	1325	1256	1326	0.76
8	28	9.1e-17	6.8e-14	52.5	0.3	1	87	1353	1423	1353	1423	0.83
9	28	3.4e-12	2.5e-09	37.9	2.2	1	86	1444	1513	1444	1514	0.82
10	28	3.8e-14	2.8e-11	44.1	2.1	1	86	1541	1612	1541	1613	0.85
11	28	1.1e-13	8e-11	42.7	1.8	1	85	1689	1757	1689	1759	0.82
12	28	5.5e-12	4.1e-09	37.2	0.1	1	86	1782	1850	1782	1851	0.82
13	28	3.9e-13	2.9e-10	40.9	0.7	1	86	1997	2065	1997	2066	0.81
14	28	5.4e-13	4e-10	40.4	1.3	1	62	2135	2194	2135	2211	0.79
15	28	0.00044	0.32	11.9	0.1	1	59	2217	2269	2217	2292	0.76
16	28	1.1e-10	7.9e-08	33.1	0.9	1	86	2307	2376	2307	2377	0.84
17	28	4.5e-14	3.4e-11	43.9	1.2	1	87	2437	2507	2437	2507	0.82
18	28	4.8e-12	3.5e-09	37.4	0.3	1	86	2542	2613	2542	2614	0.80
19	28	2.8e-12	2.1e-09	38.1	0.9	1	87	2624	2695	2624	2695	0.80
20	28	8.9e-13	6.6e-10	39.7	0.3	1	87	2718	2789	2718	2789	0.78
21	28	4.5e-05	0.034	15.0	0.1	1	57	2822	2873	2822	2887	0.83
22	28	3.9e-14	2.9e-11	44.1	0.1	1	86	2912	2984	2912	2985	0.81
23	28	6.1e-14	4.5e-11	43.5	1.8	1	86	3119	3191	3119	3192	0.83
24	28	1.9e-13	1.4e-10	41.9	1.9	1	87	3258	3329	3258	3329	0.81
25	28	3.6e-14	2.7e-11	44.2	3.3	1	86	3436	3506	3436	3507	0.85
26	28	7.9e-13	5.9e-10	39.9	0.1	1	87	3602	3672	3602	3672	0.85
27	28	1.4e-08	1.1e-05	26.2	0.2	1	58	3689	3737	3689	3745	0.88
28	28	6.4e-09	4.8e-06	27.4	1.5	18	87	3754	3812	3743	3812	0.76

Sequence Information

Coding Sequence: ATGTCACAACAACACAACAACCCCCCNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNCTCACATGTTGCTTCCTATCCAACCCCGCATGCCACTGCCTTTGCGCAGCCTTGCAAGAGCAGCAGCAACAACAATAACAACAACAATAACAACATTATGAATGCTTACGGCGCGGGTACAGGTGCGTATTATGGCTCTCCGGCAGCGGGCGGCGGTGGGGTTGGCTATAACCTTGAGGCCAATACTGTGGCNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNCCGCATATAATGCACAGCTCGTATCCCTACATTAAGAGCGAACCCATGGACCTGCCCGAGCGCCATATGCAGCAGCAGCAACAACAGCAGCCACATTTTCCGAATCCTATGGCACCGCCGCCAGCACCCGCCATTCCCAATCGTCACTCGCTTGATGCCAGCGGCGAAATGATAATAAAATCGGAACCCATTGAAGAACATGCATTCAGGTCCAACTATATTGACGATAATACGCCCTTTGCCGATTTTAGCAAATATTCCGAATTCGCTGACGATATGCTAAGCCCCAAGGTTGAGCTAACCGTCAAGGATGAGGGCTATGGTAACCAAAAAAATCCGTTAAACTATCCACGTCGCAAGCTGCAAACGGAGCGCTCTGCAGAAAATATGCCCATTTGTCAGCGATGCAAGGAGGTGTTCTTCAAGAAACAGATATACCTGCGCCATGTGGCCGAGAGCAATTGTAATATACACGAATATGAATTCAAGTGCAAAATTTGCGTTATGTCCTTCAGGGCTGTCGAGGAGCTGCACAAACATAAGCTTTTGCATCGAGCCGACAATTTTTTCTGCCACAAATACTGTGGCAAGCATTTTGATTCGATTGCAGAATGCGAATCGCATGAATACATGGAGCACGAGTACGATAGCTTTGTGTGCAATATGTGCTCTGTTACGTTTCCGACACGGGAACAGCTGTATGCTCATTTGCCGCAACATAAGTTCCAACAGCGTTACGATTGCCCGATTTGCCGTTTGTGGTATCAAACGGCATTAGAGCTGCACGAGCATCGAATGGCGGCACCCTATTTCTGTGGAANNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNGACTGTCATATGGGCACCATAGAAATGATTCCACCGCATCACAAGGCGAATACAGCATTGCCTGCAACTGCGGCGCTCAGTTCGCTGTTGCAACAGCGTCAGGCGAACGCTGATGGAGCCGCCTTGTTCGCTTCGGCACTAAAGACGGAAACCACTGTGAAACTAGAGCGCAGTTTTAGCAATTCCACTAGCGAGTCGGGATACAGCATGCAGGATAGCAACTATAATAATGCCTACGGCAGCGATAGTTCGCTGCATGGCGGAGGCGTCGGAATTGGTGGTCTACAGGCGCATTCCTCGACGCTGGACGATTCAGAAGATGCGCTGTGTTGTGTGCCACTTTGCGGTGTACGCAAGAGCACCAGCCCGACGCTACAGTTCTTTACGTTTCCCAAGGATGAAAAATATTTACATCAGTGGCTGCACAATCTCAAAATGTTTCACATTCCAGCCTCAAGCTATGCAAACTTTCGTATTTGCAGCATGCACTTTCCCAAGCGCTGCATCAATCGTTACTCGTTGTGCTATTGGGCGGTGCCAACATTTAATCTGGGTCACGATGATGTCGCCAATCTCTATCAGAATCGTGAACTGACCAACACATTTACCACCGGCGAGGTAGCACGCTGCAGCATGCCCAATTGCACAAGTCAGCGTGGCGAAAGCAATCTCAAGTTCTACAATTTTCCTAAGGACATCAAGAGTTTGATAAAGTGGTGCCAAAATGCACGCCTGCCTGTTCAGGCCAAGGAGCCGCGTCACTTCTGCAGTCGTCACTTTGAGGAGCGCTGCATTGGAAAGTTTAGACTTAAGCCCTGGGCAGTGCCTACACTACATTTGGGCGCTCAATACGGCAAGATACATGACAATCCCAAGAACCTGTATGTGGAGGAGAAGCGTTGCTGCCTAAACTTTTGTCGTCGCAGTCGCTCCTCCGATTTCAATATGTCACTGTATCGCTTCCCCAGGGATGAGGTACTGTTGCGTCGTTGGTGCTACAATCTGCGCCTTGATCCGGCTGTTTATCGTGGCAAGAATCACAAAATATGCAGCGCTCACTTTATTAAGGAAGCGTTGGGTCTACGCAAGTTATCGCCAGGAGCTGTGCCCACCCTGCACTTGGGACACAGTGACACCTTCAATATCTACGAGAACGAANNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNCATTATGTTGATCCAGAAATGAGTGCATCCTATATGAGCACGGGCGCTGGAGGCTCATCCTCGAGCCTCAACGTTAGCGACAGCATGGACATCTGTTGTGTGCCCAGCTGCGAGAGCAAACGTCACAACAACGAGAACATTACATTCCACACAATTCCCAGGCGGCCAGAGCAGATGCGCAAATGGTGTCACAATCTTAAGATACCCGAGGACAAGATGCACAAAGGCATGCGAATATGTAGCCTTCACTTTGAGCCCTACTGCATTGGTGGCTGCATGCGTCCATTTGCTGTACCCACACTGAATTTGGGTCATGACGACGAGGATATACATCGCAATCCGGATGTGATAAAGAAACTCAATATACGCGAAACGTGTTGTGTGACCGTCTGCAAGCGCAATCGTGACCGGGATCATGCCAATCTACATCGTTTTCCCAGCAATGTGTCATTACTGACCAAGTGGTGTGCCAATCTGCAGCGTCCTGTTCCGGATGGCACGAAGCTCTTCAACGATGCCATTTGTGAGGTGCACTTTGAGGATCGATGCTTGCGCAACAAGCGGTTGGAAAAGTGGGCAGTTCCCACTCTCATACTGGGGCATGAGAATATACCCTATCCGGTGCCAACGCCGGAGCAGGTGGCCGAGTTCTATGCCCGTCCCAGTGCACCAAACAATGGCGAGGAGCAGGGCGAGTGTTGTGTAGAAACTTGTAAACGTAATCCAAGCGTTGATGACATTAAGCTATATCGCCCGCCTGAAGAGTCGCAGGTGCTGGCCAAATGGGCACACAATTTAGAGCTGGAGATAACTAAGTTGCCAAATTTGAGAATATGCAATTTGCACTTTGAATCCCACTGCATTGGCAAACGAATGCGTCCATGGGCCATACCCACACTCAATCTGGCCAGCAACATTGATAATCTCTACGAGAATCCGGAACGTCAATTGCTATACAAGCGACGCACACATCTCAAACCGGAGAGAGCCGCGCGAGGCTCTTTAGCAGCCGCTGGTGTTAAGCCCACCTGGGTGCCACGATGCTGCCTGCCGCACTGTCGCAAGGTGCGTGCCACACACAATGTCCAACTGTATCGCTTCCCGAAACTCAATCGCTCCACGCTGGCCAAGTGGTCGCATAATCTGCAGCTGCCGATGGTGGGCAGTGCCCAGCGTCGTCTTTGCTCCGCCCACTTTGAGCCGCATGTGCTAAGCAAGAAGTGTCCGGTGCCCTTGGCAGTACCCACACTGGAACTCAATACACCACCCGGCTACAAGATCTATCAGAATCCCGCCAAGCTTAAGGCTAAAAACCTGTGCCTTCAGCGCGTCTGCATTGTGGAGAGCTGCCGACGACAGCGGGCGCAGGGTGTGCAGCTTTTCCGTCTGCCTCATAATCCCACCCAGCTGCGCAAGTGGATGCACAACATCCGGATGCGTCCCCGAGGTGCTATGCGACAACAATATCGCATCTGCTCACAGCACTTTGAGACACACTCGTTTAACGGCAAGAGATTGAGTGCGGGTGCAATTCCAACGCTTAACCTGGGTCATCAGGATGAGGACATTTTTCCGAATGAGGCGCAGTCTTTCGTGGAGGAGCACTGCACTGTCGAGGGCTGCAATGCAGCCAAAGACCAACCGGACGTACGTCTCTTCCGTTTCCCCAGCGAAGATGAAGATCTGCTCTGGAAGTGGTGCAACAATCTAAAAATGAATCCAGTCGATTGCATTGGTGTACGCATCTGCAACAAACACTTCGATCCGGATTGCATTGGACCCAAACATCTGTACAAGTGGGCAATTCCCACCCTCTGCCTGGGTCACGATGATTCTGACATTGAGCTAATATGCAATCCCAAGCCAGAAGATCGGTACGTTGATCCGGTCTTTAAATGCTGTGTGCCGACGTGCGGCAAGACGCGCAAGTTTGATGAGGTGCAGATGAATAGCTTTCCCAAAGATCCCACACTCTTCCATCGCTGGCGTCACAATCTTCGTTTGGAGCACCTTAATTTCAAGGAACGCGAACGTTATAAAATCTGCAATGCACACTTTGAGGATATTTGCATCGGCAAGACGCGTTTAAATATTGGTTCAATTCCAACACTAGAATTGGGCCACGACGAGACTGATGACTTGTTCCAAGTCAATCCCGAAGAGTTACAGAGCAATCTATTTGGACGACAGCGACGCGTGCAAGACTCTATGAGACTTGACATTAAAGAGGAGCCGCATTCCGAACTAGATGAAGATGTTAAACCAGATTTAACTATGTCGGAAGCCACAGACTCAAATACAAAGCAGGTTAAAATCAAGAAATCATTATCCGAATCCAAGTGCTGTGTTCCAACTTGTGGTCGCAGCCGTTTGGAGCATGGTGCCCGCCTGTTTCCTTTCCCAAATGGCAAACAGCAGCTGAACAAATGGCGCCACAATCTACAGCTATCTGCATCGGATGTGGACAAGACAACGCGCATTTGCAGCGCCCACTTTAGTCGTCGTTGCATCGATGGCAATCAGCTGAGGAGCTGGGCAATGCCCACACAGCAGCTGGGCCATCTCGAGCAGCCGATCTATGAAAATCCCAAGAATATACCGGGCTTCTTTACGCCAACATGTGCGCTGGCCCACTGCCGCAAGCGGCGCAGCATTGACAATGAATTGCGCACCTATCGATATCCACGCAGCGAGGAGCTGCTGGAGAAGTGGCGAGTTAATCTTCGTTTGTCGCCGGATCAGTGTCGCGGACGCATCTGTGCGGATCATTTTGAGCCTGTGGTGCGGGGTAAACTGAAGCTTAAAACGGGCGCGGTGCCTACACTCAAATTGGGGCACGATGAGGGCGTGGTCTTTGATAATGAAGCCATTAAAGCTTTACTGCAGCTGGATGAGGAGGAGGACGACGATGAAGAAGGAGGGGCCGATGTCAGTTTCAAGTCGTTGGTAAAAGTAAAGACTGAAAAGGAGGAGGAGAAGGAACAGGAGCTTGAGAACAATGGTGAAGAGGAGGAACAGGAGCAGGATGATGAGGAAGATCATCCGGATTCAGATGATAATGGCTATTTCGATCCGTTAGCGCTTGTGGAAACCTTTGCCGAGCGTCACAGNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNGCTTCTGCTACCTGATACACAGCCAATGCAACTCACACTGGCACCACGTCGCGAAAAAGCTGTTAACAATGTGACGCCAATTTGTTGTCTGAAACATTGTCGAAAGGAGCGTACCGCCATTCATCATCTGAGCACTTTTGGCTTTCCCAAGGATCCACAGCTGTTGCTCAAGTGGAGCGCCAATTTGCAATTGCCGCTGGAAGATTGCATGGGTCGTGTATGCGTTGAGCACTTTGAGCCTGTGATGTTGGGCACGCGCAAGCTGAAACAGAATGCTGTGCCCACTTTGAAATTGGGGCATGCAACACCGCTCACTTATAGCTGCAATGGTAAAATGCTCTCGGGTATTTATGATGAACAGCCGCAGCATTCGGTTTTTCGGCTTTGGAGCCTGAAACACTGCCGCAAAAGGAAATCGGAGTCGGAGCTGGAGCTGGAGCAGCAGCAGCAGCAGATGCAGATGCAGAAATTGTCAGATATTAAGTCAGTCCGTCGCTGTTGCCTGCCCAGTTGTGGCAAGCAGTCGGAGTTGCATGGCGTCCAATTGCATCGTATGCCCAAAGATCGAATGATGCTGCGCAAATGGTTGCACAATCTAAAGCTGCCACCGACAACGGATTGCACTCACATGTTTCTCTGCAGTGATCACTTTGAGATGAGTGCGCCGTGTCCAACATTAAAGCTAGGACATTCGGACACCAATATTTATAGGCACAGTACACCCAGCTCCATCAGCGCCGGCTGCCTAGTGCCTAAATGTACTTGTGCGCGTCTTAATCTCTATCGTGGCTATGATCTGCCTGCCAATCAGCAGGTTCAGGAGGCATGGCTAGGTTGGTTACAGCTGCCCCATCCGCAGCCATCGCCACGGCACGCCCAGCTGTGTGTAATGCACTTTATGCAGCTTTATGAACAGGTGCCGCTACCCGATTCGGTGCCTGATTTTGTGCACCGCCAGCTGCGTGAAACGTACGAGCAAATATCCAGCTCCAGCATGGCCATGAAGCTGCGCTGTGCTGTGCCCGGCTGCTACTCAAAGTATACGGATAATGTGCGTTTGACCAAGTTGCCAGTTTGCTCCAACACCTGCGCCAAATGGGTGCACAATACCAAGATTCCATACGAAGCGGCGCGACATTATGTCTATCGCATCTGTATGCTGCACTTTGAGCCCAGCTGCCTGGGGCCCGTGCGTCCCAAAATATGGGCAATGCCCACGCTCCAATTGCACCACACGGATACAAATATTTATTTAAATCCCAAACTGGATGGCAGCCTAACACATCAGCAGCCTGTGGTGCCGCTGGAGCTGCCGCTGCGTATCAAAACGGAGCTGCCAATGTGCAACAGTCCAAGCTTTACCGCCAGTGCAAGTCCCAGTCCGCGTGGCAAGCTACGCAGTTGTTGCATACCCAGCTGTGGGCAACAGGCTTCGGCATTGACGCGTCTCTTTCGATTTCCCAGCGCGGAGACGGCTTTGTTAAAATGGCTGGTAAATACGCAGCAACAGCCGCGTTTTGTCGACACACAGCGGCTGTTCATCTGTCAAGAACACTTTGAGGCGGAGGCGATTTGCCAAAATCAGCTTCGCAGCTGGGCGGTGCCCACATTGAATCTGGGACATGATGGACACATTATTCCAAATGCACGACACAATGGCAATATTGCCGATAGCCAGGAGAACAAGCAGACGCTGCAGTTTATCTGGGCAAATTACTGCTCGGTGCTGAGTTGCTTTCAGAGGAGAAGCGACGAACTCCGTCTATATCCATATCCAACGGATCGGCCAATAATTCGCAAGTGGGCCGCCAACTGTAAACATCGCTCCATGCAAGCCAGCAGCGACGGTTTCCAGGTTTGCCAGTCGCATTTTATTTCGGATTGTTTTGATCCTGATACAGGAGATCTGAAGGAGGATGCTGTGCCCACACTGGCGCTTAATCGGATTGTAAATGAGGTGCGCTGTGTTGTCAATGGTTGCGTTAAGGATGAGGATGCGCCGCGACGTCTGTTCAAGATGCCCAAACTTGTTGCCCAGATATCCGATTGGTGCCACAATTTGCGTCTAGATCGAACGGCCATTAGCAGCACGGATTCGCACGTATGTGAGCGCCACTTTGAGGCACAATGCTTCAATGTGTACAAGGCGCTGCGTCCAGGAGCCCGACCCACGCTACATTTGGGTCATGAAGACCTAGATGATTTGTTGCCCAATCCAGCCAACTTTGAAGAGGATGCGTTCGTGTGCTGTGTGCCCAATTGCGGGCGATCTAAAGATGCGGATAATGCCCTACTATTTGGGCTGCCAAAGGTGCGTCAAATGGCGGAAAAGTGGTTACAAAATATTCACCTTGATCCAAACAAGGACCAGCTAGCCTGCCTCAAAATTTGCAGTGTGCACTTTGAGGCCAGATGTTTGGAGAATGGACGTCCCACCTATGGTGCCATGCCAACGCTCCATCTGGGTCACGAACAACTGCATAATATACACCCAATTGTTGAACCGTCGCCAACAAAGCAGAGGCTTTATTGCAACAGAGATGGCGCCAGTCATGACTGCTGCTATCCCCAGTGTGTAGAGCTACAGAAAAGCTATCTGCGTGTATCCTACGAGCTGCCCCAGAAGCAGGAGCTGCGTGAGCAATGGCTCTCCTATATGGGCCTGAAGGAGCCGCTCGATAAGCAGCAGTTTCCCAAGCTCTGTCCGCTACACTTGATCTTGCTCTATGATCACAGTGTGGATAACTTTTCGGCACATGCAGGCGAGGAGCTGCTGGACGCCGATTATGAGGCATCGCGCAGCAGCGTTCGCATCCGTATTGTCAGCTGTGCGGTCCGTGGATGCAGAACTCTTAAGCCACGCGATGGAGGACGACTACATGGCTTGCCCACACGCCGGGATTTGCTCGAAATGTGGCTACATAATATGCAGCTGGTGTTTTATGAGCAGCAGCGTTATATGTACAAAATATGCAGCAAACATTTTGAGCCCATGTGTCTAACGGAGACAACCAGACGCCTGAAGCCTTGGAGCATGCCAACGCTGGAGTTGCCAGAGCGTCAACCGGGCGAAATGCCTCCGTATCAGAATCCCACAGAGGGGGAATGGCAGCGTATGAATGAACTGCACGCCAGCGCCTCGAGCAAGATTGAGGAGCCATTTGAGCCATTGATTAAGCTAGAGCCGTTGTGCAAGTTGGAGCAACCACAGCAGACGGAAATGGAATATGAAGAGGATTATGACAACAATTCACAGCAGCCGCTGGAAATGCAGGCGTTGGAGGTACTGCTTGAGGTAGGTCATGTCGAGAAGTGTGCCACATATGAGCAAATGGATACGGAGCCAAATCCCAACTATGCCGAGCAGCTCTCTCCATTGAGTGCAATTATACCTCAAGGTCGCAGCATTGCGCCTGCACAGAATGGATTCCATTATAGCGCACGTGTGTGCAGCGTGCATGGCTGCAATGTCAACACGAATAATATAGATAGCAACACAAAGCTGCATAAGTTTCCTGTCTCGATGGATGCCATGCAAAAATGGATGCACAACACCCAAGTTACTGTGGACATTAAATTTGCTTGGCGTTTTCGCATCTGCAGTCATCATTTTATACCAGATTGCTTTCAGGGCTCGCGCATCAGGCGTGGCGCAATGCCCACATTGCGTTTGGGATCGCGTCGACCCAAGCATATCTATGACAATGAGTTTAATAGTCAGCTGCAGCTTGAACTGCAGTCAAAAGAAGAATCCGCTCAGGCGATTGAGCCAGCACCAGCAATGGAGTCGCAGCAGCAGTTGCAATCAGCAAATATTGGCCTGCATCTGCCACGTCCTGCTCCGCCACGAAAATCCAGCAAATACTGTCAAATCGAAGGCTGTTCGAATCATTTAACCAGCGAAAATGTAACGCTACACAAGTTTCCTCACTCGGCGGACATGTGCGCCAAGTGGCAGCACAATACACAGGTACCCTTTGATCCAGAATATCGCTGGCGTTATCGCATTTGCAGCGCACATTTTTTGCCCTTCTGTTTGGGCAATGCGCGGCTGATGCATGGCAGTGTGCCGACACTTAATCTGGGACCGCTTGCGCCCAAGAAAGTGTTTGAAAATGATTTCATTCGTTTGGACAAGCTTAGGAGCAGCTTGGAGCTTGGCGCCACTGAACAATTTGATCAATTTGATGCAAACGATGACGATCAAGAGCACGAGGATTATAGTCTGCTGGAGCCAGAGCTGCAGCTACACGAAGGCAGTGATGATGACGAGCAACCATATAGCAATCATTTAAGCCACAACAATTCTTTTAACTGGAGCGATCAGCAGCTTCGTTTGCCCAGTATTAAGCAGGAGAAGAGCACCAGTTTCAATCCAGTTAAGTCGGGCTATGACAAATGCTCGTTGGTTCAATGCCAGCGCCAGCGTTCGCATCATGGCGTACACATCTATAAGTTTCCGCGCTCGCGTCAACTGCAGCAGCGTTGGATGCACAATTTGCGCATCCAATACGACGAGCTACGACCATGGAAGACAATGATTTGTAGCGTACACTTTGAGCCGCACTGCATTCGTTTGCGCAAACTGCGTCCCTGGGCGGTGCCCACACTGGAACTGGGTGACAATGTACCACAGGACCTCTTTACGAATGAGCAAAGCCAGCAGCTGTATGCACAGTCCGAAGCTGGCAGCGAGTGTGATGAGGGCGAAGTTGATGTAGAGGACACCATGCTGNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNCCAATTAAAGACAGCTAAATATGTGAAAAGGGAACGTCGCTCAAGATTTGATCCTTTGCCGCCGGGACAATTGCCACCTTGGAAAATCAAATCGTGCTGTTTGCCCTACTGTCGCAGTCCTCGCGGTGATGGCATCAAACTCTTTCGTCTGCCCAACAACATAAGCTCCATACGCAAATGGGAACGGGCTACAGGCATGCGATTCTATGAGTCTCAACGCAACACAAAGCTCATATGTAGTCGTCACTTTGAACCGTCGCTTATAGGCGTGCGTCGTCTTATGACGGATGCGGTTCCCAGCCTCCATCTGGGACCAGAGAGCGAAGATGTTGAGCTTTCTTCCATTGAGCCACGTTGTTGCATGCTCGATTGTCCCGAGGATGTTAATGTTCAGCTGCACAAATTTCCAAGTGATCCCAAGCTGCTGGATCAGTGGTGCCAGGCGCTTAATTTACCGGATGTTGAAAGCTATTCTGGCAAACATATTTGTGACACACATCTGCCAGCCAACGCGATGAGCTGCCTCATTTGTGGAGTTGAGGATGTGCAAATGCCAATGCTAGAGTTTCCTGTAAATCGCAATCAGCGCACCAAGTGGTGCTATAATCTTAAAATCGAGCCTCTGCCCAAGTGGGACAACTCAAAGCATATTTGCTGCAAGCACTTTGAGACCTACTGTTTCATTCAGCCGGGTCAATTGCTGCCGGAGGCAATGCCCACGCTGCACTTAAAGCATGGCGATAGCAACATATTCCTAAACGATGATACCCTGGACAACAGCAAAATGCTGCGCATCAAGGACGAGCCCATGGAAAGTGATGATCTGATGCTGTAA
Protein Sequence: MSQQHNNPPXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXSHVASYPTPHATAFAQPCKSSSNNNNNNNNNIMNAYGAGTGAYYGSPAAGGGGVGYNLEANTVAXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXPHIMHSSYPYIKSEPMDLPERHMQQQQQQQPHFPNPMAPPPAPAIPNRHSLDASGEMIIKSEPIEEHAFRSNYIDDNTPFADFSKYSEFADDMLSPKVELTVKDEGYGNQKNPLNYPRRKLQTERSAENMPICQRCKEVFFKKQIYLRHVAESNCNIHEYEFKCKICVMSFRAVEELHKHKLLHRADNFFCHKYCGKHFDSIAECESHEYMEHEYDSFVCNMCSVTFPTREQLYAHLPQHKFQQRYDCPICRLWYQTALELHEHRMAAPYFCGXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXDCHMGTIEMIPPHHKANTALPATAALSSLLQQRQANADGAALFASALKTETTVKLERSFSNSTSESGYSMQDSNYNNAYGSDSSLHGGGVGIGGLQAHSSTLDDSEDALCCVPLCGVRKSTSPTLQFFTFPKDEKYLHQWLHNLKMFHIPASSYANFRICSMHFPKRCINRYSLCYWAVPTFNLGHDDVANLYQNRELTNTFTTGEVARCSMPNCTSQRGESNLKFYNFPKDIKSLIKWCQNARLPVQAKEPRHFCSRHFEERCIGKFRLKPWAVPTLHLGAQYGKIHDNPKNLYVEEKRCCLNFCRRSRSSDFNMSLYRFPRDEVLLRRWCYNLRLDPAVYRGKNHKICSAHFIKEALGLRKLSPGAVPTLHLGHSDTFNIYENEXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXHYVDPEMSASYMSTGAGGSSSSLNVSDSMDICCVPSCESKRHNNENITFHTIPRRPEQMRKWCHNLKIPEDKMHKGMRICSLHFEPYCIGGCMRPFAVPTLNLGHDDEDIHRNPDVIKKLNIRETCCVTVCKRNRDRDHANLHRFPSNVSLLTKWCANLQRPVPDGTKLFNDAICEVHFEDRCLRNKRLEKWAVPTLILGHENIPYPVPTPEQVAEFYARPSAPNNGEEQGECCVETCKRNPSVDDIKLYRPPEESQVLAKWAHNLELEITKLPNLRICNLHFESHCIGKRMRPWAIPTLNLASNIDNLYENPERQLLYKRRTHLKPERAARGSLAAAGVKPTWVPRCCLPHCRKVRATHNVQLYRFPKLNRSTLAKWSHNLQLPMVGSAQRRLCSAHFEPHVLSKKCPVPLAVPTLELNTPPGYKIYQNPAKLKAKNLCLQRVCIVESCRRQRAQGVQLFRLPHNPTQLRKWMHNIRMRPRGAMRQQYRICSQHFETHSFNGKRLSAGAIPTLNLGHQDEDIFPNEAQSFVEEHCTVEGCNAAKDQPDVRLFRFPSEDEDLLWKWCNNLKMNPVDCIGVRICNKHFDPDCIGPKHLYKWAIPTLCLGHDDSDIELICNPKPEDRYVDPVFKCCVPTCGKTRKFDEVQMNSFPKDPTLFHRWRHNLRLEHLNFKERERYKICNAHFEDICIGKTRLNIGSIPTLELGHDETDDLFQVNPEELQSNLFGRQRRVQDSMRLDIKEEPHSELDEDVKPDLTMSEATDSNTKQVKIKKSLSESKCCVPTCGRSRLEHGARLFPFPNGKQQLNKWRHNLQLSASDVDKTTRICSAHFSRRCIDGNQLRSWAMPTQQLGHLEQPIYENPKNIPGFFTPTCALAHCRKRRSIDNELRTYRYPRSEELLEKWRVNLRLSPDQCRGRICADHFEPVVRGKLKLKTGAVPTLKLGHDEGVVFDNEAIKALLQLDEEEDDDEEGGADVSFKSLVKVKTEKEEEKEQELENNGEEEEQEQDDEEDHPDSDDNGYFDPLALVETFAERHXXXXXXXXXXXXXXXXXXXXXXXXXLLLPDTQPMQLTLAPRREKAVNNVTPICCLKHCRKERTAIHHLSTFGFPKDPQLLLKWSANLQLPLEDCMGRVCVEHFEPVMLGTRKLKQNAVPTLKLGHATPLTYSCNGKMLSGIYDEQPQHSVFRLWSLKHCRKRKSESELELEQQQQQMQMQKLSDIKSVRRCCLPSCGKQSELHGVQLHRMPKDRMMLRKWLHNLKLPPTTDCTHMFLCSDHFEMSAPCPTLKLGHSDTNIYRHSTPSSISAGCLVPKCTCARLNLYRGYDLPANQQVQEAWLGWLQLPHPQPSPRHAQLCVMHFMQLYEQVPLPDSVPDFVHRQLRETYEQISSSSMAMKLRCAVPGCYSKYTDNVRLTKLPVCSNTCAKWVHNTKIPYEAARHYVYRICMLHFEPSCLGPVRPKIWAMPTLQLHHTDTNIYLNPKLDGSLTHQQPVVPLELPLRIKTELPMCNSPSFTASASPSPRGKLRSCCIPSCGQQASALTRLFRFPSAETALLKWLVNTQQQPRFVDTQRLFICQEHFEAEAICQNQLRSWAVPTLNLGHDGHIIPNARHNGNIADSQENKQTLQFIWANYCSVLSCFQRRSDELRLYPYPTDRPIIRKWAANCKHRSMQASSDGFQVCQSHFISDCFDPDTGDLKEDAVPTLALNRIVNEVRCVVNGCVKDEDAPRRLFKMPKLVAQISDWCHNLRLDRTAISSTDSHVCERHFEAQCFNVYKALRPGARPTLHLGHEDLDDLLPNPANFEEDAFVCCVPNCGRSKDADNALLFGLPKVRQMAEKWLQNIHLDPNKDQLACLKICSVHFEARCLENGRPTYGAMPTLHLGHEQLHNIHPIVEPSPTKQRLYCNRDGASHDCCYPQCVELQKSYLRVSYELPQKQELREQWLSYMGLKEPLDKQQFPKLCPLHLILLYDHSVDNFSAHAGEELLDADYEASRSSVRIRIVSCAVRGCRTLKPRDGGRLHGLPTRRDLLEMWLHNMQLVFYEQQRYMYKICSKHFEPMCLTETTRRLKPWSMPTLELPERQPGEMPPYQNPTEGEWQRMNELHASASSKIEEPFEPLIKLEPLCKLEQPQQTEMEYEEDYDNNSQQPLEMQALEVLLEVGHVEKCATYEQMDTEPNPNYAEQLSPLSAIIPQGRSIAPAQNGFHYSARVCSVHGCNVNTNNIDSNTKLHKFPVSMDAMQKWMHNTQVTVDIKFAWRFRICSHHFIPDCFQGSRIRRGAMPTLRLGSRRPKHIYDNEFNSQLQLELQSKEESAQAIEPAPAMESQQQLQSANIGLHLPRPAPPRKSSKYCQIEGCSNHLTSENVTLHKFPHSADMCAKWQHNTQVPFDPEYRWRYRICSAHFLPFCLGNARLMHGSVPTLNLGPLAPKKVFENDFIRLDKLRSSLELGATEQFDQFDANDDDQEHEDYSLLEPELQLHEGSDDDEQPYSNHLSHNNSFNWSDQQLRLPSIKQEKSTSFNPVKSGYDKCSLVQCQRQRSHHGVHIYKFPRSRQLQQRWMHNLRIQYDELRPWKTMICSVHFEPHCIRLRKLRPWAVPTLELGDNVPQDLFTNEQSQQLYAQSEAGSECDEGEVDVEDTMLXXXXXXXXXXXXXXXXXXXXXXXQLKTAKYVKRERRSRFDPLPPGQLPPWKIKSCCLPYCRSPRGDGIKLFRLPNNISSIRKWERATGMRFYESQRNTKLICSRHFEPSLIGVRRLMTDAVPSLHLGPESEDVELSSIEPRCCMLDCPEDVNVQLHKFPSDPKLLDQWCQALNLPDVESYSGKHICDTHLPANAMSCLICGVEDVQMPMLEFPVNRNQRTKWCYNLKIEPLPKWDNSKHICCKHFETYCFIQPGQLLPEAMPTLHLKHGDSNIFLNDDTLDNSKMLRIKDEPMESDDLML

Similar Transcription Factors

Sequence clustering based on sequence similarity using MMseqs2

100% Identity: iTF_00595971;
90% Identity: iTF_01321957;
80% Identity: -