Basic Information

Insect: Scaptomyza graminum
Gene Symbol: -
Assembly: GCA_018901835.1
Location: JAEIFL010000002.1:4694584-4708366[+]

Transcription Factor Domain

TF Family: THAP
Domain: THAP domain
PFAM: PF05485
TF Group: Zinc-Coordinating Group
Description: The THAP domain is a putative DNA-binding domain (DBD) and probably also binds a zinc ion. It features the conserved C2CH architecture (consensus sequence: Cys - 2-4 residues - Cys - 35-50 residues - Cys - 2 residues - His). Other universal features include the location of the domain at the N-termini of proteins, its size of about 90 residues, a C-terminal AVPTIF box and several other conserved residues. Orthologues of the human THAP domain have been identified in other vertebrates and probably worms and flies, but not in other eukaryotes or any prokaryotes [1].
Hmmscan Out: # of c-Evalue i-Evalue score bias hmm coord from hmm coord to ali coord from ali coord to env coord from env coord to acc

1 28 7.7e-15 6.2e-12 45.9 4.6 1 86 581 653 581 654 0.85

2 28 5.9e-15 4.8e-12 46.3 4.6 1 87 681 750 681 750 0.83

3 28 1.4e-15 1.2e-12 48.2 0.4 1 87 772 844 772 844 0.85

4 28 9.5e-16 7.6e-13 48.8 5.3 1 87 937 1007 937 1007 0.83

5 28 1.6e-14 1.2e-11 44.9 3.4 1 86 1031 1102 1031 1103 0.82

6 28 1.8e-12 1.5e-09 38.3 1.2 1 87 1138 1206 1138 1206 0.80

7 28 1.9e-10 1.5e-07 31.8 2.2 1 86 1253 1322 1253 1323 0.76

8 28 6.7e-17 5.4e-14 52.5 0.3 1 87 1350 1420 1350 1420 0.83

9 28 6.7e-13 5.4e-10 39.7 2.6 1 86 1441 1510 1441 1511 0.83

10 28 2.7e-14 2.2e-11 44.1 2.1 1 86 1538 1609 1538 1610 0.85

11 28 2.3e-14 1.8e-11 44.4 1.8 1 85 1686 1754 1686 1756 0.82

12 28 3.1e-12 2.5e-09 37.6 0.1 1 86 1779 1847 1779 1848 0.82

13 28 3.8e-13 3.1e-10 40.5 0.7 1 86 1994 2062 1994 2063 0.80

14 28 3.8e-13 3e-10 40.5 1.3 1 62 2138 2197 2138 2215 0.78

15 28 0.00042 0.33 11.5 0.2 1 59 2220 2272 2220 2295 0.75

16 28 3.8e-11 3e-08 34.1 0.9 1 86 2310 2379 2310 2380 0.84

17 28 2.1e-14 1.7e-11 44.5 1.3 1 87 2440 2510 2440 2510 0.82

18 28 4.9e-12 3.9e-09 36.9 0.7 1 86 2545 2616 2545 2617 0.80

19 28 2.7e-12 2.1e-09 37.8 0.4 1 87 2627 2698 2627 2698 0.80

20 28 5.3e-13 4.2e-10 40.0 0.7 1 87 2721 2792 2721 2792 0.78

21 28 2.2e-05 0.018 15.6 0.1 1 58 2825 2877 2825 2892 0.84

22 28 2e-14 1.6e-11 44.6 0.1 1 86 2915 2987 2915 2988 0.81

23 28 1.8e-14 1.4e-11 44.7 1.4 1 86 3123 3195 3123 3196 0.83

24 28 2.6e-14 2.1e-11 44.2 1.7 1 87 3262 3333 3262 3333 0.82

25 28 4.6e-14 3.7e-11 43.4 4.9 1 86 3440 3510 3440 3511 0.85

26 28 4.9e-13 3.9e-10 40.1 0.1 1 87 3606 3676 3606 3676 0.85

27 28 1.1e-07 9e-05 22.9 0.8 1 58 3693 3741 3693 3755 0.85

28 28 1.9e-09 1.5e-06 28.6 1.4 18 87 3758 3816 3747 3816 0.76

#	of	c-Evalue	i-Evalue	score	bias	hmm coord from	hmm coord to	ali coord from	ali coord to	env coord from	env coord to	acc
1	28	7.7e-15	6.2e-12	45.9	4.6	1	86	581	653	581	654	0.85
2	28	5.9e-15	4.8e-12	46.3	4.6	1	87	681	750	681	750	0.83
3	28	1.4e-15	1.2e-12	48.2	0.4	1	87	772	844	772	844	0.85
4	28	9.5e-16	7.6e-13	48.8	5.3	1	87	937	1007	937	1007	0.83
5	28	1.6e-14	1.2e-11	44.9	3.4	1	86	1031	1102	1031	1103	0.82
6	28	1.8e-12	1.5e-09	38.3	1.2	1	87	1138	1206	1138	1206	0.80
7	28	1.9e-10	1.5e-07	31.8	2.2	1	86	1253	1322	1253	1323	0.76
8	28	6.7e-17	5.4e-14	52.5	0.3	1	87	1350	1420	1350	1420	0.83
9	28	6.7e-13	5.4e-10	39.7	2.6	1	86	1441	1510	1441	1511	0.83
10	28	2.7e-14	2.2e-11	44.1	2.1	1	86	1538	1609	1538	1610	0.85
11	28	2.3e-14	1.8e-11	44.4	1.8	1	85	1686	1754	1686	1756	0.82
12	28	3.1e-12	2.5e-09	37.6	0.1	1	86	1779	1847	1779	1848	0.82
13	28	3.8e-13	3.1e-10	40.5	0.7	1	86	1994	2062	1994	2063	0.80
14	28	3.8e-13	3e-10	40.5	1.3	1	62	2138	2197	2138	2215	0.78
15	28	0.00042	0.33	11.5	0.2	1	59	2220	2272	2220	2295	0.75
16	28	3.8e-11	3e-08	34.1	0.9	1	86	2310	2379	2310	2380	0.84
17	28	2.1e-14	1.7e-11	44.5	1.3	1	87	2440	2510	2440	2510	0.82
18	28	4.9e-12	3.9e-09	36.9	0.7	1	86	2545	2616	2545	2617	0.80
19	28	2.7e-12	2.1e-09	37.8	0.4	1	87	2627	2698	2627	2698	0.80
20	28	5.3e-13	4.2e-10	40.0	0.7	1	87	2721	2792	2721	2792	0.78
21	28	2.2e-05	0.018	15.6	0.1	1	58	2825	2877	2825	2892	0.84
22	28	2e-14	1.6e-11	44.6	0.1	1	86	2915	2987	2915	2988	0.81
23	28	1.8e-14	1.4e-11	44.7	1.4	1	86	3123	3195	3123	3196	0.83
24	28	2.6e-14	2.1e-11	44.2	1.7	1	87	3262	3333	3262	3333	0.82
25	28	4.6e-14	3.7e-11	43.4	4.9	1	86	3440	3510	3440	3511	0.85
26	28	4.9e-13	3.9e-10	40.1	0.1	1	87	3606	3676	3606	3676	0.85
27	28	1.1e-07	9e-05	22.9	0.8	1	58	3693	3741	3693	3755	0.85
28	28	1.9e-09	1.5e-06	28.6	1.4	18	87	3758	3816	3747	3816	0.76

Sequence Information

Coding Sequence: ATGTCACAACAACACAACAACCCCCCNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNCAATTGGTACTCACATGTTGCTTCCTATCCAACCCCGCATGCCGCTGCCTTTGCGCAACCCTGCAAGAGCAGCAGCAGCAACAACAATAATAACAACAACATTATGAATGCTTACGGCGCGGGTGCAGGTGCGTATTATGGCTCTCCGGCAGCGAGCGGCGGTGGGGTTGGCTATAACCTTGAGGCCAATACTGTGGCCTATGCGCACAACCAGCTGCTGCAATACNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNCACAGCTCGTATCCCTACATTAAGAGCGAACCCATGGACCTGCCCGAACGCCATCAGCAGCAGCAGCAGCAACAACAACAACAGCATCAACATTTTCAGAATCCTATGGCACCGCCGCCAGCACCCGCCATTCCCAACCGTCACTCGCTCGATGCCAACGGCGAAATGATAATAAAATCGGAACCCATTGACGACCATGCTTTCAAGTCCAACTATATTGACGATAATACGCCCTTTGCCGATTTTAGTAAATTTCCCGAATTTGGTGACGATATGCTAAGCCCTAAGATTGAGCTAACCGTCAAGGATGAGGGCTATGGTAACCAAAAAAATCCGTTAAACTATCCACGTCGCAAGCTGCAAACGGAGCGCTCTGCAGAAAATATGCCCATTTGTCAGCGGTGCAAGGAGGTGTTCTTCAAGAAACAGATATATCTGCGCCATGTAGCCGAGAGCAATTGTAATATACACGAATATGATTTCAAGTGCAACATTTGCGTTATGTCCTTTGGGGCTGTCGAGGAGCTGCACAAACACAAGCTTTTACATCGCGCCGACAAGTTCTTCTGCCACAAATACTGTGGCAAGCATTTTGATTCGATTGCAGAATGCGAATCGCATGAATACATGGAGCACGAGTACGACAGCTTTGTGTGCAATATGTGCTCTGTTACGTTCCCGACACGGGAACAGCTGTATGCTCATTTGCCGCAACATAAGTTCCACCAGCGTTACGATTGCCCGATTTGCCGTTTGTGGTATCAAACGGCATTAGAGCTGCACGAGCATCGAATGGCGGCACCGTATTTCTGTGGAAAGTATTANNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNGATTGTCATATGGGCACCATAGAAATGACTCCAACGCATCACAAGGCGAATACAGCATTGCCTGCAACGGCGGCGCTCAGTTCGCTGTTGCAACAGCGTCAGGCGAATGCTGATGGAGCCGCCTTGTACGCTTCGGCACTGAAGACGGAAACAAATGTGAAATTGGAGCGCAGCTTTAGCAACTCCACCAGCGAGTCGGGATACAGCATGCAGGACAGCAGCTATAATAATGCCTACGGCAGCGATAACTCGCTGCACGGTGGAGGCGTCGGAATTGGTGGTCCGCAGGCGCATTCCTCGACTCTGGACGACTCAGAAGATGCGCTGTGCTGTGTGCCGCTGTGCGGTGTGCGCAAGAGCACCAGCCCGACGCTACAGTTCTTTACGTTTCCAAAGGATGAAAAATATTTACATCAGTGGCTGCACAATCTCAAAATGTTTCACATTCCAGCCTCCAGCTATGCCAACTTTCGTATTTGCAGCATGCACTTTCCCAAGCGCTGTATTAATCGTTACTCGCTTTGCTATTGGGCGGTGCCCACATTTAATCTGGGTCACGACGATGTCGCCAATCTCTATCAGAATCGTGAACTGACCAACACTTTCACCACCGGCGAGGTGGCACGCTGCAGCATGCCCAATTGCACAAGTCAGCGCGGCGAGAGCAATCTCAAGTTCTACAATTTTCCTAAGGACATCAAGAGTTTGATTAAGTGGTGCCAGAATGCACGCTTGCCTGTTCAAGCCAAGGAGCCGCGTCACTTTTGCAGTCGCCACTTTGAGGAGCGCTGCATTGGAAAGTTTCGGCTTAAGCCCTGGGCAGTGCCCACACTACATTTGGGCGCCCAATACGGCAAGATTCATGACAATCCCAAGAACCTATATGTGGAGGAGAAGCGTTGCTGTTTAAACTTTTGCCGTCGCAGTCGCTCCTCTGATTTTAATATGTCACTGTATCGCTTTCCTAGGGATGAGGTACTGTTGCGTCGTTGGTGCTACAATCTGCGCCTTGATCCGGCTGTTTATCGTGGCAAGAATCACAAAATATGCAGCGCTCACTTTATTAAGGAAGCGTTGGGTCTACGCAAGTTATCGCCAGGAGCTGTTCCCACGCTGCACTTGGGACACAGTGACACCTTCAATATCTACGAGAACGAACTTTGGCCACCACCAAATCCGTCAACACCCACCCACAGTNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNGTCACTCGGCTGCATCCACATCCTCGTCAGCCTCATCGGCATCACATTATGTTGATCCAGAAATGAGTGCATCCTATATGAGCATGGGCGCTGGAGGCTCATCCTCTAGCCTCAACGTCAGCGACAGCATGGATATCTGTTGTGTGCCCAGCTGCGAGAGCAAACGTCACAACAACGAGAACATTACATTCCACACAATTCCCCGGCGGCCAGAGCAAATGCGCAAATGGTGTCACAATTTAAAGATACCCGAAGACAAGATGCACAAAGGCATGCGAATATGTAGCCTACACTTTGAGCCCTACTGCATTGGTGGCTGCATGCGTCCATTTGCTGTGCCCACACTGAATCTGGGTCACGACGACGAGGACATTCATCGCAATCCGGATGTGATCAAGAAACTCAATATACGCGAAACGTGTTGTGTTGCGGTTTGCAAGCGCAATCGTGACCGGGATCATGCCAATCTGCATCGTTTTCCAAGCAATGTGTCATTGCTGACCAAGTGGTGTGCCAATCTGCAGCGTCCTGTGCCGGATGGCACGAAGCTCTTCAACGATGCCATCTGTGAGGTGCACTTTGAGGATCGATGCTTGCGCAACAAGCGGTTGGAAAAGTGGGCAGTGCCAACTCTCATACTGGGGCATGAGAATATACCCTATCCGGTGCCAACGCCAGAGCAGGTTGCCGAGTTCTATGCCCGTCCCAGTGCACCAAACAATGGCGAGGAGCAGGGCGAGTGTTGTGTAGAGACTTGTAAACGTAATCCAAGCGTTGACGACATTAAGCTATATCGCCCGCCCGAAGAGTCGCAGGTGCTTGCCAAATGGGCGCACAATTTAGAGCTGGAGATTACCAAGTTGCCAAATTTGAGAATATGCAATCTGCACTTTGAATCCCACTGCATTGGCAAACGAATGCGTCCATGGGCCATACCCACACTCAATCTGGCCAGCAACATTGAGAATCTCTACGAGAATCCGGAACGCCAAATGCTCTACAAGCGACGCACACATCTCAAACCGGAGAGAGCAGCTCGAGGCTCTTTAGCAGCCGCTGGTGTAAAGCCCACCTGGGTGCCACGCTGCTGCTTGCCGCACTGTCGCAAGGTGCGTGCCACACACAATGTCCAGCTGTATCGCTTCCCCAAACTCAATCGCTCCACGCTGGCCAAGTGGTCACATAATCTGCAGGTGCCGATGGTGGGCAGTGCCCAGCGTCGTCTTTGCTCCGCCCACTTTGAGCCGCACGTGCTAAGCAAGAAGTGTCCGGTGCCCTTGGCGGTACCCACACTGGAACTCAATACACCACCCGGCTACAAGATCTATCAGAATCCCGCCAAGCTTAAGGCTAAAAACCTGTGCCTTCAGCGCGTCTGCATTGTTGAGAGCTGCCGACGCCAACGGGCGCAGGGTGTGCAGCTTTTCCGTCTTCCTCATAATCCCACCCAGCTGCGCAAGTGGATGCACAACATCCGGATGCGTCCCCGAGGTGCTATGCGACAACAATATCGCATCTGCTCACAGCACTTTGAAACACACTCGTTTAACGGCAAAAGATTGAGTGCGGGTGCAATTCCAACGCTGAACCTAGGTCATCAAGATGAGGACATTTTTCCGAATGAGGCGCAGTCTTTCGTGGAGGAGCACTGCACAGTCGAGGGCTGCGATGCAAGCAAAGAGCAACCGGACGTACGTCTCTTCCGTTTCCCAAGCGAAGATGAGGATCTGCTCTGGAAGTGGTGCAACAATCTCAAAATGAATCCAGTCGATTGCACTGGTGTACGCATCTGCAACAAACACTTCGAACCGGATTGCATTGGACCCAAACATTTGTACAAGTGGGCAATTCCCACGCTCTGCCTAGGTCACGATGATTCTGACATTGAGCTTATATGCAATCCCAAGCCAGAGGATCGGTACGTTGATCCGGTCTTTAAATGCTGTGTGCCGACGTGCGGCAAGACGCGCAAGTTTGATGAGGTGCAAATGAATAGCTTTCCCAAAGATCCAACTCTCTTCCATCGCTGGCGTCACAATCTTCGTTTGGAGCACCTTAACTTCAAAGAACGGGAACGTTATAAGATCTGCAATGCACACTTTGAGGATATTTGCATTGGCAAGACGCGTTTAAACATTGGTTCAATACCAACACTGGAATTAGGCCATGACGAGACTGATGACTTGTTTCAAGTTAATCCCGAAGAGTTGCAGAGCAATCTATTTGGACGCCAGCGACGTGTGCAAGACTCTATGAGAGTTGGCATAAAAGAGGAGCCGCATTCCGAGCCAGACGAAGACGTTAAACCAGACTTAACTATTTCGGAAGCCACGGACTCAAATACAACGCAGGTTAAAATCAAGAAATCAATATCCGAACTCAAGTGCTGTGTGCCAAGCTGTGGTCGCAGTCGTTTGGAGCATGGTGCCCGCCTCTTTCCCTTCCCAAGTGGCAAACAGCAGCTGAACAAATGGCGTCACAATCTACAGCTAACTGCATCAGATGTGGACAAGACATCGCGCATTTGCAGCGCCCACTTTAGCCGTCGTTGCATCGATGGCAAGCAACTAAGGAGCTGGGCAATGCCAACTCAGCAGCTGGGCCATCTCGAGCAGCCGATCTATGAGAATCCAAAAAATATACCGGGCTTCTTTACGCCAACATGTGCGCTGGCCCACTGTCGCAAGCGGCGCAGCATTGACAATGAATTGCGCACCTACCGATATCCACGCAGCGAGGAGCTGCTTGAGAAGTGGCGAGTTAATCTGCGTTTGACGCCGGATCAGTGTCGCGGACGCATCTGTGCGGATCATTTTGAGCCGGTGGTGCGAGGCAAACTGAAGCTTAAAACGGGCGCGGTGCCTACACTCAAATTGGGGCACGATGAAGGCGTGGTCTTTGATAATGAAGCCATTAAAGCCTTACTGCAGCTGGATGAGGAGGAGGACGACGATGAAGAAGGAGAGGCCGATGTTAGTTACCGTTCGTTGGTAAAAGTAAAGACTGAGAAAGAAGAGGAGGAGAAGGAACCAGAACATGAGCTTGAGAACAATGATGAAGAGGAGGAACAGGAACAGGATGATGAAGAAGATCATCCGGATTCAGATGATCATGGCTATTTCGATCCGCTGGAGCTTGTGGAAACCTTTGCCGAGCGTCACAGCGATGATAACTCTGTCGACGACGATGATGATGATGATGAGGACATTCCGGGCAATGACGATGAGCTCCTGATACCTGATACACAGCCAATGCAACTCACACTGGCACCACGACGCGAAAAAGCTGTTAACAATGTGACGCCAATTTGTTGTTTGAAACATTGTCGAAAGGAGCGTACCGCCATTCATCATCTGAGCACTTTTGGCTTTCCCAAGGATCCGCAGCTGTTGCTCAAGTGGAGCGCTAATTTGCAGTTGCCGCTAGAGGATTGCGTGGGTCGTGTATGCGTTGAGCATTTTGAGCCTGTGATGTTGGGCACGCGCAAGCTGAAGCAGAATGCTGTGCCCACTTTAAAATTGGGGCATGCAACACCGCTCACATATAGCTGCAATGGTAGAATGCTGTCGGGTATTTATGATGGACAGCCGCAACATTCGGTTTTTCGGCTTTGGAGCCTGAAACACTGCCGCAAAAGGAAGTCGGAGTCGGAGCTAGAGATGGAGCGGGAGCGGGAGCAGCAGCAGCAGCAGCAGCAGCAGAAGATGCAGAAACTGGCAGATATTAAGTCTGTCCGTCGCTGTTGCCTGCCCAGCTGTGGCAAGCAGTCGGAGTTGCATGGTGTACAATTGCATCGCCTGCCCAAAGATCGAATGATGCTGCGCAAATGGTTGCACAATCTAAAGCTACCACCGACAACGGATTGCACTCACATGTTTCTCTGCAGTGATCACTTTGAGATGAATGCGCCGTGTCCAACCTTAAAGCTAGGACATTCGGACAGCAATATTTATAGGCACAGTACGCCCAGCTCCATCAGCGCCGGCTGCCTAGTATCCAAATGTACTTGTGCGCGTCTTAATCTCTATCGTGGCTATGATTTGCCTGCGAATCAGCAAGTTCAGGAGGCATGGCTAAGTTGGCTACAGCTGCCCCATCCGCAGCCATCGCCCCGGCACGCCCAGCTATGTGTAATGCACTTTATGCAGCTTTATGAACAGGTGCCGCTACCTGATTCGGTGCCTGATTTTGTGCACCGCCAGCTGCGTGAGACCTACGAGCAAATATCCAGCTCCAGCATGGCCATGAAGCTACGATGTGCTGTGCCCGGCTGCTACTCCAAGTATACAGACAATGTGCGTTTGACCAAGTTGCCAGTTTGCCCCAAAACGTGCGCCAAATGGGTGCACAATACCAAGATTCCATACGAAGCGGCTCGACATTATGTCTATCGCATCTGTATGCTGCACTTTGAGCCCAGCTGCCTGGGTCCCGTGCGTCCCAAAATATGGGCAATGCCCACGCTCCAACTGCACCACACGGATAAAAATATTTATTTAAATCCCAAACTGGATGGCAGCCTAGCACAGCAGCAGCCTGTGGTGCCGCTGGAGCTGCCGCTGCGCATCAAAACGGAGCTGCCAATGTGCAACAGTCCAAGCTTTAGCGCCAGTGCAAGTCCCAGTCCGCGTGGCAAACTACGCAGCTGTTGCATACCCAGCTGCGGACAACAGGCTTCCGCTCTGACGCGTCTTTTTCGATTTCCCAGCTCGGAGACGGCTTTGTTGAAATGGCTGGTGAATACGCAGCAACAGCCGCGCTTTGTCGACACACAACGGCTGTTCATATGTCAAGAACACTTTGAGGATGAGGCGATTTGCCAAAATCAGCTGCGCAGCTGGGCGGTGCCCACGTTGAATCTGGGACATGATGGACACATTATTCCGAACGCCCGACATAATGGCAATATTGCTGATAGCCAGGAGAACAAGCAGACGCTACAGTTTATCTGGGAAAATTACTGCTCAGTGCTGAGCTGCTTTCAGCAGAGAAGCGACGAACTGCGTCTCTATCCATATCCAACGGATAGGCCAACAATTCGCAAGTGGGCTGCCAACTGTAAACATCGTTCCATGCAAGCCAGCAGCGATGGCTTCCAGGTTTGCCAGTCGCATTTTACTTCCGATTGCTTTGATCCTGATACTGGAGAGGTGAAGGAGGATGCTGTGCCCACGCTGGCGCTTAATCGCCTTGTGAAGGAGGTTCGCTGTGTTGTCAATGGTTGCGTTAAGGATGAGGATGCACCGCGACGTCTGTTCAAGATGCCTAAGCTTGCTGCACAGATATCCGATTGGTGCCACAATCTGCGCCTAGATCGAATGGCCATAAGCGGCACGGATTCGCACGTATGTGAGCGCCACTTTGAAGCACAATGCTTTAACGTCTACAAAGCGCTGCGTCCAGGAGCCCGACCCACACTGCATTTGGGTCATGAAGACCTAGATGATTTGTTGCCCAATCCAGCCAACTTTGAGGAGGATGCGTTCATGTGCTGTGTTCCCAATTGCGGGCGATCTAAAGATGCGGATAATGCCCTACTGTTTGGGCTGCCAAAGGTGCGTCAAATGGCTGAGAAATGGTTACAAAATATTCACCTCGATCCAAACAAGGACCAACTGGCCTGCCTCAGGATTTGCAGTGTGCACTTTGAGGCCAGATGTTTGGAGAATGGACGTCCCACCTGTGGTGCCATGCCAACGCTCCATCTGGGTCATGAACAACTGCACAGCATACACTCAATTGTTGAACCGTCTCCAGCAAAGCAGAGGCTTTATTGCAACAGAGATGGCGCCAGTCACGACTGCTGCTATCCCCAGTGTGTTGAGCTGCAGAAAAGCTATCTGCGTGTCACCTACGAGCTACCCCAGAAGCAGGAGCTGCGTGAGCAATGGCTCTCCTATATGGGCCTGGATGAGCCGCTCGATAAGCAGCAGTTTCCCAAGCTCTGTCCGCTACACTTGATCTTGCTCTATGATCACAGTGCGGATAACTTTTCGGCACATGCAGGCGAGGAGCTGCTGGACGCCGACTATGAGGCATCGCGCAGCAGCGTTCGCATTCGTATTGTGAGCTGTGCGGTGCGTGGATGCAAAACGCTCAAACCACGCGATGGAGGACGTCTACATGGCTTGCCTACTCGCCGCGATTTGCTCGAGATGTGGCTACATAATATGCAGCTGGTGTTTTACGAGCAGCAGCGTTATATGTACAAAATATGCAGCAAGCACTTTGAGCCCATGTGTCTGACGGAGACAACCAGACGCCTGAAGCCTTGGAGCATGCCAACGCTGGAGTTGCCAGAGCGTCAACCAGGCGAAATGCCTCCGTATCAGAATCCCACAGAGGGGGAGTGGCAGCATATGAATGAACTGCACGCCAGCGCCTCGACGCAGATTCAGGTGCCGTCAGAGCCATTGGTTAAGCTAGAGCCGTTGTGCAAGTTGGAGCCACCACCCCAGCAGTCGGAATTGGAATATGATGAGGATTGTGACTACAACTCACAGCAGCCGCTGGAAATGCAGGCGTTGGAGGTGCTGCTAGAGGTAGGTCATGTCGAGAAGTGTGCCACCTATGAGCAAATGGATACCGAGCCAAATCCCAACTATGCCGAGCAGCTCTCTCCCTTGAGTGCAATTATACCGCAGAGCCGCAGCATTGCGCCTGTCCAGAATGGATTCCATTATAGCGCACGTGTGTGCAGCGTGCATGGCTGCAATGTCAACACTAGTAATATAGATAGCAACATAAAGCTGCACAAGTTTCCCGTCTCAATGGATGCCATGCAAAAATGGATGCACAACACCCAAGTTACTGTGGACATTAAATTTGCTTGGCGTTTTCGCATCTGCAGTCATCATTTTATACCAGACTGCTTTCAGGGCTCGCGCATCAGGCGTGGCGCAATGCCCACGTTGCGTTTGGGATCGCGACGACCCAAGCATATCTATGACAATGAGTTTAATAGCCAATTGCAGCTAGAACTGCAGTCGAAAGAGGAAACCGCCCAGGAGATTGACCTAGTACCAGCAATAGAGTCGCAGCAACAGTTGCAATCAGCAAATATTGGTCTGCGTCTGCCGCGCCCTGCTCCGCCACGCAAATCCAGCAAGTACTGTCAAATCGAAGGATGTTCGAATCATTTAACCAGCGAGAATGTTACGCTACACAAGTTTCCCCACTCGGCGGACATGTGTGCCAAGTGGCAACACAATACGCAGGTACCCTTTGATCCCGAATATCGCTGGCGTTATCGCATATGCAGCGCACACTTTGAGCCCATCTGTTTGGGCAATGTGAGGCTGATGCATGGCAGTGTGCCGACACTAAATCTGGGACCGCTGGCGCCTAAGAAAGTGTTCGAAAATGATTTCATTCGTCTGGACAAGCCTAGGAGCAGCTTGGAGCTTGGCGCAATGGAACAATTTGATCAATTTGATGCAAATGATGACGATCAAGAGCAGGAGGATTATAGTCTGCTGGAGCCAGAGCTGCAGCTACACGTAGGCAGCGATGATGAGGAGCAACCATATGACAATCGTTTTAGCCGCAACAATTCGTTTAACTGGAGCGATCAGCAGCTGCGTTTGCCCAGTATTAAGCAGGAAAAGAGCACCAGCTACAATCCAGTCAAGTCTGGCTATGACAAATGCTCGTTGGTTCACTGCCAGCGCCACCGTTCGCATCATGGCGTACACATCTATAAGTTTCCGCGCTCGCGTCAATTGCAGCAGCGTTGGATGCACAATTTGCGCATCCAATACGACGAGCGACGACCATGGAAGACAATGATTTGTAGCGTACACTTTGAGCCGCACTGCATTCGTTTGCGCAAGCTGCGTCCGTGGGCGGTGCCCACACTGGAACTGGGTGACAATGTGCCGCAGGAGCTCTTTACGAATGAGCAGAGCCAGCAGCTGTATGCACAGTCCGAAGCAGGCAGCGATTGTGATGAGGTCGAAGTTGATGTAGGGGACACCATGCTGGAGGACTTGNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNCAATTACAGGCAGCTATATATGTGAAAAGGGAACGTCGCTCACGATTTGATCCTTTGCCGCCGGGACAATTGCCGCCTTGGAAAATCAAATCGTGCTGTTTGCCCTACTGTCGCAGTCCTCGCGGTGATGGCATCAAACTCTTTCGTCTGCCCAATAACATAAGTTCCATACGCAAATGGGAACGAGCTACAGGGATGCGCTTCTATGAGTCTCAGCGCAACACAAAGCTCATATGTAGTCGTCACTTTGAACCGTCGCTTATGGGCGTGCGTCGTCTTATGACGGATGCGGTGCCCAGCCTCCATCTGGGACCAGAGAGCGCAGATGTTAAGCTGCCTTCCATTGAGCCACGTTGTTGCATGCTTGATTGTCCCGAGGATGTCAATGTTGAGCTGCACAAGTTTCCAAGTGATCCCAAGCTGCTGGAACAATGGTGCCAGGCGCTTAATGTAATGGATGTTGAAAGCTATTGTGGCAAACATATTTGTGACACACATCTGCCCGCCAACGCGATGAGCTGTCTCATTTGTGGTGTTGAGGATGTGCAAATGCCAATGCTGGAATTTCCTGGAAATCGCAATCAGCGCACCAAGTGGTGCCACAATCTTCAAATCGACCCTCTACCCAAGTGGGACAACTCAAAGCATATTTGCTGCAAGCACTTTGAGACCTACTGTTTCATTCAGCCGGGTCAATTGCTCCCGGAAGCAATGCCCACGCTGCATTTAAAACATGGCGATAACAATATATTTCTAAACGATGACACCATGGACAACAGCAAAATGCTGCGCATCAAGGACGAGCCCATGGAAAGTGATGATCTGATGCTGTAA
Protein Sequence: MSQQHNNPPXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXNWYSHVASYPTPHAAAFAQPCKSSSSNNNNNNNIMNAYGAGAGAYYGSPAASGGGVGYNLEANTVAYAHNQLLQYXXXXXXXXXXXXXXXXXXXXXXXXXXXHSSYPYIKSEPMDLPERHQQQQQQQQQQHQHFQNPMAPPPAPAIPNRHSLDANGEMIIKSEPIDDHAFKSNYIDDNTPFADFSKFPEFGDDMLSPKIELTVKDEGYGNQKNPLNYPRRKLQTERSAENMPICQRCKEVFFKKQIYLRHVAESNCNIHEYDFKCNICVMSFGAVEELHKHKLLHRADKFFCHKYCGKHFDSIAECESHEYMEHEYDSFVCNMCSVTFPTREQLYAHLPQHKFHQRYDCPICRLWYQTALELHEHRMAAPYFCGKYXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXDCHMGTIEMTPTHHKANTALPATAALSSLLQQRQANADGAALYASALKTETNVKLERSFSNSTSESGYSMQDSSYNNAYGSDNSLHGGGVGIGGPQAHSSTLDDSEDALCCVPLCGVRKSTSPTLQFFTFPKDEKYLHQWLHNLKMFHIPASSYANFRICSMHFPKRCINRYSLCYWAVPTFNLGHDDVANLYQNRELTNTFTTGEVARCSMPNCTSQRGESNLKFYNFPKDIKSLIKWCQNARLPVQAKEPRHFCSRHFEERCIGKFRLKPWAVPTLHLGAQYGKIHDNPKNLYVEEKRCCLNFCRRSRSSDFNMSLYRFPRDEVLLRRWCYNLRLDPAVYRGKNHKICSAHFIKEALGLRKLSPGAVPTLHLGHSDTFNIYENELWPPPNPSTPTHSXXXXXXXXXXXXXXXXXXXXXHSAASTSSSASSASHYVDPEMSASYMSMGAGGSSSSLNVSDSMDICCVPSCESKRHNNENITFHTIPRRPEQMRKWCHNLKIPEDKMHKGMRICSLHFEPYCIGGCMRPFAVPTLNLGHDDEDIHRNPDVIKKLNIRETCCVAVCKRNRDRDHANLHRFPSNVSLLTKWCANLQRPVPDGTKLFNDAICEVHFEDRCLRNKRLEKWAVPTLILGHENIPYPVPTPEQVAEFYARPSAPNNGEEQGECCVETCKRNPSVDDIKLYRPPEESQVLAKWAHNLELEITKLPNLRICNLHFESHCIGKRMRPWAIPTLNLASNIENLYENPERQMLYKRRTHLKPERAARGSLAAAGVKPTWVPRCCLPHCRKVRATHNVQLYRFPKLNRSTLAKWSHNLQVPMVGSAQRRLCSAHFEPHVLSKKCPVPLAVPTLELNTPPGYKIYQNPAKLKAKNLCLQRVCIVESCRRQRAQGVQLFRLPHNPTQLRKWMHNIRMRPRGAMRQQYRICSQHFETHSFNGKRLSAGAIPTLNLGHQDEDIFPNEAQSFVEEHCTVEGCDASKEQPDVRLFRFPSEDEDLLWKWCNNLKMNPVDCTGVRICNKHFEPDCIGPKHLYKWAIPTLCLGHDDSDIELICNPKPEDRYVDPVFKCCVPTCGKTRKFDEVQMNSFPKDPTLFHRWRHNLRLEHLNFKERERYKICNAHFEDICIGKTRLNIGSIPTLELGHDETDDLFQVNPEELQSNLFGRQRRVQDSMRVGIKEEPHSEPDEDVKPDLTISEATDSNTTQVKIKKSISELKCCVPSCGRSRLEHGARLFPFPSGKQQLNKWRHNLQLTASDVDKTSRICSAHFSRRCIDGKQLRSWAMPTQQLGHLEQPIYENPKNIPGFFTPTCALAHCRKRRSIDNELRTYRYPRSEELLEKWRVNLRLTPDQCRGRICADHFEPVVRGKLKLKTGAVPTLKLGHDEGVVFDNEAIKALLQLDEEEDDDEEGEADVSYRSLVKVKTEKEEEEKEPEHELENNDEEEEQEQDDEEDHPDSDDHGYFDPLELVETFAERHSDDNSVDDDDDDDEDIPGNDDELLIPDTQPMQLTLAPRREKAVNNVTPICCLKHCRKERTAIHHLSTFGFPKDPQLLLKWSANLQLPLEDCVGRVCVEHFEPVMLGTRKLKQNAVPTLKLGHATPLTYSCNGRMLSGIYDGQPQHSVFRLWSLKHCRKRKSESELEMEREREQQQQQQQQKMQKLADIKSVRRCCLPSCGKQSELHGVQLHRLPKDRMMLRKWLHNLKLPPTTDCTHMFLCSDHFEMNAPCPTLKLGHSDSNIYRHSTPSSISAGCLVSKCTCARLNLYRGYDLPANQQVQEAWLSWLQLPHPQPSPRHAQLCVMHFMQLYEQVPLPDSVPDFVHRQLRETYEQISSSSMAMKLRCAVPGCYSKYTDNVRLTKLPVCPKTCAKWVHNTKIPYEAARHYVYRICMLHFEPSCLGPVRPKIWAMPTLQLHHTDKNIYLNPKLDGSLAQQQPVVPLELPLRIKTELPMCNSPSFSASASPSPRGKLRSCCIPSCGQQASALTRLFRFPSSETALLKWLVNTQQQPRFVDTQRLFICQEHFEDEAICQNQLRSWAVPTLNLGHDGHIIPNARHNGNIADSQENKQTLQFIWENYCSVLSCFQQRSDELRLYPYPTDRPTIRKWAANCKHRSMQASSDGFQVCQSHFTSDCFDPDTGEVKEDAVPTLALNRLVKEVRCVVNGCVKDEDAPRRLFKMPKLAAQISDWCHNLRLDRMAISGTDSHVCERHFEAQCFNVYKALRPGARPTLHLGHEDLDDLLPNPANFEEDAFMCCVPNCGRSKDADNALLFGLPKVRQMAEKWLQNIHLDPNKDQLACLRICSVHFEARCLENGRPTCGAMPTLHLGHEQLHSIHSIVEPSPAKQRLYCNRDGASHDCCYPQCVELQKSYLRVTYELPQKQELREQWLSYMGLDEPLDKQQFPKLCPLHLILLYDHSADNFSAHAGEELLDADYEASRSSVRIRIVSCAVRGCKTLKPRDGGRLHGLPTRRDLLEMWLHNMQLVFYEQQRYMYKICSKHFEPMCLTETTRRLKPWSMPTLELPERQPGEMPPYQNPTEGEWQHMNELHASASTQIQVPSEPLVKLEPLCKLEPPPQQSELEYDEDCDYNSQQPLEMQALEVLLEVGHVEKCATYEQMDTEPNPNYAEQLSPLSAIIPQSRSIAPVQNGFHYSARVCSVHGCNVNTSNIDSNIKLHKFPVSMDAMQKWMHNTQVTVDIKFAWRFRICSHHFIPDCFQGSRIRRGAMPTLRLGSRRPKHIYDNEFNSQLQLELQSKEETAQEIDLVPAIESQQQLQSANIGLRLPRPAPPRKSSKYCQIEGCSNHLTSENVTLHKFPHSADMCAKWQHNTQVPFDPEYRWRYRICSAHFEPICLGNVRLMHGSVPTLNLGPLAPKKVFENDFIRLDKPRSSLELGAMEQFDQFDANDDDQEQEDYSLLEPELQLHVGSDDEEQPYDNRFSRNNSFNWSDQQLRLPSIKQEKSTSYNPVKSGYDKCSLVHCQRHRSHHGVHIYKFPRSRQLQQRWMHNLRIQYDERRPWKTMICSVHFEPHCIRLRKLRPWAVPTLELGDNVPQELFTNEQSQQLYAQSEAGSDCDEVEVDVGDTMLEDLXXXXXXXXXXXXXXXXXXXXQLQAAIYVKRERRSRFDPLPPGQLPPWKIKSCCLPYCRSPRGDGIKLFRLPNNISSIRKWERATGMRFYESQRNTKLICSRHFEPSLMGVRRLMTDAVPSLHLGPESADVKLPSIEPRCCMLDCPEDVNVELHKFPSDPKLLEQWCQALNVMDVESYCGKHICDTHLPANAMSCLICGVEDVQMPMLEFPGNRNQRTKWCHNLQIDPLPKWDNSKHICCKHFETYCFIQPGQLLPEAMPTLHLKHGDNNIFLNDDTMDNSKMLRIKDEPMESDDLML

Similar Transcription Factors

Sequence clustering based on sequence similarity using MMseqs2

100% Identity: iTF_00595971;
90% Identity: iTF_01321957;
80% Identity: -