Basic Information

Insect: Lordiphosa collinella
Gene Symbol: -
Assembly: GCA_018904265.1
Location: JAEIFV010000086.1:620867-651543[-]

Transcription Factor Domain

TF Family: THAP
Domain: THAP domain
PFAM: PF05485
TF Group: Zinc-Coordinating Group
Description: The THAP domain is a putative DNA-binding domain (DBD) and probably also binds a zinc ion. It features the conserved C2CH architecture (consensus sequence: Cys - 2-4 residues - Cys - 35-50 residues - Cys - 2 residues - His). Other universal features include the location of the domain at the N-termini of proteins, its size of about 90 residues, a C-terminal AVPTIF box and several other conserved residues. Orthologues of the human THAP domain have been identified in other vertebrates and probably worms and flies, but not in other eukaryotes or any prokaryotes [1].
Hmmscan Out: # of c-Evalue i-Evalue score bias hmm coord from hmm coord to ali coord from ali coord to env coord from env coord to acc

1 29 6.1 1.3e+04 -2.7 2.6 49 63 297 315 278 333 0.59

2 29 4.5e-15 9.4e-12 45.8 4.6 1 86 531 603 531 604 0.86

3 29 1.3e-14 2.8e-11 44.2 5.0 1 87 631 700 631 700 0.83

4 29 1.2e-15 2.4e-12 47.6 0.2 1 87 722 794 722 794 0.85

5 29 8.3e-16 1.7e-12 48.1 5.9 1 87 892 962 892 962 0.81

6 29 8.6e-15 1.8e-11 44.8 3.3 1 86 986 1057 986 1058 0.82

7 29 2.7e-13 5.7e-10 40.1 1.0 1 87 1093 1161 1093 1161 0.81

8 29 2.8e-11 5.8e-08 33.6 2.0 1 86 1201 1270 1201 1271 0.78

9 29 1.8e-16 3.9e-13 50.2 0.4 1 86 1298 1367 1298 1368 0.82

10 29 2.1e-13 4.5e-10 40.4 1.3 1 86 1389 1458 1389 1459 0.80

11 29 3.9e-15 8.2e-12 45.9 0.8 1 86 1486 1557 1486 1558 0.85

12 29 1.1e-12 2.3e-09 38.1 2.8 1 85 1637 1705 1637 1707 0.82

13 29 1.5e-12 3.2e-09 37.6 0.1 1 86 1731 1799 1731 1800 0.83

14 29 1.9e-14 4e-11 43.8 0.9 1 87 1916 1985 1916 1985 0.80

15 29 3.9e-09 8.2e-06 26.7 0.1 1 87 2050 2117 2050 2117 0.82

16 29 0.00017 0.36 11.8 0.4 1 60 2137 2186 2137 2207 0.69

17 29 8.2e-14 1.7e-10 41.7 0.1 1 86 2218 2287 2218 2288 0.86

18 29 1.4e-14 2.9e-11 44.2 0.2 1 87 2347 2417 2347 2417 0.83

19 29 5.1e-11 1.1e-07 32.8 0.2 1 86 2452 2523 2452 2524 0.80

20 29 3.6e-13 7.6e-10 39.7 2.6 1 87 2534 2606 2534 2606 0.83

21 29 1.6e-11 3.4e-08 34.4 0.6 1 86 2632 2702 2632 2703 0.74

22 29 8.6e-07 0.0018 19.2 0.2 1 58 2736 2786 2736 2805 0.82

23 29 2.5e-13 5.3e-10 40.1 0.4 1 87 2824 2896 2824 2896 0.84

24 29 9.5e-16 2e-12 47.9 0.8 1 87 3052 3125 3052 3125 0.84

25 29 6.1e-13 1.3e-09 38.9 2.7 1 86 3186 3256 3186 3257 0.80

26 29 4.7e-14 9.9e-11 42.5 4.9 1 86 3365 3435 3365 3436 0.84

27 29 1.1e-11 2.3e-08 34.9 0.2 1 86 3510 3579 3510 3580 0.84

28 29 4.2e-11 8.9e-08 33.0 1.1 1 58 3604 3652 3604 3668 0.85

29 29 1.4e-08 3e-05 24.9 1.4 18 87 3669 3727 3658 3727 0.75

#	of	c-Evalue	i-Evalue	score	bias	hmm coord from	hmm coord to	ali coord from	ali coord to	env coord from	env coord to	acc
1	29	6.1	1.3e+04	-2.7	2.6	49	63	297	315	278	333	0.59
2	29	4.5e-15	9.4e-12	45.8	4.6	1	86	531	603	531	604	0.86
3	29	1.3e-14	2.8e-11	44.2	5.0	1	87	631	700	631	700	0.83
4	29	1.2e-15	2.4e-12	47.6	0.2	1	87	722	794	722	794	0.85
5	29	8.3e-16	1.7e-12	48.1	5.9	1	87	892	962	892	962	0.81
6	29	8.6e-15	1.8e-11	44.8	3.3	1	86	986	1057	986	1058	0.82
7	29	2.7e-13	5.7e-10	40.1	1.0	1	87	1093	1161	1093	1161	0.81
8	29	2.8e-11	5.8e-08	33.6	2.0	1	86	1201	1270	1201	1271	0.78
9	29	1.8e-16	3.9e-13	50.2	0.4	1	86	1298	1367	1298	1368	0.82
10	29	2.1e-13	4.5e-10	40.4	1.3	1	86	1389	1458	1389	1459	0.80
11	29	3.9e-15	8.2e-12	45.9	0.8	1	86	1486	1557	1486	1558	0.85
12	29	1.1e-12	2.3e-09	38.1	2.8	1	85	1637	1705	1637	1707	0.82
13	29	1.5e-12	3.2e-09	37.6	0.1	1	86	1731	1799	1731	1800	0.83
14	29	1.9e-14	4e-11	43.8	0.9	1	87	1916	1985	1916	1985	0.80
15	29	3.9e-09	8.2e-06	26.7	0.1	1	87	2050	2117	2050	2117	0.82
16	29	0.00017	0.36	11.8	0.4	1	60	2137	2186	2137	2207	0.69
17	29	8.2e-14	1.7e-10	41.7	0.1	1	86	2218	2287	2218	2288	0.86
18	29	1.4e-14	2.9e-11	44.2	0.2	1	87	2347	2417	2347	2417	0.83
19	29	5.1e-11	1.1e-07	32.8	0.2	1	86	2452	2523	2452	2524	0.80
20	29	3.6e-13	7.6e-10	39.7	2.6	1	87	2534	2606	2534	2606	0.83
21	29	1.6e-11	3.4e-08	34.4	0.6	1	86	2632	2702	2632	2703	0.74
22	29	8.6e-07	0.0018	19.2	0.2	1	58	2736	2786	2736	2805	0.82
23	29	2.5e-13	5.3e-10	40.1	0.4	1	87	2824	2896	2824	2896	0.84
24	29	9.5e-16	2e-12	47.9	0.8	1	87	3052	3125	3052	3125	0.84
25	29	6.1e-13	1.3e-09	38.9	2.7	1	86	3186	3256	3186	3257	0.80
26	29	4.7e-14	9.9e-11	42.5	4.9	1	86	3365	3435	3365	3436	0.84
27	29	1.1e-11	2.3e-08	34.9	0.2	1	86	3510	3579	3510	3580	0.84
28	29	4.2e-11	8.9e-08	33.0	1.1	1	58	3604	3652	3604	3668	0.85
29	29	1.4e-08	3e-05	24.9	1.4	18	87	3669	3727	3658	3727	0.75

Sequence Information

Coding Sequence: ATGTCACAGCATAATCCGCACTATCATCACTCCCATCCCTTANNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNCTCACATGTTGCTTCCACCTCCTCGCCCGGCTCCCCCTACCCAGCGTCGGCGGCCGCCAACAACAACAATCACATTTTGAATGCCTATGGAACACATGGATATTACGGAGCCGCCGGCGGCGGTGTCAATGTCAATGCTACGGGGGGTGTGAGCGCAGGGAGTTCAAACAGTTATAACCTAGACACGGCCAACACGGTGGCCTATGCCCATAACCAGCTGCTGCAATATCAACAGCAGCAGCAGCAACAACACCTCAGTCAAAGATCTTATATGGGAGGACACCATGGCATATATCCCTATATAAAAAGCGAACCCGCGGAGTACGCCAATCCGATGGCTCCACCGCCAGCTCCTTCAGAAATGAGAATTAAATCTGAACCTATTGACGAACAAGCCTATAAGTCCAACTATATTGATGATAATACTCCCTTTGCTGATTTTAGTAAGTTTAATGAGTTCAGCGAGGATATGTTGAGTCCCAAAGTGGAACTAACCGTCAAGGATGATTCCTATGGAAAGAATCCCAATAATTATCCGAGGCGCAAAATGCAAACCGAACGCTCTGAGGAGAGTTTACCGATTTGTCAACGATGCAAAGAAGTATTCTTTAAAAAACAATCCTACCTACGTCATGTGGCCGAGAGCAGTTGTGGCATCCAGGAATATGATTTCAAATGTAATATTTGTCCCATGTCCTTTATGAGTACGGAAGAGTTGCAAGCGCACAAACAACTACATCGAGCAGATAAATTCTTTTGTCACAAATATTGTGGCAAACATTTTGATACAATTGCCGAATGTGAATCGCATGAGTATATGCAACATGAATACGAGAGTTTTGTGTGTAATATGTGCTCGGGAACTTTTCCTACACGTGAGCAGCTTTATAACCATTTGCCTCAACATAAGTTTCAACAGCGTTACGATTGTCCCATTTGTCGATTGTGGTATCAAACTGCTGGAGAACTCCATGAACATCGCTTGGCGGCACCCTATTTCTGTGGCAAATATTATACGGGAGCGCAGCCAGCTGTTGCAACGCAGTCCCATCAAACGCAGTCACAGCAGCAATCACATCAGACGAATTATAAATTGCAGGATTGCCATATGGCCACCATGGAGATGCCTACGACTCCAGCAGCTGCAACATCATCCCATCACAAATCTAGCCCCTCAACTTCGGCATTACCGGCCACTGCAGCTTTAAGTTCCCTGCTGCAGCAGCGCCAGGCTAATGCGGACGGAGCCTCAATGTTTTCCACTACCCATAAACCTGAAGTAAATGTCAAGCTGGAGCGCAGTTATAGCAACTCCACCAGCGAATCCTCATTTAGTATGCACGAGTCGAACTACAACAATACCTATGCCAGCGATAATTCTTTACATGGTGGAGCCCTGGGTGGTCCCCAGGCTCATTCCTCAACACTGGATGACTCGGAGGATGCTTTATGTTGTGTTCCCCTCTGCGGAGTAAGAAAGAGCACTAGTCCCACACTACAGTTCTTCACGTTCCCCAAAGATGAGAAATATTTGCATCAATGGCTACACAATCTCAAGATGTTTCACATCCCAGCCTCAAGCTATACGACTTTTAGAATTTGCAGCATGCATTTCCCCAAACGCTGCATCAATCGATACTCCCTGTGCTATTGGGCAGTACCCACATTCAATTTGGGACACGATGATGTGGCTAATCTGTATCAGAATCGCGAGTTGACCAACACTTTTACCACCGGTGAAATAGCACGCTGTAGCATGCCCCATTGCAGCAGCCAAAGGGGTGAGAGTAATCTTAAATTTTATAATTTCCCTAAGGACATCAAAAGCTTGATTAAATGGTGTCAGAATGCTCGCCTGCCTGTCCAGGCCAAGGAGCCGCGTCACTTTTGTAGCCGCCACTTTGAGGAGCGTTGCATTGGCAAATTTCGTTTAAAGCCCTGGGCTGTTCCCACCTTGCATTTGGGTGCACATTATGGCAAAATTCATGACAATCCAAAGAATTTGTACGTGGAGGAGAAGCGTTGTTGTCTCAACTTTTGTCGTCGCAGTCGCTCATCGGACTTTAATATGTCGCTATATCGTTTCCCAAGAGATGAGGTGTTGCTGCGACGCTGGTGTTACAATCTACGCCTGGATCCCGGAGTATATCGTGGCAAAAATCATAAAATATGCAGTGCTCACTTTATTAAAGAGGCATTGGGATTAAGGAAACTATCGCCAGGTGCCGTGCCCACCCTTCATTTGGGTCACAACGATACGTTCAATATCTATGAGAACGAACTATGGCCGCCACCTACGCCCAGTTCCACTCCACANNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNAATCATATCAACGTCATTCGGCAGCATCCACTTCCTCATCGGCCAGTTCGGCTTCGCATTATATGGACGCCGATATGAGTGGATCGTATCTCGGTATGGGCACTTCAACTGGCATGAACGTCACCGATAGCATGGACGTTTGCTGTGTGCCGAGCTGTGAGAGCAAGCGCCATAACAATGAGAATATTACATTCCATACGATTCCCCGAAGGCCAGAGCAGATGAGGAAATGGTGTCACAATCTCAAGATACCCGAGGACAAAATGCACAAAGGCATGCGGATTTGCAGTTTGCATTTTGAGTCCTATTGCATTGGCGGTTGTATGCGTCCCTTTGCGGTGCCCACTTTGCACTTGGGTCACGACGATGAGGATATTCATCGTAATCCGGATGTGATTAAGAAGTTGAATATACGCGAAACTTGCTGTGTGGCTGTGTGCAAGAGGAATCGTGACCGAGATCATGCTAATCTCCATAGATTCCCCAGTAATGTACCTCTACTGACCAAATGGTGTGCGAATCTGCAAAGACCAGTGCCGGATGGCACTAAATTGTTCAACGATGCCATCTGTGAGGTGCATTTTGAGGATCGTTGTTTGAGAAATAAACGACTAGAGAAGTGGGCAGTTCCTACACTAATATTGGGTCATGAGGATATAGCCTATCAGCTGCCCACTCCCGAAGAAGTTTCCGAGTTCTTTGCCCGGCCCAGTGCTCCAAATAACGGGGAAGAGCAAGGTGAATGCTGTGTGGAGAGTTGTAAACGTAATCCCAGTGTGGATGACATCAAACTATATCGTCCACCCGAGGAAGCGGAGGTCTTAAGCAAATGGGCTCACAATCTACAACTGGAAGTCTCCGAGTTGACCAATCTACGAATATGTAACTTACATTTCGAATCCCATTGCATAGGCAAGCGCATGAGGCCCTGGGCCATACCCACTTTGAATCTATCGGGTAATATTGAAAACCTCTATGAGAATCCCGAGCATACCATGTTATACAAGCGACGAACCAGAGATCCAAATAGAGACTTAAGTGGTATCAAGCCGACCTGGGTGCCCAGATGCTGTCTGCCCCATTGCCGTAAGGTGAGAGCTTTGCATAATGTGCAACTCTATCGATTCCCCAAACTCAATCGTTCCACTTTGGCTAAATGGGCGCATAACTTGCAAGTGCCGATGGTGGGCAGTGCTCAGAGACGTGTCTGTTCGGCTCACTTTGAACCGCATGTGTTGAGTAAAAAGTGTCCAGTTCCCATGGCGGTGCCCACTCTGGAGTTAAACTCTCCGCCGGGCTATAAAATCTACCAGAATCCAGCCAAATTGAAAGCCAGCAAACTGTGCCTTCAAAGGGTGTGCATAGTGGAGAGCTGCCGAAAGACTCGTGCTCAGGGGGTACATCTGTTCCGACTGCCCCATAGTCCTACCCAGCTAAGAAAATGGATGCATAACATACGCACACGTCCCCGTACCGCTATGAGAGCTCAATACCGCATTTGCTCCGCACACTTCGAAACGCACTCATTCAATGGCAAAAGATTAAGCGCTGGAGCGATACCCACACTGGAATTGGGACATCAGGATGATGATATCTATCCCAATGAAGCTCAATCCTTTGTGGAGGAGCATTGCGCCGTTGAGGGATGTGACTCGACCAAAGAGCAAGCGGAAGTGCGTCTCTTCCGTTTCCCGACCGATGATGATGACTTGCTCTGGAAGTGGTGTAATAATCTCAAAATGAATCCCGTGGATTGTGTGGGCGTTCGTATATGCAATAAACATTTCGAGACCGATTGCGTAGGACCCAAACATCTGTTTAAATGGGCCATACCTACCTTGGCTTTGGGCCATGATGATTCACAAATCGAGTTGATCCCCAATCCCAAGCCCGAAGATCGTTATGCGGATCCTTTGTTCAAATGTTGTGTGCCCACTTGTGGCAAGACCCGTAAATTCGATGAGGTACAAATGAATAGTTTTCCCAAGGATCCCACACTGTTTCAACGTTGGCGACATAATCTACGACTGGACTACTTAGATTTCAAAGAACGTGAACGATATAAAATATGCAACGATCATTTCGAGGATATATGCGTGGGCAAGACACGTTTAAATATTGGTTCCATTCCCACTTTGGAGTTGGGACATGAGGAAACCGAGGATTTGTATCAAGTAAATCCCGCTGACTTGCAAAGTAATCTATTTGGTCGTCAGCGTAGATTGCTCGGTGATAGCAAACAGGAGGAAGAGGAGGAGGCTGAGGAAGATGAAGAGCAGGCTGAAGTTAAAACCCGTGCTAAGAAGGTCATGGAAGAAGCCACCGATTTGAACACCAAACAAGTGAAGATCAAGAAATCTCTGTCTGAGCTGAAGTGCTGTGTGCGTAGTTGTGGTCGTAGTCGCTTGGAGCACGGTGCTCGCTTGTTTCCCTTTCCCACGGGCAAGCAACAGCAACTCAAATGGCGTCATAATCTTCAACTGGAACCGCACGAGGTGAATAAAATGACTCGTGTCTGCAGTGCCCATTTCAATAGACGTTGTATAGATGGTAAACATTTGAGAGGATGGGCCATGCCTACCCAGCAATTGGGACATAAAAAACATCAGAATATCTATGAGAATCCCAAGAATATACCTGGTTTCTTTACGCCCACCTGTGCCTTGGGTCACTGTAGAAAACGGCGCAGCATAGATAACGATTTGCGTACCTATCGCTATCCCAGGACAGAGGATTTGCTAGAGAAATGGCGTGCCAATCTGCGTTTAGCACCAGACCAGTGTAGGGGACGAATTTGCGCCGATCATTTTGAGCCCCAGGTGAGAGGAAAACTAAAATTGAAGACGGGAGCTGTGCCCACTTTAAAATTGGGACATGATGAGGGTTTGGCATATGATAATGAGGCCATCAAGGCGGGTCTAAATGAGGATGAGGATGCTAGCTTGGACTCGCCCCCAGTACCAACCAAAAAGGAGGAGCAGGAGGAAGAAGAACAAGAAGAAGATGGGGATGATGCGTCTGTAGAAGTGCAGGATCCTGCCGAAGGCGAGCAAGACGATGAACAAAGTGGCTATTTCGATCCTCTGGAACTGGTAGAAACTTTTGCTCATGACCAGTCAAGCGCCCCCGATGAGGGCTCACCTGCAACTCCTCCTCCTTCGGCTGCTCCTCAATTGAGGCGCGATAAGCCCGCCAACAATGTCTCCCCCATCTGTTGTCTAAAACATTGCCGTAAGGAACGCACTCCCCGGAATCTTCTAAGTACTTTTGGCTTTCCCAAAGATCAACAGCTGCTTATGAAGTGGTGTGCCAATCTACAACTGGAGCTCGACGACTGTATAGGGCGCGTTTGCATGGAACATTTCGAGGCGGAGGTTCTGGGGACACGTAAACTCAAACAGAATGCGGTGCCTACTCTTAATGTAGGTCATGAACTGGATTTACCCTACACCTGTAATGGTCAGGAGCGTTCCACAGAAGACCAGTCGGTTTTTCGGCTTTGGAGCCTGAAACATTGCCGTAAAAGGAAGCTAGAAGAGCCGCCAGATGCGCCAGTCATCAAACAGGAGAAAAAGGAGGTGAAGGAGGAGCCGAAAGAGAGTAAACCAAAGATGTGTTGCCTCAGTCATTGTGGGAAAATGAAGCGTTTACAACGTTTACCCCAGGATCAATTGCTGCTCAACAAATGGTTATGCAATCTTAAATTAGTCATGGCCAAACCCACCGACCCTCAGGAACTGCGTTTGTGCTTGGACCACTTCGAACCGCATTTGGTAAGGAACGGAGAACTCTTGCCCATTGCTCTGCCCACTCTCAATCTGGGACATCAAGATCTTAAGATATATCGAAATACTATGAGCTCCAACGAAAGTGGTTGTATAGTGGCCAGTTGTCCTTGTGCACGCCTCAACCTCTATCGCAGTTGTGATCTACCAAGGAATCAGATAATAAGACAAGCCTGGCTAAGTCATCTCAAGCTCAAACAAAACACCCATGGACAACTGTGCGTCATGCACTTTATGCAGCTCTACGAAGATGTCAAAATTGAGCCACATTCTGCAGAACTGAAGTCTGCATATGAATCCATAGCCAACTCCGCACAGGCCTTGAAACTACGCTGTGCCGTGCCTGGTTGTCGTTCCAAATACACGGACAATATACACCTGACCCGTTTGCCCTATGATCAGCACATCTTCAGCAAATGGTTACACAACACGAAAATAGAATATGATCCTTCCAGACATTATATCTATCGTATTTGCCTGCTTCACTTTGAGCCCGATGCCTTGGGCGCCGTACGTCCCAAATCTTGGGCCGTTCCTACCCTCAGACTTAATCACCAGGAGGAGATCTACTTGAACTCCACTAAAGAAGAACCTCAGCTGCATACGCCACTTCACATTAAAACTGAACCTTCTGTTCCCCTGCGAATTAAAACAGAACTCACGGCTTTGTCTAGTCCCAGCATAAGTTCCACGCCCAGTCCTCGTGGCAAAATCCGAATCTGCTGTATACCCACATGCCTGCAGCAGTCCAGTTCTCAAATGCGTCTCTACCGCTTTCCTACCGCCGAGGCCGCTCTCCTCAAATGGCTGGTCAATACTCAACAGCAACCACGGCTGGTGGATGCCCTTCAGCTGTATGTGTGTCAAACTCATTTCGAACCCGAAGCCATTGTCAAAAAGCAGTTGAGAAGTTGGGCGGTGCCTACCTTGAATTTGGGCCACGATGGTCACATCATTCCCAATGCCAAGCATAATGGTAATATAGCTGATAGCCAGGAAACAGAACAGGCCATGGAGTTCATCCGAGAGAACTATTGTTCAGTTCTCAGTTGCTTTCAGCCACGAAGTGAAGAGCTGCGTCTGTACGAGTATCCTAAGGATATGCCTACAATACGACGGTGGGCGGCAAACTGTAAACACCGCTCTATGCAGGCAAGCAGTCATGGATTTCAGGTGTGTCAATTGCATTTTGGCCCCGAATGTTTTGACCCGGACACTGGCGAATTGCGTGAGGGTTCAGTACCCTCTCTGGATATTAACAAAAGTCATGCCGAACTGCGTTGCCTGGTGTCAGGCTGCGTTAAGGATGAATCTACACCACGTCGCCGTTACTACAAGCTACCCAAACGCTCCACACAATTGTCGGAATGGTGTCACAATCTCTGTTTGGAACCGTCTGAACTCTCGCCAACTGATCAGCACATATGTGAGCGTCATTTTGAGCCAAGTTGTCTAAATAATTATAAACAGCTGCGCCCTGGAGCACGACCCACCTTGCACTTGGGTCACGACCAGCCAGTAGAATTGCTAAACAACCCGGAGAACTTAAATGAGTTGCCGGAAGAGGAAGTCGTCTGCTGTGTTCCTCAATGTGAGCGCATCCAGCAGCCGGATGAGGCGCCCTATAGTTTCTTTCCCAAAATGCGACTACTGGCCGACAAATGGCTCCACAATTTCCGCCTGGAAGCCAGCAAAGAGCAGCTGGGCAAGCTGCGAGTATGTCTGCGACATTTTGAGACTACGTGTTTTGAGAACGAACGGGTACGTTTGGGTGCTATGCCTACTTTGGAGTTGGGTCATGACGATCGAGATGTTTACCATACCGATGAACAGGCTCTGGGTAAGAGTCGAAAACACCATAAGAAGAACAGTGGCCTGGGTATGGATTGTTGTTATGCTCAGTGTGCGGAGTTGCAAAAGAATTACCAAAGAGTAGTCTATGATCTGCCCGTAGATGAGCAACTACGTAGTGCTTGGCTACAGCATATCGAAGTGCAGGAGGAGGAGGATCAGCCTTTGAAGCTGTGTCCACTGCATTTTATTATACTTTACGAACATAGCCAGGAACACTTTCCAGACCATGCACCGGAAGAGTTACTCGACCATAACTATGAAGATGCTCGGAACAGTGTGAGAATCCGTCTCATAAGTTGTGCTGTACGAGGTTGTAAAACCATACAGCCCCGAGACGGTGGGCGTTTACATGGTCTACCTCCGCGAAGAGATGTATCGCAAATGTGGCTGGAGAATACCCAAATGGAGTACTTTGAGCCACAACGCTATATGCTTAAAGTGTGCAGCAAACACTTTGAACCGCATTGCTTTACGGATAGTCGAAAGCTGAAGTACTGGAGTATGCCGACGCTTCATCTCCCGGTAGAGGCGGTGCACAAAAATCTCACCGAAGAGGAATGGCAACAAATGAATGACAAACCCGCGGAGCCAAGCAAAGAGAAAGAGAAGAAGGTAGAGGAGGAGGTCTATGAAGAGAATTCTTTGCTAGAGCCCATTGTCATAATGGAGCATGCGGAGTCCGAGAAAGAGGAGGAGGAGGAGCAGGAAAAGACAGCGGAATTGGAAGATGAGCAGGAGAAGACGGAAGATGAGCATCTTACACCCGAACTGGTGATCGATGAGCGCACTCAGGACACTGCAGATCACCAGGAAGATGAAATGGAAGAACTGGAAGTGCTGCTAGAGGTGGGTCATGTGGAGAAATGTGCCAGCTATGAGAAAATGGATCAAAAATCGCACTTGCCCTACTCCCAGGAGGCCTCTGCCACTCCTTCACACTCCGCCGGTTCTGCTTTACGAAATCAATACAATGCCAGACATTGCAGTGTCCAGGGTTGTCAGACCAGTTCCCATGACATAGATGGACAAATAAAACTACACAAATTTCCCACCTCAACGGATGCTACGAAAAAATGGATGCACAACACCCAAGTGGATGTGGATGAGAGTGTTTCGTGGCGTTATCGCATTTGCAGCTATCATTTCGAGCCGGATTGCTTTAACGGAGCACGGATTCGTAAAGGTTCCATGCCAACATTACACTTGGGTCGTTCCAGACCAGAAGAGATCTATGAAAATGAATTTGCACAAATGGAAATGGAAGAATCTTTGGTGATGGAAGCAGCACCCGTTGCCACAACAAGCCGGGAAACTTCTTCCAAGAGTGAGGTAACGCAATTGTTTCTACCCCGCCCAGCTCCTCCACGGAAATCGAGCAAATTCTGTCAGATTGAGGGCTGTCCCAATCATCTGACCAGTGAGAATATGACACTGCATAAGTTTCCGCACTCGGTCGATATATGTGAGCGCTGGCAACATAATACCCAAGTGCCATTTGATCCTGAATATCGGTGGCGCTATCGCATTTGCAGTGCCCACTTCAAGTCGGTGTGTTTGGTCAATATGCGGCTGCTACATGGTAGTGTACCTACCCTAAAACTGGGTCCACGTGCTCCTGCCCAACTGTTTGATAATGATTTCGATGCCATGCACGGCAGATTGGATAAGAAGCAGACACAGTCAGCGGTAAAGCACGAAAAACCACAGAAATATCATCAGTATCAACCGGAGAATGAGCAGTACTTCGAGCCTGAATGGGATGAGGAGGAGGAGGCCGATGAGCTCGAGCCGGAGGAAGACGAAGAGGAACCGCATACCTCATTTGCCACACCCTTTGACAGCTGGAGGCACCAATTGCGTCTGCCCGCCGTTAAACAGGAGAAGTCTCCCTACAATCCCATCAAATCTGGTTATGATAAATGCTCACTGGTGCACTGCCAGCGTCAGAGATCCTTACATGGTGTACATATCTTTAAATTCCCACGCTCTAGACGCCATCAGCAGCGTTGGATGCACAATCTACGAATACGGTATGATGAGCGACGTCCCTGGAAATATATGATCTGCAGTGTGCATTTTGAACCGCATTGTGTACGTCTAAGGAAACTGCGACCATGGGCAGTGCCCACCCTGGAGTTGGGTGACAATGTGCCTGACCAAATTTATACCAATGAACAGTGTCAGGAAATGGCCACCGATCTGAGCGAGGCTGAAACAGAAGAGGAAGATGGCCTGCAGGAGGATGATGACGATGAGGAGGAGGAAGTGGACTTGTCACCTTTTATCAAAAAAGAAAAACGTAGTCGCTTAGATCCTTGGTCAACTGGTCAATTAACCGCCTGGAAAGCTAAACAATGTTGCCTGCCCTATTGCCGCCGGCCTCGGGGTGATGGCATCAGGTTGTTCCGGCTGCCCAGCAATTGCACCTCCATCAAATATTGGGAGCAGGCCACAGGCATGGTATTCAAAGAGTCGCAAAGGAATACTCGTCTGATTTGTAGTCGTCACTTTGAGCCGGAACTGATGGGAGTTCGGCGTCTTATGAGAAATGCCATCCCCACTAGGAATTTGGGCCCACAGAGTGAGAGTTTTAGCTCTGAGGCTGAGATGGTGGTACCGACGCCTACAGGACCAATGTGCTGCATGGCAGATTGCACAAATGAGGGAAACTCGAAACTGCATCAGTTTCCCAGAGATCCCACTCTGCTGCAACAATGGTGTCAATCCCTAAGACTGTCAGACTTCCAAAGCTATCGGGGCAAACATATTTGCTCCGCCCATTTGCCCGCTCAGGCCCTAACTTGCCTCATCTGTGGTGTCGACGACGTTCATCTACCTTTGCTCGATTTTCCCGAGAATCGCAACCATCGCGCCAAATGGTGTTATAATCTGAAAATCGAAACCATACCAAAATGGGATACATCCAAGCACATTTGCTGCAAGCATTTCGAATCATATTGCTTTGTCCAACCAGGCGAACTATTACCCGATGCGGCACCAACATTGCATTTGAATCACAATGACACGAATATATTCCACAATGATTATACCATAGATGATCAGCAGCACTCCATGATCCGCATTAAGGATGAACCTCTGGACAATGACGACTTTTTGCTGGTGTAG
Protein Sequence: MSQHNPHYHHSHPLXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXSHVASTSSPGSPYPASAAANNNNHILNAYGTHGYYGAAGGGVNVNATGGVSAGSSNSYNLDTANTVAYAHNQLLQYQQQQQQQHLSQRSYMGGHHGIYPYIKSEPAEYANPMAPPPAPSEMRIKSEPIDEQAYKSNYIDDNTPFADFSKFNEFSEDMLSPKVELTVKDDSYGKNPNNYPRRKMQTERSEESLPICQRCKEVFFKKQSYLRHVAESSCGIQEYDFKCNICPMSFMSTEELQAHKQLHRADKFFCHKYCGKHFDTIAECESHEYMQHEYESFVCNMCSGTFPTREQLYNHLPQHKFQQRYDCPICRLWYQTAGELHEHRLAAPYFCGKYYTGAQPAVATQSHQTQSQQQSHQTNYKLQDCHMATMEMPTTPAAATSSHHKSSPSTSALPATAALSSLLQQRQANADGASMFSTTHKPEVNVKLERSYSNSTSESSFSMHESNYNNTYASDNSLHGGALGGPQAHSSTLDDSEDALCCVPLCGVRKSTSPTLQFFTFPKDEKYLHQWLHNLKMFHIPASSYTTFRICSMHFPKRCINRYSLCYWAVPTFNLGHDDVANLYQNRELTNTFTTGEIARCSMPHCSSQRGESNLKFYNFPKDIKSLIKWCQNARLPVQAKEPRHFCSRHFEERCIGKFRLKPWAVPTLHLGAHYGKIHDNPKNLYVEEKRCCLNFCRRSRSSDFNMSLYRFPRDEVLLRRWCYNLRLDPGVYRGKNHKICSAHFIKEALGLRKLSPGAVPTLHLGHNDTFNIYENELWPPPTPSSTPXXXXXXXXXXXXXXXXXXXXXXXXXXXSYQRHSAASTSSSASSASHYMDADMSGSYLGMGTSTGMNVTDSMDVCCVPSCESKRHNNENITFHTIPRRPEQMRKWCHNLKIPEDKMHKGMRICSLHFESYCIGGCMRPFAVPTLHLGHDDEDIHRNPDVIKKLNIRETCCVAVCKRNRDRDHANLHRFPSNVPLLTKWCANLQRPVPDGTKLFNDAICEVHFEDRCLRNKRLEKWAVPTLILGHEDIAYQLPTPEEVSEFFARPSAPNNGEEQGECCVESCKRNPSVDDIKLYRPPEEAEVLSKWAHNLQLEVSELTNLRICNLHFESHCIGKRMRPWAIPTLNLSGNIENLYENPEHTMLYKRRTRDPNRDLSGIKPTWVPRCCLPHCRKVRALHNVQLYRFPKLNRSTLAKWAHNLQVPMVGSAQRRVCSAHFEPHVLSKKCPVPMAVPTLELNSPPGYKIYQNPAKLKASKLCLQRVCIVESCRKTRAQGVHLFRLPHSPTQLRKWMHNIRTRPRTAMRAQYRICSAHFETHSFNGKRLSAGAIPTLELGHQDDDIYPNEAQSFVEEHCAVEGCDSTKEQAEVRLFRFPTDDDDLLWKWCNNLKMNPVDCVGVRICNKHFETDCVGPKHLFKWAIPTLALGHDDSQIELIPNPKPEDRYADPLFKCCVPTCGKTRKFDEVQMNSFPKDPTLFQRWRHNLRLDYLDFKERERYKICNDHFEDICVGKTRLNIGSIPTLELGHEETEDLYQVNPADLQSNLFGRQRRLLGDSKQEEEEEAEEDEEQAEVKTRAKKVMEEATDLNTKQVKIKKSLSELKCCVRSCGRSRLEHGARLFPFPTGKQQQLKWRHNLQLEPHEVNKMTRVCSAHFNRRCIDGKHLRGWAMPTQQLGHKKHQNIYENPKNIPGFFTPTCALGHCRKRRSIDNDLRTYRYPRTEDLLEKWRANLRLAPDQCRGRICADHFEPQVRGKLKLKTGAVPTLKLGHDEGLAYDNEAIKAGLNEDEDASLDSPPVPTKKEEQEEEEQEEDGDDASVEVQDPAEGEQDDEQSGYFDPLELVETFAHDQSSAPDEGSPATPPPSAAPQLRRDKPANNVSPICCLKHCRKERTPRNLLSTFGFPKDQQLLMKWCANLQLELDDCIGRVCMEHFEAEVLGTRKLKQNAVPTLNVGHELDLPYTCNGQERSTEDQSVFRLWSLKHCRKRKLEEPPDAPVIKQEKKEVKEEPKESKPKMCCLSHCGKMKRLQRLPQDQLLLNKWLCNLKLVMAKPTDPQELRLCLDHFEPHLVRNGELLPIALPTLNLGHQDLKIYRNTMSSNESGCIVASCPCARLNLYRSCDLPRNQIIRQAWLSHLKLKQNTHGQLCVMHFMQLYEDVKIEPHSAELKSAYESIANSAQALKLRCAVPGCRSKYTDNIHLTRLPYDQHIFSKWLHNTKIEYDPSRHYIYRICLLHFEPDALGAVRPKSWAVPTLRLNHQEEIYLNSTKEEPQLHTPLHIKTEPSVPLRIKTELTALSSPSISSTPSPRGKIRICCIPTCLQQSSSQMRLYRFPTAEAALLKWLVNTQQQPRLVDALQLYVCQTHFEPEAIVKKQLRSWAVPTLNLGHDGHIIPNAKHNGNIADSQETEQAMEFIRENYCSVLSCFQPRSEELRLYEYPKDMPTIRRWAANCKHRSMQASSHGFQVCQLHFGPECFDPDTGELREGSVPSLDINKSHAELRCLVSGCVKDESTPRRRYYKLPKRSTQLSEWCHNLCLEPSELSPTDQHICERHFEPSCLNNYKQLRPGARPTLHLGHDQPVELLNNPENLNELPEEEVVCCVPQCERIQQPDEAPYSFFPKMRLLADKWLHNFRLEASKEQLGKLRVCLRHFETTCFENERVRLGAMPTLELGHDDRDVYHTDEQALGKSRKHHKKNSGLGMDCCYAQCAELQKNYQRVVYDLPVDEQLRSAWLQHIEVQEEEDQPLKLCPLHFIILYEHSQEHFPDHAPEELLDHNYEDARNSVRIRLISCAVRGCKTIQPRDGGRLHGLPPRRDVSQMWLENTQMEYFEPQRYMLKVCSKHFEPHCFTDSRKLKYWSMPTLHLPVEAVHKNLTEEEWQQMNDKPAEPSKEKEKKVEEEVYEENSLLEPIVIMEHAESEKEEEEEQEKTAELEDEQEKTEDEHLTPELVIDERTQDTADHQEDEMEELEVLLEVGHVEKCASYEKMDQKSHLPYSQEASATPSHSAGSALRNQYNARHCSVQGCQTSSHDIDGQIKLHKFPTSTDATKKWMHNTQVDVDESVSWRYRICSYHFEPDCFNGARIRKGSMPTLHLGRSRPEEIYENEFAQMEMEESLVMEAAPVATTSRETSSKSEVTQLFLPRPAPPRKSSKFCQIEGCPNHLTSENMTLHKFPHSVDICERWQHNTQVPFDPEYRWRYRICSAHFKSVCLVNMRLLHGSVPTLKLGPRAPAQLFDNDFDAMHGRLDKKQTQSAVKHEKPQKYHQYQPENEQYFEPEWDEEEEADELEPEEDEEEPHTSFATPFDSWRHQLRLPAVKQEKSPYNPIKSGYDKCSLVHCQRQRSLHGVHIFKFPRSRRHQQRWMHNLRIRYDERRPWKYMICSVHFEPHCVRLRKLRPWAVPTLELGDNVPDQIYTNEQCQEMATDLSEAETEEEDGLQEDDDDEEEEVDLSPFIKKEKRSRLDPWSTGQLTAWKAKQCCLPYCRRPRGDGIRLFRLPSNCTSIKYWEQATGMVFKESQRNTRLICSRHFEPELMGVRRLMRNAIPTRNLGPQSESFSSEAEMVVPTPTGPMCCMADCTNEGNSKLHQFPRDPTLLQQWCQSLRLSDFQSYRGKHICSAHLPAQALTCLICGVDDVHLPLLDFPENRNHRAKWCYNLKIETIPKWDTSKHICCKHFESYCFVQPGELLPDAAPTLHLNHNDTNIFHNDYTIDDQQHSMIRIKDEPLDNDDFLLV

Similar Transcription Factors

Sequence clustering based on sequence similarity using MMseqs2

100% Identity: iTF_00914540;
90% Identity: iTF_00918172;
80% Identity: -