Basic Information

Insect: Philophylla caesio
Gene Symbol: -
Assembly: GCA_963971545.1
Location: OZ020609.1:39412020-39426432[-]

Transcription Factor Domain

TF Family: THAP
Domain: THAP domain
PFAM: PF05485
TF Group: Zinc-Coordinating Group
Description: The THAP domain is a putative DNA-binding domain (DBD) and probably also binds a zinc ion. It features the conserved C2CH architecture (consensus sequence: Cys - 2-4 residues - Cys - 35-50 residues - Cys - 2 residues - His). Other universal features include the location of the domain at the N-termini of proteins, its size of about 90 residues, a C-terminal AVPTIF box and several other conserved residues. Orthologues of the human THAP domain have been identified in other vertebrates and probably worms and flies, but not in other eukaryotes or any prokaryotes [1].
Hmmscan Out: # of c-Evalue i-Evalue score bias hmm coord from hmm coord to ali coord from ali coord to env coord from env coord to acc

1 25 1.6e-08 1.3e-05 28.2 1.5 1 86 364 431 364 432 0.78

2 25 1.9e-13 1.6e-10 44.0 0.1 1 86 479 554 479 555 0.81

3 25 0.00011 0.094 15.9 0.4 1 62 592 656 592 674 0.73

4 25 1.1e-11 9.1e-09 38.4 3.4 1 86 691 760 691 761 0.81

5 25 2.2e-12 1.8e-09 40.6 3.4 1 85 788 873 788 875 0.78

6 25 5e-12 4.2e-09 39.4 2.7 1 86 905 973 905 974 0.80

7 25 1.4e-13 1.2e-10 44.4 2.6 1 87 997 1066 997 1066 0.82

8 25 7.6e-10 6.4e-07 32.4 0.8 1 86 1120 1186 1120 1187 0.80

9 25 1.6e-11 1.4e-08 37.8 1.1 1 86 1228 1299 1228 1300 0.80

10 25 9.7e-10 8.1e-07 32.1 0.1 1 86 1329 1398 1329 1399 0.75

11 25 4e-15 3.4e-12 49.4 1.1 1 86 1423 1493 1423 1494 0.80

12 25 3.4e-05 0.029 17.5 0.1 1 45 1534 1575 1534 1583 0.83

13 25 2.5 2.1e+03 1.9 0.0 47 80 1624 1650 1604 1657 0.61

14 25 2.4e-15 2e-12 50.1 3.2 1 87 1681 1758 1681 1758 0.83

15 25 8.4e-12 7e-09 38.7 0.8 1 86 1795 1870 1795 1871 0.79

16 25 1.2e-11 9.8e-09 38.2 0.7 1 87 2042 2113 2042 2113 0.79

17 25 3.8e-12 3.2e-09 39.8 1.2 1 87 2199 2270 2199 2270 0.81

18 25 3.2e-13 2.7e-10 43.2 1.1 1 86 2351 2427 2351 2428 0.83

19 25 2e-12 1.7e-09 40.7 0.7 1 86 2469 2538 2469 2539 0.80

20 25 3.8e-13 3.2e-10 43.0 4.3 1 87 2606 2681 2606 2681 0.82

21 25 6.4e-13 5.4e-10 42.3 0.5 1 86 2836 2904 2836 2905 0.82

22 25 7.7e-08 6.5e-05 26.0 0.4 1 86 2961 3029 2961 3030 0.81

23 25 4.4e-12 3.7e-09 39.6 1.1 1 87 3084 3157 3084 3157 0.79

24 25 3.8e-11 3.2e-08 36.6 0.4 1 86 3178 3248 3178 3249 0.74

25 25 7.8e-10 6.5e-07 32.4 2.9 1 86 3272 3340 3272 3341 0.83

#	of	c-Evalue	i-Evalue	score	bias	hmm coord from	hmm coord to	ali coord from	ali coord to	env coord from	env coord to	acc
1	25	1.6e-08	1.3e-05	28.2	1.5	1	86	364	431	364	432	0.78
2	25	1.9e-13	1.6e-10	44.0	0.1	1	86	479	554	479	555	0.81
3	25	0.00011	0.094	15.9	0.4	1	62	592	656	592	674	0.73
4	25	1.1e-11	9.1e-09	38.4	3.4	1	86	691	760	691	761	0.81
5	25	2.2e-12	1.8e-09	40.6	3.4	1	85	788	873	788	875	0.78
6	25	5e-12	4.2e-09	39.4	2.7	1	86	905	973	905	974	0.80
7	25	1.4e-13	1.2e-10	44.4	2.6	1	87	997	1066	997	1066	0.82
8	25	7.6e-10	6.4e-07	32.4	0.8	1	86	1120	1186	1120	1187	0.80
9	25	1.6e-11	1.4e-08	37.8	1.1	1	86	1228	1299	1228	1300	0.80
10	25	9.7e-10	8.1e-07	32.1	0.1	1	86	1329	1398	1329	1399	0.75
11	25	4e-15	3.4e-12	49.4	1.1	1	86	1423	1493	1423	1494	0.80
12	25	3.4e-05	0.029	17.5	0.1	1	45	1534	1575	1534	1583	0.83
13	25	2.5	2.1e+03	1.9	0.0	47	80	1624	1650	1604	1657	0.61
14	25	2.4e-15	2e-12	50.1	3.2	1	87	1681	1758	1681	1758	0.83
15	25	8.4e-12	7e-09	38.7	0.8	1	86	1795	1870	1795	1871	0.79
16	25	1.2e-11	9.8e-09	38.2	0.7	1	87	2042	2113	2042	2113	0.79
17	25	3.8e-12	3.2e-09	39.8	1.2	1	87	2199	2270	2199	2270	0.81
18	25	3.2e-13	2.7e-10	43.2	1.1	1	86	2351	2427	2351	2428	0.83
19	25	2e-12	1.7e-09	40.7	0.7	1	86	2469	2538	2469	2539	0.80
20	25	3.8e-13	3.2e-10	43.0	4.3	1	87	2606	2681	2606	2681	0.82
21	25	6.4e-13	5.4e-10	42.3	0.5	1	86	2836	2904	2836	2905	0.82
22	25	7.7e-08	6.5e-05	26.0	0.4	1	86	2961	3029	2961	3030	0.81
23	25	4.4e-12	3.7e-09	39.6	1.1	1	87	3084	3157	3084	3157	0.79
24	25	3.8e-11	3.2e-08	36.6	0.4	1	86	3178	3248	3178	3249	0.74
25	25	7.8e-10	6.5e-07	32.4	2.9	1	86	3272	3340	3272	3341	0.83

Sequence Information

Coding Sequence: atgcgaATTTCGTGTGAACAAACAGTCCCAAAATTTACAAAGCCGCTGGGTGAAAAGAAAGCCGTGCTGTCCGACTCCAGTGATGCCGAACAGGTTGATGAcgatgaagaagaagatgaagatTGCGATGATGTTAATGATGATGACTATCGTGTCGATGAAGAAGATGAAGAAAACGACTTTTACGCTTCCGCCGGTGTTGTCAATAGCGACGAGGAGGAAGAGGAAACTATTGAAGATTTTACCCCGAGCATAAGTGCCGCTACCGGTGACGATGATGAAATGTTTAGTAACGTCGATGTGCGAGAGAAAATCAATTTCAATGACGGctctgatgatgatgatgatgatgatgatgacaaTGACGATGAAGACGATGATGAAGACGTAGATGACGTCTATGGCAATGAAGATGATGAAGATAGTGATGAGGTAGATGAGAGCGTTGCTGATGATGTGTTTAACGAGAATGTGGATAGCGACAGCGACAGCGAAAGCGAAGACAATGAGGAAGGCAATATCGTTGACAGCAAGGACGCCGAAGTCGATGATGAAGACGTAGAAATGCCCATTGATGACGATGACGATAAGAGCAGTTACAATGCCTGCGATCCACTTGACTTTGTTGATTGTGTAACAAGGAGTGATAACGCGCCATTGAAGCGTAGAAAGTTACATGCGACAACAAAAGGTAGGACTTTGCCAGCGGCAAGTAAAAATGCGCACAAGCGACCAATGTCCACTACGCCTGTACGCTTTGATGACGATTCGAATACAAACTACAGTAATGCAGACGAGACGACACGTTTCACTACAATAACCTCTAATTCGGCCTCCGCCTCGGCGATCACTGCGTCCGCTTCTGCTTCGGCATCAGCCAGCGCGACAGTATCGACGACGCATCATTGCGGTAGCGAGAAAATAAGTCGTTCGGTTTTTCGGCTTGGTTGCCTCAGACATCGTAGGAAGAAGAAAGCTCCTCCAGATCCACCACCTGATCAAAAATCGACGCGCAAGAGTAGAAAAACGCTACCGCCGCCTGCGTATCCAACGAAGGCGACGATCAGTCGTAAAGCGCGTAGAATTCATTGTTCCGTGCATAGTTGTGGACGGGCAAGCGCAACTTTATACCGTTTTCCGCCCATTGGCAATCGGTTCTATCGGCAATGGTGCGCACAGTTAGGTGCCGAAATGTCACAAGCTACGTGCCTACGCATATGCCAGCGACATTTTGCTTACTGCTTAATTGATCGGCGTCGTAGAAGCTTGCGTTTCGGTGCTATTCCGACGTGCAATTTGCGCAAAACCACAAAAGACGCAAACAATATCACAAATATAACAACACAAAGCCATACAAGCCAATTAATGAATGCAACTGTTAAGAAAACCAATAAAGAGCAACCGCTTGCCGCTCAGCTCAACCCCTATAACCACTGCTGCGTACCGAACTGCGGCAAGACTCATCAAGTTGACGGCGTAACACTGTTTAGTTTTCCAAAGCTACGCTCACTCTATCTTCAATGGGCTAGTAATTTGGGGTTGATGCCTACTGCACGTCTGGTACAAGTCTATAAGGTTTGTAGCGACCACTTCGACAGCAATTGCCTCAGCTATCAGCGCAATGCTCGCGCAACACTTAAATACGGTTCGGTGCCGAAGCTTAAATTGGGACTATCAGAGAATTTGAGCATCGATACAGATAACACGTTGTTAACGCAAAAGCGTCGTAAAGTATGCAAACGCAAATGGCAGCCGCAAAAGGGTGTAAACGAATGCGCCGTACACGATTGTCGTGTGGCTCAATTTCTGCAAATGCAACTCTTCCCACTGCCCGATGTACAAAAACTGCAGGAGCGTTGGtgcaattatttcaatttaaccGTCAACAACACTGCCACCGATGCGTCCGAGTTCTTCCAGAACGTTCGCTTGTGCGCGCTACACTACATGGAAGGCTATCAGATGGCGACGCACAATGATGGCGCGCGCAAAAGCAACAAGTCCGCGTTCGAAGAACTGGAGACAAACTATGCGCGCATCACAAGTTCTACTCGCATACAAATGCTGAAATGTTGTGTACCAAATTGTTCAACAAAATTCACAGACAATCTGCGTTTGACAGTGTTTCCCAGCGCCGAAGAGTTGCGCACGAAATGGCAACACAATACACAGGTCTCCTTCAGTCCAACACATCGCTATTTGTATAAAGTGTGCGCATTACATTTTGAAGAGCGGTGTTTTGGCAAAAAACGCCTATTTCTGTGGGCAATGCCAACGCTGCGTCTGCCGCAGCCGCTAAATCAGGATCCAGCCCACAAGATCTACGAAAATCCGAGCGTAGATGTGGTAGGCACTACGCACTGCTGCGTTGAGGACTGCGAAGCGGATGAAGAGAAGCAGCCAGGGATTGCCGATGATGCGGAAAAAGCGGTCACGACATCAACGCGTTTATGGCATTTCCCACAAGATGACGCCTTGCGCGAGAAATGGTGTCATAACTTAGGACTGAGCGTGCATACTCAACAAATAAGCCACACAAGTCGCCGTTGGCGTATTTGCAGCCGTCACTTCGAGACGTATTGCATTGGCAAGACACTGCGTAGTTGGGCTGTGCCAACACAGCATTTACCCAAAACAACAAAGCTTGCAAAATCGATTAAACGCTCCACCTTTATATACCAAAACCCTGACAGCGCCGCTCTTTTTTACTGCTGTTGCATTAAAACTTGCCGTCAGCAACGGGATGTGGACGCGGGCATACGGCTATACGCTTTTCCAAAAAAGGACACGATGCTGCAAAAATGGGCGCACAATATACGCATGCCCGCGGTGAAATGCCGCCACGCGCGCATCTGCACACTACACTTTGAAGCGCAATGCTTGCGCCCACAAATGCAACCGTGGGCTTTGCCGACCATTGACCTGGGACACGACGAATCCGATATCTTTCGCGTACCGAAGGTGAAGCTAAACGTCACAAATGAGCGTTGCTGCTTGCCGCACTGTAACAAACGGCGCAGTCGCGACAACGTTCACCTCTTCATCTTTCCACGCGATGAAGCCGTGTTAGCTAAGTGGTATAACAATTTGGCAATTGGCGTGCAGGATGTTAAACACAGAGTAATATGTGACTCACATTTTGAGCCGCGCTGCATTAGCATGCGCCGGCTAAAACGTTGGGCAGTGCCCACACTCAATTTGGGACACAATAACGAACCGCTGGAGAATCCTACGCCCGCCGAAGTGCTGTCTTATGAAAATGCATCGTCGACGCGTCGCTCACAAACGCCATCAAAGATTGCGCGTACGAAATCCACACTATGTAATAAGCCAGCGTTGTCGGGTATCACAGAGAAGTGTTCCTTGGTTGGTTGTGATCGTGTCACTGACACCAATGCGCTCTACCGCTTCCCCAAACCAGGTTGGTTGCGTCAGAAATGGAGTGAAAATACGCGCCTTAACGAAGAGCAAGCTAAGCAAGCGAAAGTCTGCGCTTGTCACTTTGAGCCTCACGTAATGGGGAATCAGAAGCCGCGTCCATGGGCGTTGCCAACATTGGAACTGGGCGTTGATGAAGAGGGCGTGCCATTGCCCGCTGTGCACGCAAATCCAAAGCAACTGGCGCGTTTTCATCCCGAAGAGCATGAATGGGGTGAATTGCGTTATGTGCGCGCCAATCATTGCTCCATAATATCGTGCATGAAATCGAAGTCGGATGGCGTAACGCTTTTTAATTATCCGACCAAGCGTCATATGTTGCACAAATGGGCCGAGAATTGTCGTCACTACCCGTATCAGGCGAAACGCTATCGTTTCCAGCTATGCGGTGCACACTTTACCGCCGATTGCTTCAAACGCGAAGGCACGCGTCTGCGGAAAGGCTCTGTACCAACATTAGATTTGGGCCACGATGACCCGCAAATACACCAGAGCGAATTCGAGACCGTCAGTGCACCGGCGAGAGAGGAGAAATTGATAAAACGTTGCAGCGTACCGGAATGCGAACGCTCACAGGATGATGATGGAGTGCGACTATTCAAATTTCCCATTGAACGCgctgaaattttagaaaagtggTGTCACAATTTGCACTTGAATGTGGCAGACTGTCGGTATGCGCTCATTTGTAATATACATTTTGAGTCACGGTGCATCGGCGGTGGCCGCTTGCTGCTACGCGCGCTACCTACACTACTGTTGGGCCATAACGAAGCCGATATTTTTCACAACCCTGAGACATTTGAACGGCCTGAGAAGTTGATATGCTGCTGTGTGCCCGGTTGCAGCAATACCAAGCAAACGGAGGGTGTACAGCTAAGCGCATTTCCCAAGTTGCGCAGCCAGTTCGAGAAATGGGCGCAGAATTTGCACTTGCCGGTCACCGCAAACATTTGGCATACCTACAAAGTTTGCAGTGATCACTTTGAGAGCTATTGTTACGAGCATGGACGCATAAAGGTGGGCGCAGTACCGACGCTGAAATTGGGTCACGACAACACGGAAAATTTGTACACTGTAACTGAAGAGGCGATGAGTAATTCGTTTAAGCGTAAGCGCGTAGCGCCTAAAATTGAAACGTCAAAGGAGCCACAGAGCTCATGTTGTTATCCGGATTGTAAGGAAATGGAATTGCGTTTGACGAATCAGCTGTTTGAGTTTCCTAAATTGCCAGCAGTCAGGCGGCAGTGGCTTAAGAGTATTGGACTGTACGAGGCGAAAGTGGAAACGGAAGAAGGCAAGTGTGCGGCATTAAAAGAGGACTCAAGGGAGGTTCCACCAGCGGCAGAGACTATAAAAATCGCATGTAAAGCTGAAATTAAGAAAACGGACGATGATGATACTGCTGAACTCAGTGCGGTCAACACCACTAAACCTACACGCAAAATATGCCCAATGCACTTCAAACTACTATACATAAAACACAAGACAATGCTGCAGGCGCTACAGTCTGAAAGGACGCCAGAAATCATGCTATGTTTGCAGGAGCTCGAGAAGACATACACAAATGTGTGCGATCTATCTTGTGTGCGTCGCATTAGCTGCGCCGTACCAGAATGCAATTCAAATTATCTTACCACTGAATCCATACGATTTTTCAAATTCCCTGATAACCCGGAGATGCGCGCCAAGTGGTGTCACAACACCCAAGTGGTCATCGATCAGGATCGCCTATACTGCTACAAAATATGTGAACTGCATTTCGAATCGGCCTGCGCATCACAACCGGCCAAGAAGATACAACGCTTGAAAATTTGGGCACTGCCAACGCTCCACTTACCGCCACGTGCTGCGGACATGCCGGCAATATATCCACTACCAGCGCCTGAAACGATGCCCGATTCGAAACGCGCGGCATTACTGCTGCAGACAGCAAACAACAAATGTTGCATACCCAGTTGCATGTTTGCCAAAGAGCTCCAGCAGCGGGACGTGTCGGACGAAAGCGATATACAGTTTTTCAACTTTCCGAACGAGGCCGAATTGCTCTACAAATGGGTCTTCAATACACAGGTTAGCATGGTTGCGGCTGCTCATGCGCGCATATGTTCACTGCATTTTGAGAAGCACTGCATTAATAAACGTTTGCGCATGTATGCGGTGCCGACGTTGTTGCTGGGCCACAATAAAACCGATATCTATCACAATCCGTCGGACAAACGCACGCCTGTGGAGGCGGGATGTAAGCTGGAAGATTCGGAGAAGTCAGAAAGGTTAGACGACAAAAATAAAGAATCGAAAGCAGCCGAGAAAACGAAAGTTAAAGGTGAGGCTTCGCAAGAGCGTGAGTTGAGACAATTGCGCAAGGTTGCGTCAGTTGAAAAGGTGGAGGATAAGCCGGCTGTGTTGAAAGAAAAGGAAGCGAAAGATCTGCCGAACAACAGCAGTAGCAAGGTAGCGGTGCCTAAAAAGGCCGCACCGGAGGAAAAACCACTTCATAAGCCGTTCCTTATGCACATCAAGCAGGAAAAAGATGTTGACGAAGCGGATGTTGATATCGATACTCAAATGAAGCAAGGTCTGCTGGATATGTTCAACAGCTTTTGCGACACTGGTGATCAAGAGAATGATGACGCCACGGAGCTCGCTGAGTCTACGCCAGTAGAACGCGAAACCGCACGTCATTGTCGCATACCCGGTTGCGATAGCTACGCCCGCAATCCCGGCGTCATACTCTTCAAATTCCCGTTCGCGCTGGACCAATTCCGCAAATGGCTGCATAATACTCAACTCGAGGTAGACTACACAAGACGTTGGCGTTATCGCATTTGCCATCGTCATTTTGAACCGTTTTGCACGCAATTCCGCAAGTTGCCGCTCGGAACCATGCCTACACTGAATTTGGGTCCTTCACGTCCGCCGCACATTTACGAAAATGAAATCGATATGAATAGTTTGAAGAAGTACAAGATTAGACGACAAGCCATATCTGGTCCCACTGTGTCCAGCTTTAACGACTTGAACGATGAAGCCGACACAAGAAGTTCATTCGCTGCGCAGCCTGAAAGAACCGAGATCGACGAATATAACGAACATAATGTCGATTATACAGATTTTGTAGACAACACGCCGGTAGATCGTGACACTTCGCGTCATTGCCGCATTCTCGATTGCAGCAGTCATGCCAAAGATCCCAACGTTACGCTTTTCAAATTTCCACTCTCCGAATATCTATTTCGCAAATGGTTACACAATACCCAGCTGCAAGTCGACTATACACGTCGTTGGCGTTATCGCATTTGTCAGCGTCATTTCGATCCGATTTGCATGCAATTCCGCAAATTACCGCCCGGCACAATGCCCACGCTAAATTTGGGCCCTTCACGTCCGGCACGAATTTATGAAAATAGTTTCGATATAAATCActtgaagaaatttaaaactaaaccGCCTGCAGCAGCGACCGCAACAACCACAACGAAAGCGCCTCCGTCGAATAGTGAACTCATCGATGAAGGAGAGACAAGTAGCTCTTATGCGGCTGGCAACGATACACAATTGCTGTCTTACTCGAGCGCCGCAGATGGCTTGTCACAACAGCCGCTGCTCGCTTGTACTATACGCAATTGCACAAGCAGATATCATGAACTGAACGAAGGCATACATTTGCACAAGTTGCCGACGCATGCAACATTGCGCGAAAAGTGGATTTATAACTGTCGGTTCAGTGAGAAAAAACTCAACACGTTGGGATCGCGCATAAGAATTTGTACGCTTCATTTTTCGCCTAGTTGTTTCTACGGTATTAAACGACAATTGAAATTCGGCTCGGTACCCACTCTGCGTTTGGGTCACATGGACCCCAATATTTACTCAGATGGTTTTAGCAATTCAAAGGACGGTCCAGTTGATGGTCAGCTTTCACGTAAAACTCTATTGGCAGCATCTGAGACAATGCAGGACATTTGCTGTCTCATCAATTGTAAGCACAGCAAGCGTGAGTATACGCGGCATTTTGCATTTCCAAGCGAGAAGCAAATGCTTGATAAATGGCTAAATGCGCTCGGCATGGAGTTTAATAGTTCGCGTCCAGACGATTACAAAATCTGTGAATGGCATTTCAAGGCAGCAGATTTCGATGGCGAAGTTTTGCGTGCAGATGCGGTGCCGACACGCAATTTAAAGATTGATGATGCTGATCAAACAGATGATGAGGATGATGATGAAAATGATTATGAGGACGAAGATGAAGTGGGCTGGAATATGACCGAAGTGGCACTGGATGAACGTCCGTCTACGTCTGCAGCAGCAGCTGCTGCGGTAGCCTGTACCACCACGTCTGATGGCTACAACAAATTGATACCCGGCTCACGCAGATGTTGTTTGGCGCACTGCCGCAAACAATTGTTCCAAGACAATGTGCGCACCTTTAAGTTTCCCGCTATGCATGAACAATTCGATAAGTGGGTACACAATTTAGGCGTTAAATATGATGGCGAGACGCCCTGGCGTTATCAAATTTGTAGCGAACACTTTGAAAATCATTGTATAATACAATATGAAAACAAGGCGAAATTGTTTAGATGGGCGGTGCCCACTTTGAATTTGGGCCAACATGCACCAGCTATACTCTTCACAAACGAAAATCCTAAAAAACATCAACGAATAAGAGAAGCTGACTTCGATAGAGCGTATAGAAGTGCCACCGGGGGATCGTATGCTGATGGCGCTGACAACGAGGAGACAATGGATACAACAAACGATGAATGTTCCAATGCGGCTAAACATGTGGCTTATCAACAGGAGGATATGGATTTGCTTGCGCCAATTGAACGCCAACCGCCGAAGTCGAGTGTCACTACAAAGCGTAGTACTTATGCGTATACCGCAAGCGATGACGATGCTGATGATTACGATGATGATGATGCATATGTTATGGGTGAAGGTGAGAATTCGCTTTTGGATGTGATACGCGAAGAAAAGGCCATGCCCGTGCAAGAAGGCACGCCCTCATCAGCGTTCTTCTCACTGACGTTGGTTCGCGGTGGTTCGGCAAAAATACGCGCTTGCTGCCTGCCACATTGTGGACGTACACGTCAATCTGGCGTCCGCCTTTTCCGTTTTCCAATGGAACCCGTCTTCCTGCACCGCTGGGAATACAATTTGCGTGTGCGCTTCAATGAGACCCAACGTAATACACACTTGATATGTAGTGCACATTTCGAACGCGGACAATACAACAAACGCCTAGTGGTAGATGCTATACCAACGCTCGACTTGGGTCACAACAGTACGGATATCTATCGCAATGGTCAATTTGAGCCGTTGAAGACGCATAAGCGTACAACGATATCACCACCGCCACCACCGCGAATCCCCTCCACCACTAGTAGTAACATTGCTTTGAGTGGCGTGACAGCAACTCCGCAGAAGCCACTTAAATGCAATGTGGCCGCCTGTGTTGATGCGCAAACAACACGCCACCTATATCCTTTCCCTAGCAACAATGTATTCGTTAAGTTGTGGGCGGAACGTACACAGATCGCATACGATGCGCGTGAACATGCTGAACTGCGCGTTTGCGAGCTGCACTTTGAATCCGATTGCTTTGGATTGCACGGTCTAAATAACAATGCTGTGCCAACATTGTGTCTACCCGCACCTACTGTAATTCCCTCGGCCACACCAGCAGCAGTGACAGCGACAGCAACAGCACCAGTGCCTGTCTCAATAGCACCAAAACCTTTGACAACGTTAAGTAGTCGCCCTTCCGGACCACCGACAGCGATGCCAAAACTCAGTGCAATTGCCTGCAGTGTAACAAATTGCAGCAATAATACCGCCACACGCCcggatttaaaaatattctcgAAATTCCCAGATGATTTTGAATTATTCACCAAATGgtgttttaatttgaaaatcgaTCCACGCACCTATGTCGACGGCAGTTATAATGTTTGTAGCGAGCATTTCGAGCCCTTCTGCATCGGCGGTCATAGTTTGCGCGTTTGGGCTGTACCCACACTGCATTTAGGACATAATAGCAAACTTATACACAGCGTCGAACGGCCAGCGGAAATGGAAACGAAGTGTTGCCTACCGCATTGCGGGCGTAAGAAGAGCAAAGATGGAGTGGAGTTCTACAGCTTTCCCAAAGGCGACCATTACCGTCAATGGTGTCAAATACTCAAAATCGACGAAGGCCTCTATCGTAACACAGACAAGAAAATTTGTAGTGCACACTTCCGTGCAGACAGTTTCAACAGCAATGGTACTCTGCGCCTGGGCGCACGTCCCTCCGTACAACTGCGCAATCGCACACCAACAGCTGCCGCACACATGCTAAAGCCACCGGCGCCATATCGCAGCAAGTGCATAGTGCGCATTTGTCATGAAATGCAACAGCTTTACAGTTTTCCCGCACAGCGTAATTTATGCACGAAATGGTGCCATAACCTCAAAATCGACTACTATCCCAAATTGCATGAGaatatgaatttcaaaatttgtcgACGTCACTTCGAACCGAATTGCCTGCTAAGTGGCGGCAAATTGCATGTCGAGGCCGTGCCAACAGTGCAATTGGGACACAACGATGTGAATATCTATCAAAATATGGTCGGCGCAAAGAAAAGCGCCAGCACGCCCAGCTATGATGATAATAGCAGTTTACGCACTAGCGTCAGTACGGTGCACACTTGGCTGATGGACGTCGACGCAGAGTCGAGTGCCGCCAATATGGTAGCCATTGGTGGCCGTGTTGGCGTTAAGCGCATGGAGTACGAACCGCCAGTGGATATTGAACCCATAACCGTTGCTACTGAGGATGTCGCGAATGAGGATAATATGGATTCGACAGACAATACATATATGCAGCTGGAAGATGACTCATACTATGCGGACTTTGAAGAGCAACGTTTGTTGCCACAAAGCAGCACATTTATAGCTGCCGCTGAAAGCACGGAAGTGATTGATTTGGATGCTGTGGATGCAGTGCAGGAGCAATTTCCCAATTGGTCACAGCGTGACACAGTTTTAGtggatgatgatgacgatgaggATGATGATGCGCTTTTGTGGCCGTTGAATTGA
Protein Sequence: MRISCEQTVPKFTKPLGEKKAVLSDSSDAEQVDDDEEEDEDCDDVNDDDYRVDEEDEENDFYASAGVVNSDEEEEETIEDFTPSISAATGDDDEMFSNVDVREKINFNDGSDDDDDDDDDNDDEDDDEDVDDVYGNEDDEDSDEVDESVADDVFNENVDSDSDSESEDNEEGNIVDSKDAEVDDEDVEMPIDDDDDKSSYNACDPLDFVDCVTRSDNAPLKRRKLHATTKGRTLPAASKNAHKRPMSTTPVRFDDDSNTNYSNADETTRFTTITSNSASASAITASASASASASATVSTTHHCGSEKISRSVFRLGCLRHRRKKKAPPDPPPDQKSTRKSRKTLPPPAYPTKATISRKARRIHCSVHSCGRASATLYRFPPIGNRFYRQWCAQLGAEMSQATCLRICQRHFAYCLIDRRRRSLRFGAIPTCNLRKTTKDANNITNITTQSHTSQLMNATVKKTNKEQPLAAQLNPYNHCCVPNCGKTHQVDGVTLFSFPKLRSLYLQWASNLGLMPTARLVQVYKVCSDHFDSNCLSYQRNARATLKYGSVPKLKLGLSENLSIDTDNTLLTQKRRKVCKRKWQPQKGVNECAVHDCRVAQFLQMQLFPLPDVQKLQERWCNYFNLTVNNTATDASEFFQNVRLCALHYMEGYQMATHNDGARKSNKSAFEELETNYARITSSTRIQMLKCCVPNCSTKFTDNLRLTVFPSAEELRTKWQHNTQVSFSPTHRYLYKVCALHFEERCFGKKRLFLWAMPTLRLPQPLNQDPAHKIYENPSVDVVGTTHCCVEDCEADEEKQPGIADDAEKAVTTSTRLWHFPQDDALREKWCHNLGLSVHTQQISHTSRRWRICSRHFETYCIGKTLRSWAVPTQHLPKTTKLAKSIKRSTFIYQNPDSAALFYCCCIKTCRQQRDVDAGIRLYAFPKKDTMLQKWAHNIRMPAVKCRHARICTLHFEAQCLRPQMQPWALPTIDLGHDESDIFRVPKVKLNVTNERCCLPHCNKRRSRDNVHLFIFPRDEAVLAKWYNNLAIGVQDVKHRVICDSHFEPRCISMRRLKRWAVPTLNLGHNNEPLENPTPAEVLSYENASSTRRSQTPSKIARTKSTLCNKPALSGITEKCSLVGCDRVTDTNALYRFPKPGWLRQKWSENTRLNEEQAKQAKVCACHFEPHVMGNQKPRPWALPTLELGVDEEGVPLPAVHANPKQLARFHPEEHEWGELRYVRANHCSIISCMKSKSDGVTLFNYPTKRHMLHKWAENCRHYPYQAKRYRFQLCGAHFTADCFKREGTRLRKGSVPTLDLGHDDPQIHQSEFETVSAPAREEKLIKRCSVPECERSQDDDGVRLFKFPIERAEILEKWCHNLHLNVADCRYALICNIHFESRCIGGGRLLLRALPTLLLGHNEADIFHNPETFERPEKLICCCVPGCSNTKQTEGVQLSAFPKLRSQFEKWAQNLHLPVTANIWHTYKVCSDHFESYCYEHGRIKVGAVPTLKLGHDNTENLYTVTEEAMSNSFKRKRVAPKIETSKEPQSSCCYPDCKEMELRLTNQLFEFPKLPAVRRQWLKSIGLYEAKVETEEGKCAALKEDSREVPPAAETIKIACKAEIKKTDDDDTAELSAVNTTKPTRKICPMHFKLLYIKHKTMLQALQSERTPEIMLCLQELEKTYTNVCDLSCVRRISCAVPECNSNYLTTESIRFFKFPDNPEMRAKWCHNTQVVIDQDRLYCYKICELHFESACASQPAKKIQRLKIWALPTLHLPPRAADMPAIYPLPAPETMPDSKRAALLLQTANNKCCIPSCMFAKELQQRDVSDESDIQFFNFPNEAELLYKWVFNTQVSMVAAAHARICSLHFEKHCINKRLRMYAVPTLLLGHNKTDIYHNPSDKRTPVEAGCKLEDSEKSERLDDKNKESKAAEKTKVKGEASQERELRQLRKVASVEKVEDKPAVLKEKEAKDLPNNSSSKVAVPKKAAPEEKPLHKPFLMHIKQEKDVDEADVDIDTQMKQGLLDMFNSFCDTGDQENDDATELAESTPVERETARHCRIPGCDSYARNPGVILFKFPFALDQFRKWLHNTQLEVDYTRRWRYRICHRHFEPFCTQFRKLPLGTMPTLNLGPSRPPHIYENEIDMNSLKKYKIRRQAISGPTVSSFNDLNDEADTRSSFAAQPERTEIDEYNEHNVDYTDFVDNTPVDRDTSRHCRILDCSSHAKDPNVTLFKFPLSEYLFRKWLHNTQLQVDYTRRWRYRICQRHFDPICMQFRKLPPGTMPTLNLGPSRPARIYENSFDINHLKKFKTKPPAAATATTTTKAPPSNSELIDEGETSSSYAAGNDTQLLSYSSAADGLSQQPLLACTIRNCTSRYHELNEGIHLHKLPTHATLREKWIYNCRFSEKKLNTLGSRIRICTLHFSPSCFYGIKRQLKFGSVPTLRLGHMDPNIYSDGFSNSKDGPVDGQLSRKTLLAASETMQDICCLINCKHSKREYTRHFAFPSEKQMLDKWLNALGMEFNSSRPDDYKICEWHFKAADFDGEVLRADAVPTRNLKIDDADQTDDEDDDENDYEDEDEVGWNMTEVALDERPSTSAAAAAAVACTTTSDGYNKLIPGSRRCCLAHCRKQLFQDNVRTFKFPAMHEQFDKWVHNLGVKYDGETPWRYQICSEHFENHCIIQYENKAKLFRWAVPTLNLGQHAPAILFTNENPKKHQRIREADFDRAYRSATGGSYADGADNEETMDTTNDECSNAAKHVAYQQEDMDLLAPIERQPPKSSVTTKRSTYAYTASDDDADDYDDDDAYVMGEGENSLLDVIREEKAMPVQEGTPSSAFFSLTLVRGGSAKIRACCLPHCGRTRQSGVRLFRFPMEPVFLHRWEYNLRVRFNETQRNTHLICSAHFERGQYNKRLVVDAIPTLDLGHNSTDIYRNGQFEPLKTHKRTTISPPPPPRIPSTTSSNIALSGVTATPQKPLKCNVAACVDAQTTRHLYPFPSNNVFVKLWAERTQIAYDAREHAELRVCELHFESDCFGLHGLNNNAVPTLCLPAPTVIPSATPAAVTATATAPVPVSIAPKPLTTLSSRPSGPPTAMPKLSAIACSVTNCSNNTATRPDLKIFSKFPDDFELFTKWCFNLKIDPRTYVDGSYNVCSEHFEPFCIGGHSLRVWAVPTLHLGHNSKLIHSVERPAEMETKCCLPHCGRKKSKDGVEFYSFPKGDHYRQWCQILKIDEGLYRNTDKKICSAHFRADSFNSNGTLRLGARPSVQLRNRTPTAAAHMLKPPAPYRSKCIVRICHEMQQLYSFPAQRNLCTKWCHNLKIDYYPKLHENMNFKICRRHFEPNCLLSGGKLHVEAVPTVQLGHNDVNIYQNMVGAKKSASTPSYDDNSSLRTSVSTVHTWLMDVDAESSAANMVAIGGRVGVKRMEYEPPVDIEPITVATEDVANEDNMDSTDNTYMQLEDDSYYADFEEQRLLPQSSTFIAAAESTEVIDLDAVDAVQEQFPNWSQRDTVLVDDDDDEDDDALLWPLN

Similar Transcription Factors

Sequence clustering based on sequence similarity using MMseqs2

100% Identity: -
90% Identity: -
80% Identity: -