Basic Information

Insect: Chymomyza amoena
Gene Symbol: -
Assembly: GCA_037043745.1
Location: JBAMAX010004330.1:317159-331441[-]

Transcription Factor Domain

TF Family: THAP
Domain: THAP domain
PFAM: PF05485
TF Group: Zinc-Coordinating Group
Description: The THAP domain is a putative DNA-binding domain (DBD) and probably also binds a zinc ion. It features the conserved C2CH architecture (consensus sequence: Cys - 2-4 residues - Cys - 35-50 residues - Cys - 2 residues - His). Other universal features include the location of the domain at the N-termini of proteins, its size of about 90 residues, a C-terminal AVPTIF box and several other conserved residues. Orthologues of the human THAP domain have been identified in other vertebrates and probably worms and flies, but not in other eukaryotes or any prokaryotes [1].
Hmmscan Out: # of c-Evalue i-Evalue score bias hmm coord from hmm coord to ali coord from ali coord to env coord from env coord to acc

1 28 1.7e-15 2.4e-12 47.9 5.3 1 86 583 655 583 656 0.85

2 28 4.9e-15 6.8e-12 46.4 4.8 1 87 683 752 683 752 0.83

3 28 2.4e-15 3.3e-12 47.4 0.2 1 87 774 846 774 846 0.85

4 28 1.2e-16 1.7e-13 51.6 5.7 1 87 926 996 926 996 0.81

5 28 1.9e-14 2.6e-11 44.6 4.5 1 86 1020 1091 1020 1092 0.81

6 28 1.1e-12 1.6e-09 38.9 0.6 1 87 1127 1195 1127 1195 0.80

7 28 2.7e-10 3.6e-07 31.3 1.7 1 86 1236 1305 1236 1306 0.75

8 28 2.3e-17 3.2e-14 53.9 0.4 1 86 1333 1402 1333 1403 0.81

9 28 2e-12 2.8e-09 38.0 1.8 1 86 1424 1493 1424 1494 0.82

10 28 3.7e-15 5e-12 46.8 1.7 1 86 1521 1592 1521 1593 0.85

11 28 6.1e-14 8.4e-11 42.9 3.1 1 87 1656 1726 1656 1726 0.83

12 28 1.3e-11 1.8e-08 35.5 0.1 1 86 1748 1816 1748 1817 0.81

13 28 1.4e-13 1.9e-10 41.8 2.2 1 87 1920 1989 1920 1989 0.81

14 28 7.1e-10 9.6e-07 29.9 1.8 1 85 2050 2113 2050 2115 0.82

15 28 5.5e-05 0.075 14.2 0.1 1 59 2145 2197 2141 2220 0.74

16 28 2.2e-13 3e-10 41.2 0.5 1 86 2235 2304 2235 2305 0.83

17 28 2.3e-12 3.1e-09 37.9 0.5 1 86 2337 2404 2337 2405 0.79

18 28 1.5e-11 2e-08 35.3 0.5 1 86 2431 2500 2431 2501 0.79

19 28 6.2e-12 8.5e-09 36.5 0.6 1 87 2522 2588 2522 2588 0.77

20 28 5.9e-13 8.1e-10 39.8 0.0 1 86 2616 2690 2616 2691 0.76

21 28 0.00053 0.73 11.1 0.0 1 58 2729 2780 2729 2805 0.75

22 28 2.2e-14 2.9e-11 44.4 1.2 1 87 2819 2893 2819 2893 0.82

23 28 1.9e-13 2.6e-10 41.3 1.3 1 87 3014 3085 3014 3085 0.78

24 28 1.1e-12 1.6e-09 38.9 4.6 1 87 3154 3225 3154 3225 0.80

25 28 9.5e-14 1.3e-10 42.3 1.7 1 86 3379 3447 3379 3448 0.79

26 28 4.7e-15 6.4e-12 46.5 0.4 1 87 3470 3540 3470 3540 0.85

27 28 9.9e-07 0.0014 19.8 0.2 1 58 3585 3633 3585 3639 0.89

28 28 4.7e-13 6.4e-10 40.1 0.7 3 87 3642 3711 3638 3711 0.80

#	of	c-Evalue	i-Evalue	score	bias	hmm coord from	hmm coord to	ali coord from	ali coord to	env coord from	env coord to	acc
1	28	1.7e-15	2.4e-12	47.9	5.3	1	86	583	655	583	656	0.85
2	28	4.9e-15	6.8e-12	46.4	4.8	1	87	683	752	683	752	0.83
3	28	2.4e-15	3.3e-12	47.4	0.2	1	87	774	846	774	846	0.85
4	28	1.2e-16	1.7e-13	51.6	5.7	1	87	926	996	926	996	0.81
5	28	1.9e-14	2.6e-11	44.6	4.5	1	86	1020	1091	1020	1092	0.81
6	28	1.1e-12	1.6e-09	38.9	0.6	1	87	1127	1195	1127	1195	0.80
7	28	2.7e-10	3.6e-07	31.3	1.7	1	86	1236	1305	1236	1306	0.75
8	28	2.3e-17	3.2e-14	53.9	0.4	1	86	1333	1402	1333	1403	0.81
9	28	2e-12	2.8e-09	38.0	1.8	1	86	1424	1493	1424	1494	0.82
10	28	3.7e-15	5e-12	46.8	1.7	1	86	1521	1592	1521	1593	0.85
11	28	6.1e-14	8.4e-11	42.9	3.1	1	87	1656	1726	1656	1726	0.83
12	28	1.3e-11	1.8e-08	35.5	0.1	1	86	1748	1816	1748	1817	0.81
13	28	1.4e-13	1.9e-10	41.8	2.2	1	87	1920	1989	1920	1989	0.81
14	28	7.1e-10	9.6e-07	29.9	1.8	1	85	2050	2113	2050	2115	0.82
15	28	5.5e-05	0.075	14.2	0.1	1	59	2145	2197	2141	2220	0.74
16	28	2.2e-13	3e-10	41.2	0.5	1	86	2235	2304	2235	2305	0.83
17	28	2.3e-12	3.1e-09	37.9	0.5	1	86	2337	2404	2337	2405	0.79
18	28	1.5e-11	2e-08	35.3	0.5	1	86	2431	2500	2431	2501	0.79
19	28	6.2e-12	8.5e-09	36.5	0.6	1	87	2522	2588	2522	2588	0.77
20	28	5.9e-13	8.1e-10	39.8	0.0	1	86	2616	2690	2616	2691	0.76
21	28	0.00053	0.73	11.1	0.0	1	58	2729	2780	2729	2805	0.75
22	28	2.2e-14	2.9e-11	44.4	1.2	1	87	2819	2893	2819	2893	0.82
23	28	1.9e-13	2.6e-10	41.3	1.3	1	87	3014	3085	3014	3085	0.78
24	28	1.1e-12	1.6e-09	38.9	4.6	1	87	3154	3225	3154	3225	0.80
25	28	9.5e-14	1.3e-10	42.3	1.7	1	86	3379	3447	3379	3448	0.79
26	28	4.7e-15	6.4e-12	46.5	0.4	1	87	3470	3540	3470	3540	0.85
27	28	9.9e-07	0.0014	19.8	0.2	1	58	3585	3633	3585	3639	0.89
28	28	4.7e-13	6.4e-10	40.1	0.7	3	87	3642	3711	3638	3711	0.80

Sequence Information

Coding Sequence: ATGTCACAACAACACCACCCGCACAATCActatcatcaacaacaacaacaagcacaacaacaacaccatcaTCAACATCTTGCGCATCAGCAAAATCAACACAAACTACAACATAAACAAATACAGCACAGTTGGTACTCACATGTTGCTTCCTACCCACCGCACGGAACAGCCTTTTCGGCATCCCCGAACTGTAAGAGTAATGTTAATATGAATGCATATGGTGCAGCGTCCAACACGCATGCATATTACGGTGGCAATAGTATTGGGGGCAGTGGCATCCCTGGCGGGGTCGGTAGCATGGGCGGCGTCAATGTCAATGCTGACGGCCATAACATGGCCTATAACCCTGACGCCCCGCCGGTAAATACTGTAGCTTATGCCCATAATCAATTGCTGCAgtatcaacaacagcaacagcagcatcttcttcttcaacaacaacaacatcagcagcagaTGCAACAGCATAACCAGCGTGCTTATATGCAACATGGCCTTATGCCAGGACCAACTTATCCTCCTTATATTAAAAGCGAACCCATGGAACTACCCAGTGAAAGACAACGGCATCAGCAGCATTTTCAAACGCCCATACCAATGGCACCGCCGCCAGCGCCCGCCACTCGTTTGGATACTAGCGGCGGCGGCAACGGCGTCGGAAATGATATGATAATAAAATcgGAACCAATGGATGAACATGCTTTTAAATCAAACTATATCGATGATAACACGCCATTTGCAGATTTTAGCAAGTATCCGGAGTTCAACCAGGACATGTTGAACCCTAAAGTGGAGCTAACCGTTAAAGACGACGTTTTTAGCAATTCAAGCCAAAAGCACGCACTAAATTTTCCACGTCGTAAAATGGAAACAGAACGCTCGGAAAGCCTTCCACCCATTTGCCAACGCTGCAAGGAAGTCTTcttcaaaaaacaaatctaTCTGCGTCACGTAGCTGAGAGTAGTTGCATCATAAACGAATACGACTTCAAGTGTGGTATTTGTCCAATGTCCTTTATGAGCGgtgaagaattaaaaaaacacaagcaactacataaatacaataaattcttTTGCCACAAGTACTGTGGAAAGAATTTTGACACAATCGAGGAGTGCGAGTCGCATGAGTATATGCAGCATGAGTACGAGACTTTTGTGTGTAAtATGTGCTCGGGTAACTTTCCAACGCGTGATCAGCTGTATGCACATTTGCCTCAGCATAAATTTCAATCTCGCTACGATTGTCCTGTATGCCGTTTATGGTATCAAACGCCACTGGAACTGCACGAACATCGTATGGCTGCACcttatttttgtggcaagtaCTATACCAACGTTGGCACAAATCACACTGTGGCACAGTCAAATCTTCCTGCTCATCAcccgcagcaacaacagcaacaacaatcaaaCTATAAACTACAGGATTGCCATATGGGCACCATTGAAATGCCTTCGCCACATCATAAATCCTCCTCAGCGGCTGCTAATACGCTCCCGGCAACGGCTGCACTTAGTTCCTTACTACAACAACGTCAAGCCAATGCGGACAGTACAGCTCTGTTTGGACCGCTCAAAACTGATGTTAAGTTAGAGCGTAGCTATAGCAATTCGACAAGCGAGTCATCCTATAATAGCATGCAGGATGGCAATTATAATAATGCTTTTGGCAGCGATGCATCGCTATTAGGTGGTCAGTCAGCACACTCGTCCACTCTTGATGACTCGGATGATGCTCTGTGCTGCGTGCCAAAGTGCGGAGTGCGTAAAAGCACTAGTCACACACTGCAATTCTTTACTTTTCCGAAGGATGAAAAGTATTTGCATCAGTGGTTGCACAATCTCAAGATGTTTCACATTCCGGCCACTACATATATGAGCTATCGCATTTGTAGCATGCATTTCCCTAAACGCTGCATTAATCGCTATTCACTTTGTTACTGGGCCGTGCCCACATTTAATCTGGGTCACGACGATGTAGCCAACTTGTATCAGAATCGCGAGCTCACCAATACTTTTACAGCTGGCGAGGTGGCACGCTGCAGCATGCCCAACTGCAATAGCCAAAGGGGTGAaagcaatttaaagttttataattttccaaaggATATCAAGAGTCTGATCAAATGGTGTCAGAATGCTCGATTACCTGTGCAGGCAAAGGAGCCACGCCATTTTTGCAGCCGTCACTTTGAAGAGCGTTGCATTGGAAAATTTCGACTGAAACCATGGGCGGTGCCCACTCTTCATTTGGGAACACAATATGGCAAAATTCATGATAATCCCAAAAACCTTTATGTGGAGGAGAAGCGCTGCTGCTTAGCCTTCTGTCGACGGAGTCGTTCATCGGACTTTAACATGTCTTTGTATCGGTTTCCCCGCGATGAAGTGCTCTTAAGACGATGGTGCTATAATTTGCGTTTGGATCCAGGTGTCTACCGCGGCAAGAACCACAAAATTTGCAGCGCACATTTTATTAAGGAGGCGCTTGGCTTACGCAAACTTTCGCCGGGAGCGGTGCCAACTTTGCATTTGGGACACAATGACAACTTTAATATTTACGAGAACGAATTGTGGCCCCCACCAACACCAACAGGGACATCTAATTCTCACAATCAACAGCCTCGGAGCTATCAACGCCACTCTGTGGCTTCCACTTCATCGTCAACTAGTTCTTCATCGCTGTATATCGAACAGGAAATGAATGCATCCTATCATGGCATGTCAACTTCTTCATCATCACTCAACGTGACCGAATGCATGGATATCTGCTGTGTGCCCGGTTGCGAAAGTAAACGTCACAATAATGAAAACATTACTTTCCATACAATACCACGTCGCCCGGAACAGATGAGCAAGTGGTgtcataatataaaaatacccGAAGAGAAAATGCACAAAGGCATGCGAATTTGCAGTCGTCACTTCGAATCCTACTGTATTGGAGGCTGTATGCGTCCCTTCGCCGTGCCCACACTTCATCTGGGCCACGATGACGATGATATATACAGAAATCCTGACAAGATCAAAAAGCTTAACATACGCGAAACATGCTGTGTTCAGGTTTGCAAAAGGAATCGTGATCGTGATCATGCCAATCTGCATCGCTTTCCTTCAAATCCAACGCTGCTCGCCAAGTGGTGCGCCAATCTACATAAACCTGTACCAGATGGCAGCAAATTGTTTAATGATGCCATTTGCGAGGTGCACTTTGAGGATCGCTGTCTACGTAACAAACGACTTGAAAAGTGGGCAGTGCCTACGCTTGTTCTGGGCCATGATTTCGTACCACATATGCTGCCTAGTGAGGCAGAAGTGGCCGAGTTCTACGCACGTCCTAGTGCGCCAAACAATGGCGAAGAGGAGGGCGAATGTTGTGTGGAGACTTGTAAACGCGATCCCAGTGTTGACGATATTAAGCTTTATCGTCCGCCTGAAGACCAAGAAGTTCTCGCTAAATGGGCGCACAATCTGCAGCTAGATGTTGAGCAACTGCCTAGTCTGAGAATATGCAATCTACACTTTGAATCGCATTGCATTGGCAAGCGCATGCGCCCATGGGCATTACCCACGCTTAATCTAGCCAATAATATTGAGAATCTCTATGAAAATCCCGAAAATAATATGCTTTATGTGCGCAAACAGCGCCGTTTTCTTTCTTCGGAAACGGGCATGACAAAGCCCACTTGGGTGCCGCGTTGCTGCTTGCCACACTGCCGCAAAGTACGTGCCATACACAATGTTCAACTCTATCGTTTCCCCAAAATTAACCGTTCCACGCTGGCTAAATGGGCTCACAATCTGCAAGTTCCGTTAATGGGTAGCGCTCAGCGTCGTGTCTGCTCTGTTCATTTTGAGCCGCATGTTTTGAGCAAGAAATGTCCCGTTCCATTGGCCGTGCCCACACTTGATTTGAATATGCCTCCTGGCCTTAAAATCTATCAAAATCCTGCCAAGCTTAAGGCCAGCAAGTTGTGCTTACAGCGAGTTTGCATTGTGGAAGGCTGCCGTCGGCAGCGTGTACATGGCGTGCAACTATTCCGATTTCCACACAATACGGCACAGTTACGTAAATGGTTACACAATATTAAGCAGCGACCCAAAGGCGGCATGCGCAGTCAATTTCGCATCTGCTCTAAACATTTTGAAACGCATTCGTTTAATGGCAAACGACTGAGCGCGGGCGCAATACCCACACTTGAACTGGGACACGACGATGATGATCTATATCCAAATGAGGTGCAGTCATTTGTAGAAGAGCACTGCACCGTAGAAGGTTGTGATGCCTCAAAAGAGCAGCCCGAAGTAAGGCTTTTCAAATTTCCCACAGAAGATGAGGATTTGCTATGGAAATGGTgcaacaatttgaaaatgaatcCCGTTGATTGTGTTGGAGTACGTATATGCAATAAGCACTTCGATCCGGACTGTATTGGGCCAAAGCATCTTTTTAAATGGGCCATACCGACCTTGGAATTGGGACACGATGATGCAGAAATTGAGTTGATACTAAATCCAAAGCCAGAAGAACGCTATTTGGATCCCGTATTTAAATGCTGTGTGCCCACCTGCGGCAAAACACGCAAATTTGATGAGGTGCAAATGAACAGCTTTCCCAAAGATCCCAGTCTTTTCGAGCGCTGGCGGCATAATCTTAAATTGGAGCATTTGAACTTTAAGGAGCGAGAACGGTATAAAATCTGCAATTCCCATTTTGAAGATATCTGCATCGGCAAAACAAGACTTAACATAGGCGCCATACCAACGTTAGAGCTGGGCCATGACGAGACGGATGATCTCTATCAAGTTAATCCTGAGGAGCTGCAAAGCAATTTATTTGGTCGCCCGCGTCGCTTACACGAAACAAACACGTTAACCAAGAGTGAAGAAACCATATCAGAGGCGACTGATTTGAATACTTGCCaagttaagattaaaaaaagtttgaccGAACTCAAATGTTGTGTAGAGAGCTGCGGAAAAACTCGTTTAGAGCATGGAGTACGTCTCTATGCCTTTCCCTCTACCAAACAACAGCAGAATAAATGGCGCCATAATCTGCTCCTTAGTCCAGAGGAGTTGGACAAAAATACGCGCGTTTGCAGCTCGCATTTTAATAAGCGTTGCTTCGATGGCAAACAGCTGCGCAGTTGGGCAATGCCCACGCTGCATTTGGGTCACCAGCAGCCCATCTATGAGAATCCAAAGAATGTACCCGGCTTTTTTACACCTACCTGCGCCTTAGAACATTGTCGAAAGCGGCGCACTATTGATAATGATTTGCGTACCTATCGTTATCCTAGAAACGACGATATGCTAGAAAAATGGCGAATTAATTTAAGGTTGGAGCCTTCGCAATGTCGTGGCCGAATTTGTGCTGATCACTTTGAGCCGTTGGTGAGAGGTAAGCTAAAGCTTAAGACGGGTGCTGTGCCCACGCTCAAGCTAGGTCATGATGAAGATATCATTTACGACAACGAGGCCATTAAAGCAAGCTTGGAACTGGATGAGGATATAAGCTTAGAGTCCAGTGAGCATATGACTATTCAACCGAAGAGTGTGCCCACATACGAGGAAGACCTTGATGATGAAGAACAGTATCAAAATTCAGCATACTTCGATCCAATGGAACTAGTGCAAACTTTTGCAGAACAACACAATAGTGAAGAGGAGCAGCACGTTGGACAAAGAAACGGACCACCCGAAGTTATAATTAAGCGCGAAAAACCTGCCAATAATGTTACGCCAATTTGTTGCCTAAAGCATTGCCGCAAAGAAAGAACGGCTACTTATCATTTGAGTACATTTGGTTTTCCTAAGGATCAAAAAGTACTTCTTAAATGGTGCGCAAATTTGCATTTGCAGCCATCTGACTGTATTGGACGCGTATGCATTGAACACTTTGATCCGGAGGTGCTAGGCAGTCGTAAGCTAAAGCAAAATGCCGTGCCCACCATTAATGTGGGTCACGATGATCCGCTGCGTTATGCACACAACGGCGTTGAACTGCATTATGATGAACAACCTCAGCATTCGGTTTTTCGGCTTTCCAGCCTGAAACACTGCCGCAAACGGAAGTACTCCGAAACACTAGATCAAGAAACCAGCTCTAGTGACATCAGCCAAGACTTTAAACAGTGCTGTTCAGTATTAAATTGCAGCCGAGTTGACGTGCGTCTTGTACGTTTGCCAAAGTCCCGCATACTGCAACGGAAATGGCTGCACAATTTGCAGCTAATAGATTCTGTACAGACACCTAAAATCTGCTTAGATCACTTTGAGATGCATTGCTTTCAAAATGAATGCTCTCTTAAGCCTGACGCTCTACCCACAAGAAAACTGGGTCACAAGGAACCGAACATCTACCGAAATAGGGTAGGAAAGCCAAAGCTAATACTGGCTAACAGGAATAATCTCGTGCGAAGCTGCCTGTCTTCCAACTGTCGGTATGCACGTGCATACAATTGTCAATATTATGCGCTGCCGTTGGACGAAAATCTTCGTAAAAGTTGGCTTGAACACTTAAAACTATATGTATCTGCACAATTAAAATTCAGTGTTGGTCTTTGTTCCATACACTACTTGCAGTGCTATGAGCAGACAACAATTCCCAGTAGTTTAGCAGAGTCTGAACGACAAGAGTTATTGCAAAATTATACTGGTATTGTCATTTCCCCGACAGCTCAAATGCTGCGCTGCGCTGTACCTGGCTGTTTTACCGTGGTTACGGACAATTTACGGCTTATCAGCCTGCCACAGTCTAGCGATCAGTGTGAGAAATGGGTAGAAAATACCAAAATGGAATATGTGGCTTCCTATCATAACTACTATCGCATTTGTCAGCTACACTTTGAGCGACATTGCTTGGGGCTACGGCGTATTAAGAATTGGGCAGTCCCCACACTGCAGCTTAACCACGAAgatgaaattcataaaaatccaaTATCAAACACACCTGAAGCATTGACGTTAAACAGCTCTTGTAAGACTGATTTCAAAATTTGCTGCATTAACATTTGCAGACAGCAAGTCGATGAAAACACTAAACTGTATCCTTTTCCTACGAATGAAATAATGCTACAGAAATGGATAGTTAATACAAAACAGCTTATTGGAGAGTCTTCAAATCTGCACATATGCGAAGATCACTTTGAATCTACATGTTTAGGCCAGGAAAGTCTGCCTCAATGGGCCGTGCCCACGCTGGAGCTTGGGCACAATGAATATATCATTAAGAATAGGTATCCAGATAATGAAGTGCTTAATTACATTAGGGCAAACTACTGCTCGATAATCAGTTGTTTCCAGCAAAGCAGTGAAAAGTTGCTTCTGTATCCATATCCAAAAGATCGTAGCATTCAACGCAAATGGGCTGCAAATTGCGGACACAATCCTACTCAAGTCAATGACGGTGTTCAAGTGTGCCAGAAGCATTTTGCAGAAGATTGCTTTGATGATCACAACGAGCTTTATGTGGGCGCTGTTCCAACCTTAAAGCTAAACGTTGAACCATCTGTGCTGCAACAAAGCGATTGGTTCCATGCGATACCAATGAAATGCGCAGTACAACTGTGTAATATTATTTCTAAGCGGCACTTTGCTTTTCCGGCAAATGAGGAGTTGCGGAGCAAGTGGACTCACAATTTGGGGCTGGATTTGGTCGATACTAAAGATATGCGCATATGCCAGCGTCATTTTGAATCCCGGTGCTTCCGTGAAGGACAAAAGCTACATGACGGCTCAATACCCACACTTCATCTGGGCAATGAGTCGCTTATAGGAGACGAAATAATAAGAATGCCAACAACTTTTCCACAGACTATAGAGAATGGAGGCAAATGCTGTGTGCCTGGCTGCGACAAAACTCAGGATGATGACTTGTACTTTAGCAGCTTTCCCAAAATGCCTTGGTTGGCTAAACAATGGCTTCAGAATATTCGTCTGGAAGTGCCCCTACTAGACTCATCACTGTACAAACTTTCATGGAAAGTATGCAGCAGACATTTTGAGGCTAATAACCTTCAAGGACTTGGTGTACCGGTTTTCGGAGCTGTGCCCACATTGCACTTAGGCCATCAAGATGAAGACATACACTATCCCGATGAGCAGCTATTGGGAAGTCGCCGAAAGGCACCACAACCAGGAGCGACGTTAGCTAAACACAATGACTTTAATTACTGCTGCTATCCAAAGTGTTGTGAGTTTGATGGACCACTTGCTCAAACTGCTGCATATGCATTACCCGAATCAAAGGAGCTACGTGAATTATGGCTGCTGGCCATGGGTGATGATGTAGTTCCGCAAAAGGAACTAAGACTGTGCCCAGTGCACTACGTCTTCCTATATGGAAAAAGCCGCGATAACTTTCCTGAACATGCAGCTGAAGATTACCAGTTGCAGCGAAACTTTGAGCAAGCCAAAAGTCATAACAGAGTGCGCATGAGCAGCTGCGCAGTACCAGGCTGCAAGAGTATAAGAATGCGTGGTGCGGATAATGTTAAGCTGCATCAGCTGCCGCAACAGCCTAATAAGTTGCGAAAGTGGCTTACGAATACTCAAATGAAGGTTATTGAGACACAGCGCTACATGTTTAAGGTGTGCGATAGACATTTCGAAGAACGTTGCTTCTTAACGCCACGACGCCTTAAGTCTTGGACATTACCAACGCTAAACCTGCCGGAGAGAGATGCTAATGTCAAGCTATACAAAAATCCCAGTCCAGAGCAATTATATAGAAATTCTAGCAGTGATAGTGAATCTAGCAATCCTAGGTCCGAACCCACAATTCACGTAGAGCATATGAATTGGGAACGTGAAGATGCAGAACTTATATGTGATGTTCAACCAAGACCAACGTCTGTAAATGACAGCAGCTCTCAACCCATGGAAATGGAGGAACTGGAAGTCTTGCTAGAAGTTGGCCATGTAGAGAAATTTGAAAGCTATGAACACTTCGACACTGGACCAATTGAGGAGCCTACGACTAGTTATTTTGGTGCCCCAAAAATAAATCAGCAATACACAGCGACACGATGCTGCATTCGAGGCTGCGATGTTACCATACGTGACGGTGATGTAAAGCTACACAAATTTCCGCAACCAAAGGGAATATTACGAAAATGGATGCATAATACTCAGGTGGTGGTGGACCCCAAGTACTTCTGGCGCTATCGCATATGCAGCCATCATTTTGAACGCGAATGCTTTAACGGCTATCGTTTTCGATTGGGAACCGTTCCCACGCTGCATCTTGGCCCTAATAGACCGccgaaaatatatcaaaatgagTTTTCAGTTCAAGCGGAACCAGAGCCGGATATAGAGGAAACACAGCTATTAGAAGAAACATACGAAGAATCATTAGAAGAGACGTTTGAAGAGCCGGTGTTTGAAGAATCGTTAGGGGAATTAGAGCCAGCCTACGACAAAAGGTCACGAAAATCAACGAAATATTGTCAAATAGAACACTGCTACAATCATCTGCATACACCAAACATAACTTTACATAAGTTTCCAGTCTCTCCTGGTCAGTGCCGCAAATGGATACATAATACTCAGGTTCCTTTTGAGGCAGAGTATCGTTGGCGATTTCGCATATGCAGCGAACATTTTCAACCTTTCTGCTTAACAAGTAAGCGTCTTCTTCAAGGTAGCGTGCCCACATTAAATCTTGGACCCAATGCGCCGGCGCGACTGTATGATAATAGTTTTGAAATGAAGGAGCCACAGCTCGAAAAGAAAATGCAAGAATCGACAATTGATGTATATGATGATGATAGTTTTCAAACTAATAATACTGATTTTGATACGGAAAGTTATATGGAAATGCCTGAAATCGAACCAGAACTTGTGTTGGGATCCAGTGAGCCGACTCATTTATATGACAATAGTTTCCAGTCTCATAATATGCAGTACGATGGAGAGAATTCTATGGATATGCGAGAAAATTCATCAGAATGGGAAGAGGATGATGAAGACGATGACATGCAGCTTCTAGTACCTGAGCTGCAACTGGAAGTGCAGGATAATGAAATTTGCTTTGCCAATGACACTGCACGCACTCAAAATGGGCAACATAAACTGCAGAAGCACGTTGTATACAACGAGGTCAAGTTTGGCTATGGAAAATGCTCTCTAATTCACTGTCAAAAACAGAAGATCCAACATGGCGTGCTTTTATTTAAGTTCCCTAAGTCTAAGCTAATGCAAGAACGATGGATGCATAATCTACGCGTACAATATGATGAGCAACGTCCCTATTTAATATGCAGCGAGCACTTTGAGACAAGGTGCATAGAAGAACAGAACCTTAAAGAATGGGCCGTACCAACGCTGCAGCTTGGTGAGAATGTGCCAgagattttgtttcaaaataagGTAAAAAAGAGGTTGATAAAAACTTGCTGTCTGCAGTACTGTGGAAGGCAACGGGACGAAAACATTAAGCTCTTCCGACTACCTAACAATCGCAGCATGCTTAAAAAGTGGGAGAGGGCCACAGGCATGAGCTTTAATGAGTCTCAGCGAAACACAAGGCTAATTTGTAGTCGCCATTTTGATCCACAGCTGATTGGCGTACGACGTTTATCCAAAAACGCAGTTCCGACATTAAACTTGGGCTTTATGCAAGATGAACTTGCACCCGCACCAGTTGCGGTTAAAAaagttgaagttaaaaaacCTAAAATCAAAGTACCTAGATATTATCATCATCAAAGTGCGGAAAAACCTACTTCACCGCCGAGATGCTGCATGTCTAATTGCATATTCGACTCTAATGTTCATCTATACAAGTTTCCTTATGACTACGATCTACTGCGTCAATGGTGCCAAGGACTTAAGTTAAACGATGTGGTCAGCTTTCGTGGAAAATATATATGTGCCAACCATCTGCCCGTCAAACCGGAAAGGTGTGCCGTTTGTGGCAGAAATGATTTGCAGCTACCCCTGCTCATCTTTCCCGGCAATCGAAATGTGCGTCAGAAATGGTGTCACAATCTGAAAATTGATAACATTTCCAAGTGGGACTTTTCGCGTACCCTTTGCTCTAAGCATTTTGAAGAACACTGCTTTTCAATGGAGGATGGGGAGAGAAGTCTGCTTAAGGATGCCGTGCCCACCTTGCATTTAAAGCACACGGATGTAAACATATTCCACAATGATcaaataattgtgaaaaaagtgaaattggaACCGTTTGACAGCGAAATCCTGCTGCCATAG
Protein Sequence: MSQQHHPHNHYHQQQQQAQQQHHHQHLAHQQNQHKLQHKQIQHSWYSHVASYPPHGTAFSASPNCKSNVNMNAYGAASNTHAYYGGNSIGGSGIPGGVGSMGGVNVNADGHNMAYNPDAPPVNTVAYAHNQLLQYQQQQQQHLLLQQQQHQQQMQQHNQRAYMQHGLMPGPTYPPYIKSEPMELPSERQRHQQHFQTPIPMAPPPAPATRLDTSGGGNGVGNDMIIKSEPMDEHAFKSNYIDDNTPFADFSKYPEFNQDMLNPKVELTVKDDVFSNSSQKHALNFPRRKMETERSESLPPICQRCKEVFFKKQIYLRHVAESSCIINEYDFKCGICPMSFMSGEELKKHKQLHKYNKFFCHKYCGKNFDTIEECESHEYMQHEYETFVCNMCSGNFPTRDQLYAHLPQHKFQSRYDCPVCRLWYQTPLELHEHRMAAPYFCGKYYTNVGTNHTVAQSNLPAHHPQQQQQQQSNYKLQDCHMGTIEMPSPHHKSSSAAANTLPATAALSSLLQQRQANADSTALFGPLKTDVKLERSYSNSTSESSYNSMQDGNYNNAFGSDASLLGGQSAHSSTLDDSDDALCCVPKCGVRKSTSHTLQFFTFPKDEKYLHQWLHNLKMFHIPATTYMSYRICSMHFPKRCINRYSLCYWAVPTFNLGHDDVANLYQNRELTNTFTAGEVARCSMPNCNSQRGESNLKFYNFPKDIKSLIKWCQNARLPVQAKEPRHFCSRHFEERCIGKFRLKPWAVPTLHLGTQYGKIHDNPKNLYVEEKRCCLAFCRRSRSSDFNMSLYRFPRDEVLLRRWCYNLRLDPGVYRGKNHKICSAHFIKEALGLRKLSPGAVPTLHLGHNDNFNIYENELWPPPTPTGTSNSHNQQPRSYQRHSVASTSSSTSSSSLYIEQEMNASYHGMSTSSSSLNVTECMDICCVPGCESKRHNNENITFHTIPRRPEQMSKWCHNIKIPEEKMHKGMRICSRHFESYCIGGCMRPFAVPTLHLGHDDDDIYRNPDKIKKLNIRETCCVQVCKRNRDRDHANLHRFPSNPTLLAKWCANLHKPVPDGSKLFNDAICEVHFEDRCLRNKRLEKWAVPTLVLGHDFVPHMLPSEAEVAEFYARPSAPNNGEEEGECCVETCKRDPSVDDIKLYRPPEDQEVLAKWAHNLQLDVEQLPSLRICNLHFESHCIGKRMRPWALPTLNLANNIENLYENPENNMLYVRKQRRFLSSETGMTKPTWVPRCCLPHCRKVRAIHNVQLYRFPKINRSTLAKWAHNLQVPLMGSAQRRVCSVHFEPHVLSKKCPVPLAVPTLDLNMPPGLKIYQNPAKLKASKLCLQRVCIVEGCRRQRVHGVQLFRFPHNTAQLRKWLHNIKQRPKGGMRSQFRICSKHFETHSFNGKRLSAGAIPTLELGHDDDDLYPNEVQSFVEEHCTVEGCDASKEQPEVRLFKFPTEDEDLLWKWCNNLKMNPVDCVGVRICNKHFDPDCIGPKHLFKWAIPTLELGHDDAEIELILNPKPEERYLDPVFKCCVPTCGKTRKFDEVQMNSFPKDPSLFERWRHNLKLEHLNFKERERYKICNSHFEDICIGKTRLNIGAIPTLELGHDETDDLYQVNPEELQSNLFGRPRRLHETNTLTKSEETISEATDLNTCQVKIKKSLTELKCCVESCGKTRLEHGVRLYAFPSTKQQQNKWRHNLLLSPEELDKNTRVCSSHFNKRCFDGKQLRSWAMPTLHLGHQQPIYENPKNVPGFFTPTCALEHCRKRRTIDNDLRTYRYPRNDDMLEKWRINLRLEPSQCRGRICADHFEPLVRGKLKLKTGAVPTLKLGHDEDIIYDNEAIKASLELDEDISLESSEHMTIQPKSVPTYEEDLDDEEQYQNSAYFDPMELVQTFAEQHNSEEEQHVGQRNGPPEVIIKREKPANNVTPICCLKHCRKERTATYHLSTFGFPKDQKVLLKWCANLHLQPSDCIGRVCIEHFDPEVLGSRKLKQNAVPTINVGHDDPLRYAHNGVELHYDEQPQHSVFRLSSLKHCRKRKYSETLDQETSSSDISQDFKQCCSVLNCSRVDVRLVRLPKSRILQRKWLHNLQLIDSVQTPKICLDHFEMHCFQNECSLKPDALPTRKLGHKEPNIYRNRVGKPKLILANRNNLVRSCLSSNCRYARAYNCQYYALPLDENLRKSWLEHLKLYVSAQLKFSVGLCSIHYLQCYEQTTIPSSLAESERQELLQNYTGIVISPTAQMLRCAVPGCFTVVTDNLRLISLPQSSDQCEKWVENTKMEYVASYHNYYRICQLHFERHCLGLRRIKNWAVPTLQLNHEDEIHKNPISNTPEALTLNSSCKTDFKICCINICRQQVDENTKLYPFPTNEIMLQKWIVNTKQLIGESSNLHICEDHFESTCLGQESLPQWAVPTLELGHNEYIIKNRYPDNEVLNYIRANYCSIISCFQQSSEKLLLYPYPKDRSIQRKWAANCGHNPTQVNDGVQVCQKHFAEDCFDDHNELYVGAVPTLKLNVEPSVLQQSDWFHAIPMKCAVQLCNIISKRHFAFPANEELRSKWTHNLGLDLVDTKDMRICQRHFESRCFREGQKLHDGSIPTLHLGNESLIGDEIIRMPTTFPQTIENGGKCCVPGCDKTQDDDLYFSSFPKMPWLAKQWLQNIRLEVPLLDSSLYKLSWKVCSRHFEANNLQGLGVPVFGAVPTLHLGHQDEDIHYPDEQLLGSRRKAPQPGATLAKHNDFNYCCYPKCCEFDGPLAQTAAYALPESKELRELWLLAMGDDVVPQKELRLCPVHYVFLYGKSRDNFPEHAAEDYQLQRNFEQAKSHNRVRMSSCAVPGCKSIRMRGADNVKLHQLPQQPNKLRKWLTNTQMKVIETQRYMFKVCDRHFEERCFLTPRRLKSWTLPTLNLPERDANVKLYKNPSPEQLYRNSSSDSESSNPRSEPTIHVEHMNWEREDAELICDVQPRPTSVNDSSSQPMEMEELEVLLEVGHVEKFESYEHFDTGPIEEPTTSYFGAPKINQQYTATRCCIRGCDVTIRDGDVKLHKFPQPKGILRKWMHNTQVVVDPKYFWRYRICSHHFERECFNGYRFRLGTVPTLHLGPNRPPKIYQNEFSVQAEPEPDIEETQLLEETYEESLEETFEEPVFEESLGELEPAYDKRSRKSTKYCQIEHCYNHLHTPNITLHKFPVSPGQCRKWIHNTQVPFEAEYRWRFRICSEHFQPFCLTSKRLLQGSVPTLNLGPNAPARLYDNSFEMKEPQLEKKMQESTIDVYDDDSFQTNNTDFDTESYMEMPEIEPELVLGSSEPTHLYDNSFQSHNMQYDGENSMDMRENSSEWEEDDEDDDMQLLVPELQLEVQDNEICFANDTARTQNGQHKLQKHVVYNEVKFGYGKCSLIHCQKQKIQHGVLLFKFPKSKLMQERWMHNLRVQYDEQRPYLICSEHFETRCIEEQNLKEWAVPTLQLGENVPEILFQNKVKKRLIKTCCLQYCGRQRDENIKLFRLPNNRSMLKKWERATGMSFNESQRNTRLICSRHFDPQLIGVRRLSKNAVPTLNLGFMQDELAPAPVAVKKVEVKKPKIKVPRYYHHQSAEKPTSPPRCCMSNCIFDSNVHLYKFPYDYDLLRQWCQGLKLNDVVSFRGKYICANHLPVKPERCAVCGRNDLQLPLLIFPGNRNVRQKWCHNLKIDNISKWDFSRTLCSKHFEEHCFSMEDGERSLLKDAVPTLHLKHTDVNIFHNDQIIVKKVKLEPFDSEILLP

Similar Transcription Factors

Sequence clustering based on sequence similarity using MMseqs2

100% Identity: iTF_00336772;
90% Identity: iTF_00338371;
80% Identity: -