Basic Information

Insect: Chymomyza fuscimana
Gene Symbol: -
Assembly: GCA_949987675.1
Location: OX465088.1:55395107-55409602[+]

Transcription Factor Domain

TF Family: THAP
Domain: THAP domain
PFAM: PF05485
TF Group: Zinc-Coordinating Group
Description: The THAP domain is a putative DNA-binding domain (DBD) and probably also binds a zinc ion. It features the conserved C2CH architecture (consensus sequence: Cys - 2-4 residues - Cys - 35-50 residues - Cys - 2 residues - His). Other universal features include the location of the domain at the N-termini of proteins, its size of about 90 residues, a C-terminal AVPTIF box and several other conserved residues. Orthologues of the human THAP domain have been identified in other vertebrates and probably worms and flies, but not in other eukaryotes or any prokaryotes [1].
Hmmscan Out: # of c-Evalue i-Evalue score bias hmm coord from hmm coord to ali coord from ali coord to env coord from env coord to acc

1 28 1.5e-15 2.5e-12 47.9 5.3 1 86 583 655 583 656 0.85

2 28 4.4e-15 7.2e-12 46.4 4.8 1 87 683 752 683 752 0.83

3 28 2.1e-15 3.5e-12 47.5 0.2 1 87 774 846 774 846 0.85

4 28 1.5e-16 2.4e-13 51.2 4.6 1 86 926 995 926 996 0.80

5 28 1.7e-14 2.7e-11 44.6 4.5 1 86 1020 1091 1020 1092 0.81

6 28 2e-13 3.3e-10 41.1 0.7 1 87 1127 1195 1127 1195 0.80

7 28 1.9e-10 3.1e-07 31.6 1.4 1 86 1236 1305 1236 1306 0.75

8 28 9.8e-18 1.6e-14 54.9 0.5 1 86 1333 1402 1333 1403 0.82

9 28 8.3e-13 1.4e-09 39.1 1.5 1 86 1424 1493 1424 1494 0.81

10 28 3.1e-15 5.1e-12 46.9 1.6 1 86 1521 1592 1521 1593 0.85

11 28 2.2e-14 3.7e-11 44.2 4.2 1 87 1656 1726 1656 1726 0.83

12 28 2.9e-12 4.8e-09 37.4 0.1 1 86 1748 1816 1748 1817 0.81

13 28 1.2e-13 2e-10 41.8 2.2 1 87 1922 1991 1922 1991 0.81

14 28 5.9e-10 9.6e-07 30.0 1.3 1 85 2052 2115 2052 2117 0.82

15 28 0.00013 0.21 12.9 0.9 1 58 2147 2198 2147 2218 0.78

16 28 2.7e-13 4.5e-10 40.7 0.6 1 86 2237 2306 2237 2307 0.83

17 28 2.3e-12 3.8e-09 37.7 0.6 1 86 2339 2406 2339 2407 0.78

18 28 5.9e-12 9.7e-09 36.4 0.7 1 86 2433 2502 2433 2503 0.80

19 28 2.9e-12 4.8e-09 37.4 1.3 1 87 2524 2590 2524 2590 0.77

20 28 1.9e-13 3.2e-10 41.2 0.0 1 87 2618 2693 2618 2693 0.78

21 28 0.0008 1.3 10.3 0.1 1 58 2731 2782 2731 2807 0.73

22 28 1.2e-14 2e-11 45.0 1.4 1 87 2821 2895 2821 2895 0.82

23 28 1.7e-13 2.8e-10 41.4 1.3 1 87 3016 3087 3016 3087 0.78

24 28 2e-12 3.4e-09 37.9 5.2 1 87 3159 3230 3159 3230 0.80

25 28 5.5e-14 9.1e-11 42.9 1.7 1 86 3384 3452 3384 3453 0.79

26 28 2.3e-13 3.8e-10 40.9 0.1 6 87 3459 3524 3456 3524 0.82

27 28 8.5e-08 0.00014 23.1 0.2 1 58 3552 3600 3552 3607 0.89

28 28 1.2e-12 1.9e-09 38.7 0.9 18 87 3617 3678 3607 3678 0.81

#	of	c-Evalue	i-Evalue	score	bias	hmm coord from	hmm coord to	ali coord from	ali coord to	env coord from	env coord to	acc
1	28	1.5e-15	2.5e-12	47.9	5.3	1	86	583	655	583	656	0.85
2	28	4.4e-15	7.2e-12	46.4	4.8	1	87	683	752	683	752	0.83
3	28	2.1e-15	3.5e-12	47.5	0.2	1	87	774	846	774	846	0.85
4	28	1.5e-16	2.4e-13	51.2	4.6	1	86	926	995	926	996	0.80
5	28	1.7e-14	2.7e-11	44.6	4.5	1	86	1020	1091	1020	1092	0.81
6	28	2e-13	3.3e-10	41.1	0.7	1	87	1127	1195	1127	1195	0.80
7	28	1.9e-10	3.1e-07	31.6	1.4	1	86	1236	1305	1236	1306	0.75
8	28	9.8e-18	1.6e-14	54.9	0.5	1	86	1333	1402	1333	1403	0.82
9	28	8.3e-13	1.4e-09	39.1	1.5	1	86	1424	1493	1424	1494	0.81
10	28	3.1e-15	5.1e-12	46.9	1.6	1	86	1521	1592	1521	1593	0.85
11	28	2.2e-14	3.7e-11	44.2	4.2	1	87	1656	1726	1656	1726	0.83
12	28	2.9e-12	4.8e-09	37.4	0.1	1	86	1748	1816	1748	1817	0.81
13	28	1.2e-13	2e-10	41.8	2.2	1	87	1922	1991	1922	1991	0.81
14	28	5.9e-10	9.6e-07	30.0	1.3	1	85	2052	2115	2052	2117	0.82
15	28	0.00013	0.21	12.9	0.9	1	58	2147	2198	2147	2218	0.78
16	28	2.7e-13	4.5e-10	40.7	0.6	1	86	2237	2306	2237	2307	0.83
17	28	2.3e-12	3.8e-09	37.7	0.6	1	86	2339	2406	2339	2407	0.78
18	28	5.9e-12	9.7e-09	36.4	0.7	1	86	2433	2502	2433	2503	0.80
19	28	2.9e-12	4.8e-09	37.4	1.3	1	87	2524	2590	2524	2590	0.77
20	28	1.9e-13	3.2e-10	41.2	0.0	1	87	2618	2693	2618	2693	0.78
21	28	0.0008	1.3	10.3	0.1	1	58	2731	2782	2731	2807	0.73
22	28	1.2e-14	2e-11	45.0	1.4	1	87	2821	2895	2821	2895	0.82
23	28	1.7e-13	2.8e-10	41.4	1.3	1	87	3016	3087	3016	3087	0.78
24	28	2e-12	3.4e-09	37.9	5.2	1	87	3159	3230	3159	3230	0.80
25	28	5.5e-14	9.1e-11	42.9	1.7	1	86	3384	3452	3384	3453	0.79
26	28	2.3e-13	3.8e-10	40.9	0.1	6	87	3459	3524	3456	3524	0.82
27	28	8.5e-08	0.00014	23.1	0.2	1	58	3552	3600	3552	3607	0.89
28	28	1.2e-12	1.9e-09	38.7	0.9	18	87	3617	3678	3607	3678	0.81

Sequence Information

Coding Sequence: ATGTCACAACAACACCACCCGCACAATCActatcatcaacaacaacaacaagcacaacaacaacaacaccatcaTCAACATCTTGCGCATCAGCAAAATCAACACAAACTACAACATAAACAAATACAGCACAGTTGGTACTCACATGTTGCTTCCTACCCACCGCACGGAACAGCCTTTTCGGCATCCCCGACCTGTAAGAGTAATGTTAATATGAATGCATATGGAGCAGCGTCTAATACGCATGCATACTACGGTGGCAATAATATTGGGGGCAGTGGCATCCCTGGCGGGGTGGGTAGCATGGGCGGCGTCAATGTCAATCCTGACGGGCATAACATGGCCTATAACCCTGACGCCCCGCCTGTAAATACTGTTGCATATGCCCATAATCAATTGCTGCAgtatcaacaacagcaacagcagcaccttcttctgcaacaacaacaacatcagcagcaggTGCAACAGCATAGCCAGCGTGCTTATATGCAGCATGGTCTTATGCCAGGACCATCTTATCCTCCTTACATTAAAAGCGAGCCCATGGAACTACCCAGCGAAAGACTAAGGCATCAGCAGCATTTTCAACCGCCCATACCGATGGCACCGCCGCCAGCGCGCGCCACTCGCTTGGATGCCAGCGGCTGCGGCGTCGGAAATGATATgataataaaatcGGAACCAATGGATGAACATGCTTTTAAATCAAGTTATATCGATGATAACACGCCATTTGCAGATTTTAGCAAATATCCGGAGTTCAATCAGGACATGTTGAACCCCAAAGTAGAGCTAACCGTTAAAGACGATGTTTTTAGCAATTCAAGCCAAAAGCACGCACTAAATTTTCCACGCCGTAAAATGGAAACAGAACGCTCGGAAAGCCTTCCACCCATTTGCCAACGCTGCAAGGaagttttcttcaaaaaacaaatctatCTGCGTCACGTAGCTGAGAGTAGCTGCATCATAAACGAATACGATTTCAAGTGTGGCATTTGTCCAATGTCCTTTATGAGCGGtgaagaattaaaaaaacacaagCAACTACATAGATTCAACAAATTCTTTTGTCACAAGTACTGTGGAAAGAATTTTGACACTATTGAGGAGTGCGAATCGCATGAGTATATGCAGCATGAGTACGAGACTTTTGTGTGTAATATGTGCTCGGGTAACTTTCCAACGCGTGATCAGCTGTACGCACATTTGCCTCAGCATAAATTTCAGTCTCGCTACGATTGTCCTGTATGCCGTTTGTGGTATCAAACACCTCTGGAACTGCACGAACATCGAATGGCTGCACCTTATTTTTGTGGCAAGTACTATACCAGCGTTGGCACAAATCACACTGTGGCACAGTCAAATCTTCCTGCTCAGCAccctcaacaacaacagcaccaaCAATCAAACTACAAACTACAGGATTGCCATATGGGCACCATTGAaaTGCCGTCGCCACATCACAAATCCTCCACAGCGGCGGCTAGTACGCTCCCGGCAACGGCTGCACTTAGTTCCTTGCTACAACAACGTCAAGCCAATGCGGACAGTACAGCTCTGTTTGGACCGCTTAAAACTGATGTTAAGTTAGAGCGCAGCTATAGTAATTCGACAAGCGAGTCATCCTATAATAGCATGCAGGATGGCAATTATAATAATGCTTTTGGCAGCGATGCATCGCTGCTAGGTGGCGGTCAGTCAGCACACTCGTCCACTCTTGATGACTCGGATGATGCTCTGTGTTGCGTGCCAAAGTGCGGAGTGCGTAAAAGCACTAGTCATACACTGCAATTCTTTACTTTCCCGAAGGATGAAAAGTATTTGCATCAGTGGTTGCACAATCTCAAGATGTTTCACATTCCGGCCACAACATATATGAGCTACCGTATTTGTAGCATGCATTTTCCCAAACGCTGCATTAATCGCTATTCACTATGTTACTGGGCCGTGCCCACGTTTAATCTGGGCCATGACGATGTAGCCAACTTGTATCAGAATCGCGAGCTCACCAATACCTTTACAGCTGGCGAGGTGGCACGCTGCAGCATGCCCAACTGCAATAGCCAAAGGGGTgaaagcaatttaaaattttataattttcccaAGGATATCAAGAGTCTGATCAAATGGTGTCAGAATGCTCGATTGCCTGTGCAAGCAAAGGAGCCGCGCCACTTTTGCAGCCGTCACTTTGAAGAGCGGTGCATTGGAAAATTTCGACTGAAACCATGGGCGGTGCCCACTCTTCATTTGGGAACACAATACGGCAAAATCCATGATAATCCCAAGAATCTTTATGTGGAGGAGAAGCGCTGCTGTTTGGCCTTCTGTCGACGCAGTCGTTCATCAGATTTTAATATGTCTTTGTATCGGTTTCCCCGAGATGAAGTGCTTTTAAGACGGTGGTGCTATAATTTGCGTTTGGATCCAGGTGTCTATCGCGGCAAGAACCACAAAATTTGCAGCGCACATTTTATTAAGGAGGCTCTTGGTTTACGAAAACTTTCGCCGGGTGCTGTGCCAACTTTGCATTTGGGACACAACGACAACTTTAATATTTACGAGAACGAATTGTGGCCCCCACCAACACCAACTGGGACACCTAATTCTCACAATCAACATCCTCGGAGCTATCAACGCCACTCTGTGGCTTCCACTTCATCGTCAACTAGCTCTTCATCGCTGTATATCGAACAGGAAATGAATGCATCCTATCATGGCATGTCAACTTCTTCATCCTCACTCAACGTGACCGAATGCATGGATGTCTGCTGTGTGCCCGGTTGCGAAAGTAAACGTCACAATAATGAAAACATCACTTTCCATACAATACCACGCCGCCCGGAACAGATGAGCAAGTGGTGTCATAATCTAAAAATACCCGAAGAGAAAATGCACAAGGGCATGCGCATTTGCAGTCGTCACTTCGAATCCTACTGCATTGGCGGCTGTATGCGTCCCTTTGCCGTGCCCACACTTTATCTGGGCCACGATGACGAGGATATATACCGAAATCCTGATAAGattaaaaagcttaacataCGTGAGACATGCTGTGTTCAGGTTTGCAAAAGGAATCGAGATCGCGATCATGCCAATCTGCATCGCTTTCCTTCAAATCCAACGCTGCTTGCCAAGTGGTGCGCCAATCTACATAAACCTGTACCAGATGGCAGCAAATTGTTTAATGATGCCATTTGTGAGGTGCACTTTGAGGATCGTTGTCTGCGCAACAAACGACTTGAAAAGTGGGCAGTACCTACGCTTGTTTTGGGCCATGATATCGTCCCACATATGCTGCCTAGTGAGGCAGAAGTTGCCGAGTTCTACGCACGTCCTAGTGCGCCAAACAATGGTGAAGAGGAGGGCGAATGTTGTGTGGAGACTTGCAAACGTGATCCCAGTGTTGACGATATTAAGTTATATCGTTCGCCTGAAGATCAAGAAGTGCTCGCTAAATGGGCGCACAATCTGCAGCTGGATGTTGAGCAGCTGCCCAGTCTGAGAATATGTAATCTACACTTTGAATCGCATTGCATTGGCAAGCGCATGCGCCCTTGGGCCATACCCACGCTTAATCTAGCCAACAACATTGAGAATCTCTATGAAAATCCCGAAAATAATATGCTTTATGTGCGAAAACAGCGCCGTTTTCTTTCCTCGGAAACGGGCATGACAAAGCCCACTTGGGTGCCGCGCTGCTGCTTGCCACACTGCCGCAAAGTACGTGCCATACACAATATTCAACTCTATCGTTTCCCCAAAATCAACCGTGCCACGCTGGCTAAGTGGGCGCACAATCTGCAAGTGCCGTTAATGGGTAGCGCTCAGCGTCGTGTGTGCTCCGTTCATTTTGAGCCGCATGTTTTGAGTAAGAAATGTCCCGTTCCATTGGCCGTGCCCACACTTGATTTGAACATGCCTCCTGGCCTTAAAATCTATCAAAATCCTGCCAAGCTTAAGGCCAGCAAGCTATGCTTACAGCGAGTTTGCATTGTGGAAGGCTGTCGTCGGCAACGTGCACATGGCGTGCAACTATTCCGATTTCCACACAATACGGCACAGTTACGTAAATGGTTGCACAATATTAAGCAGCGACCCAAAGGCGGCATGCGCAATCAATTTCGCATCTGTTCTAAACATTTTGAGACGCATTCGTTTAATGGCAAACGACTGAGCGCAGGCGCAATACCCACGCTTGAACTGGGACACGACGATGACGATCTATATCCAAATGAGGTGCAGTCATTTGTAGAAGAGCACTGCGCCGTGGAGGGTTGTGATGCCTCAAAAGAGCAGCCCGAAGTAAGGCTTTTCAAATTTCCCACGGATGATGAGGATTTGCTATGGAAATGGTGcaacaatttgaaaatgaatCCCGTTGATTGTGTTGGCGTACGTATATGTAATAAGCACTTCGATCCGGACTGTATTGGGCCTAAGCATCTTTTTAAATGGGCCATACCGACCTTGGAATTGGGACACGATGATGCACAAATTGAGTTGATTCTAAATCCAAAGCCAGAAGAGCGCTATTTGGATCCCATATTTAAATGCTGTGTGCCCACCTGCGGTAAAACACGCAAATTTGATGAGGTGCAAATGAACAGCTTTCCCAAAGATCCCACCCTTTTCGAGCGCTGGCGCCATAATCTCAAGCTGGATCATTTGAACTTTAAGGAGCGAGAACGGTATAAAATCTGCAATTCCCATTTTGAAGATATTTGCATCGGCAAAACAAGACTTAATATAGGCGCCATACCAACGCTAGAGCTGGGCCATGACGAGACTGATGATCTCTATCAAGTAAATCCTGAGGAGCTGCAAAGCAATTTATTTGGGCGCCCGCGTCGCTTACACGAAACAAACACGTTGCCCAAGAGTGAAGATACCATATCAGAGGCTACTGATTTGAATACTAGCCaagttaagattaaaaaaagtttgaccGACCTCAAATGTTGTGTAGAGAGCTGCGGAAAAACTCGTTTGGAGCATGGAGTACGTCTCTATGCCTTTCCCTCTACCAAACAACAGCAGAATAAATGGCGCCATAATCTGCACCTCAGTCCAGAGGAGTTGGATAAAAATACGCGCGTTTGCAGCTCGCATTTTAATAAACGTTGCTTCGACGGGAAACAGCTGCGTAGTTGGGCTATGCCCACGCTGCATTTAGGTCACCAGCAGCCCATCTATGAGAATCCAAAGAATGTACCAGGCTTTTTTACACCTACCTGCGCCTTAGAGCATTGTCGAAAGCGGCGCACTATTGATAATGATTTGCGTACCTATCGTTATCCCAGAAACGAGGAGCTGCTAGAGAAATGGCGAATCAATTTAAGATTGGAGCCTTCGCAATGTCGTGGCCGAATTTGTGCTGATCACTTTGAACCGTTGGTGAGAGGCAAGCTAAAGCTTAAGACGGGTGCTGTGCCCACGCTCAAGTTAGGTCATGATGAAGATATCATCTATGACAACGAGGCCATTAAAGCAAGCTTGGAACTGGATGAGGATATAAGCCTAGAGTCCAGTGAGCATATGACTATTCATCCGAAGAGTGTGCCCACGTACGAGGAAGACCTTGATGATGAAGAGCAGTATCAGAATTCAGCTTACTTCGATCCAATAGAACTGGTGCAAACCTTTGCAGAACAGCACAACAGTGAAGAGGAGCAGCACGTTGCATCTGGACCACGAAACCTGCCACCCGAAGTTACAATTAAGCGCGAAAAACCTGCCAATAATGTTACGCCAATTTGTTGCCTAAAGCATTGCCGTAAGGAAAGAACTGCTACTTATCATTTGAGTACATTTGGTTTTCCCAAGGATCAAAAAGTACTTCTTAAATGGTGCGCCAATTTGCATTTGCAGCCATCTGACTGTATTGGACGCGTATGCATTGAACACTTTGATCCCGAGGTGCTAGGCAGTCGTAAGCTAAAGCAAAATGCCGTGCCCACCATTAATGTGGGTCACGATGATCCGCTGCCTTATGCACATAACGGCGTAGAACTACATTATGATGAACAACCTCAGCATTCGGTTTTTCGGCTTTCCAGCCTGAAACACTGTCGCAAACGGAAGGACTCCGAACCACTAGATCAAGAAACTAGCTCTAGTGACTTCAGCCAAGACTTTAAACAGTGCTGTTCAGTATTAAATTGCAGCCGCGTTGATGTGCGTCTTGTGCGTTTGCCCAAGTCACGCATACTGCAACGGAAATGGCTGCACAATTTGCAGCTAATAGATTCCGTACAGACACCTAAAATTTGCTTAGATCACTTTGAGATGCATTGCTTACAAAATGAATGCTCTCTCAAACCTGACGCTCTGCCCACCAGAAAACTGGGGCACAAGGAACCGAACATCTACCGAAACAGAGTTGGAAAGCCAAAGTTAGTACTGGCCAATAGGAATAATCTCGTGAGAAGCTGCTTGTTTTCCAACTGTCGGTATGCACGTGCATACAATTGTCAACATTATGCGCTGCCGTTGGACGAAACTCTTCGTAAATGTTGGCTGGAACACTTAAAACTAAATGTATCTCCACAAATAAAAATCAGTGTTGGTCTTTGTTCTATACACTACTTGCAGTGCTATGAGCAGACAACAATTCCCAGTAGTTTATCAGAGTTTGAACGACAAGAGTTATGGCAAAATTATACTGGTATTGTAAATTCGCCGACGGCTCAAATGATGCGCTGCGCTGTACCAGGCTGTTTTACCGTGGTTACGGACAATTTACGGCTTATCAGCCTGCCACAGTCTAGCGATCAGTGTGAGAGATGGGTAGAAAATACCAAAATGGAATATGTTGCTTCCAGTCACAACTACTACCGCATTTGTCAACTACACTTTGAGCGGCATTGCTTGGGGCTACGGCGTATCAAGAATTGGGCAGTCCCCACACTGCAGCTTAATCATGAAGATGAAATCCATGAAAATCCAATATCAAACACAGCTGAAGATTTAACATTAAACAGCTCTTATAAGACTGATTTCAAAATTTGCTGCATTAACATTTGTAGACAGCAAGTCGATGAAAACACCAAACTTTATCCGTTTCCTACTAATGAAATAATGCTACAGAAGTGGATAGTAAATACAAAACAGCTTATTGGAGAGTCTTCAAAACTGCATATATGTGAAGATCACTTTGAATCTACATGTTTAGGCCAGGAAAGTCTGCCTCAATGGGCCGTGCCCACGCTGGAGCTTGGCCACAATGAATATACCGTTAAGAATAGGTATCCAGATAATGAAGTGCTTAATTACATTAGGGCCAGCTACTGTTCGATAACGAGCTGTTTCCAGCAAAGCAGTGACCAGTTGCGCCTTTATCCATATCCAAAAGATCGTAGCATTCAACGCAAATGGGCCGCAAACTGCGGCCACAGTTCTGCTCAAGTTAATAACGGTCTTCAAGTATGCCATAAGCATTTTGCAGAAGATTGCTTTGATGATCACAACGAGCTTTATGTGGGCGCTGTTCCAACCTTAGAGTTAAACGTGGACCCATCTGTGCTGCAACAAAGCGATTGGTTTCATGCGATACCAATGAAATGCGCTGTACAACAGTGCAATAGTATAGCTAAGCGGCACTTTCCTTTTCCGGCAAACGAGGAGTTGCGGAGCAAGTGGACTCACAATTTGGAGCTGGATTTGGTCGATACTAAAGATATGCGCATATGCCAGCGGCATTTTGAATCCCGGTGCTTCCTTGAAGGACAAAAGCTACATGACGGCTCAATACCCACACTTCATCTGGGCAATGAGTCGCTTATAGGAGATGAGATAATAAGAATGCCAACAACTTTTCCACAAACTATAGAGAATGGAGGCAAATGCTGTGTGCCTGGCTGCGGACAAACTCAGGACGATGACTTGTACTTTAGCAGCTTTCCTAAAATGCCTTGGTTGGCTAAACAATGGCTTCAGAATATTCGTCTGGAAGTGCCCCTACTTGACTCATCACTGTACAAACTTTCATGGAAAGTATGCAGCAGACATTTTGAGACTAACAACCTTCAAGGCCATGGTGTACCGGTTTTTGGAGCTGTGCCCACATTGCACTTAGGCCATCAAGATGAAGACATACACTATCCCGATGAGCAGCTATTGGGAAGTCGCCGAAAGGGGCCACAACCAGGAGCGACGTTAGCTAAACACAATGACTTTAATTACTGCTGCTATCCAAAGTGTTGTGAGTTTGATGGACCACTTGCTCAAAATGCTGCATATGCATTACCCGAATCAAAGGAGCTACGTGAATTATGGCTGCTGGCCATGGGCGATGATGTAGTTCCGCAAAAGGAACTAAGGCTGTGCCCAGTGCACTACGTCTTCCTATATGGACAAAGCCGCGATAACTTTCCTGAACATGCGGGCGAAGAATACCATTTGCGGCAAAACTTTGAGCAAGCAAAAAGTCATAACAGAGTGCGTATGAGCAGCTGCGCAGTACCAGGCTGCAAGAGTATAAGAATGCGTGGTGCGGATAATGTTAAGCTGCATCAGCTGCCGCAACAGCCTAATAAGTTGCGAAAGTGGCTTAGGAATACTCAAATGAAGGTTATTGAGCAACAGCGCTACATGTTTAAGGTGTGTGATAGACATTTCGAAGAACGCTGTTTCTTAACGCCAAGACGCCTAAAGTCTTGGACATTACCGACGCTGAACCTGCCGGATAGAGATGCCAATGTCAAGCTGTACCAAAATCCCAGCCCGGAACAATTATATAGGAATTGTAGCAGTGATAGCGAATCTAGTAATCCTAGGTCCGAACCCACAATGCACGTAGAGCATATGAGTTGGGAACGCGAAGACACAGAACTTATATGTGATGTTCAACCAAGACCTACGTCTGTAAATGACAGCAGCTCTCAACCCATGGAAATGGAAGAACTAGAAGTCTTGCTGGAAGTTGGTCATGTAGAGAAATTTGAAAGCTATGAACACTTCGACATTGGACCAATTGAGGAGCCCACGACTAGTTATTTTGGTGCCCCCAAAATAAATCAGCAATTTACTGCGACCCGATGCTGCATACGAGGCTGCGATGTTACCATACGCGATGGTGATGTAAAGCTACACAAGTTTCCGCAACCAAAGGGAATATTACGAAAATGGATGCATAATACTCAGGTGGTGGTGGACCCTAAGTACTTCTGGCGCTATCGGATATGCAGCCATCATTTTGAACGCGAGTGTTTTAACGGTTATCGTTTTCGATTGGGAACCGTTCCCACGCTGCATCTTGGCCCTAATAGACCGCcgaaaatatatcaaaatgaaTTTTCAGTTCAAGCAGAACCAGAGCAGGATATAGAGGAAACACAGCTATTAGAAGAGCCATTCGAAGAGTCATTAGAAGAGACGTTCGAAGAGCCGGTAGAAGAGGTGTTTGAAGAATCGTTAGGGGAATTAGAGCCAGTCTACGACAAAAGGTCACGAAAATCAACGAAATATTGTCAAATAGAACACTGCTACAATCATCTGCATACGCCAAACGTAACTTTACATAAGTTTCCAGTCTCTCCTGGTCAGTGCCGCAAGTGGATACATAATACTCAGGTGCCTTTTGAGGCAGAGTATCGTTGGCGTTTTCGCATATGCAGCGAACATTTTCATCCTTTCTGCTTAACGACTAAGCGTCTACTTCAAGGTAGCGTGCCCACATTAAACCTTGGACCCAATGCGCCGGCGCGACTGTATGATAATAGTTTTGAAATGAAGGAGCCGCAGTATGAGACGAAAATGCAAGAAACGAGAATGGATGTATATGATGATGACAGTTTTCAGACTAATAACACTGAATTTGATACGGAAAGTTTTATGGAAATGCCTGAAATCGAACCGGAACTTGTGTTGGGATCCAGTGAGCCGACTCATCTATATGATAATAGTTTCCAGTCCATTGATATGCAGTACGATGGAGAGAATTCTATAGATATGCGGGAAAATTCATCAGAATGGGAGGAAGATGATGAAGACGATGACATGCAGCTTCTAGTACCTGAGCTGCAACTGGAAGTGCAGGATAACGAAATTTGCTTTGCCACTGACACAGCACGCATTCAAAATGGGCAACACAAACTGCAGAAGCACGTTGTATGCAACGAGGTCAAGTTTGGCTATGGAAAATGCTCTCTAATTCACTGTCAAAAACAGAAGATCCAACATGGCGTGCTTTTATTTAAGTTTCCCAAGTCTAAGCTAATGCAAGAACGATGGATGCACAATCTGCGCATACAATATGATGAGCAGCGTCCCTATTTAATATGCAGCGAGCACTTTGAGTCACGATGCATGGAGGAACAGAACCTTAAAGAATGGGCCGTACCAACGCTGCAGCTTGGTGAGAATTACTGCGGAAGGCAACGGGACGAAAACATTAAACTCTTCCGACTACCCAACAATCGCAGCATGCTTAAAAAGTGGGAGAGGGCCACAGGCATGACCTTTAATGAATCTCAGCGAAACACAAGGCTAATTTGTAGTCGCCATTTTGATCCGCAGCTGATTGGCGTACGACGTTTATCCAAAAACGCAGTTCCCACATTAAACTTGGGCTTTATGCAAGATGCACCCGCACCAGTTGCGGTTCAAAAAGTTGAAGTTAAAAAACCTAAAATCAAAGTACCTAGATGCTGCATGTCTAATTGCATGTCCGACTCTAATGTGCACCTATACAAGTTTCCTTATGACTACGATCTGCTGCGTCAATGGTGCCAAGGCCTTAAGTTAAATGATGTGGTCAGCTTTCGTGGAAAATACATATGTGCCAACCATCTGCCCGTCAAGCCGGAAAGGTGTGCCGTTTGCGGAACAATCGATTTGCAACTACCCCTGGTCATCTTTCCCGGCAATCGAAATGTGCGTCAGAAATGGTGTCACAACTTGAAAATCGATAACATTTCCAAGTGGGACTTTTCGCGTCACCTTTGCTCTAAACATTTTGAAGAACACTGCTTTTCAACGGCGGATGGGGAGAGAAGTCTGCTTAAGGATGCCGTGCCCACCTTGCATTTAAAGCACATGGATGTAAACATATTCCATAACGATCAAATAATtgtgaaaaaagtgaaaatggaACCGTTTGACAGCGAAATCCTGCTGCCATAG
Protein Sequence: MSQQHHPHNHYHQQQQQAQQQQHHHQHLAHQQNQHKLQHKQIQHSWYSHVASYPPHGTAFSASPTCKSNVNMNAYGAASNTHAYYGGNNIGGSGIPGGVGSMGGVNVNPDGHNMAYNPDAPPVNTVAYAHNQLLQYQQQQQQHLLLQQQQHQQQVQQHSQRAYMQHGLMPGPSYPPYIKSEPMELPSERLRHQQHFQPPIPMAPPPARATRLDASGCGVGNDMIIKSEPMDEHAFKSSYIDDNTPFADFSKYPEFNQDMLNPKVELTVKDDVFSNSSQKHALNFPRRKMETERSESLPPICQRCKEVFFKKQIYLRHVAESSCIINEYDFKCGICPMSFMSGEELKKHKQLHRFNKFFCHKYCGKNFDTIEECESHEYMQHEYETFVCNMCSGNFPTRDQLYAHLPQHKFQSRYDCPVCRLWYQTPLELHEHRMAAPYFCGKYYTSVGTNHTVAQSNLPAQHPQQQQHQQSNYKLQDCHMGTIEMPSPHHKSSTAAASTLPATAALSSLLQQRQANADSTALFGPLKTDVKLERSYSNSTSESSYNSMQDGNYNNAFGSDASLLGGGQSAHSSTLDDSDDALCCVPKCGVRKSTSHTLQFFTFPKDEKYLHQWLHNLKMFHIPATTYMSYRICSMHFPKRCINRYSLCYWAVPTFNLGHDDVANLYQNRELTNTFTAGEVARCSMPNCNSQRGESNLKFYNFPKDIKSLIKWCQNARLPVQAKEPRHFCSRHFEERCIGKFRLKPWAVPTLHLGTQYGKIHDNPKNLYVEEKRCCLAFCRRSRSSDFNMSLYRFPRDEVLLRRWCYNLRLDPGVYRGKNHKICSAHFIKEALGLRKLSPGAVPTLHLGHNDNFNIYENELWPPPTPTGTPNSHNQHPRSYQRHSVASTSSSTSSSSLYIEQEMNASYHGMSTSSSSLNVTECMDVCCVPGCESKRHNNENITFHTIPRRPEQMSKWCHNLKIPEEKMHKGMRICSRHFESYCIGGCMRPFAVPTLYLGHDDEDIYRNPDKIKKLNIRETCCVQVCKRNRDRDHANLHRFPSNPTLLAKWCANLHKPVPDGSKLFNDAICEVHFEDRCLRNKRLEKWAVPTLVLGHDIVPHMLPSEAEVAEFYARPSAPNNGEEEGECCVETCKRDPSVDDIKLYRSPEDQEVLAKWAHNLQLDVEQLPSLRICNLHFESHCIGKRMRPWAIPTLNLANNIENLYENPENNMLYVRKQRRFLSSETGMTKPTWVPRCCLPHCRKVRAIHNIQLYRFPKINRATLAKWAHNLQVPLMGSAQRRVCSVHFEPHVLSKKCPVPLAVPTLDLNMPPGLKIYQNPAKLKASKLCLQRVCIVEGCRRQRAHGVQLFRFPHNTAQLRKWLHNIKQRPKGGMRNQFRICSKHFETHSFNGKRLSAGAIPTLELGHDDDDLYPNEVQSFVEEHCAVEGCDASKEQPEVRLFKFPTDDEDLLWKWCNNLKMNPVDCVGVRICNKHFDPDCIGPKHLFKWAIPTLELGHDDAQIELILNPKPEERYLDPIFKCCVPTCGKTRKFDEVQMNSFPKDPTLFERWRHNLKLDHLNFKERERYKICNSHFEDICIGKTRLNIGAIPTLELGHDETDDLYQVNPEELQSNLFGRPRRLHETNTLPKSEDTISEATDLNTSQVKIKKSLTDLKCCVESCGKTRLEHGVRLYAFPSTKQQQNKWRHNLHLSPEELDKNTRVCSSHFNKRCFDGKQLRSWAMPTLHLGHQQPIYENPKNVPGFFTPTCALEHCRKRRTIDNDLRTYRYPRNEELLEKWRINLRLEPSQCRGRICADHFEPLVRGKLKLKTGAVPTLKLGHDEDIIYDNEAIKASLELDEDISLESSEHMTIHPKSVPTYEEDLDDEEQYQNSAYFDPIELVQTFAEQHNSEEEQHVASGPRNLPPEVTIKREKPANNVTPICCLKHCRKERTATYHLSTFGFPKDQKVLLKWCANLHLQPSDCIGRVCIEHFDPEVLGSRKLKQNAVPTINVGHDDPLPYAHNGVELHYDEQPQHSVFRLSSLKHCRKRKDSEPLDQETSSSDFSQDFKQCCSVLNCSRVDVRLVRLPKSRILQRKWLHNLQLIDSVQTPKICLDHFEMHCLQNECSLKPDALPTRKLGHKEPNIYRNRVGKPKLVLANRNNLVRSCLFSNCRYARAYNCQHYALPLDETLRKCWLEHLKLNVSPQIKISVGLCSIHYLQCYEQTTIPSSLSEFERQELWQNYTGIVNSPTAQMMRCAVPGCFTVVTDNLRLISLPQSSDQCERWVENTKMEYVASSHNYYRICQLHFERHCLGLRRIKNWAVPTLQLNHEDEIHENPISNTAEDLTLNSSYKTDFKICCINICRQQVDENTKLYPFPTNEIMLQKWIVNTKQLIGESSKLHICEDHFESTCLGQESLPQWAVPTLELGHNEYTVKNRYPDNEVLNYIRASYCSITSCFQQSSDQLRLYPYPKDRSIQRKWAANCGHSSAQVNNGLQVCHKHFAEDCFDDHNELYVGAVPTLELNVDPSVLQQSDWFHAIPMKCAVQQCNSIAKRHFPFPANEELRSKWTHNLELDLVDTKDMRICQRHFESRCFLEGQKLHDGSIPTLHLGNESLIGDEIIRMPTTFPQTIENGGKCCVPGCGQTQDDDLYFSSFPKMPWLAKQWLQNIRLEVPLLDSSLYKLSWKVCSRHFETNNLQGHGVPVFGAVPTLHLGHQDEDIHYPDEQLLGSRRKGPQPGATLAKHNDFNYCCYPKCCEFDGPLAQNAAYALPESKELRELWLLAMGDDVVPQKELRLCPVHYVFLYGQSRDNFPEHAGEEYHLRQNFEQAKSHNRVRMSSCAVPGCKSIRMRGADNVKLHQLPQQPNKLRKWLRNTQMKVIEQQRYMFKVCDRHFEERCFLTPRRLKSWTLPTLNLPDRDANVKLYQNPSPEQLYRNCSSDSESSNPRSEPTMHVEHMSWEREDTELICDVQPRPTSVNDSSSQPMEMEELEVLLEVGHVEKFESYEHFDIGPIEEPTTSYFGAPKINQQFTATRCCIRGCDVTIRDGDVKLHKFPQPKGILRKWMHNTQVVVDPKYFWRYRICSHHFERECFNGYRFRLGTVPTLHLGPNRPPKIYQNEFSVQAEPEQDIEETQLLEEPFEESLEETFEEPVEEVFEESLGELEPVYDKRSRKSTKYCQIEHCYNHLHTPNVTLHKFPVSPGQCRKWIHNTQVPFEAEYRWRFRICSEHFHPFCLTTKRLLQGSVPTLNLGPNAPARLYDNSFEMKEPQYETKMQETRMDVYDDDSFQTNNTEFDTESFMEMPEIEPELVLGSSEPTHLYDNSFQSIDMQYDGENSIDMRENSSEWEEDDEDDDMQLLVPELQLEVQDNEICFATDTARIQNGQHKLQKHVVCNEVKFGYGKCSLIHCQKQKIQHGVLLFKFPKSKLMQERWMHNLRIQYDEQRPYLICSEHFESRCMEEQNLKEWAVPTLQLGENYCGRQRDENIKLFRLPNNRSMLKKWERATGMTFNESQRNTRLICSRHFDPQLIGVRRLSKNAVPTLNLGFMQDAPAPVAVQKVEVKKPKIKVPRCCMSNCMSDSNVHLYKFPYDYDLLRQWCQGLKLNDVVSFRGKYICANHLPVKPERCAVCGTIDLQLPLVIFPGNRNVRQKWCHNLKIDNISKWDFSRHLCSKHFEEHCFSTADGERSLLKDAVPTLHLKHMDVNIFHNDQIIVKKVKMEPFDSEILLP

Similar Transcription Factors

Sequence clustering based on sequence similarity using MMseqs2

100% Identity: iTF_00336772;
90% Identity: iTF_00335931;
80% Identity: -