Basic Information

Insect: Chymomyza procnemis
Gene Symbol: -
Assembly: GCA_035046065.1
Location: JAWNOJ010000024.1:7598109-7612406[-]

Transcription Factor Domain

TF Family: THAP
Domain: THAP domain
PFAM: PF05485
TF Group: Zinc-Coordinating Group
Description: The THAP domain is a putative DNA-binding domain (DBD) and probably also binds a zinc ion. It features the conserved C2CH architecture (consensus sequence: Cys - 2-4 residues - Cys - 35-50 residues - Cys - 2 residues - His). Other universal features include the location of the domain at the N-termini of proteins, its size of about 90 residues, a C-terminal AVPTIF box and several other conserved residues. Orthologues of the human THAP domain have been identified in other vertebrates and probably worms and flies, but not in other eukaryotes or any prokaryotes [1].
Hmmscan Out: # of c-Evalue i-Evalue score bias hmm coord from hmm coord to ali coord from ali coord to env coord from env coord to acc

1 28 2e-15 1.8e-12 47.9 5.3 1 86 596 668 596 669 0.85

2 28 3.3e-15 3e-12 47.1 4.7 1 87 696 765 696 765 0.83

3 28 2.7e-15 2.4e-12 47.4 0.2 1 87 787 859 787 859 0.85

4 28 1.7e-16 1.5e-13 51.3 4.9 1 86 939 1008 939 1009 0.80

5 28 2.1e-14 1.9e-11 44.5 4.5 1 86 1033 1104 1033 1105 0.81

6 28 1e-12 9.1e-10 39.2 0.7 1 87 1140 1208 1140 1208 0.79

7 28 2e-10 1.8e-07 31.8 1.8 1 86 1249 1318 1249 1319 0.76

8 28 6.3e-18 5.6e-15 55.9 0.8 1 86 1346 1415 1346 1416 0.82

9 28 5.9e-13 5.3e-10 39.9 1.5 1 86 1437 1506 1437 1507 0.82

10 28 1.3e-14 1.2e-11 45.2 1.7 1 86 1534 1605 1534 1606 0.85

11 28 7.2e-14 6.5e-11 42.8 5.2 1 87 1669 1739 1669 1739 0.82

12 28 6.2e-12 5.5e-09 36.7 0.1 1 86 1761 1829 1761 1830 0.81

13 28 8.1e-14 7.3e-11 42.7 1.7 1 87 1935 2004 1935 2004 0.81

14 28 4.8e-11 4.3e-08 33.8 0.1 1 85 2068 2131 2068 2133 0.83

15 28 6e-07 0.00054 20.7 0.3 1 60 2163 2216 2163 2239 0.75

16 28 2.3e-13 2.1e-10 41.2 0.7 1 86 2253 2322 2253 2323 0.83

17 28 2.6e-13 2.3e-10 41.1 0.5 1 86 2355 2422 2355 2423 0.77

18 28 1.8e-11 1.7e-08 35.1 0.3 1 86 2449 2518 2449 2519 0.78

19 28 2.4e-12 2.1e-09 38.0 0.2 1 87 2540 2606 2540 2606 0.78

20 28 5e-12 4.5e-09 37.0 0.1 1 86 2634 2708 2634 2709 0.77

21 28 0.00055 0.49 11.2 0.0 1 58 2747 2798 2747 2821 0.80

22 28 1.5e-14 1.4e-11 45.0 1.4 1 87 2837 2911 2837 2911 0.82

23 28 1.6e-13 1.4e-10 41.7 1.0 1 87 3087 3158 3087 3158 0.80

24 28 1.3e-12 1.2e-09 38.8 4.6 1 87 3230 3301 3230 3301 0.80

25 28 8.4e-14 7.5e-11 42.6 2.0 1 86 3455 3523 3455 3524 0.79

26 28 1.7e-14 1.5e-11 44.9 0.5 1 87 3546 3616 3546 3616 0.85

27 28 1.2e-07 0.00011 22.9 0.6 1 58 3662 3710 3662 3724 0.87

28 28 1e-11 9.4e-09 35.9 1.9 18 87 3727 3788 3715 3788 0.76

#	of	c-Evalue	i-Evalue	score	bias	hmm coord from	hmm coord to	ali coord from	ali coord to	env coord from	env coord to	acc
1	28	2e-15	1.8e-12	47.9	5.3	1	86	596	668	596	669	0.85
2	28	3.3e-15	3e-12	47.1	4.7	1	87	696	765	696	765	0.83
3	28	2.7e-15	2.4e-12	47.4	0.2	1	87	787	859	787	859	0.85
4	28	1.7e-16	1.5e-13	51.3	4.9	1	86	939	1008	939	1009	0.80
5	28	2.1e-14	1.9e-11	44.5	4.5	1	86	1033	1104	1033	1105	0.81
6	28	1e-12	9.1e-10	39.2	0.7	1	87	1140	1208	1140	1208	0.79
7	28	2e-10	1.8e-07	31.8	1.8	1	86	1249	1318	1249	1319	0.76
8	28	6.3e-18	5.6e-15	55.9	0.8	1	86	1346	1415	1346	1416	0.82
9	28	5.9e-13	5.3e-10	39.9	1.5	1	86	1437	1506	1437	1507	0.82
10	28	1.3e-14	1.2e-11	45.2	1.7	1	86	1534	1605	1534	1606	0.85
11	28	7.2e-14	6.5e-11	42.8	5.2	1	87	1669	1739	1669	1739	0.82
12	28	6.2e-12	5.5e-09	36.7	0.1	1	86	1761	1829	1761	1830	0.81
13	28	8.1e-14	7.3e-11	42.7	1.7	1	87	1935	2004	1935	2004	0.81
14	28	4.8e-11	4.3e-08	33.8	0.1	1	85	2068	2131	2068	2133	0.83
15	28	6e-07	0.00054	20.7	0.3	1	60	2163	2216	2163	2239	0.75
16	28	2.3e-13	2.1e-10	41.2	0.7	1	86	2253	2322	2253	2323	0.83
17	28	2.6e-13	2.3e-10	41.1	0.5	1	86	2355	2422	2355	2423	0.77
18	28	1.8e-11	1.7e-08	35.1	0.3	1	86	2449	2518	2449	2519	0.78
19	28	2.4e-12	2.1e-09	38.0	0.2	1	87	2540	2606	2540	2606	0.78
20	28	5e-12	4.5e-09	37.0	0.1	1	86	2634	2708	2634	2709	0.77
21	28	0.00055	0.49	11.2	0.0	1	58	2747	2798	2747	2821	0.80
22	28	1.5e-14	1.4e-11	45.0	1.4	1	87	2837	2911	2837	2911	0.82
23	28	1.6e-13	1.4e-10	41.7	1.0	1	87	3087	3158	3087	3158	0.80
24	28	1.3e-12	1.2e-09	38.8	4.6	1	87	3230	3301	3230	3301	0.80
25	28	8.4e-14	7.5e-11	42.6	2.0	1	86	3455	3523	3455	3524	0.79
26	28	1.7e-14	1.5e-11	44.9	0.5	1	87	3546	3616	3546	3616	0.85
27	28	1.2e-07	0.00011	22.9	0.6	1	58	3662	3710	3662	3724	0.87
28	28	1e-11	9.4e-09	35.9	1.9	18	87	3727	3788	3715	3788	0.76

Sequence Information

Coding Sequence: ATGTCACAACAACACCATTCGCACAATCACTaccatcaacaacaacaacaagcacaacaacaacaacaacatcatcatcatcaacatcttGCGCATCAGCAAAATCAACACAAACtacaacataaacaaatacagcACAGTTGGTACTCACATGTTGCTTCCTACCCACCGCACGGAACAGCTTTTTCGGCATCCTCGAATTGTAAGAGTAATGTTAATATGAATGCATATGGTGCAGCGTCCAGCACGCATGCATATTATGGTGGCAATAGTATTGGGGGCAGTGGCATGCCCGGTGGGGTTAATAACATGGGAGGCGGTGTCAATGTCAATGCTGACGGGCATAACATGGCCTATAACGCCGAAGCCTCGCCGGTAAATACTGTTGCCTATGCACATAATCAATTGTTGCAgtatcaacaacagcaacaacaacaacatttgctaatgcagcaacaacaacagcagcaacagcaacatcagcagcagcaagtgcaACACCATAGTCAGCGTCCTTATATGCCGCCACACGGTCATGCTCTTATGCCAGGACCCAATTATACACCTTATATCAAAAGCGAACCCATGGAACTACCCAGTGAAAGACTAAGGCATCAGCAACATTACCAACCGCCCATACCGATGGCACCGCCGCCAGCGCCCGCCACACGCTTGGATGCCAACAGCGGCGCTGGCGTCGGAAATGAtatgataataaaatcgGAACCAATGGATGAACATGCTTTTAAATCAAGCTATATCGATGATAACACGCCATTTGCTGATTTTAGCAAATATCCCGATTTCAATCAGGACATGTTAAACCCCAAAGTAGAGCTAACTGTTAAAGACGATGCGTTTAGCAATTCAAGCCAAAAGCATGCGCTGAATTTTCCACGCCGTAAAATGGAAACAGAACGATCGGAAAGCCTTCCACCAATTTGCCAACGCTGCAAGGaagttttctttaagaaaCAAATGTATCTGACACACGTAGCTGAGAGTAGCTGCACCATTAACGAATATGATTTCAAATGTAGCATTTGCCCGATGTCCTTTATGAGCGGTGAAGAATTAAAGAAACACAAGCAACTGCACAGATTCAACAAATTCTTTTGCCACAAATATTGCGGCAAGCATTTTGACACAATTGAGGAATGCGAGTCGCATGAGTATATGCAACATGAGTACGATCCGTTTGTGTGTAATATATGCTCGGGTAACTTTGGAACGCGCGATCAGCTGTACGCACATTTGCCTCAGCATAAATTTCAGTCTCGCTACGATTGCCCTGTATGCCGTGTGTGGTATCAGACACCGCAGGAATTGCACGAACATCGTTTGGCTGCGCCctatttttgtggcaaatacTATACCAGCGTTGGGACAAATCACAATAGAGCACAATCAAATCTTTCTGCTCAGCATACgcaacatcaacagcaacaacaatcaaactATAAACTACAGGATTGCCAAATGGGCACTATTGAAATGCCTTCGCCACATCACAAATCCTCCACTGCTGCAGCTGGTTCGCTTCCAGCAACGGCTGCACTTAGTTCCTTGCTACAACAGCGTCAAGCCAACGCCGATAGTGCAGCTCTATTTGGACCACTTAAAACGGATGTTAAGTTAGAGCGCAGCTATAGCAATTCGACAAGCGAATCATCCTACAACAGCATGCAAGATGGCAATTATAACAATGCTTATGGTAGCGATGCGTCGCTTCTTGGTGGCCAGTCAGCACACTCGTCCACTCTTGATGATTCTGATGATGCACTGTGTTGCGTGCCAAAATGCGGAGTGCGTAAAAGCACCAGTCATACATTGCAATTCTTTACTTTTCCGAAGGATGAAAAGTATTTGCATCAGTGGTTGCATAATCTCAAAATGTTTCACATTCCGGCCACTACATACATGAGCTACCGCATTTGTAGCATGCATTTTCCCAAACGCTGCATAAATCGTTATTCGCTGTGTTACTGGGCTGTGCCCACGTTTAATTTGGGTCATGACGATGTAGCCAATTTGTATCAGAATCGTGAGCTTACCAATATGTTCACAGTTGGCGAGGTGGCACGCTGCAGTATGCCCAATTGCAATAGCCAACGCGGtgaaagcaatttaaagttttataattttcccAAGGACCTCAAGAGTCTGATTAAATGGTGTCAGAATGCCCGTTTACCTGTGCAAGCAAAGGAGCCACGTCATTTTTGCAGCCGTCACTTTGAGGAGCGTTGCATTGGAAAATTTCGACTGAAACCATGGGCAGTTCCTACACTGCATTTGGGAACACAATATGGCAAAATTCATGATAATCCTAAAAATCTTTATGTGGAGGAAAAGCGCTGCTGTTTAGCCTTCTGCCGTCGAAGTCGTTCATCCGATTTTAATATGTCTCTGTATCGCTTTCCCCGAGATGAAGTGCTACTAAGACGTTGGTGCTACAATTTGCGGCTAGACCCAGGTGTTTATCGCGGCAAGAACCACAAAATTTGCAGCGCTCATTTTATTAAGGAGGCGCTTGGTCTGCGAAAGCTTTCGCCAGGTGCTGTTCCAACCTTGCATTTGGGACACAAcgacaattttaatatttacgaGAATGAGTTGTGGCCGCCACCAACACCAACTGGCACATCTAATTCTCACAATCAACAGCACCGAAGTTATCAACGTCACTCTGTAGCTTCCACTTCATCGTCAACAAGCTCTTCATCTATGTACATTGAACAGGAAATGAATGCATCGTATCATGGTTTGTCAGCTTCTTCATCCTCACTGAATGTGACCGAATGCATGGATGTCTGCTGTGTGCCCGGTTGCGAAAGTAAACGACACAATAATGAAAACATCACTTTCCATACAATACCACGTCGCCAGGAGCAAATGAGCAAGTGGTgtcataatattaaaatacccGAAGAGAAAATGCATAAGGGCATGCGTATTTGCAGTCGTCACTTCGAATCCTATTGTATAGGCGGTTGTATGCGACCTTTTGCCGTGCCCACACTTTATCTTGGCCATGATGACGAGGATATTTACCGAAACCCGGATAAGATTAAGAAACTAAACATACGTGAGACATGCTGTGTTCAGGTTTGCAAAAGGAATCGCGATCGCGACCATGCAAATTTGCATCGCTTTCCCTCAAATCCAACACTGCTCGCCAAGTGGTGCGCTAATCTTCATAAACCTGTACCAGATggcagcaaattgtttaatgatGCCATTTGTGAAGTGCACTTTGAGGATCGCTGTCTACGCAACAAACGACTTGAAAAGTGGGCAGTACCTACACTTGTCCTGGGTCATGATACCATACCATACTCGCTGCCCAGTGAGGCAGAAGTGGCCGAATTCTATGCACGTCCCAGTGCACCAAATAATGGTGAAGAGGAGGGCGAATGTTGTGTCGAAACTTGTAAACGCGATCCCAGTGTTGACGATATAAAGCTCTATCGTCCGCCCGAAGAACAAGAAGTGCTCGCTAAATGGGCCCACAATCTTCAGCTGGATATCGAACAACTGCCCAGTCTGAGAATATGTAATCTGCACTTTGAATCGCATTGCATTGGCAAGCGCATGCGACCATGGGCTATACCCACGCTGAATCTAGGCAAAAACATTGAGAATCTTTATGAAAATCCTGAGAACAATATGCTTTATGTACGCAAACAGCGTCGATTTTTGTCCTCGGATTCGGGCATGACAAAGCCCACTTGGGTGCCTCGCTGCTGTTTGCCACACTGTCGTAAAGTACGTGCCATACACAATGTTCAACTCTATCGATTCCCCAAAATTAATCGCTCCACGCTGGCTAAATGGGCGCACAATCTGCAAGTGCCGGTAATGGGTAGCGCTCAGCGTCGTGTGTGCTCTGCTCATTTTGAGCCGCATGTTTTGAGCAAAAAGTGCCCCGTTCCATTGGCTGTGCCCACACTTGATTTGAACGTGCCTTCAGGCtttaaaatctatcaaaatccAGCCAAGCTTAAGGCCAACAAGCTGTGTATGCAGCGAGTTTGCATCGTAGAAGGCTGTCGTCGGCAACGTGCACATGGCGTACAGCTATTCCGATTTCCACACAATACTGCACAATTACGTAAATGGCTgcacaatattaaacagcgaCCCAAAAGCGGTATGCGTAATCAGTTTCGCATATGCTCTAAACATTTTGAGACGCATTCGTTTAATGGCAAACGATTGAGCGCAGGCGCAATACCCACTCTTGAATTGGGACACGACGATGACGATCTCTATCCAAATGAAGTGCAGTCATTTGTAGAAGAACATTGCGCGGTAGAAGGCTGTAGTTCTGCAAAAGAGCAACCCGATGTAAGGCTCTTCAAATTTCCCACTGAAGATGAGGATTTGCTATGGAAATGGTgtaacaacttaaaaatgaatCCGGTTGATTGTGTTGGTGTGCGTATTTGTAATAAGCACTTTGATCCTGATTGTATTGGGCCAAAGCATCTTTTTAAATGGGCTATACCGACCTTGGCATTGGGCCACGATGATGCAGAAATTGAGTTGATACAAAATCCTAGACCAGAAGAACGCTATTTGGATCCcatatttaaatgttgtgTGCCAACCTGCGGTAAAACACGAAAATTTGATGAGGTGCAAATGAACAGCTTTCCCAAAGATCCTACGCTTTTTGAGCGCTGGCGCCATAATCTCAAGCTAGAACACCTAAACTTTAAGGAGCGAGAACGCTATAAAATCTGCAACGCacattttgaagatatttgcATTGGCAAAACAAGACTTAATATAGGCTCCATACCAACACTAGAGTTGGGCCATGATGAGACTGATGATCTCTATCAAGTTAATCCTGAGGATcttcaaagcaatttatttgggCGCCCACGTCGCTTACATGAAACAAACACATTGGCCAAGAGTGAAGAAACCATATCAGAGGCTACTGATTTAAATACTAGCCAAGTTAAGATTAAGAAAGTCTCGACTGAGCTTAAATGTTGCGTTGAGAGCTGCAGTAAAACTCGATTGGAGCATGGAGTACGTCTTTATGCTTTTCCCTCTgccaaacagcagcagaaTAAATGGCGTCACAATCTGCATCTTAGTTCAGAAGATTTTGATAAGAATGCCCGCGTTTGTAGTTCCCATTTCAATAAGCGCTGCTTTGATGGTAAACAGCTGCGCAGCTGGGCAATGCCTACACTGCATTTGGGCCACGATCAGCCCATCTATGAGAATCCAAAGAATGTACCGGGCTTTTTTACTCCTACTTGCGCCTTAGAGCATTGTCGAAAGCGGCGCACTATAGATAATGATTTGCGTACCTATCGTTATCCTCGAAATGATGAACTGCTGGAGAAGTGGCGTATTAATTTAAGATTGGAGCCATCGCAGTGTCGAGGCCGTATTTGTGCTGATCACTTTGAACCATTGGTGAGAGGTAAACTAAAGCTTAAGACGGGTGCTGTGCCCACGCTTAAGCTAGGACATGATGAAGATATCATTTATGACAACGAGGCCATTAAGGCTAGCTTGGAAGTAGATGAGGATATAAGCCTTGATTCCAGTGAGCATACAACTCTACAACCGAAAAGTGTGCCCGCGTACGAAGAAGATCTGGATGATGAAGGGCAGTATCAAAACTCCGCGTACTTCGATCCAATGGAGTTGGTGCAAACCTTTGCCGATGAGCACCACAGTACCGAAGAACAGCACGTTGCAACCGAAACACGACGCCTGCCATCGGAAGTTACTATTAAGCGCGAAAAACCTGCCAATAATGTTACACCAATTTGTTGCCTAAAGCATTGCCGTAAGGAAAGAACTGCTACGTACCATTTGAGTACGTTTGGCTTTCCAAAGGATCCAAATGTGCTGCTTAAATGGTGCGCTAACCTACACTTGGAGCCATCCGACTGCATTGGACGCGTATGCATTGAGCACTTCGATCCCGAGGTGCTGGGCAGTCGCAAACTTAAACAGAATGCAGTGCCAACTATTAATGTGGGCCACGATGATCCGCTGCCTTATGCACACAATGGCATAGAACTGCACTTGGAGCAATATGACGAGCAGCCTCAGCATTCGGTTTTTCGGCTTTCCAGCCTGAAACACTGCCGCAAACGGAAGGAATCCGAACCACCAGATCAAGAAACTAGCTCTAGTGACTATAGCCAAGACTTTAAACAATGCTGTTCAGTATTAAAATGTGGCCGTGACGACGTGCGTCTAGTGCGTTTGCCCAAATCGCGCATATTGCAGCGCAAATGGCTGCATAATTTGCAGCTAGTAGATTCCGTGCAATCACCTAAAATTTGCTTGGAACACTTTGAACCAGATAGCTTTCAAAATGAATATTCTCTGAAACCTGACGCGCTACCCACCAGAAAACTGGGACACAAGGAATCAAATATCTACCGAAATAGGGTAGAAAATCCCAAACTTGTGCTAACCCATAGAAACAAACTTGTAAAGAGCTGTGTGGTTCCCAACTGTCGTTATGCACGTGCATACAATTGCCAACATTTTGCGCTGCCATTGGATGAAGCTCTGCGCAAGACTTGGCTGGAATACTTAACACTAAATGTATCTGCACAATTAAGAATCAGTGTTGGTATTTGTTCCATGCACTACATGCAGTGCTATGAGCAGACCACAATTCCCAATACTTTGGAAGAGTCAGAACGACAGGAGTTATGTCAAAACTATACTGATTTTGTGAATTCGCCAACGGCACAAACGCTGCGCTGCGCTGTACCAGGCTGTCGCATAGTTGTTACGGACAATCAACGGCTTATCGAGCTGCCACAGTCTAGTGATCAGTGTGAGAAATGgataaaaaataccaaaatggcATATGATGCTGCAAGTCACAACTACTATCGCATTTGCCAATTGCATTTCGAGAGACATTGCTTGGGGCTCAGGCGTATCAAAAATTGGGCTGTACCCACGCTGCAGCTGAACCACAAAGACGAAATCCACGAAAATCCAATATCAAACACAGCTGAAGGCTCTACATTAATCAACTGTAATAAGACTGATGTTAAAATCTGTTGCATAAGCATTTGCAGCCAACAGGTCgatgaaaatacaaaactttattcGTTTCCGACTAACGAGTTAATGCTTCAGAAGTGGATAGTAAATACAAAACAGATTATTCGAGAGTCTTCCAAACTGTACATATGTGAAGATCACTTTGAATCCACATGCTTAGCCGAGGAGAGTCTGGCCCCATGGGCTGTTCCCACGTTGGAGCTGGGTCACAatgaatatataattaaaaataggtATCCAGATAATGAAGTGCTTAATTACATAAGGGTCAACTACTGCTCAATAATAAGTTGCTTCCAGCAAAGCAGTCAGAAGGTGCAACTTTATCCATACCCAAAAGATCGTAGCATTCAACGCAGATGGGCCGCCAATTGCGGTCACAGTCTTACCAATGTCAACAACGGTGTTCAAGTATGTCAAAAGCATTTTGCAGAAGATTGCTTTGATGATCTCAACGAGCTTTATATGGGCGCTGTGCCAACGTTAGAGCTAAACGAGGACACATCTGCGATAGAACAAAGCGATTGGTTTTATACAGTACCATTGAAATGTGCCGTACAACAATGCAATAGCGTAGGAAAGCGGCACTTTGCTTTTCCGGAAAACGAGGAGTTGCTTAGCAAGTGGACCCACAATTTGGGGCTTGACTTAGTCGATACTACAGATATGCGCATATGTCAGCGGCATTTTGAAACTCGCTGCTTCCGTGAAGGACTAAAGCTGCACGAGGGCTCGATACCCACACTAAATCTATGCAATGAGTCGCTTTCAGGAGAAGAGATTATAAGAATGCCAATATCTTTTCCACAGACAATAAAGAATGGAGGCAAATGCTGTGTGCCAAGCTGCGGAAAAACTCAGGACGACGGCTTGTACTTTAGCAGCCTACCTAAAATGCCTTGGTTAGCTAAACAATGGCTTCAGAATATGCGTCTGGAAGTACCCTTGCATGACTCAGCACTGTACAAACTCTCATGGAAAGTATGCAGCAGACATTTTGAAGCTAACAGTCTACAAGGGAATAGTGTACCCATTTTTGGAGCTGTGCCTACATTGCACCTAGGTCATAATGATCAAGACATACACTATCCCGATGAGCAGCTATTAGGAAGTCGCCGCAGGGGACCACAACCAGGGACAACATTAACCAAAAGCAATGACCATAAGTATTGCTGCTACCCAAACTGCTGCGAGTTTGATGGACCACTAGCACAAAATGCCGCATATCCGTTACCCGAATCAGAAGAGCTACGTGAATTATGGCTTATTGCCATGGGCGATGATTTCGTTCCGCAAAAAGAGCTAAGGTTGTGCCCGGTGCACTACGTCTTCCTATATGGACAGAGCCTTGACAAATTTCCCGAACATGCGACTGAAGATTATCATTTACGGCGCAGCTTCGAGCAAGCCAAAACTCATAACAGAGTGCGCATGAGTAGCTGCGCCGTACCAGGTTGCAAGAGCATAAGAATGCGTGGAGCGGATAATGTAAAACTCCATCAGCTGCCGCAACAACCCAATAAGTTACGAAAGTGGCTGAATAATACTCAAATGCAGGTTGTTGAGCAGCAGCGCTACATGTTTAAGGTGTGTGATAGACATTTCGAAGAACGTTGCTTCCTAACACCAAGACGTCTGAAGTCTTGGACATTACCAACTCTGAACCTGCCAGAGAGAGATCCCAGTGTCAAGCTCTACCAGAACCCCAGCCCGGAGCAAATATATCAGAATTGTAACAGTGACAGCGAAGCAAGTAATCCTCGATCAGACCCCACTGCTGCGGATATAGAGCATATGAATTGGGAACGTGATGACGCTCAAGCATGCAATTGGGAACGTGATGACGCTCAACCTAGAACCTGGGAACGCGATGACGCTCAAACAAGCCATTGGGAACCTGAAGACGATGATGGCCAAGCAAGCAATTGGGAACAGGACGATGATGACGCACAAGCAAGCAATTGGGAACGTGATAACGCAGAACATATAAGCGAAGTTCAACAAAGGCCTACGTCTGAAAATGACAGCAACTCTCAACCCGGTGAAATGGAAGAGCTAGAAGTGTTGCTGGAAGTTGGCCATGTACAGAAATTCGACAGCTATGAACACTTCGACACTGGACCGACTGAGGAGCCAACAACGAGTTATTTTAGTGCACCAAAAATGAATCAGCAGTTCACTGCGACACGATGTTGCATACGTGGCTGTGATATTACCATACGCGATGGTGACGTTAAGCTTCACAAGTTCCCGCAACCAAAGGGAATTTTGCGCAAATGGATGCATAATACTCAGGTGGTGGTAGACCCTAAATACTCTTGGCGCTATCGTATATGCAGTCATCATTTTGAACGTGAATGTTTTAATGGTTATCGTTTTCGCTTGGGCACAGTGCCCACACTTCATCTTGGGCCCAATAGACCGCcgaaaatatatcaaaatgaattttcaattcaagCAGAACCAGAGCCAGATTTGGAGGAAACGCAACTTTTTGAGGAGACGTATGAAGATTCAATAGAAGATACTTACGACGAGCCGCTGGAAGAAGCTTTTGAAGAATCCTTTGGGGAACAAGAGCAAGTCTACGACAAAATAACGCGAAAATCAACGAAATATTGTCAAATAGAGCACTGCTACAATCATCTACATACACCCAACATAACCTTGCATAAGTTTCCAGTCTCTCCTGGTCAGTGCCGCAAATGGATACATAATACTCAGGTACCTTTTGAGGCAGAGTATCGTTGGCGTTTCCGTATATGCAGCGAACACTTCCAACCTTTTTGCTTAACATCTAAGCGTCTGCTACAAGGTAGCGTGCCCACACTAAATCTTGGGCCCAATGCGCCGGCGCGTCTGTATGATAATAGTTTTGAACTAAAAGAGACACAGTACGACAAGAAAATACAAGAATCGACAACAGATGTATATGATGATAATAGTTATCAGTCCAATGGTACTAATTTTGAATCTGAGAGTTACATGGAAATGCCTGAAGTTGAACCAGAACTTGTGTTAGGTTCTAGTGATACGACTCATCTGTATGACAATAGTTATCATTCCACAGATATGCAATATGAAGGAGAAAATTCTTTGGAGCTGCGTGAAAATTCTTCAGAATGGGAGGAGGATGATGAAGACGATGATATGCAGCTGCTCGTACCTGAATTGCAGCTAGAAGTGCAGGATAATGAAATTTGCTTCAAACCTGATGCATCACGCACACAAAATGGTCAACATAAGACGCAGAAGAGCATTGTATACAACGAGGTTAAGTTTGCCTATGGCAAATGCTCTCTAATACATTGCCAAAAGCAGAAGGTACACCATGGcgtgcttttgtttaaatttcccAAGTCTAAGCTTATGCAAGAACGTTGGATGCACAACCTGCGCATACAATATGATGAACAGCGTCCCTATTTGATATGCAGCGATCACTTTGAGTCACGTTGCATGGAGGAACAAAACTTAAAGGAATGGGCCGTACCAACGCTGCAACTTGGCGAAAATGTGCcagaaattttgtttcaaaataaggtCAAAAAGAGGTTGATAAAAACTTGCTGTTTACAATATTGCGGAAGACAACgagatgaaaatattaaactattcCGACTACCCAACAATCGTAGCATGCTCAAAAAGTGGGAACGGGCCACTGGCATGAGCTTCAATGAATCTCAGCGAAACACAAGACTAATTTGTAGTCGGCATTTTGATCCGCAGCTGATTGGAGTACGACGGTTGTCCAAACATGCAGTACCCACTTTAAATTTGGGctttatgcaaaatgaaagCGCGCCAGCACCAGTACCAGTTGCGACGCCAAAAGTTgaagctaaaaaaaacaaaataaaagtaccaAGATATCATCATCTTAATGCGGAAAAGTCAACATCACCACCGCAATGCTGCATGTCCAATTGTATGTCTGACTCGAATGTGCACCTCTACAAATTTCCTTCTGaCTACGATCTGCTGCGTCAATGGTGTCAAGGCCTCAAGTTAAACGATGTAGTCAGCTTCCGTGGCAAATACATATGTGCCAACCATCTGCCTGTCAGGCCAGAAAGATGTACCGTTTGCGGTAAACATGATTTGCAACTGCCATTGCAAATCTTTCCCGGCAATCGAAATGTGCGTCAGAAATGGTGCCACAACTTAAAAATCGATAACATTTCCAAATGGGATTTTTCACGTCACCTCTGCTCCAAGCATTTCGAAGATAATTGCTTTTCAACGGTGGATGACGAGAGAATTCTGCTTAAAGATGCCGTACCCACCTTGCATTTAAAGCACATGGATGTTAACATATTCCATAATGAACAAATAACAGggaagaaaatgaaattggaACCCTTTGACAGCGAAATTCTGCTGCCATAG
Protein Sequence: MSQQHHSHNHYHQQQQQAQQQQQHHHHQHLAHQQNQHKLQHKQIQHSWYSHVASYPPHGTAFSASSNCKSNVNMNAYGAASSTHAYYGGNSIGGSGMPGGVNNMGGGVNVNADGHNMAYNAEASPVNTVAYAHNQLLQYQQQQQQQHLLMQQQQQQQQQHQQQQVQHHSQRPYMPPHGHALMPGPNYTPYIKSEPMELPSERLRHQQHYQPPIPMAPPPAPATRLDANSGAGVGNDMIIKSEPMDEHAFKSSYIDDNTPFADFSKYPDFNQDMLNPKVELTVKDDAFSNSSQKHALNFPRRKMETERSESLPPICQRCKEVFFKKQMYLTHVAESSCTINEYDFKCSICPMSFMSGEELKKHKQLHRFNKFFCHKYCGKHFDTIEECESHEYMQHEYDPFVCNICSGNFGTRDQLYAHLPQHKFQSRYDCPVCRVWYQTPQELHEHRLAAPYFCGKYYTSVGTNHNRAQSNLSAQHTQHQQQQQSNYKLQDCQMGTIEMPSPHHKSSTAAAGSLPATAALSSLLQQRQANADSAALFGPLKTDVKLERSYSNSTSESSYNSMQDGNYNNAYGSDASLLGGQSAHSSTLDDSDDALCCVPKCGVRKSTSHTLQFFTFPKDEKYLHQWLHNLKMFHIPATTYMSYRICSMHFPKRCINRYSLCYWAVPTFNLGHDDVANLYQNRELTNMFTVGEVARCSMPNCNSQRGESNLKFYNFPKDLKSLIKWCQNARLPVQAKEPRHFCSRHFEERCIGKFRLKPWAVPTLHLGTQYGKIHDNPKNLYVEEKRCCLAFCRRSRSSDFNMSLYRFPRDEVLLRRWCYNLRLDPGVYRGKNHKICSAHFIKEALGLRKLSPGAVPTLHLGHNDNFNIYENELWPPPTPTGTSNSHNQQHRSYQRHSVASTSSSTSSSSMYIEQEMNASYHGLSASSSSLNVTECMDVCCVPGCESKRHNNENITFHTIPRRQEQMSKWCHNIKIPEEKMHKGMRICSRHFESYCIGGCMRPFAVPTLYLGHDDEDIYRNPDKIKKLNIRETCCVQVCKRNRDRDHANLHRFPSNPTLLAKWCANLHKPVPDGSKLFNDAICEVHFEDRCLRNKRLEKWAVPTLVLGHDTIPYSLPSEAEVAEFYARPSAPNNGEEEGECCVETCKRDPSVDDIKLYRPPEEQEVLAKWAHNLQLDIEQLPSLRICNLHFESHCIGKRMRPWAIPTLNLGKNIENLYENPENNMLYVRKQRRFLSSDSGMTKPTWVPRCCLPHCRKVRAIHNVQLYRFPKINRSTLAKWAHNLQVPVMGSAQRRVCSAHFEPHVLSKKCPVPLAVPTLDLNVPSGFKIYQNPAKLKANKLCMQRVCIVEGCRRQRAHGVQLFRFPHNTAQLRKWLHNIKQRPKSGMRNQFRICSKHFETHSFNGKRLSAGAIPTLELGHDDDDLYPNEVQSFVEEHCAVEGCSSAKEQPDVRLFKFPTEDEDLLWKWCNNLKMNPVDCVGVRICNKHFDPDCIGPKHLFKWAIPTLALGHDDAEIELIQNPRPEERYLDPIFKCCVPTCGKTRKFDEVQMNSFPKDPTLFERWRHNLKLEHLNFKERERYKICNAHFEDICIGKTRLNIGSIPTLELGHDETDDLYQVNPEDLQSNLFGRPRRLHETNTLAKSEETISEATDLNTSQVKIKKVSTELKCCVESCSKTRLEHGVRLYAFPSAKQQQNKWRHNLHLSSEDFDKNARVCSSHFNKRCFDGKQLRSWAMPTLHLGHDQPIYENPKNVPGFFTPTCALEHCRKRRTIDNDLRTYRYPRNDELLEKWRINLRLEPSQCRGRICADHFEPLVRGKLKLKTGAVPTLKLGHDEDIIYDNEAIKASLEVDEDISLDSSEHTTLQPKSVPAYEEDLDDEGQYQNSAYFDPMELVQTFADEHHSTEEQHVATETRRLPSEVTIKREKPANNVTPICCLKHCRKERTATYHLSTFGFPKDPNVLLKWCANLHLEPSDCIGRVCIEHFDPEVLGSRKLKQNAVPTINVGHDDPLPYAHNGIELHLEQYDEQPQHSVFRLSSLKHCRKRKESEPPDQETSSSDYSQDFKQCCSVLKCGRDDVRLVRLPKSRILQRKWLHNLQLVDSVQSPKICLEHFEPDSFQNEYSLKPDALPTRKLGHKESNIYRNRVENPKLVLTHRNKLVKSCVVPNCRYARAYNCQHFALPLDEALRKTWLEYLTLNVSAQLRISVGICSMHYMQCYEQTTIPNTLEESERQELCQNYTDFVNSPTAQTLRCAVPGCRIVVTDNQRLIELPQSSDQCEKWIKNTKMAYDAASHNYYRICQLHFERHCLGLRRIKNWAVPTLQLNHKDEIHENPISNTAEGSTLINCNKTDVKICCISICSQQVDENTKLYSFPTNELMLQKWIVNTKQIIRESSKLYICEDHFESTCLAEESLAPWAVPTLELGHNEYIIKNRYPDNEVLNYIRVNYCSIISCFQQSSQKVQLYPYPKDRSIQRRWAANCGHSLTNVNNGVQVCQKHFAEDCFDDLNELYMGAVPTLELNEDTSAIEQSDWFYTVPLKCAVQQCNSVGKRHFAFPENEELLSKWTHNLGLDLVDTTDMRICQRHFETRCFREGLKLHEGSIPTLNLCNESLSGEEIIRMPISFPQTIKNGGKCCVPSCGKTQDDGLYFSSLPKMPWLAKQWLQNMRLEVPLHDSALYKLSWKVCSRHFEANSLQGNSVPIFGAVPTLHLGHNDQDIHYPDEQLLGSRRRGPQPGTTLTKSNDHKYCCYPNCCEFDGPLAQNAAYPLPESEELRELWLIAMGDDFVPQKELRLCPVHYVFLYGQSLDKFPEHATEDYHLRRSFEQAKTHNRVRMSSCAVPGCKSIRMRGADNVKLHQLPQQPNKLRKWLNNTQMQVVEQQRYMFKVCDRHFEERCFLTPRRLKSWTLPTLNLPERDPSVKLYQNPSPEQIYQNCNSDSEASNPRSDPTAADIEHMNWERDDAQACNWERDDAQPRTWERDDAQTSHWEPEDDDGQASNWEQDDDDAQASNWERDNAEHISEVQQRPTSENDSNSQPGEMEELEVLLEVGHVQKFDSYEHFDTGPTEEPTTSYFSAPKMNQQFTATRCCIRGCDITIRDGDVKLHKFPQPKGILRKWMHNTQVVVDPKYSWRYRICSHHFERECFNGYRFRLGTVPTLHLGPNRPPKIYQNEFSIQAEPEPDLEETQLFEETYEDSIEDTYDEPLEEAFEESFGEQEQVYDKITRKSTKYCQIEHCYNHLHTPNITLHKFPVSPGQCRKWIHNTQVPFEAEYRWRFRICSEHFQPFCLTSKRLLQGSVPTLNLGPNAPARLYDNSFELKETQYDKKIQESTTDVYDDNSYQSNGTNFESESYMEMPEVEPELVLGSSDTTHLYDNSYHSTDMQYEGENSLELRENSSEWEEDDEDDDMQLLVPELQLEVQDNEICFKPDASRTQNGQHKTQKSIVYNEVKFAYGKCSLIHCQKQKVHHGVLLFKFPKSKLMQERWMHNLRIQYDEQRPYLICSDHFESRCMEEQNLKEWAVPTLQLGENVPEILFQNKVKKRLIKTCCLQYCGRQRDENIKLFRLPNNRSMLKKWERATGMSFNESQRNTRLICSRHFDPQLIGVRRLSKHAVPTLNLGFMQNESAPAPVPVATPKVEAKKNKIKVPRYHHLNAEKSTSPPQCCMSNCMSDSNVHLYKFPSDYDLLRQWCQGLKLNDVVSFRGKYICANHLPVRPERCTVCGKHDLQLPLQIFPGNRNVRQKWCHNLKIDNISKWDFSRHLCSKHFEDNCFSTVDDERILLKDAVPTLHLKHMDVNIFHNEQITGKKMKLEPFDSEILLP

Similar Transcription Factors

Sequence clustering based on sequence similarity using MMseqs2

100% Identity: iTF_00336772;
90% Identity: -
80% Identity: -