Basic Information

Insect: Drosophila trichaetosa
Gene Symbol: -
Assembly: GCA_035043205.1
Location: JAWNNE010000535.1:6995364-7009351[-]

Transcription Factor Domain

TF Family: THAP
Domain: THAP domain
PFAM: PF05485
TF Group: Zinc-Coordinating Group
Description: The THAP domain is a putative DNA-binding domain (DBD) and probably also binds a zinc ion. It features the conserved C2CH architecture (consensus sequence: Cys - 2-4 residues - Cys - 35-50 residues - Cys - 2 residues - His). Other universal features include the location of the domain at the N-termini of proteins, its size of about 90 residues, a C-terminal AVPTIF box and several other conserved residues. Orthologues of the human THAP domain have been identified in other vertebrates and probably worms and flies, but not in other eukaryotes or any prokaryotes [1].
Hmmscan Out: # of c-Evalue i-Evalue score bias hmm coord from hmm coord to ali coord from ali coord to env coord from env coord to acc

1 28 6.7e-15 1.3e-11 45.1 4.2 1 86 570 642 570 643 0.85

2 28 2.8e-15 5.5e-12 46.3 4.6 1 87 670 739 670 739 0.83

3 28 6.8e-16 1.3e-12 48.2 0.4 1 87 761 833 761 833 0.85

4 28 6e-16 1.2e-12 48.4 5.7 1 87 928 998 928 998 0.83

5 28 9.4e-15 1.9e-11 44.6 3.8 1 86 1022 1093 1022 1094 0.81

6 28 2.6e-13 5.2e-10 39.9 1.2 1 87 1129 1197 1129 1197 0.80

7 28 1.7e-11 3.3e-08 34.1 2.3 1 86 1245 1314 1245 1315 0.78

8 28 1e-16 2e-13 50.9 0.2 1 86 1342 1411 1342 1412 0.82

9 28 1.5e-11 2.9e-08 34.4 0.5 1 86 1433 1502 1433 1503 0.79

10 28 4.7e-15 9.4e-12 45.5 1.6 1 86 1529 1600 1529 1601 0.85

11 28 4.2e-13 8.3e-10 39.3 1.3 1 85 1677 1745 1677 1747 0.81

12 28 3e-12 5.9e-09 36.5 0.1 1 86 1770 1838 1770 1839 0.82

13 28 4.9e-14 9.7e-11 42.3 0.9 1 86 1994 2062 1994 2063 0.82

14 28 6.8e-11 1.4e-07 32.2 0.4 1 61 2116 2170 2116 2192 0.79

15 28 5.2e-05 0.1 13.3 0.1 1 58 2199 2250 2199 2274 0.78

16 28 2.9e-11 5.7e-08 33.4 0.1 1 86 2289 2358 2289 2359 0.83

17 28 2.8e-14 5.6e-11 43.0 1.0 1 87 2417 2487 2417 2487 0.81

18 28 3.5e-13 7e-10 39.5 0.6 1 86 2522 2593 2522 2594 0.82

19 28 8.8e-14 1.7e-10 41.5 1.5 1 87 2604 2676 2604 2676 0.81

20 28 9.5e-14 1.9e-10 41.4 0.1 1 87 2699 2770 2699 2770 0.78

21 28 2e-05 0.039 14.7 0.1 1 57 2803 2855 2803 2873 0.83

22 28 1.4e-14 2.8e-11 44.0 0.2 1 86 2894 2966 2894 2967 0.80

23 28 4.5e-14 8.9e-11 42.4 1.4 1 86 3101 3173 3101 3174 0.81

24 28 2.1e-14 4.2e-11 43.4 2.2 1 87 3237 3308 3237 3308 0.84

25 28 1.1e-14 2.1e-11 44.4 4.4 1 86 3421 3491 3421 3492 0.85

26 28 2.3e-13 4.6e-10 40.1 0.3 1 87 3584 3654 3584 3654 0.84

27 28 1.1e-09 2.2e-06 28.3 0.4 1 58 3671 3719 3671 3730 0.88

28 28 7.8e-09 1.5e-05 25.6 1.3 18 87 3736 3794 3724 3794 0.76

#	of	c-Evalue	i-Evalue	score	bias	hmm coord from	hmm coord to	ali coord from	ali coord to	env coord from	env coord to	acc
1	28	6.7e-15	1.3e-11	45.1	4.2	1	86	570	642	570	643	0.85
2	28	2.8e-15	5.5e-12	46.3	4.6	1	87	670	739	670	739	0.83
3	28	6.8e-16	1.3e-12	48.2	0.4	1	87	761	833	761	833	0.85
4	28	6e-16	1.2e-12	48.4	5.7	1	87	928	998	928	998	0.83
5	28	9.4e-15	1.9e-11	44.6	3.8	1	86	1022	1093	1022	1094	0.81
6	28	2.6e-13	5.2e-10	39.9	1.2	1	87	1129	1197	1129	1197	0.80
7	28	1.7e-11	3.3e-08	34.1	2.3	1	86	1245	1314	1245	1315	0.78
8	28	1e-16	2e-13	50.9	0.2	1	86	1342	1411	1342	1412	0.82
9	28	1.5e-11	2.9e-08	34.4	0.5	1	86	1433	1502	1433	1503	0.79
10	28	4.7e-15	9.4e-12	45.5	1.6	1	86	1529	1600	1529	1601	0.85
11	28	4.2e-13	8.3e-10	39.3	1.3	1	85	1677	1745	1677	1747	0.81
12	28	3e-12	5.9e-09	36.5	0.1	1	86	1770	1838	1770	1839	0.82
13	28	4.9e-14	9.7e-11	42.3	0.9	1	86	1994	2062	1994	2063	0.82
14	28	6.8e-11	1.4e-07	32.2	0.4	1	61	2116	2170	2116	2192	0.79
15	28	5.2e-05	0.1	13.3	0.1	1	58	2199	2250	2199	2274	0.78
16	28	2.9e-11	5.7e-08	33.4	0.1	1	86	2289	2358	2289	2359	0.83
17	28	2.8e-14	5.6e-11	43.0	1.0	1	87	2417	2487	2417	2487	0.81
18	28	3.5e-13	7e-10	39.5	0.6	1	86	2522	2593	2522	2594	0.82
19	28	8.8e-14	1.7e-10	41.5	1.5	1	87	2604	2676	2604	2676	0.81
20	28	9.5e-14	1.9e-10	41.4	0.1	1	87	2699	2770	2699	2770	0.78
21	28	2e-05	0.039	14.7	0.1	1	57	2803	2855	2803	2873	0.83
22	28	1.4e-14	2.8e-11	44.0	0.2	1	86	2894	2966	2894	2967	0.80
23	28	4.5e-14	8.9e-11	42.4	1.4	1	86	3101	3173	3101	3174	0.81
24	28	2.1e-14	4.2e-11	43.4	2.2	1	87	3237	3308	3237	3308	0.84
25	28	1.1e-14	2.1e-11	44.4	4.4	1	86	3421	3491	3421	3492	0.85
26	28	2.3e-13	4.6e-10	40.1	0.3	1	87	3584	3654	3584	3654	0.84
27	28	1.1e-09	2.2e-06	28.3	0.4	1	58	3671	3719	3671	3730	0.88
28	28	7.8e-09	1.5e-05	25.6	1.3	18	87	3736	3794	3724	3794	0.76

Sequence Information

Coding Sequence: atgtcacaacaacaacacaatccCCCTCCACAtcaccaacatcaacatcactactatcagcaacagcagcaacaacaacaacatcaacatcatctgcagcagcagcagcatttgcagcataaacaaatacaacaacagcacagtTGGTACTCACATGTTGCTTCCTATCCGCCCCCGCATGCCGCTGCCTTTGCGTCGCCctgcaaaagcagcagcagcaacaccagcaacaacaataacaacaacaaccacattaTGAATGCATACGGTACGGGTGCAGGAGCGTATTATGGCTCAACGGGGGCGGGTGGCGTTGGGGTTGGCTATAACCTTGAGGCCAATACTGTGGCCTATGCGCACAACCAGCTGCTGcagtaccaacaacaacaacagcagcaacaacagcagcagcatcagcaacaacagcaccagcagcagctcaaccAGCGCTCGTATATGCCACCACATATAATGCACAGCTCGTATCCGTACATTAAGAGCGAACCATTGGAGCCACTGCCCGAacgccatcagcagcagcagcagcaacaactcttTCAGAATCCTATGGCACCGCCGCCAGCACCCGCCATTGCAAATCGTCATTCGCTCGATGCTAGTGGCGaaatgataattaaatCGGAACCCATTGACGAACATGCTTTCAAGTCCAACTATATCGATGATAATACTCCCTTTGCCGATTTTAGTAAATATCCCGAATTCGGCGACGATATGCTAAGTCCCAAGCTTGAGCTGAATGTCAAGGATGAGGCCTATGGAAACCAAAAAaACCCGCTAAACTACCCGCGTCGGAAGCTGCAGACGGATCGCTCCGCGGAGAGTATGCCCATTTGTCAGCGCTGTAAAGAGGTGTTCTTCAAGAAGCACATTTACCTGCGGCATGTGGCCGAGAGCAGTTGCAGCATACACGAGTATGAGTTCAAGTGCAATATCTGTCCCATGTCTTTTATGGGCGCCGAGGAGCTGCAGAAGCACAAGCATCTGCATCGAACTGACAAGTTCTTCTGCCACAAATACTGTGGGAAGCACTACGACTCGATTGCAGAGTGCGAATCGCACGAGTACATGGAGCACGAGTACGATAGCTTTGTGTGCAATATGTGCTCTGTTACGTTCCCCACACGGGAACAGCTGTATGCCCATTTGCCGCAACACAAGTTCCAACAGCGTTACGATTGCCCCATTTGCCGGTTGTGGTACCAAACGGCATTAGAGCTGCACGAGCATCGACTGGCGGCGCCCTACTTCTGTGGCAAGTATTACGCTGCagcacaccaacaacagccgcatcaacaacaacaacagcagcaccagcatacacaacaacatcagcaacagggCAACTACAAACTGCAGGATTGTCACATGGGTACCATTGAAAtgACTCCACCGCAGCACAAAGCGCATGCGGCATTACCGGCAACAGCGGCGCTCAATTCGCTGTTGCAGCAACGCCAGGCGAACGCTGATGGCGCCGCTTTATATGCCTCGGCGCTGAAGAGCGAGACGAACGTGAAACTGGAGCGCAGCTATAGCAACTCCACCAGCGAGTCTGGCTACAGTATGCACGAGAGCAGCTATAACAATGCCTACGCCAGCGACAATTCTCTGCATGGCGGGGGCGGGGCTATTGGTGGTCCGCAGGCGCATTCCTCGACGCTGGACGATTCGGAGGATGCGCTGTGCTGTGTGCCACTGTGCGGTGTGCGCAAGAGCACCAGCCCGACGCTGCAATTCTTCACATTTCCCAAAGATGACAAGTACTTGCATCAGTGGCTGCACAACCTCAAGATGTTCCACATTCCGGCGTCGAGCTATGCCAGCTTTCGCATTTGCAGCATGCACTTCCCTAAGCGTTGCATCAATCGTTACTCTCTGTGCTATTGGGCGGTGCCCACATTTAATCTGGGCCACGACGATGTGGCCAATCTCTATCAGAATCGTGAGCTGACCAACACATTCACCACCGGCGAGGTTGCCCGCTGCAGTATGCCAAACTGCACTAGTCAGCGTGGCGAGAGTAATCTGAAGTTCTACAACTTTCCCAAGGACATCAAGAGTTTGATTAAGTGGTGCCAAAACGCGCGTCTGCCCGTCCAGGCCAAGGAGCCGCGTCACTTCTGCAGTCGCCACTTCGAGGAGCGCTGCATCGGCAAGTTCCGGCTGAAGCCCTGGGCAGTGCCCACGTTACACCTGGGCGCCCAGTATGGCAAAATTCATGACAATCCCAAAAATCTGTATGTGGAGGAGAAGCGCTGCTGCCTCAACTTTTGTCGTCGCAGTCGCTCCTCCGACTTCAACATGTCACTGTATCGCTTCCCCAGGGATGAGGTGCTGCTGCGTCGTTGGTGTTACAATCTACGCCTTGATCCGGCTGTATATCGTGGCAAGAATCACAAAATTTGCAGCGCCCACTTTATAAAGGAAGCTTTGGGATTACGCAAACTATCTCCGGGTGCTGTGCCCACGCTACATCTGGGTCATAATGACACCTTTAACATATACGAGAACGAACTGTGGCCACCGCCAACGCCCTCTACGCCCACCCAcaatcatcagcagcagctgcagcaacaccagttacagcagcagccgcaacaagtGCATCATAAATATCAGCGGCATTCGGCTGCATCCACATCCTCGTCGGCCTCATCGACATCGCATTATGTGGATCCGGAGTTAAGTGCATCCTACATGAGCATGGGCGCTGGAGGCTCATCCTCTGGCCTTAATGTCAGCGACAGCATGGACGTCTGCTGTGTGCCCAGCTGCGAGAGCAAGCGTCACAACAATGAGAACATCACATTCCACACAATACCCAGGCGGCCAGAGCAAATGCGTAAGTGGTGTCACAATCTTAAGATTCCCGAGGACAAGATGCACAAGGGCATGCGGATATGTAGCTTGCACTTTGAGCCCTACTGCATTGGCGGCTGCATGCGTCCGTTTGCGGTGCCCACATTGCATCTGGGCCACGACGACGAGGACATTCACCGCAATCCGGATGTGATAAAGAAGCTCAACATACGCGAAACTTGCTGCGTGGCTGTTTGCAAGCGGAATCGTGACCGGGACCATGCCAATCTGCATCGCTTTCCCAGCAATGTGCCGCTGCTGACCAAATGGTGCGCAAATCTGCAGCGTCCTGTTCCAGATGGCAGTAAACTCTTTAATGATGCCATCTGTGAGGTGCACTTTGAGGATCGATGCCTGCGCAACAAACGGCTGGAGAAGTGGGCAGTGCCCACACTCACCCTTGGGCATGAGAATATACCCTATCCGCTGCCCACGTCGGAGCAAGTTGCCGAGTTCTATGCGCGTCCCAGTGCGCCTAACAATGGCGAGGAGCAGGGCGAGTGCTGTGTGGAGACGTGTAAGCGTAATCCCAGCGTGGATGACATCAAACTATATCGCCCGCCCGAGGAGTCGCAGGTGCTGGCCAAGTGGGCACACAATCTCCAACTGGAGATAGCCCAGCTGCCCAATATGAGAATATGCAATCTGCATTTCGAATCCCACTGCATTGGCAAGCGGATGCGCCCCTGGGCAGTACCCACTCTCAATCTTGCAACCAACATAGAGAATCTCTACGAGAATCCCGAACACCAGATGCTCTACAAGCGGCGCACGCATCTCAAGCCGGGCAGAGCAGTCCGAGGCTCTGAAGCAAGCGCTGGTGGCGTACAGCCCACCTGGGTGCCACGCTGCTGCTTGCCGCACTGCCGCAAGGTGCGTGCCACACACAATGTCCAGCTGTATCGCTTCCCCAAACTCAATCGCTCCACGCTGGCCAAGTGGGCGCATAATCTTCAGGTGCCGCCTGTGGGCAGCGCCCAGCGTCGCCTCTGCTCCGCACACTTTGAGCCGCATGTGCTCAGCAAGAAATGCCCGGTGCCCATGGCGGTGCCCACACTGGACCTCAATACACCATCCGGCTACAAGATCTATCAGAATCCGGCCAAGCTCAAGGCCAACAAGCTCTGCTTGCAGCGCGTCTGCATTGTGGAGAGCTGCCGGCGTCAGCGGGCGCAGGGGGTGCAGCTCTTTCGTCTGCCTCACAGCCCCACCCAGCTGCGTAAGTGGATGCACAACATTCGGATGCGTCCCCGAGGTGCTATGCGGCAACAGTATCGCATCTGCTCGCAGCACTTCGAGACGCACTCGTTCAATGGGAAGAGACTCAGTGCCGGAGCAATTCCAACGCTTGAGTTGGGCCATGAAGATGAAGACATATTTCCGAATGAGGCGCAGTCTTTCGTGGAGGAGCACTGCACCGTCGAGGGCTGCGGTGCCATCAAGGAGCTACCGGATGTGCGTCTCTTCCGCTTCCCCAACGACGATGAGGATCTGCTGTGGAAGTGGTGCAACAATCTGAAAATAAGTCCAGTCGACTGTATCGGCGTTCGCATCTGCAACAGACATTTCGAGGCGGATTGCATTGGACCGAAGCATCTGTTCAAGTGGGCCATTCCCACTCTATCCCTTGGCCACGATGATGATATCGAGCTGATGCTAAATCCTAAGCCGGAGGAGCGCTATATTGATCCGGTCTTCAAATGCTGTTTGCCCTCTTGCGGAAAGACGCGTAAATTCGATGAAGTGCAGATGAACAGTTTTCCCAAAGATCCGGAGCTCTTCCAACGCTGGCGCCACAATCTCCGCCTGGAGCATCTCAACTTCAAGGAGCGCGAACGCTATAAGATCTGCAACGCCCATTTCGAGGACATTTGCATTGGTAAGACGCGCCTAAACATTGGGTCCGTACCAACACTGGAGCTTGGCCATGACGAGACTGATGACTTGTTCCAAGTCAATCCCGAGGAGCTGCAGAGCAATCTCTTTGGACGCCAGCGGCGCGTCCAAGATTCTATGAGGATCAACATTAAGCAGGAGGCGCACTCCGACCTGGATGAAGACATCAAACCGGACATTAACATGTCGGCGGCCACAGATTCAAGTACAACACAGGTTAAAATCAAGAAATCTTTGACTGATTTCAAGTGCTGCGTGCAGAGCTGTGGTCGCAGCCGCCTGGAGCAGGGTGCCCGCCTCTTTCCGTTTCCGAATgggaaacagcagcagagcaagTGGCGCCACAATCTGCGGCTGCCTGCTGCCGACGTGGACAAGACGACGCGCATCTGCAGCGCCCACTTCAATCGCCGTTGTATCGATGGCAACCAGCTGAGGGGCTGGGCAATGCCCACACAGCAACTGGGTCATCAGGAGTTGCCGATCTATGAGAATCCAAAGAATATACCGGGCTTCTTTACGCCCACCTGTGCGCTGGCGCACTGCCGCAAGCGGCGCAGCATTGACAACGATTTGCGTACCTATCGGTATCCACGCAGCGAGGAGCTGCTCGAGAAGTGGCGCGTCAATCTACGCTTGTCGCCGGATCAATGCCGCGGACGAATCTGTGCGGATCATTTCGAGCCGCTGGTGCGCGgcaagctgaagctgaagacGGGAGCAGTGCCAACGCTCAAATTGGGACACGACGAGGGCGTGGTCTTTGATAACGAAGGCATTAAGGCGGGTCTGCAGCAGGAGGACGAGGCGGAGGAAGAAGAGGGCGATGCCAGCTTAAAGTCGTTGGTCAAAGTCAAGACTGAACAGGAGGATGAACAGGAGCTAGAGAATGAAGATGaagagcagcaagagcaggaGCAAGATCTTGAGCAGGAGCACGATCAAAATATGGGCGAGGATGAGGAAGGGCATCGGGACTCTGAGGAACATGGCTATTTTGATCCCTTGGAACTTGTGGAAACCTACGCTGAGCACCACAGCGATGATACCTCTGCCGGACATGATAAtctcgatgatgatgaggatgatgatgaagacATTCCCGGCAATGACGATGAGCTGCTTCTGCCAGATACGCGGCCACTTCGAATGACAATGGCTCCGCGGCGCGAGAAGGCTGTGAATAATGTGACGCCCATTTGCTGTCTGAAGCACTGTCGCAAGGAGCGCACCGCCATCCATCATCTGAGCACCTTTGGCTTTCCCAAGGATCCACAGCTGCTTCTCAAGTGGAGCGCCAATCTGCAGCTGCCGTTGGAGTCCTGCATGGGTCGTGTATGCGTCGAGCACTTTGAGCCCTCTATGTTGGGCACCCGCAAGCTGAAGCAGAATGCTGTGCCCACCTTGAAACTGGGCCATGCCACACCGCTCACCTACAGCTGCAATGGCCGGATGCTGTCGGGCATCTATGATGAACAGCCGCAACATTCGGTTTTTCGGCTTTGGAGCCTGAAACACTGCCGAAAACGGAAACCGGATCTGGCGGAGATTAAGCCCGGTCGTCGTTGTTGCCTGCCTAGTTGCGGCAAGCTGTCGGAGTTGCATGGCGTTCAGCTTCAGCGTCTGCCCAAGGatcgtctgctgctgcgcaaATGGTTGCACAACCTGAAGCTGCCTCCTACAATGGACTGCACTCAAATGTTTCTCTGCAGCGATCACTTTGAGCTGAATGCGCCGTGCCCCACTTTGAAACTGGGCCACTCGGATACCAATATTTATCGCCACAATGTGGCTAGCACCAGTGGCACCAGTGGCTGTCTGGTGCCCAAATGTACTTGTGCTCGTCTCAATCTCTATCGCGGCTATGATCTGCCCGCGCATCCGCAGGTGCAACAGGCCTGGCTGCACTGGTTGGAGCTGCCCCATCCTCAGCAGTCGCCCCGGCATGCCCAGCTGTGTGTGATGCACTTTATGCAGCTCTACGAACTGGTGCCGCTGCCCGAGTCGGTGCCAGATGTTGTGCGTCGCCAGCTGCGTGAGACTTACGAACTGATATCCAGCTCCAGCATGGCCATGAAGCTACGTTGTGCTGTGCCCGGCTGCTACTCGAAGTATACGGACAATGTGCGTCTGACCAAGCTGCCCGTTTACCCCGACACCTGCGCCAAGTGGGTGCACAACACCAAGATTGAATACGATCCGGCCCGTCATTATGTCTATCGCATCTGCATGTTGCATTTTGAGCCAGGCTGCCTGGGCCCAGTGCGCCCCAAAGTGTGGGCAATGCcaacgctgcagctgcaccacGAGGAtgccaacatttatttgaatccTAAGCTGGATGGGAGCCAAACACAACCCGCCGTGCCGTTGGAGCTGCCGCTGCGTATTAAAACTGAGCTGCCGATGTGCAACAGTCCCAGCTttagtgcgagtgcgagtccCAGTCCGCGTGGCAAGCTGCGCATCTGCTGTATTCCCAGCTGCGGTCAGCAGGGTTCCGCCCTGACGCGTCTCTTTCGCTTTCCCAGCGCGGAGACGTCGATGCTAAAGTGGCTGGTgaacacacagcagcagccgcgcTTTGTCGATGCACAACGGCTGTTCGTCTGCCAGGATCACTTCGAGGCGGAGGCCATTTGCAAGAATCAGCTGCGCAGCTGGGCGGTGCCCACGCTGAATCTAGGACACGATGGACACATCATCCCGAATGCCAAGCACAATGGCAACATTGCCGACAGCCAGGAGAACAAGCAGACGCTGCAGTTCATCTGGGCCAACTACTGCTCGGTGCTGACCTGCTTCCAGCAAAGTAGCGAGCAGCTGCGTCTCTACCAATATCCCACGGATCGGCCAACCATTCGCAAGTGGGCCGCCAATTGTAAGCATCGCTCCATGCAGGCCAGCAGCGATGGATTTCAGGTGTGCCAGTCGCATTTTGCGCCGGATTGCTTTGATCCTGATACCGGGGAGCTGAAGGAGGACGCTGTGCCCACTCTGGCGCTGAGCCGGGCTGTAACTGAGGTGCGCTGTGTGGTCAATGGTTGCGTTAAGGACGAAGATGCATCGCGTCGCCGTCTGTTCAAGATGCCCAAGCGTTCCCCACAGATATTGGATTGGTGCCATAATTTGCGCCTGGATCAGGCGGCCACGAGCGGCTCGGAACAGCACGTTTGTGAACGTCACTTCGAGTCAAACTGCTTTAATGCGTCTCGAGTGCTGCGTCCTGGAGCACGACCCACACTTCATTTAGGTTACGAGGACCTAGACGATGTGATACCCAATCCGGCGAACTGGGAAGAGGATGTGATCGTGTGCTGTGTGCCCCACTGCGCGAGCTCCAAGGATGCGGATGAGGTTCAACTATTTGGGCTGCCAAAGGTGCGCCCGTTGGCGGACAAGTGGCTGCAAAATGTGCGCCTTGATCCGAGCAAAGAACAACTGGCCAGCTTGAAGATCTGCAGTGTGCATTTTGAGGCTAGCTGCTTGGAGAATGGACGACCCACCTATGGTGCAATGCCCACACTCCATCTGGGTCACGATGAGCTCGACAATATACACCCAAGCGTAGAGTCGGTGCCGACGCAGCAGAAGCGCTACTGCAATAGAGACGGCGCCAGGCACGACTGCTGCTATCCGCAATGCGTGGAGCTGCAGAAGAGCTATCTGCGGGTCACCTACGAGCTGCCCCAGGAGCAGGAGCTCCGTCAGCAGTGGCTCTCTTATATGGACCTGGAGGCGCCGCAGCTCGATAAGGAGCAGCTGCCCAAGCTCTGCCCACTCCACCTAATCTTGCTCTACGATCATAGTGCGGATCACTTTTCAGCACACGTCGCTGAGGAGCTGCTGGACTCCAATTATGAGGCAGCGCGTAGCAGCGTTCGCATACGCGTTGTCAGCTGTGCGGTGCGTGGCTGCAGAACACTCAAGCCACGCGACGGCGGACGGCTGCATGGTTTGCCCACCCGTCGAGATGTGCTGGAGATGTGGCTGCACAATATGCAGCTGGTGTTTTACGAGCAACAGCGTTATATGTACAAGATATGCAGCAAGCACTTTGAGCCCAGATGCTTCACGGAGACAACCAAGCGCTTGAAGCCGTGGAGCATGCCTACGCTGGAGTTGCCGGAGCTTCAACCGGGCGAGATGCCAGCCTATCAGAATCCCACAGAATTGGAGTGGCAACACATGAATGAGCTGCAGGTGAGCGAGAAAGTTGTTGAGGCTCAGCCGGAGCCATTGCCCAAGCTGGAGCCGTTGCCCAAGAAGGAGCCACCAGCACCGCAGGTTATGGAATATGAAGAGGATTGCGACAATAACTCACAGCAGCCTTTGGAAATGCAGGCGCTGGAGGTGCTGCTCGAGGTGGGTCATGTCGAGAAGTGTACCACCTATGAGCAAATGGATACCGAGGCAAATCTCAGCTATGCCGAGCAGTTCTCGCACAATCCCCTCAGTCCAGGTCCACCTCAATGCCGTATCCCTGTTGTCCAGAATGGACTCCACTACAGCGCACGCCACTGCAGCGTGCATGGCTGCAATGTCACCTCGAATAAtctgagcagcagcatcaagcTGCACAAGTTTCCCGTCTCGCTGGATGCCATGCAAAAGTGGATGCACAACACCCAGGTGCTCGTGGATGTCAAATTCGCTTGGCGCTTTCGCATCTGCAGTCATCATTTCATCGAGGATTGCTTTCACGGCTCGCGCATCAGACGTGGAGCGATGCCCACGTTGCGACTGGGCTCACGTCGACCGAAGCATATCTATGATAATGAGTTCAACGCCATACTGCAAGTGGAACAGACTAAAGAAGAGACCAGGCAGTCGCTCGCTACTCCGCTGGAGTctcagcaacagttgctctcTGCGAATGTAGGTCTTCGCCTGCCACGCCCTGCACCGCCTTGCAAATCCAGCAAATACTGTCAGATCGAGGGCTGCTCCAATCATTTGACCAGCGAGAATCTAACGCTGCACAAGTTCCCACATTCGTCGGACATGTGCGCCAAGTGGCAGCACAACACTCAGGTGCCCTTCGATCCCGAGTTCCGCTGGCGCTATCGCATCTGCAGCGCACACTTTGAGCCCATCTGTCTAGGCAATGTGCGACTGATGCACGGCAGTGTGCCCACCCTGAATCTGGGACCGCTTGCACCCAAGAAACTGTTTGATAACGAATTCTTGCGTCTGGACAAGCCAATGAGCAGCTCGGAGCTGGGCATGACAGTCAAACAGGAACGAATGGAGCAATTTGATCAATTGGAGCTGGAAGATGGCAACCAGGAGCAGGATGATTTCAGTCTGCTGGAGCCCGAGCTGGAGTTGCACGAGGGTAGCGAGGATGAGCAACAATATGACAATCATTTCAGCCAAAACGATTCCTATAACTGGTCCGATCAGCAACTGCGTCTGTCAAGCAATAATCAGGAGAAGTGCACCATCAGCTACAATCCGGTCAAGTCCGGCTATGATAAGTGCTCACTGGTCCACTGCCAACGACAACGTTCCCAGCACGGCGTGCACATCTACAAGTTTCCGCGCTCGCGTCAGTTGCAACAGCGATGGATGCATAATTTGCGTATCCATTACGATGAGCGACGGCCGTGGAAGACAATGATATGTAGTGTCCATTTCGAACCGCACTGCATCCGTCTGCGCAAGTTGCGTCCCTGGGCGGTGCCCACGCTGGAACTGGGGGACAATGTGCCGCTGGAGATCTTTACGAATGAGCAGAGTCAGCAGCTGTTTACTCAGTCCGAAACAGGCAGCGAGTGTGATGAGGTTGAAGTGGATGTTGAGGACACCATATTGGAGGACTTGGATGATGACTATGATGACAATGATGCTGATGTGAATGTAGATGCTGATCATCAAATGCGGACGGCTCCGTATGTGAAAAGGGACCGTCGCTCTCGATTTGATCCTCTGCCGCCGGGTCAGCTGCCACCGTGGAAGATCaaatgctgctgtttgccCTATTGCCGCAATCCCCGCGGTGATGGCATCAAGCTCTTTCGACTGCCCAACAACATTAGCTCCATACGCAAATGGGAGCAGGCCACAGGCATGCGCTTCTATGAGTCGCAGCGCAACACAAAGCTCATCTGCAGTCGGCACTTTGATCCACAGCTGGTAGGCGTGCGTCGTCTCATGTGCAATGCGGTGCCCAGCCTCCATTTGGGCCCAGACAGCGCAGAGCCCGAGCAGACTCCAGTGGGACCACGTTGCTGCATGCCCGATTGCTCTGAGGATATCAATGTCCAGCTGCACAAGTTTCCCAGGGATCCAATGCTGATGCATCAATGGTGTCAGGCGCTCAATCTACCGGATGTTCAAAGTTACTCTGGCAAATTCATTTGTGCCGCACATCTGCCCGCCAACGCGATGAGCTGTCTAATTTGTGGCGTGGACGATGTCCAGCTGCCAATGCTGGACTTTCCCCAGAATCGCAATCAGCGCACAAAGTGGTGTTACAATCTGAAAATCGAGCCTCTGCCCAAGTGGGACAACTTTAAGAAAATTtgctgcaaacattttgagaGCTACTGCTTTATCCAGCCGGGGCAACTTCTGGCGGAGGCAATGCCCACGCTACACTTGGAGCATGAGGATAGCAACATATTCCTAAACGATGATGCCATTGATAATAGCAAGTTGTTGCGCATCAAGGACGAGCCCATGGAGAGCGAGGATCTGATGCTGTAA
Protein Sequence: MSQQQHNPPPHHQHQHHYYQQQQQQQQHQHHLQQQQHLQHKQIQQQHSWYSHVASYPPPHAAAFASPCKSSSSNTSNNNNNNNHIMNAYGTGAGAYYGSTGAGGVGVGYNLEANTVAYAHNQLLQYQQQQQQQQQQQHQQQQHQQQLNQRSYMPPHIMHSSYPYIKSEPLEPLPERHQQQQQQQLFQNPMAPPPAPAIANRHSLDASGEMIIKSEPIDEHAFKSNYIDDNTPFADFSKYPEFGDDMLSPKLELNVKDEAYGNQKNPLNYPRRKLQTDRSAESMPICQRCKEVFFKKHIYLRHVAESSCSIHEYEFKCNICPMSFMGAEELQKHKHLHRTDKFFCHKYCGKHYDSIAECESHEYMEHEYDSFVCNMCSVTFPTREQLYAHLPQHKFQQRYDCPICRLWYQTALELHEHRLAAPYFCGKYYAAAHQQQPHQQQQQQHQHTQQHQQQGNYKLQDCHMGTIEMTPPQHKAHAALPATAALNSLLQQRQANADGAALYASALKSETNVKLERSYSNSTSESGYSMHESSYNNAYASDNSLHGGGGAIGGPQAHSSTLDDSEDALCCVPLCGVRKSTSPTLQFFTFPKDDKYLHQWLHNLKMFHIPASSYASFRICSMHFPKRCINRYSLCYWAVPTFNLGHDDVANLYQNRELTNTFTTGEVARCSMPNCTSQRGESNLKFYNFPKDIKSLIKWCQNARLPVQAKEPRHFCSRHFEERCIGKFRLKPWAVPTLHLGAQYGKIHDNPKNLYVEEKRCCLNFCRRSRSSDFNMSLYRFPRDEVLLRRWCYNLRLDPAVYRGKNHKICSAHFIKEALGLRKLSPGAVPTLHLGHNDTFNIYENELWPPPTPSTPTHNHQQQLQQHQLQQQPQQVHHKYQRHSAASTSSSASSTSHYVDPELSASYMSMGAGGSSSGLNVSDSMDVCCVPSCESKRHNNENITFHTIPRRPEQMRKWCHNLKIPEDKMHKGMRICSLHFEPYCIGGCMRPFAVPTLHLGHDDEDIHRNPDVIKKLNIRETCCVAVCKRNRDRDHANLHRFPSNVPLLTKWCANLQRPVPDGSKLFNDAICEVHFEDRCLRNKRLEKWAVPTLTLGHENIPYPLPTSEQVAEFYARPSAPNNGEEQGECCVETCKRNPSVDDIKLYRPPEESQVLAKWAHNLQLEIAQLPNMRICNLHFESHCIGKRMRPWAVPTLNLATNIENLYENPEHQMLYKRRTHLKPGRAVRGSEASAGGVQPTWVPRCCLPHCRKVRATHNVQLYRFPKLNRSTLAKWAHNLQVPPVGSAQRRLCSAHFEPHVLSKKCPVPMAVPTLDLNTPSGYKIYQNPAKLKANKLCLQRVCIVESCRRQRAQGVQLFRLPHSPTQLRKWMHNIRMRPRGAMRQQYRICSQHFETHSFNGKRLSAGAIPTLELGHEDEDIFPNEAQSFVEEHCTVEGCGAIKELPDVRLFRFPNDDEDLLWKWCNNLKISPVDCIGVRICNRHFEADCIGPKHLFKWAIPTLSLGHDDDIELMLNPKPEERYIDPVFKCCLPSCGKTRKFDEVQMNSFPKDPELFQRWRHNLRLEHLNFKERERYKICNAHFEDICIGKTRLNIGSVPTLELGHDETDDLFQVNPEELQSNLFGRQRRVQDSMRINIKQEAHSDLDEDIKPDINMSAATDSSTTQVKIKKSLTDFKCCVQSCGRSRLEQGARLFPFPNGKQQQSKWRHNLRLPAADVDKTTRICSAHFNRRCIDGNQLRGWAMPTQQLGHQELPIYENPKNIPGFFTPTCALAHCRKRRSIDNDLRTYRYPRSEELLEKWRVNLRLSPDQCRGRICADHFEPLVRGKLKLKTGAVPTLKLGHDEGVVFDNEGIKAGLQQEDEAEEEEGDASLKSLVKVKTEQEDEQELENEDEEQQEQEQDLEQEHDQNMGEDEEGHRDSEEHGYFDPLELVETYAEHHSDDTSAGHDNLDDDEDDDEDIPGNDDELLLPDTRPLRMTMAPRREKAVNNVTPICCLKHCRKERTAIHHLSTFGFPKDPQLLLKWSANLQLPLESCMGRVCVEHFEPSMLGTRKLKQNAVPTLKLGHATPLTYSCNGRMLSGIYDEQPQHSVFRLWSLKHCRKRKPDLAEIKPGRRCCLPSCGKLSELHGVQLQRLPKDRLLLRKWLHNLKLPPTMDCTQMFLCSDHFELNAPCPTLKLGHSDTNIYRHNVASTSGTSGCLVPKCTCARLNLYRGYDLPAHPQVQQAWLHWLELPHPQQSPRHAQLCVMHFMQLYELVPLPESVPDVVRRQLRETYELISSSSMAMKLRCAVPGCYSKYTDNVRLTKLPVYPDTCAKWVHNTKIEYDPARHYVYRICMLHFEPGCLGPVRPKVWAMPTLQLHHEDANIYLNPKLDGSQTQPAVPLELPLRIKTELPMCNSPSFSASASPSPRGKLRICCIPSCGQQGSALTRLFRFPSAETSMLKWLVNTQQQPRFVDAQRLFVCQDHFEAEAICKNQLRSWAVPTLNLGHDGHIIPNAKHNGNIADSQENKQTLQFIWANYCSVLTCFQQSSEQLRLYQYPTDRPTIRKWAANCKHRSMQASSDGFQVCQSHFAPDCFDPDTGELKEDAVPTLALSRAVTEVRCVVNGCVKDEDASRRRLFKMPKRSPQILDWCHNLRLDQAATSGSEQHVCERHFESNCFNASRVLRPGARPTLHLGYEDLDDVIPNPANWEEDVIVCCVPHCASSKDADEVQLFGLPKVRPLADKWLQNVRLDPSKEQLASLKICSVHFEASCLENGRPTYGAMPTLHLGHDELDNIHPSVESVPTQQKRYCNRDGARHDCCYPQCVELQKSYLRVTYELPQEQELRQQWLSYMDLEAPQLDKEQLPKLCPLHLILLYDHSADHFSAHVAEELLDSNYEAARSSVRIRVVSCAVRGCRTLKPRDGGRLHGLPTRRDVLEMWLHNMQLVFYEQQRYMYKICSKHFEPRCFTETTKRLKPWSMPTLELPELQPGEMPAYQNPTELEWQHMNELQVSEKVVEAQPEPLPKLEPLPKKEPPAPQVMEYEEDCDNNSQQPLEMQALEVLLEVGHVEKCTTYEQMDTEANLSYAEQFSHNPLSPGPPQCRIPVVQNGLHYSARHCSVHGCNVTSNNLSSSIKLHKFPVSLDAMQKWMHNTQVLVDVKFAWRFRICSHHFIEDCFHGSRIRRGAMPTLRLGSRRPKHIYDNEFNAILQVEQTKEETRQSLATPLESQQQLLSANVGLRLPRPAPPCKSSKYCQIEGCSNHLTSENLTLHKFPHSSDMCAKWQHNTQVPFDPEFRWRYRICSAHFEPICLGNVRLMHGSVPTLNLGPLAPKKLFDNEFLRLDKPMSSSELGMTVKQERMEQFDQLELEDGNQEQDDFSLLEPELELHEGSEDEQQYDNHFSQNDSYNWSDQQLRLSSNNQEKCTISYNPVKSGYDKCSLVHCQRQRSQHGVHIYKFPRSRQLQQRWMHNLRIHYDERRPWKTMICSVHFEPHCIRLRKLRPWAVPTLELGDNVPLEIFTNEQSQQLFTQSETGSECDEVEVDVEDTILEDLDDDYDDNDADVNVDADHQMRTAPYVKRDRRSRFDPLPPGQLPPWKIKCCCLPYCRNPRGDGIKLFRLPNNISSIRKWEQATGMRFYESQRNTKLICSRHFDPQLVGVRRLMCNAVPSLHLGPDSAEPEQTPVGPRCCMPDCSEDINVQLHKFPRDPMLMHQWCQALNLPDVQSYSGKFICAAHLPANAMSCLICGVDDVQLPMLDFPQNRNQRTKWCYNLKIEPLPKWDNFKKICCKHFESYCFIQPGQLLAEAMPTLHLEHEDSNIFLNDDAIDNSKLLRIKDEPMESEDLML

Similar Transcription Factors

Sequence clustering based on sequence similarity using MMseqs2

100% Identity: iTF_00595971;
90% Identity: iTF_00500343;
80% Identity: -