Basic Information

Insect: Drosophila helvetica
Gene Symbol: -
Assembly: GCA_963969585.1
Location: OZ018402.1:58415814-58428092[+]

Transcription Factor Domain

TF Family: THAP
Domain: THAP domain
PFAM: PF05485
TF Group: Zinc-Coordinating Group
Description: The THAP domain is a putative DNA-binding domain (DBD) and probably also binds a zinc ion. It features the conserved C2CH architecture (consensus sequence: Cys - 2-4 residues - Cys - 35-50 residues - Cys - 2 residues - His). Other universal features include the location of the domain at the N-termini of proteins, its size of about 90 residues, a C-terminal AVPTIF box and several other conserved residues. Orthologues of the human THAP domain have been identified in other vertebrates and probably worms and flies, but not in other eukaryotes or any prokaryotes [1].
Hmmscan Out: # of c-Evalue i-Evalue score bias hmm coord from hmm coord to ali coord from ali coord to env coord from env coord to acc

1 29 9.3 1.6e+04 -2.9 3.1 44 62 134 155 119 170 0.56

2 29 8.6e-15 1.5e-11 45.3 3.5 1 86 362 434 362 435 0.85

3 29 1.9e-14 3.3e-11 44.2 4.8 1 87 462 531 462 531 0.82

4 29 1.6e-15 2.8e-12 47.7 0.2 1 87 553 625 553 625 0.85

5 29 9.5e-16 1.7e-12 48.4 5.5 1 87 736 806 736 806 0.82

6 29 8.7e-15 1.5e-11 45.3 3.2 1 86 830 901 830 902 0.82

7 29 7.6e-13 1.3e-09 39.1 0.6 1 87 937 1005 937 1005 0.81

8 29 3e-11 5.3e-08 33.9 2.0 1 86 1044 1113 1044 1114 0.77

9 29 6.8e-17 1.2e-13 52.1 0.4 1 86 1141 1210 1141 1211 0.82

10 29 5.8e-13 1e-09 39.4 1.3 1 86 1232 1301 1232 1302 0.79

11 29 9.4e-14 1.6e-10 42.0 1.0 1 86 1329 1400 1329 1401 0.85

12 29 1.7e-12 3e-09 38.0 2.3 1 85 1468 1536 1468 1538 0.82

13 29 4.1e-12 7.2e-09 36.7 0.0 1 86 1561 1629 1561 1630 0.82

14 29 2e-13 3.5e-10 40.9 1.8 1 87 1810 1879 1810 1879 0.78

15 29 1.7e-10 3.1e-07 31.5 0.0 1 86 1968 2038 1968 2039 0.78

16 29 0.0018 3.1 9.0 0.0 1 58 2058 2102 2058 2118 0.80

17 29 1.6e-12 2.8e-09 38.0 0.2 1 86 2138 2207 2138 2208 0.81

18 29 2.8e-13 4.9e-10 40.5 0.0 1 86 2294 2363 2294 2364 0.81

19 29 7.7e-10 1.4e-06 29.4 0.3 1 85 2399 2469 2399 2471 0.79

20 29 4.5e-12 7.8e-09 36.6 0.7 1 87 2485 2555 2485 2555 0.80

21 29 9.7e-18 1.7e-14 54.8 0.9 1 86 2580 2656 2580 2657 0.84

22 29 0.002 3.5 8.9 0.2 1 58 2684 2739 2684 2757 0.75

23 29 2e-11 3.5e-08 34.5 0.4 1 87 2777 2849 2777 2849 0.79

24 29 4.2e-13 7.4e-10 39.9 0.1 1 86 2981 3051 2981 3052 0.78

25 29 2.9e-12 5.1e-09 37.2 4.2 1 86 3107 3177 3107 3178 0.81

26 29 2.7e-14 4.7e-11 43.7 5.5 1 86 3304 3374 3304 3375 0.84

27 29 4.2e-12 7.3e-09 36.7 0.2 1 86 3471 3540 3471 3541 0.84

28 29 2.6e-09 4.6e-06 27.7 0.8 1 58 3561 3610 3561 3625 0.86

29 29 1.7e-09 2.9e-06 28.4 0.8 18 87 3629 3687 3617 3687 0.74

#	of	c-Evalue	i-Evalue	score	bias	hmm coord from	hmm coord to	ali coord from	ali coord to	env coord from	env coord to	acc
1	29	9.3	1.6e+04	-2.9	3.1	44	62	134	155	119	170	0.56
2	29	8.6e-15	1.5e-11	45.3	3.5	1	86	362	434	362	435	0.85
3	29	1.9e-14	3.3e-11	44.2	4.8	1	87	462	531	462	531	0.82
4	29	1.6e-15	2.8e-12	47.7	0.2	1	87	553	625	553	625	0.85
5	29	9.5e-16	1.7e-12	48.4	5.5	1	87	736	806	736	806	0.82
6	29	8.7e-15	1.5e-11	45.3	3.2	1	86	830	901	830	902	0.82
7	29	7.6e-13	1.3e-09	39.1	0.6	1	87	937	1005	937	1005	0.81
8	29	3e-11	5.3e-08	33.9	2.0	1	86	1044	1113	1044	1114	0.77
9	29	6.8e-17	1.2e-13	52.1	0.4	1	86	1141	1210	1141	1211	0.82
10	29	5.8e-13	1e-09	39.4	1.3	1	86	1232	1301	1232	1302	0.79
11	29	9.4e-14	1.6e-10	42.0	1.0	1	86	1329	1400	1329	1401	0.85
12	29	1.7e-12	3e-09	38.0	2.3	1	85	1468	1536	1468	1538	0.82
13	29	4.1e-12	7.2e-09	36.7	0.0	1	86	1561	1629	1561	1630	0.82
14	29	2e-13	3.5e-10	40.9	1.8	1	87	1810	1879	1810	1879	0.78
15	29	1.7e-10	3.1e-07	31.5	0.0	1	86	1968	2038	1968	2039	0.78
16	29	0.0018	3.1	9.0	0.0	1	58	2058	2102	2058	2118	0.80
17	29	1.6e-12	2.8e-09	38.0	0.2	1	86	2138	2207	2138	2208	0.81
18	29	2.8e-13	4.9e-10	40.5	0.0	1	86	2294	2363	2294	2364	0.81
19	29	7.7e-10	1.4e-06	29.4	0.3	1	85	2399	2469	2399	2471	0.79
20	29	4.5e-12	7.8e-09	36.6	0.7	1	87	2485	2555	2485	2555	0.80
21	29	9.7e-18	1.7e-14	54.8	0.9	1	86	2580	2656	2580	2657	0.84
22	29	0.002	3.5	8.9	0.2	1	58	2684	2739	2684	2757	0.75
23	29	2e-11	3.5e-08	34.5	0.4	1	87	2777	2849	2777	2849	0.79
24	29	4.2e-13	7.4e-10	39.9	0.1	1	86	2981	3051	2981	3052	0.78
25	29	2.9e-12	5.1e-09	37.2	4.2	1	86	3107	3177	3107	3178	0.81
26	29	2.7e-14	4.7e-11	43.7	5.5	1	86	3304	3374	3304	3375	0.84
27	29	4.2e-12	7.3e-09	36.7	0.2	1	86	3471	3540	3471	3541	0.84
28	29	2.6e-09	4.6e-06	27.7	0.8	1	58	3561	3610	3561	3625	0.86
29	29	1.7e-09	2.9e-06	28.4	0.8	18	87	3629	3687	3617	3687	0.74

Sequence Information

Coding Sequence: ATGGACGAACATCCCTACAAGTCCAACTATATTGATGACAATACGCCCTTTGCTGATTTCAACAAGTTCAACGAATTCAGCGGCGATATGCTAAGCCCCAAAGTGGAGCTAACCGTCAAGGATGAGACCTACGGAAAGactcccagcagcagcagcagctttgcACGCCGCaaagcccagcagcagcagcagcagccgcagccacagcagcagacgACAGATCGCTCGGCGGAGAGTCTGCCCATCTGCCAGCGCTGCAAGGAAGTGTTCTTCAAGAAGCAATCCTATCTGCGGCATGTGGCCGAGAGCAGTTGCGGCATCCAGGAGTACGATTTCAAGTGCAACATTTGCCCCATGTCCTTCATGACAACCGAAGAGCTGCAGCGGCACAAGCACCTGCATCGGGCGGACAAGTTCTTTTGCCACAAATACTGCGGCAAGCATTTCGATACGATAGCCGAGTGCGAGTCGCACGAGTACATGCAGCACGAGTATGAGAGTTTTGTTTGTAATATGTGCTCGGGAACCTTTGCCACGCGGGAGCAGCTGTATGCCCACCTGCCGCAGCACAAGTTCCAGCAGCGTTACGACTGCCCCATTTGCCGATTGTGGTATCAGACGGCCCTCGAATTGCACGAGCATCGACTGGCGGCCCCGTACTTTTGCGGCAAGTActatcagcagcagcagcagcagctggcgaCCAATCAGGGGAACTACAAGCTGCAGGACTGCCATATGGCCACCATGGAAATGCCCACAGCACCACTCCATAAGGCAACGCCTGCCAATGCCTCAGCCCTGCCAGCCACAGCCGCTTTGAGCTCGCTGTTGCAGCAGCGCCAGGCCAATGCCGATGGGGCagcggccatgtttgccgccTCCACTTCCGCCTCGCTGAAGAGCGAGGTGAGCGTGAAGCTGGAGCGCAGCTACAGCAACTCCACCAGCGAGTCCTCGTACAGCCACCAGGACAACAGCAGCTACAACAATGCCTACGGCAGCGACAGCTCCATCCACGGCGGAGCCCTGGCCGGACCGCAGGCGCACTCCTCCACGCTGGACGACTCCGAGGACGCACTGTGCTGTGTGCCGCTGTGCGGCGTCAGGAAGAGCACCAGTCCCACGCTGCAGTTCTTCACGTTCCCCAAGGACGACAAGTATCTGAACCAGTGGCTGCACAACCTCAAGATGTTCCACATACCAGCCGCCAGCTATGCGACATTCCGCATCTGCAGCATGCACTTCCCGAAGCGCTGCATCAATCGGTATTCGCTGTGCTATTGGGCGGTGCCCACCTTCAACCTGGGCCACGACGATGTGGCCAATCTGTACCAGAACCGGGAGCTGACCAACACCTTTACCACCGGCGAGGTGGCACGCTGCAGCATGCCGCACTGCACCAGCCAGCGGGGCGAGAGCAATCTGAAGTTCTACAATTTCCCGAAGGACATCAAGAGCCTGATCAAGTGGTGCCAGAATGCCCGCCTGCCCGTGCAGGCCAAGGAGCCGCGTCACTTTTGCAGCCGCCACTTTGAGGATCGCTGCATCGGCAAGTTCCGACTGAAGCCCTGGGCCGTGCCCACCCTCCATCTGGGGGCGCAGTACGGCAAGATCCATGACAATCCCAAGAACCTGTATGTGGAGGAGAAGCGCTGCTGCCTGAACTTTTGTCGTCGCAGCCGCTCCTCGGACTTCAACATGTCGCTGTATCGATTCCCCCGCGACGAGGTGCTCCTGCGACGCTGGTGCTACAACTTGAGGCTGGATCCGGGCGTGTATCGCGGCAAGAATCACAAAATATGCAGTGCGCATTTCATCAAGGAGGCCCTGGGTCTCAGAAAGCTATCGCCAGGGGCCGTTCCCACACTGCATTTGGGCCACAATGACACCTTTAATATCTACGAGAACGAGCTGTGGCCGCCGCCATCGCCCACTGGACAACATGGCGGCAGCCATCAGcttctccagcagcagcagcatcatacgtcgcagcagcagctgtcgcATCATCACTcctcgctgcagcagcagcatcagtcGATGCCTAGCAAATCCTATCAACGCCATTCGGCGGCCTCCACTTCCTCCTCGGCCAGTTCGGCCTCGCATTACGTGGACCCCGAGATGAGTGGCTCCTACTTAAGCCTGACTGCGGGCGGCTCCTCGGGCGGCGGGATGAATGCCAGCGACTGCATGGACGTGTGCTGTGTGCCCAGCTGCGAGAGCAAGCGGCACAACAGCGAGAACATCACATTCCACACGATACCGCGCCGGCCGGAGCAGATGCGCAAGTGGTGCCACAACCTGAAGATACCCGAGGACAAGATGCACAAGGGCATGCGGATCTGCAGCCTGCACTTTGAGCCCTACTGCATTGGCGGCTGCATGCGTCCCTTTGCCGTGCCCACGCTCCACTTGGGGCACGACGACGAGGACATACACCGCAATCCGGACGTGATCAAGAAGCTGAACATCCGCGAGACCTGCTGTGTGGCCGTCTGCAAGCGGAATCGCGACAGAGACCACGCCAATCTCCACCGGTTCCCCAGCAACGTGGCGCTGCTCACCAAGTGGTGTGCGAATCTGCAGCGGTCCGTGCCCGATGGCAGCAAACTGTTCAACGATGCCATCTGCGAGGTGCACTTTGAGGATCGCTGTCTGCGCAACAAGCGGCTGGAGAAGTGGGCGGTGCCCACACTGatcctcggccacgaggacaTTGCCTATCAGCTGCCCACGCCCGAGCAGGTGGCCGAGTTCTATGCCCGGCCCACGGCCCCCAACAATGGCGAGGAGCAGGGCGAGTGCTGTGTGGAGACGTGCAAGCGGAACCCGAGCGTGGACGACATCAAGCTGTATCGTCCGCCGGAGGATGCCTCGGTGCTGGCCAAATGGGCGCACAATCTGCAGACGGAGGCCGCTCTCCTCATCAACATGCGGATATGCAATCTGCACTTTGAGGCCCACTGCATTGGCAAGCGGATGCGTCCGTGGGCCGTACCCACGCTCAATCTGGCCGGCAACATTGAGAATCTGTACGAGAATCCGGAGCACTCGATGCTGTACAAGCGCAGGACGCACCTCAAGCAGAAGGTGCCGGTGACGAAGCCCACGTGGGTGCCGCGCTGCTGTCTGCCGCACTGCCGCAAGGTGCGCGCCCTGCACAATGTCCAGCTGTATCGCTTCCCCAAGCTGAATCGCTCCACGCTGGCCAAGTGGGCGCACAATCTGCAGGTGCCGCAGGTGGGCAGTGCCCAGCGGCGGGTCTGTTCCGCCCACTTTGAGCCGCATGTCCTCAGCAAAAAGTGCCCGGTGCCGCTGGCGGTGCCCACACTGGACCTGAACTCGCCCGCCGGCCACAAGATCTACCAGAATCCGGCCAAGCTGAAGGCCAACAAGCTGTGCCTGCAGCGCGTCTGCATTGTGGAGAGCTGCCGGAAGACCCGGGCCCAGGGCGTGCAGCTCTTCCGCCTGCCCCACAGCCCCACGCAGCTGAGGAAGTGGATGCACAACATACGGACCCGGCCGAGGGCGGCCATGAGGAGCCAGTATCGCGTCTGTTCGCGACACTTTGAGACGCACTCCTTCAACGGACGCAGGCTGAGCGCCGGGGCCATTCCCACCTTGGAGCTGGGCCACGAGGATGACGACATCTTCCCGAATGAGGCGCAGGCCTTTGCGGACGAGCACTGCGCCGTGGAGGGCTGTGAATCGTCGAAGGAGCAGCCGGAGGTGCGGCTCTTCCGCTTCCCCACGGACGACGACGACATGCTGTGGAAGTGGTGCAACAATCTGAAGATGAATCCCGTCGACTGCATCGGCGTGCGGATCTGCAACAAGCATTTCGATGCCGACTGCATTGGCCCCAAGCATCTCTACAAATGGGCCATACCCACGATGCAGCTCGGCCACGACGACTCCCAGATCGAGCTGATACTCAACCCCAAGCCGGAGGAGCGCTATGTGGATCCCGTGTTCAAGTGCATTGTGCCCACCTGCGGCAAGACGCGTCGCTTCGATGAGGTGCAGATGAACAGCTTCCCCAAGGATGCGGATCTCTTCCAGCGCTGGCGCCACAACCTGCGCCTGGAGCATCTGTGCTTCCAGGAGCGCGAGAAGTACAAGATCTGCAATGCCCACTTCGAGGACATGTGCATTGGCAAGACGCGTCTCAACATCGGCTCGATACCCACGCTGGAGCTGGGCCACGACGAGACGGAGGATCTGTTCAAGGTGAATCCCGAGGAGCTGCAGAGCAATCTGTTTGGGCGTCCCCGGCGGCTGCTCAGAGGATTCAACAATGTGGCCATCAAGCAGGAGGTGCCCGAGGCGGAGGAGCAGGACACAAAGCCCGATATTACACAGGTGAAGGTCAAGAGATCTCTGGGCGATATCAAGTGCTGTGTGCAGACGTGCGGACGCAGTCGCCTGGAGCATGGGGCACGGCTCTTTCCCTTTCCCACGggcaagcagcagcacctcAAGTGGCGGCACAATCTGCGCCTGGAGCCCGACGAGGTGGACAAGACCACGCGCGTCTGCAGCGCACACTTCAACAGGCGCTGCATCGACGGCAAGCATCTCAGGGGCTGGGCCATGCCCACACAGCAGCTGGGCCACCAGGAGCAGCCCATCTACGAGAATCCCAAGAATATACCCGGCTTCTTTACGCCCACCTGTGCGCTGGGGCACTGCCGCAAGCGTCGGAGCATCGACAACGATCTGCGCACGTATCGGTATCCGCGGAGCGAGGATCTGCTCGAGAAGTGGCGTGCCAATCTCGGACTAACGCTGGATCAGTGCCGCGGCAGGATCTGTGCGGATCACTTCGAGCCGCAGGTGAGGGgcaagctgaagctgaagacGGGGGCAGTGCCCACGCTGAAACTGGGCCACGAGGAGGCTCTGATGTACGACAATGAGGCTATAAAGGCTGGAGTGGCCGAAGAGGAGGCTGGCAGTGCGGCGGCATCGCCTCTGGTGACTCCCAAAACGGAAGTGCCGGACGAAGAGGAGCGCGAGGaagatgaggaggaggaggagaaccCCGAAGAAGAGCAGCAGGAAACCCACGACGAGGAGAAGGATGAGCACGAAGATGACACGCCCGAGGGAGCAGAGCAGCTGGGAGATGAGGATGACGACGAGGATCCGGGCAACTATTTTGATCCCTTGGAACTGGTGGAGACGTATGCAGAGCATCCCAGCGACGATGACAGCGGCCCCGAGGCAGCAGACGATGCCAGAGAGGAGGACGATGAGGaagatgatgaggaggagccAGAAACGCTCCTGCCCGATACACCACCCcaaccagcagcagtagcagctgcagcagccgtCCTGCGCGTGCCCAAGCCGTGGGAAAGACCTGTCGCAGTGGTGCCTCGCCGCGAGAAGCGTCCGAATAACGTGGATCCCATCTGCTGCCTCAAGCACTGCCGCAAGGAGCGCTCCGCCATGTATCTGCTGAGCACATTCGGCTTCCCCAAGgaccagcagctgctgctcaagTGGTGCGCCAACCTGCAAATGGATCCCTCGTGCTGCATTGGCCGCGTCTGCATCGAGCACTTCCAGTCGGAGGTGCTGGGCACGCGCAAGCTCAAACAGAATGCGGTGCCCACCCTCAATGTGGGTCACGATGTGCCGCTGCGCTACACCTGCAACGGCCAGGAGATACCTCAGGCAGCCACCAGCAGCTTCCCCGACGAAATGCCACAGCATTCGGTTTTTCGGCTTTGGAGCCTGAAACACTGCCGCAAGAGGAAGCTGTCGGAGagtccagctccagctccagcagcgaTCAAGAAGGAGGAGCAGATGCTGACTCAGATTCaggcggagacggagacggagacgaagatggagatggaggtggAAACTAAGCCAAAGATATGCTGCCTCCCCAGTTGTGGCAATGTGGAGGGCTACGGCCCGGGCGGGCACTTTCAGCCGCTGCCCCACGACCAAAGAGTGCTGAAAAAGTGGCAGCACAACCTGAGGCTAACGTCCATCAATTCCGACTCGGATTTGCGCCTGTGCATGGAGCACTTCGAGCCGCACCAAATCGAGAACGGAGCCCCAGTGCGGATGGCAGTGCCGACCCTGAAGCTGGGCCACTCCAGTCCGAATATCTTTAAGAACAGCGAGAGCACGCTGCTTGGATGCCTGTGGCCCTCGTGTCCGCCCCAACGCAAGATCTGCTACGATCTGCCAGACAATGAGGCCGTTCGAGCGGCCTGGCTGTCGTCTATGCGGCTGCCGCTGGACAGCCCGGGGCGTCTGTGTGGCCTGCACTTTCTGCAGCTGTTCGAGGAGGTGGATCTGCCGGGAGATGTACCCGAAACGGTGCTCGAGCGTCTGCAGGATACCTACGATCAGGCCTCCATCTCGCTGAAGTTCCAGTGCTCGGTGCAGGGCTGCGGCTCCAAGTACAAGCAGGACACGCATTTGGCGAAGCTGCCACACGACGCGGAGCTGCTCGCCAAGTGGCTGCACAACACCAGGATCTCCTACGATCGCTCCCTGCATTTCAGCTACCGCATTTGTCTGGAGCACTTTGAGGCGTTCTGCTTGAACGGCGTGCGCCCGCAGACCTGGGCCATACCCACGCTCCAGCTGAATCACGACGAACAGATCTACCAGAATACCGTCAAGCAGGAGATCCCAGAGGATACCCCAAAGCAGGAGATCCTCGAGAGCCCCACCGTGAAGCAGGAGAAAGCCCACTGTAGCAGCATCTCCAGCCTGAGTCTCTCCATCCCCCTGCACATCAAGACGGAGCAGGGTCCTGTCCTGCGGTCCCGAGGCACATCTTCCCAGAGCAGTCCCTGCCTGAGCGCCAGCTCCAGTCCCCGCCTGAAGAACAGGATTTGCTGCGTTCCCGATTGCGGAGAAAATGGCAGATCGCAGCGGCTCTTCCGCTTTCCCACCGCCGAGCCGGCGCTGCTCATGTGGCTGGTGAACACCCAGCAAAAGCCGGGCCTGGTGGACATCCAGAGCCTGTTTGTGTGTCAGCTGCACTTCGAGGCGGACGCCATCAGCCAGCAGACGCAGCTCAGCAGCTGGGCCGTGCCCACGCTGAGGCTGGGCCACGACGGCCATGTCATACCGAATGCCAAGCACAATGGCAACATAGCCAACAGCCAGGAGACGGAGCAGGCCATGGAGTTCATTCGGGCCAACTACTGCTCCGTGCTGAGCTGCTTCCAGCCGAAGGGCGAGGGTGTGCGCTTCCACAAGTATCCCAGCGACATAGCCATGGTGCGCAAGTGGGCCACGAGTCTCAAGCATCGCTCCATGCAGGCCAGCAGCCACGGCTTCCTGGTCTGCCAGTCCCACTTCGCCGCCGACTGTTTCGATCCGGAGACGGGAGAGCTGTGCGAGGACGCCGTACCCGTGGCCACAATTGCGAGCAGCGTGAAGACCGAGAGCCAGCTGCTGCGTTGTCTGGTAAAGGGTTGCTCTAGGGATAACTCTGGCAAGGCACTGCTGTTCAAGGTGCCAAAGAAGAACCGCGTGCGCGATGCGTGGGCCCACAATCTGTGGATGCATCCGATAGAGCTGATGGGCGAGCACTACATCTGTGATCGGCACTTCGAGGCGCACTGCGTGAACGAACACAAACTGCTGCACCCGGGCTCAGTGCCAACCCTGCACCTGGGACACAACGAGCCGCTGGAACTGCTGCCCAATCCCGCGACCTTCCAGGAGTGCCCCGAGGCGTGCAAGTGCTGTGTGCCCGGCTGTGGGCGCTCCAATCGCAAGGAGAAGGAGCTGCAGTTTACCAAATTTCCCAAGTGGCGAGTGCTGTACGAGAAGTGGCTGCACAACTTCCGTCTCGAAGCGCCCAAGCAGCAGCGCATGCGGACGCTGCGCGTGTGCCACACGCACTTTGAGGAGAGCTGCTTtgagggccagggccagggccagggcgtGCGGAGTGGAGCCATGCCCACCCTGGAGCTGGGACACTCGCATCCGGACATTTACCGCACGGACAAGGAATCGGTGTGGAAGAAGGTGCACAACAGATTCAGCAACTGCTGCTATCCCGACTGCTACGAGGAGTGCCACAAGGCCAACGTCCATCGCATGGCCTACGATCTGCCCAGCGATGGGCCACTGCGAGCGTCCTGGCAGCAGCACTTGGGCATCCCCGCGAGCGGCGAGGATTGCTCCTCGTTGCTGAAGCTCTGCGCCCTGCACTACATCATGCTGTACGAGCACAGCGAACAGAGCTTCCCCGAGCACGGACCCAACCCACTGCTGGACAGGAGCTACGAGCACGCCCGCCAGCTGGCCTATCTGCGACGCTTCATGTGTGCCGTGCAGGGGTGTCGCCATCTGCAGCCGCGGGACGGGGGTCCGATGCACGGCATACCCCGGCGGAGGGAGATCCTGCGGATGTGGGTGGAGAATGCACAGCTGCGGCTGAACGAGCAGGAAATCTACATGACCAAGCTGTGCAGCAAACACTTTGAGGCCCACTGCCTGTTCGAGGGCAAGAAATGCTATCCCTGGAGTGTGCCCACGCTCCATCTTCCCGAGCTGCAGCCCGGGCAGGTGCTGCACCCGAATCCCACCAAGGAGGAGTGGCAGCAAATGAAACAGAGAATGAAAATGGACGAGCAGACGCTGGAGGCGGAACAGCAGGCAGACGGATTGCTGGTGGAGCCCTACGTCAAGATGGAACCCCTCGACGACGAGTCACAAACGGAATCGGAATTGCTGATAAACGAGAGCACGCTGGACTCGCAGGAACAGGACTCTTCAGCCCATGAGCCCATGGAAATGCCCGCCCTGGAGGTGCTCCTGGAGGTGGGCCATGTCGAGCGACTGGACAGCTACGAGAAGAAGGAATACTCTGCAGATACCCCAGCCATCGCGTGTGCTCCCCCCAAACGCTTCCGCCACCAGTACACTGCCCACAAGTGCAGTGTTGAGGGCTGTCGCGTGTCGCTCGAGGATCTGGGCGGGAATCTGAAGCTGCACAAGCTGCCCAGCTCCACGGAGGCGGCCAGGAAGTGGCTGCACAACATTCAGGTGGATATCGAGGACAAATGGCGGATACGCGTCTGCAGCCATCACTTCGACAGGCAATGCCTCAACGGTTCGCGGCTCAGGCGGGGATCGATGCCCACTCTGCTGCTGGGGCCGCGTGGCCCACAGACTATCCATCAGAATGAGTTTGCGCAGCTGCAATCGGACGAGGCGTCAGCCCAGAATGGCCAGCCGTCGGAGCGATCCGTTGGAGAGGTCGAGCAGCTATGCGTGCCACGTCCCTCGCCGCCGCGCAAGTCCAGCAAATTCTGCCAGATCGAGGGCTGTCCGAATCATTTGACCAGCGAGAATATGACACTCCACAAGTTCCCGCACTCGTCGTGGATCTGCACCAAGTGGCAGCACAACACGCAGGTGCCCTTCGATCCGGAGTACCGCTGGCGCTATCGCATCTGCAGCGCCCACTTCCACCCGGTCTGCATGGCCAATATGCGGCTGCTGCATGGCAGTGTGCCCACCCTGAAGCTGGGTCCACGGGCACCCGCCGAGCTCTTTGACAGCGACTTTGAGGCCATCAACATAAAGATTGAGAAAATGGAGAAGCTGGAGAGGAAATCCGAGGCGCAGAGGAGCACCTCTGGCGACAGGTATCCCACCATGCAGGTCGTGGGGGAGAAGAAGTTCAAGACTGAGGAGCTGGAAGACGGAATGGAGGAGGAGCACGATGACATGCTCTACCTGGAGCCAGAGATGCAGCTGTACGAGGATCAGgaggaacagcaacagcagcagaagccaaAGGTCAGTCTTGCAGTCCCCAATGGCGGCTGGAAAACGGAACTCCGTTTGCCATCGAAGGGCAGGGTGGCCTTCAATCCGGTGAGATCTGGCTACGACAAGTGCTCGCTGATGCACTGCCAGCGCCAGAGATCGAAGCACGGCGTCCACATCTACAAGTTCCCCCGGTCGCAGGAGCACCAGCAGCGCTGGATGCACAATCTGCGCATCCGCTACGACGAGAAGCGGCCCTGGAAGTTCATGGTCTGCAGCGTGCACTTTGAGCCGCATTGCATACGGCTGCGGAAGCTGCGGCCCTGGGCAGTGCCCACGCTGGAGTTGGGAGACAATGTCCCCGAGGACATCTACACCAACGAGCAGTGCCAGATGTTTGCCAGTGGACAGGGAGGGGAGATCAATGGCATCGATAGCGatgaggcggaggcagaggcagaggcggaggcagaggcggagAGCGATGGGAATGATGAGGAGGATGGTCTGCAGGAGGACGAGGAAGAGGAGCCCGACGACCAGGACCAGCCCGCCGTTAAGAAGCGTCGTCGCTCGCGGCTGGATGCCTTCTGGCCTCCTGGGCAGGTGCCACCGTGGAAGGTGAAGCAATGCTGTCTGCCCTACTGCCGCAGTCCGCGCGGCGAGGGCATCAAGCTGTTTCGACTGCCCAACAAAGTCAACTCCATCCGCAACTGGGAGCTGGCCACGGGCATGAAGTTCAAGGAGTCGCAGCGCAACACGAGACTCATCTGCAGCCGCCACTTTGAGCCGGAGCTGATCGGAGTGCGTCGCCTCATGCGCAATGCCATTCCCACCAGGCATCTGGGACCCACAGGCGATGTCAAGCCCTTGGTGGCCCCTCCGACAGCTGGTCCCAGATGCTGCATGGCAGACTGTGCCTACGATGTGGCGGATGTGAAGCTGCACAAGTTTCCCAGCAATCCCAAACTCCTGAAGGAGTGGTGCCAGGCCTTGAGGGTCACGGACATGCAAAGGTATCGCGGCAAGCACATCTGCTCCGCCCATCTGCCCGTCCACAAGGCCGTGCACTGCATTGTTTGTGGCGCGGACAAGGCACCACTGCTGCCGATGCTTAACTTTCCCGCTAACCGGAATCAGCGGGCCAAATGGTGCTACAACCTGAAGATCGAAACGATAACCAAGTGGGACATATCCAAGCACATTTGCTGCAAACACTTTGAGCCATATTGCTTTGCAGAGGCGGGTCTCCTAAAGCCGGAGGCGGCGCCCACACTGCATTTGAATCACAATGATACCAACATATTCCTTAACGATTGTGCCATAAACCCTGCCTACAGTGGCGGAGGAGTGCGGGTGAAGGACGAGCCCCTGGACAATCAGGTCCTGTCGTTGATGTAG
Protein Sequence: MDEHPYKSNYIDDNTPFADFNKFNEFSGDMLSPKVELTVKDETYGKTPSSSSSFARRKAQQQQQQPQPQQQTTDRSAESLPICQRCKEVFFKKQSYLRHVAESSCGIQEYDFKCNICPMSFMTTEELQRHKHLHRADKFFCHKYCGKHFDTIAECESHEYMQHEYESFVCNMCSGTFATREQLYAHLPQHKFQQRYDCPICRLWYQTALELHEHRLAAPYFCGKYYQQQQQQLATNQGNYKLQDCHMATMEMPTAPLHKATPANASALPATAALSSLLQQRQANADGAAAMFAASTSASLKSEVSVKLERSYSNSTSESSYSHQDNSSYNNAYGSDSSIHGGALAGPQAHSSTLDDSEDALCCVPLCGVRKSTSPTLQFFTFPKDDKYLNQWLHNLKMFHIPAASYATFRICSMHFPKRCINRYSLCYWAVPTFNLGHDDVANLYQNRELTNTFTTGEVARCSMPHCTSQRGESNLKFYNFPKDIKSLIKWCQNARLPVQAKEPRHFCSRHFEDRCIGKFRLKPWAVPTLHLGAQYGKIHDNPKNLYVEEKRCCLNFCRRSRSSDFNMSLYRFPRDEVLLRRWCYNLRLDPGVYRGKNHKICSAHFIKEALGLRKLSPGAVPTLHLGHNDTFNIYENELWPPPSPTGQHGGSHQLLQQQQHHTSQQQLSHHHSSLQQQHQSMPSKSYQRHSAASTSSSASSASHYVDPEMSGSYLSLTAGGSSGGGMNASDCMDVCCVPSCESKRHNSENITFHTIPRRPEQMRKWCHNLKIPEDKMHKGMRICSLHFEPYCIGGCMRPFAVPTLHLGHDDEDIHRNPDVIKKLNIRETCCVAVCKRNRDRDHANLHRFPSNVALLTKWCANLQRSVPDGSKLFNDAICEVHFEDRCLRNKRLEKWAVPTLILGHEDIAYQLPTPEQVAEFYARPTAPNNGEEQGECCVETCKRNPSVDDIKLYRPPEDASVLAKWAHNLQTEAALLINMRICNLHFEAHCIGKRMRPWAVPTLNLAGNIENLYENPEHSMLYKRRTHLKQKVPVTKPTWVPRCCLPHCRKVRALHNVQLYRFPKLNRSTLAKWAHNLQVPQVGSAQRRVCSAHFEPHVLSKKCPVPLAVPTLDLNSPAGHKIYQNPAKLKANKLCLQRVCIVESCRKTRAQGVQLFRLPHSPTQLRKWMHNIRTRPRAAMRSQYRVCSRHFETHSFNGRRLSAGAIPTLELGHEDDDIFPNEAQAFADEHCAVEGCESSKEQPEVRLFRFPTDDDDMLWKWCNNLKMNPVDCIGVRICNKHFDADCIGPKHLYKWAIPTMQLGHDDSQIELILNPKPEERYVDPVFKCIVPTCGKTRRFDEVQMNSFPKDADLFQRWRHNLRLEHLCFQEREKYKICNAHFEDMCIGKTRLNIGSIPTLELGHDETEDLFKVNPEELQSNLFGRPRRLLRGFNNVAIKQEVPEAEEQDTKPDITQVKVKRSLGDIKCCVQTCGRSRLEHGARLFPFPTGKQQHLKWRHNLRLEPDEVDKTTRVCSAHFNRRCIDGKHLRGWAMPTQQLGHQEQPIYENPKNIPGFFTPTCALGHCRKRRSIDNDLRTYRYPRSEDLLEKWRANLGLTLDQCRGRICADHFEPQVRGKLKLKTGAVPTLKLGHEEALMYDNEAIKAGVAEEEAGSAAASPLVTPKTEVPDEEEREEDEEEEENPEEEQQETHDEEKDEHEDDTPEGAEQLGDEDDDEDPGNYFDPLELVETYAEHPSDDDSGPEAADDAREEDDEEDDEEEPETLLPDTPPQPAAVAAAAAVLRVPKPWERPVAVVPRREKRPNNVDPICCLKHCRKERSAMYLLSTFGFPKDQQLLLKWCANLQMDPSCCIGRVCIEHFQSEVLGTRKLKQNAVPTLNVGHDVPLRYTCNGQEIPQAATSSFPDEMPQHSVFRLWSLKHCRKRKLSESPAPAPAAIKKEEQMLTQIQAETETETKMEMEVETKPKICCLPSCGNVEGYGPGGHFQPLPHDQRVLKKWQHNLRLTSINSDSDLRLCMEHFEPHQIENGAPVRMAVPTLKLGHSSPNIFKNSESTLLGCLWPSCPPQRKICYDLPDNEAVRAAWLSSMRLPLDSPGRLCGLHFLQLFEEVDLPGDVPETVLERLQDTYDQASISLKFQCSVQGCGSKYKQDTHLAKLPHDAELLAKWLHNTRISYDRSLHFSYRICLEHFEAFCLNGVRPQTWAIPTLQLNHDEQIYQNTVKQEIPEDTPKQEILESPTVKQEKAHCSSISSLSLSIPLHIKTEQGPVLRSRGTSSQSSPCLSASSSPRLKNRICCVPDCGENGRSQRLFRFPTAEPALLMWLVNTQQKPGLVDIQSLFVCQLHFEADAISQQTQLSSWAVPTLRLGHDGHVIPNAKHNGNIANSQETEQAMEFIRANYCSVLSCFQPKGEGVRFHKYPSDIAMVRKWATSLKHRSMQASSHGFLVCQSHFAADCFDPETGELCEDAVPVATIASSVKTESQLLRCLVKGCSRDNSGKALLFKVPKKNRVRDAWAHNLWMHPIELMGEHYICDRHFEAHCVNEHKLLHPGSVPTLHLGHNEPLELLPNPATFQECPEACKCCVPGCGRSNRKEKELQFTKFPKWRVLYEKWLHNFRLEAPKQQRMRTLRVCHTHFEESCFEGQGQGQGVRSGAMPTLELGHSHPDIYRTDKESVWKKVHNRFSNCCYPDCYEECHKANVHRMAYDLPSDGPLRASWQQHLGIPASGEDCSSLLKLCALHYIMLYEHSEQSFPEHGPNPLLDRSYEHARQLAYLRRFMCAVQGCRHLQPRDGGPMHGIPRRREILRMWVENAQLRLNEQEIYMTKLCSKHFEAHCLFEGKKCYPWSVPTLHLPELQPGQVLHPNPTKEEWQQMKQRMKMDEQTLEAEQQADGLLVEPYVKMEPLDDESQTESELLINESTLDSQEQDSSAHEPMEMPALEVLLEVGHVERLDSYEKKEYSADTPAIACAPPKRFRHQYTAHKCSVEGCRVSLEDLGGNLKLHKLPSSTEAARKWLHNIQVDIEDKWRIRVCSHHFDRQCLNGSRLRRGSMPTLLLGPRGPQTIHQNEFAQLQSDEASAQNGQPSERSVGEVEQLCVPRPSPPRKSSKFCQIEGCPNHLTSENMTLHKFPHSSWICTKWQHNTQVPFDPEYRWRYRICSAHFHPVCMANMRLLHGSVPTLKLGPRAPAELFDSDFEAINIKIEKMEKLERKSEAQRSTSGDRYPTMQVVGEKKFKTEELEDGMEEEHDDMLYLEPEMQLYEDQEEQQQQQKPKVSLAVPNGGWKTELRLPSKGRVAFNPVRSGYDKCSLMHCQRQRSKHGVHIYKFPRSQEHQQRWMHNLRIRYDEKRPWKFMVCSVHFEPHCIRLRKLRPWAVPTLELGDNVPEDIYTNEQCQMFASGQGGEINGIDSDEAEAEAEAEAEAESDGNDEEDGLQEDEEEEPDDQDQPAVKKRRRSRLDAFWPPGQVPPWKVKQCCLPYCRSPRGEGIKLFRLPNKVNSIRNWELATGMKFKESQRNTRLICSRHFEPELIGVRRLMRNAIPTRHLGPTGDVKPLVAPPTAGPRCCMADCAYDVADVKLHKFPSNPKLLKEWCQALRVTDMQRYRGKHICSAHLPVHKAVHCIVCGADKAPLLPMLNFPANRNQRAKWCYNLKIETITKWDISKHICCKHFEPYCFAEAGLLKPEAAPTLHLNHNDTNIFLNDCAINPAYSGGGVRVKDEPLDNQVLSLM

Similar Transcription Factors

Sequence clustering based on sequence similarity using MMseqs2

100% Identity: iTF_00536072;
90% Identity: iTF_00484466;
80% Identity: -