Basic Information

Insect: Drosophila albomicans
Gene Symbol: -
Assembly: GCA_009650485.1
Location: NC:8975948-8991790[-]

Transcription Factor Domain

TF Family: THAP
Domain: THAP domain
PFAM: PF05485
TF Group: Zinc-Coordinating Group
Description: The THAP domain is a putative DNA-binding domain (DBD) and probably also binds a zinc ion. It features the conserved C2CH architecture (consensus sequence: Cys - 2-4 residues - Cys - 35-50 residues - Cys - 2 residues - His). Other universal features include the location of the domain at the N-termini of proteins, its size of about 90 residues, a C-terminal AVPTIF box and several other conserved residues. Orthologues of the human THAP domain have been identified in other vertebrates and probably worms and flies, but not in other eukaryotes or any prokaryotes [1].
Hmmscan Out: # of c-Evalue i-Evalue score bias hmm coord from hmm coord to ali coord from ali coord to env coord from env coord to acc

1 28 4.1e-15 6.8e-12 45.6 4.3 1 86 610 682 610 683 0.85

2 28 2.5e-15 4.2e-12 46.2 4.6 1 87 710 779 710 779 0.83

3 28 5.5e-16 9.1e-13 48.4 0.4 1 87 801 873 801 873 0.84

4 28 5.5e-16 9.1e-13 48.4 5.2 1 86 971 1040 971 1041 0.82

5 28 5.1e-15 8.4e-12 45.3 3.1 1 86 1065 1136 1065 1137 0.82

6 28 9.5e-13 1.6e-09 38.0 0.9 1 87 1172 1240 1172 1240 0.82

7 28 8.7e-11 1.4e-07 31.7 1.4 1 86 1285 1354 1285 1355 0.76

8 28 5.4e-16 8.9e-13 48.4 0.1 1 86 1382 1451 1382 1452 0.83

9 28 6.1e-13 1e-09 38.6 1.4 1 87 1473 1543 1473 1543 0.80

10 28 4.3e-15 7.1e-12 45.5 2.0 1 86 1570 1641 1570 1642 0.85

11 28 2.9e-14 4.9e-11 42.8 2.6 1 85 1718 1786 1718 1788 0.82

12 28 2.9e-12 4.8e-09 36.4 0.1 1 86 1811 1879 1811 1880 0.81

13 28 6.8e-14 1.1e-10 41.7 1.2 1 87 2022 2091 2022 2091 0.80

14 28 7.5e-12 1.2e-08 35.1 0.1 1 62 2159 2217 2159 2238 0.79

15 28 0.0045 7.4 7.0 0.1 1 58 2250 2300 2250 2314 0.75

16 28 6.4e-12 1.1e-08 35.3 0.7 1 87 2339 2409 2339 2409 0.83

17 28 4.8e-15 8e-12 45.3 1.9 1 86 2485 2554 2485 2555 0.83

18 28 1.7e-12 2.8e-09 37.2 0.8 1 86 2590 2661 2590 2662 0.81

19 28 3.6e-13 6e-10 39.3 0.5 1 87 2672 2744 2672 2744 0.81

20 28 3e-15 4.9e-12 46.0 0.0 1 86 2773 2846 2773 2847 0.79

21 28 0.00013 0.21 11.9 0.0 1 58 2880 2930 2880 2964 0.77

22 28 2.8e-13 4.7e-10 39.7 0.1 1 86 2969 3041 2969 3042 0.80

23 28 3.7e-14 6e-11 42.5 0.4 1 86 3194 3266 3194 3267 0.84

24 28 1.7e-14 2.7e-11 43.6 1.6 1 86 3327 3397 3327 3398 0.81

25 28 4.2e-13 7e-10 39.1 5.8 1 86 3500 3570 3500 3571 0.83

26 28 3e-13 5e-10 39.6 0.0 1 87 3648 3718 3648 3718 0.84

27 28 1.2e-08 1.9e-05 24.9 0.5 1 58 3738 3787 3738 3800 0.84

28 28 2.9e-10 4.8e-07 30.0 0.6 18 87 3804 3862 3791 3862 0.75

#	of	c-Evalue	i-Evalue	score	bias	hmm coord from	hmm coord to	ali coord from	ali coord to	env coord from	env coord to	acc
1	28	4.1e-15	6.8e-12	45.6	4.3	1	86	610	682	610	683	0.85
2	28	2.5e-15	4.2e-12	46.2	4.6	1	87	710	779	710	779	0.83
3	28	5.5e-16	9.1e-13	48.4	0.4	1	87	801	873	801	873	0.84
4	28	5.5e-16	9.1e-13	48.4	5.2	1	86	971	1040	971	1041	0.82
5	28	5.1e-15	8.4e-12	45.3	3.1	1	86	1065	1136	1065	1137	0.82
6	28	9.5e-13	1.6e-09	38.0	0.9	1	87	1172	1240	1172	1240	0.82
7	28	8.7e-11	1.4e-07	31.7	1.4	1	86	1285	1354	1285	1355	0.76
8	28	5.4e-16	8.9e-13	48.4	0.1	1	86	1382	1451	1382	1452	0.83
9	28	6.1e-13	1e-09	38.6	1.4	1	87	1473	1543	1473	1543	0.80
10	28	4.3e-15	7.1e-12	45.5	2.0	1	86	1570	1641	1570	1642	0.85
11	28	2.9e-14	4.9e-11	42.8	2.6	1	85	1718	1786	1718	1788	0.82
12	28	2.9e-12	4.8e-09	36.4	0.1	1	86	1811	1879	1811	1880	0.81
13	28	6.8e-14	1.1e-10	41.7	1.2	1	87	2022	2091	2022	2091	0.80
14	28	7.5e-12	1.2e-08	35.1	0.1	1	62	2159	2217	2159	2238	0.79
15	28	0.0045	7.4	7.0	0.1	1	58	2250	2300	2250	2314	0.75
16	28	6.4e-12	1.1e-08	35.3	0.7	1	87	2339	2409	2339	2409	0.83
17	28	4.8e-15	8e-12	45.3	1.9	1	86	2485	2554	2485	2555	0.83
18	28	1.7e-12	2.8e-09	37.2	0.8	1	86	2590	2661	2590	2662	0.81
19	28	3.6e-13	6e-10	39.3	0.5	1	87	2672	2744	2672	2744	0.81
20	28	3e-15	4.9e-12	46.0	0.0	1	86	2773	2846	2773	2847	0.79
21	28	0.00013	0.21	11.9	0.0	1	58	2880	2930	2880	2964	0.77
22	28	2.8e-13	4.7e-10	39.7	0.1	1	86	2969	3041	2969	3042	0.80
23	28	3.7e-14	6e-11	42.5	0.4	1	86	3194	3266	3194	3267	0.84
24	28	1.7e-14	2.7e-11	43.6	1.6	1	86	3327	3397	3327	3398	0.81
25	28	4.2e-13	7e-10	39.1	5.8	1	86	3500	3570	3500	3571	0.83
26	28	3e-13	5e-10	39.6	0.0	1	87	3648	3718	3648	3718	0.84
27	28	1.2e-08	1.9e-05	24.9	0.5	1	58	3738	3787	3738	3800	0.84
28	28	2.9e-10	4.8e-07	30.0	0.6	18	87	3804	3862	3791	3862	0.75

Sequence Information

Coding Sequence: ATGTCACAACACAACAATCCCCCCTCGCATCATCATCACTActaccagcaacagcagcaacaattacaacagcaacatcaccaccatcagcagcaacaacatcaccaccaccaacaacaacaacaacagctacaacataaacaaatacagcagcaacacaattGGTACTCACATGTTGCTTCCTACCCTCCCCACCATTCGCAGGCCGCCGCAGCCTTTGCGGAGCCCTGcaaagccagcagcaacaacaataacaacaacaacagcattatGAATGCATACGGCTCTGGAGTTGTTGCAAGTGGTACGCAGGCAACGTATTatggggcagcagcagcagctggtggTGGGGTGGGATATAACCTTGAGGCCAATACTGTTGCCTATGCGCACAACCAGCTGCTGCagtaccaacaacaacaacagcagcaacaacaacatcaccagcagcatcagcaacaacaacatcatgtGCTTAATCAACGCTCTTATCTGCCGCATGGTTCAATGCATAGCTCTTATCCTTATATCAAGAGCGAGCCATTGGAGTTGCCCGATGATAGACAAcgacagccacaacaacaacagcagcatcatcaacaacaacaacatcaccagcaacaacaacagcatttcCAAAATCCTATGGCACCGCCGCCAGCTCCCGCCAATCATCGTCACAGTCTCGATGCCAGCGGtgaaatgataataaaatcGGAACCTATTGACGAACATGCCTACAAATCAAACTATATCGATGATAATACGCCGTTTGTTGATTTTAGTAAATATCCCGAATTCGGCGACGATATGCTGAGTCCGAAGGTGGAATTAACCGTCAAGGACGAGGGCTATGGCAGTCAAAAAGTTCCCAACCCGCTTAGCTATCCGCGGCGCAAGCTGCAAACGGATCGCTCATCGGAAAGTCTTCCCATATGCCAGCGTTGCAAGGAGGTGTTCTTTAAAAGATCGATCTACTTGCGACATGTGGCCGAGAGCAGTTGCAACATACAGGAGTATGACTTCAAGTGCAACCTCTGCACCATGTCCTTCATGACCAGCGATGAGCTGCAGAAACACAAGCATCTGCACAGAATGGACAAGTTCTTTTGCCACAAATACTGTGGCAAGTACTTTGATACAATTGCCGAATGCGAATCGCATGAGTACATGCAGCACGAATATGAAAACTTTGTGTGCAACATGTGCTCCATGACGTTTGCCACGCGGGAACAACTCTATGGTCATTTGCCGCAGCACAAATTCCAGCAGCGTTACGATTGTCCCATTTGTCGCCTGTGGTATCAAACCGCTTTGGAGTTGCACGAGCATCGTTTAGCGGCGCCGTACTTCTGCGGCAAGTACTACGCACCCGCTCAATCGGCAGTTcatcagcaacaaccacagcaactaCATTcacatcaacagcatcagcaacaggcCAACTACAAACTTCAGGATTGTCACATGGGCACCATTGAAATGCCTTCGCCGCAACACAAAACTAATACATTACCAGCAAACGCATTgccggcaacagcagcgctcAATTCGTTGTTGCAACAGCGTCAAGCCAATGCCGATAATGCCGCATTGTTTGCTTCCACATTGAAGAACGAGGCGAATGTGAAGCTGGAGCGAAGCTACAGCAATTCAACGAGCGAATCTGGTTACAGTCTACACGATAACAGTAGCTACAACAATGCCTATGGCAGCGACAACTCGATTCATGCCGCAGCCGGAggcggtggtggcggcggcTCTGGTGGTGCCATTGGAGGTCCGCAGGCGCACTCCTCCACACTGGACGACTCGGAGGATGCTCTTTGCTGTGTGCCTTTGTGTGGAGTGCGCAAGAGCACCAGTCCAACGCTGCAGTTCTTCACGTTCCCCAAAGATGAGAAGTATCTGCATCAGTGGCTGCATAATCTCAAGATGTTTCACATTCCGGCATCGAGCTATGCGAGCTTTCGCATTTGCAGCATGCACTTTCCGAAGCGTTGTATCAATCGCTATTCATTGTGCTATTGGGCGGTGCCTACATTCAATCTGGGCCACGATGATGTTGCCAATCTGTATCAGAATCGCGAGCTGACCAACACATTTACCACCGGCGAAGTGGCACGCTGCAGCATGCCCAACTGCACCAGCCAGCGGGGCGAGAGCAATCTCAAGTTCTACAACTTTCCCAAGGATATCAAGAGTCTGATCAAATGGTGCCAGAATGCCCGTCTGCCCGTCCAGGCCAAGGAGCCGCGTCACTTTTGCAGTCGCCACTTTGAGGAGCGTTGCATTGGAAAGTTCCGGCTGAAACCGTGGGCAGTGCCCACCTTACATTTGGGCGCTCAGTACGGCAAGATCCATGACAATCCCAAGAATCTGTATGTGGAGGAGAAGCGTTGCTGCCTTAACTTTTGTCGTCGCAGTCGCTCGTCCGACTTTAATATGTCGCTCTATCGCTTTCCGCGCGATGAGGTGCTGCTTCGACGCTGGTGCTATAATCTACGTCTCGATCCTTCCGTCTATCGCGGCAAGAATCACAAAATATGCAGCGCTCACTTTATCAAAGAGGCTTTGGGACTACGCAAACTCTCGCCGGGTGCTGTTCCCACGCTGCATTTGGGGCACAACGACACGTTCAACATCTACGAGAATGAGCTGTGGCCACCACCGACGCCTTCCACGCCCACCAAccaccatcagcagcaactgcagcagcatcagttgcagcaacaccagcagcaacaacaacagcatcacaAATATCAACGTCAATCGGCAGCCTCAACATCTTCTTCAGCCAGCTCATCGCACTATGTGGATGCTGGAGACATGGGTGGATCGTACATGGGCATGGGCAACTCAGGAGGCTCTTCGTCCGGCCTGAATGTGAGCGACAGTATGGACGTGTGCTGTGTGCCGAGCTGCGAGAGCAAGCGGCACAATAATGAGAACATCACATTCCACACGATACCGAGAAGGCCCGAGCAGATGCGCAAATGGTGTCACAATCTGAAGATACCCGAGGATAAGATGCATAAGGGAATGCGCATCTGCAGTCTGCACTTTGAACCCTATTGCATTGGCGGTTGCATGCGTCCGTTTGCCGTGCCCACGTTGCAATTGGGCCACGACGACGAGGACATTCATCGCAATCCGGATGTGATCAAGAAGCTGAACATAAGGGAAACCTGTTGTGTGGCTGTCTGCAAGCGTAATCGCGATCGTGATCATGCCAATCTGCATCGCTTCCCCAGCAATGTGGCGTTGCTGACCAAGTGGTGTGCGAACCTGCAGCGCCCGGTGCCGGATGGCACTAAGCTCTTCAACGATGCCATCTGCGAGGTGCACTTCGAGGATCGCTGTCTACGCAACAAGCGGCTGGAGAAGTGGGCAGTGCCAACGTTGATACTCGGCCACGAGAACATCGCCTATCCGCTGCCCACGGCAGAGCAGGTGGCCGAGTTCTACGCTCGACCCAGTGCACCCAATAATGGCGAGGAGCAGGGCGAGTGCTGCGTGGACACGTGCAAGCGTAATCCCAGCGTTGATGATATCAAACTCTATCGCCCGCCTGAAGAGTCGCAAGTGCTGGCCAAATGGTCGCACAATCTGCAGCTGGACGCGGCAAAATTATCCAGCTTGAGGATCTGCAATCTGCACTTTGAAGCGCACTGCATTGGGAAACGCATGCGTCCCTGGGCGATACCCACGCTCAATCTGGCGACAAACATTGAGAATCTCTACGAGAATCCCGAGCACCAAATGCTCTATAAGCGACGCACGCATCTCAAAACCAAACGTGCCGCTAATCACGAGGCGGGTGGCGTGAAACCGACGTGGGTGCCACGCTGTTGTCTGCCACATTGCCGCAAGGTGCGTGCACTGCATAATGTGCAACTGTATCGCTTTCCTAAGCTCAATCGCTCCACGCTGGCCAAGTGGGCGCACAATCTGCAAGTGCCGCTGGTGGGCAGCGCCCAAAGACGCCTCTGCTCGGCGCACTTTGAGCCGCACGTGCTCAGCAAGAAATGTCCGGTACCGCTGGCTGTGCCCACGCTTGATCTGAACTCACCACCTGGCTACAAGATCTATCAGAATCCCGCCAAGCTCAAGGCCAACAAGTTGTGCCTGCAACGCGTCTGCATTGTGGAGAGTTGTCGCCGGCAGCGTGGTCAGGGCGTGCAGCTCTTCCGGCTGCCACACAATCCTACGCAGCTGCGCAAATGGATGCACAACATACGCATGCGACCCAGAGGCGCCATGCGGCAACAGTATCGTATGTGCTCCATTCACTTTGAGACGCACTCCTTCAATGGCAAGCGGTTGAGTGCGGGAGCCATTCCAACGCTCGAGTTGGGTCACAATGACGACGATATCTATCCGAATGAAGCGCAATCGTTTGTTGAGGAACACTGTACTGTTGAGGGCTGTGAGGCGTCTAAGGAGCAGCCAGATGTGCGTCTCTTCCGCTTCCCCACCGACGACGAAGATCTGCTGTGGAAGTGGTGCAACAATCTCAAGATGAATCCCGTGGATTGCATTGGTGTGCGCATCTGCAACAAGCACTTTGAGCTGGACTGCATCGGACCCAAGCATCTGTACAAATGGGCGATACCCACACTGCATCTAGGTCATGACGATGAGCAGATCGAGCTGATCGACAATCCCAAGCCCGAAGAACGCTATGTGGATCCCGTGTTCAAGTGCTGTGTACCGACGTGCGGCAAGACGCGCAAGTTTGATGAGGTGCAAATGAATAGCTTTCCCAAGGATCCGAACATGTTTCAGCGCTGGCGACACAATTTGCGACTGGAGCATCTCAATTTCAAGGAGCGCGAACGCTACAAGATTTGCAATGCGCACTTTGAGGATATTTGCATAGGGAAGACGCGGCTTAACATTGGCTCGATACCCACGCTCGAGTTGGGGCACGAGGAGACGGAGGATCTATTCCAAGTGAATCCCGAGGAGCTGCAAAGCAATCTCTTTGGACGTCAGCGTCGAGTGAATTCTTCGATGGGGATGAGCATCAAGCAGGAGGACAACTCGGAGGTGGACGAGGACATTAAGCCTGACTTGAATATGTTGGAGGCAAAAGACAGAAATATCGCACAGGTAAAGATCAAGCGTTCTCTGGCAGATTACAAGTGTTGTGTGCCAGACTGTGGACGCAGTCGCTTGGAGCATGGCGCTCGCCTGTTTCCTTTCCCCAatggcaagcagcaacagagcaaGTGGCGCCATAATCTTCGCCTGCAACCCGATGAAGTGGATCGCAGCACACGAGTCTGCAGTGCGCATTTCAATCGTCGTTGCATCGATGGCAAGCAGCTAAGAAGTTGGGCCATGCCCACGCAGCAGTTGGGTCATCAGGAATTGCCCATCTATGAGAATCCAAAGAATATACCGGGCTTCTTTACGCCCACCTGTGCGCTGGCTCATTGTCGCAAGCGTCGCAGCATTGACAACGATCTGCGTACCTATCGCTATCCGCGTAGCGAAGATCTGCTCGAGAAGTGGCGCGTTAATCTGCGATTGGCGCCGGATCAGTGTCGTGGACGCATTTGTGCAGATCACTTTGAGCCCATGGTACGTGgcaagctgaagctgaagacGGGCGCAGTGCCCACGTTGAAGTTGGGTCACAACGAAGGCGTTGTCTTTGACAATGAGGCTATTAAGGCGGGACTGCAGCAAGAGGCGGAGGAGGGTGGCGATCAGGAGACCAGTATGGAATCGCAGGTCAAAGTGAAGCAGGAGAGACTCGATCCGGAAGAGGAGCCAGCTGATGATGTGGACCACGAGCAGCagcacgacgacgacgatgagcaGGCAGATCATGGCTACTTTGATCCTCTAGAGCTGGTCGAGACGTTTGCTGAGCAGCACAGCGCCGAGGATGAGAACGAAGTcaatgacgacgatgacgaagatgaagatgaggaTGAGCCGGGCGACGATGATGAGCTGCTACTACCAGACACACCGCCTGTGAAGCGACTGCCGCCTTTGGTGCTGCCGCCGCGGCGCGAGAAAGCCGTGAACAATGTGACGCCCATCTGCTGCCTGAAACATTGTCGCAAGGAGCGCACGGCCAGCCATCAACTGAGCACCTTTGGCTTCCCAAAGGATCGGCAACAGCTGCTCAAATGGAGCGCCAATCTACAGCTATCGCTCGATGATTGTGTGGGACGCGTGTGCATCGAACACTTTGAGTCGGAGATGCTGGGCACACGTAAGCTGAAGCAGCATGCGGTGCCCACGTTGAATCTGGGTCACGCAACGCCCCTCAGCTACAGTTGCAATGGTCAGGCATTGAGCATTTACGATGCACAGCCGCAGCATTCGGTTTTTCGGCTTTGGAGCCTGAAACATTGCCGCAAACGGAAGCATCCAACGGAACCGCCGgatcagcagcagaagcagcggcagctggaTCAGAATCCTACAACGATGATGACTAAGCGACGCTGTTGTCTGCCCAGCTGTGGCAAGCAGCCGGAGGTGCATGGCGTGCAATTGCAACGACTGCCCAGCAATCGCATTCAGCTTCGCAAGTGGCTGCACAATCTCAAGCTATCCCCAATGCTGGACAGCAGTCAGGCGCGTCTCTGCAGCGAACACTTTGAGCCGGAGCTGCTGGACCATGTGGAGGATGTGGTGCCCACACTGCGACTGGGACACGATGACACGCACATCTATCGCAATCGTGGCAACATCGCGGCAGCCTCCACGTCGAGTGCCTGTTTGGTGGCCAGTTGTCCGTGTGCTCGTCTCAATCTCTATCGCTGTTACGATCTGCCCGAACATCGTCTGGTGCAGCAAGCTTGGCTGCAGTGGTTAGAGCTGCCGCTGCCCCAACAAGCCAGCGATGGCAAGCTCTGTGTCATGCACTTCATGCAGCTCTTCGAGCAGGTGCCGCTGCCCGCGGAGTTGCCAGGCTCGGTGCTCCGTCAACTGCAGGAGACTTATGATCTCATTGGAGGCTCCACGATGGCTATGAAGTTGCGCTGCGCTGTGCCCGGCTGTTACTCGAAGTACACGGACAACATCAGGCTGACCAAGCTTCCCATGTGTCCCGGCATGTGCTCCAAATGGGTGCACAACACCAAGATCAACTACGATGCAACGCGTCACTACGTCTATCGCATATGCATGCTGCACTTTGAGTCTCGCTGCTTGGGACCTGTGCGTCCCAAGCTGTGGGCGGTGCCAACGCTGCACTTGAACCACAACGATGCGAATATCTATCAGAACCCGAAGTTGGATGGGCAATTCCCGTCAGCTCCAGTGCCGCCTCCTGTGCCCGTTGCCATGACGGCGTCGGTACCCGTTGCTTTGACAGCGTCGGTGCCCGTTGAGTTGCCACTGCGCATCAAGACGGAGCTGGCTTTCAGTGGCAGTCCCAGCGCCAGTGCAAGTCCCAGTCCGCGTGGCAAGCTGCGCTTCTGCTGCATCCCCAGCTGCTTGCAACAGGCTACGTCGCAGACGCGACTCTTTCGCTTTCCTACCGCTGAAACGGCACTGCTGAAGTGGCTGGTGAATACGCAGCAACAGCCGCGTTTGGTGGATACCCAGCAGCTGTTTATTTGCCAGGATCATTTCGAGGAGGAGGCCATCTGCAAGAAGCAGCTGCGCAGCTGGGCGGTGCCTACATTGAAGCTTGGTCACGACGGCCATGTCATACCGAATGCCAGGCACAATGGCAACATTGCCGACAGCCAGGAGAACAAGCAGACGTTACAGTACATCTGGGAGAACTATTGCTCCGTCTTGAGCTGCTTCCAGCCGCGTAGCGAGGAATTGCGTCTCTACGCTTATCCCACGGATCGACCCACCATTCGCAAGTGGGCGACCAACTGCAAGCATCGCTCCATGCAGGCCAGCAGCGATGGTTTCCAGGTCTGCCAGCTGCACTTTGCACCACATTGCTTTGACCGGGAGACGGGCGAGTTGAGGGAGGATGCGGTGCCCACGCTGGAACTGAGTCGATGCCTAAACGATGTGCATTGCATCGTTGCTGGCTGTGTGAAAGACGAGGATGGACCGCGTCAACGCTTCTACAAGATGCCCAAGCGCAGTGCTCAACTGCTTAGCTGGTGTCACAATCTGCGTTTGGATGCGGCAAACATGGGCAGTGGGGAGCATCACGTCTGCGATCGCCACTTCGAAACGCAGTGCATCAATCACCAAAAACTGCTACGACCCGGCGCACGTCCTACTCTCCACCTGGGCCACGATGAGCCCATTGAATTGATGCCCAATCCAGCGGAATGGGATGCTACGgatgctgcggctgctgtagACAATGTATGCTGTGTGCCCAACTGCGGTCTGGCcaaggatgaggaggaggatgtGCAGCTGTTTGCCTTCCCCAAGCTGCGGTCGCTCGCCGAAAAGTGGCTACAGAACATACGCCTCGAAAACATAAGTCGCGAACAGCTGATGCGACTGAGGATCTGCGGCGCACACTTCGATGATAGCTGCCTGGAGAGCAACGGACGTCCACAGCTGGGCGCCATGCCCACGCTGCAGCTGGGTCACGAGGATAACGGGAACATTCATCGCAGCACCGATGCTTCTGCCGTTAAGGCTAAGAAGTTCTGTAATCGAAGTGGCTCCAGTTATGACTGCTGCTATCCGCAATGTGTGGAGCTGCAGAAGAGTTACCTAAGGATTAGCTACGATCTGCCACAATCGGAGGCACTGCGTCTCAAGTGGCTGGAGTACATGGGTCTGGAAAAGACGGAAGAAAAGCTCTTGAAGCTGTGCCCGTTGCACTTGGTGCTGCTCTACGATCACAGCGTCGAACATTTTGCAGAGGAACACACGCCCGAGCAGCAGTTGGACGCCAACTACGAGGACAGTCGGAACAGTGTGCGATTGCGAGTCATCAGCTGCGCGGTGGCCGGCTGCCGTACGCTAAAGCCACGCGATGGTGGCATACTTTATGGATTGCCGCAGCGTCGCGATGTGCTTGAGATGTGGCTACACAACATGCAGCTGGTGTTCTATGAGCAGCAGCGTTACGTGTACAAGATATGCAGCAAACACTTTGAGCCCTGCTGTTTTATGGACAGCACGCGACGCTTGAAACCGTGGACTATGCCGACGCTGGAGCTACCGCCGCGCGATGCGGAAGAAGCACCCATTTATCCCAATCCCAGCGAGCAAGAGTGGCAGCGCATGAACGAACTGCTGGCGGTAGAGCAGCTGCAACCGCAAccagaggagcagcagcagccagaggaGCTATGCAACTTACTGGAGCCAATTGTGAAGATGGAGCACATTGAAAGGGACGAGGATGAAGAGGAGTGTCACGAGTATCAAGAGCAGCAAGAGGAAGAACTGCAGCCGGATAATGTCGATGACAACTCACAGCAACCGCTGGCGCTTGAGGTGCTGCTCGAGGTGGGTCACGTGGAAAAGTGCACCACGTATGAGCAAATGGACAACGAGGCGAATTTGAGCTATgccgaacagcagcagcatctgatACATGGATATGGAAAAGGAGCGGGTTCAAGTGGTCACTTGGGCAGCAATGGATTCAAGTACACCGCGCGTCATTGCAGCGTACAGGGCTGCGATGTGACTGTGAACGATGTGAATGGTAACATTAAGCTGCACAAGTTTCCCACCTCGCTGGATGCCATGGAGAAGTGGAAGCACAACACCCAGGTGGAAGTGGATCTGAATTACTCGTGGCGTTTTCGCATCTGTAGCTATCACTTTACCGAGGAATGTTTCCATGGTGCTCGCATCAAACGGGGTGCTATGCCAACGCTTAGTTTGGGGCCGCGGCGACCGCTAAAGATCTATGACAATGAGTTTGGCACCACTCTGCCGCTCCCGGAGCCGGAACAGCTGCAGCTCAAAGAGGAGAAACAGGTTTCCAGGCCAATTAAGGATATCGATATAAGTCTTCGGTTGCCGGAGCCGGCGCCGCCGCGCAAGTCGAGCAAATTTTGTCAGGTCGATGGTTGCCCAAATCATTTGACCAGCGAGAACTTGACGCTACACAAGTTTCCACATGATGTGGACATGTGCGCCAAGTGGCAACACAATACGCAGGTGCCCTTTGATCCCGAATATCGTTGGCGTTATCGCATCTGCAGCGCTCACTTTGAACCCATTTGCCTGTTGAATATGCGACTATTACACGGCAGCGTGCCCACCTTGAAGCTGGGACCGCGTGCGCCGCGGGAGCTTTTCGATAGCGACTTTGAGGCCATTAACTTGCGGCTGGACAAGCAGAAGAACAGCAGTGGCGAACAACAATTCCCCATCAAACTGGAGCAGGACTTTCAGGAGGAGGAAGAAGCGGAGCTGAGCTATTTGGTGCCCGAAATGCAATTGCACGAGGATATGGAGCAGGCACACGGCAGATCGAGCAACTGGGAGGAACTGCGCTTGCCCAGCATCAAGCAGGAGGCTGAGGAGCAATCAGTGACCAGCTACAATCCGGTCAAGTCGGGCTACGACAAGTGTTCGCTGGTGCATTGCCAGCGTCAGCGTTCGCAGCACGGTGTGCACATTTACAAGTTTCCACGCTctcgccagcagcagcagcgctggATGCACAATCTGCGCATCAAGTACGACGAGCGACGGCCCTGGAAGACGATGATCTGCAGCGTACACTTCGAGCGCAGCTGCATCCGGCTGCGCAAGCTTTGTTCGTGGGCAGTGCCCACTTTGGAGCTGGGCGATAATGTGCCGCTGGAGATCTATACGAATGAGCAGAGTCGCCAGCAACTGGAAGTAGGCAGCGATTGTGAGGATATGCCGTTGGAGGATGGCTACGAGGATGACGATTACGATGATGATTTGGCCCAGCAGATGGCCAATGAACCGCTGGTAAAACGCGAACGTCGCTCACGTCTCGATCCCTTGCCGCCGGGGCAACTGCCGCCTTGGAAGATCAAAGTGTGCTCGCTGCCCTATTGTCGCAGTCCGCGAGGCGATGGCATCAAGCTGTTTCGGCTGCCCAACAACACCAGTTCCATACGCAAGTGGGAGCAGGCGACTGGTATGCGTTTCACCGAAGCGCAGCGCAATACGAAGCTCATCTGCAGTCGGCACTTTGATCCGCAGCTGATTGGAGTGCGGCGTCTCATGTACAATGCAGTTCCGACGCTCAATCTGGGTCCAAGGAGTGGGGAGAGTTCAGCTGCGTTGCTGCCTGATGTTGGACCACGCTGCTGTATGCTCGATTGTCAAGCGGAAGGCAAGGATGCCAAGCTGCACAAGTTTCCTAGTGaTCCCATGCTGCTGCATCAGTGGTGTCATGCACTGAATCTCTCGGACATTCAACGCTATCGTGGCAAGCACATTTGTGCCCTGCATCTGCCCGCCAAGACACCCAATTGCATTGTTTGCGGCATTGagcaattgcagttgccacTCCTCGACTTCCCAGAGAATCGCAATCTGCGTGCCAAGTGGTGCTATAATCTCAAAATCGAACCCATTGCCAAATGGGACAACTCACGACAGATATGCAGCAAGCACTTTGAAAGCTATTGCTTTACTCAGCCAGGGCAACTGCAACCGGAGGCTGCGCCAACGTTGCATTTGCGGCACAACGATAGCAATATATTCCTAAACGATTATGCCATAACAGATGACAGTAAGATGCTGCGCATCAAGGATGAGCCGCTGGACAGCGACGATCTGATGCTgtaa
Protein Sequence: MSQHNNPPSHHHHYYQQQQQQLQQQHHHHQQQQHHHHQQQQQQLQHKQIQQQHNWYSHVASYPPHHSQAAAAFAEPCKASSNNNNNNNSIMNAYGSGVVASGTQATYYGAAAAAGGGVGYNLEANTVAYAHNQLLQYQQQQQQQQQHHQQHQQQQHHVLNQRSYLPHGSMHSSYPYIKSEPLELPDDRQRQPQQQQQHHQQQQHHQQQQQHFQNPMAPPPAPANHRHSLDASGEMIIKSEPIDEHAYKSNYIDDNTPFVDFSKYPEFGDDMLSPKVELTVKDEGYGSQKVPNPLSYPRRKLQTDRSSESLPICQRCKEVFFKRSIYLRHVAESSCNIQEYDFKCNLCTMSFMTSDELQKHKHLHRMDKFFCHKYCGKYFDTIAECESHEYMQHEYENFVCNMCSMTFATREQLYGHLPQHKFQQRYDCPICRLWYQTALELHEHRLAAPYFCGKYYAPAQSAVHQQQPQQLHSHQQHQQQANYKLQDCHMGTIEMPSPQHKTNTLPANALPATAALNSLLQQRQANADNAALFASTLKNEANVKLERSYSNSTSESGYSLHDNSSYNNAYGSDNSIHAAAGGGGGGGSGGAIGGPQAHSSTLDDSEDALCCVPLCGVRKSTSPTLQFFTFPKDEKYLHQWLHNLKMFHIPASSYASFRICSMHFPKRCINRYSLCYWAVPTFNLGHDDVANLYQNRELTNTFTTGEVARCSMPNCTSQRGESNLKFYNFPKDIKSLIKWCQNARLPVQAKEPRHFCSRHFEERCIGKFRLKPWAVPTLHLGAQYGKIHDNPKNLYVEEKRCCLNFCRRSRSSDFNMSLYRFPRDEVLLRRWCYNLRLDPSVYRGKNHKICSAHFIKEALGLRKLSPGAVPTLHLGHNDTFNIYENELWPPPTPSTPTNHHQQQLQQHQLQQHQQQQQQHHKYQRQSAASTSSSASSSHYVDAGDMGGSYMGMGNSGGSSSGLNVSDSMDVCCVPSCESKRHNNENITFHTIPRRPEQMRKWCHNLKIPEDKMHKGMRICSLHFEPYCIGGCMRPFAVPTLQLGHDDEDIHRNPDVIKKLNIRETCCVAVCKRNRDRDHANLHRFPSNVALLTKWCANLQRPVPDGTKLFNDAICEVHFEDRCLRNKRLEKWAVPTLILGHENIAYPLPTAEQVAEFYARPSAPNNGEEQGECCVDTCKRNPSVDDIKLYRPPEESQVLAKWSHNLQLDAAKLSSLRICNLHFEAHCIGKRMRPWAIPTLNLATNIENLYENPEHQMLYKRRTHLKTKRAANHEAGGVKPTWVPRCCLPHCRKVRALHNVQLYRFPKLNRSTLAKWAHNLQVPLVGSAQRRLCSAHFEPHVLSKKCPVPLAVPTLDLNSPPGYKIYQNPAKLKANKLCLQRVCIVESCRRQRGQGVQLFRLPHNPTQLRKWMHNIRMRPRGAMRQQYRMCSIHFETHSFNGKRLSAGAIPTLELGHNDDDIYPNEAQSFVEEHCTVEGCEASKEQPDVRLFRFPTDDEDLLWKWCNNLKMNPVDCIGVRICNKHFELDCIGPKHLYKWAIPTLHLGHDDEQIELIDNPKPEERYVDPVFKCCVPTCGKTRKFDEVQMNSFPKDPNMFQRWRHNLRLEHLNFKERERYKICNAHFEDICIGKTRLNIGSIPTLELGHEETEDLFQVNPEELQSNLFGRQRRVNSSMGMSIKQEDNSEVDEDIKPDLNMLEAKDRNIAQVKIKRSLADYKCCVPDCGRSRLEHGARLFPFPNGKQQQSKWRHNLRLQPDEVDRSTRVCSAHFNRRCIDGKQLRSWAMPTQQLGHQELPIYENPKNIPGFFTPTCALAHCRKRRSIDNDLRTYRYPRSEDLLEKWRVNLRLAPDQCRGRICADHFEPMVRGKLKLKTGAVPTLKLGHNEGVVFDNEAIKAGLQQEAEEGGDQETSMESQVKVKQERLDPEEEPADDVDHEQQHDDDDEQADHGYFDPLELVETFAEQHSAEDENEVNDDDDEDEDEDEPGDDDELLLPDTPPVKRLPPLVLPPRREKAVNNVTPICCLKHCRKERTASHQLSTFGFPKDRQQLLKWSANLQLSLDDCVGRVCIEHFESEMLGTRKLKQHAVPTLNLGHATPLSYSCNGQALSIYDAQPQHSVFRLWSLKHCRKRKHPTEPPDQQQKQRQLDQNPTTMMTKRRCCLPSCGKQPEVHGVQLQRLPSNRIQLRKWLHNLKLSPMLDSSQARLCSEHFEPELLDHVEDVVPTLRLGHDDTHIYRNRGNIAAASTSSACLVASCPCARLNLYRCYDLPEHRLVQQAWLQWLELPLPQQASDGKLCVMHFMQLFEQVPLPAELPGSVLRQLQETYDLIGGSTMAMKLRCAVPGCYSKYTDNIRLTKLPMCPGMCSKWVHNTKINYDATRHYVYRICMLHFESRCLGPVRPKLWAVPTLHLNHNDANIYQNPKLDGQFPSAPVPPPVPVAMTASVPVALTASVPVELPLRIKTELAFSGSPSASASPSPRGKLRFCCIPSCLQQATSQTRLFRFPTAETALLKWLVNTQQQPRLVDTQQLFICQDHFEEEAICKKQLRSWAVPTLKLGHDGHVIPNARHNGNIADSQENKQTLQYIWENYCSVLSCFQPRSEELRLYAYPTDRPTIRKWATNCKHRSMQASSDGFQVCQLHFAPHCFDRETGELREDAVPTLELSRCLNDVHCIVAGCVKDEDGPRQRFYKMPKRSAQLLSWCHNLRLDAANMGSGEHHVCDRHFETQCINHQKLLRPGARPTLHLGHDEPIELMPNPAEWDATDAAAAVDNVCCVPNCGLAKDEEEDVQLFAFPKLRSLAEKWLQNIRLENISREQLMRLRICGAHFDDSCLESNGRPQLGAMPTLQLGHEDNGNIHRSTDASAVKAKKFCNRSGSSYDCCYPQCVELQKSYLRISYDLPQSEALRLKWLEYMGLEKTEEKLLKLCPLHLVLLYDHSVEHFAEEHTPEQQLDANYEDSRNSVRLRVISCAVAGCRTLKPRDGGILYGLPQRRDVLEMWLHNMQLVFYEQQRYVYKICSKHFEPCCFMDSTRRLKPWTMPTLELPPRDAEEAPIYPNPSEQEWQRMNELLAVEQLQPQPEEQQQPEELCNLLEPIVKMEHIERDEDEEECHEYQEQQEEELQPDNVDDNSQQPLALEVLLEVGHVEKCTTYEQMDNEANLSYAEQQQHLIHGYGKGAGSSGHLGSNGFKYTARHCSVQGCDVTVNDVNGNIKLHKFPTSLDAMEKWKHNTQVEVDLNYSWRFRICSYHFTEECFHGARIKRGAMPTLSLGPRRPLKIYDNEFGTTLPLPEPEQLQLKEEKQVSRPIKDIDISLRLPEPAPPRKSSKFCQVDGCPNHLTSENLTLHKFPHDVDMCAKWQHNTQVPFDPEYRWRYRICSAHFEPICLLNMRLLHGSVPTLKLGPRAPRELFDSDFEAINLRLDKQKNSSGEQQFPIKLEQDFQEEEEAELSYLVPEMQLHEDMEQAHGRSSNWEELRLPSIKQEAEEQSVTSYNPVKSGYDKCSLVHCQRQRSQHGVHIYKFPRSRQQQQRWMHNLRIKYDERRPWKTMICSVHFERSCIRLRKLCSWAVPTLELGDNVPLEIYTNEQSRQQLEVGSDCEDMPLEDGYEDDDYDDDLAQQMANEPLVKRERRSRLDPLPPGQLPPWKIKVCSLPYCRSPRGDGIKLFRLPNNTSSIRKWEQATGMRFTEAQRNTKLICSRHFDPQLIGVRRLMYNAVPTLNLGPRSGESSAALLPDVGPRCCMLDCQAEGKDAKLHKFPSDPMLLHQWCHALNLSDIQRYRGKHICALHLPAKTPNCIVCGIEQLQLPLLDFPENRNLRAKWCYNLKIEPIAKWDNSRQICSKHFESYCFTQPGQLQPEAAPTLHLRHNDSNIFLNDYAITDDSKMLRIKDEPLDSDDLML

Similar Transcription Factors

Sequence clustering based on sequence similarity using MMseqs2

100% Identity: iTF_00601834;
90% Identity: -
80% Identity: -