Basic Information

Insect: Drosophila ezoana
Gene Symbol: -
Assembly: GCA_035045725.1
Location: JAWNOU010000005.1:6238552-6252623[-]

Transcription Factor Domain

TF Family: THAP
Domain: THAP domain
PFAM: PF05485
TF Group: Zinc-Coordinating Group
Description: The THAP domain is a putative DNA-binding domain (DBD) and probably also binds a zinc ion. It features the conserved C2CH architecture (consensus sequence: Cys - 2-4 residues - Cys - 35-50 residues - Cys - 2 residues - His). Other universal features include the location of the domain at the N-termini of proteins, its size of about 90 residues, a C-terminal AVPTIF box and several other conserved residues. Orthologues of the human THAP domain have been identified in other vertebrates and probably worms and flies, but not in other eukaryotes or any prokaryotes [1].
Hmmscan Out: # of c-Evalue i-Evalue score bias hmm coord from hmm coord to ali coord from ali coord to env coord from env coord to acc

1 29 3.5 5.4e+03 -1.6 2.3 49 63 346 364 324 379 0.57

2 29 6.6e-15 1e-11 45.6 4.3 1 86 572 644 572 645 0.85

3 29 4e-15 6.2e-12 46.3 4.6 1 87 672 741 672 741 0.83

4 29 9.9e-16 1.5e-12 48.2 0.4 1 87 763 835 763 835 0.85

5 29 8.6e-16 1.3e-12 48.4 5.7 1 87 933 1003 933 1003 0.83

6 29 9.1e-15 1.4e-11 45.1 3.3 1 86 1027 1098 1027 1099 0.82

7 29 8.3e-13 1.3e-09 38.8 0.9 1 87 1134 1202 1134 1202 0.80

8 29 1.2e-10 1.9e-07 31.9 1.2 1 86 1251 1320 1251 1321 0.76

9 29 7.4e-15 1.1e-11 45.4 0.1 1 86 1348 1417 1348 1418 0.81

10 29 7.9e-14 1.2e-10 42.1 0.8 1 86 1439 1508 1439 1509 0.81

11 29 1e-14 1.6e-11 44.9 1.8 1 86 1536 1607 1536 1608 0.86

12 29 3.5e-13 5.3e-10 40.1 1.7 1 85 1680 1748 1680 1750 0.82

13 29 1.3e-12 1.9e-09 38.3 0.1 1 86 1773 1841 1773 1842 0.81

14 29 4.4e-14 6.7e-11 42.9 0.7 1 87 1999 2068 1999 2068 0.80

15 29 1.4e-11 2.2e-08 34.9 0.1 1 62 2123 2182 2123 2200 0.78

16 29 0.0032 5 8.1 0.0 1 58 2204 2254 2204 2278 0.81

17 29 1.7e-12 2.6e-09 37.9 1.7 1 87 2293 2363 2293 2363 0.85

18 29 3.8e-14 5.9e-11 43.1 1.1 1 86 2422 2491 2422 2492 0.82

19 29 8.6e-13 1.3e-09 38.8 0.6 1 86 2527 2598 2527 2599 0.81

20 29 1.6e-12 2.5e-09 37.9 1.7 1 87 2609 2680 2609 2680 0.82

21 29 1.5e-12 2.2e-09 38.1 0.0 1 86 2703 2773 2703 2774 0.81

22 29 7.5e-05 0.12 13.4 0.1 1 58 2805 2855 2805 2875 0.82

23 29 4.8e-15 7.4e-12 46.0 0.2 1 86 2894 2966 2894 2967 0.80

24 29 9.5e-14 1.5e-10 41.9 0.2 1 86 3108 3180 3108 3181 0.84

25 29 3.8e-14 5.9e-11 43.1 1.5 1 86 3246 3316 3246 3317 0.82

26 29 5e-14 7.7e-11 42.8 4.5 1 86 3431 3501 3431 3502 0.85

27 29 7.4e-13 1.1e-09 39.0 0.1 1 86 3593 3662 3593 3663 0.84

28 29 1.2e-09 1.8e-06 28.8 1.1 1 58 3680 3728 3680 3736 0.86

29 29 3e-08 4.7e-05 24.2 2.5 19 87 3746 3803 3734 3803 0.75

#	of	c-Evalue	i-Evalue	score	bias	hmm coord from	hmm coord to	ali coord from	ali coord to	env coord from	env coord to	acc
1	29	3.5	5.4e+03	-1.6	2.3	49	63	346	364	324	379	0.57
2	29	6.6e-15	1e-11	45.6	4.3	1	86	572	644	572	645	0.85
3	29	4e-15	6.2e-12	46.3	4.6	1	87	672	741	672	741	0.83
4	29	9.9e-16	1.5e-12	48.2	0.4	1	87	763	835	763	835	0.85
5	29	8.6e-16	1.3e-12	48.4	5.7	1	87	933	1003	933	1003	0.83
6	29	9.1e-15	1.4e-11	45.1	3.3	1	86	1027	1098	1027	1099	0.82
7	29	8.3e-13	1.3e-09	38.8	0.9	1	87	1134	1202	1134	1202	0.80
8	29	1.2e-10	1.9e-07	31.9	1.2	1	86	1251	1320	1251	1321	0.76
9	29	7.4e-15	1.1e-11	45.4	0.1	1	86	1348	1417	1348	1418	0.81
10	29	7.9e-14	1.2e-10	42.1	0.8	1	86	1439	1508	1439	1509	0.81
11	29	1e-14	1.6e-11	44.9	1.8	1	86	1536	1607	1536	1608	0.86
12	29	3.5e-13	5.3e-10	40.1	1.7	1	85	1680	1748	1680	1750	0.82
13	29	1.3e-12	1.9e-09	38.3	0.1	1	86	1773	1841	1773	1842	0.81
14	29	4.4e-14	6.7e-11	42.9	0.7	1	87	1999	2068	1999	2068	0.80
15	29	1.4e-11	2.2e-08	34.9	0.1	1	62	2123	2182	2123	2200	0.78
16	29	0.0032	5	8.1	0.0	1	58	2204	2254	2204	2278	0.81
17	29	1.7e-12	2.6e-09	37.9	1.7	1	87	2293	2363	2293	2363	0.85
18	29	3.8e-14	5.9e-11	43.1	1.1	1	86	2422	2491	2422	2492	0.82
19	29	8.6e-13	1.3e-09	38.8	0.6	1	86	2527	2598	2527	2599	0.81
20	29	1.6e-12	2.5e-09	37.9	1.7	1	87	2609	2680	2609	2680	0.82
21	29	1.5e-12	2.2e-09	38.1	0.0	1	86	2703	2773	2703	2774	0.81
22	29	7.5e-05	0.12	13.4	0.1	1	58	2805	2855	2805	2875	0.82
23	29	4.8e-15	7.4e-12	46.0	0.2	1	86	2894	2966	2894	2967	0.80
24	29	9.5e-14	1.5e-10	41.9	0.2	1	86	3108	3180	3108	3181	0.84
25	29	3.8e-14	5.9e-11	43.1	1.5	1	86	3246	3316	3246	3317	0.82
26	29	5e-14	7.7e-11	42.8	4.5	1	86	3431	3501	3431	3502	0.85
27	29	7.4e-13	1.1e-09	39.0	0.1	1	86	3593	3662	3593	3663	0.84
28	29	1.2e-09	1.8e-06	28.8	1.1	1	58	3680	3728	3680	3736	0.86
29	29	3e-08	4.7e-05	24.2	2.5	19	87	3746	3803	3734	3803	0.75

Sequence Information

Coding Sequence: ATGTCACAACACAACAATCAACCGCATtcgcatcagcatcatcactactatcagcagcagcagcaccacctccagcaacaacaacaacaacaacaccaccaccaccagcagcagcagcaacagcagcagcagcagcatttgcagcataaacaaatacaacagcagcacagtTGGTACTCACATGTTGCTTCCTACCCGCCCCACCAAGCGCACGCCGCCGCTGCTTATGCGGCGCCctgcaagaacaacaacaacaataataacaacaatattatgAATGCATACGGCACGGGCGCTGCCAGCGCGCACTATTATGGCGCTGCTCCTACTGCTGGGACTGGGGTGGGCTATAACCTTGAGGCCAATACTGTGGCCTATGCGCACAACCAGCTGCTgcaataccaacaacaacaacagcagcagcagcaacagctcagTCAACGCTCGTATATGCCGCACAGTTTAATGCATGGCTCGTATCCTTATATCAAGAGCGAGCCATTGGAACTGCCAGATGATAGACAACGccatcaacaacatcaacagcaccagcagcaacaacaacaacaacattttcagAATCCAATGGCCCCGCCACCAGCGCCCGCCGTCAATCGTCACACGCTCGATGCTAGCGGtgaaatgataataaaatCGGAACCCATTGACGAACATGCGTTCAGGTCCAACTATATCGATGACAATACGCCCTTTGCCGATTTTAGTAAATTTCCCGAGTGTGGCGACGACATGCTAAGTCCCAAGGTTGAGCTAACGGTTAAGGACGAGGCTTATGGCAGCCAAAAGaaCCCGCTCAGCTATCCGCGCCGCAAGCTGCAAACTGAGCGCCCTTCGGAGAGTCTGCCCATATGCCAACGCTGCAAGGAGGTCTTCTTCAAGAAGCAGGTCTATCTGCGTCATGTGGCCgagagcagctgcagcatacACGAGTATGAATTTAAGTGCAACATCTGCCCTATGTCCTTCATGGGCGCTGAGGAGTTGCAGAAGCACAAGCAACTGCATCGCGCGGACAAGTTCTTTTGCCACAAGTACTGTGGCAAGCACTTCGACAACATTGCCGAATGCGAGTCGCATGAGTATATGCAGCATGAATACGATAGCTTTGTGTGCAATATGTGCTCTGTAACGTTTTCAACTCGGGAACAGCTTTATGCTCATCTGCCGCAGCACAAGTTTCAGCAACGTTACGATTGCCCTATATGCCGCTTGTGGTATCAAACGGCACTAGAGTTGCACGAGCATCGACTGGCGGCGCCCTACTTTTGTGGCAAGTATTATCCAGCagcacatcagcagcagcagcaacaacaacatccacagcagcaacacccgcagcagcagcaaggcaACTACAAACTGCAGGACTGCCACATGGGCACCATAGAAATGACAGCACCGCATAACAAGACAAACAATGCCTTGCCTGCAACAGCGGCGCTTAGTTccttgctgcagcagcgccaggCGAATGCGGATAGTGCCGCGCTGTATGCCTCGACGCTGAAGAGCGAGGCTAATGTTAAGTTGGAGCGCAGCTATAGCAACTCCACCAGCGAGTCTGGTTACAGTTTGCACGAGAGTAGTTATAACAATGCCTACGGCAGCGATAATTCGTTGCATGGTGGCAACGCAGCAATTGGTGGCCCGCAGGCACACTCCTCCACGCTGGACGAATCGGAGGATGCGCTGTGCTGTGTGCCGCTGTGCGGTGTGCGCAAAAGCACCAGCCCCACGCTGCAGTTCTTTACATTTCCCAAGGATGAAAAGTATCTGCATCAGTGGCTGCACAATCTCAAAATGTTCCATATTCCGGCCTCAAGCTATGCCAGCTTTCGTATCTGCAGTATGCATTTTCCTAAGCGATGCATCAATCGATATTCGTTGTGTTATTGGGCGGTGCCCACATTCAACTTGGGACACGATGATGTAGCCAATCTGTATCAGAATCGCGAGCTGACTAACACCTTCACCACCGGCGAGGTGGCGCGCTGCAGCATGCCCAACTGTACCAGCCAACGCGGCGAGAGCAATCtcaagttttataattttcccAAGGACATCAAGAGCCTGATCAAGTGGTGCCAGAACGCACGTTTACCCGTCCAGGCCAAGGAGCCGCGTCATTTTTGCAGTCGCCATTTCGAGGAGCGCTGCATTGGCAAGTTCCGGCTGAAGCCCTGGGCTGTGCCCACTCTACATCTGGGTGCCCAGTACGGCAAGATTCACGACAATCCCAAGAACCTGTATGTGGAAGAGAAACGCTGCTGCCTTAACTTttgccgtcgcagtcgctCTTCGGACTTTAACATGTCATTGTATCGCTTTCCCAGAGATGAAGTACTGCTGCGACGCTGGTGCTATAATCTGCGGCTCGATCCGGCTGTTTACCGCGGCAAGAACCACAAAATTTGCAGCGCTCACTTTATCAAGGAAGCCCTCGGATTGCGCAAACTGTCACCAGGTGCTGTGCCCACTCTGCATCTGGGCCACAATGACACCTTCAATATCTACGAGAACGAATTATGGCCACCGCCGACGCCCTCTACGCCCACCCACAATCatcagcagcaattgcagcagcatcagctgcagcagcatcaacagcaacttCAGCAACATGTACATCATAATAAATATCAGCGTCATTCGGCGGCATCCACATCATCGTCGGCCAGCTCGGCCTCGCACTATGTGGATCCAGAACTGAGTGCCTCCTACATGGGCATGAGCGCTTCATCCTCTGGCCTCAATGTCAGCGACAGCATGGACGTGTGCTGTGTGCCCAGCTGCGAGAGCAAACGGCACAATAATGAGAACATCACATTCCATACCATACCTAGGCGGCCAGAGCAGATGCGTAAATGGTGCCACAACTTGAAGATACCCGAGGACAAGATGCACAAGGGCATGCGAATATGCAGTCTACACTTTGAACCCTATTGTATTGGCGGTTGTATGCGACCGTTTGCGGTGCCCACACTGCATCTGGGCCACGATGACGAGGACATTCATCGTAATCCGGATGTGATTAAGAAGCTGAACATACGCGAAACCTGTTGCGTTGCCGTTTGCAAGCGTAATCGAGATCGGGATCATGCCAATCTGCATCGTTTTCCCAGCAATGTCGCCCTGCTGACCAAGTGGTGCGCCAATCTGCAGCGACCCGTACCGGATGGCACCAAACTTTTCAACGATGCTATCTGCGAGGTGCACTTCGAAGATCGTTGTCTGCGCAACAAGCGCCTGGAGAAGTGGGCAGTCCCCACGCTTGTGCTAGGCCACGAGAATATTGCCTACCCGCTGCCCACGCCCGAGCAGGTGGCCGAGTCCTATGCGCGTCCCTGTGCGCCCAACAACGGCGAGGAGCAGGGTGAATGCTGCGTGGAGACATGCAAGCGTAATCCTAGCGTAGATGACATCAAGCTCTATCGTCCGCCCGAAGAATCACAGGTGCTTGCCAAATGGGCGCACAATCTGCAGCTGGACATTGCCCAGCTTCCTAGCATGCGAATCTGTAATCTGCACTTTGAATCCCACTGCATTGGCAAACGCATGCGACCGTGGGCCATACCCACCCTTAATTTGGCCAGCAACATTGAGAATCTCTTCGAGAATCCTGAACATCAGATGCTCTACAAGCGTCGCACGCATCTCAACACGGCCAGAGCCGCAAATCGCAGCGCTGGCGCTGACGGAGCCGTCATGAAGGCCTCTTGGGTGCCACGTTGTTGCCTGCCGCACTGCCGTAAGGTGCGCGCTCTGCACAATGTCCAGCTGTATCGCTTCCCCAAGGTCAACCGCACAACGTTAGCTAAATGGGCGCATAATCTGCAAGTGCCGCTGGTCGGCAGCGCCCAAAGGCGTTTATGCTCCGCCCACTTTGAGCCGAATGTGCTGAGCAAGAAATGCCCGGTGCCCTTGGCGGTGCCCACGCTGGATCTCAATACGCCACCGGGCTACAAGATTTACCAAAACCCAGCCAAGGTGCGGGCTAACAAGCTGTGTTGGCAGCGCGTCTGTATTGTGGAGAGCTGCCGTCGACAGCGGGCCCAGGGCGTACAGCTCTTCCGGCTGCCGAACAGTCGCACCCAGTTGCGCAAGTGGATGCACAATCTTCGCATGCTGCCGAGAGGCGCCATGCGGCAGCAGTATCGCATCTGCTCGCTGCACTTTGAGGCGCACTCGTTTAACGGCAAGCGTCTGAGCACAGGCGCAATTCCAACGCTGGAGCTGGGCCATCAGGATGACGATATTTATCCCAATGAGGCGCAGTCGTTTGTCGAGGAGCACTGCGCCGTAGAAGGCTGCGATGCGTCCAAGGAGCAGCCGGATGTGCGTCTCTTCCGCTTTCCCAACGACGACGAGGATCTGCTCTGGAAGTGGTGCAACAATCTTAAAATGAATCCCGTTGACTGCTATGGCATGCGCATCTGCAACAGGCACTTCGAGCCAGACTGCATTGGGCCCAAGCATCTGTACAAGTGGGCCATTCCCACTTTGGTTCTGGGGCACGATGATAGCCAGATCGAGCTGATACCCAATCCCAAGCCGGAGGAACGCTATGCTGATCCTGTGTTCAAGTGCTGTGTGCCCACCTGCGGCAAAACGCGCAAATTTGATGAGGCGCAAATGAATAGCTTTCCCAAGGACCCATCGCTCTTCCAGCGCTGGCGTCACAATCTGCGGCTGGAACATCTCAACTTCAAGGAGCGCGAGCGCTACAAGATTTGCAATGCGCATTTTGAGGACATTTGCATAGGCAAGACGCGTCTCAATATTGGCTCCATACCCACGCTGGAGCTGGGCCATGAAGAGACCGAAGATCTGTATCAGGTTAATCCCGAGGAGCTGCAGAGCAACTTGTTTGGACGCCCGAGACGCGTGCATGAGAATCAGCGACTGAGTATCAAGCAGGAGCTGGATGAGGACATCAAGCCGGACATAACCATGTCAGAGGCCACGGATACAAACACAACACAGGTGAAGATCAAGAAATCTGTGTTGGACTTGAAGTGCTGTGTGGCCAGCTGCGGTCGAAGCCGGCTGGAGCATGGTGCTCGCCTATTTCCCTTTCCCActggcaagcagcagcagaccaAGTGGCGCCACAATCTCCGCCTTAGCGCCGCCGACGTAGACAGAACAACGCGCGTTTGCAGCGCCCACTTCAATCGACGCTGCATCGATGGAAAACAGCTGCGAGCTTGGGCCATTCCCACACAGCAGCTGGGCCACCATGAACAAAACATATATGAGAATCCAAAGAATATACCGGGCTTCTTTACGCCCACCTGTGCGCTGGCGCACTGTCGTAAACGACGAAGCATTGACAATGATTTGCGCACTTACCGCTATCCGCGCAACGAGGAGCTGCTCGAAAAGTGGCGCGTGAATCTGCGTCTGGCGCCGGATCAATGTCGCGGACGCATTTGTGCGGATCACTTTGAGCCCATGGTACGCGGCAAGCTAAAGCTGAAGACGGGCGCGGTGCCCACGCTGAAGCTTGGCCATGATGAGGGCGTAGTCTTTGACAATGAGGCCATTAAAGTAGGAatgcagcaggaggaggaagaTGAGGAGGAGGCGGGCAGCTTGGAGTCGCTGGGGAAGATAAAAATTGAGAAGCAGGAGAAGGAATCCCTAGAGCAGCAGTTGGAAAAGAATGATGAGGATGAAGAGGACGAGCAGCTGCAGAAGGTAGAAGATCCTGATGATGAcatggagcaggagcaggatgAGCAGGAAGAGGATCTGCAGGATCATGGCTATTTTGATCCCCTTGAGCTAGTGGAAACCTTTGCCGAACAGCACAGCGATGACAATTCCGCTGACAATTATCATCTCGaagctgatgatgatgatgatgatgaagataTATCTGGCAATGAtgatgagctgctgctgccagacACTGTTCCAATACAGCTGCCGCCACGCCGCGAAAAGGCGGTGAACAATGTGACCCCTATTTGTTGCTTGAAACATTGCCGCAAGGAGCGTACCGCAAGTCATCAGCTGAGTACTTTTGGTTTTCCCaaggatcagcagcagctgcttaaaTGGAGCGCCAATCTGCAGCTGGATCTCGTCGATTGTGTGGGACGCGTGTGCATCGAACATTTCGAGGCGGAGATGCTCGGCACTCGTAAGCTAAAGCAGAATGCGGTGCCCACTTTGAATCTGGGACATGCCACGCCGTTGAGCTATAGCTGCAATGGCCAATCCTTGAGCATATACGATGCACAGCCGCAGCATTCGGTTTTTCGGCTTTGGAGCCTGAAACACTGCCGCAAAAGGAAGCTGCTGACGATGCCTCCGGATCCGGCGACGACTAAACGACGCTGTTGCCTGCCCAGCTGTGGCAAAGAGCCGGAGCTGCATGGTGTTCAATTGAAGCGACTGCCCAAGGATCGACTGCTGCTACGCAAGTGGCTGCACAATCTGAAGCTGCCGGCGCACATGGACACCAGACACTCGTTTCTTTGCGAGGAGCACTTTGAGCCACAAGCGACGCTGCCTACCCTGAAGCTGGGCCACGCGGCTAACAACATATATCGCAATGGCAGTTCGGCCTTATCCAGTGGCTGCCTGGTGCCCAGCTGTCCGTGTGCACGGCTCAATCTATATCGCTGCTATGCTCTGCCCGAGCATCCGCAGGTGCAGCAGGCCTGGTTGCAGTGGCTGCaactgccgccgccgcagctggCTAGCCTTGCCCAGCTCTGCGTCATGCACTATATGCAGCTGTTTGAGCAGGTGCCGCTACCCGCGGATCTGCCTGAGTCAGTGCTGCGCCAACTGCAGGAAACCTACGATCAAATATCCAGCTCCAGCATGGCCATGAAACTGCGCTGTGCTGTGCCGGGCTGCTACTCCAAATACACGGACAATGTGCGTCTCACCAAACTGCCCGTGTGCCCGCAAACCTGCGCCCAGTGGGTACACAATACCAAAATTAAGTACGATCCAGAGCGCCATTACATGTATCGCATCTGCATGCGGCACTTTGAGCCGCAATGCCTGGGTGCAGTACGTCCTAAGCTGTGGGCGATGCCTACTTTGCATCTTAACCATAACGATGCGGATATATATCAGAATACCATGTTGGATAGCTCGGATGCCATGCCGGTAGCCGAGTCTATACCGCTGACGTTGCCGCTGCGCATCAAGACAGAGCTGCCGCTAGCTTTATCAGTCAGTCCCAGTGCCAGTCCCAGTCCACGCGGCAAACTGCGCACCTGTTGCATTCCCACCTGCGGCCAGCAAGCCAATGCCCTAACGCGTCTGTTTCGCTTTCCCAGCGCCGAAACGGCGCTGCTTAAATGGCTGGTGAacacacaacagcagccacgccTCGTTGATACGCAGAATCTCTTTGTATGCCAGCGTCACTTCGCGGCGGAGGCGATTTGCAAGAAGCAGCTACAAAGTTGGGCAGTGCCTACCCTAAGTCTGGGCCATGAGGGCCACATCATACCGAATGCCAAGCACAATGGCAATATTGCCGACAGCCAGGAGAACAAGCAGGCGCTGCAGTACATCTGGGCCAATTATTGCTCGGTGCTCACCTGCTTCCAACAGCGCAGCGAGCAGGTTCGTCTCTATGCCTATCCCACAGATCGGCCCACCATACGAAGGTGGGCGGCCAACTGCAAGCATCGCTCCATGCAGGCCAGCAGCGATGGATTTCAGGTCTGTCAGTCACATTTTACAGCAGACTGCTTTGACCCTGATACCGGGGAGCTGAAGGAAGACGCGGTGCCCACACTGGAGCTGAGCCGGCCTGTCCATGAGTTGCGCTGCTTGGTCAATGGCTGCGTTAGGGAGAAGGATGCAGCGCGTTGTCGTTTTTTCAAAGTGCCCAAGCGTGCCTCACAGCTGGAGGACTGGTGCTACAATCTGCGCATTGATGCTGCGTCAATAAGCGGCCAGGAGGTGCACGTGTGTGAGCGCCACTTCGAGGCGCACTGTTTCAGTGCGTACAAACTGCGTCCGGGTGCACGACCTACACTTCATTTGGGCCACGATGATGAGTTGGATTTGTTGCCGAATCCGGCAAAGTGGGAAGAGGATGTGAATGTATGCTTTGTGCCCAGCTGTGGACGCTCCAAGGATATGGATAATGTGGAGCTATTTGGACTGCCCAGGATAAAGGGGGTCTTGGATAAATGGCTGCAAAATTTCCGCCTCGAGCCGAGTAGGGAGCAGCTGCAGGGCATGCGGATATGCAGCGCACATTTTGAGGCCAGCTGCATAGAGAACGGCCGTCTACATTTAAGTTCGGTGCCCACGCTGCAGCTGGGCCACGATGAGTTGGATAATATACATCAAAGCGCGGAACTGCCGTCATCGCAGCTTAAAGGCAAAAGATTAGCCATGAACTACGACTGCTGCTATCCACAGTGTATGGAGCTGCAAAAGAGTTATCAAAGAATCTCATATGAGCTGCCCCAGCAGGAGGCACTGCGTAACTTGTGGATGTCGTATTTGGGCCTGGAGCAGCAAAATCAGCAACCGCTCAAGCTCTGCCCGCTGCACTTGATCATGCTTTATGAACACAGTCTCAACAATTTCCCAGAGCATTCATCAGAGGAGCAACTGCTGGACGCCAATTACGAGGCTGCGCGCAATAGCGTGCGCATACGGATTATCAGCTGTGCGGTTCGTGGCTGCAGGACCCTCAAACCACGCGACGACTACCGCCTGCACGCCATGCCTACGCGTCGGGATGTCCTCCAGATGTGGCTAGACAACATGCAGCTTGTGTTCTACGAGCAGCAGCGTTATATGTATAAGGTATGCAGCAGACACTTTGAGGCTACCTGCGTAACAGAGACCACTCGCCGTCTAAAACCCTGGAGCATGCCGACGTTGGAGTTGCCAGAACGTGACCCAGACGCTCCGCCCTTTCATCAGAATCCTACGGAGGAGGAGTGGCAGCGCATGAATGAGCAGATAGGCAGCAGCGAGGCAGTGCCTATGTTAGAGCCCGTGTTCAagctggagccggagccaACTGTCAAGCAGGAGTTGCACCCTATTGTCAAGCTGGAGCAGAATGCGCAGCCAGAACAGCTGTATGAGGGGGAGGAGTACGAGGCCAACGACCAGCAGCAAGCGCTAGAGGTGCTGCTCGAAGTGGGTCACGTTGAGAAGTGCACCACATACGAGCAAATGGACACAAAACCAATTATAGGCTATGCCGATAGCCTGTCTCATAATTCACTGGGCCCGACGACAACAGTGGGCAGCGCCTGCATTGTCAACGGTAACGGACTCACCTACAGCGCGCGCCACTGCAGCGTGCGGGGTTGCGATGTGACCTCTCTGGATGTGAATGACAGTCTCAAGCTACACAAGTTTCCCACATCGCTGGATGCCATGGAAAAATGGATGCACAACACCCAGGTGAATGTGGACATCAACTTTGCGTGGCGGTTTCGCATCTgcagtttgcattttctacCCGAGTGCTTTAATGGTTCGCGTATCAGACGTGGGGCCATGCCCACGCTGCGTCTGGGATCGCGTCGCCTAGGGGATATCTACGACAATGAGTTCAATGTGCAGCCAGAGCAGGCGAGTGTTGATCAGCCGGCTGAGGCGTCAGCAGACGATGTGTTGCCCACTGAACCGCACGATGGCGCGACAGAGTTTAATATAAATCTGCATTTGCCCTGCCCCGCACCACCGCGCAAGTCCAGCAAATTCTGTCAGATCGATGGCTGCTCCAATCATTTGACTAGCGAAAATCTTACGCTGCACAAGTTTCCCCACTCGGCGGACATGTGCGCCAAATGGCAGCACAATACACAGGTGCCATTCGATCCGGAGTACCGCTGGCGTTATCGTATCTGCAGCGCACACTTCGAGCCCATCTGCCTGGGAAACATGCGGCTGATGCATGGCAGCGTGCCCACACTTAAACTGGGCGCCCGGGCGCCTAAGCAGCTCTTTGGCAATGACTTTGCGGCGATTAGCTTGCGCCTGGATAAGGAAAAGCGCAGTGCCGAACAGAGCTTGCCAGTGAAGCAGGAGCAAGTGGAAGATGATCAGGAGCACTATGATCAAGAGCAGGAGGATCTGAGCATGCTGGTAccagagctgcagctgcacgaGGGTGACGACGAGCAGGAAGACAATCAGTTTATATACACCAACAGTTGGAGAGAttcgcagcaacagctgcagctgcagctacgTCTGCCCAGCATTAAGCAGGAGAAAGGCACCATCTATAATCCCGTCAAGTCTGGCTATGACAAGTGCTCGCTGGTACACTGTCAGCGACAGCGTTCACAGCATGGCGTCCACATTTATAAATTCCCACGCTCGCGCCAGCTACAGCATCGCTGGATGCACAATTTACGAATCAGATATGACGAGCGGCGACCTTGGAAGACAATGATATGCAGTGTACACTTTGAGCCGCACTGCATACGCCTGCGTAAGCTGCGTCCGTGGGCGGTACCCACACTAGAGCTGGGAGACAATGTTCCGCAGGATCTGTACAGGAACGAGCAAAGCCAACAGCAGTTTgtgcagcagcgcagcagcgacgccgaaATGGGCAGTGAGGGCGAGGACTATGATGCGGAGCTGGAGGACACCATACTGGAGGAGTACGACGATGAGtatgatgataatgataatgctgAACAATACCCGCCTGAGCCACACATCAAGCGGGAGTATCGCTCACGCTGCGATCCACAGCCGCCAGGTCAGCTGCCACCCTGGAAAATTAAGCAATGCTGTTTGCCCTATTGCCGACGCCCACGCGGCGATGGCATCAAGCTTTTCCGGCTGCCCAACAATATCAGCGCCATACGCAAATGGGAGCAGGCGACAGGCATGCGCTTCTATGAGTCCCAGCGTAACACAAAACTCATCTGCAGTCGTCACTTTGATCCGCAACTTATTGGTGTGCGTCGCCTTATGTCCAATGCGGTACCCACCCGCAATCTGGGTCCAAACAGTGAGGAATCCGAGCTGCCAGCGAGCAGTCCACGCTGCTGCATTAAGGATTGCCAACCAGATGGACATGTCAAGCTGCACAAGTTTCCCAGCGATCCCGAGCTGCTGCATCAGTGGTGTCAGGCGCTCAATTTGCGGGATGAGCAGCGCCACGCCGGCAAGTACATTTGTGCCGTGCACCTGCCCACCAAAGCAATGAGCTGTCTCATTTGCGGTGTGGAGGATGTACAGCTACCCATGCAGGACTTTCCCGAGCATCGCAATCAGCGAGTCAAATGGTGCTACAATTTGAAAATCGAACCAATAACCAAGTGGGACAACTCGAAGCACATTTGCTGCAAGCACTTTGAGAGCTATTGCTTCATTAAGCCGGGTCATCTGTTGCCGGACGCCATGCCCACGCTGCATTTAAAGCACAACGACAGCAATATATTCCTCAACGAATCTGCCATAGAGAGCAGCAGGCTGCTGCGCGTCAAGGACGAGCCTATGGAGTGTGAGGATCTGATGCTGTAA
Protein Sequence: MSQHNNQPHSHQHHHYYQQQQHHLQQQQQQQHHHHQQQQQQQQQQHLQHKQIQQQHSWYSHVASYPPHQAHAAAAYAAPCKNNNNNNNNNIMNAYGTGAASAHYYGAAPTAGTGVGYNLEANTVAYAHNQLLQYQQQQQQQQQQLSQRSYMPHSLMHGSYPYIKSEPLELPDDRQRHQQHQQHQQQQQQQHFQNPMAPPPAPAVNRHTLDASGEMIIKSEPIDEHAFRSNYIDDNTPFADFSKFPECGDDMLSPKVELTVKDEAYGSQKNPLSYPRRKLQTERPSESLPICQRCKEVFFKKQVYLRHVAESSCSIHEYEFKCNICPMSFMGAEELQKHKQLHRADKFFCHKYCGKHFDNIAECESHEYMQHEYDSFVCNMCSVTFSTREQLYAHLPQHKFQQRYDCPICRLWYQTALELHEHRLAAPYFCGKYYPAAHQQQQQQQHPQQQHPQQQQGNYKLQDCHMGTIEMTAPHNKTNNALPATAALSSLLQQRQANADSAALYASTLKSEANVKLERSYSNSTSESGYSLHESSYNNAYGSDNSLHGGNAAIGGPQAHSSTLDESEDALCCVPLCGVRKSTSPTLQFFTFPKDEKYLHQWLHNLKMFHIPASSYASFRICSMHFPKRCINRYSLCYWAVPTFNLGHDDVANLYQNRELTNTFTTGEVARCSMPNCTSQRGESNLKFYNFPKDIKSLIKWCQNARLPVQAKEPRHFCSRHFEERCIGKFRLKPWAVPTLHLGAQYGKIHDNPKNLYVEEKRCCLNFCRRSRSSDFNMSLYRFPRDEVLLRRWCYNLRLDPAVYRGKNHKICSAHFIKEALGLRKLSPGAVPTLHLGHNDTFNIYENELWPPPTPSTPTHNHQQQLQQHQLQQHQQQLQQHVHHNKYQRHSAASTSSSASSASHYVDPELSASYMGMSASSSGLNVSDSMDVCCVPSCESKRHNNENITFHTIPRRPEQMRKWCHNLKIPEDKMHKGMRICSLHFEPYCIGGCMRPFAVPTLHLGHDDEDIHRNPDVIKKLNIRETCCVAVCKRNRDRDHANLHRFPSNVALLTKWCANLQRPVPDGTKLFNDAICEVHFEDRCLRNKRLEKWAVPTLVLGHENIAYPLPTPEQVAESYARPCAPNNGEEQGECCVETCKRNPSVDDIKLYRPPEESQVLAKWAHNLQLDIAQLPSMRICNLHFESHCIGKRMRPWAIPTLNLASNIENLFENPEHQMLYKRRTHLNTARAANRSAGADGAVMKASWVPRCCLPHCRKVRALHNVQLYRFPKVNRTTLAKWAHNLQVPLVGSAQRRLCSAHFEPNVLSKKCPVPLAVPTLDLNTPPGYKIYQNPAKVRANKLCWQRVCIVESCRRQRAQGVQLFRLPNSRTQLRKWMHNLRMLPRGAMRQQYRICSLHFEAHSFNGKRLSTGAIPTLELGHQDDDIYPNEAQSFVEEHCAVEGCDASKEQPDVRLFRFPNDDEDLLWKWCNNLKMNPVDCYGMRICNRHFEPDCIGPKHLYKWAIPTLVLGHDDSQIELIPNPKPEERYADPVFKCCVPTCGKTRKFDEAQMNSFPKDPSLFQRWRHNLRLEHLNFKERERYKICNAHFEDICIGKTRLNIGSIPTLELGHEETEDLYQVNPEELQSNLFGRPRRVHENQRLSIKQELDEDIKPDITMSEATDTNTTQVKIKKSVLDLKCCVASCGRSRLEHGARLFPFPTGKQQQTKWRHNLRLSAADVDRTTRVCSAHFNRRCIDGKQLRAWAIPTQQLGHHEQNIYENPKNIPGFFTPTCALAHCRKRRSIDNDLRTYRYPRNEELLEKWRVNLRLAPDQCRGRICADHFEPMVRGKLKLKTGAVPTLKLGHDEGVVFDNEAIKVGMQQEEEDEEEAGSLESLGKIKIEKQEKESLEQQLEKNDEDEEDEQLQKVEDPDDDMEQEQDEQEEDLQDHGYFDPLELVETFAEQHSDDNSADNYHLEADDDDDDEDISGNDDELLLPDTVPIQLPPRREKAVNNVTPICCLKHCRKERTASHQLSTFGFPKDQQQLLKWSANLQLDLVDCVGRVCIEHFEAEMLGTRKLKQNAVPTLNLGHATPLSYSCNGQSLSIYDAQPQHSVFRLWSLKHCRKRKLLTMPPDPATTKRRCCLPSCGKEPELHGVQLKRLPKDRLLLRKWLHNLKLPAHMDTRHSFLCEEHFEPQATLPTLKLGHAANNIYRNGSSALSSGCLVPSCPCARLNLYRCYALPEHPQVQQAWLQWLQLPPPQLASLAQLCVMHYMQLFEQVPLPADLPESVLRQLQETYDQISSSSMAMKLRCAVPGCYSKYTDNVRLTKLPVCPQTCAQWVHNTKIKYDPERHYMYRICMRHFEPQCLGAVRPKLWAMPTLHLNHNDADIYQNTMLDSSDAMPVAESIPLTLPLRIKTELPLALSVSPSASPSPRGKLRTCCIPTCGQQANALTRLFRFPSAETALLKWLVNTQQQPRLVDTQNLFVCQRHFAAEAICKKQLQSWAVPTLSLGHEGHIIPNAKHNGNIADSQENKQALQYIWANYCSVLTCFQQRSEQVRLYAYPTDRPTIRRWAANCKHRSMQASSDGFQVCQSHFTADCFDPDTGELKEDAVPTLELSRPVHELRCLVNGCVREKDAARCRFFKVPKRASQLEDWCYNLRIDAASISGQEVHVCERHFEAHCFSAYKLRPGARPTLHLGHDDELDLLPNPAKWEEDVNVCFVPSCGRSKDMDNVELFGLPRIKGVLDKWLQNFRLEPSREQLQGMRICSAHFEASCIENGRLHLSSVPTLQLGHDELDNIHQSAELPSSQLKGKRLAMNYDCCYPQCMELQKSYQRISYELPQQEALRNLWMSYLGLEQQNQQPLKLCPLHLIMLYEHSLNNFPEHSSEEQLLDANYEAARNSVRIRIISCAVRGCRTLKPRDDYRLHAMPTRRDVLQMWLDNMQLVFYEQQRYMYKVCSRHFEATCVTETTRRLKPWSMPTLELPERDPDAPPFHQNPTEEEWQRMNEQIGSSEAVPMLEPVFKLEPEPTVKQELHPIVKLEQNAQPEQLYEGEEYEANDQQQALEVLLEVGHVEKCTTYEQMDTKPIIGYADSLSHNSLGPTTTVGSACIVNGNGLTYSARHCSVRGCDVTSLDVNDSLKLHKFPTSLDAMEKWMHNTQVNVDINFAWRFRICSLHFLPECFNGSRIRRGAMPTLRLGSRRLGDIYDNEFNVQPEQASVDQPAEASADDVLPTEPHDGATEFNINLHLPCPAPPRKSSKFCQIDGCSNHLTSENLTLHKFPHSADMCAKWQHNTQVPFDPEYRWRYRICSAHFEPICLGNMRLMHGSVPTLKLGARAPKQLFGNDFAAISLRLDKEKRSAEQSLPVKQEQVEDDQEHYDQEQEDLSMLVPELQLHEGDDEQEDNQFIYTNSWRDSQQQLQLQLRLPSIKQEKGTIYNPVKSGYDKCSLVHCQRQRSQHGVHIYKFPRSRQLQHRWMHNLRIRYDERRPWKTMICSVHFEPHCIRLRKLRPWAVPTLELGDNVPQDLYRNEQSQQQFVQQRSSDAEMGSEGEDYDAELEDTILEEYDDEYDDNDNAEQYPPEPHIKREYRSRCDPQPPGQLPPWKIKQCCLPYCRRPRGDGIKLFRLPNNISAIRKWEQATGMRFYESQRNTKLICSRHFDPQLIGVRRLMSNAVPTRNLGPNSEESELPASSPRCCIKDCQPDGHVKLHKFPSDPELLHQWCQALNLRDEQRHAGKYICAVHLPTKAMSCLICGVEDVQLPMQDFPEHRNQRVKWCYNLKIEPITKWDNSKHICCKHFESYCFIKPGHLLPDAMPTLHLKHNDSNIFLNESAIESSRLLRVKDEPMECEDLML

Similar Transcription Factors

Sequence clustering based on sequence similarity using MMseqs2

100% Identity: iTF_00534610;
90% Identity: iTF_00490809;
80% Identity: -