Basic Information

Insect: Drosophila longiperda
Gene Symbol: -
Assembly: GCA_035042125.1
Location: JAWNLV010000093.1:552222-566241[-]

Transcription Factor Domain

TF Family: THAP
Domain: THAP domain
PFAM: PF05485
TF Group: Zinc-Coordinating Group
Description: The THAP domain is a putative DNA-binding domain (DBD) and probably also binds a zinc ion. It features the conserved C2CH architecture (consensus sequence: Cys - 2-4 residues - Cys - 35-50 residues - Cys - 2 residues - His). Other universal features include the location of the domain at the N-termini of proteins, its size of about 90 residues, a C-terminal AVPTIF box and several other conserved residues. Orthologues of the human THAP domain have been identified in other vertebrates and probably worms and flies, but not in other eukaryotes or any prokaryotes [1].
Hmmscan Out: # of c-Evalue i-Evalue score bias hmm coord from hmm coord to ali coord from ali coord to env coord from env coord to acc

1 28 1e-14 1.5e-11 44.9 4.2 1 86 575 647 575 648 0.85

2 28 3.7e-15 5.5e-12 46.3 4.6 1 87 675 744 675 744 0.83

3 28 9.1e-16 1.3e-12 48.2 0.4 1 87 766 838 766 838 0.85

4 28 8.1e-16 1.2e-12 48.4 5.6 1 87 935 1005 935 1005 0.83

5 28 1.1e-14 1.6e-11 44.7 3.4 1 86 1029 1100 1029 1101 0.81

6 28 5.4e-13 7.9e-10 39.3 1.5 1 87 1136 1204 1136 1204 0.80

7 28 6.4e-11 9.4e-08 32.7 1.7 1 86 1252 1321 1252 1322 0.75

8 28 5.8e-17 8.5e-14 52.1 0.4 1 86 1349 1418 1349 1419 0.82

9 28 6.6e-12 9.7e-09 35.9 0.9 1 86 1440 1509 1440 1510 0.81

10 28 5.5e-15 8.1e-12 45.7 1.7 1 87 1537 1609 1537 1609 0.85

11 28 4.8e-14 7e-11 42.7 2.2 1 85 1685 1753 1685 1755 0.82

12 28 3.2e-12 4.6e-09 36.9 0.1 1 86 1778 1846 1778 1847 0.82

13 28 1.9e-13 2.8e-10 40.8 0.8 1 86 2003 2071 2003 2072 0.81

14 28 1.5e-11 2.3e-08 34.7 0.3 1 61 2125 2179 2125 2201 0.78

15 28 5.1e-05 0.075 13.8 0.1 1 58 2206 2257 2206 2281 0.79

16 28 2e-11 3e-08 34.3 0.6 1 86 2296 2365 2296 2366 0.83

17 28 3.2e-14 4.7e-11 43.3 1.1 1 87 2424 2494 2424 2494 0.81

18 28 3.7e-12 5.4e-09 36.7 0.7 1 86 2529 2600 2529 2601 0.81

19 28 2.5e-12 3.7e-09 37.2 1.3 1 87 2611 2683 2611 2683 0.81

20 28 2.5e-13 3.7e-10 40.4 0.4 1 87 2706 2777 2706 2777 0.80

21 28 1.1e-05 0.016 15.9 0.1 1 58 2810 2863 2810 2877 0.86

22 28 5.5e-13 8.1e-10 39.3 0.1 1 86 2901 2973 2901 2974 0.80

23 28 4.9e-14 7.2e-11 42.7 1.1 1 86 3108 3180 3108 3181 0.81

24 28 1.5e-14 2.2e-11 44.3 2.2 1 87 3241 3312 3241 3312 0.83

25 28 1.9e-14 2.8e-11 44.0 4.4 1 86 3425 3495 3425 3496 0.84

26 28 2.8e-13 4e-10 40.3 0.1 1 87 3588 3658 3588 3658 0.85

27 28 1.5e-09 2.3e-06 28.3 0.3 1 58 3675 3723 3675 3739 0.87

28 28 8.2e-09 1.2e-05 25.9 1.2 18 87 3740 3798 3729 3798 0.76

#	of	c-Evalue	i-Evalue	score	bias	hmm coord from	hmm coord to	ali coord from	ali coord to	env coord from	env coord to	acc
1	28	1e-14	1.5e-11	44.9	4.2	1	86	575	647	575	648	0.85
2	28	3.7e-15	5.5e-12	46.3	4.6	1	87	675	744	675	744	0.83
3	28	9.1e-16	1.3e-12	48.2	0.4	1	87	766	838	766	838	0.85
4	28	8.1e-16	1.2e-12	48.4	5.6	1	87	935	1005	935	1005	0.83
5	28	1.1e-14	1.6e-11	44.7	3.4	1	86	1029	1100	1029	1101	0.81
6	28	5.4e-13	7.9e-10	39.3	1.5	1	87	1136	1204	1136	1204	0.80
7	28	6.4e-11	9.4e-08	32.7	1.7	1	86	1252	1321	1252	1322	0.75
8	28	5.8e-17	8.5e-14	52.1	0.4	1	86	1349	1418	1349	1419	0.82
9	28	6.6e-12	9.7e-09	35.9	0.9	1	86	1440	1509	1440	1510	0.81
10	28	5.5e-15	8.1e-12	45.7	1.7	1	87	1537	1609	1537	1609	0.85
11	28	4.8e-14	7e-11	42.7	2.2	1	85	1685	1753	1685	1755	0.82
12	28	3.2e-12	4.6e-09	36.9	0.1	1	86	1778	1846	1778	1847	0.82
13	28	1.9e-13	2.8e-10	40.8	0.8	1	86	2003	2071	2003	2072	0.81
14	28	1.5e-11	2.3e-08	34.7	0.3	1	61	2125	2179	2125	2201	0.78
15	28	5.1e-05	0.075	13.8	0.1	1	58	2206	2257	2206	2281	0.79
16	28	2e-11	3e-08	34.3	0.6	1	86	2296	2365	2296	2366	0.83
17	28	3.2e-14	4.7e-11	43.3	1.1	1	87	2424	2494	2424	2494	0.81
18	28	3.7e-12	5.4e-09	36.7	0.7	1	86	2529	2600	2529	2601	0.81
19	28	2.5e-12	3.7e-09	37.2	1.3	1	87	2611	2683	2611	2683	0.81
20	28	2.5e-13	3.7e-10	40.4	0.4	1	87	2706	2777	2706	2777	0.80
21	28	1.1e-05	0.016	15.9	0.1	1	58	2810	2863	2810	2877	0.86
22	28	5.5e-13	8.1e-10	39.3	0.1	1	86	2901	2973	2901	2974	0.80
23	28	4.9e-14	7.2e-11	42.7	1.1	1	86	3108	3180	3108	3181	0.81
24	28	1.5e-14	2.2e-11	44.3	2.2	1	87	3241	3312	3241	3312	0.83
25	28	1.9e-14	2.8e-11	44.0	4.4	1	86	3425	3495	3425	3496	0.84
26	28	2.8e-13	4e-10	40.3	0.1	1	87	3588	3658	3588	3658	0.85
27	28	1.5e-09	2.3e-06	28.3	0.3	1	58	3675	3723	3675	3739	0.87
28	28	8.2e-09	1.2e-05	25.9	1.2	18	87	3740	3798	3729	3798	0.76

Sequence Information

Coding Sequence: atgtcacaacaacaacacaatccCCCTTCACATcaccaacatcaacatcactactatcaacaacagcagcaacagcaacaacaacaacatcaacaacatcatcttcagcagcagcatttgcagcacaaacaaatacaacaacaacaacacagttGGTACTCACATGTTGCTTCCTATCAGCCCCCGCATGCCGCTGCCTTTGCGTCTCCctgcaaaagcagcagcagcaacaacaataacaacaacaaccacattaTGAATGCATACGGCACGGGTGCAGGAGCTTATTATGGCTCAACGGGAGCGGGTGGCGTTGGGGCTGGCTATAACCTTGAGGCCAATACTGTGGCCTATGCGCACAACCAGCTGCtgcaataccaacaacaacaacagcaacaacaacagcagcagcatcagcaacaacaacatcagcagcatctCAGTCAGCGCTCGTATATGCCACCGCATATAATGCACAGCTCGTATCCGTACATTAAGAGCGAACCATTGGAGCCACTACCCGAacgccatcagcagcagcaacaactctTTCAGAACCCTATGGCACCGCCGCCAGCACCCGCCATTGCTAATCGTCATTCGCTGGATGCTAGTGGCgaaatgataattaaatCGGAACCCATTGACGAACATGCTTTCAAGTCCAACTATATCGATGATAACACTCCCTTTGCGGATTTTAGTAAATATCCCGAATTCGGCGACGATATGTTAAGCCCAAAGCTTGAGCTGAATGTCAAGGATGAGGCGTATGGAATCCAAAAAAACCCGCTAAACTACCCACGGCGCAAGCTGCAAACGGATCGCTCCGCAGAGAATATGCCAATTTGCCAGCGTTGCAAAGAGGTGTTCTTCAAGAAGCACATTTACCTGCGACATGTGGCCGAAAGCAGTTGCAACATACACGAGTATGAGTTCAAGTGCAACATTTGTCCCATGTCCTTTATGGGCGCCGAGGAGCTGCAGAAGCACAAGCATCTGCATCGAACCGACGAGTTCTTTTGCCACAAATACTGCGGAAAGCACTACGACTCGATTGCGGAGTGCGAATCGCACGAGTACATGGAGCACGAGTACGATAGCTTTGTGTGCAATATGTGCTCCGTTACGTTCCCCACACGGGAACAGCTGTATGCCCATTTGCCGCAACATAAGTTCCAACAGCGTTACGATTGCCCCATTTGCCGGTTGTGGTATCAAACGGCATTAGAGCTCCACGAGCATCGACTGGCGGCGCCCTACTTCTGTGGCAAGTATTACGCTGCAgcacaccagcagcaacagcaacaacagcaacagcaacagcaacaacaacaacaacagcagcagcagcatacacaacaacatcagcaacagggCAACTACAAACTGCAGGATTGTCACATGGGTACCATTGAAAtgacTCCACCGCAGCACAAGGCTAATACGGCATTACCAGCAACGGCGGCGCTCAATTCGCTGTTGCAGCAACGCCAAGCGAACGCTGATGGCGCCGCTTTATATGCCTCGGCGCTGAAGAGCGAGACGAACGTGAAACTGGAGCGCAGCTATAGCAACTCCACCAGCGAGTCTGGTTACAGTATGCACGAGAGCAGCTACAACAATGCCTACGCCAGCGACAATTCTCTTCATGGCGGTGGCGGGGCAATTGGTGGTCCGCAGGCGCATTCCTCGACGCTGGACGATTCGGAAGATGCGCTGTGCTGTGTGCCTCTGTGCGGGGTGCGCAAGAGCACCAGCCCGACGCTGCAATTCTTTACATTTCCCAAAGATGACAAATACTTGCATCAGTGGCTGCACAACCTGAAGATGTTCCACATTCCCGCGTCGACCTATGTCAGCTTTCGCATTTGCAGCATGCACTTTCCCAAGCGTTGCATCAATCGTTACTCTCTGTGCTATTGGGCGGTGCCCACATTTAATCTGGGCCACGACGATGTGGCCAATCTCTATCAGAATCGTGAGCTGACTAACACATTCACCACCGGCGAGGTCGCCCGCTGTAGTATGCCAAACTGCACTAGTCAGCGTGGCGAGAGTAATCTGAAGTTCTACAACTTTCCCAAGGACATTAAAAGTTTGATTAAGTGGTGCCAAAACGCTCGACTGCCCGTCCAGGCCAAGGAACCGCGTCACTTCTGCAGTCGCCACTTCGAGGAGCGCTGCATCGGCAAGTTCCGGCTGAAACCCTGGGCAGTGCCCACGTTACACCTGGGCGCCCAGTACGGCAAGATTCATGACAATCCGAAAAATCTGTATGTGGAGGAGAAACGCTGCTGCCTCAACTTTTGTCGTCGCAGTCGCTCCTCTGACTTCAATATGTCGCTGTATCGCTTTCCCAGGGATGAGGTGCTGCTGCGTCGTTGGTGCTACAATCTTCGCCTTGATCCTGCTGTCTATCGTGGCAAGAATCATAAAATTTGCAGCGCTCACTTTATCAAGGAAGCTTTAGGATTACGCAAACTATCTCCGGgCGCTGTGCCCACGCTGCATCTGGGTCATAATGACACCTTTAACATCTATGAGAACGAACTGTGGCCACCGCCAACGCCCTCCACGCCCACCCACaatcatcagcagcaccagctgcagccacaccagttgcaacagcagcagccccagCAAGTGCATCATAAATATCAGCGTCACTCGGCTGCATCTACATCATCGTCGGCCTCATCGACATCACATTATGTGGATCCGGAGTTAAGTGCATCCTACATGAGCATGAGCGCTGGGGGCTCATCCTCAGGCCTTAATGTCAGCGATAGCATGGACGTCTGCTGTGTGCCCAGCTGCGAGAGCAAGCGTCACAACAATGAGAACATCACATTCCACACAATACCCAGGCGGCCAGAGCAGATGCGCAAGTGGTGTCACAATCTTAGAATACCCGAGGACAAGATGCACAAGGGAATGCGGATATGTAGCTTGCACTTTGAGCCCTACTGCATTGGCGGATGCATGCGTCCGTTTGCGGTGCCCACATTGCATCTGGGCCACGACGACGAGGACATTCATCGCAATCCGGATGTGATCAAAAAGCTCAACATACGGGAAACCTGTTGCGTGGCCGTTTGCAAGCGCAATCGTGACCGGGACCATGCCAATCTGCATCGCTTTCCCAGCAATGTGCCGCTGCTGACCAAATGGTGCGCAAACCTACAGCGTCCTGTGCCGGATGGCAGTAAACTCTTTAACGATGCCATCTGTGAGGTGCACTTTGAGGATCGGTGTCTGCGCAACAAGCGGCTGGAGAAGTGGGCAGTGCCCACACTCATCCTTGGGCATGAGAATATACCCTATCCACTGCCCACACCGGAGCAGGTTGCCGAGTTCTATGCGCGTCCCAGTGCGCCTAACAATGGCGAGGAGCAGGGCGAGTGCTGTGTGGATACCTGCAAGCGTAATCCCAGTGTCGATGACATTAAGCTATATCGCCCGCCCGAGGAGTCGCAGGTGCTGGCCAAGTGGGCACACAATCTGCAACTGGAGATTGACCAGCTGCCCAATAAGAGAATATGCAATCTACATTTCGAATCCCACTGCATTGGCAAGCGGATGCGCCCCTGGGCAATACCCACGCTCAATCTGGCAACCAACATAGAGAATCTCTACGAGAATCCCGAACATCAGATGCTCTACAAGCGCCGCACGCATCTCAAACCGGGCAGAGTAGCCCGAGGCACAGAAGGAAGCGCTGGTGGTGTGAAGCCCACCTGGGTGCCACGCTGCTGCTTGCCGCACTGCCGCAAGGTGCGTGCCACACACAATGTGCAGCTGTATCGCTTCCCCAAACTCAATCGCTCCACGCTGGCCAAGTGGGCGCATAATCTACAGGTGCCCCTCGTGGGCAGCGCCCAGCGTCGTCTCTGCTCCGCACACTTTGAGCCGCATGTGCTCAGCAAGAAATGCCCGGTGCCCTTGGCGGTGCCCACACTGGACCTTAACACACCATCCGGCTACAAGATCTATCAGAATCCGGCCAAGCTTAAGGCCAACAAGCTGTGCTTGCAGCGCGTCTGCATTGTGGAGAGCTGCCGGCGTCAGCGGGCACAGGGTGTGCAGCTCTTCCGTCTGCCTCACAGCCCCACCCAGCTGCGTAAGTGGATGCACAACATCCGGATGCGTCCCAGAGGCGCTATGCGACAACAGTACCGCATTTGCTCGAAGCACTTCGAGACGCACTCATTCAATGGGAAAAGACTCAGCAACGGAGCAATTCCAACGCTTGAATTGGGCCATGAGGACGAAGACATATTTCCGAATGAGGCGCAGTCTTTCGTGGAGGAGCACTGCACCGTCGAGGGCTGCGATGCCGTCAAGGAGCAGCCGGATGTGCGTCTCTTCCGCTTCCCCATCGATGATGAGGATCTGCTGTGGAAGTGGTGCAACAATCTGAAAATTAGTCCAGTCGACTGCATCGGCGTTCGCATctgcaacaaacattttgagGCTGATTGCATTGGACCGAAGCATCTGTTTAAGTGGGCCATTCCCACGCTCTCCCTTGGCCACGATGATGAGGACATCGAACTGATGATGAATCCTAAGCCAGAGGATCGCTATATTGATCCGGTCTTCAAGTGCTGTGTGCCCTCGTGCGGAAAGACGCGTAAATTCGATGAAGTGCAGATGAACAGTTTTCCCAAAGATCCGGAGGTCTTCCAGCGATGGCGCCACAATCTCCGCCTCGAGCATCTCATCTTCAAGGACCGCGAACGCTATAAGATCTGCAACGCCCACTTCGAGGAGATTTGCATTGGTAAGACGCGCCTAAACATTGGATCCATACCAACACTGAATCTTGGCCATGATGAGACTGATGACTTGTTCCAAGTCAATCCCGAGGCGCTGCAGAGCAATCTCTTTGGACGCCAGCGACGCGTGCAAGACGCCATGAGGATCAACATTAAACAAGAGGCGCACTCCGACCTGGATGAAGACATTAAACCGGACATAAACATGACGGATGCCACAGATTCACATACCAAACAGGTGAAAACCAAGAAATCTTTTACCGATTTCAATTGCTGTGTGCCGAACTGTGGTCGCAGTCGTCTGGAGCACGGTGCCCGCCTCTTTTCGTTCCCGAACgggaaacagcagcaaagcaaGTGGCGCCACAACCTGCGGCTACATGCTGCCGATGTGGACAAGACGACTCGCATCTGCAGCGCTCACTTCAATCGCCGTTGCATCGATGGCAATCAGCTGAGGGGCTGGGCAATGCCCACACAGCAGCTGGGCCATCAGGAGCTTCCGATCTATGAGAATCCAAAGAATATTCCGGGCTTCTTCACGCCCACCTGTGCGCTGGCGCACTGCCGTAAGCGGCGCAGCATTGACAACGACCTGCGCACATATCGCTATCCACGCAGCGATGAGCTGCTCGAGAAGTGGCGCGCAAATCTACGCTTATCGCCGGACCAATGCCGCGGACGCATCTGTGCTGATCATTTTGAGCCGCTGGTGCGCGGCAAGCTGAAGCTTAAGACGGGCGCAGTGCCTACTCTCAAATTGGGTCACGACGAGGGCGTGGTCTTTGATAACGACGGCATTAAGGTAAGTCTGCAGCAGGAGGACGAGGCGGAGGAAGAAGAGGGCGATGCCAGCATGAAGTCGTTGGTCAAAGTAAAGACTGAGCAGGAGGATAAGCAGGAGCTAGAGAATGAAGATGATGAGCAGCAAGCGCAGGAGCAGGATCTAGAGCAGGAGCATGATCAAGATATGATTGAGGATGGGGATGAGCATCGGGACTCAGAGGAACATGGCTATTTCGATCCCTTGGAACTTGTGGAAACCTTCGCTGAGCACCACAGCGATGATACATCTGCCGGACACGATAAtctcgatgatgatgaggatgatgaagatgaagacaTTCCCGGCAATGACGATGAGCTGCTTCTGCCTGACACGCGGCCACTTCGAATGCCAATGGCTCCACGGCGCGAGAAGGCTGTGAATAATGTGACGCCGATTTGCTGCCTGAAACACTGTCGCAAGGAGCGCACCGCCATCCATCATCTGAGCACATTTGGCTTCCCCAAGGatccgcagctgctgctcaagtGGAGCGCCAATCTCGAGATACCCTTGGAGTCCTGCATGGGTCGTGTATGCGTCGAGCACTTTGAGCCCTCGATGCTGGGCACGCGCAAGCTGAAGCAGAATGCGGTGCCCACCTTGAAACTGGGTCATGCCACACCGCTCACCTACAGCTGCAATGGCCGGATGGTGTCGGGCATATATGATGAACAGCCGCAGCATTCGGTTTTTCGGCTTTGGAGCCTGAAACACTGCCGCAAACGGAAACCTGATTTGGAGGAGATTAAGCCTGTACGTCGCTGTTGCCTGCCAAGCTGCGGCAAGCAGTCGGAGTTGCATGGCGTCCAGCTGCAGCGTCTGCCCAAGGATCGTCTGACACTGCGCAAATGGTTACACAACCTGAAGCTGCCTCTAACGACTGATTCCACTCAAATGTTCCTCTGTAGCGATCACTTTGAGCTGAATGCGCCGTGTCCCACCTTGAAACTGGGCCATTCGGATACCAATATTTATCGCCACAATGTGGCCAGCACCAGCGGCAGCTGTCTCGTGCCAAAATGCCCATGTGCTCGTCTCAATCTCTATCGTGGCTACGATCTGCCCGCAAATTCGCAGGTGCAACAGGCCTGGCTACACTGGTTGCAGCTGCCCCATCCGCAGCCGTCGCCCAGGCACGCTCAGCTGTGTGTGATGCACTTTATGCAGCTCTTCGAACTAGTGCCGCTGCCCGAGTCGGTGCCAGATGTTGTGCGCCGGCAGCTGCGTGACACTTACGAACTGATATCCAGATCCACCATGGCCATGAAGCTACGTTGCGCTGTACCCGGCTGCTACTCGAAGTATACGGATAATGTGCGTCTGACCAAGCTACCCGTTTGCCCCAACACCTGCGCCAAGTGGGTGCACAATACCAAGATACAATACGATCCGACCCGACATTATGTCTATCGCATCTGCATGTTGCACTTTGAGCCAGGCTGCCTGGGCCCAGTGCGTCCCAAATTGTGGGCAATGCCAACGCTGCAGCTGCACCACGAGGATGCcgacatatatttaaatccaaAGCTGGATGGCAGCCATGCGCGGCCGTCCGTGCCACTGGAGTTGCCGCTGCGCATCAAAACAGAGCTGCCGATGTGCAACAGTCCCAGCTTTAGTACGAGTGCTAGTCCCAGTCCGCGTGGCAAGCTGCGCACCTGCTGCATACCCAGCTGCGGTCAGCAGGCTTCGGCCCTGTTACGCCTCTTTCGTTTTCCCAGCGCGGAGACGTCGATGCTGAAGTGGCTGGTgaacacacagcagcagccgcgtTTTGTCGATGCACAACGGCTCTTCGTCTGCCAGGATCACTTCGAGGCGGAGGCCATTTGCAAGAATCAGCTGCGCAGCTGGGCGGTGCCCACACTGAATCTCGGACACGATGGACACATCATACCGAATGCTAAGCACAATGGCAACATTGCCGACAGCCAGGAGAACAAACAGACGCTGCAGTTCATCTGGGCCAACTACTGCTCGGTGCTGACCTGCTTCCAGCAGAGCAGCGAGCAGCTGCGTCTCTACCAATACCCCACAGATCGACCAACTATTCGCAAGTGGGCCGCCAATTGTAAGCATCGCTCCATGCAGGCCAGCAGCGATGGATTCCAGGTGTGCCAGTCACATTTTGCGCCGGACTGCTTTGATTCTGTTACTGGGGAGCTAAAGGAGGACTCTGTGCCCACACTGGCGCTGAGCCGGGTTGTGACTGAGGTGCGCTGTATGGTCAATGGTTGCGTTAAAGACGACGATGCATCGCGTCGCCGACTGTTCAAGATGCCCAAGCGTATTCCACTGATATTGGATTGGTGCCACAATTTGCGCGTGGATCATGCCACCGTGAGTGCCTCGGAACAGCACGTTTGTGAACGCCACTTCGAAGTTAACTGCTtcaattcatataaaatgCTGCGTCCAGGAGCACGGCCTACACTTCATTTAGGTCATGAGGATCTAGACAATGTGATACCCAATCCGGCGAACTGGGAAGAGGAGGTGATCTTGTGCTGTGTGCCCCACTGCGAAAGCTCCAAGGATGCGGATGAGGTTCAAATGTTTGGACTGCCAAAGGTGCGCCAGTTGGCGGACAAGTGGCTGCAAAATGCGCGCCTCGATCCGAGCAAAGACGAACAGGCCAATCTGAAGTTTTGCAGTGTGCATTTTGAGGCTAGCTGCTTGGAAAATGGACGACCTACCTATGGTGCAATGCCCACACTCCATTTGGGCCACGATGAGCTACACAACATACACCCAAGCGTAGAGTCATTGCCGGCGCAGCAGAAGCGCTACTGCAATAGAGATGGCGCCAGACACGACTGCTGCTATCCGCAGTGCGTGGAGCTGCAGAAGAGCTATTTGCGGGCCACCTACGAGTTGCCCCAGAAGCAGGAGCTCCGTCAGCATTGGCTCTCCTATATGGGCCTGGAGGCGCAGCAGCCCGATAAGCAGGAGCTACTCAAGCTCTGTCCACTTCACCTCATCGTGCTCTATGATCACAGTGCGGATCACTTGTCGGCACACGCCTCTGAGGAGCTGCTGGACTCCAATTATGATGCAGCACGCAGCAGCGTTCGCATACGCGTTGTCAGCTGTGCGGTGCACGGCTGCAGAACGCTAAAACCACGCGACGGTGGTCGGCTGTACGGTTTGCCCACTCGTCGAGATCAGCTGGACATGTGGCTGTACAACACACAACTGGTGTTTTACGAGCAGCAGCGTTATATGTACAAGATATGCAGCAAGCACTTTGAGCCCAAATGCTTCACGGAGACAACCAAGCGCTTGAAGCCGTGGAGCATGCCTACGCTGGAGTTGCCGGAGCGTCAATCGGGCGAGATGCCAGCCTATCAGAATCCCACAGAGTTGGAGTGGCTACAAATGAACGAGCTGCTGGTCAGCGAAAAAGTTGTTGAGGCTCTGCCGGATCCCTTACTCAAGTTGGAGCCGTTGCCCAAGAAGGAGCCACCACCACCGCAGGTTATGGAATTTGAAGAGGATTGCGATAATAACTCACAGCAGCCATTAGAAATGCAGGCGCTGGAGGTGCTGCTCGAGGTGGGTCATGTCGAGAAGTGCACCACCTACGAGCAAATGGATACCGAGGCAAATCTCAGCTATGCCGAACAGTTCTCGCACAATCCCCTGAGTCCAAGACCACCCCAATGCCGTATCCCCGTTGTCCAGAATGGACTCAACTACAGCGCACGGCACTGCAGCGTGCATGGCTGCAATGTCACCTCGAATAAtctgagcagcagcattaaGCTGCACAAGTTCCCCGTCTCGCTGGATGCCATGCAAAAGTGGATGCACAACACCCAAGTGCTCGTGGACGTTAAATTCGCTTGGCGCTTTCGCATCTGCAGTCATCATTTCATCGAGGATTGCTTTCGCGGCTCGCGTATCAGGCGTGGCGCAATGCCCACGTTGCGACTGGGCTTACGTCGTCCGAAGCATATCTATGATAATGCATTCAACGCCCTGGAACTGACTAAAGAAGAGACCAAGGATGAACTCGCTGCCCCGCTCGAAtctcagcaacagttgctctCTGCGAATGTAGGTCTTCGCCTGCCACGCCCTGGACCGCCCAGCAAATCCAGCAAATACTGCCAGATCGAGGGCTGCTCAAATCATTTGACCAGCGAGAATGTAACGCTGCACAAGTTCCCTCATTCGTCGGACATGTGCGCCAAGTGGCAGCACAACACTCAGGTACCCTTCGATCCCGAGTATCGCTGGCGCTATCGCATCTGCAGCGCACACTTTGAGCCCATCTGTCTAGGCAATGTGAGATTGACGCACGGCAGTGTGCCCACTCTGAATCTGGGACCGCTTGCGCCAAAGAAACTGTTTGACAATGAATTCTTGCGCCAGGACAAACCAATGAGTAGTTCAGAGCTGGACATGACAGTCAAACATGAACAAATGGAGCAATTTGATCAACTAGAGCTCGAAGATGGCAACCAGAAGCGGGATGATTTCAGCTTGCTGGAGCCCGAGCTGCAGTTGCACGAGGGTAGCGAGGATGAGCAACAATATGACAATCATTTCAGCCAAAACGATTCCTATAACTGGTCCGATCAGCAGCTGCGTCTGTCCAGCAATAATCAGGAGAATTCCACAATTAGCTACAATCCAGTCAAGTCCGGCTATGATAAGTGCTCACTGGTCCACTGTCAACGACAGCGTTCCCATCACGGCGTGCACATCTACAAGTTTCCGCGCTCGCGTCAGTTGCAGCAACGATGGATGCATAACTTGCGCATCCAATACGATGAGCGACGGCCGTGGAAGACAATGATATGCAGTGTCCATTTCGAGCCGCACTGCATCCGTCTGCGCAAATTGCGTCCCTGGGCGGTCCCTACGCTGGAACTGGGGGACAACGTGCCACTGGAAATCTTTACGAATGAGCAGAGTCACCGGCTGTTTGCTCAATCTGAAGCAGGCAGCGAGTGTGATGAGGTTGAAGTGGAGGTTGAGGACACCATACTGGAGGACTTGGATGATGACTATGATGACAATGATGCTGATTTAAATATGGATGCTAATGATCAAAGGCGAACAGTTCCATATGGGAAAAGTGACCGTCGCTCTCGATTTGATCAATTGCCGCCTGGTCAGCTGTCACCGTGGAAGATCAAATGCTGCTGTTTGCCCTATTGCCGCAGTCCTCGCGGTGATGGCATTAAGCTCTTCCGACTGCCCAATAACATTAGCTCCATTCGCAAATGGGAACAGGCCACAGGCATGCGCTTTTATGAGTCCCAGCGCAACACAAAGCTCATCTGCAGTCGGCACTTTGATCCGCAGCTTATAGGCGTGCGTCGTCTCATGTCGAATGCGGTGCCAAGCCTCCATTTGGGCCCGGACAGCGCAGAGCCCGAGCTGCCTCTTGTAAGACCACGGTGCTGCATGCCCGATTGTTTTGAGGATGTCAACGTCGAGCTGCACAAGTTTCCCAGTGATCCCATGCTGCTGCATCAATGGTGTCAAGCGCTCAATTTACCGGATGTTCAAAGCTACACTGACAAACTCATATGTTCCGCACATCTGCCCGCCAACGCGATGAGCTGTCTAATTTGTGGCGTGGACGATGTACAGCTGCCAATGCTGGACTTTCCCCAGAATCGCAATCAGCGCACCAAGTGGtgctacaatttaaaaatcgagCCTCTGCCCAAATGGGATAACTCTAAGCAAATTTGCTGCAAACACTTTGAGAGCTACTGTTTTATCCAGCCTGGCCAACTTCTGGCAGAGGCAATGCCCACACTACACTTGGAGCACAGAGATAGCAACATATTCTTAAACGAGGACGTCATGTATAACAGCAAGTTATTGCGCATTAAGGACGAGCCCGTGGAGAGCGAGGATCTAATGCTATAA
Protein Sequence: MSQQQHNPPSHHQHQHHYYQQQQQQQQQQHQQHHLQQQHLQHKQIQQQQHSWYSHVASYQPPHAAAFASPCKSSSSNNNNNNNHIMNAYGTGAGAYYGSTGAGGVGAGYNLEANTVAYAHNQLLQYQQQQQQQQQQQHQQQQHQQHLSQRSYMPPHIMHSSYPYIKSEPLEPLPERHQQQQQLFQNPMAPPPAPAIANRHSLDASGEMIIKSEPIDEHAFKSNYIDDNTPFADFSKYPEFGDDMLSPKLELNVKDEAYGIQKNPLNYPRRKLQTDRSAENMPICQRCKEVFFKKHIYLRHVAESSCNIHEYEFKCNICPMSFMGAEELQKHKHLHRTDEFFCHKYCGKHYDSIAECESHEYMEHEYDSFVCNMCSVTFPTREQLYAHLPQHKFQQRYDCPICRLWYQTALELHEHRLAAPYFCGKYYAAAHQQQQQQQQQQQQQQQQQQQQHTQQHQQQGNYKLQDCHMGTIEMTPPQHKANTALPATAALNSLLQQRQANADGAALYASALKSETNVKLERSYSNSTSESGYSMHESSYNNAYASDNSLHGGGGAIGGPQAHSSTLDDSEDALCCVPLCGVRKSTSPTLQFFTFPKDDKYLHQWLHNLKMFHIPASTYVSFRICSMHFPKRCINRYSLCYWAVPTFNLGHDDVANLYQNRELTNTFTTGEVARCSMPNCTSQRGESNLKFYNFPKDIKSLIKWCQNARLPVQAKEPRHFCSRHFEERCIGKFRLKPWAVPTLHLGAQYGKIHDNPKNLYVEEKRCCLNFCRRSRSSDFNMSLYRFPRDEVLLRRWCYNLRLDPAVYRGKNHKICSAHFIKEALGLRKLSPGAVPTLHLGHNDTFNIYENELWPPPTPSTPTHNHQQHQLQPHQLQQQQPQQVHHKYQRHSAASTSSSASSTSHYVDPELSASYMSMSAGGSSSGLNVSDSMDVCCVPSCESKRHNNENITFHTIPRRPEQMRKWCHNLRIPEDKMHKGMRICSLHFEPYCIGGCMRPFAVPTLHLGHDDEDIHRNPDVIKKLNIRETCCVAVCKRNRDRDHANLHRFPSNVPLLTKWCANLQRPVPDGSKLFNDAICEVHFEDRCLRNKRLEKWAVPTLILGHENIPYPLPTPEQVAEFYARPSAPNNGEEQGECCVDTCKRNPSVDDIKLYRPPEESQVLAKWAHNLQLEIDQLPNKRICNLHFESHCIGKRMRPWAIPTLNLATNIENLYENPEHQMLYKRRTHLKPGRVARGTEGSAGGVKPTWVPRCCLPHCRKVRATHNVQLYRFPKLNRSTLAKWAHNLQVPLVGSAQRRLCSAHFEPHVLSKKCPVPLAVPTLDLNTPSGYKIYQNPAKLKANKLCLQRVCIVESCRRQRAQGVQLFRLPHSPTQLRKWMHNIRMRPRGAMRQQYRICSKHFETHSFNGKRLSNGAIPTLELGHEDEDIFPNEAQSFVEEHCTVEGCDAVKEQPDVRLFRFPIDDEDLLWKWCNNLKISPVDCIGVRICNKHFEADCIGPKHLFKWAIPTLSLGHDDEDIELMMNPKPEDRYIDPVFKCCVPSCGKTRKFDEVQMNSFPKDPEVFQRWRHNLRLEHLIFKDRERYKICNAHFEEICIGKTRLNIGSIPTLNLGHDETDDLFQVNPEALQSNLFGRQRRVQDAMRINIKQEAHSDLDEDIKPDINMTDATDSHTKQVKTKKSFTDFNCCVPNCGRSRLEHGARLFSFPNGKQQQSKWRHNLRLHAADVDKTTRICSAHFNRRCIDGNQLRGWAMPTQQLGHQELPIYENPKNIPGFFTPTCALAHCRKRRSIDNDLRTYRYPRSDELLEKWRANLRLSPDQCRGRICADHFEPLVRGKLKLKTGAVPTLKLGHDEGVVFDNDGIKVSLQQEDEAEEEEGDASMKSLVKVKTEQEDKQELENEDDEQQAQEQDLEQEHDQDMIEDGDEHRDSEEHGYFDPLELVETFAEHHSDDTSAGHDNLDDDEDDEDEDIPGNDDELLLPDTRPLRMPMAPRREKAVNNVTPICCLKHCRKERTAIHHLSTFGFPKDPQLLLKWSANLEIPLESCMGRVCVEHFEPSMLGTRKLKQNAVPTLKLGHATPLTYSCNGRMVSGIYDEQPQHSVFRLWSLKHCRKRKPDLEEIKPVRRCCLPSCGKQSELHGVQLQRLPKDRLTLRKWLHNLKLPLTTDSTQMFLCSDHFELNAPCPTLKLGHSDTNIYRHNVASTSGSCLVPKCPCARLNLYRGYDLPANSQVQQAWLHWLQLPHPQPSPRHAQLCVMHFMQLFELVPLPESVPDVVRRQLRDTYELISRSTMAMKLRCAVPGCYSKYTDNVRLTKLPVCPNTCAKWVHNTKIQYDPTRHYVYRICMLHFEPGCLGPVRPKLWAMPTLQLHHEDADIYLNPKLDGSHARPSVPLELPLRIKTELPMCNSPSFSTSASPSPRGKLRTCCIPSCGQQASALLRLFRFPSAETSMLKWLVNTQQQPRFVDAQRLFVCQDHFEAEAICKNQLRSWAVPTLNLGHDGHIIPNAKHNGNIADSQENKQTLQFIWANYCSVLTCFQQSSEQLRLYQYPTDRPTIRKWAANCKHRSMQASSDGFQVCQSHFAPDCFDSVTGELKEDSVPTLALSRVVTEVRCMVNGCVKDDDASRRRLFKMPKRIPLILDWCHNLRVDHATVSASEQHVCERHFEVNCFNSYKMLRPGARPTLHLGHEDLDNVIPNPANWEEEVILCCVPHCESSKDADEVQMFGLPKVRQLADKWLQNARLDPSKDEQANLKFCSVHFEASCLENGRPTYGAMPTLHLGHDELHNIHPSVESLPAQQKRYCNRDGARHDCCYPQCVELQKSYLRATYELPQKQELRQHWLSYMGLEAQQPDKQELLKLCPLHLIVLYDHSADHLSAHASEELLDSNYDAARSSVRIRVVSCAVHGCRTLKPRDGGRLYGLPTRRDQLDMWLYNTQLVFYEQQRYMYKICSKHFEPKCFTETTKRLKPWSMPTLELPERQSGEMPAYQNPTELEWLQMNELLVSEKVVEALPDPLLKLEPLPKKEPPPPQVMEFEEDCDNNSQQPLEMQALEVLLEVGHVEKCTTYEQMDTEANLSYAEQFSHNPLSPRPPQCRIPVVQNGLNYSARHCSVHGCNVTSNNLSSSIKLHKFPVSLDAMQKWMHNTQVLVDVKFAWRFRICSHHFIEDCFRGSRIRRGAMPTLRLGLRRPKHIYDNAFNALELTKEETKDELAAPLESQQQLLSANVGLRLPRPGPPSKSSKYCQIEGCSNHLTSENVTLHKFPHSSDMCAKWQHNTQVPFDPEYRWRYRICSAHFEPICLGNVRLTHGSVPTLNLGPLAPKKLFDNEFLRQDKPMSSSELDMTVKHEQMEQFDQLELEDGNQKRDDFSLLEPELQLHEGSEDEQQYDNHFSQNDSYNWSDQQLRLSSNNQENSTISYNPVKSGYDKCSLVHCQRQRSHHGVHIYKFPRSRQLQQRWMHNLRIQYDERRPWKTMICSVHFEPHCIRLRKLRPWAVPTLELGDNVPLEIFTNEQSHRLFAQSEAGSECDEVEVEVEDTILEDLDDDYDDNDADLNMDANDQRRTVPYGKSDRRSRFDQLPPGQLSPWKIKCCCLPYCRSPRGDGIKLFRLPNNISSIRKWEQATGMRFYESQRNTKLICSRHFDPQLIGVRRLMSNAVPSLHLGPDSAEPELPLVRPRCCMPDCFEDVNVELHKFPSDPMLLHQWCQALNLPDVQSYTDKLICSAHLPANAMSCLICGVDDVQLPMLDFPQNRNQRTKWCYNLKIEPLPKWDNSKQICCKHFESYCFIQPGQLLAEAMPTLHLEHRDSNIFLNEDVMYNSKLLRIKDEPVESEDLML

Similar Transcription Factors

Sequence clustering based on sequence similarity using MMseqs2

100% Identity: iTF_00595971;
90% Identity: iTF_00500343;
80% Identity: -