Basic Information

Insect: Liodrosophila aerea
Gene Symbol: -
Assembly: GCA_035045005.1
Location: JAWNNL010001373.1:1141348-1154934[+]

Transcription Factor Domain

TF Family: THAP
Domain: THAP domain
PFAM: PF05485
TF Group: Zinc-Coordinating Group
Description: The THAP domain is a putative DNA-binding domain (DBD) and probably also binds a zinc ion. It features the conserved C2CH architecture (consensus sequence: Cys - 2-4 residues - Cys - 35-50 residues - Cys - 2 residues - His). Other universal features include the location of the domain at the N-termini of proteins, its size of about 90 residues, a C-terminal AVPTIF box and several other conserved residues. Orthologues of the human THAP domain have been identified in other vertebrates and probably worms and flies, but not in other eukaryotes or any prokaryotes [1].
Hmmscan Out: # of c-Evalue i-Evalue score bias hmm coord from hmm coord to ali coord from ali coord to env coord from env coord to acc

1 29 8 2e+04 -8.1 6.7 55 78 30 41 4 56 0.52

2 29 3.9e-15 9.5e-12 45.6 4.6 1 86 597 669 597 670 0.86

3 29 2.6e-15 6.2e-12 46.2 4.6 1 87 697 766 697 766 0.83

4 29 6.2e-16 1.5e-12 48.2 0.4 1 87 788 860 788 860 0.85

5 29 4.1e-16 9.9e-13 48.8 6.2 1 87 961 1031 961 1031 0.81

6 29 8e-15 2e-11 44.6 3.3 1 86 1055 1126 1055 1127 0.81

7 29 3.6e-13 8.9e-10 39.3 0.9 1 87 1162 1230 1162 1230 0.81

8 29 8.1e-11 2e-07 31.8 1.4 1 86 1275 1344 1275 1345 0.76

9 29 3e-16 7.4e-13 49.2 0.2 1 86 1372 1441 1372 1442 0.82

10 29 2.6e-13 6.4e-10 39.8 1.1 1 86 1463 1532 1463 1533 0.81

11 29 4.5e-14 1.1e-10 42.2 3.0 1 85 1560 1630 1560 1632 0.84

12 29 1.5e-13 3.6e-10 40.6 1.2 1 85 1709 1777 1709 1779 0.82

13 29 1.9e-12 4.6e-09 37.0 0.1 1 86 1802 1870 1802 1871 0.81

14 29 2.4e-12 5.9e-09 36.7 0.1 1 87 2026 2095 2026 2095 0.80

15 29 1.6e-12 3.9e-09 37.2 0.1 1 65 2157 2216 2157 2241 0.79

16 29 0.25 6.1e+02 1.4 0.2 1 58 2247 2297 2247 2309 0.71

17 29 1.2e-11 3e-08 34.4 0.3 1 86 2336 2405 2336 2406 0.84

18 29 4.1e-14 1e-10 42.4 0.7 1 86 2482 2551 2482 2552 0.84

19 29 1.9e-13 4.7e-10 40.2 0.6 1 86 2587 2658 2587 2659 0.81

20 29 1.2e-11 3e-08 34.4 4.9 1 87 2667 2741 2667 2741 0.83

21 29 7.6e-14 1.9e-10 41.5 1.6 1 86 2775 2854 2775 2855 0.81

22 29 5.1e-06 0.013 16.4 0.2 1 71 2885 2947 2885 2959 0.70

23 29 4.8e-12 1.2e-08 35.7 0.1 1 86 2972 3042 2972 3043 0.81

24 29 1.8e-14 4.3e-11 43.5 0.2 1 87 3169 3242 3169 3242 0.84

25 29 3.9e-14 9.5e-11 42.4 2.4 1 86 3328 3398 3328 3409 0.80

26 29 2.8e-13 6.8e-10 39.7 4.8 1 86 3527 3597 3527 3598 0.84

27 29 1.5e-13 3.6e-10 40.6 0.2 1 87 3678 3748 3678 3748 0.84

28 29 1.7e-08 4.3e-05 24.3 1.2 1 59 3771 3821 3771 3836 0.81

29 29 1.3e-10 3.1e-07 31.2 1.1 18 87 3837 3895 3826 3895 0.74

#	of	c-Evalue	i-Evalue	score	bias	hmm coord from	hmm coord to	ali coord from	ali coord to	env coord from	env coord to	acc
1	29	8	2e+04	-8.1	6.7	55	78	30	41	4	56	0.52
2	29	3.9e-15	9.5e-12	45.6	4.6	1	86	597	669	597	670	0.86
3	29	2.6e-15	6.2e-12	46.2	4.6	1	87	697	766	697	766	0.83
4	29	6.2e-16	1.5e-12	48.2	0.4	1	87	788	860	788	860	0.85
5	29	4.1e-16	9.9e-13	48.8	6.2	1	87	961	1031	961	1031	0.81
6	29	8e-15	2e-11	44.6	3.3	1	86	1055	1126	1055	1127	0.81
7	29	3.6e-13	8.9e-10	39.3	0.9	1	87	1162	1230	1162	1230	0.81
8	29	8.1e-11	2e-07	31.8	1.4	1	86	1275	1344	1275	1345	0.76
9	29	3e-16	7.4e-13	49.2	0.2	1	86	1372	1441	1372	1442	0.82
10	29	2.6e-13	6.4e-10	39.8	1.1	1	86	1463	1532	1463	1533	0.81
11	29	4.5e-14	1.1e-10	42.2	3.0	1	85	1560	1630	1560	1632	0.84
12	29	1.5e-13	3.6e-10	40.6	1.2	1	85	1709	1777	1709	1779	0.82
13	29	1.9e-12	4.6e-09	37.0	0.1	1	86	1802	1870	1802	1871	0.81
14	29	2.4e-12	5.9e-09	36.7	0.1	1	87	2026	2095	2026	2095	0.80
15	29	1.6e-12	3.9e-09	37.2	0.1	1	65	2157	2216	2157	2241	0.79
16	29	0.25	6.1e+02	1.4	0.2	1	58	2247	2297	2247	2309	0.71
17	29	1.2e-11	3e-08	34.4	0.3	1	86	2336	2405	2336	2406	0.84
18	29	4.1e-14	1e-10	42.4	0.7	1	86	2482	2551	2482	2552	0.84
19	29	1.9e-13	4.7e-10	40.2	0.6	1	86	2587	2658	2587	2659	0.81
20	29	1.2e-11	3e-08	34.4	4.9	1	87	2667	2741	2667	2741	0.83
21	29	7.6e-14	1.9e-10	41.5	1.6	1	86	2775	2854	2775	2855	0.81
22	29	5.1e-06	0.013	16.4	0.2	1	71	2885	2947	2885	2959	0.70
23	29	4.8e-12	1.2e-08	35.7	0.1	1	86	2972	3042	2972	3043	0.81
24	29	1.8e-14	4.3e-11	43.5	0.2	1	87	3169	3242	3169	3242	0.84
25	29	3.9e-14	9.5e-11	42.4	2.4	1	86	3328	3398	3328	3409	0.80
26	29	2.8e-13	6.8e-10	39.7	4.8	1	86	3527	3597	3527	3598	0.84
27	29	1.5e-13	3.6e-10	40.6	0.2	1	87	3678	3748	3678	3748	0.84
28	29	1.7e-08	4.3e-05	24.3	1.2	1	59	3771	3821	3771	3836	0.81
29	29	1.3e-10	3.1e-07	31.2	1.1	18	87	3837	3895	3826	3895	0.74

Sequence Information

Coding Sequence: ATGTCACAACACAACAACCCCCCGCCCTCgccgcatcatcatcatcatcactaCTATCAACagcaccatcagcagcagcaacagcaacaacaacatttccagcagcagcatcaacagcagctacaacataaacaaatacaacagcaacagcagcagcacacttGGTACTCACATGTTGCTTCCTACCCTCCCCACCATCATCCGCACGCCGCTGCAGCCTCAGCCGCAGCCTTTGCGGCGCCCTGCAAaaccaataacaataacaacagcagtaacagcatTATGAATGCTGCATACGGCGCATCGGCAGCGGGGGCTGGCTCATACTACGgctctcctgctgctgctgctgctgcatctgctgGGGGTGGGTCAGGTTATAACCTTGAGGCCAACACTGTGGCCTATGCGCACAACCAGCTGCTgcaataccaacaacagcagcagcagcagcaacatcaacagcagcagcagcagcttggccAACGCTCTTCGTATATGTCGCATGGTTTAATGCACAGCTCGTATCCTTACATAAAGAGCGAGCCACTGGAGTTGTCCGATGATAGAGCtacacgacaacaacaacaacatcaacagcagcagcagcaacaacaacagctttaCCAGAATCCAATTATGGCACCACCCCCCGCCCCTTCTACAGCAAACCGTCATACGCTCGATGCCAGCGGcgaaatgataataaaatcgGAACCGATTGATGAACATGCGTACAAATCCAACTACATCGATGATAACACGCCCTTTGCCGATTTTAGTAAATATCCCGAATTTGGCGACGACATGCTAAGTCCCAAGGTGGAGCTATCCGTTAAGGATGAGGTCTACGGAAATCACAAGAACCCGCTTGGCTATCCCCGTCGTAAGCTGCAAGCGGAACGCTCTACGGAAAGTCTACCTATATGTCAGCGCTGCAAGGAGGTGTTCTTTAAGAAGCAGGTATACTtgcggcatgtggcagagAGTAGTTGCACCATACAGGAATATGATTTCAAGTGCAACATCTGTCCCATGTCGTTTATGAGCACTGGGGAGTTGCTGAAGCACAAGCATCTCCATAGAGCCGATAAATACTTTTGCCACAAATACTGTGGCAAGTATTTTGACACAATCGCCGATTGTGAGTCGCATGAGTATATGCAGCATGAGTATGATAGCTTTGTTTGCAACATGTGTTCCGGTACGTTTGCGACGCGGGAGCAGCTCTACGCGCATTTGCCGCAACACAAGTTCCAGCAGCGTTACGATTGCCCCATTTGCCGTTTGTGGTATCAAACGCCATTGGAGTTGCACGAGCATCGACTGGCAGCGCCCTACTTCTGTGGCAAATATTATGCGGGCGCACAAAGTGCAACAACACAtcagtcgcagcagcaacacgcacatccacatcagcagcagcaacatcatgcGCCACAACAGGCCAACTATAAACTGCAGGATTGTCACATGGGTACAATGGAAATGCCATCGTCGCATCATAAGCAAAACACTGCTGCACTGCCAGCAACGGCTGCACTGAACTCACTGCTGCAACAACGCCAAGCTAATGCTGATGGTGCCGCCATGTATTCGTCACCGATGAAGAACGACGTGAATGTGAAGCTGGAACGTAGCTATAGCAATTCTACAAGCGAATCCGGATACAGTCTACACGATAGCAGCTATAACAATGCCTATGGCAGCGATACATCCATGCATAGTGGTTCAGTTGGTGGGCCACAAGCTCATTCTTCGACACTGGACGATTCAGAGGATGCGCTATGTTGTGTGCCATTGTGTGGAGTTCGAAAGAGCACTAGCCCCACGCTGCAGTTCTTTACGTTTCCCAAAGATGATAAATACTTACATCAGTGGCTGCACAATCTTAAAATGTTCCACATACCAGCGTCTAGTTATACCAACTTTCGCATATGCAGCATGCACTTTCCGAAGCGTTGCATCAATCGGTATTCGCTCTGCTATTGGGCGGTGCCCACGTTCAATTTGGGACACGATGACGTTGCCAATCTGTATCAGAATCGAGAGTTAACAAATACGTTTACCACCGGTGAGGTGGCACGTTGCAGTATGCCCAATTGCACAAGCCAGCGAGGCGAAAGTAATCTGAAGTTCTACAATTTTCCCAAGGATATCAAGAGTCTGATCAAATGGTGCCAGAATGCCCGTCTGCCCGTCCAGGCCAAGGAGCCGCGTCACTTCTGCAGTCGTCACTTTGAGGAGCGATGCATTGGCAAGTTTCGACTGAAACCATGGGCTGTTCCCACACTGCATTTGGGCGCTCAATACGGCAAAATTCATGACAATCCAAAGAATTTGTATGTGGAGGAGAAACGTTGCTGCCTTAACTTCTGTCGTCGCAGTCGCTCGTCCGACTTCAATATGTCGCTCTATCGCTTCCCCAGAGACGAGGTGCTGCTGCGGCGCTGGTGCTACAATCTGCGGCTCGATCCAGCTGTCTATCGTGGTAAGAATCACAAGATCTGCAGTGCTCACTTCATCAAGGAAGCGTTAGGCCTGCGCAAACTATCCCCGGGTGCCGTTCCCACACTGCATCTGGGTCACAATGACACATTCAACATTTACGAGAATGAACTCTGGCCACCGCCGACGCCCTCAACGCCCACCGGTcaccatcatcagcagcagcatcagcagcaaatgcaacagcatcagttgcagcaacagcatgcaAATTATCACAGCAGCAAATATCAACGATATTCTGTGGCTGCATCTACATCCTCATCAGCCAGCTCGACATCCCATTATGTGGACCCGGATTTAAGTTCGTCGTATATGGGCATGGGCAGCTCGAGTGGATCTGGTCTAAATGTGAGCGACAGCATGGACATTTGTTGTGTGCCGAGCTGCGAGAGCAAACGCCACAATAACGAGAATATCACTTTCCACACCATACCAAGGAGGCCAGAGCAGATGCGCAAGTGGTGTCACAATATAAAGATACCCGAAGAAAAGATGCACAAGGGCATGCGCATCTGTAGTCTGCACTTTGAGTCCTACTGCATTGGCGGTTGCATGCGCCCGTTTGCCGTGCCAACGCTGCATTTGGGACACGATGACGAGGATATACATCGCAATCCGGACGTCATTAAGAAACTGAACATAAGGGAGACGTGTTGTGTGGCTGTGTGCAAACGTAATCGGGATCGAGATCATGCCAATTTGCATCGTTTCCCAAGTAATGTGACTCTGTTGACCAAATGGTGTGCAAATCTGCAGCGTGCTGTGCCAGATGGCAGTAAACTCTTTAACGACGCCATATGTGAGGTGCATTTCGAGGATCGTTGCTTGCGGAATAAGCGCTTAGAGAAGTGGGCAGTACCCACTCTCGTGCTGGGTCATGAAAACATTGCATACCCCTTACCGACACCGGAGCAGGTGGCCGAGTTCTATGCACGTCCCAGTGCGCCCAACAATGGCGAGGAGCAAGGCGAGTGTTGTGTGGAGACATGCAAACGTAATCCAAGCGTGGATGATATTAAGCTATACCGTCCTCCCGAGGATACATCCGTATTGGCGAAATGGGCTCATAATCTGGAGATTGATGCAGCGAAGTTGCCCAACATGCGCATCTGTAATCTTCACTTTGAGTCCCACTGCATTGGCAAACGTATGCGTCCCTGGGCCATACCAACGCTCAATTTGTCCAGTAACATTGAGAATCTTCATGAAAATCCTGATCATCACATGCTCTACAAACGTCGCAGACATCTCAACCGTGGCGCAGAGGGAGAACGCTCGTCGTCCATGGTTAAACCCACTTGGGTGCCACGTTGCTGTCTGCCACATTGCCGCAAGGTGCGAGCCTTGCATAACGTGCAGCTCTATCGCTTCCCAAAACTGAACCGTTCCACGCTAGCCAAATGGGCGCATAACCTTCAGGTGCCCATGATGGGCAGCGCACAGAGGCGTCTGTGCTCGGCTCACTTTGAGCCTCATGTGCTGAGTAAAAAGTGTCCGGTGCCGTTGGCGGTGCCCACATTGGATCTCAATTCACCGCCCGGCTATAAGATCTATCAGAATCCCGCCaaattaaaagccaacaaaCTGTGCCTGCAACGTGTCTGCATTGTGGCAAGTTGTCGTCGTCAGCGTGGTCCCGGCGTGAAGCTATTCCGGCTGCCACATAGCCCGACGCAGTTACGCAAATGGATGCATAATATAAGAATGCGTCCCAGAGGCTCCATGCGTCAGCAGTATCGTATTTGTTCCTCGCACTTTGAGTCGCACTCGTTCAACGGCAAGCGCTTGAGTACTGGAGCTATACCAACGCTGGAATTGggccatgatgatgatgatatctATCCAAACGAGGCGCAATCATTTGTCGAGGAACGCTGTGCTGTGGAGGGCTGTGAGGCGTCTAAGGAACAGATAGAGGTGCGTCTCTTCCGATTCCCCATCGACGATGAGGATTTGCTATGGAAATGGTGCAACAATCTCAAAATGAATCCCGTCGACTGCATTGGTGTGCGCATCTGTAACAAACACTTTGAATCTGACTGCATCGGACCTAAGCATCTATTCAAGTGGGCAATACCCACGCTGGAGTTGGGCCACGACGATGCCGAAATTGAACTTACACCTAATCCTAAGCCAGCGAATCGCTACCTTGATCCGGTCTTCAAGTGCTGTGTTCCAACATGTGGCAAAACGCGCAAATTCGATGAGGTTCAATTAAATAGCTTCCCTAAAGATCCGACACTCTTCAATCGCTGGCGCCACAATCTTCGCCTGGATCATATCCACATCAAGGAACGCGATCGCTACAAAATATGCAACTCGCACTTTGAAGATATCTGCATCGGTAAGACGCGCCTTAAACACGGTTCCATTCCCACTCAAGAACTGGGGCACGACGATACCGAAGATCTCTATCAGGTGAACCCTGACGAACTGCACTCTTTCATTGGTCGCCATCGACGACCTCGTGACTCTATACGGGGAGTCTTCGTCAAGCAAGAGGAGCATTCGGAGCTTGAAGAGGAGGACATTAAGCCAAGTATTAGCATATCGGAGGCAACGGATATAAACACTAGACAGgttaaaataaaaaaatcctTGGTGGACCTCACGTGCTGTGTGCCTGACTGTGGTCGCAGTCGCTTGGAGCATGGAGCACGCATGTTTCCCTTTCCCAATggcaagcaacaacagatCAAATGGCGTGAAAATCTTCGCCTCGAGGCCACCGATGTGGATAAAACGAGCCGGGTGTGCAACGTTCATTTCAATAAACGTTGCATTGATGGGAAACAGCTACGAGGCTGGGCCATACCCACACAGCAGTTGGGCCATGGGGATCCGCCAATCTATGAGAATCCAAAGAATATACCAGGCTTTTTTACGCCCACATGTGCGCTGGCTCATTGCCGCAAGCGTAGGAGCATTGATAATGATTTGCGCACCTATCGCTATCCTCGTACTGAGGATTTGCTGGAGAAATGGCGTGTCAATTTGCGATTGTCGCCGGATCAATGTCGTGGTCGTATCTGTGCCGATCACTTTGAGCCAATGGTGCGCggtaaactgaaactgaagacAGGAGCGGTCCCCACACTGAAGCTCGGACACAATGAAGGCGTAGTCTTTGACAACGAGGCTATTAAAGCAGGTCTGCAACTGGAAGAGGACGGTGAGTCACCAGTTAAAGTGAAAAAGGAGAAAATTGACGAGGAAGATGAGATAAAGCAAGAGCGAAAGGATGACGACGAAGGCGACGATGAAGAGCAGCAAACGGAGCCTAAAGAGGAGCAAATGGAGGAAGAACACGAGGAGGACGAAGAAGATCACGGCTATTTCGACCCCTTGGAACTGGTTGAAACCTATGCCGATCATCACAGTGAAGATAACGCCGCCGACATGGATGAAGATGGCATTGAcaatgatgacgacgatggtgaagatgatgaagaagaagatcTCCCTGGTAATGATGATGAACTGCTACTCCCAGATAGTCCACCTGCAGGGCATCAAGAGAACCACACTGATGTGGAggcaaatcataaaaatggtATTCCCAAATGCGTATTAAAACATTGCCGTAATGAGCGCAGCTACAGCTATCCATTGAGCACCTTTGGGTTTCCCACAAATCAGGAAGTGTTGCTCAAATGGAGTACCAATTTGCAGCTGCCGCTAGAGGATTGTGTTGGACGCATTTGCATTGCGCATTTTGAACCGGAAGTTGTGGGCACGCGCAATCTCAAACGAAATGCAGTGCCCACATTGAATCTGGGACACGACACGCCGATTAGCTATGACTGCAATGGCCAGGCAGTTGGGATCTATGATGACCAGCCGCAGCATTCGGTTTTTCGGCTTAGCAGCCTAAAACATTGTCGCAAAAGGGAACCAGAgaagctacagcaacaacaggcgaCTAAATTCGCGAAACAGCGAAAGGAAGGCGAAAGGTGTTGCGTTCCCAGCTGTGACAAGCAACCGGAGTTGCATGGCGTTAAGCTCCATAAAATACCCAATCAAATGCTACTTCAACGAAAATGGCTATACAATCTAAAGCTTCATCCCGATGATTTGAATCTCACCAAAGCTGTTGTCTGCAGCAATCACTTTGAGGCAGACTTGGAAGCGCATGACCAAGTGATGCAGTTGATACCCACACTGGACCTGGGTCACAATGACGCAAGTATATATCGCAATCAGAACAATGCCATGGCAACGTCCTGCATGGTGCCGAGCTGTCCCTGTGCTCGCTTGAATCTCTACCGCTGCAATCCACTGCCAGCGTATCCTCTCGTCCAGCACGCGTGGTTGGAGTGGTTGCAGTTGCCCAAGCCAAAGCGAGTTTGTGACGGACAACTGTGTGTTATGCATTACATGCAACTGTATGAGCAAGTGCCACTGCCGCCGGAGGTGCCAGGTGTGGAGTTGCAGTTACTGCAGCGCAACTACGATGTGATTTCCAACTCGACGATGGCCATGAAGTTGCGATGTGCTGTGCCTGGTTGTTATAGCAAGTATGTGGACGATATACGGTTGACTGAGCTACCCAGCAATCCGGATACTTGTTCGAAATGGGTCCACAATACGAAGATTCAGTACGATCAGTCTCGGCATTATATGTTTCGCATatgtttattgcattttgagCCCCAGTGTCTGGGTCCAGTGCGGCCAAAGTACTGGGCAATGCCCACACTATTGCTGAATCACAACGAAGctgatatatatttaaaccCAAAAGAAGAACCCGAGGAAGAAGAGCTGGTGACAGATACCCAGCTGCCACAGCCATCGTTTCTGCTTGAGCCTGATCATGATCATGATTCTGTTCCTCTTGAGCTACCGTTGAGAATCAAGACGGATTATTTACGCAGCTCTAGTCCAAGTGTTAGCGCCAGTCCAAGTCCACGTAGTAGGTCACGTGTCTGCTGCATTCCAAGTTGTGGCCAGCATACCAGCACTCATACGCGTGTCTACCGCTTTCCCACCGGAAAAACCGTGTTACTCATGTGGTTGGTGAATACACAGCAATCGCCAAGACTTGTGGATACCAAAAATCTGTTTATATGCCAGGATCATTTTGAAGCGGAGGCTTTTCAGCGAAGACAACTCGCAAGTTGGGCTGTCCCTACTGTAAAGCTAGGACACGACGGTCACATCCTGCCGAATCCCAAGCATAATGGCAACATGGCCGATAGCAGCGAGAACAAGAACGCTCTACAATTCATCTGGAAGAACTATTGTTCCGTGTTAGACTGCTTTCAACCGCGCAGCGAAGAAGTCCGTCTATTTCCCTATCCTACGGATCGGGCCCTCATACGCAAATGGGCTGTTAACTGTAGACAGCGGAGCAGTCTGGCCAGCAGTGATGGATGTCAGGTGTGTGAATTGCACTTTTCGGCAGACTGTTTTGATGCCGACACAAATGAACTGAAGGAGGATGCCGTACCCACGCTGGAGCTGACTCGTTCAGACTGGCCTTGCGTGGTATCTGGTTGTGTGaggaatgagaatgagaagaAACGTCGACTGTATAAGATACCCAAGAGGTGCGCTCAGTTGGCCGATTGGTGTCACAATCTACAGCTGGATCAGTGCACCATCAGGGAAGCAGAGCAGCCgcaatatgtgtgtgagcttCACTTTGAGAAGAACTGCTTCAACTCGAGCAAGATGCTGCTGCCTTTCGCACGACCAACATTGCATTTGGGCCATGACTCAGACATAAAGACAAACATAAAGCTGCGTTTGAATCCGAAATACGTTGAAAGCGAGCCAGAAGAACCTGAAGATGAAATAACGTACTGCTGTGTGCCCAAGTGTGGACGTACTAAGAAATTGAAAGAGGATGAtgcagaagaagaggaggaggaattGCAACTATTTAGTTTCCCTAGGCAGCGGACTATAGCCGAAAAGTGGTTACACAACATTTGCCTAAAGCTGAGCAAGGAGCAGATACGAAGTATGAAGGTTTGCCGTTTTCACTTTGAGCCCACTTGCATGGATGAGGGACAACTTCAGTACACTGCAATGCCAACACTTGAATTGGGCCACAATGATCTGTCTATTTATCGGTCAGCAACTTCGGGAAAGGTTAAACGCTACCTCAATCGCAACGGAGTCAGTATTGAGTGTTGTTATCCGATGTGTACTGAGCTGCAAAAGCAGTACATGAGAATGAACTTTGATCTACCTGAAACGGAGGCATTGCGTCGCAAATGGCTAGACCATATGGATAtagaggaggagcagcaaacGCCAAAGCTATGCCCCCTTCACTTGGTCATGATGTACGAACACAGTGACGACAATTTTGAGGAGCATCAGTCCGAGGAGCTGTTGGATACAAACTATGCCAACGCGAAGAAAAGTGTTCGATTACGCGCTATTAGTTGTGCTGTACGTGGATGCAGATTCATTCAGTCTCGCGATGGCGGTACTCTGCATGGTCTGCCCTCACGGGATGATATATTACAGATGTGGATACACAATTTACAATTGGATTTCACTGAGCGAGGGCGATACTTGACCAAAGTGTGTAGTAAACATTTTGCAGAGTGTTGTTTCATTGTTGGCCGCCTTAAAACATGGAGCATACCAACACTGGAATTACCTGAGCCTCAGCCGGACGCGGAACCACCTTATAAGATGATCACTGAAGAGGAATGGCAACAGATGTCAAAGCAATGGAAAGCAGAAAAACTGCAAATGGAACAGGCCAAGAACATTATCGATGACCCACGTATAGTGGTAAAGAATGAGCAGctagaggaggaggaggagccaGGTCAGGTGATTAAGTGTGATGAAAGTAACTCCCCGCAGCCGATGGAAATGGGCGAACTAGAGGTGCTCCTTGAGGTGGCACACGTGGAACATTGTCGATCATATGAGCACATATATAAGAAGCATGTCCAGCCATCTGACTTTGACTCACCGGGAGAGCCCTCATCCACTAGCTATGCCAGCAATAATGCCCGGCGTTGCAGTGTTTATGGTTGTGATGTGACAATTGATGATATCTGCGACTCCGTGAAGCTGCATAAGTTTCCCGTATTGTTCGATGCCATGAAGAAATGGATGCACAATACTCAGGTGGATGTGGATGTAAACTACTCTTGGCGTTATCGCATATGCAGCTATCATTTTACGCCGGAATGCTTAACTGGTTGGCGCCTACGACGTGGTGCAATGCCCACGTTAAATCTAGGTCCTCGACGTCCTAAGACTATCTACGATAATGAGTTCTACCTGAACAACGAATTGCCAATGTTGGATGGTGAGGAGCAGTTGACAAAAGTATTTCCTTCGGTCAAGATGGAGAAGAGCGCTGCCAATAACATTACAATGTCTATACCACCTGCAGCACGAATGCATAAATCCAGTAAAATCTGTAAGATTGAGAGTGACATTATCATGTGCATACCACCTCCGGCACGACCTCATAAATCGAGTAAATACTGTCAGGTTCATGGTTGTCCCAATCATTTGACCAGCGAGAACCTAACGCTGCATAAGTTTCCTCATGCGCCGGACATTTGCGCCAAGTGGCAGCACAACACACAGATACCATTCGACCCGAAATTCCGTTGGCGTTATCGCGTCTGCAGTGTTCACTTTGAGCCCAAATGCCTCTTGGGATTGCGTTTATGTCATGGTAGTGTGCCAACACTGTATTTGGGTTCAAATGCGCCGCCTCAGATCTTTGATAACGATATAGATGCGCTAAGCATGCGCTCAGACAGAGAGACGAGCGAGTTCGACCAGGAGTTGGCGATAATGCAGGAAGACATGGAGCAGCCAGAGCAGGAATTCGATTTGGACGAAGAGGAGGACGAAGAGCATGAAATGATCTGTTTTGAACCAGAGATGCAGCTGTTTGAGGATGATGAGACGGACAATCATTTTGAACCAGAGACGCAGCTATATGAGAATGCAGAACAGTCAAAATATGACAATCATCTTGGCTACAACAATTTCAGCCAATTGCGTTTACCCAGGATAAAGCAAGAGAACTTTGCAGATGGCTATAATCCGGTCAAACCTGGCTATGACAAGTGCTCACTGGTTCACTGCCAGCGGCAGCGTGCTCATCATGGCGTACATATCTACAAGTTTCCACGTTCACGTCAGCTGCAACAGCGGTGGATGCATAATCTCAGAATTCGGTATGATGAACGACGTCCCTGGCAGACAATGATATGTAGTGCTCATTTTGAGCCACGTTGCATACAACTGCGTAAGCTATGTTCGTGGGCTGTTCCTACGCTGGAGCTGGGTGATAACACACCGGAAGAGATTTATACAAATGAGTCAGCTCTGCAGCATCTGGGCGAAAATTATGAGGACATGCCATATAACGACTATGAAGATAACAACGGTTTTGTTGTGGAAGACGAATACGGAGAGCATGAGTACAAACCAATGGAAACAGTCAGACGACGTGGACCTGGACGTCCCCGACGCAGTGAGGCTGTAAAAAATGATAGACCAGGTcctaaaatcaaattgtgcTGCCTGCCGCATTGTCGCAGACCACGTGGTGATGGCATTAAACTGTTTCGTCTGCCCAGTAGATACACTGAGATAAAGCAATGGGAGCAGGCAACGGGAATGCAGTTTAAACCAGCAGAACGTAACACAAAACTCGTCTGCAGTCGTCACTTTGAGCCGCATTTGATCGGAGTGCGGCGTCTCATGTACAATGCAGTGCCAACACTCCATTTGCATCCAAGTAAAGAAACAACACCTGAACCACCTGCTGAACCTGTGCGTCCTACCAATCCACGTTGCTGCATTGAGGATTGCCACGAGGATATGCAGACGGGCAAGCTGCAGCGGTTTCCTAGTGATCCCGAGTTGCTTGCACAATGGTGCCATTCGCTTAAACTCACGAATATGGAAAGTTATCGTGACAAACACGtttgtgccacacacatgcCGCAGAATACGCTCAACTGCCTGATTTGTGGCGACGAGAagatgctgctgccattgcttGAATTCCCCAAGAATCGTAATCAGCGAGCCAAATGGTGTTATAATCTTAAAATCGAAGTCATACCCAAGTGGGACAACTCCAAACATATTTGCAGCAAACATTTCGAGAGCTACTGCTTCACAGAGCCAGGTCAATTGGTTCCGGAGGCAGCTCCGACGTTGCATTTGAAACACACGGACAGTAATATATTCCTAAACGATTATGCCATAGATCCTAACAAGATGATGATCAAGGATGAGCCAATGGAGGTCCCCGACGATCTGATGCTCTAA
Protein Sequence: MSQHNNPPPSPHHHHHHYYQQHHQQQQQQQQHFQQQHQQQLQHKQIQQQQQQHTWYSHVASYPPHHHPHAAAASAAAFAAPCKTNNNNNSSNSIMNAAYGASAAGAGSYYGSPAAAAAASAGGGSGYNLEANTVAYAHNQLLQYQQQQQQQQHQQQQQQLGQRSSYMSHGLMHSSYPYIKSEPLELSDDRATRQQQQHQQQQQQQQQLYQNPIMAPPPAPSTANRHTLDASGEMIIKSEPIDEHAYKSNYIDDNTPFADFSKYPEFGDDMLSPKVELSVKDEVYGNHKNPLGYPRRKLQAERSTESLPICQRCKEVFFKKQVYLRHVAESSCTIQEYDFKCNICPMSFMSTGELLKHKHLHRADKYFCHKYCGKYFDTIADCESHEYMQHEYDSFVCNMCSGTFATREQLYAHLPQHKFQQRYDCPICRLWYQTPLELHEHRLAAPYFCGKYYAGAQSATTHQSQQQHAHPHQQQQHHAPQQANYKLQDCHMGTMEMPSSHHKQNTAALPATAALNSLLQQRQANADGAAMYSSPMKNDVNVKLERSYSNSTSESGYSLHDSSYNNAYGSDTSMHSGSVGGPQAHSSTLDDSEDALCCVPLCGVRKSTSPTLQFFTFPKDDKYLHQWLHNLKMFHIPASSYTNFRICSMHFPKRCINRYSLCYWAVPTFNLGHDDVANLYQNRELTNTFTTGEVARCSMPNCTSQRGESNLKFYNFPKDIKSLIKWCQNARLPVQAKEPRHFCSRHFEERCIGKFRLKPWAVPTLHLGAQYGKIHDNPKNLYVEEKRCCLNFCRRSRSSDFNMSLYRFPRDEVLLRRWCYNLRLDPAVYRGKNHKICSAHFIKEALGLRKLSPGAVPTLHLGHNDTFNIYENELWPPPTPSTPTGHHHQQQHQQQMQQHQLQQQHANYHSSKYQRYSVAASTSSSASSTSHYVDPDLSSSYMGMGSSSGSGLNVSDSMDICCVPSCESKRHNNENITFHTIPRRPEQMRKWCHNIKIPEEKMHKGMRICSLHFESYCIGGCMRPFAVPTLHLGHDDEDIHRNPDVIKKLNIRETCCVAVCKRNRDRDHANLHRFPSNVTLLTKWCANLQRAVPDGSKLFNDAICEVHFEDRCLRNKRLEKWAVPTLVLGHENIAYPLPTPEQVAEFYARPSAPNNGEEQGECCVETCKRNPSVDDIKLYRPPEDTSVLAKWAHNLEIDAAKLPNMRICNLHFESHCIGKRMRPWAIPTLNLSSNIENLHENPDHHMLYKRRRHLNRGAEGERSSSMVKPTWVPRCCLPHCRKVRALHNVQLYRFPKLNRSTLAKWAHNLQVPMMGSAQRRLCSAHFEPHVLSKKCPVPLAVPTLDLNSPPGYKIYQNPAKLKANKLCLQRVCIVASCRRQRGPGVKLFRLPHSPTQLRKWMHNIRMRPRGSMRQQYRICSSHFESHSFNGKRLSTGAIPTLELGHDDDDIYPNEAQSFVEERCAVEGCEASKEQIEVRLFRFPIDDEDLLWKWCNNLKMNPVDCIGVRICNKHFESDCIGPKHLFKWAIPTLELGHDDAEIELTPNPKPANRYLDPVFKCCVPTCGKTRKFDEVQLNSFPKDPTLFNRWRHNLRLDHIHIKERDRYKICNSHFEDICIGKTRLKHGSIPTQELGHDDTEDLYQVNPDELHSFIGRHRRPRDSIRGVFVKQEEHSELEEEDIKPSISISEATDINTRQVKIKKSLVDLTCCVPDCGRSRLEHGARMFPFPNGKQQQIKWRENLRLEATDVDKTSRVCNVHFNKRCIDGKQLRGWAIPTQQLGHGDPPIYENPKNIPGFFTPTCALAHCRKRRSIDNDLRTYRYPRTEDLLEKWRVNLRLSPDQCRGRICADHFEPMVRGKLKLKTGAVPTLKLGHNEGVVFDNEAIKAGLQLEEDGESPVKVKKEKIDEEDEIKQERKDDDEGDDEEQQTEPKEEQMEEEHEEDEEDHGYFDPLELVETYADHHSEDNAADMDEDGIDNDDDDGEDDEEEDLPGNDDELLLPDSPPAGHQENHTDVEANHKNGIPKCVLKHCRNERSYSYPLSTFGFPTNQEVLLKWSTNLQLPLEDCVGRICIAHFEPEVVGTRNLKRNAVPTLNLGHDTPISYDCNGQAVGIYDDQPQHSVFRLSSLKHCRKREPEKLQQQQATKFAKQRKEGERCCVPSCDKQPELHGVKLHKIPNQMLLQRKWLYNLKLHPDDLNLTKAVVCSNHFEADLEAHDQVMQLIPTLDLGHNDASIYRNQNNAMATSCMVPSCPCARLNLYRCNPLPAYPLVQHAWLEWLQLPKPKRVCDGQLCVMHYMQLYEQVPLPPEVPGVELQLLQRNYDVISNSTMAMKLRCAVPGCYSKYVDDIRLTELPSNPDTCSKWVHNTKIQYDQSRHYMFRICLLHFEPQCLGPVRPKYWAMPTLLLNHNEADIYLNPKEEPEEEELVTDTQLPQPSFLLEPDHDHDSVPLELPLRIKTDYLRSSSPSVSASPSPRSRSRVCCIPSCGQHTSTHTRVYRFPTGKTVLLMWLVNTQQSPRLVDTKNLFICQDHFEAEAFQRRQLASWAVPTVKLGHDGHILPNPKHNGNMADSSENKNALQFIWKNYCSVLDCFQPRSEEVRLFPYPTDRALIRKWAVNCRQRSSLASSDGCQVCELHFSADCFDADTNELKEDAVPTLELTRSDWPCVVSGCVRNENEKKRRLYKIPKRCAQLADWCHNLQLDQCTIREAEQPQYVCELHFEKNCFNSSKMLLPFARPTLHLGHDSDIKTNIKLRLNPKYVESEPEEPEDEITYCCVPKCGRTKKLKEDDAEEEEEELQLFSFPRQRTIAEKWLHNICLKLSKEQIRSMKVCRFHFEPTCMDEGQLQYTAMPTLELGHNDLSIYRSATSGKVKRYLNRNGVSIECCYPMCTELQKQYMRMNFDLPETEALRRKWLDHMDIEEEQQTPKLCPLHLVMMYEHSDDNFEEHQSEELLDTNYANAKKSVRLRAISCAVRGCRFIQSRDGGTLHGLPSRDDILQMWIHNLQLDFTERGRYLTKVCSKHFAECCFIVGRLKTWSIPTLELPEPQPDAEPPYKMITEEEWQQMSKQWKAEKLQMEQAKNIIDDPRIVVKNEQLEEEEEPGQVIKCDESNSPQPMEMGELEVLLEVAHVEHCRSYEHIYKKHVQPSDFDSPGEPSSTSYASNNARRCSVYGCDVTIDDICDSVKLHKFPVLFDAMKKWMHNTQVDVDVNYSWRYRICSYHFTPECLTGWRLRRGAMPTLNLGPRRPKTIYDNEFYLNNELPMLDGEEQLTKVFPSVKMEKSAANNITMSIPPAARMHKSSKICKIESDIIMCIPPPARPHKSSKYCQVHGCPNHLTSENLTLHKFPHAPDICAKWQHNTQIPFDPKFRWRYRVCSVHFEPKCLLGLRLCHGSVPTLYLGSNAPPQIFDNDIDALSMRSDRETSEFDQELAIMQEDMEQPEQEFDLDEEEDEEHEMICFEPEMQLFEDDETDNHFEPETQLYENAEQSKYDNHLGYNNFSQLRLPRIKQENFADGYNPVKPGYDKCSLVHCQRQRAHHGVHIYKFPRSRQLQQRWMHNLRIRYDERRPWQTMICSAHFEPRCIQLRKLCSWAVPTLELGDNTPEEIYTNESALQHLGENYEDMPYNDYEDNNGFVVEDEYGEHEYKPMETVRRRGPGRPRRSEAVKNDRPGPKIKLCCLPHCRRPRGDGIKLFRLPSRYTEIKQWEQATGMQFKPAERNTKLVCSRHFEPHLIGVRRLMYNAVPTLHLHPSKETTPEPPAEPVRPTNPRCCIEDCHEDMQTGKLQRFPSDPELLAQWCHSLKLTNMESYRDKHVCATHMPQNTLNCLICGDEKMLLPLLEFPKNRNQRAKWCYNLKIEVIPKWDNSKHICSKHFESYCFTEPGQLVPEAAPTLHLKHTDSNIFLNDYAIDPNKMMIKDEPMEVPDDLML

Similar Transcription Factors

Sequence clustering based on sequence similarity using MMseqs2

100% Identity: -
90% Identity: -
80% Identity: -