Basic Information

Insect: Drosophila atripex
Gene Symbol: -
Assembly: GCA_035045925.1
Location: JAWNOP010000070.1:11808115-11821262[-]

Transcription Factor Domain

TF Family: THAP
Domain: THAP domain
PFAM: PF05485
TF Group: Zinc-Coordinating Group
Description: The THAP domain is a putative DNA-binding domain (DBD) and probably also binds a zinc ion. It features the conserved C2CH architecture (consensus sequence: Cys - 2-4 residues - Cys - 35-50 residues - Cys - 2 residues - His). Other universal features include the location of the domain at the N-termini of proteins, its size of about 90 residues, a C-terminal AVPTIF box and several other conserved residues. Orthologues of the human THAP domain have been identified in other vertebrates and probably worms and flies, but not in other eukaryotes or any prokaryotes [1].
Hmmscan Out: # of c-Evalue i-Evalue score bias hmm coord from hmm coord to ali coord from ali coord to env coord from env coord to acc

1 29 3.4 8.9e+03 -2.4 3.2 49 62 352 369 333 385 0.57

2 29 2.4e-15 6.2e-12 46.1 4.1 1 86 578 650 578 651 0.85

3 29 8.9e-15 2.3e-11 44.3 5.0 1 87 678 747 678 747 0.83

4 29 8.1e-16 2.1e-12 47.6 0.2 1 87 769 841 769 841 0.85

5 29 2.6e-16 6.8e-13 49.2 6.3 1 87 940 1010 940 1010 0.82

6 29 5.1e-15 1.3e-11 45.1 3.5 1 86 1034 1105 1034 1106 0.81

7 29 8.4e-13 2.2e-09 38.0 1.2 1 87 1141 1209 1141 1209 0.81

8 29 2.8e-11 7.3e-08 33.1 2.5 1 86 1249 1318 1249 1319 0.77

9 29 2e-17 5.2e-14 52.8 0.3 1 86 1346 1415 1346 1416 0.82

10 29 7.4e-13 1.9e-09 38.2 1.5 1 85 1437 1505 1437 1507 0.79

11 29 1.2e-14 3.2e-11 43.8 1.0 1 86 1534 1605 1534 1606 0.85

12 29 4.1e-14 1.1e-10 42.2 2.0 1 86 1688 1757 1688 1758 0.82

13 29 5.2e-13 1.3e-09 38.6 0.1 1 86 1781 1849 1781 1850 0.82

14 29 5.8e-14 1.5e-10 41.7 1.4 1 87 1977 2046 1977 2046 0.81

15 29 2.1e-08 5.3e-05 23.9 0.0 1 86 2142 2207 2142 2208 0.74

16 29 1.8e-06 0.0047 17.7 0.0 1 58 2223 2270 2223 2286 0.80

17 29 2.1e-13 5.4e-10 39.9 0.2 1 87 2300 2372 2300 2372 0.81

18 29 1.4e-13 3.6e-10 40.5 0.1 1 87 2432 2502 2432 2502 0.81

19 29 1e-10 2.7e-07 31.3 0.1 1 86 2537 2608 2537 2609 0.80

20 29 2.4e-13 6.1e-10 39.7 0.0 1 86 2619 2690 2619 2691 0.80

21 29 1e-15 2.6e-12 47.3 0.2 1 85 2715 2785 2715 2787 0.82

22 29 7.5e-07 0.0019 18.9 0.1 1 58 2817 2864 2817 2892 0.81

23 29 5.4e-12 1.4e-08 35.4 0.1 1 87 2902 2974 2902 2974 0.81

24 29 5.6e-16 1.5e-12 48.1 0.2 1 86 3083 3155 3083 3156 0.81

25 29 5.1e-13 1.3e-09 38.7 3.1 1 86 3216 3286 3216 3287 0.82

26 29 5.9e-14 1.5e-10 41.7 3.6 1 86 3357 3427 3357 3428 0.85

27 29 6e-12 1.6e-08 35.2 0.1 1 87 3511 3581 3511 3581 0.84

28 29 2.7e-10 7.1e-07 29.9 1.8 1 58 3609 3657 3609 3667 0.84

29 29 1.7e-09 4.5e-06 27.4 1.3 18 86 3675 3732 3664 3733 0.74

#	of	c-Evalue	i-Evalue	score	bias	hmm coord from	hmm coord to	ali coord from	ali coord to	env coord from	env coord to	acc
1	29	3.4	8.9e+03	-2.4	3.2	49	62	352	369	333	385	0.57
2	29	2.4e-15	6.2e-12	46.1	4.1	1	86	578	650	578	651	0.85
3	29	8.9e-15	2.3e-11	44.3	5.0	1	87	678	747	678	747	0.83
4	29	8.1e-16	2.1e-12	47.6	0.2	1	87	769	841	769	841	0.85
5	29	2.6e-16	6.8e-13	49.2	6.3	1	87	940	1010	940	1010	0.82
6	29	5.1e-15	1.3e-11	45.1	3.5	1	86	1034	1105	1034	1106	0.81
7	29	8.4e-13	2.2e-09	38.0	1.2	1	87	1141	1209	1141	1209	0.81
8	29	2.8e-11	7.3e-08	33.1	2.5	1	86	1249	1318	1249	1319	0.77
9	29	2e-17	5.2e-14	52.8	0.3	1	86	1346	1415	1346	1416	0.82
10	29	7.4e-13	1.9e-09	38.2	1.5	1	85	1437	1505	1437	1507	0.79
11	29	1.2e-14	3.2e-11	43.8	1.0	1	86	1534	1605	1534	1606	0.85
12	29	4.1e-14	1.1e-10	42.2	2.0	1	86	1688	1757	1688	1758	0.82
13	29	5.2e-13	1.3e-09	38.6	0.1	1	86	1781	1849	1781	1850	0.82
14	29	5.8e-14	1.5e-10	41.7	1.4	1	87	1977	2046	1977	2046	0.81
15	29	2.1e-08	5.3e-05	23.9	0.0	1	86	2142	2207	2142	2208	0.74
16	29	1.8e-06	0.0047	17.7	0.0	1	58	2223	2270	2223	2286	0.80
17	29	2.1e-13	5.4e-10	39.9	0.2	1	87	2300	2372	2300	2372	0.81
18	29	1.4e-13	3.6e-10	40.5	0.1	1	87	2432	2502	2432	2502	0.81
19	29	1e-10	2.7e-07	31.3	0.1	1	86	2537	2608	2537	2609	0.80
20	29	2.4e-13	6.1e-10	39.7	0.0	1	86	2619	2690	2619	2691	0.80
21	29	1e-15	2.6e-12	47.3	0.2	1	85	2715	2785	2715	2787	0.82
22	29	7.5e-07	0.0019	18.9	0.1	1	58	2817	2864	2817	2892	0.81
23	29	5.4e-12	1.4e-08	35.4	0.1	1	87	2902	2974	2902	2974	0.81
24	29	5.6e-16	1.5e-12	48.1	0.2	1	86	3083	3155	3083	3156	0.81
25	29	5.1e-13	1.3e-09	38.7	3.1	1	86	3216	3286	3216	3287	0.82
26	29	5.9e-14	1.5e-10	41.7	3.6	1	86	3357	3427	3357	3428	0.85
27	29	6e-12	1.6e-08	35.2	0.1	1	87	3511	3581	3511	3581	0.84
28	29	2.7e-10	7.1e-07	29.9	1.8	1	58	3609	3657	3609	3667	0.84
29	29	1.7e-09	4.5e-06	27.4	1.3	18	86	3675	3732	3664	3733	0.74

Sequence Information

Coding Sequence: ATGTCACAACATAACCAACCCCACCAAGTTCCCCCGCATCCGCACTATCCTTACCACCACGCCTCTCTTTCGCTGCccctgcaacagcaacatcagcaacagcagcagcagcagcaacagcagcaacagcaacatcatcaacaacagcttcagcagcagcagcagcagcagcaacatgccAGCAGTTGGTACTCACATGTTGCTTCCTACCCACCCTCCCATACGGCCTTCAACCCCTCACTCCCCTGCAAGgccgccagcaacagcagcaccaacaacaactccATCATGGGCGCCTACggagggggtggtggtgtcACGCATGGCTATTACGGCAATGTCAGCGGCGGAGTTGGTGTTGGAGTGGGTgggggcggtggcggtggcggtgccGTTGGCGGAGGAGGTGCAGTAGGTTCGACTTATGGCCTTGGGGCCAACACAGTGGCCTATGCCCACAACCAGCTGCTACAGTATcagcaacaccaccagcagcaggagcaacaATCGCATCAGTCCCACTTGGGCCAGCGGTCCTCCTACATGGGCCACGATATCATGGCCGGCAGCTATCCGTACATCAAGAGCGAACCCATGGAGGCCTTCCAGCAGCCGCCAAACCCCATGGCTCCACCGCCGCCCCTGCCTCCGGCCCAGGAAATGATCATAAAATCGGAACCTATGGACGAACAGGCCTACAAGTCCAACTACATAGATGACAACACCCCGTTTGCGGACTTCAGCAAATTCAACGAGTTCAGCGAGGACATGCTGAGTCCCAAAGTGGAGCTCACCGTCAAGGATGAGTCCTACGGCAAGAACCATAATAGTTTTCCTCGCCGCAAGCCACTCAATGATCGCCCCGCCGGTAATGAAAGCCTGCCTGTCTGCCAGCGCTGCAAGGAGGTGTTCTTCAAGAAGCAGACCTACTTGCGCCACGTTGCCGAGAGCAGCTGCACCATCCAGGAGTATGACTTCAAGTGCAACATCTGCCCCATGTCCTTCGTGAGCGCCGATGagctgcagcagcacaaaaaCCATCACCGGGCCGACCGATTCTTCTGCCACAAGTACTGCGGCAAGCACTTCGAATCGATCGCCGAGTGTGAAGCGCACGAGTACATGCAGCATGAGTACGACAGCTTCGTCTGCAACATGTGCTCGGCCACTTTTGCGACCAGGGATCAGCTCTACTCCCACCTGCCGCAGCACAAGTTTCAGCAGCGCTTCGACTGTCCCATATGCCGTCTGTGGTACCAGACCGCCCTACAGCTGCACGAGCATCGGATAGCGGAGCCCTATTACTGCGGAAAGTACTACGGGGCCGGGCTGAACACGGCGGCAcctcagcagcaacaccaccatCAGAGCCAGACAAACTACAAGCTACAGGATTGCCACATGGCCACCATGGAGATGCCCAATACATCTCAACACAAGCCAAATtcctccaccacctccaccttgCCGGCTACTGCGGCTCTGAGTTCCTtgctgcagcagcggcaagCGAATGCCGATGGAGCTGCCATGTTCGCTGCCTCGGCCGTCAAGGCGGAGATGAACGTCAAGCTGGAGCGGAGCTACAGCAACTCGACCAGTGAATCATCGTACGGAGTACAGGACGGCGGCTACAACAACTCGTTTGCAGGAGAAACAGCAATGCACAGTGGTGCGATAGCCGGACCACAGGCCAACTCCTCGACGCTGGACGACTCCGAAGATGCGCTGTGCTGTGTGCCATTGTGCGGGGTGCGCAAGAGCACCAGCCCTACGCTGCAGTTCTTCACGTTCCCCAAAGACGAGAAATACCTCAACCAGTGGCTGCACAACCTCAAGATGTTCCACGTGCCGGCCTCCAGCTACGCCAGCTTCCGCATCTGCAGCATGCACTTCCCCAAGCGCTGCATTAACCGCTACTCGCTGTGCTATTGGGCCGTTCCGACCTTCAACCTGGGCCACGACGACGTGGCCAATCTCTACCAGAACCGCGAGCTCACCAACACGTTCACCGTCGGCGAAGTGGCCAGGTGCAGCATGCCCCACTGCACCAGCCAGCGGGGCGAGAGCAATCTCAAGTTCTACAACTTTCCCAAGGACATCAAGAGCCTGATCAAGTGGTGTCAGAACGCCCGTCTGCCCGTCCAGGCCAAGGAGCCGCGGCACTTCTGCAGCCGCCACTTCGAGGAGCGGTGTATTGGCAAGTTCCGCCTCAAGCCCTGGGCTGTGCCCACTCTTCATCTGGGCGCTCAGTACGGGAAAATCCACGACAATCCCAAGAACCTGTATGTGGAGGAGAAGCGTTGTTGCCTCAACTTCTGTCGCAGGAGCAGGTCCTCCGACTTCAATATGTCGCTATATCGTTTTCCCAGAGACGAGGTGCTCCTCCGCCGTTGGTGCTACAATCTTCGCCTGGATCCCGGTGTTTATCGCGGCAAGAATCACAAAATATGCAGTGCCCACTTCATAAAGGAAGCGCTGGGCTTGCGGAAGCTATCACCTGGAGCGGTGCCTACTTTGCATTTGGGCCACAACGACACCTTCAACATCTACGAAAACGAGCTGTGGCCGCCGCCGACTCCCTCCACCAGCCACGGCAGTGGCCAGGTGCACttgcaacaccagcaacataTCCCCTCGCACCATCcgctccagcagcagctgcataTTGGACAGAGCAAATCCTATCAACGGCACTCGGCCGCATCCACCTCATCCTCGGCCAGCTCCACCTCGCACTACGTGGATCCGGAGGTGAGTGCCTCCTACCTGGCGGTGGGCGGATCCTCGGTGAACGCCAGCGACAGCATGGATGTCTGCTGTGTGCCCAGCTGCGAGAGCAAGCGGCACAACTCCGAAAACATCACCTTCCACACGATCCCCCGACGTCCCGAGCAGATGCGCAAGTGGTGCCACAACCTGAAGATACCCGAGGACAAGATGCACAAGGGTATGCGGATCTGCAGCCGGCACTTCGAGCCCTACTGCATCGGCGGGTGCATGCGTCCGTTCGCAGTGCCCACCCTGCACCTGGGTCACGACGACGAGGACATTCACCGGAATCCGGACGTAATAAAGAAGCTAAACATCCGTGAAACCTGCTGCGTAGCTGTGTGCAAGCGGAACCGGGACAGGGACCATGCCAACCTGCACCGCTTCCCCAGCAACGTGGCTCTGCTGACCAAGTGGTGTGCCAATCTCCAGCGCCCCGTGCCGGACGGCAGCAAGCTCTTCAACGACGCCATTTGCGAGGTGCACTTCGAGGACCGCTGTCTGCGGAACAAGCGCCTGGAGAAGTGGGCTGTGCCTACCCTGACCCTGGGCCACGAAGACATTGCCTATCCTCTGCCCACGCCGGAGCAGGTGGCCGAGTTCCACTCCCGGCCCTCGGCGCCCAACAATGGCGAGGAACAGGGCGAGTGCTGCGTTGAGACCTGCAAGCGAAACCCCAGCGTGGACGACATTAAGCTATACCGCCCTCCGGAGGAGGCGTCCGTGCTAGCCAAGTGGGCACACAACCTGCAGACAGAGGCCGCCCAGCTGGTAAGCCAGCGCATCTGCAACCTGCACTTCGAGGCCCACTGCATCGGCAAGCGAATGCGGCCATGGGCCATACCCACCCTCAACCTGGCCGGCAACATTGAGAATCTCTACGAGAACCCGGAGCCCTCGATGCTCTACAAACGGCGGATGCACACGAAGGCGAAACTGTCTGCCTCTGCGAAACCCACCTGGGTGCCGCGGTGCTGCCTACCACATTGCCGCAAGGTGCGCGCCCTCCACAATGTCCAGCTCTACCGCTTCCCCAAGCACAACCGCTCCACGCTGGCCAAGTGGGCCCACAACCTGCAGGTGCCCATGGTGGGCAGTGCCCAACGCCGGGTCTGCTCGGCTCATTTCGAGCCTCATGTGCTGAGCAAAAAGTGTCCGGTCCCGTTGGCGGTGCCCACCTTGGACCTGAACGCTCCGGCCGGGCATATGGTGTACCAGAATCCGGCCAAGCTGAGGGCTAGCAAGCTGTGCCTGCAGCGCGTGTGCATCGTGGAGAGTTGCCGCAAGACCCGGGCACAAGGCGTGCAACTCTTCCGGCTCCCGCACAATCCATCCCAGCTGCGGAAGTGGATGCACAACATCCGGACACGTCCACGGGGCTCCATGCGATCGCAATACCGGATCTGTTCCCGCCACTTTGAGACGCACTCGTTCAACGGGCGAAGGCTCAGTGCAGGAGCCATTCCCACGCTGGAGCTGGGCCACGACGACGATGACATCTACCCCAATGAGGCACAGGCTTTTGTGGACGAGCACTGTGCCGTGGAGGGATGTGGGGCGTCCAAAGAACAGCCGGAAGTGCGACTATTCCGCTTCCCCACGGACGACGATGACatgttgtggaagtggtgcaACAACCTCAAGATGAACCCCGCCGACTGCACGGGCGTGCGCATCTGCAACAAGCATTTCGAAGCGGACTGCATCGGACCGAAGCACCTATTTAAGTGGGCCATTCCCACCCAGGAGCTGGGCCACGACGACGCCCAGATAGAACTCATTCCGAACCCGAAGCCGGAGGATCGGTACGTCGATCCGGTGTTTAAGTGCGTGGTTCCCACCTGCGGCAAGACGCGGCGTTTCGACGAAGTCCAGATGAACAGCTTCCCCAAGGACCCGGAGCTCTTCCAGCGGTGGCGACACAACCTCCGCTTGGACCATCTGCACTTCCACGAGCGGGAACGCTACAAGATCTGCAACGCCCACTTCGAGGACGTCTGCATTGGCAAGACCCGCCTGAATATCGGCTCGATACCCACTCTGGAGCTGGGACATGATGAGACGGATGACCTGTTCCAAGTCAATCCCGCGGAGTTGCAGAGCAACTTGTTCGGCCGTCaacggcggctgcttgacgaAACGGAATCCGGGGAGGTGGTGGTCAAGCAGGAGCTGCCGGATGGGGATGGTGACTCCGAGCCCGAGGACCTAAAACCGGATATAAGACAAATACTAATACCCAGACCCAGACAGGTGAAGGCCAAGAAAGGAACTGTGGGGAATCTGAAGTGCTGCGTCCGAAGTTGCGGAAGGAGCCGGCTGCAGCATGGAGCTCGTCTGTTTGCCTTTCCCACGGGCAAGCAGCAGCACCTTAAGTGGCGCCACAATCTCCGCCTGGAGCCCGAGGACGTGGATAGGACCACCCGGGTGTGCAGCGCTCACTTTAATCGCCGCTGCATAGACGGGAAGCAGCTGAGGAGCTGGGCCATGCCCACACTCCAGCTGGGGCATCGGGAACAGCCGATCTACGAGAACCCGAAGAACATACCGGGCTTCTTCACACCCACCTGTGCCCTGAGCCACTGCCGCCAGAGAAGGAGTATCGACAACGACTTGAGGACATATCGGTACCCCCGGACGGAAGACCTCCTGGAAAAGTGGCGGGCGAATCTTCGCCTGACTCCGGATCAGTGCCGCGGTCGTATCTGTGCCGATCATTTCGAGCCTATGGTGCGCGGCAAGTTGAAACTGAAAACCGGAGCGGTGCCCACTTTGAAGCTCGGCCACGACGAGGGACTGATCTACGATAACGAGGCAATCAAGGCTGGcatggcggaggaggaggaggtcgcCTGCAAGCAGGAGATcatggacgaggaggaggagggcgaaGGAGAGGAGTCGCGGGAAGGTGTTCCCGCTGTCAACGAGGATGACGACGACAAGGACGACAGTTACTTTGATCCTTTGGAACTGGTGGAAACATTCGCAGAGCGGGCCAGCGACGACGAGGCGGAAGACCACGAAACGGAGGAGCAAAATGATCCCGATGAGGCGGATGAGGAGGAGGCAGAGGAGCTCCTGCCCGACCTGCCTCCCACACCGCCACCTGTGCCCCAGCGTCGCGAGAAACCCGCCAATAATGTGACCCCCATTTGCTGTCTGAAGCACTGTCGCAAGGAGCGCACGGCCTTCCATCTGCTGAGCACCTTCGGCTTTCCCAAGGACCGTAAGCTTCTACTGAAGTGGTGCGACAATCTCCACCTGCACCCGGATGACATCGTCGGCCGGGTCTGCATCGAGCACTTCGAGCCGGAGGTCCTCGGCACTCGGAAGCTGAAACAAAATGCAGTGCCCACCGTGAACTTGGGCCACGACGATCCGTTGCGGTACTCCTGCCATGGCGTGGAGCTAGATGCGGACTTGGAGCATGGCCAGCCGCAGCACTCGGTTTTTCGGCTTTGGAGCCTGAAACACTGCCGCAAGAGGAAGCTCCCGGATCCGCCGGACATTCGCCCCAGCCACTGGAAGGAGCTGAAGATGCATATGCAGAAGCAgagggagatggagatggagatggaaatGACGATGGAGACCGACATAGTGATGAGCACTCCTCCACAGACGCCGGTGAAGATTAAGCCAAAAAGATGCTGCGTCATCAGCTGCGGAAGCGAGGACGCCAAAAAGCTGGTAACCATGCCGGATGAGCGCAGCCTTCTCCGCCGGTGGCAGCACAATCTTAAGCTGCCAGTGTCGACGGATCCCAGTCTTGGCTTGTGCCTGGACCACTTCGAAGAGTCTCTGGTGCAATTTGGAAAGCCCCTGGACAGGGCAGTGCCCACACTGAAGCTGGGCCACAACAGTGGCAATCTCTACCAAAACAACGCCACTTGCTTGGTTCCCAGTTGTCCTAGTTCTGGCTCCGATGTATCTAGTTTCGTGGGTCTGCCCGTGAATCCAGTTATGAGAAGGGCCTGGCTCTCCTACCTTCAACATCCATTCCCGAGCGAAGGACTTCTATGTGGCAACCACTTCGTAGAACTGTACGAGCAGGTGGACTTGCCGGAGGACTTACCCGTCCAGGATCTGGAGGAGCTGGAACGCACTGTCGATGAACTGCAGTGCGCTGTGCCCGGTTGCGAGTCAAAGAACGCCCGCGAGATTCCTGTCCAGCTGGTCCAGTTACCCCACAACGAGGAGGAACTGTCCAAGTGGCTGCACAACACAAAGATCACTTATGACTATTCCCGACACGGTAGCTATCGGATCTGCCTGCTCCACTTTGACCCCAGCTGCCTGGAAGAGGACTTTCCACAGAGCTGGGCAGTGCCTACTCTGAACCTGGGCCACGAGGACGAGATCCACCTGAACCCCGAGCAGAATCAGGCTCCTGAGGCTCTTAACGGAACCTCCAACGGCAATCCCTGGCTGACGCCTCTCAGAATCAAGACGGAATTGGCTTCCGTAAGCAGCCCCAGCGTGAGCGCCAGTCCCAGTCCGAGGGGTAAGATCCGGATTTGCTGCATCCCCACCTGCGGCCAGTTTGGCAATAGCCAGGTGCGACTGTATCGCTTTCCCAGCGAGGAGCAGTTCCTCCTCCAGTGGCTGATCAacacgcagcagcagccccgGCTCGTGGATCCCATGGAGCTCTACGTGTGCCAGGCACACTTTGAAGCCGACGCCATCTACAAGAAGCATCTTCGCAGCTGGGCGTTGCCAACCCTAAATCTTGGCCATGACGGGCATGTCTTTCCGAATTCCAGGCACAACGGAAACACCGCCGATGTCTTGGATATCGAGGAGGCCACTAAGTTCATCCGGGAGCGCTACTGTTCGGTGCTGAGTTGCTTTCAGCCCGGAGGAGAGCAGGTTCGGCTCTTCGAGTACCCCGAGGACATGTCTATGATTCGAAAGTGGGCAGTGGCCTGCAAACATCGTTCCATGCACGCCAGGAGCCATGGACTCCGGGTGTGTCAGGCGCACTTTGCTGCCGAGTGTTTTCATCCCGCTACTGGAGATCTGCTAGAAGGGTCCATACCCACACTGGAACTCAGCCGAGACGACATCGAGAGACACTGCTTGGTGCGGGGATGTGAGAGGGACGAGTCGGGTCATCGCTTGCGATTCTATAAGCTGCCCAAGATCGCTGACCAGCTCCAGGCGTGGAGCAACAATCTGAAAATTCCGCCCACCGAACTGATGCAAGGAGACCAGCGCATCTGCGAGCGCCACTTCGAGGCGTACTGCTTCGGACCCAGCCGGGGCCTGCGCCAGGGAGCTTTACCCACATTGTCCCTGGGCCacgaggaggaggtggagctgCTTCCTAATCCCGAGAAGTTGCGGCTGGGCACGCAGGAGAGATGTTGTGTACCAGGCTGCGGAGAAGTCCGCCAGCCAGATGACATCCCCTTCCACAGCTTCCCGAAGCTTTGGCCTTTGGCCAGGAAGTGGCTGCACAACCTCCGCCTGGAAAAGTCGAGCAAGGATCAGCTAAACAAACTTAGGGTGTGCCCGGCGCACTTTGACGCGGAAGTGCGTGGAAACGATGGACTCCTGCCAGAAGCCGTGCCCACCAAGCAGCTGGGGCACTCCTCCGAAGGCATTTTCCTAACCACCCAACAGGCCAGGAGCTTTCAGAGTCACAAAAAGTCCCTTGCGGAGGTGGCTTGCTGTTATCCGAATTGTACTGATTCCTCCAGGATCCAGTTGATGGATTTTCCCGACGCGGCAGAGCTGCGCAATGCTTGGTTGGATCATTTGGAAATCAAGGAGCCACATGGTAATGGCCCACAACTCTGTCCCCTCCATTATGTGATTGTATATGAGCACAGTGCCAAGGCGTTTCCGGAGCACACTCCAGACCAGTTAATGGAGGAGAACTACCGAAACGCCCGCGGCAGTCGGCGCGTGAAGATCGTCAGTTGCGCCATCAAGGGCTGCAGTATGGTGAAGCCTAGAGATGGAGTGATGCTGCACGGAATGCCCATCTTCAAGGACATCTTGCAGATGTGGCTGGACAACGGACAGATAGACTTCTCCGAACAGCAACGGTACATGCTCAAGGTGTGCCACCGGCACTTTGAACCAAGTTGCTTCGTCGAGGAACGGCGGCTCACCTCCTGGAGTGTTCCTACTCTGCATCTTCCCGGCGAGACCATCCACCAGAGCCCCAGCAAAGAAGAATGGCTGGCCATTAAGAAGGATAGGGAAGAGCCAGAGATTAAGGAGGAACCACTAGAGACGCAGACAGAGATGGAAACGGAAAACTCTCTACTGGAGCCTATTGTGAAGATGGAACATATGGACTCCGAGGAGGACGACTCACAGATGCAGGCGTTGGAGGTGCTGCTGGAGGTGGGACACGTGGAGCGGCTGGACAGCTATGAGAAGATAGACAAATCCCCCATCGCCTACCCGGAGCACGTCATATACAAATCCAATCGAAGTCAATACAACGCCAACCGATGCGCCGTGGAGGGATGTGAGGTCACAGCCGAGGACGTAGACGGCACCATCAGGCTGCACAAGTTTCCCGCCTCTGCGGACGCCGCCCAGAAGTGGATGCACAACACCCAGGTGGACATGGAGGAGAAGTTCTGGTGGCGCTATCGCATTTGCAGCTATCACTTCCACCAGGAATGCTTTCAGGGCTCCAGAATCCGGAAAGGAGCAATGCCCACGCTGCTCTTGGGACCTCGGCGACCGGATGAACTTTACGAGAATGAGTTCGCCTCGCAGCCGGAAGCGGAGGAGTCGCCTCTGCCGGTCGAGATTTCTCAGGCCAGTGTGACAGAGCGGACTGCTCCCGACGTTACCAATCTCTGCCTTCCGCCGCCGGCTGCGCCGCGAAAGTCTAGCAAGTTCTGCCAAATCGAAGGCTGCTCGAATCATCTGACCAGCGAGAACATAACCCTCCACAAGTTTCCCCACTCTGAGGACATGTGCATCCGATGGCAGCACAACACTCAAGTTCCATTCGATCCGAATCATCGCTGGCGGTACAGGATCTGTACCGCCCACTTTGAGCCCGTGTGCTTGGCCAACTTGCGCCTGCTCCACGGCAGTGTGCCCACCCTGAAGCTCGGACCCAAAGCTCCGGCGGAGCTCTTCGACAACGATTTTGAGGCCATCAACCAGCGCCTGGACAAGAGATCGGCGGCAGAGATAAAACAGGAACGTGTGGACATGGAGGACGAGCTGCACGAGGATCAAATGGAGGTGCCTAGCTGGAAACCTGTGAAGCAGGAGAAGATATCCTTCAACCAGATCAAATCTGGCTACGACAAGTGCTCGCTGGCCCACTGCCAGCGCCAAAGATCTCTGCACGGCGTCCACATCTACAAGTTTCCCAGGTCGCAGCGCCAACAGGAGcggtggatgcacaacctccGCATTCGCTACGATGAGCGCCGTCCCTGGCGCTTCATGATCTGCAGCGTCCACTTCGAGCCCCACTGCATCAGCCTTAGAAAGCTGCGTCCCTGGGCAGTTCCCACGCTGGAGCTGGGCACGAACGTGCCGGAGAAAATCTTCACCAACGAGCAGTGCCAGGAACTGGAGGTGGAACAGCCCAGCGATCGCAGCGAGGCGGACAGCGATGAGGAGGATGGGCTGGAAGAAGACGACGatggggaggaggaggcggtggaggAAGAAGGACAAGACTGTAATGTCCGCATTAAGAAGGAACGGCGTTCGAAGCTGGATCCATATCCTGCAGGTCAGGTCCCGCCATGGAAGGTGAAGCAGTGCTGCCTTCCCTACTGTCGTGCCTTCCGAGGAGATGGCATTAAGCTCTTCCGGCTCCCCAACAACCGATCCTCCATTCGCAACTGGGAGCTGGCCACGGGCATGGTGTTCAAAGAGTCGCAGCGGAACACACGACTCATTTGCAGTCGACACTTTGACCCGGAGCTTATCGGCGTCCGTCGTCTCATGCGCAACGCTATTCCCACTCTGCATCTGAATCCCCAGGCGGTTCCAGCCAAGGAGAAAAAGATATCGCCGGCCAAGCCCAAGGATACCCCTTCCTCCATGCCCACCTGCTGCATGGCGGATTGTCATCACAACGGAAATGCGAAGCTCCATAAATTCCCCAGCGACTCCACACACCTGAGGCAGTGGTGCCAGGCTCTCAGACTCACGGATACACAACGTTATCGCGGCAAGTATATCTGTTCAGCCCACCTGCCCACCAATATGACAGTTAGCTGCATCGTCTGCGGGGTAGATGACGTTCAGCTACCGATGCTGGACTTTCCAGAGAACCGCAACCAGCGGGCCAAATGGTGCTACAACCTGAAAATCGAGACCATACCCAAGTGGGATCGCTCCAAGCACATCTGCTGCCGGCACTTTGAGGCACACTGCTTTGCCCGGCCGGGTGAACTTCGTCCAGGAGCGACCCCAACAGTGGCTTTGAACCACAACGACACAAACATATTCCTCAGCGACTACGCCACCGATCCGACGACCTCCAATGCGGGTAGTCAGATCAAGGACGAGCCCATGGACGGCGACGAGACGCTCCTGGTCTAG
Protein Sequence: MSQHNQPHQVPPHPHYPYHHASLSLPLQQQHQQQQQQQQQQQQQHHQQQLQQQQQQQQHASSWYSHVASYPPSHTAFNPSLPCKAASNSSTNNNSIMGAYGGGGGVTHGYYGNVSGGVGVGVGGGGGGGGAVGGGGAVGSTYGLGANTVAYAHNQLLQYQQHHQQQEQQSHQSHLGQRSSYMGHDIMAGSYPYIKSEPMEAFQQPPNPMAPPPPLPPAQEMIIKSEPMDEQAYKSNYIDDNTPFADFSKFNEFSEDMLSPKVELTVKDESYGKNHNSFPRRKPLNDRPAGNESLPVCQRCKEVFFKKQTYLRHVAESSCTIQEYDFKCNICPMSFVSADELQQHKNHHRADRFFCHKYCGKHFESIAECEAHEYMQHEYDSFVCNMCSATFATRDQLYSHLPQHKFQQRFDCPICRLWYQTALQLHEHRIAEPYYCGKYYGAGLNTAAPQQQHHHQSQTNYKLQDCHMATMEMPNTSQHKPNSSTTSTLPATAALSSLLQQRQANADGAAMFAASAVKAEMNVKLERSYSNSTSESSYGVQDGGYNNSFAGETAMHSGAIAGPQANSSTLDDSEDALCCVPLCGVRKSTSPTLQFFTFPKDEKYLNQWLHNLKMFHVPASSYASFRICSMHFPKRCINRYSLCYWAVPTFNLGHDDVANLYQNRELTNTFTVGEVARCSMPHCTSQRGESNLKFYNFPKDIKSLIKWCQNARLPVQAKEPRHFCSRHFEERCIGKFRLKPWAVPTLHLGAQYGKIHDNPKNLYVEEKRCCLNFCRRSRSSDFNMSLYRFPRDEVLLRRWCYNLRLDPGVYRGKNHKICSAHFIKEALGLRKLSPGAVPTLHLGHNDTFNIYENELWPPPTPSTSHGSGQVHLQHQQHIPSHHPLQQQLHIGQSKSYQRHSAASTSSSASSTSHYVDPEVSASYLAVGGSSVNASDSMDVCCVPSCESKRHNSENITFHTIPRRPEQMRKWCHNLKIPEDKMHKGMRICSRHFEPYCIGGCMRPFAVPTLHLGHDDEDIHRNPDVIKKLNIRETCCVAVCKRNRDRDHANLHRFPSNVALLTKWCANLQRPVPDGSKLFNDAICEVHFEDRCLRNKRLEKWAVPTLTLGHEDIAYPLPTPEQVAEFHSRPSAPNNGEEQGECCVETCKRNPSVDDIKLYRPPEEASVLAKWAHNLQTEAAQLVSQRICNLHFEAHCIGKRMRPWAIPTLNLAGNIENLYENPEPSMLYKRRMHTKAKLSASAKPTWVPRCCLPHCRKVRALHNVQLYRFPKHNRSTLAKWAHNLQVPMVGSAQRRVCSAHFEPHVLSKKCPVPLAVPTLDLNAPAGHMVYQNPAKLRASKLCLQRVCIVESCRKTRAQGVQLFRLPHNPSQLRKWMHNIRTRPRGSMRSQYRICSRHFETHSFNGRRLSAGAIPTLELGHDDDDIYPNEAQAFVDEHCAVEGCGASKEQPEVRLFRFPTDDDDMLWKWCNNLKMNPADCTGVRICNKHFEADCIGPKHLFKWAIPTQELGHDDAQIELIPNPKPEDRYVDPVFKCVVPTCGKTRRFDEVQMNSFPKDPELFQRWRHNLRLDHLHFHERERYKICNAHFEDVCIGKTRLNIGSIPTLELGHDETDDLFQVNPAELQSNLFGRQRRLLDETESGEVVVKQELPDGDGDSEPEDLKPDIRQILIPRPRQVKAKKGTVGNLKCCVRSCGRSRLQHGARLFAFPTGKQQHLKWRHNLRLEPEDVDRTTRVCSAHFNRRCIDGKQLRSWAMPTLQLGHREQPIYENPKNIPGFFTPTCALSHCRQRRSIDNDLRTYRYPRTEDLLEKWRANLRLTPDQCRGRICADHFEPMVRGKLKLKTGAVPTLKLGHDEGLIYDNEAIKAGMAEEEEVACKQEIMDEEEEGEGEESREGVPAVNEDDDDKDDSYFDPLELVETFAERASDDEAEDHETEEQNDPDEADEEEAEELLPDLPPTPPPVPQRREKPANNVTPICCLKHCRKERTAFHLLSTFGFPKDRKLLLKWCDNLHLHPDDIVGRVCIEHFEPEVLGTRKLKQNAVPTVNLGHDDPLRYSCHGVELDADLEHGQPQHSVFRLWSLKHCRKRKLPDPPDIRPSHWKELKMHMQKQREMEMEMEMTMETDIVMSTPPQTPVKIKPKRCCVISCGSEDAKKLVTMPDERSLLRRWQHNLKLPVSTDPSLGLCLDHFEESLVQFGKPLDRAVPTLKLGHNSGNLYQNNATCLVPSCPSSGSDVSSFVGLPVNPVMRRAWLSYLQHPFPSEGLLCGNHFVELYEQVDLPEDLPVQDLEELERTVDELQCAVPGCESKNAREIPVQLVQLPHNEEELSKWLHNTKITYDYSRHGSYRICLLHFDPSCLEEDFPQSWAVPTLNLGHEDEIHLNPEQNQAPEALNGTSNGNPWLTPLRIKTELASVSSPSVSASPSPRGKIRICCIPTCGQFGNSQVRLYRFPSEEQFLLQWLINTQQQPRLVDPMELYVCQAHFEADAIYKKHLRSWALPTLNLGHDGHVFPNSRHNGNTADVLDIEEATKFIRERYCSVLSCFQPGGEQVRLFEYPEDMSMIRKWAVACKHRSMHARSHGLRVCQAHFAAECFHPATGDLLEGSIPTLELSRDDIERHCLVRGCERDESGHRLRFYKLPKIADQLQAWSNNLKIPPTELMQGDQRICERHFEAYCFGPSRGLRQGALPTLSLGHEEEVELLPNPEKLRLGTQERCCVPGCGEVRQPDDIPFHSFPKLWPLARKWLHNLRLEKSSKDQLNKLRVCPAHFDAEVRGNDGLLPEAVPTKQLGHSSEGIFLTTQQARSFQSHKKSLAEVACCYPNCTDSSRIQLMDFPDAAELRNAWLDHLEIKEPHGNGPQLCPLHYVIVYEHSAKAFPEHTPDQLMEENYRNARGSRRVKIVSCAIKGCSMVKPRDGVMLHGMPIFKDILQMWLDNGQIDFSEQQRYMLKVCHRHFEPSCFVEERRLTSWSVPTLHLPGETIHQSPSKEEWLAIKKDREEPEIKEEPLETQTEMETENSLLEPIVKMEHMDSEEDDSQMQALEVLLEVGHVERLDSYEKIDKSPIAYPEHVIYKSNRSQYNANRCAVEGCEVTAEDVDGTIRLHKFPASADAAQKWMHNTQVDMEEKFWWRYRICSYHFHQECFQGSRIRKGAMPTLLLGPRRPDELYENEFASQPEAEESPLPVEISQASVTERTAPDVTNLCLPPPAAPRKSSKFCQIEGCSNHLTSENITLHKFPHSEDMCIRWQHNTQVPFDPNHRWRYRICTAHFEPVCLANLRLLHGSVPTLKLGPKAPAELFDNDFEAINQRLDKRSAAEIKQERVDMEDELHEDQMEVPSWKPVKQEKISFNQIKSGYDKCSLAHCQRQRSLHGVHIYKFPRSQRQQERWMHNLRIRYDERRPWRFMICSVHFEPHCISLRKLRPWAVPTLELGTNVPEKIFTNEQCQELEVEQPSDRSEADSDEEDGLEEDDDGEEEAVEEEGQDCNVRIKKERRSKLDPYPAGQVPPWKVKQCCLPYCRAFRGDGIKLFRLPNNRSSIRNWELATGMVFKESQRNTRLICSRHFDPELIGVRRLMRNAIPTLHLNPQAVPAKEKKISPAKPKDTPSSMPTCCMADCHHNGNAKLHKFPSDSTHLRQWCQALRLTDTQRYRGKYICSAHLPTNMTVSCIVCGVDDVQLPMLDFPENRNQRAKWCYNLKIETIPKWDRSKHICCRHFEAHCFARPGELRPGATPTVALNHNDTNIFLSDYATDPTTSNAGSQIKDEPMDGDETLLV

Similar Transcription Factors

Sequence clustering based on sequence similarity using MMseqs2

100% Identity: iTF_00550281; iTF_00580011; iTF_00538995; iTF_00566122; iTF_00488052;
90% Identity: iTF_00538995;
80% Identity: -