Basic Information

Insect: Drosophila merina
Gene Symbol: -
Assembly: GCA_035047645.1
Location: JAWNPH010000055.1:9093293-9106169[-]

Transcription Factor Domain

TF Family: THAP
Domain: THAP domain
PFAM: PF05485
TF Group: Zinc-Coordinating Group
Description: The THAP domain is a putative DNA-binding domain (DBD) and probably also binds a zinc ion. It features the conserved C2CH architecture (consensus sequence: Cys - 2-4 residues - Cys - 35-50 residues - Cys - 2 residues - His). Other universal features include the location of the domain at the N-termini of proteins, its size of about 90 residues, a C-terminal AVPTIF box and several other conserved residues. Orthologues of the human THAP domain have been identified in other vertebrates and probably worms and flies, but not in other eukaryotes or any prokaryotes [1].
Hmmscan Out: # of c-Evalue i-Evalue score bias hmm coord from hmm coord to ali coord from ali coord to env coord from env coord to acc

1 29 7 2.1e+04 -3.5 4.5 38 62 326 353 318 372 0.60

2 29 2.8e-15 8.4e-12 45.9 4.2 1 86 562 634 562 635 0.86

3 29 8.9e-15 2.6e-11 44.3 5.0 1 87 662 731 662 731 0.83

4 29 8.1e-16 2.4e-12 47.6 0.2 1 87 753 825 753 825 0.85

5 29 2.6e-16 7.7e-13 49.2 6.3 1 87 924 994 924 994 0.82

6 29 4.5e-15 1.3e-11 45.2 3.2 1 86 1018 1089 1018 1090 0.82

7 29 8.3e-13 2.5e-09 38.0 1.2 1 87 1125 1193 1125 1193 0.81

8 29 2.8e-11 8.3e-08 33.1 2.5 1 86 1233 1302 1233 1303 0.77

9 29 1.7e-17 5.1e-14 53.0 0.3 1 86 1330 1399 1330 1400 0.82

10 29 7.3e-13 2.2e-09 38.2 1.5 1 85 1421 1489 1421 1491 0.79

11 29 6.1e-14 1.8e-10 41.6 0.7 1 86 1518 1589 1518 1590 0.84

12 29 2.6e-14 7.6e-11 42.8 2.0 1 86 1670 1739 1670 1740 0.83

13 29 2.1e-12 6.3e-09 36.7 0.1 1 86 1763 1831 1763 1832 0.82

14 29 7.4e-14 2.2e-10 41.3 1.4 1 87 1962 2031 1962 2031 0.81

15 29 3.9e-08 0.00012 23.0 0.0 1 86 2127 2192 2127 2193 0.79

16 29 9.8e-06 0.029 15.3 0.0 1 58 2208 2255 2208 2271 0.80

17 29 2.6e-12 7.8e-09 36.4 0.1 1 87 2285 2357 2285 2357 0.79

18 29 2.2e-14 6.6e-11 43.0 0.2 1 87 2417 2487 2417 2487 0.82

19 29 3.6e-10 1.1e-06 29.5 0.0 1 86 2522 2593 2522 2594 0.79

20 29 3e-11 9e-08 33.0 0.0 1 87 2602 2674 2602 2674 0.76

21 29 7.9e-14 2.3e-10 41.3 0.1 1 85 2698 2768 2698 2770 0.81

22 29 2.8e-08 8.3e-05 23.5 0.3 1 58 2798 2845 2798 2865 0.84

23 29 1.4e-12 4.2e-09 37.2 0.1 1 87 2883 2955 2883 2955 0.81

24 29 1.7e-15 5.2e-12 46.6 0.1 1 86 3062 3134 3062 3135 0.81

25 29 6.7e-13 2e-09 38.3 3.3 1 86 3195 3265 3195 3266 0.82

26 29 5.8e-14 1.7e-10 41.7 3.6 1 86 3336 3406 3336 3407 0.85

27 29 1.9e-11 5.7e-08 33.6 0.1 1 86 3490 3559 3490 3560 0.84

28 29 3.9e-10 1.1e-06 29.4 0.8 1 58 3588 3636 3588 3652 0.85

29 29 2.8e-09 8.1e-06 26.7 1.4 18 86 3654 3711 3642 3712 0.74

#	of	c-Evalue	i-Evalue	score	bias	hmm coord from	hmm coord to	ali coord from	ali coord to	env coord from	env coord to	acc
1	29	7	2.1e+04	-3.5	4.5	38	62	326	353	318	372	0.60
2	29	2.8e-15	8.4e-12	45.9	4.2	1	86	562	634	562	635	0.86
3	29	8.9e-15	2.6e-11	44.3	5.0	1	87	662	731	662	731	0.83
4	29	8.1e-16	2.4e-12	47.6	0.2	1	87	753	825	753	825	0.85
5	29	2.6e-16	7.7e-13	49.2	6.3	1	87	924	994	924	994	0.82
6	29	4.5e-15	1.3e-11	45.2	3.2	1	86	1018	1089	1018	1090	0.82
7	29	8.3e-13	2.5e-09	38.0	1.2	1	87	1125	1193	1125	1193	0.81
8	29	2.8e-11	8.3e-08	33.1	2.5	1	86	1233	1302	1233	1303	0.77
9	29	1.7e-17	5.1e-14	53.0	0.3	1	86	1330	1399	1330	1400	0.82
10	29	7.3e-13	2.2e-09	38.2	1.5	1	85	1421	1489	1421	1491	0.79
11	29	6.1e-14	1.8e-10	41.6	0.7	1	86	1518	1589	1518	1590	0.84
12	29	2.6e-14	7.6e-11	42.8	2.0	1	86	1670	1739	1670	1740	0.83
13	29	2.1e-12	6.3e-09	36.7	0.1	1	86	1763	1831	1763	1832	0.82
14	29	7.4e-14	2.2e-10	41.3	1.4	1	87	1962	2031	1962	2031	0.81
15	29	3.9e-08	0.00012	23.0	0.0	1	86	2127	2192	2127	2193	0.79
16	29	9.8e-06	0.029	15.3	0.0	1	58	2208	2255	2208	2271	0.80
17	29	2.6e-12	7.8e-09	36.4	0.1	1	87	2285	2357	2285	2357	0.79
18	29	2.2e-14	6.6e-11	43.0	0.2	1	87	2417	2487	2417	2487	0.82
19	29	3.6e-10	1.1e-06	29.5	0.0	1	86	2522	2593	2522	2594	0.79
20	29	3e-11	9e-08	33.0	0.0	1	87	2602	2674	2602	2674	0.76
21	29	7.9e-14	2.3e-10	41.3	0.1	1	85	2698	2768	2698	2770	0.81
22	29	2.8e-08	8.3e-05	23.5	0.3	1	58	2798	2845	2798	2865	0.84
23	29	1.4e-12	4.2e-09	37.2	0.1	1	87	2883	2955	2883	2955	0.81
24	29	1.7e-15	5.2e-12	46.6	0.1	1	86	3062	3134	3062	3135	0.81
25	29	6.7e-13	2e-09	38.3	3.3	1	86	3195	3265	3195	3266	0.82
26	29	5.8e-14	1.7e-10	41.7	3.6	1	86	3336	3406	3336	3407	0.85
27	29	1.9e-11	5.7e-08	33.6	0.1	1	86	3490	3559	3490	3560	0.84
28	29	3.9e-10	1.1e-06	29.4	0.8	1	58	3588	3636	3588	3652	0.85
29	29	2.8e-09	8.1e-06	26.7	1.4	18	86	3654	3711	3642	3712	0.74

Sequence Information

Coding Sequence: ATGTCACAACATAATCAACCCCACCAAGTTCCCCCGCACCCGCATCCGCACTATCCCTACCACCACGCCTCCTTGTCACTGCCcttgcagcaacaacagcagcagcatcagcagcagcagcaacagcaacagcagcagcatgcCAGCAGTTGGTACTCACATGTTGCTTCCTACCCACCCTCCCATACGGCCTTCAGCCCCGCACTCCCCTGCAAGgccgccagcaacagcaacagcgccaccaacaacaactccATCATGGGCGCCTATGGAGGGGGCGGCGACACGCATGGCTATTACGGCAATGTAAGCGCCGGAAtaggagtgggagtgggagtgggtggtggggcaGTAGGCTCGACCTACGGCCTTGGGGCCAACACAGTGGCCTATGCCCACAATCAACTGCTTCAGTATCAGCCGCACcatcagcagcatcagcaggagcagcacTCGCAGCAGCCGCACCTGGGCCACCGGTCGTATATGGGGCACGATGTCatgacagggacagggaccgCAACCGGTAGCTATCCGTATATCAAAAGCGAACCCATGGAGGCTTTTCAGCAGCCGCCAAACCCCATGGCTCCGCCACCAGCCCTGCCCCCAGCCCAAGAGATGATCATAAAATCGGAACCCATTGACGAACAGGCCTACAAGTCCAACTATGTTGACGACAACACGCCCTTTGCCGACTTCAGTAAGTTCAACGAATTCAGCGAAGACATGCTGAGTCCCAAAGTGGAGCTGACCGTCAAAGACGAGTCGTACGCCAAAAACTTCCACCATCGAAAGCTGCAAAACGATCGCCCTGCCGGCAATGAAAGCCTGCCGGTGTGCCAGCGCTGCAAGGAGGTGTTCTTTAAGAAGCAGACCTACCTTCGCCACGTTGCAGAGAGTAGCTGCTGCATCCAGGAGTATGACTTCAAGTGCACCATCTGCCCCATGTCCTTCGTGAGCGCTGAGGAGCTGCAGCGGCACAAGCACCATCATCGGGCCGATCGATTCTTCTGCCACAAATACTGTGGCAAGCATTTCGAATCGATTGCCGAGTGTGAGGCGCATGAGTACATGCAGCATGAGTACGACAGCTTTGTCTGCAATATGTGCTCGGCCAACTTTGCGACCAGGGAGCAGCTCTACTCCCACCTACCGCAGCACAAGTTTCAGCAGCGCTTCGACTGCCCCATATGCCGCCTATGGTATCAGACCGCTCTCCAGCTGCACGAGCACCGGATAGCGGAGCCCTATTACTGCGGCAAATATTACGCAAGCGGACTTAACACAGGCGCatcacagcagcagcagcatcaccACCAGAGCCAGACGAACTACAAGCTACAGGATTGTCACATGGCCACAATGGAGATGCCCAATACATCGCAACACAAGCCGAATTCCTCCAACTCCACCATGCCGGCTACGGCGGCACTTAGTTCCTTGCTCCAGCAGCGGCAAGCAAAAGCCGATGGTGCGGCCATGTTCGCCGCCTCGGCGGTCAAGGCGGAAACAAACGTGAAGCTGGAGCGGAGCTACAGTAACTCGACCAGTGAATCATCGTACGGTATGCAGGATGGCGGCTACAACAACTCCTTTTCCGGAGAGTCTTCGATGCACAGCGGGGCCATCGCCGGACCGCAGGCCAACTCCTCCACGCTTGACGACTCCGAGGACGCGCTGTGCTGTGTGCCATTATGTGGAGTACGCAAGAGCACCAGCCCCACGCTGCAGTTCTTTACGTTCCCCAAAGACGACAAATACCTCAACCAGTGGCTGCACAATCTGAAGATGTTCCATGTGCCGGCCTCCAGCTACAGCAGCTTCCGGATCTGCAGTATGCACTTCCCCAAACGCTGCATTAATCGATATTCGCTGTGCTATTGGGCCGTACCGACATTCAACCTGGGCCACGACGACGTGGCCAATCTCTACCAGAACCGAGAGCTCACCAACACTTTCACCGTCGGCGAGGTGGCCCGGTGCAGCATGCCCCACTGTACCAGCCAGCGGGGCGAGAGCAATTTGAAGTTTTACAACTTTCCCAAGGACATCAAGAGCTTGATTAAATGGTGCCAGAACGCCCGTCTGCCTGTCCAGGCCAAGGAGCCGCGCCACTTCTGCAGCCGTCACTTCGAGGAACGCTGCATCGGCAAGTTCCGCCTTAAGCCCTGGGCGGTGCCCACTCTTCATCTGGGCGCTCAGTATGGAAAGATTCACGACAATCCCAAGAACTTGTATGTGGAAGAGAAACGCTGTTGCCTAAACTTTTGTCGCAGGAGCAGGTCCTCTGACTTCAATATGTCGCTGTATCGATTCCCCAGAGACGAAGTGCTCCTTCGTCGTTGGTGCTATAATCTCCGCTTGGATCCAGGAGTTTATCGAGGCAAGAATCACAAAATATGCAGTGCCCACTTTATCAAGGAGGCATTGGGTCTGCGAAAGTTATCTCCCGGAGCCGTGCCAACATTGCATTTGGGTCACAATGACACCTTCAACATCTACGAGAACGAGCTGTGGCCGCCCCCGACTCCTTCCACCAGCCATGGCGGTGgccagttgcagttgcagcaccaacaacaactccCGGCGCACCACTCGCTCCAGCACCAGCTGCATATTGGACAGGGAAAGTCCTACCAACGCCACTCGGCCGCTTCCACTTCCTCCTCGGCGAGCTCCACCTCGCACTACGTGGACCCGGAGGTAAGCGCTTCATACCTGGCGATGGGTGGCTCCTCGATGAACGCCACCGACAGCATGGATGTCTGCTGTGTGCCCAGCTGCGAGAGCAAGCGACACAACTCGGAGAACATCACCTTCCACACGATTCCGCGAAGACCGGAGCAGATGCGAAAGTGGTGCCACAACCTGAAGATACCCGAGGACAAAATGCACAAGGGCATGCGAATTTGCAGCCGCCATTTCGAGCCCTACTGCATCGGCGGGTGCATGCGCCCGTTCGCAGTGCCCACGTTGCACCTGGGGCATGACGACGAGGACATTAACCGCAACCCGGACGTAATCAAGAAGCTGAACATCCGCGAGACATGTTGCGTAGCTGTGTGCAAGCGAAACCGGGACAGGGACCACGCCAACCTGCACCGCTTCCCCAGCAACGTGGCTTTGCTGACCAAGTGGTGTGCCAATTTGCAGCGTCCCGTTCCGGACGGCAGCAAGCTCTTCAACGACGCCATTTGCGAGGTGCACTTCGAAGATCGTTGTCTGCGAAACAAGCGCCTGGAAAAGTGGGCGGTGCCAACACTGATCCTGGGCCACGAAGACATTGCCTATCCACTGCCCACGCCGGATCAGGTGGCCGAGTTCCATTCTCGACCCTCGGCCCCCAACAATGGCGAGGAGCAGGGCGAGTGCTGCGTCGAGACCTGTAAGCGAAATCCCAGCGTGGACGACATCAAACTATACCGGCCACCGGAGGAGGCCTCTGTGCTGGCCAAGTGGGCGCACAACCTACAGACTGAGGCCGCCCAGTTGGTAAGCCAGCGAATCTGCAATCTGCACTTCGAGGCCCACTGCATTGGCAAGCGAATGCGGCCGTGGGCCATTCCCACCCTCAACTTGGCCGGAAATATTGAGAATCTCTACGAGAACCCGGAGCCCTCGATGCTTTACAAACGTCGAATGCACACGAAAGCCAAGTTGTCCGCCTCTGCGAAGCCTACCTGGGTACCGCGTTGCTGCCTGCCACATTGCCGCAAGGTACGTGCCCTGCACAACGTCCAGCTCTACCGCTTCCCCAAGCACAACCGCTCTACGCTGGCCAAGTGGGCGCACAATTTGCAGGTGCCCATGGTGGGAAGTGCCCAACGCCGGGTTTGCTCGGCTCATTTTGAGCCGCACGTGCTGAGCAAAAAGTGTCCGGTGCCGTTGGCAGTGCCCACTTTGGACCTGAACGCGCCACAAGGGCATGTGGTCTACCAGAATCCGGCCAAGCTGAGGGCTAGCAAACTGTGCCTGCAGCGCGTATGCATCGTAGAGAGCTGTCGCAAGACACGGGCGCAAGGCGTGCAACTCTTCCGGCTGCCGCACAATCCCACCCAGCTGCGGAAGTGGATGCACAATATCCGGACACGTCCACGGGGTTCCATGCGATCCCAATACCGGATTTGCTCGCGCCACTTTGAAACGCATTCGTTTAACGGCCGAAGGTTAAGTGCAGGGGCCATTCCCACGCTGGAGCTGGGTCATGACGACGACGACATCTACCCCAACGAGGCGCAATCCTTTGTGGACGAGCACTGCGCCGTGGAAGGATGCGGGGCATCTAAAGAGCAACCGGAAGTGCGGCTTTTCCGCTTCCCCACCGACGACGACGACATGTTGTGGAAATGGTGCAACAATCTCAAAATGAATCCGGCCGACTGCACCGGCGTCCGAATCTGTAACAAGCATTTTGAGGCGGACTGCATTGGACCCAAGCACCTATTTAAGTGGGCTATTCCCACCCAGGAGCTGGGCCACGACGATGCCCAGATCGAACTCATTCCGAACCCAAAGCCGGAGGATCGTTACGTGGATCCGGTGTTCAAGTGCATTGTGCCCACCTGCGGCAAGACGCGGCGTTTCGACGAGGTCCAAATGAACAGCTTCCCTAAGGACTCCGAGCTCTTCCAGCGATGGCGTCATAACCTCCGCTTAGACCACTTGTTCTTCCACGAGCGGGAACGCTACAAGATCTGTAACGCCCACTTCGAGGACGTTTGTATTGGCAAAACGCGTCTGAATATCGGTTCAATACCCACACTGGAGCTGGGACACGATGAGACCGATGACCTATTCCAGGTCAATCCCGCGGAGCTGCAGAGCAACTTGTTCGGTCGCCAGCGCCGGCTGCTTGACGAATCGGAATCGGGCGAGGTGGTGATCAAGCAGGAGCTTCCGGACGGTGATACCGAGCCTGACGATGTAAAACCTGATGTAAGGGAACTAATAATTTCCAAACCCAGACAGGTGAAGGCCAAAAGAAGGGGCCTGACGAATTTGAAATGCTGTGTGCGCAGTTGCGGAAGGAGCCGCCTCCAACATGGGGCACGTCTGTTTGCCTTTCCCTCGGGCAAGCAGCAGCACCTCAAGTGGCGCCACAATCTGCGACTAGAGCCCGAGGAGGTGGATAGTACCACCCGGGTGTGCAGCGCTCACTTCAATCGCCGCTGCATAGATGGCAAACAGCTGAGGAGCTGGGCAATGCCCACATTGCAGCTGGGGCATCGGGAGCAGCCCATCTACGAGAACCCCAAGAACATACCGGGCTTCTTTACGCCCACTTGTGCCCTGAGCCACTGCCGGCAGCGAAGGAGCATCGACAACGACCTGCGAACATACCGGTATCCTCGGACAGAGGACTTGCTGGAAAAGTGGCGCGCGAATCTTCGCCTGGCTCCGGATCAATGTCGCGGCCGTATCTGTGCGGATCACTTTGAACCCCTGGTGCGGGGTAAGTTGAAGCTGAAAACCGGCGCCGTGCCCACTCTGAAGCTGGGCCACAACGAGGGATTGATTTATGACAACGAGGCAATTAAGGCGGGCATAGCGGAGGACGAGGAAGTCACATGCAAGCAGGAAATAATGGATGAGGGGGATGATGGCGAAGGAGAGGGAGAGGGAGAGGAGTCGCCGGAGGTGGATCCTGCAGTTAACGATGAtgaagacgacaaagacgacagtTACTTCGATCCTTTAGAGTTGGTGGAAACATTTGCAGAGCGAGCGAGCGACGAAGATGCGGAAGATCACGAAATGGGAGAGGAAAATGATCCCGATGAAGGGGATGAAGAGGCAGAGCAGCTCCTGCCGGACCTGCCACCCACTCCTCCACCCGTGCCCCAGCGTCGCGAAAAACCTGCCAATAATGTGACCCCCATCTGCTGCCTAAAGCACTGTCGCAAGGAACGTACGGCCTTCCACCTTTTGAGCACATTCGGCTTTCCTAAGGACCGTAAGCTATTGCTGAAGTGGTGCGCCAATCTTCACCTGCATCCGGATGACATTGTCGGACGGGTCTGCATCGAGCACTTTGAGCCGGAGGTCCTCGGCACGCGTAAACTCAAACAGAATGCTGTGCCCACCGTGAACTTGGGGCACCAGGAACCGTTACGCTACTCCTGCCATGGCGTGGAACTGGATCAGGACTTGGAGCATGGACAGGCACAACATTCGGTTTTTCGGCTTTGGAGCCTGAAACACTGCCGCAAGAGGAAACTATCGGATCCGCCGGACATTCGGGCCAGCGATTGGAAGGAGCTGAAGATGCACATGCAGAAGCAGAGGGAGTTGGAGATGGCGACGGAGCGGGAGAGGGAGAGGGACATTCGGATGAGCACTCCACCTCAGACACCGGTGAAGATTAAACCAAAAAGATGCTGCGTTGTCAGCTGTGGGAGCGAGGATATGAAAAAATTGCTACCTCTGCCGGATGAGCGTGGCCTTTTCCGCCAGTGGCAGCATAACCTCAAGTTGCCAGCATTAATAGATTTAAGTCTCGGTTTGTGCCTGGACCATTTCGAAGAGTCTCAAGTGCGAAATGGAAAGCCCTTAGAAAGGGCAGTGCCCACCCTGAAGTTGGGTCACAGCAGTTGTAATCTTTACCGAAACAACGCAGCTTGCCTGGTGACCAGTTGTCCAAGTTCTGGCTCCGATGCCATTAGCTTTGTGAGCCTGCCCGCTAATTTAGTGATGAAAAAGGCCTGGCTGTCCTACCTTCAACTTTCATTCGATAGTGAAGGACTCCTTTGTGGCACACACTTTGTGGAACTCTACGAGCAGGTGGATTTGCCCGAGGACTTACCCGTCCAGGATTTAGAGGAGCTGGAACGCACTGTTGATGAGCTACAGTGCGCTGTACCCGGTTGTGAGTCCAAGAACGCCCGTGATGATCCCGTCCAGCTGGTCCAGTTGCCCCACAACGAGGGGGAACTTTCAAAGTGGCTACATAACACAAAGATCACCTATGACTACTCGCGACATAGTAGCTATCGAATCTGTCTGCTCCACTTTGACCCCATCTGCTTGGATGCAGACTTTCCAGCAAGTTGGGCAGTGCCTACCCTAAACCTGGGCCACGACGAAGAAATCTACCAGAATCCCGTGCATCATCAACAGCTGAGGTTGCGCAGCGAAACCAGCAACTATAATTCCTGTCAGACTCCTCTCAGGATCAAAACGGAACTAACTTCCGTGGAAAGCCCCAGTATAAGCGCCAGTCCCAGTCCAAAGGGTAAAATCCGGATATGCTGCATCCCCACATGTGGGCAGTTTGGGAACAGCCAAATACGTCTTTACCGCTTTCCCAGTGATGAACAGTTCCTCCTCCAGTGGCTGGTAAACACTCAGCAACAACCCCGACTCGTTGACCCCATGGAGCTCTACGTGTGCCAGGCACACTTTGAAACCGACGCCATTTCAAAGAAGCATCTTCGGAGCTGGGCATTGCCTACCTTAAACCTGGGTCACGACAGGCATGTCTTCCAAAATCCCAGGCACAACGGAAACATTGCGGAAAGCTTGGACATAGAGGAAGCAGTTAAGTTTATTCGAGAGCGCTACTGTTCCGTGCTAAGTTGCTTTCAGCCTGGAGGAGAAGGCGTCCGGCTGTTCAAGTACCCCGAGGATATGGCCATGATCCGAAAGTGGGCAGTTTCCTGCAAACATCGTTCAATGCATGCCAGAACCCAGGGGCTCCAGGTGTGCCAGGCGCACTTTGCCGCCGAATGCTTTCATCCGGACACTGGAGATCTTCTAGAAGGGTCGATTCCCACATTAGAACTAATCCGCGATGACAGACACTGCTTGGTGCGGGGATGTGAGCGGGATGAATCGGGTCCTCGATTGCGATTCTATAAGCTGCCCAAGATCACTGACCAGGTCGAGGCTTGGAGCAACAACTTGCTAATTCCACTTTCAGAATTAATGCAAGGAGATCAACGCATTTGCGAGCGACACTTTGAAGCGTGCTGCTTTGGAGCTAGCCGAGGTCTTCGGCTGGGAGCTTTACCCACTCTGTTTCTGGGTCATGAAGAGGAAGTCGACTTGCTTTCCAATCCCGAGAAGTTGCGGCTGGGCAAGCAGGAGAACTGTTGCGTATCGGGCTGCGAGCGAATCCGACTGGCTGATGATATCCCTTTTTACAGCTTCCCAAGGCTTTGGCCCTTAGCCAGGAAGTGGCTGCACAATCTCCGTCTAGAAAAAACAAGCAAGGACCAGCTACAAAAACTTAGGATATGCCCGGCGCACTTTGACTCGGACGTGCAAGATGAAGATGGACTGCTGCCAGGAGCCATGCCCACCAAGCAGCTTGGACATACCTCCGAGGGCATTTTTCTGCCACAGGAAAAGGATTTTCAGAGTAACAAAAACTCATTCCATGAGTCTACTTGCTGTTATCCGAAATGTACTGATGCCTCCAAAAAAGAGTTATTAGAATTTCCCGACGAAACAGAGCTCCGCCAAGCCTGGTTGGatcatttaaatattaaggAGAGAGCTAATAGAACCCTACAGCTCTGTTCCCTCCATTATGTGATTCTTTATGAGCACAGTGTCAAGGAGTTCCCGGAGCATCTTCCAAGCCAGTTAATGCAACAGAACTACGAAATTGCCCGCGACAACCGTCGGGTGAAGATCGTAAGTTGTGCCATCAAGGGATGCAGTATGCTAAAGCCTAGAGATGGAGTGCTGCTCCACGGCGTGCCCATGCGCAAGGACATCTTGCAGATGTGGATCGACAACGGGCAGATAGAGTTCTCCGAACAGCAACGTTACATGTTTAGGGTGTGCCACAGACACTTTGAGTCACGTTGCTTCATCGACGAGCGTCGGCTCTCCTCCTGGAGTGTCCCAACTTTGCATCTTCCTGGTGAGGTTATCCATCAGAATCTCAGCAAGGAAGAGTGGGAGGTCATTAAGCAGGAAAAGGTAGATCCAGAAATTGAGGAGGAACCTCTAGAGACGGAGATGGAAACGGAAAACTCTCTTCTCGAGCCGATTGTAAGGATGGAGCATGTGGAATCCGACGAGGACGACTCGCAAATGCAGGCATTGGAGGTGCTGCTGGAGGTGGGCCACGTGGAACGGCTGGACAGTTACGAAAAGATTGACAAATCTCCTATTGTCTACCCCGAGCATGTTATGTATAGATCAAATAGGAGTCAGTACAATGCCAACCGCTGCGCCGTGGAGGGATGCGAGGTTACCGTCGAGGACGTAGACGGAACCATCAAGTTGCACAAGTTTCCAGCCTCGACGGAGGCTGCCCAGAAGTGGATGCATAACACTCAGGTGGACATGGAAGTGAAGTACTGGTGGCGGTACCGCATCTGCAGCTATCACTTTGATCCGGAATGCTTCCAGGGATCTAGAATCCGGAAGGGAGCCATGCCCACGCTGTTGTTGGGGTCCCAGAGACCGGATGAGCTCTACGACAATGAGTTCATTTCCATGCCGGAGGTTGAGGACCTACCTTTGCCGGTCGAGATTAGCCAGAGCGATGTGGCAGAGAAAACTGTTCCAGAAGTGACCAATATTTGCCTGCCCCCGCCAGCTGCGCCGCGGAAATCCAGCAAGTTCTGCCAGATCGAAGGGTGCTCGAATCATCTAACCACCGAGAACATAACCCTCCACAAGTTTCCGCACTCAAAGGATATGTGCATCCGATGGCAGCACAACACACAAGTTCCATTCGACCCAGATCATCGTTGGCGGTACAGGATATGTACAGCCCATTTTGAGCCCGTGTGCCTGTCCAATTTGCGCCTGCTCCACGGAAGTGTGCCCACCTTAAAGCTGGGACCCAAAGCTCCCGCCGAACTTTTCGACAACGACTTTGAGGCCATCAACCAGCGACTGGATAAGAAATCGGCGGCAGAGGTATATCAGGAACGGGTGGATATGGAAGACGAGCTTAGCGAGGATCAGGTAGAGACGCCTATCTGTATTCCTGTAAAACAGGAGAAGATATCCTTTAACCAGATCAAGTCCGGCTACGACAAGTGCTCACTGGCCCACTGCCAACGGCAAAGATCTCTGCATGGCGTACATATCTATAAGTTTCCTAGGTCGCAGCGCCAGCAGGAGCGATGGATGCACAACCTCCGCATCCGCTACGATGAGCGCCGGCCCTGGCGTTTCATGATTTGCAGCGTCCACTTCGAGCCGCACTGTATCAGCCTTAGGAAGCTGCGTCCATGGGCAGTTCCTACGCTGGAGCTGGGCCCGAATGTACCGGAGAAAATCTTTACAAACGAGCAGTGCCAGGAACTGGAGGTTGAACAACCAAGTGATCGTAGCGAGGCAGAGAGCGAGGAGGAGGATGGTCTGGAAGAAGACGATGATGGGGAGGAGGACAATATCGAGGAAGATGGACAAGAACTCAATGTGCCCAATAAGAAAGAGCGGCGCTCGAAGTTGGACTCGTGTCCGTCCGGTCAGGTTGCGCCATGGAAGGTAAAGCAGTGTTGCCTGCCCTATTGTCGCGCCTTCCGAGGAGATGGCATCAAGCTCTTCCGGCTGCCCAACAACCGATCCTCCATCCGCAACTGGGAGATTGCCACGGGCATGATGTTTAAGGAGTCGCAGCGAAACACACGACTCATTTGTAGTCGACATTTTGACCCGGAACTTATTGGTGTCCGTCGTCTCATGCGCAACGCAATTCCCACCCGGCACCTGAATCCAAAATCCGTTACAAGCGACGAGAAAAGGGTTTTGCCGGTCAAGACTAAGGATACGCCTCCCCCAATGCCCTCCTGCTGCATGGCGGACTGCCATTATAATGGTAATGTGAAGATGCATAAATTTCCCAGTGATCCCACACACCTGAGGCAGTGGTGCCAGGCTCTCAGGCTCACGGATACGCAACGTTATCGTGGCAAGTATATTTGCGCGGCCCACCTGCCTACCAACATGTCAGTTAGCTGCGTCGTCTGCGGGATGGATGACGTACAGCTGCCGATGCTGGACTTCCCAGAGAACCGCAACCAGCGGGCCAAATGGTGCTACAACCTAAAGATTGAGACCATACCCAAGTGGGATCGCTCCAAGCACATCTGCTGCCGGCATTTCGAGGCACACTGCTTTGTCCGGCCGGGTGAACTTCGTCCAGGAGCGACCCCTACAGTGGCTTTGAACCACAACGACACAAACATATTCCTTAGCGACTACTCCATCGATTCGGCGACCTCCTATGGCGGTAATCGAATCAAGGACGAACCCAAGGACGGCGACGACACGCTCCTGGTCTAG
Protein Sequence: MSQHNQPHQVPPHPHPHYPYHHASLSLPLQQQQQQHQQQQQQQQQQHASSWYSHVASYPPSHTAFSPALPCKAASNSNSATNNNSIMGAYGGGGDTHGYYGNVSAGIGVGVGVGGGAVGSTYGLGANTVAYAHNQLLQYQPHHQQHQQEQHSQQPHLGHRSYMGHDVMTGTGTATGSYPYIKSEPMEAFQQPPNPMAPPPALPPAQEMIIKSEPIDEQAYKSNYVDDNTPFADFSKFNEFSEDMLSPKVELTVKDESYAKNFHHRKLQNDRPAGNESLPVCQRCKEVFFKKQTYLRHVAESSCCIQEYDFKCTICPMSFVSAEELQRHKHHHRADRFFCHKYCGKHFESIAECEAHEYMQHEYDSFVCNMCSANFATREQLYSHLPQHKFQQRFDCPICRLWYQTALQLHEHRIAEPYYCGKYYASGLNTGASQQQQHHHQSQTNYKLQDCHMATMEMPNTSQHKPNSSNSTMPATAALSSLLQQRQAKADGAAMFAASAVKAETNVKLERSYSNSTSESSYGMQDGGYNNSFSGESSMHSGAIAGPQANSSTLDDSEDALCCVPLCGVRKSTSPTLQFFTFPKDDKYLNQWLHNLKMFHVPASSYSSFRICSMHFPKRCINRYSLCYWAVPTFNLGHDDVANLYQNRELTNTFTVGEVARCSMPHCTSQRGESNLKFYNFPKDIKSLIKWCQNARLPVQAKEPRHFCSRHFEERCIGKFRLKPWAVPTLHLGAQYGKIHDNPKNLYVEEKRCCLNFCRRSRSSDFNMSLYRFPRDEVLLRRWCYNLRLDPGVYRGKNHKICSAHFIKEALGLRKLSPGAVPTLHLGHNDTFNIYENELWPPPTPSTSHGGGQLQLQHQQQLPAHHSLQHQLHIGQGKSYQRHSAASTSSSASSTSHYVDPEVSASYLAMGGSSMNATDSMDVCCVPSCESKRHNSENITFHTIPRRPEQMRKWCHNLKIPEDKMHKGMRICSRHFEPYCIGGCMRPFAVPTLHLGHDDEDINRNPDVIKKLNIRETCCVAVCKRNRDRDHANLHRFPSNVALLTKWCANLQRPVPDGSKLFNDAICEVHFEDRCLRNKRLEKWAVPTLILGHEDIAYPLPTPDQVAEFHSRPSAPNNGEEQGECCVETCKRNPSVDDIKLYRPPEEASVLAKWAHNLQTEAAQLVSQRICNLHFEAHCIGKRMRPWAIPTLNLAGNIENLYENPEPSMLYKRRMHTKAKLSASAKPTWVPRCCLPHCRKVRALHNVQLYRFPKHNRSTLAKWAHNLQVPMVGSAQRRVCSAHFEPHVLSKKCPVPLAVPTLDLNAPQGHVVYQNPAKLRASKLCLQRVCIVESCRKTRAQGVQLFRLPHNPTQLRKWMHNIRTRPRGSMRSQYRICSRHFETHSFNGRRLSAGAIPTLELGHDDDDIYPNEAQSFVDEHCAVEGCGASKEQPEVRLFRFPTDDDDMLWKWCNNLKMNPADCTGVRICNKHFEADCIGPKHLFKWAIPTQELGHDDAQIELIPNPKPEDRYVDPVFKCIVPTCGKTRRFDEVQMNSFPKDSELFQRWRHNLRLDHLFFHERERYKICNAHFEDVCIGKTRLNIGSIPTLELGHDETDDLFQVNPAELQSNLFGRQRRLLDESESGEVVIKQELPDGDTEPDDVKPDVRELIISKPRQVKAKRRGLTNLKCCVRSCGRSRLQHGARLFAFPSGKQQHLKWRHNLRLEPEEVDSTTRVCSAHFNRRCIDGKQLRSWAMPTLQLGHREQPIYENPKNIPGFFTPTCALSHCRQRRSIDNDLRTYRYPRTEDLLEKWRANLRLAPDQCRGRICADHFEPLVRGKLKLKTGAVPTLKLGHNEGLIYDNEAIKAGIAEDEEVTCKQEIMDEGDDGEGEGEGEESPEVDPAVNDDEDDKDDSYFDPLELVETFAERASDEDAEDHEMGEENDPDEGDEEAEQLLPDLPPTPPPVPQRREKPANNVTPICCLKHCRKERTAFHLLSTFGFPKDRKLLLKWCANLHLHPDDIVGRVCIEHFEPEVLGTRKLKQNAVPTVNLGHQEPLRYSCHGVELDQDLEHGQAQHSVFRLWSLKHCRKRKLSDPPDIRASDWKELKMHMQKQRELEMATERERERDIRMSTPPQTPVKIKPKRCCVVSCGSEDMKKLLPLPDERGLFRQWQHNLKLPALIDLSLGLCLDHFEESQVRNGKPLERAVPTLKLGHSSCNLYRNNAACLVTSCPSSGSDAISFVSLPANLVMKKAWLSYLQLSFDSEGLLCGTHFVELYEQVDLPEDLPVQDLEELERTVDELQCAVPGCESKNARDDPVQLVQLPHNEGELSKWLHNTKITYDYSRHSSYRICLLHFDPICLDADFPASWAVPTLNLGHDEEIYQNPVHHQQLRLRSETSNYNSCQTPLRIKTELTSVESPSISASPSPKGKIRICCIPTCGQFGNSQIRLYRFPSDEQFLLQWLVNTQQQPRLVDPMELYVCQAHFETDAISKKHLRSWALPTLNLGHDRHVFQNPRHNGNIAESLDIEEAVKFIRERYCSVLSCFQPGGEGVRLFKYPEDMAMIRKWAVSCKHRSMHARTQGLQVCQAHFAAECFHPDTGDLLEGSIPTLELIRDDRHCLVRGCERDESGPRLRFYKLPKITDQVEAWSNNLLIPLSELMQGDQRICERHFEACCFGASRGLRLGALPTLFLGHEEEVDLLSNPEKLRLGKQENCCVSGCERIRLADDIPFYSFPRLWPLARKWLHNLRLEKTSKDQLQKLRICPAHFDSDVQDEDGLLPGAMPTKQLGHTSEGIFLPQEKDFQSNKNSFHESTCCYPKCTDASKKELLEFPDETELRQAWLDHLNIKERANRTLQLCSLHYVILYEHSVKEFPEHLPSQLMQQNYEIARDNRRVKIVSCAIKGCSMLKPRDGVLLHGVPMRKDILQMWIDNGQIEFSEQQRYMFRVCHRHFESRCFIDERRLSSWSVPTLHLPGEVIHQNLSKEEWEVIKQEKVDPEIEEEPLETEMETENSLLEPIVRMEHVESDEDDSQMQALEVLLEVGHVERLDSYEKIDKSPIVYPEHVMYRSNRSQYNANRCAVEGCEVTVEDVDGTIKLHKFPASTEAAQKWMHNTQVDMEVKYWWRYRICSYHFDPECFQGSRIRKGAMPTLLLGSQRPDELYDNEFISMPEVEDLPLPVEISQSDVAEKTVPEVTNICLPPPAAPRKSSKFCQIEGCSNHLTTENITLHKFPHSKDMCIRWQHNTQVPFDPDHRWRYRICTAHFEPVCLSNLRLLHGSVPTLKLGPKAPAELFDNDFEAINQRLDKKSAAEVYQERVDMEDELSEDQVETPICIPVKQEKISFNQIKSGYDKCSLAHCQRQRSLHGVHIYKFPRSQRQQERWMHNLRIRYDERRPWRFMICSVHFEPHCISLRKLRPWAVPTLELGPNVPEKIFTNEQCQELEVEQPSDRSEAESEEEDGLEEDDDGEEDNIEEDGQELNVPNKKERRSKLDSCPSGQVAPWKVKQCCLPYCRAFRGDGIKLFRLPNNRSSIRNWEIATGMMFKESQRNTRLICSRHFDPELIGVRRLMRNAIPTRHLNPKSVTSDEKRVLPVKTKDTPPPMPSCCMADCHYNGNVKMHKFPSDPTHLRQWCQALRLTDTQRYRGKYICAAHLPTNMSVSCVVCGMDDVQLPMLDFPENRNQRAKWCYNLKIETIPKWDRSKHICCRHFEAHCFVRPGELRPGATPTVALNHNDTNIFLSDYSIDSATSYGGNRIKDEPKDGDDTLLV

Similar Transcription Factors

Sequence clustering based on sequence similarity using MMseqs2

100% Identity: iTF_00615596; iTF_00504021; iTF_00614936;
90% Identity: iTF_00504021; iTF_00614936;
80% Identity: -