Basic Information

Insect: Drosophila mimetica
Gene Symbol: -
Assembly: GCA_037075245.1
Location: JBAMCH010000007.1:8739782-8753635[-]

Transcription Factor Domain

TF Family: THAP
Domain: THAP domain
PFAM: PF05485
TF Group: Zinc-Coordinating Group
Description: The THAP domain is a putative DNA-binding domain (DBD) and probably also binds a zinc ion. It features the conserved C2CH architecture (consensus sequence: Cys - 2-4 residues - Cys - 35-50 residues - Cys - 2 residues - His). Other universal features include the location of the domain at the N-termini of proteins, its size of about 90 residues, a C-terminal AVPTIF box and several other conserved residues. Orthologues of the human THAP domain have been identified in other vertebrates and probably worms and flies, but not in other eukaryotes or any prokaryotes [1].
Hmmscan Out: # of c-Evalue i-Evalue score bias hmm coord from hmm coord to ali coord from ali coord to env coord from env coord to acc

1 29 3.1 5.6e+03 -1.7 1.8 38 62 319 346 311 360 0.60

2 29 3.4e-15 6.1e-12 46.3 3.9 1 86 551 623 551 624 0.85

3 29 1.4e-14 2.5e-11 44.3 5.0 1 87 651 720 651 720 0.83

4 29 1.3e-15 2.3e-12 47.6 0.2 1 87 742 814 742 814 0.85

5 29 5.8e-16 1.1e-12 48.7 5.5 1 87 915 985 915 985 0.82

6 29 1.7e-14 3e-11 44.1 2.8 1 86 1009 1080 1009 1081 0.82

7 29 1.4e-12 2.6e-09 37.8 0.5 1 87 1116 1184 1116 1184 0.81

8 29 1.1e-10 2e-07 31.8 1.4 1 86 1224 1293 1224 1294 0.76

9 29 6.2e-17 1.1e-13 51.9 0.4 1 86 1321 1390 1321 1391 0.83

10 29 6e-13 1.1e-09 39.1 1.7 1 85 1412 1480 1412 1482 0.82

11 29 5.4e-14 9.7e-11 42.4 0.4 1 86 1509 1580 1509 1581 0.84

12 29 9.4e-13 1.7e-09 38.4 3.0 1 85 1657 1725 1657 1727 0.82

13 29 2.8e-12 5e-09 36.9 0.1 1 86 1750 1818 1750 1819 0.81

14 29 3.5e-13 6.4e-10 39.8 2.2 1 87 1960 2029 1960 2029 0.79

15 29 3.3e-10 6e-07 30.3 0.0 1 86 2119 2185 2119 2186 0.77

16 29 9.6e-05 0.17 12.8 0.0 1 58 2201 2245 2201 2261 0.82

17 29 1.3e-12 2.4e-09 37.9 0.3 1 86 2275 2344 2275 2345 0.80

18 29 1.3e-12 2.4e-09 38.0 0.5 1 87 2404 2474 2404 2474 0.82

19 29 4.6e-11 8.3e-08 33.0 0.1 1 86 2510 2581 2510 2582 0.81

20 29 2.4e-12 4.3e-09 37.1 0.0 1 86 2593 2664 2593 2665 0.79

21 29 8.1e-09 1.5e-05 25.8 0.0 1 86 2689 2759 2689 2784 0.76

22 29 0.00049 0.9 10.5 0.0 1 58 2787 2834 2787 2849 0.80

23 29 3.1e-13 5.7e-10 40.0 0.2 1 86 2872 2944 2872 2945 0.82

24 29 7.8e-16 1.4e-12 48.3 0.4 1 86 3055 3127 3055 3128 0.82

25 29 9.6e-13 1.7e-09 38.4 3.0 1 86 3189 3259 3189 3260 0.80

26 29 3.2e-14 5.8e-11 43.2 4.6 1 86 3359 3429 3359 3430 0.85

27 29 2.6e-11 4.8e-08 33.8 0.1 1 86 3510 3579 3510 3580 0.83

28 29 2.5e-10 4.5e-07 30.7 1.5 1 58 3603 3651 3603 3663 0.85

29 29 5.3e-10 9.6e-07 29.6 1.6 18 87 3669 3727 3657 3727 0.77

#	of	c-Evalue	i-Evalue	score	bias	hmm coord from	hmm coord to	ali coord from	ali coord to	env coord from	env coord to	acc
1	29	3.1	5.6e+03	-1.7	1.8	38	62	319	346	311	360	0.60
2	29	3.4e-15	6.1e-12	46.3	3.9	1	86	551	623	551	624	0.85
3	29	1.4e-14	2.5e-11	44.3	5.0	1	87	651	720	651	720	0.83
4	29	1.3e-15	2.3e-12	47.6	0.2	1	87	742	814	742	814	0.85
5	29	5.8e-16	1.1e-12	48.7	5.5	1	87	915	985	915	985	0.82
6	29	1.7e-14	3e-11	44.1	2.8	1	86	1009	1080	1009	1081	0.82
7	29	1.4e-12	2.6e-09	37.8	0.5	1	87	1116	1184	1116	1184	0.81
8	29	1.1e-10	2e-07	31.8	1.4	1	86	1224	1293	1224	1294	0.76
9	29	6.2e-17	1.1e-13	51.9	0.4	1	86	1321	1390	1321	1391	0.83
10	29	6e-13	1.1e-09	39.1	1.7	1	85	1412	1480	1412	1482	0.82
11	29	5.4e-14	9.7e-11	42.4	0.4	1	86	1509	1580	1509	1581	0.84
12	29	9.4e-13	1.7e-09	38.4	3.0	1	85	1657	1725	1657	1727	0.82
13	29	2.8e-12	5e-09	36.9	0.1	1	86	1750	1818	1750	1819	0.81
14	29	3.5e-13	6.4e-10	39.8	2.2	1	87	1960	2029	1960	2029	0.79
15	29	3.3e-10	6e-07	30.3	0.0	1	86	2119	2185	2119	2186	0.77
16	29	9.6e-05	0.17	12.8	0.0	1	58	2201	2245	2201	2261	0.82
17	29	1.3e-12	2.4e-09	37.9	0.3	1	86	2275	2344	2275	2345	0.80
18	29	1.3e-12	2.4e-09	38.0	0.5	1	87	2404	2474	2404	2474	0.82
19	29	4.6e-11	8.3e-08	33.0	0.1	1	86	2510	2581	2510	2582	0.81
20	29	2.4e-12	4.3e-09	37.1	0.0	1	86	2593	2664	2593	2665	0.79
21	29	8.1e-09	1.5e-05	25.8	0.0	1	86	2689	2759	2689	2784	0.76
22	29	0.00049	0.9	10.5	0.0	1	58	2787	2834	2787	2849	0.80
23	29	3.1e-13	5.7e-10	40.0	0.2	1	86	2872	2944	2872	2945	0.82
24	29	7.8e-16	1.4e-12	48.3	0.4	1	86	3055	3127	3055	3128	0.82
25	29	9.6e-13	1.7e-09	38.4	3.0	1	86	3189	3259	3189	3260	0.80
26	29	3.2e-14	5.8e-11	43.2	4.6	1	86	3359	3429	3359	3430	0.85
27	29	2.6e-11	4.8e-08	33.8	0.1	1	86	3510	3579	3510	3580	0.83
28	29	2.5e-10	4.5e-07	30.7	1.5	1	58	3603	3651	3603	3663	0.85
29	29	5.3e-10	9.6e-07	29.6	1.6	18	87	3669	3727	3657	3727	0.77

Sequence Information

Coding Sequence: ATGTCACAACAACACCCCCATCACGCCCACCCCCACCACTACGCCCACCACCATCATTATCCGCCCCCTGCGACGCCCATGTCCatgcagcagccgccgcagcagcagcagcagcaagcgcagcagcagcagcagcacgccAATTGGTACTCACATGTTGCTTCCTACCCCACACCCCACTCGGCCTTCGgccccgcccccgccccctcctGCAAGGccacaagcagcagcagcaacagcaacaacaacatcatggGTGGGGGAGGCGGCTATGGGCCGGGGGGTGGTGGCGGTGCGCAGGGTTATTATGGCGCCGCTGGCGGTGGCCTCAATGTCACTGGggcggtggtgggtggtggtgggccAAGCTACGGCCTTGGGGCTAACACAGTGGCATATGCCCACAACCAACTGCTGCagtaccaacaacaacaacagcaacagcaacaacagcaacaacttcCACAGCATCTAAGCCAACAGAGGTCCTATATGGGGCACGATATCATGACCGGCAGCTATCCCTATATCAAAAGCGAACCCCTGGAGGCCTTCCAGCAGCCCCCCAATCCCATGGCCCCGCCCCCGGCGCCAGAAGTATTAATCAAATcGGAACCCATTGACGAACATTCCTACAAGTCCAACTATATAGACGACAACACGCCCTTTGCAGACTTTAGCAAGTTCAGCGAATTCAGCGAGGACATGTTGAGTCCCAAAGTGGAACTGACCGTCAAGGATGAGTCCTACGGAAGGAATGCCAACAGCTTTCTGCGACGCAAACAGCAAACGGATCGGAGTGCCGAAAGCCTGCCGATTTGTCAGCGCTGCAAGGAGGTGTTCTTCAAGAAGCAGGCTTATTTGCGGCACGTGGCCGAGAGCAATTGCGGCATGCAGGAGTACGACTTCAAGTGCAGCACCTGTCCCATGTCCTTCATGACCACCGAGGAGCTGCAGCGGCACAAGCTTCAGCATCGGGCAGACAGGTTCTTCTGCCACAAGTACTGCGGCAAGCACTTTGATACGATCGCCGAGTGCGAGGCGCATGAGTACATGCAGCACGAATACGATAGCTTTGTGTGCAACATGTGCTCGGGAACCTTTGCCACCCGTGAGCAGCTATACGCCCACCTGCCGCAACACAAGTTCCAGCAGCGCTTCGACTGTCCCATCTGCCGCCTGTGGTATCAGACGGCTCTCGAGCTGCACGAACACCGCTTGGCCGCACCCTACTTCTGCGGCAAGTACTACACGGGGGCGCAGTCAGCCACGGCCTCGCATTCGCAGCAGCACCAGACGAACTACAAGCTGCAGGATTGCCATATGGCCACCATGGAAATGCCCACCGCCCCGCACCACAAACCCAACGCATCCACCTCATCCCTGCCAGCCACAGCTGCTCTAAACTCgctcctgcagcagcaacaggcgaACGCCGATGGAGCAGCCATGTTTGCGGCCTCTGCTCTTAAGAACGAGGTAAATGTGAAGCTGGAACGCAGCTTTAGCAACTCCACCAACGAGTCATCGTACAGCGTTCAGGAGAGTAGCTACAATAATGCCTACGGAAGTGACAGCTCAATCCACGGAGGAGCAATCGCTGGACCACAGGCTCACTCATCGACACTGGACGACTCCGAGGACGCGCTGTGCTGTGTGCCATTGTGTGGAGTGCGTAAGAGCACCAGTCCCACGCTGCAGTTCTTCACGTTTCCCAAGGACGAGAAGTACCTCAATCAGTGGCTGCACAATCTCAAGATGTTCCACATACCCGCCGCCAGCTACGCCAATTTCCGCATCTGCAGCATGCACTTTCCAAAGCGCTGTATTAATCGCTATTCGTTATGTTATTGGGCAGTGCCCACGTTTAACCTGGGTCACGACGACGTGGCCAATCTCTACCAGAACAGGGAACTGACCAATACCTTTACCACCGGCGAGGTGGCGCGTTGCAGCATGCCGCACTGCACCAGTCAGCGGGGTGAGAGCAACTTGAAGTTCTACAACTTCCCCAAGGACATCAAGAGCCTGATCAAGTGGTGCCAGAACGCACGACTTCCCGTGCAGGCGAAGGAGCCGCGTCACTTCTGCAGCCGCCACTTTGAGGAGCGCTGCATCGGCAAGTTCCGGTTGAAGCCTTGGGCGGTGCCCACTTTACATCTGGGTGCCCAGTATGGCAAGATTCACGACAATCCAAAGAATCTGTATGTGGAGGAGAAGCGCTGCTGTCTCAACTTTTGCCGCCGCAGCCGATCCTCTGACTTCAATATGTCGCTATATCGTTTTCCCAGAGATGAGGTGCTTCTGCGACGCTGGTGCTACAATCTGCGCCTGGATCCGGGCGTGTATCGCGGCAAGAATCACAAAATATGTAGTGCACACTTTATCAAAGAGGCTCTGGGTCTGCGGAAGCTATCACCAGGTGCTGTTCCCACGCTTCACCTGGGTCACACGGACACCTTTAACATCTACGAGAACGAACTGTGGCCGCCACCGACGCCCTCCAGCACGCATAGCAGTGGACTACAGCAGCATCAGGCGCAGCATCATCATACGCAGCActcactgcagcagcagcagctgcacagCAAATCCTACCAGCGCCACTCGGCGGCATCTACGTCATCCTCGGCCAGTTCGGCAACCTCTCACTATGTGGATCCGGAGCTGAGCTCCTCCTACCTGGCCATGGGTGGAGCCGGTGGCTCCTCGGCGATGAACGTCAGCGACAGCATGGACATCTGCTGTGTGCCCAGTTGCGAGAGCAAGCGGCACAACAACGAGAACATCACATTCCACACCATACCGCGGCGACCGGAGCAGATGCGCAAGTGGTGCCACAACCTAAAGATACCAGAGGAGAAGATGCACAAGGGCATGCGGATTTGCAGTCTGCACTTCGAGCCCTACTGCATCGGCGGTTGTATGCGTCCGTTTGCGGTGCCCACGCTTAATTTGGGCCACGATGAGGAGGATATTCATCGCAATCCGGATGTGATTAAGAAGCTGAATATACGGGAAACATGCTGCGTGGCTGTGTGCAAACGGAATCGTGACAGGGACCATGCCAACCTTCATCGCTTCCCGAGTAATGTGTCGCTGCTGACCAAGTGGTGTGGCAATCTCCAGCGTCCCGTTCCGGATGGCAGTAAGCTCTTCAACGACGCCATCTGTGAAGTGCACTTTGAGGATCGCTGCCTGCGCAATAAGAGGCTGGAGAAGTGGGCTGTGCCCACACTGATCCTGGGCCACGAGAACATCCCATATCCGCTGCCCACACCGGAACAGGTCACCGAGTTCTATGCCCGGCCCACGGCGCCCAACAATGGCGAGGAACAGGGCGAGTGCTGTGTGGAGACCTGCAAGCGAAATCCCAGTGTGGATGACATCAAGCTTTACCGGCCGCCCGAGGAGGCTTCCGTGTTGGCTAAGTGGGCGCACAACCTGCAAACCGAGGCTGGTGCACTGACGAGCATGAGGATTTGTAATCTGCACTTCGAGGCCCACTGCATTGGCAAACGGATGCGACCTTGGGCGATACCCACACTGAATCTGGCCGGAAACATTGAGAATCTGTATGAGAATCCAGAGCATTCGATGCTGTACAAGCGGCGAGCGCACACGAAAACCAAGCTGCCGGCTTCAGTGAAGCCCACTTGGGTACCTAGATGTTGTCTTCCACATTGCCGCAAGGTGCGGGCTCTGCACAACGTTCAGCTGTATCGCTTCCCCAAGCTCAATCGCTCCACGCTGGCCAAGTGGGCGCACAATCTGCAGGTTCCCATGGTGGGCAGTGCCCAACGGCGACTGTGCTCGGCGCACTTTGAGCCGCATGTGCTGAGCAAGAAGTGTCCGGTGCCGCTGGCGGTACCCACACTGGATTTGAACCCACCGCCCGGCCTGAAGATCTACCAGAATCCCGCCAAGCTGAAGGCCAGCAAGCTGTGTCTGCAGCGTGTGTGCATCGTGGAGAGCTGCCGCAAGACGCGGGCGCAGGGCGTCCAGCTCTTCCGGCTGCCACATAGCCCGACGCAGCTGCGCAAGTGGATGCATAATATTAAGACGCGTCCGCGGGCGGCCATGAGGGCTCAGTACCGCGTTTGTTCCCGTCACTTTGAGACGCATTCCTTCAATGGCCGGAGACTGAGCGCTGGCGCCATTCCCACCCTGGAATTGGGTCACGACGACGAGGACATCTATCCCAACGAAGCGCAGGCATTCGCAGATGAGCACTGCGTGGTGGAGGGCTGTGAGGCATCCAAGGAACAGGCGGAGGTGCGACTCTTCCGCTTTCCCACCGAGGACGACGATATGCTGTGGAAATGGTGCAATAACCTCAAGATGAACCCCGTGGATTGCACGGGGGTGCGCATATGCAACAAACACTTTGAGGCGGACTGCATTGGACCCAAGCACCTGTACAAGTGGGCCATTCCCACGCAGGAACTGGGCCACGACGATGCCCAGATCGAGCTGATTCCAAATCCCAAGCCGGAGGATCGGTATGTGGATCCAGTGTTCAAGTGCATTGTGCCCACCTGTGGGAAGACGCGCCGCTTCGACGAGGTGCAAATGAACAGCTTCCCCAAGGATCCGAATCTCTTCCAGCGCTGGCAGCACAACCTGCGGCTGGAGCATCTAAGCTTCGTGGAACGCGAGCGCTACAAGATCTGCAATGCCCACTTCGAGGATATCTGTATTGGGAAGACGCGGCTGAACATCGGATCTATTCCTACTCTGGAGCTGGGTCATGAGGAGACGGAGGATCTGTTCCAGGTGAATCCGGCGGAGCTGCAGAGCAATCTTTTCGGAAGGCAGCGGCGTATAAAAGAGGAATCGGGTGGGATTAGTATCAAGCAGGAGCTCTCCGAGTCGGAGGATGTCAAGCCGGATGAGGCAACCTTGCGGGAGGCCACAGAATCGAGAACTAGACAGATAAAGTTCAAGAAAACCCTGTCCGATCTCAAGTGTTGTGTGCACAGTTGCGGACGCAGTCGCCTGGAACATGGAGCCCGTCTCTTTCCCTTTCCCACCGGCAAGCAGCAGCACCTCAAGTGGCGCCACAATCTGCGCCTGGAGCCCGACGAGGTGGACCGTTCGACGCGAGTGTGCAGTGCCCACTTCAATCGGCGCTGCATTGATGGCAAGCAGCTGAGGAGTTGGGCCATGCCCACACAGCAACTGGGCCACCAGGAGCAACCGATCTACGAGAATCCCAAGAACATACCAGGCTTCTTTACGCCCACCTGTGCCCTGGGTCATTGCCGCAAGCGACGGAGCATTGACAACGATCTGCGCACCTACCGATATCCAAGGAGTGAGGATCTCCTCGAGAAATGGCGGGCGAATCTGCGGCTGGCGCCGGATCAGTGCCGCGGCAGGATTTGTGCGGATCACTTTGAGGCCCAGGTGCGGGGCAAACTGAAGCTGAAAACGGGAGCAGTGCCCACTCTAAAACTGGGCCACGATGAGGGATTGATCTACGACAACGAGGCTATTAAGGTGGGACTGACAGAGGATGAGGAAGGCAGCTCTGAGCTGCCGCGccttaaacccaaaagagagCCActcgatgaggaggaggagttggAGGAAGGAGAGGCTGAGGAGGAGCACCATGACCAGGATAATGAGgatgaagatgaagatgaTAAAGGCGACCACTACTTTGATCCTCTCGAACTAGTCGAGACCTTTGCCGAACATCCcagcgatgaggaggaggcTGAATATTGTAACGATGAAGAGGATTTGGATCGAGATGAGGAGGAGAACTTGGAGGAAATGGATCACTTTCTGCCGGACACGCCACCGACTCCTCCACCCACCACCCTCCCCATGCGTCGCGAAAAGCCCGCCAACAATGTGACGCCCATTTGCTGCCTGAAGCACTGCCGCAAGGAGCGCACTGCATTTCACCTGCTCAGCACGTTTGGTTTTCCCAAGGACCGCCAGCTGCTGCTCAAGTGGTGCGCCAATCTCCACCTGAATCCGGACGACTGCATCGGTCGGGTGTGCATTGAACACTTCCAATCGGAGGTTCTGGGCACCCGGAAACTTAAGCAGAATGCGGTGCCCACTTTGAATGTGGGTCACAGTGAGCCACTCCGGTACTCGTGCAATGGAATGGATCGGAATGAGGAGCAGCAATCACAGCCAGAGCATTCGGTTTTTCGGCTTTGGAGCCTGAAACACTGCCGCAAGAGGAAGCTAACCGAGCCGCCGGACATTCCGGAAGCTCAGATGATGCGGAGGCTGAAGATGGAGCTACAGATGGAGAGGGAGATCAAGTTGGAGATGCAGATGGAGAGGGAAACAAAGACGAGGATTCCGAGGGATAGTAAACCGGAAAGATGTTGCATCAGCAGCTGCACAAATGAGGATGTCAAGCAATTACTACCAATGCCCGAAGAGGGAAGTCTCTTAAGGAAGTGGCTGCATAATCTAAAGCTGGCCATGGATACGGTTATTAGAGATATGCGAGTTTGTTTGGAGCATTTCGAAGCGGAGACTGTGCCAAATGGAAAGCCCTTGGAGCAGGCAGTTCCCACCTTAAAACTGGATCCACATAGTTGGAACCTCTACAGAAACAATGGAACATGTTTGGTCAAGGAATGTGAAAGCTCTGCCTCCAGCTTGTTGGAGTTGCCCGAAAATATGGTTATACGGGAGACCTGGTTGCTCCACCTAAATCTGTCACCCAAGAGTGATGCTCTTCTATGTGGTAACCACTTTTTGGAGCTCTATGAACAGTTGGACCTGCCTAAAGTTCTGGCCGCCAAGGATTTGGAGATTATGCAGTGGTGTCTAAACGAACTCAAATGCGCTGTGCCTGGTTGCTCCTCCAAAGAGACCAAAGATCTTCAGCTTATCCAGCTGCCAGAGAAGGAAGTCACTCTTTTCAAGTGGCTACATAACACAAAGATGGCCTATGAGCATTCCAGGCACAAGAGCTATCGCATCTGTCAGCTGCACTTTGAGCCAGCGGCTCTGGATTCGGATTTCCCGAGACCATGGGCTTTGCCCACTTTGCAACTGAATCATGAGGATAAGATTCACTTGAATCCCAGTCAGCCAGGCTATGAGTCACGCAGCATCTCCCCCAGCAGCAATTGTAGACTAACTCCTCTCAGAATCAAGACGGATCTCGCCTCCTTGGGCAGTCCCTGTGCGAGTGCCAGCCCCAGTCCTCGAGGCAGGATCAGGATATGTTGCATACCCACATGTGGACAGTTTGGCAATAGCCAAATAAGGCTCTATCGCTTCCCCACCGAAGAGCAGTCCCTGCTCCGTTGGCTGGTGAACACGAATCAGCAACCTCGCCTGGTGGACCCCATGGAGCTGTATGTTTGCCAGTCCCACTTCGAACCGGATGCCATATGTAAGAGGCAACTGCGCAGCTGGGCAGAGCCCACCTTGAACCTGGGCCATGACGGCTATGTCATCCCGAATGCCAAGCACAATGGGAATATCGCTGCTGGCGGGCAGGATACTGAGCAGGCGATGGCGTTCATACGACAGCGATATTGCTCAGTTCTATCCTGCTTTCAAGCGGAAGGTAATGGAATACGGCTCTATGAGTATCCCAGGGATATGGCGACGATACGAAAGTGGGCAGCCGCCTGCCGGCATCGCTCCATGCAGGCCAGCAGCCATGGCTTCAAGGTGTGTCAGTCGCATTTCGCACCGGAATGCTTTGAACCGGACACTTTGGATTTGGTAGAGGGATCGGTACCCACACTGGAGTTGAGCCGGGATCGGGACATCGAGAAGCACTGCCTGGTACCGGGATGTGTAAAGGATGCATCTACCGATCGACTGCGTTACTACAAGGTGCCCAGGAATGCGGCGCAACTGGAGGCTTGGAGCAACAACCTGAAAATCAATGCCATGGAACTCGTTCAGGGCGAGCAACTCATCTGCGAGCGCCACTTTGAGTCCTTTTGCTTTGGAGCCTACAGGGGATTGCGCCCTGGAGCGCTTCCCACCCTCTTGCTGGGTCACGACGAGGAAGTGGAGATGCTACCCAATCCCGAAAATCTCTTTCAGAGCAAAACGGAGGTCTGCTGTGCACCAGGATGTGGACGTATTTGGCAGCCTGGAGACCCGGCGTTCAGTGGATTTCCCAAGCTATTCGCCTTGGCCGATAAATGGATGTATAACCTCCGTTTGAGGGTAACCAAGGATCAGCTGTGCAGGCTGAAAGTCTGCAGAGCGCACTTTGAACCCGCTCTCTACGACAAAGGTGAAGTGATCTTGGGAGCCATGCCCACTCTGGAACTGGGTCACTCATCGCCGGATATTTTCCAGACGGATACGGAAAAGCTTTCCAAGCGAGTTGCAATCCCAGAGGTTACTTGCTGTTATCCCGAGTGCCAGGAGCTGTCGAAGAACCTTTCCTACCATCTGCCCTCGGAGGAGCCACTCAGAGGAGCCTGGCTTCGCCACTTGGACATCGAGGAGCCGGCAAATAACCTCGGCCAGCTGTGCCCTCTGCATTATGTGATTCTCTATGAGCTCAGTGCCAAGAGTTTTCCCGAACACGCACCCAATCCAATCCTCGAGGATAACTACCATTCAGCTCGGAGCAACCGACGCGTTCGCATAGTTAGTTGTGCAGTTAGAGGTTGTGAAATGATCAGGCCGCGGGATAAGGTCCTTTTGCATGGGCTGCCGCAGAGAAAGGACATGCTGAAGATGTGGGTGGAGAATGGCCAACTGGAGATcacagagcagcagcagcagtacaTGCTTAAGGTGTGTCGCAATCACTTTGATACGCGTTGCACCTTTGACGACCGCAGGCTGCAACCATGGAGCGTTCCCACTCTGCAGCTGCCAGCTAGCCCCGTGCATCAGATTCCCAGCAAAGAGGAGTGGCAAGAGATGACGCTTAAACTGAGCCAGGAAGTGGGGACCATCAAactggaggtggaggaggagttgcaggaggaggaggacaacTCACTGTTGGAACCCATTGTGAGAATGGAGCACATCGAGTCCGAGGAGGATGACTCGCAGATGCAGGCCCTGGAGGTGCTGCTGGAGGTGGGCCACGTGGAGCGCATGGATAGCTACGAGAAGGTGGACAAATCCTACACCAACGAACATGCCATTTACCAGCCCACTGGCATTCGGAATCCGTACAACGCCAATCACTGCGCCGTCGACGGTTGCCAGGTGACTGTTGAGGATGTGGATGGGACCATCAAGCTGCACAAGTTCCCCGCATCTTCGGAGGCCGCCCGCAAGTGGATGCACAACACCCAAGTGGACATGGACGAGAAGTTCTGGTGGCGCTATCGCATTTGCAGTTACCATTTCGAGCAGGAGTGCTTCCAAAGCGCCAGGATTAAGAAGGGAGCGATGCCCACACTTCTGCTGGGACCTAAAAGACCCGAAAAGCTGTACGAGAATGAGTTTGCCACACAGGAAACGGATGAGTTACCACTGCTCTTGCCAGCAGAGGCACTACCAAGGGTGCACAAGGATGCATCCCTGCGAGAGGTCACAAAGTTATGCCTGCCCACGCCAGCACCACCTCAAAAGTCCAGCAAGTTTTGCCAGATTGAGGGATGTGCGAATCACCTAACCACCGAGAACGTGACGCTGCACAAGTTCCCGCATTCCGAGGACATGTGCCTCAAGTGGCAGCACAACACACAGGTGCCATTCGATCCCTTCTACCGATGGCGCTACCGCATCTGCAGCGCCCACTTTCATCCGGTGTGCCTGCTCAACATGCGACTGGTCCACGGCAGTGTGCCCACCTTGAAGCTGGGCAGCCGAGCGCCCGCCGAGCTCTTTGACAACGACTTCGAGGCCATCAACTTGAGGCTGGACAAGAGGTCGACCTTGGAGGCCGGCAGCGTGCAGATCAAGGAGGAAAGGGAGGAAGATGAAGATGCTATGCTGTTCTTGGAGCCGGAGTTGCAGCTGCACGAGGaccaggaggagcaggaggaagcGGTGAAAGTATCCTTCAGCCAGTCGAACTGGAAGAGCCAACTGCGTCTGCCCGTGAAGCAAGAGAAGATCACCTACAACCAAGTAAAGTCCGGCTACGATAAGTGCTCGCTGGCCCATTGCCAGCGGCAGAGATCCCAGCACGGCGTCCACATCTACAAGTTTCCCAAATCGAGGCGGCAACAGGAGCGTTGGATGCACAACCTGCGCATCCGTTACGATGAGCGGCGGCCCTGGAAGTTTATGATCTGCAGCGTGCACTTCGAGCCGCACTGCATTAGCCTGAGGAAGCTGCGTCCCTGGGCGGTGCCCACGCTGGAGCTGGGCGACAATGTGCCGGAGAAGATCTTTACGAACGAACAGTGCCAGGAGCTGGCCACCGATCGCAGCGAGGCTGAGAGCGACGGCGACGAGGAGGATGGCCtgcaggaggacgaggaggaggaggaggatgagtgCGATGAGGATGTGGAGCCGGAGATTCGCATCAAGCGAGAGCGACGTTCGAAACACGATCCCTGGCCACCGGGCACCATTCCGCCTTGGAAGGTCAAGCAGTGCTGCCTCCCCTACTGCCGCGCCTTTCGTGGCGAGGGCATCAAGCTGTTCCGGCTGCCCAACAATCGCACCTCGATCCGCAACTGGGAGCTGGCCACGGGCATGTTGTTCAAGGAGTCCCAGAGGAATACGCGTCTCATCTGCAGCCGTCACTTTGAGCCAGAGTTGATAGGGGTACGTCGTCTCATGCGCAATGCCATTCCCACGCGGCACTTGAATCCCCAAGGAGTCTGCGAAGAGATTAAGAAAAAGCCAGATCCTCCCAAGCCCATCGCCACCTGCTGCATGGCTGACTGTCATCACAATGGAAACGTCAGGCTGCACAAGTTTCCCAGTGATCCTGCAATGCTGAGGCAGTGGTGCCAGGCACTCAGGCTAACGGACACACAGAGATATCGGGGCAAACATATCTGCTCGGTCCACCTGCCCACCGATAGGACGATAAGCTGCGTTCTCTGCGGGCTGGACAACGTTCAGCTGCCGTTGCTGGACTTTCCGGAGCAGCGCAATCAGCGCGCCAAGTGGTGCTACAATCTCAAGATCGAGGCCATACCAAAGTGGGACCACTCCAAGCACATCTGCTGTCGTCACTTCGAGTCGCATTGCTTTGTGCAGCCGGGTGAACTGCGTCCGGGTGCGATACCCACGCTGCACCTGAACCACAACGACACGAACATCTTCCTCAGCGACTACGCCACTGGTCCTACCAGCAATAATCGGATCAAGGACGAGCCGCTGGACAACGACGAGATGCTGCTGGTTTAG
Protein Sequence: MSQQHPHHAHPHHYAHHHHYPPPATPMSMQQPPQQQQQQAQQQQQHANWYSHVASYPTPHSAFGPAPAPSCKATSSSSNSNNNIMGGGGGYGPGGGGGAQGYYGAAGGGLNVTGAVVGGGGPSYGLGANTVAYAHNQLLQYQQQQQQQQQQQQLPQHLSQQRSYMGHDIMTGSYPYIKSEPLEAFQQPPNPMAPPPAPEVLIKSEPIDEHSYKSNYIDDNTPFADFSKFSEFSEDMLSPKVELTVKDESYGRNANSFLRRKQQTDRSAESLPICQRCKEVFFKKQAYLRHVAESNCGMQEYDFKCSTCPMSFMTTEELQRHKLQHRADRFFCHKYCGKHFDTIAECEAHEYMQHEYDSFVCNMCSGTFATREQLYAHLPQHKFQQRFDCPICRLWYQTALELHEHRLAAPYFCGKYYTGAQSATASHSQQHQTNYKLQDCHMATMEMPTAPHHKPNASTSSLPATAALNSLLQQQQANADGAAMFAASALKNEVNVKLERSFSNSTNESSYSVQESSYNNAYGSDSSIHGGAIAGPQAHSSTLDDSEDALCCVPLCGVRKSTSPTLQFFTFPKDEKYLNQWLHNLKMFHIPAASYANFRICSMHFPKRCINRYSLCYWAVPTFNLGHDDVANLYQNRELTNTFTTGEVARCSMPHCTSQRGESNLKFYNFPKDIKSLIKWCQNARLPVQAKEPRHFCSRHFEERCIGKFRLKPWAVPTLHLGAQYGKIHDNPKNLYVEEKRCCLNFCRRSRSSDFNMSLYRFPRDEVLLRRWCYNLRLDPGVYRGKNHKICSAHFIKEALGLRKLSPGAVPTLHLGHTDTFNIYENELWPPPTPSSTHSSGLQQHQAQHHHTQHSLQQQQLHSKSYQRHSAASTSSSASSATSHYVDPELSSSYLAMGGAGGSSAMNVSDSMDICCVPSCESKRHNNENITFHTIPRRPEQMRKWCHNLKIPEEKMHKGMRICSLHFEPYCIGGCMRPFAVPTLNLGHDEEDIHRNPDVIKKLNIRETCCVAVCKRNRDRDHANLHRFPSNVSLLTKWCGNLQRPVPDGSKLFNDAICEVHFEDRCLRNKRLEKWAVPTLILGHENIPYPLPTPEQVTEFYARPTAPNNGEEQGECCVETCKRNPSVDDIKLYRPPEEASVLAKWAHNLQTEAGALTSMRICNLHFEAHCIGKRMRPWAIPTLNLAGNIENLYENPEHSMLYKRRAHTKTKLPASVKPTWVPRCCLPHCRKVRALHNVQLYRFPKLNRSTLAKWAHNLQVPMVGSAQRRLCSAHFEPHVLSKKCPVPLAVPTLDLNPPPGLKIYQNPAKLKASKLCLQRVCIVESCRKTRAQGVQLFRLPHSPTQLRKWMHNIKTRPRAAMRAQYRVCSRHFETHSFNGRRLSAGAIPTLELGHDDEDIYPNEAQAFADEHCVVEGCEASKEQAEVRLFRFPTEDDDMLWKWCNNLKMNPVDCTGVRICNKHFEADCIGPKHLYKWAIPTQELGHDDAQIELIPNPKPEDRYVDPVFKCIVPTCGKTRRFDEVQMNSFPKDPNLFQRWQHNLRLEHLSFVERERYKICNAHFEDICIGKTRLNIGSIPTLELGHEETEDLFQVNPAELQSNLFGRQRRIKEESGGISIKQELSESEDVKPDEATLREATESRTRQIKFKKTLSDLKCCVHSCGRSRLEHGARLFPFPTGKQQHLKWRHNLRLEPDEVDRSTRVCSAHFNRRCIDGKQLRSWAMPTQQLGHQEQPIYENPKNIPGFFTPTCALGHCRKRRSIDNDLRTYRYPRSEDLLEKWRANLRLAPDQCRGRICADHFEAQVRGKLKLKTGAVPTLKLGHDEGLIYDNEAIKVGLTEDEEGSSELPRLKPKREPLDEEEELEEGEAEEEHHDQDNEDEDEDDKGDHYFDPLELVETFAEHPSDEEEAEYCNDEEDLDRDEEENLEEMDHFLPDTPPTPPPTTLPMRREKPANNVTPICCLKHCRKERTAFHLLSTFGFPKDRQLLLKWCANLHLNPDDCIGRVCIEHFQSEVLGTRKLKQNAVPTLNVGHSEPLRYSCNGMDRNEEQQSQPEHSVFRLWSLKHCRKRKLTEPPDIPEAQMMRRLKMELQMEREIKLEMQMERETKTRIPRDSKPERCCISSCTNEDVKQLLPMPEEGSLLRKWLHNLKLAMDTVIRDMRVCLEHFEAETVPNGKPLEQAVPTLKLDPHSWNLYRNNGTCLVKECESSASSLLELPENMVIRETWLLHLNLSPKSDALLCGNHFLELYEQLDLPKVLAAKDLEIMQWCLNELKCAVPGCSSKETKDLQLIQLPEKEVTLFKWLHNTKMAYEHSRHKSYRICQLHFEPAALDSDFPRPWALPTLQLNHEDKIHLNPSQPGYESRSISPSSNCRLTPLRIKTDLASLGSPCASASPSPRGRIRICCIPTCGQFGNSQIRLYRFPTEEQSLLRWLVNTNQQPRLVDPMELYVCQSHFEPDAICKRQLRSWAEPTLNLGHDGYVIPNAKHNGNIAAGGQDTEQAMAFIRQRYCSVLSCFQAEGNGIRLYEYPRDMATIRKWAAACRHRSMQASSHGFKVCQSHFAPECFEPDTLDLVEGSVPTLELSRDRDIEKHCLVPGCVKDASTDRLRYYKVPRNAAQLEAWSNNLKINAMELVQGEQLICERHFESFCFGAYRGLRPGALPTLLLGHDEEVEMLPNPENLFQSKTEVCCAPGCGRIWQPGDPAFSGFPKLFALADKWMYNLRLRVTKDQLCRLKVCRAHFEPALYDKGEVILGAMPTLELGHSSPDIFQTDTEKLSKRVAIPEVTCCYPECQELSKNLSYHLPSEEPLRGAWLRHLDIEEPANNLGQLCPLHYVILYELSAKSFPEHAPNPILEDNYHSARSNRRVRIVSCAVRGCEMIRPRDKVLLHGLPQRKDMLKMWVENGQLEITEQQQQYMLKVCRNHFDTRCTFDDRRLQPWSVPTLQLPASPVHQIPSKEEWQEMTLKLSQEVGTIKLEVEEELQEEEDNSLLEPIVRMEHIESEEDDSQMQALEVLLEVGHVERMDSYEKVDKSYTNEHAIYQPTGIRNPYNANHCAVDGCQVTVEDVDGTIKLHKFPASSEAARKWMHNTQVDMDEKFWWRYRICSYHFEQECFQSARIKKGAMPTLLLGPKRPEKLYENEFATQETDELPLLLPAEALPRVHKDASLREVTKLCLPTPAPPQKSSKFCQIEGCANHLTTENVTLHKFPHSEDMCLKWQHNTQVPFDPFYRWRYRICSAHFHPVCLLNMRLVHGSVPTLKLGSRAPAELFDNDFEAINLRLDKRSTLEAGSVQIKEEREEDEDAMLFLEPELQLHEDQEEQEEAVKVSFSQSNWKSQLRLPVKQEKITYNQVKSGYDKCSLAHCQRQRSQHGVHIYKFPKSRRQQERWMHNLRIRYDERRPWKFMICSVHFEPHCISLRKLRPWAVPTLELGDNVPEKIFTNEQCQELATDRSEAESDGDEEDGLQEDEEEEEDECDEDVEPEIRIKRERRSKHDPWPPGTIPPWKVKQCCLPYCRAFRGEGIKLFRLPNNRTSIRNWELATGMLFKESQRNTRLICSRHFEPELIGVRRLMRNAIPTRHLNPQGVCEEIKKKPDPPKPIATCCMADCHHNGNVRLHKFPSDPAMLRQWCQALRLTDTQRYRGKHICSVHLPTDRTISCVLCGLDNVQLPLLDFPEQRNQRAKWCYNLKIEAIPKWDHSKHICCRHFESHCFVQPGELRPGAIPTLHLNHNDTNIFLSDYATGPTSNNRIKDEPLDNDEMLLV

Similar Transcription Factors

Sequence clustering based on sequence similarity using MMseqs2

100% Identity: iTF_00605601;
90% Identity: iTF_00578570; iTF_00602625; iTF_00604873; iTF_00581563;
80% Identity: -