Basic Information

Insect: Drosophila seguyi
Gene Symbol: -
Assembly: GCA_008042675.1
Location: VNJU01009197.1:52493-65726[-]

Transcription Factor Domain

TF Family: THAP
Domain: THAP domain
PFAM: PF05485
TF Group: Zinc-Coordinating Group
Description: The THAP domain is a putative DNA-binding domain (DBD) and probably also binds a zinc ion. It features the conserved C2CH architecture (consensus sequence: Cys - 2-4 residues - Cys - 35-50 residues - Cys - 2 residues - His). Other universal features include the location of the domain at the N-termini of proteins, its size of about 90 residues, a C-terminal AVPTIF box and several other conserved residues. Orthologues of the human THAP domain have been identified in other vertebrates and probably worms and flies, but not in other eukaryotes or any prokaryotes [1].
Hmmscan Out: # of c-Evalue i-Evalue score bias hmm coord from hmm coord to ali coord from ali coord to env coord from env coord to acc

1 29 7 1.7e+04 -3.7 2.0 49 60 328 341 314 358 0.57

2 29 2.4e-15 5.7e-12 46.1 4.0 1 86 555 627 555 628 0.85

3 29 9e-15 2.2e-11 44.3 5.0 1 87 655 724 655 724 0.83

4 29 8.2e-16 2e-12 47.6 0.2 1 87 746 818 746 818 0.85

5 29 3.1e-16 7.3e-13 49.0 6.0 1 87 920 990 920 990 0.82

6 29 1.9e-15 4.6e-12 46.4 3.6 1 86 1014 1085 1014 1086 0.82

7 29 4.2e-13 1e-09 38.9 0.7 1 87 1121 1189 1121 1189 0.81

8 29 6.4e-11 1.5e-07 31.9 1.6 1 86 1231 1300 1231 1301 0.77

9 29 4.5e-17 1.1e-13 51.7 0.4 1 86 1328 1397 1328 1398 0.82

10 29 7.2e-13 1.7e-09 38.2 1.4 1 85 1419 1487 1419 1489 0.79

11 29 6.8e-15 1.6e-11 44.7 0.5 1 86 1516 1587 1516 1588 0.85

12 29 1.6e-12 3.8e-09 37.1 3.7 1 85 1664 1732 1664 1734 0.82

13 29 1.6e-12 3.7e-09 37.1 0.1 1 86 1757 1825 1757 1826 0.83

14 29 4e-13 9.5e-10 39.0 2.2 1 87 1975 2044 1975 2044 0.80

15 29 1.8e-12 4.4e-09 36.9 0.2 1 86 2139 2212 2139 2213 0.84

16 29 3.5e-05 0.083 13.6 0.2 1 60 2228 2279 2228 2296 0.76

17 29 3.6e-12 8.7e-09 35.9 0.0 1 87 2307 2378 2307 2378 0.78

18 29 9.9e-13 2.4e-09 37.7 0.4 1 87 2430 2500 2430 2500 0.82

19 29 1.5e-12 3.7e-09 37.1 0.1 1 86 2535 2610 2535 2611 0.83

20 29 4.7e-13 1.1e-09 38.8 0.0 1 87 2621 2695 2621 2695 0.80

21 29 3.2e-11 7.8e-08 32.9 0.0 1 86 2720 2793 2720 2794 0.68

22 29 0.0001 0.24 12.1 0.2 1 58 2823 2873 2823 2894 0.82

23 29 2.7e-11 6.5e-08 33.1 1.0 1 86 2913 2984 2913 2985 0.81

24 29 1.9e-16 4.4e-13 49.7 0.4 1 86 3097 3169 3097 3170 0.82

25 29 4.1e-12 9.7e-09 35.8 3.4 1 86 3233 3303 3233 3304 0.80

26 29 1.8e-14 4.3e-11 43.3 4.6 1 86 3395 3465 3395 3466 0.84

27 29 3.4e-12 8.1e-09 36.0 0.2 1 86 3547 3616 3547 3623 0.84

28 29 2.6e-10 6.1e-07 30.0 0.5 1 58 3642 3690 3642 3699 0.83

29 29 3e-10 7.1e-07 29.8 0.9 18 87 3708 3766 3697 3766 0.75

#	of	c-Evalue	i-Evalue	score	bias	hmm coord from	hmm coord to	ali coord from	ali coord to	env coord from	env coord to	acc
1	29	7	1.7e+04	-3.7	2.0	49	60	328	341	314	358	0.57
2	29	2.4e-15	5.7e-12	46.1	4.0	1	86	555	627	555	628	0.85
3	29	9e-15	2.2e-11	44.3	5.0	1	87	655	724	655	724	0.83
4	29	8.2e-16	2e-12	47.6	0.2	1	87	746	818	746	818	0.85
5	29	3.1e-16	7.3e-13	49.0	6.0	1	87	920	990	920	990	0.82
6	29	1.9e-15	4.6e-12	46.4	3.6	1	86	1014	1085	1014	1086	0.82
7	29	4.2e-13	1e-09	38.9	0.7	1	87	1121	1189	1121	1189	0.81
8	29	6.4e-11	1.5e-07	31.9	1.6	1	86	1231	1300	1231	1301	0.77
9	29	4.5e-17	1.1e-13	51.7	0.4	1	86	1328	1397	1328	1398	0.82
10	29	7.2e-13	1.7e-09	38.2	1.4	1	85	1419	1487	1419	1489	0.79
11	29	6.8e-15	1.6e-11	44.7	0.5	1	86	1516	1587	1516	1588	0.85
12	29	1.6e-12	3.8e-09	37.1	3.7	1	85	1664	1732	1664	1734	0.82
13	29	1.6e-12	3.7e-09	37.1	0.1	1	86	1757	1825	1757	1826	0.83
14	29	4e-13	9.5e-10	39.0	2.2	1	87	1975	2044	1975	2044	0.80
15	29	1.8e-12	4.4e-09	36.9	0.2	1	86	2139	2212	2139	2213	0.84
16	29	3.5e-05	0.083	13.6	0.2	1	60	2228	2279	2228	2296	0.76
17	29	3.6e-12	8.7e-09	35.9	0.0	1	87	2307	2378	2307	2378	0.78
18	29	9.9e-13	2.4e-09	37.7	0.4	1	87	2430	2500	2430	2500	0.82
19	29	1.5e-12	3.7e-09	37.1	0.1	1	86	2535	2610	2535	2611	0.83
20	29	4.7e-13	1.1e-09	38.8	0.0	1	87	2621	2695	2621	2695	0.80
21	29	3.2e-11	7.8e-08	32.9	0.0	1	86	2720	2793	2720	2794	0.68
22	29	0.0001	0.24	12.1	0.2	1	58	2823	2873	2823	2894	0.82
23	29	2.7e-11	6.5e-08	33.1	1.0	1	86	2913	2984	2913	2985	0.81
24	29	1.9e-16	4.4e-13	49.7	0.4	1	86	3097	3169	3097	3170	0.82
25	29	4.1e-12	9.7e-09	35.8	3.4	1	86	3233	3303	3233	3304	0.80
26	29	1.8e-14	4.3e-11	43.3	4.6	1	86	3395	3465	3395	3466	0.84
27	29	3.4e-12	8.1e-09	36.0	0.2	1	86	3547	3616	3547	3623	0.84
28	29	2.6e-10	6.1e-07	30.0	0.5	1	58	3642	3690	3642	3699	0.83
29	29	3e-10	7.1e-07	29.8	0.9	18	87	3708	3766	3697	3766	0.75

Sequence Information

Coding Sequence: ATGTCACAACACAACCCCAATCACGCCCACCCACACTACCACTACCCGTCCCATACGACGCCGCTGgctctgcagcagcagcagcagcagcagcatcaggagcagcagcagcagcacggcaGTAGTTGGTACTCACATGTTGCTTCCTACCCAGCAGCCTCCCACTCCCACCCCCTCTCTCAGTCGGCCTTTGGTCCTGCGCCCCCTTGCAAGGccagcatcagcaacaacaactccaGCAACATTATGGGCGTCTACGGAGGAGTGGGAGGGGGTGGAGGCTCGCATGGATATTTCGGCGCCGCTGGCGGTGGCCTCAATGTCAGCGGGGCGGGGGGTGGTGCTGGGTCGTCCTACGGCCTTGGTGCCAACACGGTGGCATATGCTCACAACCAACTGCTGCAGTaccagcatcatcatcagcacaaccagcagccgccgcagccgcagcagcagcagcacctggGACTGGGCCAGCGATCCTATATGGGCCACGATGTCATGGCCGGGAGCTATCCCTATATCAAGAGCGAACCCATGGAGGGGTTCCAGCAACCAGCCAATCCAATGGCCCCACCCCCGGCCCCagaaatgataataaaatCGGAACCCATTGACGACCTGGCCTACAAGTCAAACTACATAGACGACAATACGCCATTTGCGGACTTCAGTAAGTTTAGCGAATTCAGCGAAGACATGCTGAGTCCCAAAGTCGAGCTGACAGTCAAGGATGAATCCTTTGTCAGGAACCCCAATAGCTTTTTACGTCGTAAGCAACAATCGGATCTGACGACAGCAGAGAGCCTGCCCGTCTGCCAGCGCTGCAAGGAGGTGTTCTTTAAAAAGCAGACTTATCTGCGGCACGTCGCCGAGAGCAACTGCGGCATCCAGGAGTACGACTTTAAGTGCACCATATGCCCCATGTCCTTCATGACCGCCGAGGAGCTACACCTGCATAAGCAACAGCATCGCGCGGACAGGTTTTTCTGTCACAAGTACTGCGGAAAGCACTTTGGCACGATCACAGAGTGCGAGGCACACGAGTACATGCAGCATGAATATGAAAACATTGTTTGCAACATGTGCTCGGGATCTTTCTCCACGCGGGAACAGCTGTATGCCCACTTGCCGCAGCACAAGTTCCAGCAGCGCTTCGACTGTCCCGTATGCCGCTTGTGGTACCAAACAGCACTGGAACTGCACGAGCACCGCCTGGCTGCACCCTACTTCTGCGGTAAATACTACACGGGCGGACAGTCTCCGTCCCCGTCctcgcaacagcaacagcatcagagCCAGACGAACTACAAGCTGCAGGACTGCAACATGGCCACCATGGAAATGCCAAGCGTGCCGCCGCTCCTTAAGGGAAACCCATCCAACTCGCCTGCCTTGCCTGCGACAGCAGCGCTTAATTCACTGCTGCAGCAGCGCCAGGCCAATGCCGATGGAGCGGCCATTTTTGCCGCATCTTCGCTGAAGAACGAGGTCGCTGTGAAGCTGGAGCGCAGCTACAGTAACTCGACCAATGAATCCTCTTATAGCGTCCAGGAGAGCGGCTACAATAATGTGTATGGCAACAGCGACAGCTCAGTCCACGGTGCCATCGCCGGACCACAGGCACACTCATCGACGCTGGACGACTCCGAAGATGCACTGTGCTGCGTGCCACTGTGCGGGGTTCGGAAGAGCACGAGTCCAACTTTGCAGTTTTTCACGTTCCCGAAGGACGAGAAGTATCTCAACCAGTGGCTGCATAACCTCAAGATGTTCCACATACCCGCGTCCAGCTACGTTAGTTTCCGGATCTGCAGCATGCACTTCCCCAAGCGATGCATCAACCGCTACTCGCTGTGCTACTGGGCGGTGCCGACGTTCAACCTCGGACACGATGACGTAGCCAATCTCTACCAGAACCGGGAGCTGACAAATACATTTACCACTGGCGAAGTGGCTCGGTGTAGCATGCCACACTGCACCAGCCAGCGGGGTGAGAGCAACCTCAAGTTTTACAACTTTCCCAAGGACATCAAAAGCCTGATTAAGTGGTGCCAAAACGCCCGCCTCCCAGTGCAGGCGAAGGAGCCGCGACATTTCTGCAGCCGGCACTTCGAGGAGCGGTGCATTGGCAAGTTCCGCCTAAAGCCTTGGGCGGTGCCCACCTTGCACCTGGGCGCCCAGTACGGCAAGATCCACGACAATCCGAAGAACCTATATGTGGAAGAGAAACGCTGTTGTCTCAACTTTTGCCGTCGGAGCCGCTCTTCAGATTTCAATATGTCGCTATATCGATTTCCTAGAGACGAAGTCCTGCTTCGTCGCTGGTGCTACAATCTTCGCCTCGATCCGGGAGTCTACCGCGGAAAGAATCACAAAATATGCAGCGCCCACTTTATAAAGGAGGCGTTGGGTCTCCGTAAACTATCTCCTGGTGCCGTGCCCACACTTCATCTGGGCCACAATGATACCTTCAACATCTACGAGAACGAACTGTGGCCACCGCCAACACCGACACCCTCGTCTTGTCAcctccaacagcagcagcagcagcagcagcagtcatcCCTGCATTCGCTTCAACAGCAGATGCACAGCAAGTCCTACCAGCGCCGTTCTGTGGCATCCACTTCGTCGTCGGCGAGCTCGGCAGCATCGCATTATGTGGACCCGGAGATGAGCTCCTCTTAccatctagccatgtccgcctCCGCCGGTGGCTCTGCGACGATCAACGCCAGCGACAGTATGGACGTCTGTTGCGTGCCAAGTTGCGAGAGCAAGCGACACAATAGCGAGAACATTACATTCCACACGATTCCGCGACGGCCCGAGCAGATGCGCAAATGGTGTCACAACCTTAAGATTGCCGAGGACAAGATGCACAAGGGCATGCGAATCTGTAGCCGCCACTTCGAGCCCTACTGCATTGGCGGCTGTATGCGACCGTTTGCTGTACCCACTCTTCACTTGGgtcacgacgacgacgacattcACCGCAATCCGGACGTTATCAAAAAGCTGAACATTCGGGAAACATGCTGCGTGGCTGTGTGCAAGCGGAATAGGGACAGAGACCATGCCAACCTGCATCGTTTTCCTAGCAACGTGGCGTTACTGAAGAAGTGGTGCGCCAATTTACAACGCAGCGTGCCCGATGGCAGTAAGCTTTTCAACGATGCCATCTGTGAAGTGCACTTTGAGGATCGGTGCTTGCGCAACAAGAGACTGGAGAAGTGGGCAGTGCCTACGCTGATCCTGGGACACGAGGACATTCCCTATCCGCTGCCCACGCCGGAGCAAGTGACCGAATTCTATGCCCGGCCTTCGGCTCCGAACAATGGAGAGGAACAGGGCGAGTGCTGTGTGGAGACCTGCAAGAGGAATCCCAGCGTAGACGATATAAAGCTATACCGACCTCCGGAAGACGCTGGCGTGCTGGCCAAGTGGGCGCACAACCTGCAAACGGAGGCCAACCAACTGACAAGCATGAGGATTTGCAACCTTCACTTCGAGGCGCATTGCATCGGCAAGAGGATGCGGCAGTGGGCCATACCGACTTTGAATCTAGCCGGCAACATTGAAAATCTCTACGAGAATCCGGAGCAATCGTTGCTCTACAGGCGACGCACGACTCACTTGAAGGCGAAGCTCCCACTAAGCTCCGCGAAACCCACCTGGGTGCCCAGATGCTGTCTTCCACATTGCCGCAAAGTCAGAGCCCTGCACAATGTCCAGCTCTATCGCTTCCCCAAGCTCAATCGGTCCACATTGGCCAAGTGGGCGCATAATCTTCAGGTTCCAATGGTGGGCAGTGCCCAGCGCAGGCTCTGCTCGGCCCATTTCGAGCCTCATGTACTCAGTAAAAAGTGTCCGGTGCCGCTGGCGGTGCCTACGATCGACCTTAATTCACCACCCGGCTTGAAAATATACCAGAATCCGGCCAAGCTAAAGGCCAGCAAACTGTGCCTGCAGCGGGTTTGCATCGTCGAGAGCTGCCGTAAGACGAGGGCGCAAGGAGTGCAGCTTTTCCGGCTGCCGCACAGCCCCACACAGCTACGGAAGTGGATGCATAACATAAGGACGCGGCCTCGAGCAGCTATGCGGGCTCAGTACCGGGTCTGTTCCCGCCACTTTGAGACGCATTCCTTCAATGGCCGAAGACTGAGTGCAGGTGCCATTCCGACTCTAGAACTGGGCCACGATGACGACGATATCTATCCGAATGAAGCACAGGCATTTGTGGATGAGCATTGTGCTGTCGAGGGCTGCGAGGCATCCAAGGAGCAGCCGGAGGTGCGACTGTTCCGCTTTCccaccgacgacgacgatatGTTGTGGAAATGGTGCAACAACCTGAAAATGAATCCAGTGGATTGCATTGGGGTCCGCATCTGCAACAAGCACTTTGAGGACGATTGCATCGGTCCGAAGCACCTGTACAAGTGGGCCATTCCCACGCAAGAGCTGGGCCACGACGACGCGCAAATCGAGCTGATCCCGAATCCGAAGCCAGAGGAGAGGTATGTGGATCCTGTCTTCAAGTGCATCGTTCCCACCTGCGGCAAGACTCGACGGTTTGACGAGGTACAAATGAACAGCTTCCCCAAGGACCCGGATCTATTTCAGCGATGGCGGCACAACCTGCGCCTGGAACATCTCAGTTTCCAGGAGCGGGAGCGCTACAAGATCTGCAACGCCCATTTCGAGGAGATCTGTATTGGGAAGACACGGCTAAACATAGGATCCGTTCCAACCTTGGAACTTGGTCATGACGATGAGGATGATATCTTCCAAGTAAATCCAGCGGAGCTCCAGAGCAATTTATTCGGTCGACAGCGTCGACTGCTGCTCGAGAGATCCGGCGAACTGAGTGTCAAGCAAGAGCTGTCAGAGACAGAGGACAACAAAAAAGCGGATGCGGATGTGACGGCCACAGGCTCCAATTCCAAGCAGGCCAAGATCAAGAGATCTGCATCGGATTTAAAGTGTTGCGTGCACAGTTGTGGAAGAAGTCGCTTGGAGCACGGGGCACGGCTATTTCCCTTTCCTACCGGCAAGCAGCAGCACTTAAAGTGGCGTCACAATCTACACCTGGAACCAGAGGAGGTGGACCGGTCGACCCGCGTCTGCAGCGCCCACTTTAATCGACGTTGCATCGAGGGCAAACAACTTAGGAGTTGGGCGATGCCCACCCAACAGTTGGGACACAACGACCAACCGATCTACGAGAATCCAAAGAATATACCGGGATTCTTTACACCTACTTGTGCCCTGGGACATTGTCGCAAGCGAAGGAGTATTGACAACGATCTGCGTACCTACCGGTATCCCAGGAGCGAGGATCTTTTGGAAAAATGGCGAGCTAACCTACGTCTGGCTCCGGATCAGTGTCGTGGTCGGATCTGTGCAAATCACTTCGAACCGCAGGTTCGAGGAAAGCTGAAGTTGAAGACTGGAGCCGTTCCCACATTACAACTGGGACACGATGAGGGGTTAATCTATGACAATGAAGCTATTAAGGCTGGCATGGCCGACGAAGAGGAAGTCATACCCGCAGAATTTCCGAGACTGAAACTAAAAAAGGAGGTGttcgatgaggaggaggaggaggaggagggcgaAGGTAATGATGGCGAGCAGCAGAACCCCGATGACCTGGATGATAATGCAGATGAAGAAGACAAAGATGATCACTATTTTGATCCCCTTGAACTGGTAGAGACTTTTGCTGAAAATCGCAGCGATGATGAAGCCCAGGACTATGAGGATGAAGAAGGCGAGGGTCGAGTTGAGGACGCTCCCTCCGGGTACAATGTCAATGAGGAGATAGAACAGCTTCCAAGCTCCCCACCTTCCTCGCTTCCTCGACGCCACCAAGCCCCTCGTCGTGACAAGCCGGCTAACAACGTAACGCCCATTTGCTGCCTGAAGCACTGCCGAAAGGAACGCACTGCCTTCCACCTGCTAAGCACTTTCGGCTTCCCAAAGGATCGCCAGTTGCTGCTGAAATGGTGTGTCAATTTGCACCTTAACCCGGACGACTGTATCGGTAGAGTTTGCATCGAGCACTTCCAGCCGGAGGTACTCGGCACCCGTAAGCTCAAGCAGAATGCGGTGCCCACTCTTAATGTAGGACATGAGGAACCGCTTAGGTACTCGTGCCATGGCGTGGACCAGAATCTCGAGGAGCGAGACCCCCAGCCGCAGCATTCGGTTTTTCGGCTTTGGAGCCTGAAACACTGCCGGAAAAGGAAGCTAACGGAGCCGCCGGATATTCCCCTAGCCAAGAGGAGAGCACTGGAGATGCCGATAATGAAGCGAGAGtgggagatggagatggagatcgGAATGCAGATGGAGCGGACGAAGGAGACAAACAAAATAACTCAAACTGAAAGTGAATCTTATAAATGCTGTATAAGCAGCTGCGGAAGCCAGGAAGTTAGCAATTTGCTGCCTTTTCCCGAGGAGAAGACACTGCAAAGAAAGTGGAGCCATAATTTAAGGCTGCCGCCTGAGACTGACACCACTTCTTTAAGCCTAAAAAGGGTTTGCTTGGCTCACTTCGAATCGCAGCTGTTTGAGAATGGCAGGCTCACGAAAgaagcagaggcagaggctgTGCCCACCTTGAAACTGGGTCACAGCGGCTGGAACCTTTACAGGACCAATGGGATCTGCCTAGTGCCTGACTGCACCCACAGTACTTTCGGGCGCTTAAGCTTTATCGATTTACCGGATAACAGTATAATTAGGGACGCTTTCCTTTCCTGCCTTAACCTACCTGAACGCTGCGAGGAGCAGGCAAGGCTATGCCGTATCCACTTTATGAAGGCATACAAGCAATTTGATCTTCCCAACGTTCTGCACCCCCAAGTCATTATGGAGCTACAAAGTGCTGTGGACGAACTGCAATGCGCGGTGCCCGGCTGCAGTTTCGAAGATGCTGATATGGATTTTCACCTAATTCAGCTTCCCGAAAACAAGGAGGAGCTGTCGAAGTGGCTGCGCAACACCAAGATTCCATATGATCCTTTAAAGCACCAAAGCTATCGCATTTGCACGCTCCACTTTGAATCAGAGTACTTGAATTTGAGTCACCCGCTAAAAGGGGCTATTCCGACGCTCCATCTAAACCATGAAGATGAGATTCACCTGAATACTAGACCTTTGCCAGAGGAGCAGGACTCCATGTTGACTCCACTGCGGATAAAGACGGACCTAGCGTTCTTGGGCAGTCCCTGTGCAAGTGCCAGCCCCAGTCCTCGGGGCAGGATTCGAATGTGCTGCATTCCCACATGTGGACAGTTTGGAAGCAGTCAAGTGAGGCTGTTTCGTTTTCCCACCGAGGAGCAGGCGCTGCTTCGGTGGTTGGTGAATACACAACAGCAGCCAAGACTGGTAGATCCCCTGGATTTGTATGTGTGCCAGTTGCATTTTGAGCCCGAGGCTATATGCATGAAGCAACTTCGAAGCTGGGCTGAGCCCACCTTACACCTGGGACACGACGGATATGTAATCCCCAATGCCAAACACAATGGAAATATTTCCGACAGCCAAGATACTGAGCAAGCCATGAGGTTTATTCGCGAACGCTTCTGCTCCGTCATTTCCTGCTTTCAAGCAGGGggacaggaggaggaggaggaggtgagACTATTTGATTATCCCGAGGATATGGCGACCATTCGAAAGTGGGCAGCCGCTTGTAGACATCGCTCCATGCAGGCTAGGAGTCATGGGTTCAAGGTGTGCCAGTTTCACTTCGCTAAGGAATGCTTTGACCCTAACACTGGCGAATTAATTGAGGGCGCTGTCCCTACCCTGGAGTTGAGCAGAGACGAAATGGAGAGGCAATGTCTTGTGGCTGGATGTGTAAAAAATGATGCCAATGGAACCCGTCTCCGCTACTTTAAGATACCAAAAGTGGCTGCTCAATTGGAAGCGTGGAGCCGCAACCTTAAAGTCCATCCAACGGATCTCATGCAGGGAGAGCAGCAGTACATCTGCGAGAAACACTTTGAAGCTTTCTGCTTTGGGGCCAACAAGGGCCTGCGCTCTGGCGCTCTACCAACCCTCCATCTGGGTCATGATGAGGATGTGGATATGCTTCCGAGTCCAGAAAGCCTCTTCTGCCAAAATAAGACGGATGAGTGCTGCGTACCAGGCTGCGGGCGTGTCTGGCACACTGGGGACCGTAAGTTTCGTGGTTTTCCCAAATTGTTGGCTATGGCCCAAAAATGGCGGCATAACCTTCGTTTGGACGCGCCCGTGGAGCAACTCGGCAAGCTGAAGGTCTGCAATGCTCATTTTGAAACCACCTCATCCAACATGGGTACCAATGGACTAAGCTCTAGTGCCTCGATACCAACACTGGAATTGGGCCATTCTTCTCCGGATATTTACCCAGCGGATGTGAACTTAAAGTTCCAAAAGCGTTCAGGAGTGCCGGCAAAAATTTACTGTTGCTATCCCAAGTGCGAGGAAACCTGTTTGCCCAAGAACCTTTCTTACGCGCTTCCCCAGGAGGAGCATCTGAGGAATGCCTGGCTAAGCCATATGGATATAGAAGAACCGAAAGACGAAGGAAGCATACTGCTTTGCCCGCTGCACTATGTCATCCTCTACCAGTATAGTGTCACGCACTATCCGGAGCATCATGCTTTAAGTAGGATTCTTCTTGATGACAATTACAAGGAAGCGCGGAACAACAGGCGCGTGAAGATTGTTAGTTGTACGATCAAGGGCTGCGACATGGTTAAGCCCCGGGATGGGGTACCGCTGCACGGCATGCCGCAAAGCAAAGAAATCCTCCAGATGTGGATAGACAATGGCCAGTTTGAGTTCTTAGAGCAACAGCGGTATATGTTCAAGGTGTGTCACAATCATTTTGAGCCATGCTGCTTCTTTGACGACAGACGTTTGCATTCATGGAGCGTACCCACTTTGCGCCTACCCGGCGAAGTTATTCACCAAAATCCTTCCGCCGAACAGTGGCAGAACATGATCAACAAGCAAGCAGCAGCTAAAACATACGCAGAAGATAAGGAAGAGCCAGATCCCCATGGCGATGTGGTTAAAACCGAacccattttaaaaatagagcATATGGAATCGGAACATGAAGATGAAGCCCCAGAGATGCAGGCCCTTGAGGTCCTCCTAGAAGTTGGCCATGTCGAGCGAATGGAGAGCTATGAGAAAGTGGATAAATCACCGCTGATCTATACCGATAATGCGCCCTTCCGAACATCACCCATACGTTGCCAATACAATGCTAATCACTGTGCTGTAGATGGATGTCGGGTGACTGCCGAGGATGTTGATGGCACAATCAAGCTGCACAAGTTCCCCGCTTCCCAGGAAGCCGCACAGAAGTGGATGCACAACACCCAAGTTGACATGGACGAAAAGTTTTGGTGGCGCTATCGCATATGCAGTTACCACTTCGATCAGGAGTGCTTTCAGAGTTCTAGGATTCGAAAAGGAGCGATGCCCACGCTTTTATTAGGTCCTCGGCGACCGGACAAGGTGTACGATAATGAGTTTTCGCTTCCAGAGGGGGAAGAGCCTTTTCTAGACCCTCCGGACACTCAGCTGGAGGAAGGCACGACTGTTGTATCAAGAGTTCAGAAGGAGGTGTCCAATTTATGCCTGCCCCCACGGGCACCGCCTCGAAAGTCAAGCAAGTTTTGCCAGATTGATTCCTGCCCGAACCACTTGACCACTGAGAATATGACACTTCACAAGTTTCCCCACTCGGAGGACATGTGCCTCAAATGGCAGCACAACACGCAAGTGCCATTTGACCCCTACTACCGTTGGCGTTACCGCATCTGCAGTGCACATTTCCATCCAGTGTGTTTGGTCAACATGCGTCTAGTCCACGGCAGCGTTCCCACTTTAAAGCTGGGTCCCAAGGCACCTTCAGAGCTGTTTGACAACGATTTTGAAGCCATTAACCTAAGGCTGGATAAAAGGTTGACAGAGTCTAATGCTAATGTTTACATCAAGCATGAAAGAAGGGAAGAGGATGAGGATTCAATGATGTTCCCGGAGCCCGAGCTCCAGGTACACGAGGATCAAGACGATAAGATATCAAGCTGGAACAGCAAACTGCAATTACCTGTGAAGCAAGAGAAAATTATATGTAGCCAGATCAAATCTGGATACGATAAGTGTTCGCTGGCTCACTGTCAGCGGCAAAGGTCCCAGCATGGCGTACACATTTACAAGTTTCCTAGATCGAAGCGTCAACAGGAGCGTTGGATGCACAACCTACGCATCCGCTATGATGAACGGACACCGTGGAAGTTCATGATCTGCAGCGTTCATTTTGAACCACACTGCGTCAGCCTAAGGAAGCTGCGACCTTGGGCGGTTCCCACACTGGAACTGGGAGACAATGTACCAGAGACAATCTTTACTAACGAACAGTgcgaggaggagctggtgaCCGATCGCAGTGAGCTTGATAGCGACGCAGAAGAAGAGGACGGCTTacaggaggacgacgacgatgatgacgacgaagACGATGTTAAGCCGGATGTTATTGGCATAAAAAGGAGGAGGCGTTTCAAGATAGATTCCGGGTGCCCTCCTAGCCAGATTCCCCCCTGGAAAGTCAAACAATGCTGCCTTCCCTATTGTCGTGCGTTCCGAGGCGATGGTATCAAGCTATTTCGGCTTCCGAACAACCGAAACTCCATTAGCAATTGGGAACGGGCCACCGGAATGGTATTCAAAGAGTCTCAACGGAACACTCGTCTGATATGCAGCCGTCACTTCGAGCCAGAGCTGATTGGAGTCAGGCGTCTAATGCGTAACGCCATTCCCACGAAGCACTTGAACCCTCAAGCAGTTGACCAGATCCGTACTAAGAAGGAAAAGAATCCTCCTGCCCCTATTGTACCCATATGCTGCATGGCTGACTGCCACTACAACGGGAATGTGAAGCTGCACAAGTTTCCAAGTGATCCCACTCTTCTTAGGCAGTGGTGCCAGGCTCTCCGACTAACTGATACACAGCGGTATTTGGGCAAGCACATTTGCTCCATGCACCTGCCAATGAACAAGACGCTGAGCTGTGTCATTTGCGGTGGGGACAACGTTGAGTTGCCGATGCTTGGGTTTCCAGAAAACCGCAACCAGCGCGCCAAGTGGTGTTACAATCTCAAAATTGAGACAATACCAAAGTGGGACAACTCAAAGCACATTTGCTGCCGGCACTTTGAGTCCCATTGCTTTGACACCCCGGGTGAGCTACGTCCAGGAGCGGCTCCCACGCTCCATCTCAATCACGACGACACAAACATATTCTTCAGCGACTATGCCACTGGTCTTCCGTCCTCGCCACTAGGCAATCGAATTAAAGACGAGCCCCTGGAAACGGAGTCCGACGAGACGCTGCTGGTGTAG
Protein Sequence: MSQHNPNHAHPHYHYPSHTTPLALQQQQQQQHQEQQQQHGSSWYSHVASYPAASHSHPLSQSAFGPAPPCKASISNNNSSNIMGVYGGVGGGGGSHGYFGAAGGGLNVSGAGGGAGSSYGLGANTVAYAHNQLLQYQHHHQHNQQPPQPQQQQHLGLGQRSYMGHDVMAGSYPYIKSEPMEGFQQPANPMAPPPAPEMIIKSEPIDDLAYKSNYIDDNTPFADFSKFSEFSEDMLSPKVELTVKDESFVRNPNSFLRRKQQSDLTTAESLPVCQRCKEVFFKKQTYLRHVAESNCGIQEYDFKCTICPMSFMTAEELHLHKQQHRADRFFCHKYCGKHFGTITECEAHEYMQHEYENIVCNMCSGSFSTREQLYAHLPQHKFQQRFDCPVCRLWYQTALELHEHRLAAPYFCGKYYTGGQSPSPSSQQQQHQSQTNYKLQDCNMATMEMPSVPPLLKGNPSNSPALPATAALNSLLQQRQANADGAAIFAASSLKNEVAVKLERSYSNSTNESSYSVQESGYNNVYGNSDSSVHGAIAGPQAHSSTLDDSEDALCCVPLCGVRKSTSPTLQFFTFPKDEKYLNQWLHNLKMFHIPASSYVSFRICSMHFPKRCINRYSLCYWAVPTFNLGHDDVANLYQNRELTNTFTTGEVARCSMPHCTSQRGESNLKFYNFPKDIKSLIKWCQNARLPVQAKEPRHFCSRHFEERCIGKFRLKPWAVPTLHLGAQYGKIHDNPKNLYVEEKRCCLNFCRRSRSSDFNMSLYRFPRDEVLLRRWCYNLRLDPGVYRGKNHKICSAHFIKEALGLRKLSPGAVPTLHLGHNDTFNIYENELWPPPTPTPSSCHLQQQQQQQQQSSLHSLQQQMHSKSYQRRSVASTSSSASSAASHYVDPEMSSSYHLAMSASAGGSATINASDSMDVCCVPSCESKRHNSENITFHTIPRRPEQMRKWCHNLKIAEDKMHKGMRICSRHFEPYCIGGCMRPFAVPTLHLGHDDDDIHRNPDVIKKLNIRETCCVAVCKRNRDRDHANLHRFPSNVALLKKWCANLQRSVPDGSKLFNDAICEVHFEDRCLRNKRLEKWAVPTLILGHEDIPYPLPTPEQVTEFYARPSAPNNGEEQGECCVETCKRNPSVDDIKLYRPPEDAGVLAKWAHNLQTEANQLTSMRICNLHFEAHCIGKRMRQWAIPTLNLAGNIENLYENPEQSLLYRRRTTHLKAKLPLSSAKPTWVPRCCLPHCRKVRALHNVQLYRFPKLNRSTLAKWAHNLQVPMVGSAQRRLCSAHFEPHVLSKKCPVPLAVPTIDLNSPPGLKIYQNPAKLKASKLCLQRVCIVESCRKTRAQGVQLFRLPHSPTQLRKWMHNIRTRPRAAMRAQYRVCSRHFETHSFNGRRLSAGAIPTLELGHDDDDIYPNEAQAFVDEHCAVEGCEASKEQPEVRLFRFPTDDDDMLWKWCNNLKMNPVDCIGVRICNKHFEDDCIGPKHLYKWAIPTQELGHDDAQIELIPNPKPEERYVDPVFKCIVPTCGKTRRFDEVQMNSFPKDPDLFQRWRHNLRLEHLSFQERERYKICNAHFEEICIGKTRLNIGSVPTLELGHDDEDDIFQVNPAELQSNLFGRQRRLLLERSGELSVKQELSETEDNKKADADVTATGSNSKQAKIKRSASDLKCCVHSCGRSRLEHGARLFPFPTGKQQHLKWRHNLHLEPEEVDRSTRVCSAHFNRRCIEGKQLRSWAMPTQQLGHNDQPIYENPKNIPGFFTPTCALGHCRKRRSIDNDLRTYRYPRSEDLLEKWRANLRLAPDQCRGRICANHFEPQVRGKLKLKTGAVPTLQLGHDEGLIYDNEAIKAGMADEEEVIPAEFPRLKLKKEVFDEEEEEEEGEGNDGEQQNPDDLDDNADEEDKDDHYFDPLELVETFAENRSDDEAQDYEDEEGEGRVEDAPSGYNVNEEIEQLPSSPPSSLPRRHQAPRRDKPANNVTPICCLKHCRKERTAFHLLSTFGFPKDRQLLLKWCVNLHLNPDDCIGRVCIEHFQPEVLGTRKLKQNAVPTLNVGHEEPLRYSCHGVDQNLEERDPQPQHSVFRLWSLKHCRKRKLTEPPDIPLAKRRALEMPIMKREWEMEMEIGMQMERTKETNKITQTESESYKCCISSCGSQEVSNLLPFPEEKTLQRKWSHNLRLPPETDTTSLSLKRVCLAHFESQLFENGRLTKEAEAEAVPTLKLGHSGWNLYRTNGICLVPDCTHSTFGRLSFIDLPDNSIIRDAFLSCLNLPERCEEQARLCRIHFMKAYKQFDLPNVLHPQVIMELQSAVDELQCAVPGCSFEDADMDFHLIQLPENKEELSKWLRNTKIPYDPLKHQSYRICTLHFESEYLNLSHPLKGAIPTLHLNHEDEIHLNTRPLPEEQDSMLTPLRIKTDLAFLGSPCASASPSPRGRIRMCCIPTCGQFGSSQVRLFRFPTEEQALLRWLVNTQQQPRLVDPLDLYVCQLHFEPEAICMKQLRSWAEPTLHLGHDGYVIPNAKHNGNISDSQDTEQAMRFIRERFCSVISCFQAGGQEEEEEVRLFDYPEDMATIRKWAAACRHRSMQARSHGFKVCQFHFAKECFDPNTGELIEGAVPTLELSRDEMERQCLVAGCVKNDANGTRLRYFKIPKVAAQLEAWSRNLKVHPTDLMQGEQQYICEKHFEAFCFGANKGLRSGALPTLHLGHDEDVDMLPSPESLFCQNKTDECCVPGCGRVWHTGDRKFRGFPKLLAMAQKWRHNLRLDAPVEQLGKLKVCNAHFETTSSNMGTNGLSSSASIPTLELGHSSPDIYPADVNLKFQKRSGVPAKIYCCYPKCEETCLPKNLSYALPQEEHLRNAWLSHMDIEEPKDEGSILLCPLHYVILYQYSVTHYPEHHALSRILLDDNYKEARNNRRVKIVSCTIKGCDMVKPRDGVPLHGMPQSKEILQMWIDNGQFEFLEQQRYMFKVCHNHFEPCCFFDDRRLHSWSVPTLRLPGEVIHQNPSAEQWQNMINKQAAAKTYAEDKEEPDPHGDVVKTEPILKIEHMESEHEDEAPEMQALEVLLEVGHVERMESYEKVDKSPLIYTDNAPFRTSPIRCQYNANHCAVDGCRVTAEDVDGTIKLHKFPASQEAAQKWMHNTQVDMDEKFWWRYRICSYHFDQECFQSSRIRKGAMPTLLLGPRRPDKVYDNEFSLPEGEEPFLDPPDTQLEEGTTVVSRVQKEVSNLCLPPRAPPRKSSKFCQIDSCPNHLTTENMTLHKFPHSEDMCLKWQHNTQVPFDPYYRWRYRICSAHFHPVCLVNMRLVHGSVPTLKLGPKAPSELFDNDFEAINLRLDKRLTESNANVYIKHERREEDEDSMMFPEPELQVHEDQDDKISSWNSKLQLPVKQEKIICSQIKSGYDKCSLAHCQRQRSQHGVHIYKFPRSKRQQERWMHNLRIRYDERTPWKFMICSVHFEPHCVSLRKLRPWAVPTLELGDNVPETIFTNEQCEEELVTDRSELDSDAEEEDGLQEDDDDDDDEDDVKPDVIGIKRRRRFKIDSGCPPSQIPPWKVKQCCLPYCRAFRGDGIKLFRLPNNRNSISNWERATGMVFKESQRNTRLICSRHFEPELIGVRRLMRNAIPTKHLNPQAVDQIRTKKEKNPPAPIVPICCMADCHYNGNVKLHKFPSDPTLLRQWCQALRLTDTQRYLGKHICSMHLPMNKTLSCVICGGDNVELPMLGFPENRNQRAKWCYNLKIETIPKWDNSKHICCRHFESHCFDTPGELRPGAAPTLHLNHDDTNIFFSDYATGLPSSPLGNRIKDEPLETESDETLLV

Similar Transcription Factors

Sequence clustering based on sequence similarity using MMseqs2

100% Identity: iTF_00525910;
90% Identity: iTF_00594581;
80% Identity: -