Basic Information

Insect: Drosophila pseudotakahashii
Gene Symbol: -
Assembly: GCA_035046095.1
Location: JAWNOE010000198.1:7178668-7191969[+]

Transcription Factor Domain

TF Family: THAP
Domain: THAP domain
PFAM: PF05485
TF Group: Zinc-Coordinating Group
Description: The THAP domain is a putative DNA-binding domain (DBD) and probably also binds a zinc ion. It features the conserved C2CH architecture (consensus sequence: Cys - 2-4 residues - Cys - 35-50 residues - Cys - 2 residues - His). Other universal features include the location of the domain at the N-termini of proteins, its size of about 90 residues, a C-terminal AVPTIF box and several other conserved residues. Orthologues of the human THAP domain have been identified in other vertebrates and probably worms and flies, but not in other eukaryotes or any prokaryotes [1].
Hmmscan Out: # of c-Evalue i-Evalue score bias hmm coord from hmm coord to ali coord from ali coord to env coord from env coord to acc

1 29 5 9.2e+03 -2.2 3.3 38 62 311 338 302 353 0.59

2 29 3.7e-15 6.9e-12 46.3 3.9 1 86 544 616 544 617 0.85

3 29 1.5e-14 2.8e-11 44.3 5.0 1 87 644 713 644 713 0.83

4 29 1.4e-15 2.6e-12 47.6 0.2 1 87 735 807 735 807 0.85

5 29 8.1e-16 1.5e-12 48.4 5.6 1 87 906 976 906 976 0.81

6 29 2.1e-14 3.9e-11 43.9 3.0 1 86 1000 1071 1000 1072 0.82

7 29 8.8e-13 1.6e-09 38.7 0.7 1 87 1107 1175 1107 1175 0.81

8 29 2.2e-10 4.1e-07 31.0 1.6 1 86 1215 1284 1215 1285 0.76

9 29 6.7e-17 1.2e-13 51.9 0.4 1 86 1312 1381 1312 1382 0.83

10 29 1.5e-12 2.8e-09 37.9 1.7 1 85 1403 1471 1403 1473 0.81

11 29 4.3e-14 8e-11 42.9 0.4 1 86 1500 1571 1500 1572 0.85

12 29 1e-12 1.9e-09 38.5 2.9 1 85 1648 1716 1648 1718 0.83

13 29 1.6e-12 3e-09 37.8 0.1 1 86 1741 1809 1741 1810 0.81

14 29 3.4e-13 6.4e-10 40.0 1.8 1 87 1945 2014 1945 2014 0.79

15 29 1.2e-09 2.2e-06 28.6 0.2 1 86 2116 2182 2116 2183 0.77

16 29 0.00014 0.26 12.4 0.0 1 59 2198 2243 2198 2259 0.80

17 29 3.9e-12 7.2e-09 36.6 0.4 1 87 2272 2342 2272 2342 0.81

18 29 1.8e-12 3.4e-09 37.6 0.4 1 87 2401 2471 2401 2471 0.82

19 29 2.2e-11 4.1e-08 34.2 0.1 1 86 2506 2577 2506 2578 0.81

20 29 6.7e-12 1.3e-08 35.8 0.0 1 86 2588 2659 2588 2660 0.78

21 29 3.6e-11 6.7e-08 33.5 0.0 1 86 2684 2754 2684 2755 0.79

22 29 0.00017 0.31 12.1 0.1 1 58 2788 2835 2788 2855 0.81

23 29 3.4e-13 6.3e-10 40.0 0.3 1 86 2873 2945 2873 2946 0.82

24 29 7.4e-16 1.4e-12 48.5 0.4 1 86 3058 3130 3058 3131 0.81

25 29 2.4e-12 4.4e-09 37.3 3.0 1 86 3192 3262 3192 3263 0.81

26 29 3.5e-14 6.5e-11 43.2 4.6 1 86 3363 3433 3363 3434 0.85

27 29 1e-11 1.9e-08 35.2 0.1 1 86 3514 3583 3514 3584 0.83

28 29 4.4e-10 8.2e-07 30.0 0.8 1 58 3607 3655 3607 3664 0.84

29 29 1.5e-09 2.8e-06 28.3 1.4 18 86 3673 3730 3662 3731 0.75

#	of	c-Evalue	i-Evalue	score	bias	hmm coord from	hmm coord to	ali coord from	ali coord to	env coord from	env coord to	acc
1	29	5	9.2e+03	-2.2	3.3	38	62	311	338	302	353	0.59
2	29	3.7e-15	6.9e-12	46.3	3.9	1	86	544	616	544	617	0.85
3	29	1.5e-14	2.8e-11	44.3	5.0	1	87	644	713	644	713	0.83
4	29	1.4e-15	2.6e-12	47.6	0.2	1	87	735	807	735	807	0.85
5	29	8.1e-16	1.5e-12	48.4	5.6	1	87	906	976	906	976	0.81
6	29	2.1e-14	3.9e-11	43.9	3.0	1	86	1000	1071	1000	1072	0.82
7	29	8.8e-13	1.6e-09	38.7	0.7	1	87	1107	1175	1107	1175	0.81
8	29	2.2e-10	4.1e-07	31.0	1.6	1	86	1215	1284	1215	1285	0.76
9	29	6.7e-17	1.2e-13	51.9	0.4	1	86	1312	1381	1312	1382	0.83
10	29	1.5e-12	2.8e-09	37.9	1.7	1	85	1403	1471	1403	1473	0.81
11	29	4.3e-14	8e-11	42.9	0.4	1	86	1500	1571	1500	1572	0.85
12	29	1e-12	1.9e-09	38.5	2.9	1	85	1648	1716	1648	1718	0.83
13	29	1.6e-12	3e-09	37.8	0.1	1	86	1741	1809	1741	1810	0.81
14	29	3.4e-13	6.4e-10	40.0	1.8	1	87	1945	2014	1945	2014	0.79
15	29	1.2e-09	2.2e-06	28.6	0.2	1	86	2116	2182	2116	2183	0.77
16	29	0.00014	0.26	12.4	0.0	1	59	2198	2243	2198	2259	0.80
17	29	3.9e-12	7.2e-09	36.6	0.4	1	87	2272	2342	2272	2342	0.81
18	29	1.8e-12	3.4e-09	37.6	0.4	1	87	2401	2471	2401	2471	0.82
19	29	2.2e-11	4.1e-08	34.2	0.1	1	86	2506	2577	2506	2578	0.81
20	29	6.7e-12	1.3e-08	35.8	0.0	1	86	2588	2659	2588	2660	0.78
21	29	3.6e-11	6.7e-08	33.5	0.0	1	86	2684	2754	2684	2755	0.79
22	29	0.00017	0.31	12.1	0.1	1	58	2788	2835	2788	2855	0.81
23	29	3.4e-13	6.3e-10	40.0	0.3	1	86	2873	2945	2873	2946	0.82
24	29	7.4e-16	1.4e-12	48.5	0.4	1	86	3058	3130	3058	3131	0.81
25	29	2.4e-12	4.4e-09	37.3	3.0	1	86	3192	3262	3192	3263	0.81
26	29	3.5e-14	6.5e-11	43.2	4.6	1	86	3363	3433	3363	3434	0.85
27	29	1e-11	1.9e-08	35.2	0.1	1	86	3514	3583	3514	3584	0.83
28	29	4.4e-10	8.2e-07	30.0	0.8	1	58	3607	3655	3607	3664	0.84
29	29	1.5e-09	2.8e-06	28.3	1.4	18	86	3673	3730	3662	3731	0.75

Sequence Information

Coding Sequence: ATGTCACAACAACACCCCCATCACGCCCACCCCCTCCACTACGCCCACCACTATCCGCCCCCTGCGACGCCCATGTCCCTGCAGCAACAAACGCAGCAGCCgtcgcaacagcagcagcagcagcacgccAATTGGTACTCACATGTTGCTTCCTACCCCACACCCCACTCGGCCTTCGgccccgcccccgccccctcCTGCAAGGccacaagcagcagcagcaacaacaacatcatggGTGGCGGAGGCTATGGGCCGGGGGGTGGCAACGCGCAGGGTTATTATGGCGCCGCTGGCGGTGGCCTCAATGTCAGTGGGgcggtggtgggtggtgggccgAGCTACGGCCTTGGGGCCAATACAGTGGCATATGCCCACAACCAACTGCTGCAgtaccagcaacagcaacaacaacaacagcagcaacatcagcaacttCCACAGCATCTAAGCCAACAAAGGTCCTATATGGGCCACGATATCATGACCGGCAGCTATCCCTATATCAAAAGCGAACCCATGGAGGCCTTCCAGCAGCCCCCCAATCCCATGGCCCCGCCCCCGGCTccagaaatattaattaaatcGGAACCCATTGATGAGCATTCCTACAAGTCCAACTATATAGACGACAACACGCCATTTGCGGACTTTAGCAAGTTCAGCGAATTCAGCGAGGACATGTTGAGTCCCAAAGTGGAATTGACCGTCAAGAATGAGTCCTACGGAAGGAATACCAACAGTTTTCTGCGCCGCAAACAGCAATCGGATCGGAGTGCCGAAAGCCTGCCCATCTGCCAGCGCTGCAAGGAGGTCTTCTTCAAGAAGCAGGCCTATCTGCGACACGTGGCCGAGAGCAATTGCGGGATGCAGGAGTACGACTTTAAGTGCAGCACCTGCCCCATGTCCTTCATGACCACCGAGGAGCTGCAGCGGCACAAGCACCAGCACCGTGCGGACAGATTCTTCTGCCACAAGTACTGCGGCAAGCACTTCGAAACGATCGCCGAGTGCGAGGCGCACGAGTATATGCAGCACGAATACGATAGCTTTGTCTGCAACATATGTTCCGGGACCTTCGCTACCCGTGAGCAGCTATACGCCCACCTGCCGCAACACAAGTTCCAGCAGCGCTTCGACTGTCCCATCTGCCGCTTGTGGTATCAGACGGCTCTCGAGCTCCACGAACACCGTTTGGCCGCACCCTACTTCTGCGGCAAGTATTACACGGGGGGACAGTCATCCACGACCTCGCactcgcagcagcagcatcagacAAACTACAAGCTACAGGATTGCCATATGGCAACCATGGAAATGCCCACCGCCCCGCACCACAAACCGAACTCATCCAGCTCGTCCTTGCCGGCCACGGCTGCACTAAATTCACTCCTGCAGCAGCGTCAAGCAAACGCCGACGGAGCAGCCATGTTTGCGGCTTCCGCACTCAAGAACGAGGTAAATGTGAAACTGGAGCGCAGCTTTAGCAACTCGACCAGCGAGTCATCCTACAGCGTTCAGGAGAATAGCTACAATAATGCCTACGGAAGCGACAGCTCAATCCACGGAGGTGCGATCGCTGGACCACAAGCACACTCTTCGACGCTGGACGACTCCGAGGACGCTCTGTGCTGTGTGCCACTGTGCGGAGTGCGGAAGAGCACCAGCCCCACGCTGCAGTTCTTTACGTTCCCCAAGGACGAGAAGTACCTCAACCAGTGGCTACATAATCTCAAGATGTTCCACATACCCGCCGCCAGCTACGCCAATTTCCGCATCTGCAGCATGCACTTCCCGAAACGCTGTATTAACCGCTATTCGCTGTGCTATTGGGCAGTGCCCACGTTCAACCTGGGTCACGACGACGTGGCGAATCTCTATCAAAACCGGGAGCTGACCAACACCTTCACCACCGGCGAAGTAGCCCGTTGCAGCATGCCGCACTGCACCAGTCAACGTGGCGAGAGCaacttaaagttttataactttcctAAGGACATCAAGAGCCTCATCAAGTGGTGCCAGAACGCCCGACTTCCCGTTCAGGCGAAGGAGCCGCGTCACTTCTGCAGCCGCCACTTTGAGGAGCGTTGCATCGGCAAGTTTCGCCTGAAGCCTTGGGCGGTACCCACTTTACATCTGGGTGCCCAATATGGCAAGATCCATGATAACCCGAAGAATCTGTACGTGGAGGAGAAGCGCTGCTGCCTCAATTTCTGCCGCCGGAGCCGATCCTCTGACTTCAATATGTCGCTATATCGATTTCCCAGAGATGAGGTGCTCCTGCGACGTTGGTGCTACAATCTGCGCCTGGATCCGGGAGTGTATCGCGGGAAGAACCACAAAATATGTAGCGCTCACTTTATTAAAGAGGCTTTGGGTCTGCGGAAGCTATCACCGGGTGCTGTTCCCACGCTTCATCTAGGTCACACTGACACCTTCAACATCTACGAGAACGAACTGTGGCCGCCGCCAACGCCCTCCAGCTCTCACAGCGGTGGCCTCCAGCAGCACCAGGCGCAGCCTCACCATTCGCAACACTCAttgcaacagcagctgcaCAGCAAATCGTACCAGCGCCACTCGGCGGCCTCTACGTCTTCCTCGGCCAGTTCGGCGACCTCTCACTACGTTGATCCGGAGCTGAACTCCTCTTACCTGGCCATGGGTGCTGGTGGATCCTCGGCGATGAACGTCAGCGACAGCATGGACATCTGCTGTGTGCCCAGTTGCGAGAGCAAGCGACATAACAACGAGAACATCACATTCCACACCATACCGCGCCGGCCGGAGCAGATGCGCAAGTGGTGTCACAACCTGAAAATACCAGAAGAAAAGATGCACAAGGGCATGCGGATCTGCAGTCTGCACTTCGAGTCTTACTGCATCGGCGGTTGTATGCGTCCGTTTGCAGTGCCCACGCTTAATTTGGGTCACGAAGAGGAGGACATTCATCGGAATCCGGACGTGATCAAGAAGCTTAATATCCGGGAAACATGCTGCGTCTCCGTATGCAAACGAAATCGAGATAGGGACCATGCCAACCTGCACCGCTTCCCAAGTAATGTGTCGTTGCTGACCAAGTGGTGTGGTAATCTCCAGCGGCCCGTTCCGGATGGCAGTAAACTATTTAACGACGCTATCTGTGAAGTGCACTTCGAGGATCGATGCCTGCGGAACAAAAGGCTGGAGAAGTGGGCAGTGCCCACACTGATCCTGGGCCACGAAAACATCGCCTATCCGCTTCCCACACCGGAGCAGGTCACCGAGTTCTATGCGCGACCCACTGCGCCCAACAATGGCGAGGAACAGGGCGAGTGCTGCGTGGAGACGTGCAAGAGAAATCCCAGTGTGGACGACATCAAGCTTTATCGGCCGCCGGAGGAGGCTTCCGTGTTGGCCAAGTGGGCGCACAACCTGCAAACAGAGGCTGGTAAACTGACGAGCATGCGGATTTGTAATCTTCACTTCGAGGCTCACTGCATCGGCAAACGGATGCGGCCATGGGCGATACCCACACTAAATCTGGCCGGAAACATAGAGAATCTCTATGAGAATCCAGAGCATTCGATGCTGTACAAGCGACGAACTCACACGAAAACCAAGCTACCGGCTTCCGTAAAGCCCACTTGGGTGCCCAGGTGCTGTCTTCCACATTGCCGCAAGGTTCGAGCTCTGCACAACGTTCAGCTGTATCGCTTCCCCAAGCTCAATCGCTCCACTCTGGCCAAGTGGTCGCACAATCTGCAGGTTCCCATGGTTGGCAGTGCCCAACGGCGGCTGTGCTCGGCTCATTTTGAACCACATGTGCTGAGCAAGAAGTGTCCGGTGCCGCTGGCGGTACCCACTCTGGACTTGAACCCCCCGCCCGGCCTAAAGATCTACCAGAATCCGGCCAAGCTAAAGGCCAGCAAGCTGTGCCTGCAGCGCGTGTGCATAGTCGAGAGCTGCCGCAAGACGCGGGCGCAGGGCGTCCAGCTCTTCCGGCTGCCACATAGTCCCACACAGCTACGCAAGTGGATGCACAACATCAAGACGCGTCCGAGGGCGGCGATGAGGGCTCAATACCGGGTTTGCTCCCGCCACTTTGAGACGCACTCGTTCAATGGCAGGAGACTAAGCGCTGGCGCCATTCCCACCCTGGAATTGGGCCACGACGACGAGGACATCTATCCCAACGAAGCGCAGGCATTTGCGGACGAACACTGCGTGGTGGAGGGCTGCGAGGCATCTAAGGAGCAGGCGGAGGTCCGACTCTTCCGCTTTCCCACGGAAGACGACGATATGCTGTGGAAGTGGTGCAACAACCTCAAAATGAACCCTGTGGACTGCACCGGAGTACGCATATGCAACAAACACTTCGAGGTGGACTGCATCGGGCCCAAGCACCTGTACAAGTGGGCTATACCCACGCAGGAACTGGGCCACGACGACGCCCAGATCGAGCTGATACCGAATCCCAAGCCAGAGGACCGGTATGTGGATCCGGTGTTCAAGTGCATCGTACCCACCTGCGGGAAAACGCGCCGCTTCGACGAGGTGCAGATGAACAGCTTCCCCAAGGACCCGAATCTCTTCCAGCGCTGGCAGCATAACCTGCGCCTGGAACACCTCAACTTCCTGGAACGCGAGCGCTACAAGATCTGCAATGCCCACTTCGAGGACATCTGTATTGGCAAGACACGCCTGAACATAGGCTCGATCCCTACTCTTGAGCTGGGTCACGACGAGACGGAGGATCTGTTCCAGGTGAATCCGGCGGAGCTGCAGAGCAACCTTTTCGGACGACAGCGGCGAATACACGATGAATCAGGTGGAATTAGCATCAAGCAGGAGCTCTCCGAGTCGGAAGACGTCAAGCCAGATTTGACAACTCTGCACGAAGCCACAGAATCGAGAACTAGACAGgtaaaattcaagaaaacgGTATCCGATCTAAAGTGTTGTGTGCACAGTTGCGGACGCAGTCGTCTGGAGCACGGAGCACGGCTCTTTCCGTTTCCCACCGGTAAGCAGCAACACCTCAAGTGGCGTCACAACCTGCGCCTGGAGCCCGACGAGGTGGACCGAACGACGCGCGTTTGCAGTGCCCACTTTAATCGGCGCTGCATTGACGGAAAGCAACTGAGGAGTTGGGCAATGCCCACGCAGCAACTGGGTCACCAGGAGCAGCCGATCTACGAGAATCCGAAGAACATACCGGGATTCTTCACGCCCACCTGCGCTCTGGGGCATTGCCGCAAGCGGAGGAGCATAGACAACGATCTGCGAACCTACCGATATCCAAGAAGTGAGGACCTACTGGAGAAATGGCGGGCGAATCTTCGGCTGACTCCGGATCAGTGCCGCGGACGGATTTGTGCGGATCACTTTGAGGCCCAGGTTCGGGGCAAACTAAAGTTGAAGACGGGAGCGGTGCCCACCTTAAAACTGGGCCACGATGAGGGCTTAGTATTCGACAATGAGGCTATTAAGGTTGGAGTGACCGAGGATGAGGAGGGCAGCTCGGAGTTTCCGCGACTGAAACCCAAAAGGGAGATActcgatgaggaggaggaagacGTGGAGGCTGAGGAGGAACACAATGATCAGGAtaatgaggatgaggatgaagACGATAAAGGCGACCACTATTTTGATCCACTTGAATTGGTCGAGACCTTCGCCGAACATCCGAGCGATGATGAAGCCGAATATTGTGCGGATGAAGAGGATGATCGAGACGAAGAGGAGAATTTGGAGGAGAAGGATCACTTCCTGCCGGATCTACCACCGACTCCGCCAATCGTCTCTATGCGTCGCGAAAAGCCCGCCAACAATGTGACTCCCATTTGTTGCCTGAAGCACTGTAGAAAGGAGCGCACTGCCTTCCACCTCCTCAGCACGTTTGGTTTTCCCAAGGACCGCCAGCTGCTGCTCAAGTGGTGCGCCAATCTCCACCTGGATCCGGATGACTGCATCGGCCGGGTTTGCATTGAACACTTCCAGTCGGAGGTTCTCGGAACCCGAAAGCTCAAGCAGAATGCGGTGCCCACCCTCAATGTGGGACATAATGAGCCACTCAGATACTCGTGTAACGGAATGGATCGGGACCAGGAGCAATCACAGCCACAGCATTCGGTTTTTCGGCTTTGGAGCCTAAAACACTGCCGCAAGAGGAAGCTGACAGAGCCGCCGGACATTCGACCAAGCAAATGGAGTGCGGCGGAAGAGCAGATGATGCAGAGGTTGAAGATGGAGATTCAGATAGAGAGGGAGATCAAGTTGGAGATGCAGATGGAGAGGGAATCAAAGACGTCGGCGAAGACTCTAACCAGGAATCCGAGGGAGAGTAAGCCGGAAAGATGTTGCATCAGCACCTGCGCCAACGAGGATGTTAAGCAATTACTTCCAATGCCTGATGAGCAGAATCTCTTAAGAAAATGGCAGCATAACCTGAAGGTTTCCATAGACACGGTTTTCAGGGATGTTCGTGTATGTGTGGAGCATTTTGAGGCTGAAGTTGTGCAAAATGGAAAGCCGTTGGCGCAGGCAGTTCCCACCCTAAAACTGGACCAAAACAGTTATAACATCTACAGAAACAACGGATCGTGTCTGGTTATCGACTGCGGAAACTTTTCGTCGAGCTTGGTCGAGTTGCCCCAAAATAGGGTTATAAGAGACTCCTGGATGTCCCACCTAAATCTCCCTCTCAGCAGTAATGGTCTTCTATGTAATCTTCACTTTATGGAGCTGTTTGAACAAGTGGAGTTGCCCAAGGTTTTAGCCGCACAAGACTTGGAGGACTTGCAGTGGTCTGCCGACGAAATGAAATGCGCTGTGCCTGGATGCTCCTCCAAAAATGCCAAAGATCTTAAGCTTACCCAGCTTCCAGAGAAGGAGGTGACGCTTTTCAAGTGGCTACATAACACTAAGATAGCATACGAGCATTCGAGGCATAAAAGCTATCGCATCTGTCTGCTCCACTTCGAGGCAGCGGTCCTAGAGTCGGATTTCCCGAAACCTTGGGCTATACCCACCTTGCATCTGAACCATGAAGACAAGATCCATTTGAATCCCAGTCAGCAAAGTCAAGAGTCACGCAGTATAACTCCCAATAGCAATTCTAGGCTAACTCCTTTAAGAATTAAGACCGATCTCGCCTCCTTGAGCAGTCCCTGTGCGAGTGCAAGTCCCAGTCCTCGAGGCAGGATCAGGATATGTTGCATTCCCACATGTGGACAGTTTGGAAACAGCCAAATACGGCTCTATCGCTTCCCCTCCGAAGAGCAAGCCTTGCTCCGGTGGCTGGTGAACACGAATCAGCAACCTCGCCTTGTGGATCCCCTGGAGCTTTATGTGTGCCAATCCCACTTCGAGCCCGATGCCATATGTAAGAAGCAACTACGCAGCTGGGCAGAGCCCACCTTGAACTTGGGCCACGACGGCTATGTCATCCCCAATGCCAGGCACAATGGGAACATCGCCGACGGCCAGGACACTGAGCAGGCGATGATGTTTATCCGGGAACGCTATTGCTCAGTGCTGTCTTGCTTTCAAGCCGAAGGCAATGGAATACGGCTCTATAAGTATCCCAAGGATATGACAACGATACGAAAGTGGGCAGCCGCCTGCAGGCATCGCTCCATGCAGGCCAGCAGCCATGGATTCAAGGTGTGCCAGTCTCATTTTGCCCCGGAATGCTTCGACCCGGACACTTTGGATTTGATTGACGGATCGGTTCCCACTCTGGAGTTGACTAGAGATGACATTGAAAAGCACTGCTTGGTGCCGGGATGCGTGAAGGATGCGACTGGGGACCGTCTGCGTTACTACAAGGTGCCAAAGAACGCTGCTCAACTGGATGCTTGGAGCAACAACCTGAAAATCAATTCCATGGACCTCGTTCAGGGAGAGCAGCTCATCTGCGAGCGCCACTTCGAGTCCTTTTGCTTCGGTGCCTACAAGGGCTTGCGTCCCGGTGCGCTTCCGACACTTTTGCTTGGAAACGACGAGGAGGTTGAGATGTTACCCAATCCCGCAAATCTCTGCCAGAGCAAAACGGAGGTTTGCTGTGCGCCCGGATGCGGACGTACTTGGCAGCCTGAAGACCCACCGTTCAGTGGATTTCCCAAAGTATTCGCGATGGCCGATAAATGGATGCATAACCTCCGCCTGAGAGTTGCTAAGGAGCAGCTGGGCAGACTGAAAGTCTGCAGTGCGCACTTTGAACCCTCTCTCTTCGACAAAAGTGGATTAATGTCGGGATCAATACCCACCCTGGAACTGGGCCATTCCTCGCCGGACATTTTCCAGACGGACCCGCAAAATCTAGGAAAAAGTATCAAGTTCTTCAAGCGAGACTTAACGGCGGAGGTTAATTGCTGTTATCCTGAGTGCAAGGAACTCTCCAAAAACCTGACTTACAACCTGCCGCAGGAGGAACCCCTCAGAAGAGCTTGGCTTCAACATTTGGACATCGAAGAGCCGGCGAATGGTGTCGGCCAGCTTTGCCCGCTGCATTACGTTATTCTCTATGAGTTGAGTGTCAAAAGTTTCCCCGAGCACGTTCCAAATCGATTCCTCGAGGATAATTACCATTCGGCTCGGAGCAACCGCCGCGTGAAAATCGTTAGTTGCTCTGTTAAAGGTTGTGAAATGATCAGGCCCCGGGATAAGGTTCTTTTGCACGGGTTGCCGCAAAGAAAGGACATTCTGAAAATGTGGGTGGAAAATGGCCAACTGGAGATtacggagcagcagcagcaatacaTGCTCAAGGTGTGTCGCAATCACTTTGAGTCACGCTGCACGTTTGACGACCGGAGGCTGCATCCATGGAGCGTTCCCACTCTGCAGTTACCAGCAGATGCTGTGCATCAGATACCCACGAAAGAGGAGTGGCAGGAGATGACGCTTAAACTGACCCAGGAAGCCGGGACAATCAAACAGGAGATAGAGGAGGAgttgcaggaggaggaggagtgtGATAACTCACTGTTGGAACCCATTGTACGAATGGAGCACATTGAGTCCGAGGAGGAAGACTCGGAGATGCAGGCCCTGGAGGTGCTCCTGGAGGTTGGCCACGTTGAGCGGATGGACAGCTACGAGAAGGTGGACAAATCCTATACCACCGAACACGCCATCTACCAACCTACGGGCATTCGAAATCAGTACAATGCCAACCACTGCGCCGTCGAGGGATGCCAGGTGACTGTTGAGGACGTTGACGGGACCATCAAGCTGCACCGGTTCCCCGCATCCTCGGAGTCCGCTAGAAAGTGGATGCACAACACCCAAGTTGATATGGACGAGAAGTTCTGGTGGCGCTATCGCATTTGCAGTTATCATTTCGACCAGGAGTGCTTCCAAAGCGCCAGGATAAAGAAGGGCGCGATGCCCACGCTTCTCTTGGGACCAAAGAGACCGGACCAGCTGTTTGAGAATGAATTCGCCCTACAGGAGACAGAAGAGCTACCTTTACTCCTACCACCAGATGCACTTCCAAGGGAGCATAAGAAAGCGTCAGTTCGAGAGGTAACCAAATTATGCCTGCCGCCGCCGGCTCCGCCTCAAAAGTCCAGCAAGTTTTGTCAGATCGAGGGATGTATGAATCACCTGACCACTGAAAACATGACGCTGCACAAGTTTCCTCATTCCGAGGATATGTGCCTCAAGTGGCAACACAACACGCAGGTGCCATTCGACCCCCTCCACCGATGGCGCTATCGCATCTGCAGTGCCCACTTTCATCCGGTGTGTCTGCTGAACATGCGACTAGTGCACGGCAGTGTGCCCACCTTGAAACTGGGAGCCAAGGCGCCCGCCGAGCTCTTCGACAACGACTTTGAGGCCATCAACCTTAGACTGGACAAGAGGTCGGGCGTGGAGTTAAGCACCGTCCAGATCAAGGAGGAAAGGGAGAAAGATGAAGACGCCATGCTGTTCCTGGAGCCGGAGTTGCAGCTCCACGAGGACCAAGAGGAGGAGGACACGGCAGCGCTGCAAGTATCCTTTAGCCAATCAAACTGGAAAAGCCAACTGCGTCTTCCCGTAAAGCAGGAGAAAATTACCTACAACCAAGTGAAGTCCGGATACGATAAGTGCTCGCTGGCCCACTGTCAGCGGCAGAGATCTCAGCACGGCGTTCACATCTACAAGTTTCCCAAATCGAGGCGCCAACAGGAGCGTTGGATGCACAACCTCCGCATTCGTTACGATGAGCGGCGGCCCTGGAAGTTTATGATCTGCAGCGTGCACTTCGAGCCGCACTGCATCAGCCTGAGGAAGCTGCGTCCCTGGGCAGTGCCCACGCTGGAACTGGGAGACAATGTGCCGGAGAAGATCTTTACGAACGAACAGTGCCAGGAGCTCACCACTGATCGCAGCGAGGCTGAGAGCGAAGGCGACGAGGAGGATGGCCTacaggaggacgaggaggaggaggaggatgagtgCGACGAGGACATGGAGCCGGAGGTTCGCATCAAGCGAGAGCGACGATCCAAGCTTGATCCCTGGCCTCCTGGCAGCGTTCCGCCTTGGAAGGTCAAGCAGTGCTGCCTCCCATACTGCCGCTCCTTTCGTGGCGAGGGCATCAAGCTGTTCCGGCTACCCAACAACCGCACCTCCATCCGGAACTGGGAGCTGGCGACGGGCATGCTGTTCAAGGAGTCTCAACGGAATACACGTCTGATCTGCAGCCGTCATTTCGAGCCCGAGTTGATTGGGGTAAGGCGGCTCATGCGCAACGCAATCCCCACGAGGCATTTGAATCCCCAAGGAGTCGCGCAAGAAGCTAAGAAAAAGCCGGAGCCACCCGTCCCCATCGCAACCTGTTGCATGGCTGACTGCCACCACAATGGAAATGTCAAGCTTTACAAGTTTCCCAGTGATCCCTCACTGCTAAGACAGTGGTGCCAAGCACTCAGGCTTACGGACACACAGCGATACCGGGGCAAACATATCTGCTCGGTCCACCTGCCCACCGACAAGACGATAAGCTGCGTTATCTGCGGCGTGGACAGCGTTCAGCTGCCGATGCTGGACTTTCCGGAGCAGCGCAATCAGCGCGCCAAGTGGTGCTACAATCTCAAGATCGAGGCCATACCAAAGTGGGACCACTCCAAGCACATCTGCTGTCGTCACTTCGAGTCGCATTGCTTTGTGCAGCCGGGTGAGCTGCGCTCGGGTGCGATTCCCACGCTGCAGCTGAACCACGACGACACGAACATCTTCCTAAGCGACTACGCCACTGGTCCGACCAGCAATCGGATCAAGGACGAGCCGGTGGACAACGATAACGAGATGCTGCTGGTTTAG
Protein Sequence: MSQQHPHHAHPLHYAHHYPPPATPMSLQQQTQQPSQQQQQQHANWYSHVASYPTPHSAFGPAPAPSCKATSSSSNNNIMGGGGYGPGGGNAQGYYGAAGGGLNVSGAVVGGGPSYGLGANTVAYAHNQLLQYQQQQQQQQQQHQQLPQHLSQQRSYMGHDIMTGSYPYIKSEPMEAFQQPPNPMAPPPAPEILIKSEPIDEHSYKSNYIDDNTPFADFSKFSEFSEDMLSPKVELTVKNESYGRNTNSFLRRKQQSDRSAESLPICQRCKEVFFKKQAYLRHVAESNCGMQEYDFKCSTCPMSFMTTEELQRHKHQHRADRFFCHKYCGKHFETIAECEAHEYMQHEYDSFVCNICSGTFATREQLYAHLPQHKFQQRFDCPICRLWYQTALELHEHRLAAPYFCGKYYTGGQSSTTSHSQQQHQTNYKLQDCHMATMEMPTAPHHKPNSSSSSLPATAALNSLLQQRQANADGAAMFAASALKNEVNVKLERSFSNSTSESSYSVQENSYNNAYGSDSSIHGGAIAGPQAHSSTLDDSEDALCCVPLCGVRKSTSPTLQFFTFPKDEKYLNQWLHNLKMFHIPAASYANFRICSMHFPKRCINRYSLCYWAVPTFNLGHDDVANLYQNRELTNTFTTGEVARCSMPHCTSQRGESNLKFYNFPKDIKSLIKWCQNARLPVQAKEPRHFCSRHFEERCIGKFRLKPWAVPTLHLGAQYGKIHDNPKNLYVEEKRCCLNFCRRSRSSDFNMSLYRFPRDEVLLRRWCYNLRLDPGVYRGKNHKICSAHFIKEALGLRKLSPGAVPTLHLGHTDTFNIYENELWPPPTPSSSHSGGLQQHQAQPHHSQHSLQQQLHSKSYQRHSAASTSSSASSATSHYVDPELNSSYLAMGAGGSSAMNVSDSMDICCVPSCESKRHNNENITFHTIPRRPEQMRKWCHNLKIPEEKMHKGMRICSLHFESYCIGGCMRPFAVPTLNLGHEEEDIHRNPDVIKKLNIRETCCVSVCKRNRDRDHANLHRFPSNVSLLTKWCGNLQRPVPDGSKLFNDAICEVHFEDRCLRNKRLEKWAVPTLILGHENIAYPLPTPEQVTEFYARPTAPNNGEEQGECCVETCKRNPSVDDIKLYRPPEEASVLAKWAHNLQTEAGKLTSMRICNLHFEAHCIGKRMRPWAIPTLNLAGNIENLYENPEHSMLYKRRTHTKTKLPASVKPTWVPRCCLPHCRKVRALHNVQLYRFPKLNRSTLAKWSHNLQVPMVGSAQRRLCSAHFEPHVLSKKCPVPLAVPTLDLNPPPGLKIYQNPAKLKASKLCLQRVCIVESCRKTRAQGVQLFRLPHSPTQLRKWMHNIKTRPRAAMRAQYRVCSRHFETHSFNGRRLSAGAIPTLELGHDDEDIYPNEAQAFADEHCVVEGCEASKEQAEVRLFRFPTEDDDMLWKWCNNLKMNPVDCTGVRICNKHFEVDCIGPKHLYKWAIPTQELGHDDAQIELIPNPKPEDRYVDPVFKCIVPTCGKTRRFDEVQMNSFPKDPNLFQRWQHNLRLEHLNFLERERYKICNAHFEDICIGKTRLNIGSIPTLELGHDETEDLFQVNPAELQSNLFGRQRRIHDESGGISIKQELSESEDVKPDLTTLHEATESRTRQVKFKKTVSDLKCCVHSCGRSRLEHGARLFPFPTGKQQHLKWRHNLRLEPDEVDRTTRVCSAHFNRRCIDGKQLRSWAMPTQQLGHQEQPIYENPKNIPGFFTPTCALGHCRKRRSIDNDLRTYRYPRSEDLLEKWRANLRLTPDQCRGRICADHFEAQVRGKLKLKTGAVPTLKLGHDEGLVFDNEAIKVGVTEDEEGSSEFPRLKPKREILDEEEEDVEAEEEHNDQDNEDEDEDDKGDHYFDPLELVETFAEHPSDDEAEYCADEEDDRDEEENLEEKDHFLPDLPPTPPIVSMRREKPANNVTPICCLKHCRKERTAFHLLSTFGFPKDRQLLLKWCANLHLDPDDCIGRVCIEHFQSEVLGTRKLKQNAVPTLNVGHNEPLRYSCNGMDRDQEQSQPQHSVFRLWSLKHCRKRKLTEPPDIRPSKWSAAEEQMMQRLKMEIQIEREIKLEMQMERESKTSAKTLTRNPRESKPERCCISTCANEDVKQLLPMPDEQNLLRKWQHNLKVSIDTVFRDVRVCVEHFEAEVVQNGKPLAQAVPTLKLDQNSYNIYRNNGSCLVIDCGNFSSSLVELPQNRVIRDSWMSHLNLPLSSNGLLCNLHFMELFEQVELPKVLAAQDLEDLQWSADEMKCAVPGCSSKNAKDLKLTQLPEKEVTLFKWLHNTKIAYEHSRHKSYRICLLHFEAAVLESDFPKPWAIPTLHLNHEDKIHLNPSQQSQESRSITPNSNSRLTPLRIKTDLASLSSPCASASPSPRGRIRICCIPTCGQFGNSQIRLYRFPSEEQALLRWLVNTNQQPRLVDPLELYVCQSHFEPDAICKKQLRSWAEPTLNLGHDGYVIPNARHNGNIADGQDTEQAMMFIRERYCSVLSCFQAEGNGIRLYKYPKDMTTIRKWAAACRHRSMQASSHGFKVCQSHFAPECFDPDTLDLIDGSVPTLELTRDDIEKHCLVPGCVKDATGDRLRYYKVPKNAAQLDAWSNNLKINSMDLVQGEQLICERHFESFCFGAYKGLRPGALPTLLLGNDEEVEMLPNPANLCQSKTEVCCAPGCGRTWQPEDPPFSGFPKVFAMADKWMHNLRLRVAKEQLGRLKVCSAHFEPSLFDKSGLMSGSIPTLELGHSSPDIFQTDPQNLGKSIKFFKRDLTAEVNCCYPECKELSKNLTYNLPQEEPLRRAWLQHLDIEEPANGVGQLCPLHYVILYELSVKSFPEHVPNRFLEDNYHSARSNRRVKIVSCSVKGCEMIRPRDKVLLHGLPQRKDILKMWVENGQLEITEQQQQYMLKVCRNHFESRCTFDDRRLHPWSVPTLQLPADAVHQIPTKEEWQEMTLKLTQEAGTIKQEIEEELQEEEECDNSLLEPIVRMEHIESEEEDSEMQALEVLLEVGHVERMDSYEKVDKSYTTEHAIYQPTGIRNQYNANHCAVEGCQVTVEDVDGTIKLHRFPASSESARKWMHNTQVDMDEKFWWRYRICSYHFDQECFQSARIKKGAMPTLLLGPKRPDQLFENEFALQETEELPLLLPPDALPREHKKASVREVTKLCLPPPAPPQKSSKFCQIEGCMNHLTTENMTLHKFPHSEDMCLKWQHNTQVPFDPLHRWRYRICSAHFHPVCLLNMRLVHGSVPTLKLGAKAPAELFDNDFEAINLRLDKRSGVELSTVQIKEEREKDEDAMLFLEPELQLHEDQEEEDTAALQVSFSQSNWKSQLRLPVKQEKITYNQVKSGYDKCSLAHCQRQRSQHGVHIYKFPKSRRQQERWMHNLRIRYDERRPWKFMICSVHFEPHCISLRKLRPWAVPTLELGDNVPEKIFTNEQCQELTTDRSEAESEGDEEDGLQEDEEEEEDECDEDMEPEVRIKRERRSKLDPWPPGSVPPWKVKQCCLPYCRSFRGEGIKLFRLPNNRTSIRNWELATGMLFKESQRNTRLICSRHFEPELIGVRRLMRNAIPTRHLNPQGVAQEAKKKPEPPVPIATCCMADCHHNGNVKLYKFPSDPSLLRQWCQALRLTDTQRYRGKHICSVHLPTDKTISCVICGVDSVQLPMLDFPEQRNQRAKWCYNLKIEAIPKWDHSKHICCRHFESHCFVQPGELRSGAIPTLQLNHDDTNIFLSDYATGPTSNRIKDEPVDNDNEMLLV

Similar Transcription Factors

Sequence clustering based on sequence similarity using MMseqs2

100% Identity: iTF_00605601;
90% Identity: iTF_00548096;
80% Identity: -