Basic Information

Insect: Chymomyza caudatula
Gene Symbol: -
Assembly: GCA_035041775.1
Location: JAWNKW010000209.1:3555256-3571068[+]

Transcription Factor Domain

TF Family: THAP
Domain: THAP domain
PFAM: PF05485
TF Group: Zinc-Coordinating Group
Description: The THAP domain is a putative DNA-binding domain (DBD) and probably also binds a zinc ion. It features the conserved C2CH architecture (consensus sequence: Cys - 2-4 residues - Cys - 35-50 residues - Cys - 2 residues - His). Other universal features include the location of the domain at the N-termini of proteins, its size of about 90 residues, a C-terminal AVPTIF box and several other conserved residues. Orthologues of the human THAP domain have been identified in other vertebrates and probably worms and flies, but not in other eukaryotes or any prokaryotes [1].
Hmmscan Out: # of c-Evalue i-Evalue score bias hmm coord from hmm coord to ali coord from ali coord to env coord from env coord to acc

1 29 6.9 5.4e+03 -1.7 2.5 49 62 366 383 347 417 0.63

2 29 3e-15 2.4e-12 47.5 3.7 1 86 592 664 592 665 0.86

3 29 6.6e-15 5.3e-12 46.4 4.8 1 87 692 761 692 761 0.83

4 29 3.2e-15 2.5e-12 47.4 0.2 1 87 783 855 783 855 0.85

5 29 3.1e-16 2.4e-13 50.7 5.6 1 87 940 1010 940 1010 0.81

6 29 5.3e-14 4.2e-11 43.5 4.3 1 86 1034 1105 1034 1106 0.81

7 29 7.4e-13 5.9e-10 39.9 0.4 1 87 1141 1209 1141 1209 0.79

8 29 1.3e-10 1.1e-07 32.6 1.4 1 86 1250 1319 1250 1320 0.76

9 29 2.1e-17 1.7e-14 54.4 0.5 1 86 1347 1416 1347 1417 0.82

10 29 3.2e-12 2.5e-09 37.8 1.1 1 86 1438 1507 1438 1508 0.79

11 29 1.6e-15 1.3e-12 48.4 1.5 1 86 1535 1606 1535 1607 0.85

12 29 6.9e-14 5.5e-11 43.2 3.1 1 87 1670 1740 1670 1740 0.83

13 29 3.4e-12 2.7e-09 37.8 0.1 1 86 1762 1830 1762 1831 0.82

14 29 1.3e-13 1e-10 42.3 2.6 1 87 1932 2001 1932 2001 0.82

15 29 2.3e-11 1.8e-08 35.1 2.2 1 85 2065 2128 2065 2130 0.83

16 29 0.0001 0.081 13.8 0.2 1 59 2160 2212 2160 2234 0.77

17 29 4.7e-13 3.7e-10 40.5 1.0 1 86 2250 2319 2250 2320 0.85

18 29 5e-12 4e-09 37.2 0.4 1 86 2352 2419 2352 2420 0.78

19 29 5.7e-11 4.5e-08 33.8 0.3 1 86 2446 2515 2446 2516 0.79

20 29 1.2e-12 9.8e-10 39.2 0.9 1 86 2537 2602 2537 2603 0.78

21 29 2.4e-12 1.9e-09 38.2 0.1 1 63 2631 2691 2631 2706 0.76

22 29 0.00015 0.12 13.2 0.4 1 58 2744 2795 2744 2821 0.76

23 29 1.8e-14 1.4e-11 45.0 1.0 1 87 2834 2908 2834 2908 0.82

24 29 2.7e-14 2.2e-11 44.5 1.1 1 87 3028 3099 3028 3099 0.79

25 29 3.4e-13 2.7e-10 40.9 3.7 1 87 3171 3242 3171 3242 0.80

26 29 3.2e-13 2.5e-10 41.0 2.8 1 86 3401 3469 3401 3470 0.79

27 29 4.4e-15 3.5e-12 47.0 1.5 1 87 3492 3562 3492 3562 0.86

28 29 6.7e-07 0.00053 20.8 0.3 1 58 3603 3651 3603 3659 0.89

29 29 3e-12 2.4e-09 37.9 0.4 2 87 3659 3729 3656 3729 0.80

#	of	c-Evalue	i-Evalue	score	bias	hmm coord from	hmm coord to	ali coord from	ali coord to	env coord from	env coord to	acc
1	29	6.9	5.4e+03	-1.7	2.5	49	62	366	383	347	417	0.63
2	29	3e-15	2.4e-12	47.5	3.7	1	86	592	664	592	665	0.86
3	29	6.6e-15	5.3e-12	46.4	4.8	1	87	692	761	692	761	0.83
4	29	3.2e-15	2.5e-12	47.4	0.2	1	87	783	855	783	855	0.85
5	29	3.1e-16	2.4e-13	50.7	5.6	1	87	940	1010	940	1010	0.81
6	29	5.3e-14	4.2e-11	43.5	4.3	1	86	1034	1105	1034	1106	0.81
7	29	7.4e-13	5.9e-10	39.9	0.4	1	87	1141	1209	1141	1209	0.79
8	29	1.3e-10	1.1e-07	32.6	1.4	1	86	1250	1319	1250	1320	0.76
9	29	2.1e-17	1.7e-14	54.4	0.5	1	86	1347	1416	1347	1417	0.82
10	29	3.2e-12	2.5e-09	37.8	1.1	1	86	1438	1507	1438	1508	0.79
11	29	1.6e-15	1.3e-12	48.4	1.5	1	86	1535	1606	1535	1607	0.85
12	29	6.9e-14	5.5e-11	43.2	3.1	1	87	1670	1740	1670	1740	0.83
13	29	3.4e-12	2.7e-09	37.8	0.1	1	86	1762	1830	1762	1831	0.82
14	29	1.3e-13	1e-10	42.3	2.6	1	87	1932	2001	1932	2001	0.82
15	29	2.3e-11	1.8e-08	35.1	2.2	1	85	2065	2128	2065	2130	0.83
16	29	0.0001	0.081	13.8	0.2	1	59	2160	2212	2160	2234	0.77
17	29	4.7e-13	3.7e-10	40.5	1.0	1	86	2250	2319	2250	2320	0.85
18	29	5e-12	4e-09	37.2	0.4	1	86	2352	2419	2352	2420	0.78
19	29	5.7e-11	4.5e-08	33.8	0.3	1	86	2446	2515	2446	2516	0.79
20	29	1.2e-12	9.8e-10	39.2	0.9	1	86	2537	2602	2537	2603	0.78
21	29	2.4e-12	1.9e-09	38.2	0.1	1	63	2631	2691	2631	2706	0.76
22	29	0.00015	0.12	13.2	0.4	1	58	2744	2795	2744	2821	0.76
23	29	1.8e-14	1.4e-11	45.0	1.0	1	87	2834	2908	2834	2908	0.82
24	29	2.7e-14	2.2e-11	44.5	1.1	1	87	3028	3099	3028	3099	0.79
25	29	3.4e-13	2.7e-10	40.9	3.7	1	87	3171	3242	3171	3242	0.80
26	29	3.2e-13	2.5e-10	41.0	2.8	1	86	3401	3469	3401	3470	0.79
27	29	4.4e-15	3.5e-12	47.0	1.5	1	87	3492	3562	3492	3562	0.86
28	29	6.7e-07	0.00053	20.8	0.3	1	58	3603	3651	3603	3659	0.89
29	29	3e-12	2.4e-09	37.9	0.4	2	87	3659	3729	3656	3729	0.80

Sequence Information

Coding Sequence: ATGTCACAGCAACATCACCCGCACAACCACTaccatcaacagcagcagcaacaacaacaaacacaacaacaccATCATCAACATCTTGCGCATCAGCAAAATCAACACAAActacaacataaacaaatacagCACAGTTGGTACTCACATGTTGCTTCCTACCCACCGCACGCAACGGCCTTTTCGACGTCCTCGCCCTGCAAAAGTAATGTTAATATGAATGCATATGGCGCGGCGGCGTCCAGCACGCATGCATATTACGGCGGCAACAGTATTGGTGGTGGGGCCAGCAGCGTCGGCGTTGGGATCCCAGGCGGCGTCGGTGGTATGAGTGGAGTCAATGTCAATGCTGGCGGGCATAACATGGCCTATAACCTTGAGACCACAGCCGCAAATACTGTTGCTTATGCACACAATCAATTGCTGAAttaccaacagcagcagcaacagcagcatcttcatcatcaacaacaacaacagcaacaacatcagcaagTTCAACAACATAGTCAGCGTGCTTATATGCAGCACGGACTTATGCACGGACCAACATATCCTCCTTATATTAAAAGCGAGCCCATGGAAGTACCCAGTGAAAGGCTAAGGCATCAGCAACATTTCCAGCCGCCCAATCCAATGGCACCGCCGCCAGCACCCGCCACTCGCTTGGATgccagcggcggcagcggaAGCGATATGATTATAAAATcgGAACCAATGGATGAACATGCTTTTAAATCCAGCTTTATTGATGATAATACGCCATTTGCAGATTTTAGCAAGTTTCCCGAGTTTAATCAGGACGTGTTAAGCCCCAAAGTGGAGCTAACTGTTAAAGACGATTCTTATAACAATTCCAGCCAAAAGCATGCGCTTAATTTTCCGCGCCGTAAAATGCAAACGGAACGCTCTGAAAGCCTTCCACCCATTTGCCAGCGCTGCAAGGAAGTCTTCTTTAAGAAACAAACCTATCTACGTCACGTAGCCGAGAGTAGCTGCAGCATAAACGAATATGAGTTCAAGTGCGGTATTTGTCCTATGTCTTTTATGAGCGGTGAAGAATTGAAAAAGCACAAGCAACTGCACCGATTCAACAAATTCTTTTGCCACAAGTACTGCGGCAAACATTTTGATACAATTGAGGAGTGCGAGTCCCATGAATATATGCAGCACGAGTACGAGACCTTCGTGTGCAATATGTGCTCCAGTAACTTTACCTCGCGTGATCAGCTGTACGCACATTTGCCTCAGCACAAATTTCAGTCTCGCTACGATTGTCCTGTGTGTCGTTTGTGGTATCAAACGCCGCTGGAACTCCACGAACATCGTCTGGCTGCACCATATTTTTGTGGCAAGTACTATGCCGGCGTTGGCATGAACAACGTCGGATCGCAGTCAAATATTGTCCCACAGCATCAggcacaacagcagcaacagcaatcaaACTACAAACTGCAGGATTGCCGTATGGGCACCATTGAAATGTCTACACCACATCACAAATCCTCCACAACATCGGCTAACACGCTTCCTGCAACGGCTGCACTCAGTTCGTTACTACAACAGCGACAAGCCAATGCGGATAGCACAACTCTTTTTGGGCCGCTCAAAACAGATGTCAAGCTAGAGCGCAGCTATAGCAATTCAACCAGCGAGTCCTCATATAATAGCATGCAAGATAGCAGCTATAATAATGCCTTTGGTAGCGACACATCGCTGCTAGGCGGTCAGTCAGCACACTCATCTACTCTTGATGACTCGGATGATGCACTGTGTTGCGTGCCATTGTGTGGAGTGCGTAAGAGCACTAGTCCAACGCTGCAGTTCTTTACTTTTCCCAAGGATGAAAAGTATTTGCATCAGTGGCTCCACAATCTCAAGATGTTTCACATTCCAGCCTCTACATATATGAGCTACCGTATTTGCAGCATGCATTTTCCCAAACGGTGCATTAATCGCTATTCACTGTGCTACTGGGCAGTGCCAACTTTTAATCTAGGCCATGACGATGTGGCCAATTTGTATCAGAATCGCGAGCTCACCAACACCTTCACAGCTGGTGAGGTGGCACGTTGTAGTATGCCCAATTGCAATAGCCAAAGGGGCgaaagcaatttaaagttttataattttcccAAAGACATCAAGAGCCTGATTAAATGGTGCCAGAATGCACGACTGCCTGTGCAGGCCAAGGAGCCGCGCCACTTTTGCAGTCGTCACTTTGAGGAACGCTGCATTGGAAAATTTCGACTGAAACCATGGGCTGTACCCACGCTGCATTTGGGTACACAGTACGGCAAAATTCATGATAATCCCAAGAATCTTTATGTGGAGGAGAAGCGCTGCTGTTTAGCCTTTTGTCGTCGTAGTCGCTCATCGGATTTTAATATGTCGTTATATCGATTTCCCAGAGATGAAGTGCTGCTAAGACGTTGGTGTTATAATCTGCGTTTAGACCCAGGTGTCTATCGCGGCAAGaatcataaaatttgcagCGCACATTTTATTAAGGAGGCCCTTGGCTTACGCAAACTTTCGCCGGGTGCCGTGCCAACTTTGCATTTGGGTCACAACGataactttaatatttacGAGAATGAATTGTGGCCACCACCAACATCAACTGGTACACCTACTCATCAAAATCATCAGCCGAGGAGCTATCAGCGCCACTCGGTGGCTTCGACTTCGTCTTCAACAAGCTCTTCATCGCTGTACATTGAACAGGAATTGAATGCATCCTATCATGGAATGTCAACTACTAGTGGCGGCGGTTCTTCATCCTCACTAAATGTGACCGAGTGCATGGATGTCTGCTGTGTGCCCGGCTGCGAGAGCAAACGCCacaacaatgaaaacattACTTTCCATACCATACCACGCCGTCCGGAACAAATGAGCAAGTGGTGTCATAATCTTAAAATCCCTGAAGAGAAAATGCACAAGGGCATGCGCATATGCAGTCGTCACTTCGAGTCCTACTGCATCGGCGGTTGTATGCGTCCTTTTGCCGTGCCCACTCTTCATTTGGGCCACGATGACGATGATATATATAGGAATCCAGATAAGATTAAAAAGCTCAATATACGCGAGACTTGCTGCGTACAGGTGTGCAAGCGTAATCGAGATCGCGACCATGCCAATCTGCATCGCTTCCCTTCGAATGCCACGCTACTTGCCAAGTGGTGCGCAAATCTGCATAAGCCTGTGCCAGATGGCAGCAAATTGTTTAATGATGCCATTTGCGAGGTGCACTTTGAGGATCGATGTTTGCGTAATAAAAGACTGGAAAAGTGGGCAGTACCTACGCTAGTATTGGGCCATGATGTCGTACCACACATGCTGCCTACTGAAGCGGAAGTTGCCGAGTTCTTTGCTCGTCCAAGTGCGCCGAATAATGGTGAAGAGGAGGGCGAATGTTGCGTGGAGACCTGCAAACGCGATCCAAGTGTGGATGATATTAAGCTCTATCGTCCGCCTGAGGACCAGGAAGTGCTTGCCAAATGGGCGCATAATCTGCAGCTTGATGTTGAGCAGCTGTCCGGCCTGAGGATATGTAACCTGCACTTTGAATCGCATTGTATTGGAAAGCGCATGCGTCCATGGGCCATACCCACTCTAAATCTAGCCAATAACATTGAGAATCTCTATGAAAATCCCGAAAACAACATGCTTTATGTGCGCAAGCAGCGACGTTTTCTTTCTACAGATACAGGCATGGCAAAGCCCACTTGGGTGCCTCGCTGCTGTTTACCGCACTGTCGTAAAGTACGTGCCATACACAATGTTCAGCTCTATCGTTTTCCCAAAATCAATCGCGCTACGCTGGCCAAGTGGGCGCATAATCTGCAAGTCCCATTGCTGGGCAGCGCTCAGCGTCGTGTGTGCTCCGCACACTTTGAACCGCACGTTCTGAGCAAGAAATGTCCCGTGCCATTGGCGGTGCCTACGCTGGATTTGAACACACCAACCGGCCATAAAATCTACCAAAATCCAGCCAAGCTAAAAGCAAGCAAGCTATGTTTACAGCGCGTTTGTATTGTGGAAGGCTGTCGTCGGCAGCGGGTACATGGCGTTCAGCTTTTCCGTTTTCCACATAACACCGCACAGTTACGCAAATGGTTGCACAATATCAAGCAGCGACCCAAGGGCGGCATGCGTAATCAGTTTCGCATCTGTTCTAAACACTTTGAGTCGCATTCATTCAATGGCAAGCGGCTCAGCGCAGGCGCCATACCAACACTTGAGCTGGGGCACGACGATGACGACCTTTATCCAAATGAGGTGCAGTCCTTTGTGGAAGAGCACTGCGTCGTGGATGGCTGCGACGCTTCGAAGGATCAGCCGGAAGTAAGGCTTTTCAAATTTCCGACGGATGACGAAGATTTGTTGTGGAAATGGtgtaataatttgaaaatgaacCCTGTCGATTGTGTGGGTGTACGTATATGCAATAAGCACTTCGATGCGGACTGCATTGGGCCCAAGCATTTGTTCAAATGGGCCATACCCACTCTGGAACTGGGCCACGATGATGCGCAAATTGAGCTGATTCTGAATCCGAAACCGGAGGAGCGCTATTTGGATCCCATATTCAAATGTTGTGTGCCCACCTGTGGCAAAACGCGCAAGTTCGATGAGGTGCAAATGAACAGTTTTCCCAAAGATCCAACGCTTTTCGAGAGGTGGCGCCATAATCTTAAATTGGAGCATTTGAACTTTAAAGAACGCGAGCgctataaaatttgcaatgatCATTTTGAAGATATTTGCATCGGCAAAACTAGACTTAATATAGGCGCCATACCTACGCTTGAGCTGGGCCACGATGAGATCGAAGATCTCTATCAAGTAAATCCCGAGGAGCTGCAAAGCAATTTATTTGGACGTCCGCGTCGCATACACGAACTAAACGTGTTACCCAAGACTGAAGACACCATATCGGAGGCTACTGATATGAATACTTGCCAAGTTAAGATTAAAAAGAGCTTAACCGAGTTAAAATGCTGTGTAGAGAGCTGCGGTAAAACTCGTCTGGAGCATGGCGTACGTCTCATTGCCTTTCCTTCTACCAAACAGCAGCAGAATAAATGGCGCCATAATTTGAACCTTAGTCCAGGGGAGATGGACAAGAACACGCGCGTTTGCAGTTCACATTTCAACAAACGTTGCTTTGATGGCAAACAACTCCGTAGTTGGGCTATGCCCACGCTGCACTTGGGTCACCAGCAGCCCATTTATGAGAATCCAAAGAATATACCAGGCTTTTTTACGCCCACCTGCGCTTTGGAGCACTGCCGCAAACGACGCAGCATTGATAATGATTTGCGTACCTACCGTTATCCAAGAAACGAAGAGCTGCTGGAGAAATGGCGCATCAATTTGAGATTAGAGCCTTCGCAATGTCGCGGTCGTATTTGTGCTGATCACTTTGAGCCATTGGTAAGAGGTAAGCTGAAGCTGAAGACGGGTGCGGTGCCTACGCTTAAGCTAGGTCATGATGGTGATGTCATTTATAACAACGAGGCTATTAAGGCAAGCTTAGAGGTGGATGAAGACATTAGCTTAGAGTCAAGTGAGCAACCCAAGAGTGAGCACCCATACGAGGAAGatattgatgatgatgatgagccgTATCATAATTCAGCTTACTTCGATCCCATGGAACTGGTAGAAACCTTTGCGGAACAGCAAAACAGCGATGAGGAGCACAACGTGCCTTCTGAAACACGACACCTGCCTAATGTTACAATTAAACGCGAAAAACCCGCTAATAATGTTACGCCCATTTGTTGCCTAAAGCATTGTCGCAAGGAAAGAACTGCCACTCATCATTTGAGCACTTTTGGCTTTCCCAAGGATCAAAATATACTGCTTAAGTGGTGCGCCAATTTGCATTTGGAGCCATCTGACTGCATTGGACGTGTGTGCATTGAACACTTTGATCCCGAGGTGTTGGGCAGTCGCAAGTTAAAGCAAAATGCTGTGCCTACCATTAATGTGGGCCACGATGATCCTCTGCCATATGCACACAATGGCGTGGAACTGCACTTGGAGCAATATGATGAACAACCTCAGCATTCGGTTTTTCGGCTTTCCAGCCTGAAACACTGTCGCAAACGGAAAGACAGCGAACCACCAGATCCAGAGACTGACTCTAGTTACTCCAGCCAAGAGTTTAAGATCTGTTGCTCAGTATTAAATTGTGGCAGAGACGATGTTCGTCTGGTACGTTTGCCAAAGTCACGCATGCTGCAACGGAAATGGCTACATAATCTACAGCTAATTGATTCCCTACAGCCACCTAGAATTTGTTTCGAACACTTTGAGCCGCACtgctttcaaaatgaaaactgtCTCAAGCCTGATGCTGTGCCAACCAGAAAACTTGGGCACAAGAATACTAACATCTACCGCAACAGAGTAGGAAAGCCAAAGCTTGTACTAGCCAATAGAAATGCTCTTGTGAGAAGCTGCATGTTACCCAACTGTCGTTATTCACGTGCTTACAATTGTCAATATTATGCGCTTCCGATGCACGCGGCTTTACGAAATTGTTGGCTTGAACACTTAAAACTCAATGAACCGGGACTCTATAAACTTAGTGTTGGGCTTTGTTCAATACACTATTTACAGTGTTATGAGCAGACAACTATTCCTAGTACTTTGCCTGAATCTGAAAGACTAAAGCTGTGGAAAAACCATACAATCATTGTAAGTACTCCAACCGCTCAgacgctgcgctgcgctgtaCCGGGCTGTTTTACCGTGGTAACAGACAATGTACGGCTTATCAGCTTGCCACAGTCTAGTGATCAGTGCACAAAGTGGctagaaaataccaaaattgaTTATGTTGCTCGCCGCCACAATTTCTATCGCATTTGCCAACTACACTTTGAGCCGCATTGCTTGGGTATTAGGCGTATTAAGAACTGGGCAGTGCCAACTCTGCAGCTGAATCATGATGATAAAATCCATGAAAATCCGATAGCCAACGAACCTGAAACATTGACTTTGACCAGCGCTCTTAAGACTGCATCCAAAATTTGCTGCATATACATTTGTAGACAGCAAGCCGATAAAAATACAAAGCTTTATCCGTTTCCCGCTACTGAAGTTATGCTACAAAAGTGGattgtaaacacaaaacaaatcatGGCGGAGTccacaaatttgcatatatgcgaGGATCATTTTGATGTTGCTTGCCTTGGCCAGGAAAGTCTGCCTCAATGGGCCGTGCCCACGTTGGAACTTGGACACAATGATTATATCGTTAAGAATAGGCATCCAGATAATAAAGAGCTCAGTTACATACTGGCCAACTACTGCTCGGTGACGCGTTGTTTTCAGAAAAGCAGCGAACGGTTGCGTCTATACGCATATCCAACAGATCATAGCGTACAACTTAAATGGAGCGCAAATTGCGGGCATAGCCTGAACCAGGTTTATAGCGGTGCTAAGGTATGCCAAAGGCATTTTGCAGCAGATTGCTTTGATGAAAACGACGAGCTTTATGAGGGCGCTGTGCCCACTATTGAAGTAAGTGTGGACCCAACTGAGCTGCAGCAGAGCGATTGGTTCAATAAGCCCCTTTATAAATGCGCAGTACAACAGTGCAATAGTAAAGCTAAACGCCACTATCCATTCCCCGAAAACGAGGAGCTGCGAAGTAATTGGATTCACAACTTGGGCTTGGACTTGGTCGAAACTAAAGATATGCGCATATGCCAGCGACACTTTGAATCGCGATGCTTTCATGAAGGGCAAGAGCTACATGACGGCTCAATACCCACACTGCAGCTGGGCAATGAGTCGCTTAAAGAGGAAGACATTATACGAATGCCGGAAACTTTTCCGCAGACTATAGAGAATGGAGTAAGATGTTGTGTGCCTGGCTGCGGCAAAACTGAGGAGGATGACGTGTACTTAAGCAGTTTTCCTAAAATGCCTTGGTTGGGTAAACAATGGCTTGAGAATATTCGTCTCGAAGGGACCCTCCATGATACGTCGCTGTACAAATGTTCTTGGAAAGTATGCAGCAGACATTTTGAGGCTAATACCCTTCAAGCCCATGGTGTACCAGTTTTTGGAGCGATACCCACATTACTTTTAGGCCACCAAGACGAAGACATTCACTATAATGATGAGCAACTTTTGGGAGCTCGTCGCAAGGGACATCAAGCTGGTACGACTTCGGCTAGATATAATGAGTTCAATTACTGCTGCTATCCAAAGTGCTGCGAATTTGATGGCCAGCTTGCAGTAAATTCCGCTTATCCATTTCCCGAGTCAAAGCAGCTGCGGGATTTGTGGTTTCAGGCCATGGGTGATGATATAGTTCCACAAAAAGAACTTAAGCTTTGCCCAGTGCATTATGTGTTTCTGTATGGACACAGTTTCGATAGCTTTCCCGAACATGCGGCCGAAGATCACCAATTGCggaaaaattttatacaagcCAAAACTCATAATAGAGTGCGCATGAGCAGCTGCGCTGTACCAGGCTGCAAAAGTATAAGAATGCGAGGGGCAGATAACGTTAAGCTGCATCAGTTGCCGCAACAGCCAAATAAGTTACGAAAATGGCTTAGGAATACTCAGATGGAGGTTATTGAGGCTCAGCGCTATATGTTCAAGGTGTGTGATAAACATTTCGAAGAACGTTGCTTCTTAACGCCGAGGCGCCTAAAGTCTTGGAGTCTACCTACGTTAAATCTACCGAAGAGAGATGCCAATGTTAAGCTGTATAAAAATCCCAGTCCGGAGGAACTATATAGGGGCTGTAGCAGTGATAGCGAATCCAGCAATTCTAGGACCGAACCCACGGTGCATGTAGAGCATATTAATTGGGAGCGTGAAGATTCAGAGGTTATATGTGATACACAACCGAGGCCAACGTCTATTGATGATAGCAGCTCTCAACCCATGGAAATGGAAGAGCTTGAAGTATTGTTGGAAGTGGGTCATGTGGAAAAATTCGAAAGCTATGAACACTTTGACACTGGACCTCCTGAAGAGCCTACGACAAGTTATTTCGGTGCACCTAAACTCAATCAGTTCACTGCGACACGATGCTGTGTATATGGCTGTGATGTAACCATACGCGATGGGGATGTTAAGCTACACAAGTTTCCACAACCAAAAGGAATACTGCGCAAATGGATGCATAATACTCAGGTGGAGGTGGACACCAAATACTTCTGGCGCTATCGCATATGCAGCCATCATTTTGAACGTGAGTGCTTCAATGGCTACCGTTTTCGGTTGGGAACCGTGCCTACACTACATCTTGGATCTCGTAGACCACCGAAAATCTATCAAAATGAGTTTTCAGTGCTAGCGAAATCCGAGCAGCATATAGAAGAACCCGAACTATTAGAAGACTCATACGAGGAGTCGTTAGAAGAAACATTCGAAGAGCCAGTTGAAGAGCTGTTAGAGGATTCATTAGTAGAAGTAGAGCCAGCCTACGGGAAAAGGACTCGAAAGTCCACGAAATATTGCCAAATAGAAGGCTGCTATAATCATTTACATACTCCCAACGTaactttacataaatttcCAGTCTCGCCGGGACAATGCCGTAAGTGGATACATAATACACAGGTTCCTTTCGAGGCGGAGTACCGTTGGCGTTTTCGTATATGCAGCGAACATTTCCATCCGTTCTGTTTAACGACCAAGCGCCTACTTCAAGGTAGCGTGCCCACACTAAACCTGGGGCCCAATGCACCGGCACGACTGTACGACAATGGTTTTCAGATGAAAGATGTGCAATTCGATAAGAAGatgccacaaacaaaaatggatGTATATGATGATGATAGTTATCATAGCAATGATACTGACTTTGACAAGGAAAGTTTCATGGAAATGCATGAAATTGAGCCGGAATTGGTGCTGGGATCCAGTGGGCCGGCGCATACATATGATAATAGTTTTCAGTCCATTGATATGCACTATGATGAAGAGAATTCCACAGAATTGCGTGATAATTCGTCAGAATGGGAGGATGAACAGGATGAcgaagaagatgatgatgatgatatgcAGCTCCTAGTACCTGAGTTACAGCTGGAGGTACAGGATAATGAACTATGTTTTGCTAATGACCTAACACACAGCCAAAATGGACAGCGCAAGCAGCATGAGGGCGTTCCTTACAATGAGGTCAAGTTTGGCTTTGGAAAATGCTCTCTAGTGCATTGTCAGAAGCAGAGAGACCAACATGGCGTGCTTTTATTCAAGTTTCCCAAGTCTAAGCTGTTCCAAGAGCGGTGGATGCATAATCTGAACATTCAGTTCGATGAACAGCGTCCCTATTTGATATGCAGTGAGCATTTTGAGAGACGGTGCATAGACGAACAGAAGCTGAAAGAGTGGGCAGTACCAACGCTGCAGCTGGGTGAAAATGTTCGCGagattttatttcaaaataaagtcaaaaaaagGATGATAAAAACTTGTTGTCTGAAGTACTGCGGTAGGCAACGAGACCAAAACATTAAGCTCTTCCGGTTGCCCAACAATCGCTGCATGCTTAAAAAGTGGGAAAAAGCTACAGGCATGACCTTCAACGAATCTCAGCGCAACACCAAGCTCGTCTGTAGTCGTCATTTTGACCCGCAGCTGATTGGTGTACGACGATTGTCCAAAAACGCGGTTCCCACGTTGAACCTGGGCTTTATGCAAGGTGCATCCGAGCAAATTGAGATTCGTCAACCTGATgttaaaaaagctaaaatcaaACCATCTAAGTATCCCCTAACTGAAGACAAACCAGCTCAGCCGCCAAGGTGTTGCATGCCCAATTGCATGCCTGACTCTAATGTGCACCTATACAAGTTTCCCTATGaCTATGATCTACTGCGTCAATGGTGCCAGGGCCTGAAGTTTAACGATGTTGTAAGCTTTCGCGGGAAGTACATTTGTGCCAATCACCTTCCTGTCAAACCGGAAATCTGCGCTGTTTGTGGAAAGAATGACTTGCAGCTCCCGCTACTTATCTTTCCCGGTAATCGGAATGTGCGTTACAAATGGTGCCACAACTTAAAAATCGATAACATTTCCAAGTGGGACTTCTCGCGTCACATTTGCTCTAAgcattttgaagattattgCTTTTCAACGGCTGATGGAGAGAGAAGTCTGCTCAAGGATGCCGTGCCCACCTTGCATTTAAAGCACATGGATGTAAACATATTCCAAAATGATCAAATACTAGTGACAAAAATGAATATGGAACCTTTCGAAAGCGAAGTCCTGCTCCCGTAG
Protein Sequence: MSQQHHPHNHYHQQQQQQQQTQQHHHQHLAHQQNQHKLQHKQIQHSWYSHVASYPPHATAFSTSSPCKSNVNMNAYGAAASSTHAYYGGNSIGGGASSVGVGIPGGVGGMSGVNVNAGGHNMAYNLETTAANTVAYAHNQLLNYQQQQQQQHLHHQQQQQQQHQQVQQHSQRAYMQHGLMHGPTYPPYIKSEPMEVPSERLRHQQHFQPPNPMAPPPAPATRLDASGGSGSDMIIKSEPMDEHAFKSSFIDDNTPFADFSKFPEFNQDVLSPKVELTVKDDSYNNSSQKHALNFPRRKMQTERSESLPPICQRCKEVFFKKQTYLRHVAESSCSINEYEFKCGICPMSFMSGEELKKHKQLHRFNKFFCHKYCGKHFDTIEECESHEYMQHEYETFVCNMCSSNFTSRDQLYAHLPQHKFQSRYDCPVCRLWYQTPLELHEHRLAAPYFCGKYYAGVGMNNVGSQSNIVPQHQAQQQQQQSNYKLQDCRMGTIEMSTPHHKSSTTSANTLPATAALSSLLQQRQANADSTTLFGPLKTDVKLERSYSNSTSESSYNSMQDSSYNNAFGSDTSLLGGQSAHSSTLDDSDDALCCVPLCGVRKSTSPTLQFFTFPKDEKYLHQWLHNLKMFHIPASTYMSYRICSMHFPKRCINRYSLCYWAVPTFNLGHDDVANLYQNRELTNTFTAGEVARCSMPNCNSQRGESNLKFYNFPKDIKSLIKWCQNARLPVQAKEPRHFCSRHFEERCIGKFRLKPWAVPTLHLGTQYGKIHDNPKNLYVEEKRCCLAFCRRSRSSDFNMSLYRFPRDEVLLRRWCYNLRLDPGVYRGKNHKICSAHFIKEALGLRKLSPGAVPTLHLGHNDNFNIYENELWPPPTSTGTPTHQNHQPRSYQRHSVASTSSSTSSSSLYIEQELNASYHGMSTTSGGGSSSSLNVTECMDVCCVPGCESKRHNNENITFHTIPRRPEQMSKWCHNLKIPEEKMHKGMRICSRHFESYCIGGCMRPFAVPTLHLGHDDDDIYRNPDKIKKLNIRETCCVQVCKRNRDRDHANLHRFPSNATLLAKWCANLHKPVPDGSKLFNDAICEVHFEDRCLRNKRLEKWAVPTLVLGHDVVPHMLPTEAEVAEFFARPSAPNNGEEEGECCVETCKRDPSVDDIKLYRPPEDQEVLAKWAHNLQLDVEQLSGLRICNLHFESHCIGKRMRPWAIPTLNLANNIENLYENPENNMLYVRKQRRFLSTDTGMAKPTWVPRCCLPHCRKVRAIHNVQLYRFPKINRATLAKWAHNLQVPLLGSAQRRVCSAHFEPHVLSKKCPVPLAVPTLDLNTPTGHKIYQNPAKLKASKLCLQRVCIVEGCRRQRVHGVQLFRFPHNTAQLRKWLHNIKQRPKGGMRNQFRICSKHFESHSFNGKRLSAGAIPTLELGHDDDDLYPNEVQSFVEEHCVVDGCDASKDQPEVRLFKFPTDDEDLLWKWCNNLKMNPVDCVGVRICNKHFDADCIGPKHLFKWAIPTLELGHDDAQIELILNPKPEERYLDPIFKCCVPTCGKTRKFDEVQMNSFPKDPTLFERWRHNLKLEHLNFKERERYKICNDHFEDICIGKTRLNIGAIPTLELGHDEIEDLYQVNPEELQSNLFGRPRRIHELNVLPKTEDTISEATDMNTCQVKIKKSLTELKCCVESCGKTRLEHGVRLIAFPSTKQQQNKWRHNLNLSPGEMDKNTRVCSSHFNKRCFDGKQLRSWAMPTLHLGHQQPIYENPKNIPGFFTPTCALEHCRKRRSIDNDLRTYRYPRNEELLEKWRINLRLEPSQCRGRICADHFEPLVRGKLKLKTGAVPTLKLGHDGDVIYNNEAIKASLEVDEDISLESSEQPKSEHPYEEDIDDDDEPYHNSAYFDPMELVETFAEQQNSDEEHNVPSETRHLPNVTIKREKPANNVTPICCLKHCRKERTATHHLSTFGFPKDQNILLKWCANLHLEPSDCIGRVCIEHFDPEVLGSRKLKQNAVPTINVGHDDPLPYAHNGVELHLEQYDEQPQHSVFRLSSLKHCRKRKDSEPPDPETDSSYSSQEFKICCSVLNCGRDDVRLVRLPKSRMLQRKWLHNLQLIDSLQPPRICFEHFEPHCFQNENCLKPDAVPTRKLGHKNTNIYRNRVGKPKLVLANRNALVRSCMLPNCRYSRAYNCQYYALPMHAALRNCWLEHLKLNEPGLYKLSVGLCSIHYLQCYEQTTIPSTLPESERLKLWKNHTIIVSTPTAQTLRCAVPGCFTVVTDNVRLISLPQSSDQCTKWLENTKIDYVARRHNFYRICQLHFEPHCLGIRRIKNWAVPTLQLNHDDKIHENPIANEPETLTLTSALKTASKICCIYICRQQADKNTKLYPFPATEVMLQKWIVNTKQIMAESTNLHICEDHFDVACLGQESLPQWAVPTLELGHNDYIVKNRHPDNKELSYILANYCSVTRCFQKSSERLRLYAYPTDHSVQLKWSANCGHSLNQVYSGAKVCQRHFAADCFDENDELYEGAVPTIEVSVDPTELQQSDWFNKPLYKCAVQQCNSKAKRHYPFPENEELRSNWIHNLGLDLVETKDMRICQRHFESRCFHEGQELHDGSIPTLQLGNESLKEEDIIRMPETFPQTIENGVRCCVPGCGKTEEDDVYLSSFPKMPWLGKQWLENIRLEGTLHDTSLYKCSWKVCSRHFEANTLQAHGVPVFGAIPTLLLGHQDEDIHYNDEQLLGARRKGHQAGTTSARYNEFNYCCYPKCCEFDGQLAVNSAYPFPESKQLRDLWFQAMGDDIVPQKELKLCPVHYVFLYGHSFDSFPEHAAEDHQLRKNFIQAKTHNRVRMSSCAVPGCKSIRMRGADNVKLHQLPQQPNKLRKWLRNTQMEVIEAQRYMFKVCDKHFEERCFLTPRRLKSWSLPTLNLPKRDANVKLYKNPSPEELYRGCSSDSESSNSRTEPTVHVEHINWEREDSEVICDTQPRPTSIDDSSSQPMEMEELEVLLEVGHVEKFESYEHFDTGPPEEPTTSYFGAPKLNQFTATRCCVYGCDVTIRDGDVKLHKFPQPKGILRKWMHNTQVEVDTKYFWRYRICSHHFERECFNGYRFRLGTVPTLHLGSRRPPKIYQNEFSVLAKSEQHIEEPELLEDSYEESLEETFEEPVEELLEDSLVEVEPAYGKRTRKSTKYCQIEGCYNHLHTPNVTLHKFPVSPGQCRKWIHNTQVPFEAEYRWRFRICSEHFHPFCLTTKRLLQGSVPTLNLGPNAPARLYDNGFQMKDVQFDKKMPQTKMDVYDDDSYHSNDTDFDKESFMEMHEIEPELVLGSSGPAHTYDNSFQSIDMHYDEENSTELRDNSSEWEDEQDDEEDDDDDMQLLVPELQLEVQDNELCFANDLTHSQNGQRKQHEGVPYNEVKFGFGKCSLVHCQKQRDQHGVLLFKFPKSKLFQERWMHNLNIQFDEQRPYLICSEHFERRCIDEQKLKEWAVPTLQLGENVREILFQNKVKKRMIKTCCLKYCGRQRDQNIKLFRLPNNRCMLKKWEKATGMTFNESQRNTKLVCSRHFDPQLIGVRRLSKNAVPTLNLGFMQGASEQIEIRQPDVKKAKIKPSKYPLTEDKPAQPPRCCMPNCMPDSNVHLYKFPYDYDLLRQWCQGLKFNDVVSFRGKYICANHLPVKPEICAVCGKNDLQLPLLIFPGNRNVRYKWCHNLKIDNISKWDFSRHICSKHFEDYCFSTADGERSLLKDAVPTLHLKHMDVNIFQNDQILVTKMNMEPFESEVLLP

Similar Transcription Factors

Sequence clustering based on sequence similarity using MMseqs2

100% Identity: iTF_00338371; iTF_00335931; iTF_00339185;
90% Identity: -
80% Identity: -