Basic Information

Insect: Drosophila virilis
Gene Symbol: -
Assembly: GCA_007989325.2
Location: CM017607.2:21811999-21825741[-]

Transcription Factor Domain

TF Family: THAP
Domain: THAP domain
PFAM: PF05485
TF Group: Zinc-Coordinating Group
Description: The THAP domain is a putative DNA-binding domain (DBD) and probably also binds a zinc ion. It features the conserved C2CH architecture (consensus sequence: Cys - 2-4 residues - Cys - 35-50 residues - Cys - 2 residues - His). Other universal features include the location of the domain at the N-termini of proteins, its size of about 90 residues, a C-terminal AVPTIF box and several other conserved residues. Orthologues of the human THAP domain have been identified in other vertebrates and probably worms and flies, but not in other eukaryotes or any prokaryotes [1].
Hmmscan Out: # of c-Evalue i-Evalue score bias hmm coord from hmm coord to ali coord from ali coord to env coord from env coord to acc

1 29 6.9 8e+03 -2.7 3.4 49 64 265 284 246 299 0.55

2 29 5.9e-15 6.9e-12 45.6 4.3 1 86 497 569 497 570 0.85

3 29 3.7e-15 4.3e-12 46.3 4.6 1 87 597 666 597 666 0.83

4 29 8.9e-16 1e-12 48.3 0.4 1 87 688 760 688 760 0.85

5 29 7.8e-16 9.1e-13 48.4 5.7 1 87 857 927 857 927 0.83

6 29 4.8e-15 5.6e-12 45.9 3.1 1 86 951 1022 951 1023 0.82

7 29 7.5e-13 8.8e-10 38.9 0.9 1 87 1058 1126 1058 1126 0.80

8 29 1.1e-10 1.3e-07 31.9 1.2 1 86 1175 1244 1175 1245 0.76

9 29 4e-15 4.7e-12 46.2 0.1 1 86 1272 1341 1272 1342 0.82

10 29 7.2e-14 8.4e-11 42.2 0.8 1 86 1363 1432 1363 1433 0.81

11 29 9.5e-15 1.1e-11 45.0 1.8 1 86 1460 1531 1460 1532 0.86

12 29 2.1e-13 2.5e-10 40.6 1.4 1 85 1604 1672 1604 1674 0.82

13 29 1.1e-12 1.3e-09 38.3 0.1 1 86 1697 1765 1697 1766 0.81

14 29 4.1e-14 4.8e-11 42.9 0.8 1 87 1923 1992 1923 1992 0.80

15 29 4.1e-11 4.9e-08 33.3 0.1 1 62 2047 2106 2047 2124 0.78

16 29 0.008 9.4 6.7 0.1 1 58 2128 2178 2128 2202 0.80

17 29 6e-13 7e-10 39.2 1.6 1 87 2217 2287 2217 2287 0.86

18 29 8.2e-14 9.6e-11 42.0 0.9 1 87 2346 2416 2346 2416 0.82

19 29 1.3e-12 1.6e-09 38.1 0.4 1 86 2451 2522 2451 2523 0.82

20 29 1.5e-12 1.7e-09 37.9 1.7 1 87 2533 2604 2533 2604 0.82

21 29 4e-13 4.6e-10 39.8 0.0 1 86 2627 2697 2627 2698 0.82

22 29 0.00013 0.15 12.5 0.1 1 58 2729 2779 2729 2801 0.82

23 29 6.6e-15 7.8e-12 45.5 0.2 1 86 2818 2890 2818 2891 0.82

24 29 8.6e-14 1e-10 41.9 0.2 1 86 3030 3102 3030 3103 0.84

25 29 2.1e-14 2.4e-11 43.9 1.5 1 86 3168 3238 3168 3239 0.82

26 29 4.5e-14 5.3e-11 42.8 4.5 1 86 3353 3423 3353 3424 0.85

27 29 6.7e-13 7.8e-10 39.0 0.1 1 86 3515 3584 3515 3585 0.84

28 29 1.6e-09 1.8e-06 28.2 1.3 1 58 3602 3650 3602 3663 0.86

29 29 4.4e-08 5.2e-05 23.6 2.8 19 87 3668 3725 3656 3725 0.76

#	of	c-Evalue	i-Evalue	score	bias	hmm coord from	hmm coord to	ali coord from	ali coord to	env coord from	env coord to	acc
1	29	6.9	8e+03	-2.7	3.4	49	64	265	284	246	299	0.55
2	29	5.9e-15	6.9e-12	45.6	4.3	1	86	497	569	497	570	0.85
3	29	3.7e-15	4.3e-12	46.3	4.6	1	87	597	666	597	666	0.83
4	29	8.9e-16	1e-12	48.3	0.4	1	87	688	760	688	760	0.85
5	29	7.8e-16	9.1e-13	48.4	5.7	1	87	857	927	857	927	0.83
6	29	4.8e-15	5.6e-12	45.9	3.1	1	86	951	1022	951	1023	0.82
7	29	7.5e-13	8.8e-10	38.9	0.9	1	87	1058	1126	1058	1126	0.80
8	29	1.1e-10	1.3e-07	31.9	1.2	1	86	1175	1244	1175	1245	0.76
9	29	4e-15	4.7e-12	46.2	0.1	1	86	1272	1341	1272	1342	0.82
10	29	7.2e-14	8.4e-11	42.2	0.8	1	86	1363	1432	1363	1433	0.81
11	29	9.5e-15	1.1e-11	45.0	1.8	1	86	1460	1531	1460	1532	0.86
12	29	2.1e-13	2.5e-10	40.6	1.4	1	85	1604	1672	1604	1674	0.82
13	29	1.1e-12	1.3e-09	38.3	0.1	1	86	1697	1765	1697	1766	0.81
14	29	4.1e-14	4.8e-11	42.9	0.8	1	87	1923	1992	1923	1992	0.80
15	29	4.1e-11	4.9e-08	33.3	0.1	1	62	2047	2106	2047	2124	0.78
16	29	0.008	9.4	6.7	0.1	1	58	2128	2178	2128	2202	0.80
17	29	6e-13	7e-10	39.2	1.6	1	87	2217	2287	2217	2287	0.86
18	29	8.2e-14	9.6e-11	42.0	0.9	1	87	2346	2416	2346	2416	0.82
19	29	1.3e-12	1.6e-09	38.1	0.4	1	86	2451	2522	2451	2523	0.82
20	29	1.5e-12	1.7e-09	37.9	1.7	1	87	2533	2604	2533	2604	0.82
21	29	4e-13	4.6e-10	39.8	0.0	1	86	2627	2697	2627	2698	0.82
22	29	0.00013	0.15	12.5	0.1	1	58	2729	2779	2729	2801	0.82
23	29	6.6e-15	7.8e-12	45.5	0.2	1	86	2818	2890	2818	2891	0.82
24	29	8.6e-14	1e-10	41.9	0.2	1	86	3030	3102	3030	3103	0.84
25	29	2.1e-14	2.4e-11	43.9	1.5	1	86	3168	3238	3168	3239	0.82
26	29	4.5e-14	5.3e-11	42.8	4.5	1	86	3353	3423	3353	3424	0.85
27	29	6.7e-13	7.8e-10	39.0	0.1	1	86	3515	3584	3515	3585	0.84
28	29	1.6e-09	1.8e-06	28.2	1.3	1	58	3602	3650	3602	3663	0.86
29	29	4.4e-08	5.2e-05	23.6	2.8	19	87	3668	3725	3656	3725	0.76

Sequence Information

Coding Sequence: atgaATGCATACGGCACGGGCGCTGCCAGCGCGCACTATTATGGCGCTGCTCCTACTGCTGCCACTGCGGCTGGAGCTGGGGCTGGGGTGGGGTATAACCTTGAGGCCAATACTGTGGCCTATGCGCACAACCAGCTGCTgcaataccaacaacaacaacagcagcagcagcaacagctcagtCAACGCTCGTATATGCCGCACAGTTTAATGCATGGCTCGTATCCTTATATCAAGAGCGAGCCATTGGAGCTGCCAGATGATAGacaacgccagcaacaacatcaacagcaacaccagcagcagcagcaacaacaacaacaacaacatttccaGAATCCAATGGCCCCGCCACCAGCGCCCGCCCTCAATCGTCACACGCTCGATGCTAGCGGTGAaatgataataaaatCGGAACCCATTGACGAACATGCGTTCAAGTCCAACTATATCGATGACAACACGCCCTTTGCCGATTTTAGTAAATTTTCCGAGTTTGGCGACGACATGCTAAGTCCCAAGGTTGAGCTAACGATTAAGGACGAGGCTTATGGCAGCCAAAAGaaccCGCTCAGCTATCCGCGCCGCAAGCTGCAAACGGAGCGATCTTCGGAAAGTTTGCCCATTTGCCAACGCTGCAAGGAGGTCTTCTTTAAGAAGCAGGTCTATCTGCGTCATGTGGCCGAGAGCAGCTGTATCATACAAGAGTATGAATTCAAGTGCAACATCTGCCCTATGTCGTTCATGGGCGCTGAGGAGCTGCAGAAGCACAAGCAACTGCATCGCGCTGACAAGTTCTTTTGCCACAAATACTGTGGCAAGCACTTCGACAACATCGCCGAATGCGAGTCGCATGAGTATATGCAGCATGAATACGATAGCTTTGTGTGCAATATGTGCTCTGTAACGTTTTCAACGCGGGAACAGCTTTACGCTCATCTGCCGCAGCACAAGTTTCAGCAGCGTTACGATTGCCCTATTTGCCGCTTGTGGTATCAAACGGCACTAGAGTTGCACGAGCATCGACTGGCGGCGCCCTACTTTTGTGGCAAGTATTATCCAGCagcacatcagcagcagcagcagcaacaacaacaacaacaacaacaacaacatgcacagcagcaacacccacagcagcagcaaggcaactacaaactgcaggaCTGCCACATGGGCACCATAGAAATGACAGCAACGCAGCACAAGACAAATGCCTTGCCCGCAACGGCGGCGCTTAGTTccttgctgcagcagcgccaggCGAATGCGGATGGTGCCGCGCTGTATGCTTCGACGCTGAAGAGCGAGGCTAATGTGAAGTTGGAGCGCAGCTATAGCAACTCCACCAGCGAGTCTGGTTACAGTCTGCACGAGAGTAGTTATAATAATGCCTACGGCAGCGATAATTCGTTGCATGGTGGCAGCGCAGCAATTGGTGGCCCGCAGGCACACTCCTCCACGCTGGACGAATCGGAGGATGCGCTGTGCTGTGTGCCGCTGTGCGGTGTGCGCAAGAGCACCAGTCCCACGCTGCAATTCTTTACATTTCCCAAGGATGAAAAGTATCTGCATCAGTGGCTGCACAATCTCAAAATGTTCCATATTCCGGCCTCAAGCTATGCCAGCTTTCGTATCTGCAGTATGCATTTTCCTAAGCGATGCATCAATCGTTATTCGTTGTGTTATTGGGCGGTGCCCACATTCAACCTGGGTCACGATGATGTAGCCAATCTGTACCAGAATCGTGAGCTGACTAACACCTTCACCACCGGCGAGGTGGCGCGCTGCAGCATGCCCAACTGCACCAGCCAACGCGGCGAGAGCAATCtcaagttttataattttcctaAGGACATCAAGAGCCTGATCAAGTGGTGCCAGAATGCACGTTTACCCGTCCAGGCCAAGGAGCCGCGACATTTTTGCAGCCGCCATTTCGAGGAGCGCTGCATTGGCAAGTTCCGGCTGAAGCCCTGGGCTGTGCCCACTCTACATCTGGGCGCCCAGTACGGCAAGATTCACGACAATCCTAAGAACCTGTATGTGGAAGAGAAACGCTGCTGCCTCAACTTTTGCCGTCGCAGTCGCTCCTCGGACTTTAACATGTCATTGTATCGCTTTCCCAGAGATGAAGTACTGCTGCGACGCTGGTGCTATAATCTGCGCCTCGATCCGGCTGTCTATCGCGGCAAGAACCACAAAATTTGCAGTGCTCACTTTATCAAGGAAGCTCTCGGATTGCGCAAATTATCACCAGGCGCTGTGCCCACACTGCATCTGGGCCACAATGACACTTTCAACATCTACGAGAATGAATTATGGCCACCACCAACGCCTTCGACGCCCACGCACAATCatcagcagcaattgcagcagcatcaactgcaacagcatcaacagcaactgcagcaacatgtACATCATAAATATCAGCGTCATTCGGCGGCATCCACATCATCGTCGGCCAGCTCGGCCTCGCACTATGTAGATCCAGAGCTGAGTGCATCCTACATGGGCATGAGCGCTTCATCGTCTGGCGTGAATGTCAGCGACAGCATGGACGTGTGCTGTGTGCCAAGCTGCGAGAGCAAACGGCACAACAATGAGAATATCACATTCCATACAATACCCAGGCGGCCAGAGCAGATGCGTAAATGGTGCCACAATCTGAAGATACCCGAGGACAAGATGCACAAGGGCATGCGGATATGCAGTCTACACTTTGAACCCTACTGCATTGGCGGTTGTATGCGACCGTTTGCGGTGCCCACACTGCATCTGGGCCATGATGACGAGGACATTCATCGTAATCCGGATGTGATTAAGAAGCTGAACATACGCGAAACCTGTTGCGTTGCCGTTTGCAAGCGCAATCGCGATCGGGATCATGCCAATCTGCATCGTTTCCCCAGCAATCTCGCCCTTCTGACCAAGTGGTGCGCCAATCTGCAGCGACCCGTACCGGATGGCACCAAACTATTCAATGATGCCATCTGCGAGGTGCACTTTGAGGATCGCTGTCTGCGCAACAAGCGCCTGGAGAAGTGGGCTGTACCCACGCTTGTGCTAGGCCACGAGAATATAGCCTACCCGCTGCCCACGCCCGAGCAGGTCGCCGAGTCCTATGCGCGTCCCAGTGCGCCCAACAATGGCGAGGAACAGGGTGAATGCTGCGTGGAGACCTGTAAGCGTAATCCCAGCGTAGATGACATCAAGCTCTATCGTCCGCCCGAAGAATCGCAGGTGCTTGCCAAATGGGCGCACAATCTGCAGCTGGACATTGCCCAGCTTCCTAGCATGCGAATCTGTAATCTGCACTTTGAATCCCACTGCATTGGCAAACGCATGCGACCCTGGGCCATACCCACCCTCAATTTGGCCAGCAACATTGAGAATCTTTTTGAGAATCCTGAACACCAGATGCTCTACAAGCGTCGCACGCATCTCAACGCGGACAGAGCCGCCGCTCGCAGCGCTGGCGCTGACGCAGCCGCCATGAAGGCCTCTTGGGTGCCACGCTGTTGCCTGCCGCACTGCCGTAAGGTGCGCGCTCTGCACAATGTCCAGTTGTATCGCTTTCCCAAGGTCAATCGCACAACGTTGGCCAAATGGGCGCATAATCTACAAGTGCCGCTGGTCGGCAGCGCCCAAAGGCGTTTATGTTCCGCCCACTTTGAGCCAAATGTGTTGAGCAAGAAATGCCCGGTGCCGCTGGCGGTGCCCACACTGGATCTCAATACGCCACCGGGCTACAAGATTTACCAAAACCCAGCCAAGGTGAGGGCTAACAAGCTGTGTTGGCAGCGCGTCTGCATTGTGGAGAGCTGCCGTCGACAGCGGGCACAGGGCGTACAGCTCTTCCGGCTGCCGCACAGTCGCACCCAGTTGCGCAAGTGGATGCACAATCTTCGCATGCTGCCGAGAGGCGCCATGCGGCAACAGTATCGCATCTGCTCGCTGCACTTTGAGCCGCACTCGTTTAACGGCAAGCGTCTGAGCACAGGAGCAATTCCAACGCTGGAGCTGGGCCATCAGGATGACGATATTTATCCCAATGAGGCGCAGTCGTTTGTTGAGGAACACTGCGCCGTTGAAGGTTGCGATGCATCCAAGGAGCAGCCGGATGTGCGTCTCTTCCGCTTTCCCAACGACGACGAAGATCTGCTCTGGAAATGGTGCAACAATCTCAAAATGAATCCCGTCGACTGCTATGGCATGCGCATCTGCAACAGGCACTTCGAGCCGGACTGCATTGGTCCCAAACACCTGTACAAGTGGGCCATACCCACCTTGGTTCTGGGGCACGATGATGGCCAGATCGAGCTGATACCCAATCCCAAGCCGGAGGAACGTTATGGTGATCCTGTGTTCAAGTGCTGTGTGCCCACCTGCGGCAAAACGCGCAAATTTGATGAGGCGCAAATGAATAGCTTTCCCAAGGACCCATCGCTCTTCCAGCGCTGGCGCCACAATCTTCGCCTGGAACATCTTAACTTCAAGGAGCGCGAGCGTTACAAGATTTGTAATGCGCATTTTGAGGACATTTGCATTGGCAAGACGCGTCTCAATATTGGCTCCATACCCACGCTGGAGCTGGGCCATGAAGAGACCGAAGATCTGTATCAGGTTAATCCCGAGGAGCTGCAGAGCAACTTGTTTGGACGACCGCGACGTGTGCATGAGAATCAGCGACTGAGCATCAAGCAGGAGTTGGATGAGGACATCAAGCCGGACATAACAATGTCAGAGGCCACggacacaaacacaacacagGTGAAGATCAAGAAATCTGTGTTGGACTTGAAGTGCTGTGTGCCCAGCTGTGGTCGCAGCCGGCTGGAGCATGGTGCTCGCCTGTTTCCCTTTCCCActggcaagcagcagcagaccaaGTGGCGACACAATCTCCGCCTTAGCGCCGCCGATGTGGACAGGACAACGCGCGTTTGCAGCGCTCACTTCAATCGACGCTGCATCGATGGCAAACAGCTGCGTGGCTGGGCCATGCCCACACAGCAGCTGGGCCACCAGGAACAAAACATATATGAGAATCCAAAGAATATACCGGGCTTTTTTACGCCCACCTGTGCGCTGGCGCACTGTCGTAAACGACGTAGCATTGACAATGATTTGCGCACCTACCGCTATCCGCGCAACGAGGAGCTGCTCGAGAAATGGCGCGTGAATTTACGTTTGGCGCCAGATCAATGTCGCGGACGCATTTGTGCGGATCACTTTGAGCCCATGGTGCGCGGCAAGCTGAAGCTTAAGACGGGCGCGGTGCCCACGCTGAAACTTGGCCATGATGAGGGCGTAGTCTTTGACAATGAGGCCATTAAAATAGGAATGCAACAGGAGgaggaagaggaggaggaggccgGCAGCTTGGAGTCGCTGGGGAAGATAAAAATTGAGAAGCAGGAGAAGGAAACCCCTGAGCAGGAGTTAGAAaatgaggatgaggatgaagagggcgagcagcagcagaaggtgGAAGATCCTGAAGTTGATATGGAACAGGAACAGGATGAGGAGGAAGAGGAACTGCAGGAGCATGGCTATTTTGATCCCCTCGAGCTAGTGGAAACCTTTGCCGAACACCACAGCGATGACAATTCTGCTGATAATTATCATCTCGATGCtgatgaagatgatgatgatgaagataTACCTGGCAATGATGACGAGCTCCTGCTGCCAGATACTCTTCCAATACAGTTGCCGCCACGCCGCGAAAAGGCGGTAAACAATGTGACGCCTATTTGTTGCTTGAAACATTGCCGCAAGGAGCGCACCGCAAGTCATCAGCTGAGTACTTTTGGTTTTCCCAaagatcagcagcagctgcttaaaTGGAGCGCCAATCTGCAGCTGGATCTCGTCGATTGTGTGGGACGCGTGTGCGTCGAACATTTCGAAGCTGAGATGCTGGGCACACGTAAGCTAAAGCAGAATGCGGTGCCCACATTGAATCTGGGTCATGCCACGCCATTGAGCTATAGCTGCAATGGCCAATCCTTGGGCATATACGATGCACAGCCGCAGCATTCGGTTTTTCGGCTTTGGAGCCTGAAACACTGCCGCAAAAGGAAGCTGCTGACGATGCCTCCGGATCCAGTGACGACTAAGCGACGCTGTTGCCTGCCCAGTTGTGGCAAGGAACCGGAGCTGCATGGCGTTCAATTGAAACGACTGCCCAAGGAtcgactgctgctgcgcaAGTGGCTTCACAATCTAAAGCTACCGGCGCACATGAACACCAGACACGCGTTTCTTTGCGACGAGCACTTTGAGCCACAGGCAACGCTGCCTACCCTGAAGCTGGGCCACGCAGCGAACAACATTTATCGCAATGGCAGCTCGGCTTTATCCAGTGGCTGCCTGGTGCCCAGCTGTCCGTGTGCACGGCTTAATCTATACCGCTGCTATGCTCTGCCCGAGCATCCGCAGGTGCAGCATGCCTGGCTGCAGTGGCTGCaattgccgccgccgcagctggCTAGCCTTGCCCAACTGTGCGTCATGCATTATATGCAGCTGTTTGAGCAGGTGACACTACCCGCGGATCTGCCTGAGTCTGTGCTGCGCCAATTGCAGGAAACCTACGAACAAATATCCAGCTCTAGCATGGCCATGAAACTGCGCTGTGCTGTGCCCGGCTGCTACTCCAAATACACGGACAATGTGCGTCTCACCAAGCTGCCCGTGTGCCCGCGAACCTGCGCCCAATGGGTGcacaatacaaaaattaagtaCGATCCGGAGCGCCATTACATGTATCGCATCTGCATGCGGCACTTTGAGCCGGAATGCCTGGGTGCAGTACGTCCTAAGCTGTGGGCTGTGCCTACGCTGCATCTTAACCATAACGATGCGGATATATATCAGAATACCATGTTGGATAGCTCGGATGCCATGCCGGTAGCCGAGTCTGTACCGCTGGAGTTGCCGCTGCGTATCAAAACAGAAATGCCGCCAACCTTATCAGTCAGTCCCAGTGCCAGTCCCAGTCCACGCGGCAAACTGCGCACCTGTTGCATTTCCACCTGCGGCCAGCAGGGCAATGCCCTAACGCGTCTCTTTCGCTTTCCCAGCGCCGAAACGGCCCTGTTAAAATGGCTGGTGAacacacaacagcagccacgTCTCGTTGATACGCAGAATCTCTTTGTATGCCAGCGTCACTTCGCAGCGGAGGCGATTTGCAAGAAGCAGCTGCAAAGTTGGGCAGTGCCTACGCTAAATCTGGGCCATCAGGGCCACATCATACCGAATGCCAAGCACAATGGCAATATTGCAGATAGCCAGGAAAATAAGCAGGCGCTGCAGTATATCTGGGCCAATTACTGCTCGGTGCTCACCTGCTTCCAACAGCGCAGCGATCTGGTTCGTCTCTATGCCTATCCCACAGATCGGCCCACCATACGCAGGTGGGCAGCCAACTGCAAGCATCGCTCCATGCAGGCCAGCAGCGATGGATTTCAGGTCTGCCAGTCACATTTTACACCAGACTGCTTTGACCCTGATACCGGGGAGCTGAAGGAAGACGCGGTGCCCACACTGGAGCTGAGCCGGCCAGTCAATGAGTTGCGCTGCTTGGTCAATGGCTGCGTTAGGGAGAAGGATGCAGCGCGTTGTCGTTTTTTCAAAGTGCCCAAACGTGCCTCTCAGCTGGAGGACTGGTGTTACAATCTGCGCATCGATGCTGCGTCAATTAGCGGCCAGGAGGTGCACGTGTGTGAACGCCACTTCGAGGCGCACTGTTTCAGTGCGTACAAGCTGCGTCCGGGTGCACGACCTACACTTCATTTGGGTCACGATGATGAGTTGGATTTGTTGCCCAATCCGGCAAAATGGGAGGAGGATGTGAATATATGCTTTGTGCCCAGCTGTGGTCGCTCCAAGGATGTGGATAATGTGGAGCTATTCGGACTGCCCAGGATTAGAGGGGTCTTGGAGAAATGGCTACAAAATTTCCGCCTCGAGCCGAGCAGAGAGCAGTTGCAAGGCATGCGGATATGCAGCGCACATTTCGAGCCCAGCTGCATAGAGAATGGCCGTCTACACTTAGGCTCGGTGCCCACGCTGCAGCTGGGCCACGATGAGTTAGACAGTATACATCAAAGCGCGGAGCTGCCGCAATCGCAGCTTAAAGGCAAACGAATAGCCATGGGCTACGACTGCTGCTATCCACAGtgtatggaacttcagaagaCCTATCAAAGAATCGCATATGAGCTGCCACAGCAGGAGGCATTGCGTAATTTGTGGATGTCGTATCTGGGTCTGGAGCAGCATAATCAGGAACCGCTCAAGCTCTGCCCACTGCACTTGATCATGCTCTATGAACACAGTGTCAACCATTTTCCAGAGCATTCATCAGAGGAGCAGTTGCTGGACGCCAATTACGAGGCTGCGCGAAATAGCGTGCGCATACGAATTATCAGCTGTGCGGTGCGTGGCTGCAGGACACTCAAACCACGTGACGACTACCGCTTGCACGCCATGCCTACGCGTCGGGATGTACTCCAGATGTGGTTAGATAACATGCAGCTTGTGTTCTACGAGCAGCAGCGTTATATGTATAAGGTATGCAGCAGACATTTTGAGGCCATCTGCGTAACAGAGACCACTCGCCGCCTAAAACCCTGGAGCATGCCGACGTTGGAGTTGCCGGAACGTGACCCAGAAGCGCCAGCGTTGCATCAGAATCCTTCGGAGGAGGAGTGGCAGCGCATGAATGAGCAGATAGGCAGCTGCGAGGCAGTGCAGTTGTTAGAGCCCGCGGTCAAGCTGGAGCCGGAGCCAATTGTCAAGCAAGAGCTGCACTCTATTGTCAAGCTGGAACCGAAGCCACAGTCAGAACAGCTGTATGAGGAGGAGTACGAGGCCAATGATCAGCAGCAAGCGCTAGAGGTGCTGCTCGAAGTGGGTCACGTTGAGAAGTGCACCACGTACGAGCAAATGGACACAAAACCAATTATAAGCTATGCCGATACCCTGTCACATAATTCACTGGGCCCAACCACAACAGTGGGCAGTGCCTGTATTGTCGGCAACGGACTCACCTACAGCGCGCGCCACTGCAGCGTGCGGGGTTGCGATGTGACCTCGCTGGATGTTAATGACAGTCTCAAGCTACACAAGTTTCCCACATCGCTGGATGCCATGGAGAAATGGATGCACAACACCCAGGTAAATGTGGACATCAACTTTGCGTGGCGTTTTCGCATctgcagtttgcattttctacCCGAGTGCTTTAATGGCTCGCGTATCAGGCGTGGGGCAATGCCCACGCTGCGTCTGGGATCGCGCCGCCTAGGGGATATCTATGACAATGAGTTCAATGTGCAGCCAGAGCAGACGAGTGTGGATCAGTCGGCTGATGCGTCGGCAGACGCTGTAGTGCCCACCGAACCGCACGATGATGCGACAGAGCTGAATATAAATCTCCATTTGCCCTGCCCCGCACCACCGCGCAAGTCCAGCAAGTTCTGTCAGATCGATGGCTGCTCGAATCATTTGACCAGCGAAAATCTTACGCTGCACAAGTTTCCACACTCGGCGGACATGTGCGCCAAGTGGCAGCACAATACACAGGTGCCGTTCGATCCGGAGTACCGCTGGCGATATCGTATCTGCAGCGCACACTTCGAGCCCATGTGCCTGGGAAACATGCGACTGATGCATGGCAGCGTGCCCACACTGAAACTTGGCGCCCGGGCGCCCAAGCAGCTTTTTGGCAATGACTTTGCGGCGCTTAGTTTGCGCCTGGATAAGGAAAAGCGCAGTGCCGACCAGAGCTTGCCAGTGAAGCAGGAGCAAGTGGATGATGATCAAGAGCAGTATGATCAGGAGCAAGAGGATCTGAGCATGCTCGTACCAGAGTTGCAACTGCTCGAGGGCGACGACGACCAGGAAGACAATCAGTTTAACTACACCAATAGTTGGAGAGAttcgcagcagcaactgcagctacaGCTACGCCTGCCCAGCATTAAGCAGGAAGAGGACACAATCTATAATCCCGTCAAGTCTGGCTATGACAAGTGCTCGCTGGTGCACTGCCAGCGCCAGCGTTCACAGCATGGCGTTCACATCTATAAATTCCCACGCTCGCGGCAGCTACAGCATCGCTGGATGCATAATTTACGTATCAGATATGACGAGCGGCGACCTTGGAAGACTATGATATGTAGTGTACACTTTGAGCCGCACTGCATACGCCTGCGTAAGCTGCGTCCATGGGCGGTACCCACACTGGAGCTGGGCGACAATGTTCCGCAAGATCTGTACAGGAACGAGCAAAGCCAACAGCAGTTTATGCAGCAGCGCAACAGCGACGCGGAAGCGGGCAGTGAGGGCGAGGACTATGATGCGGAGCTGGATGACACCATACTGGAGGAGTGCGACGATGAgtatgatgataatgataatgccgAGCAATTTCCGGCTGAGCCACACATCAAGCGGGAGTATCGCTCACGCTGCGATCCACAGCCGGCGGGTCAGCTGCCACCCTGGAAAATCAAGCAATGCTGTTTGCCCTATTGCCGTCGTCCACGCGGCGATGGCATCAAGCTTTTCCGGCTGCCAAACAATATTAGCGCCATACGTAAATGGGAGCAGGCGACGGGCATGCGCTTCTATGAGTCGCAGCGCAACACAAAACTCATCTGCAGTCGTCACTTTGATCCGCAACTTATTGGTGTGCGTCGTCTTATGTCCAATGCGGTACCCACGCGCAATCTGGCACCGAACAACGAGGAATCCGAGCCGCCAGCGGCAGGTCCACGCTGCTGCATTAAGGATTGCCAACCAGATGGACATGTCAAGCTGCACAAGTTTCCCAGCGATCCCCAGCTGCTGCATCAGTGGTGTCAGGCGCTTAATTTGAGGGATGAGCAGCGCCACGCCGGCAAGTACATTTGTGCCGTGCACCTGCCCACCAAAGCGATGAGCTGTCTCATTTGCGGTGTGGAGGATGTACAGCTACCCCTGCAGGACTTTCCTGAGCATCGCAATCAGCGAGTCAAATGGTGCtacaatttgaaaatcgaACACATCGCCAAGTGGGACAATTCGAAGCACATTTGCTGCAAGCACTTTGAGAGCTATTGCTTCATTAAGCCGGGCCATCTGTTGCCGGACGCCATGCCCACGCTGCATTTAAAGCACAACGACAGCAATATATTCCTCAACGAATCCGTCATAGAGAGCAGCCAGCTGCTGCGCGTCAAGGATGAGCCTATAGAGTGTGAGGATCTAATGCTGTAA
Protein Sequence: MNAYGTGAASAHYYGAAPTAATAAGAGAGVGYNLEANTVAYAHNQLLQYQQQQQQQQQQLSQRSYMPHSLMHGSYPYIKSEPLELPDDRQRQQQHQQQHQQQQQQQQQQHFQNPMAPPPAPALNRHTLDASGEMIIKSEPIDEHAFKSNYIDDNTPFADFSKFSEFGDDMLSPKVELTIKDEAYGSQKNPLSYPRRKLQTERSSESLPICQRCKEVFFKKQVYLRHVAESSCIIQEYEFKCNICPMSFMGAEELQKHKQLHRADKFFCHKYCGKHFDNIAECESHEYMQHEYDSFVCNMCSVTFSTREQLYAHLPQHKFQQRYDCPICRLWYQTALELHEHRLAAPYFCGKYYPAAHQQQQQQQQQQQQQQHAQQQHPQQQQGNYKLQDCHMGTIEMTATQHKTNALPATAALSSLLQQRQANADGAALYASTLKSEANVKLERSYSNSTSESGYSLHESSYNNAYGSDNSLHGGSAAIGGPQAHSSTLDESEDALCCVPLCGVRKSTSPTLQFFTFPKDEKYLHQWLHNLKMFHIPASSYASFRICSMHFPKRCINRYSLCYWAVPTFNLGHDDVANLYQNRELTNTFTTGEVARCSMPNCTSQRGESNLKFYNFPKDIKSLIKWCQNARLPVQAKEPRHFCSRHFEERCIGKFRLKPWAVPTLHLGAQYGKIHDNPKNLYVEEKRCCLNFCRRSRSSDFNMSLYRFPRDEVLLRRWCYNLRLDPAVYRGKNHKICSAHFIKEALGLRKLSPGAVPTLHLGHNDTFNIYENELWPPPTPSTPTHNHQQQLQQHQLQQHQQQLQQHVHHKYQRHSAASTSSSASSASHYVDPELSASYMGMSASSSGVNVSDSMDVCCVPSCESKRHNNENITFHTIPRRPEQMRKWCHNLKIPEDKMHKGMRICSLHFEPYCIGGCMRPFAVPTLHLGHDDEDIHRNPDVIKKLNIRETCCVAVCKRNRDRDHANLHRFPSNLALLTKWCANLQRPVPDGTKLFNDAICEVHFEDRCLRNKRLEKWAVPTLVLGHENIAYPLPTPEQVAESYARPSAPNNGEEQGECCVETCKRNPSVDDIKLYRPPEESQVLAKWAHNLQLDIAQLPSMRICNLHFESHCIGKRMRPWAIPTLNLASNIENLFENPEHQMLYKRRTHLNADRAAARSAGADAAAMKASWVPRCCLPHCRKVRALHNVQLYRFPKVNRTTLAKWAHNLQVPLVGSAQRRLCSAHFEPNVLSKKCPVPLAVPTLDLNTPPGYKIYQNPAKVRANKLCWQRVCIVESCRRQRAQGVQLFRLPHSRTQLRKWMHNLRMLPRGAMRQQYRICSLHFEPHSFNGKRLSTGAIPTLELGHQDDDIYPNEAQSFVEEHCAVEGCDASKEQPDVRLFRFPNDDEDLLWKWCNNLKMNPVDCYGMRICNRHFEPDCIGPKHLYKWAIPTLVLGHDDGQIELIPNPKPEERYGDPVFKCCVPTCGKTRKFDEAQMNSFPKDPSLFQRWRHNLRLEHLNFKERERYKICNAHFEDICIGKTRLNIGSIPTLELGHEETEDLYQVNPEELQSNLFGRPRRVHENQRLSIKQELDEDIKPDITMSEATDTNTTQVKIKKSVLDLKCCVPSCGRSRLEHGARLFPFPTGKQQQTKWRHNLRLSAADVDRTTRVCSAHFNRRCIDGKQLRGWAMPTQQLGHQEQNIYENPKNIPGFFTPTCALAHCRKRRSIDNDLRTYRYPRNEELLEKWRVNLRLAPDQCRGRICADHFEPMVRGKLKLKTGAVPTLKLGHDEGVVFDNEAIKIGMQQEEEEEEEAGSLESLGKIKIEKQEKETPEQELENEDEDEEGEQQQKVEDPEVDMEQEQDEEEEELQEHGYFDPLELVETFAEHHSDDNSADNYHLDADEDDDDEDIPGNDDELLLPDTLPIQLPPRREKAVNNVTPICCLKHCRKERTASHQLSTFGFPKDQQQLLKWSANLQLDLVDCVGRVCVEHFEAEMLGTRKLKQNAVPTLNLGHATPLSYSCNGQSLGIYDAQPQHSVFRLWSLKHCRKRKLLTMPPDPVTTKRRCCLPSCGKEPELHGVQLKRLPKDRLLLRKWLHNLKLPAHMNTRHAFLCDEHFEPQATLPTLKLGHAANNIYRNGSSALSSGCLVPSCPCARLNLYRCYALPEHPQVQHAWLQWLQLPPPQLASLAQLCVMHYMQLFEQVTLPADLPESVLRQLQETYEQISSSSMAMKLRCAVPGCYSKYTDNVRLTKLPVCPRTCAQWVHNTKIKYDPERHYMYRICMRHFEPECLGAVRPKLWAVPTLHLNHNDADIYQNTMLDSSDAMPVAESVPLELPLRIKTEMPPTLSVSPSASPSPRGKLRTCCISTCGQQGNALTRLFRFPSAETALLKWLVNTQQQPRLVDTQNLFVCQRHFAAEAICKKQLQSWAVPTLNLGHQGHIIPNAKHNGNIADSQENKQALQYIWANYCSVLTCFQQRSDLVRLYAYPTDRPTIRRWAANCKHRSMQASSDGFQVCQSHFTPDCFDPDTGELKEDAVPTLELSRPVNELRCLVNGCVREKDAARCRFFKVPKRASQLEDWCYNLRIDAASISGQEVHVCERHFEAHCFSAYKLRPGARPTLHLGHDDELDLLPNPAKWEEDVNICFVPSCGRSKDVDNVELFGLPRIRGVLEKWLQNFRLEPSREQLQGMRICSAHFEPSCIENGRLHLGSVPTLQLGHDELDSIHQSAELPQSQLKGKRIAMGYDCCYPQCMELQKTYQRIAYELPQQEALRNLWMSYLGLEQHNQEPLKLCPLHLIMLYEHSVNHFPEHSSEEQLLDANYEAARNSVRIRIISCAVRGCRTLKPRDDYRLHAMPTRRDVLQMWLDNMQLVFYEQQRYMYKVCSRHFEAICVTETTRRLKPWSMPTLELPERDPEAPALHQNPSEEEWQRMNEQIGSCEAVQLLEPAVKLEPEPIVKQELHSIVKLEPKPQSEQLYEEEYEANDQQQALEVLLEVGHVEKCTTYEQMDTKPIISYADTLSHNSLGPTTTVGSACIVGNGLTYSARHCSVRGCDVTSLDVNDSLKLHKFPTSLDAMEKWMHNTQVNVDINFAWRFRICSLHFLPECFNGSRIRRGAMPTLRLGSRRLGDIYDNEFNVQPEQTSVDQSADASADAVVPTEPHDDATELNINLHLPCPAPPRKSSKFCQIDGCSNHLTSENLTLHKFPHSADMCAKWQHNTQVPFDPEYRWRYRICSAHFEPMCLGNMRLMHGSVPTLKLGARAPKQLFGNDFAALSLRLDKEKRSADQSLPVKQEQVDDDQEQYDQEQEDLSMLVPELQLLEGDDDQEDNQFNYTNSWRDSQQQLQLQLRLPSIKQEEDTIYNPVKSGYDKCSLVHCQRQRSQHGVHIYKFPRSRQLQHRWMHNLRIRYDERRPWKTMICSVHFEPHCIRLRKLRPWAVPTLELGDNVPQDLYRNEQSQQQFMQQRNSDAEAGSEGEDYDAELDDTILEECDDEYDDNDNAEQFPAEPHIKREYRSRCDPQPAGQLPPWKIKQCCLPYCRRPRGDGIKLFRLPNNISAIRKWEQATGMRFYESQRNTKLICSRHFDPQLIGVRRLMSNAVPTRNLAPNNEESEPPAAGPRCCIKDCQPDGHVKLHKFPSDPQLLHQWCQALNLRDEQRHAGKYICAVHLPTKAMSCLICGVEDVQLPLQDFPEHRNQRVKWCYNLKIEHIAKWDNSKHICCKHFESYCFIKPGHLLPDAMPTLHLKHNDSNIFLNESVIESSQLLRVKDEPIECEDLML

Similar Transcription Factors

Sequence clustering based on sequence similarity using MMseqs2

100% Identity: iTF_00519952;
90% Identity: iTF_00490809;
80% Identity: -