Basic Information

Gene Symbol
-
Assembly
GCA_951394005.1
Location
OX596074.1:10097220-10130378[-]

Transcription Factor Domain

TF Family
THAP
Domain
THAP domain
PFAM
PF05485
TF Group
Zinc-Coordinating Group
Description
The THAP domain is a putative DNA-binding domain (DBD) and probably also binds a zinc ion. It features the conserved C2CH architecture (consensus sequence: Cys - 2-4 residues - Cys - 35-50 residues - Cys - 2 residues - His). Other universal features include the location of the domain at the N-termini of proteins, its size of about 90 residues, a C-terminal AVPTIF box and several other conserved residues. Orthologues of the human THAP domain have been identified in other vertebrates and probably worms and flies, but not in other eukaryotes or any prokaryotes [1].
Hmmscan Out
# of c-Evalue i-Evalue score bias hmm coord from hmm coord to ali coord from ali coord to env coord from env coord to acc
1 33 2e-15 4.1e-12 47.8 0.6 1 86 856 928 856 929 0.83
2 33 4.3e-15 8.8e-12 46.7 4.7 1 87 956 1025 956 1025 0.80
3 33 2.4e-15 5.1e-12 47.5 0.3 1 87 1046 1118 1046 1118 0.83
4 33 3.6e-14 7.4e-11 43.8 3.1 1 86 1199 1267 1199 1268 0.78
5 33 4.4e-15 9.1e-12 46.7 5.4 1 87 1292 1364 1292 1364 0.81
6 33 3.6e-12 7.4e-09 37.3 0.9 1 87 1399 1467 1399 1467 0.80
7 33 3.7e-11 7.7e-08 34.1 3.1 1 86 1508 1577 1508 1580 0.74
8 33 2.8e-14 5.7e-11 44.1 0.1 1 87 1605 1675 1605 1675 0.80
9 33 5e-15 1e-11 46.5 1.5 1 86 1697 1766 1697 1767 0.81
10 33 4.6e-13 9.6e-10 40.2 2.7 1 87 1795 1867 1795 1867 0.86
11 33 2.1e-06 0.0043 18.9 0.6 1 80 1935 2009 1935 2011 0.75
12 33 1.9e-11 4e-08 35.0 0.6 1 87 2032 2104 2032 2104 0.79
13 33 2.8e-14 5.8e-11 44.1 2.6 1 87 2136 2207 2136 2207 0.80
14 33 1.3e-14 2.7e-11 45.2 5.2 1 87 2252 2325 2252 2325 0.84
15 33 2.4e-13 5.1e-10 41.1 0.6 1 87 2347 2415 2347 2415 0.80
16 33 3.7e-15 7.6e-12 46.9 0.2 1 87 2708 2777 2708 2777 0.80
17 33 1.7e-14 3.5e-11 44.8 1.8 1 86 2835 2917 2835 2918 0.81
18 33 1.3e-10 2.7e-07 32.4 1.8 1 87 2948 3021 2948 3021 0.79
19 33 1.1e-12 2.2e-09 39.0 0.9 1 87 3049 3118 3049 3118 0.82
20 33 1.1e-13 2.4e-10 42.1 1.3 1 87 3138 3208 3138 3208 0.81
21 33 1.7e-13 3.5e-10 41.6 2.7 1 87 3231 3302 3231 3302 0.80
22 33 2.4e-05 0.05 15.5 0.3 1 59 3318 3365 3318 3392 0.77
23 33 1.2e-11 2.6e-08 35.6 4.6 1 87 3406 3476 3406 3476 0.81
24 33 6e-12 1.2e-08 36.6 3.2 1 86 3501 3572 3501 3573 0.76
25 33 3.3e-14 6.8e-11 43.9 2.9 1 86 3593 3665 3593 3666 0.78
26 33 3.1e-11 6.3e-08 34.4 8.6 1 86 3686 3755 3686 3756 0.79
27 33 4.8e-11 1e-07 33.7 0.3 1 86 4253 4329 4253 4330 0.80
28 33 9.6e-07 0.002 19.9 2.4 1 86 4350 4419 4350 4420 0.72
29 33 2e-13 4.1e-10 41.4 3.8 1 86 4439 4509 4439 4510 0.80
30 33 4.1e-12 8.6e-09 37.1 1.6 1 87 4612 4686 4612 4686 0.83
31 33 1.1e-14 2.2e-11 45.4 0.5 1 85 4709 4780 4709 4782 0.82
32 33 6.5e-13 1.4e-09 39.7 5.0 1 86 4955 5027 4955 5028 0.79
33 33 1.1e-12 2.3e-09 39.0 1.6 1 86 5053 5122 5053 5123 0.80

Sequence Information

Coding Sequence
atgtCACAAAATAATCAACGTAAACATTATCACATACATGCTCCCTATCAACACCCCCAACAGCAGCAGCATCAACAACAGCAGgctcaacatcatcatcatcacttAACGTCCTCATCGCAGCAGCTCCAtcatcagcaacaacaacaacagcagcaacaccAGCAATGGTACTCACAGCAGCAACATTATCAACATGGTCTTCATTTAAGAGAATCCCGCCATATGCAACATGCTCAACATGCTCATCATGCTGCTGCTCATCACCATCAGACGCAACACCAGCAACCACATCATAATCATGCTATGTCGGCACCACATATGTTTACAAGTGGTTATGTGGGTATGACAGCATCCTCCTCTGGTGGTGCAGGAGGAGGTGTGGGGGGTGTAAGTAATCCAGGTAGTGGGGTGGCACACTCGGCCACAGCAACAATGGGTTCAACACACAATATACCGGCTTCTTCATCATCATCCTCGTCGTCTTCGGTTCATCATCATTATTCTGCTACTGCTTTGGCAGCTTCGAGTGCAAATAATACAGCAAGTGCTGCTACTGGTGGTGCTGGTGGTAGTACAGCCTATGCTGCTGGTCGTAATCGTATGTTTGACCTTGAAATGTTAACaccacaacaacagcaacaacattcACATCAAAGTACAGCATCAGCTACACATGCACACTCTATGCTACCGACTGCTAGTACAAGTGGACGTTCTGGTTTTGATGCCTACTCTCATAGCTCTTTGTATGCTCAACAAAATCAGCGACATCATACAACTCCCAGCTCTTCGCATCATCATCATTTGGCAGCTACACACCATTCCTTGCATTCTCATCACTCGCAACATCATCCCCAATCAGCAGCAGTAGCGCCACCACCCCCACATCATCATCCACACCAACAACATCCGCAAACTTCGTCtcttcatcatcatcagcagcaGCATCCCCATCACcaccaccaacaacaacaacattattATCATCATGCTCAACAAACTTCCCTCCACCGACCACATACTCAAGTTATGGGTCCTATGTTGCAACATATTAAATCTGAACCAGTAGAGCAAATAACCGTAACACCATCGATACAAACCGAGGAAGTTATCATAAAATccGAACCTGTGGATGATAGTGGTTATCATAAAAGTGCGCCACAAATTGAAAACAATTCTTTTCACATGGAAGAAAAACGTAAACAACATGAGTTCcatcaacaacagcaacaacaacaattacaacaaaaacaacagcagGAGCAACAACGTgttcaacaacaacaattacatGAACAGCGACAACAACAACTACTTCAACaccagcagcagcaacaacagatACAAATAAAAGAAGAACCACATGATTATCCTGAACATCAACATCATCATGAGCATCAACAAAGTGAACATACTCATAATGAAGATATTTCCCAACAAACACAAAAACGTACAAATTCCGAGAATTCTACTACGATACAACCAGCAGTAGTAGTAGAGCAAAAAACTGaaaagcagcaacaacaacaaccagaacaacaacaacagcagcagcaaatATCCTTGACAAATATAAAAACAGAGGCAAagCCCCTTAACTTTCCTCGTCGCAAATTACAAACAGAACGTTCCTCTACGCTGCCCATATGCCAACGATGTAAACAAGTTTTTTTGAAACGTCAAAACTATACACAACATGTTGCTCTATCCAGTTGTAATATTGTTGAATACGACTTTAAGTGTTCCGTATGTCCCATGTCCTTTATGTCCAATGAGGAATTACAAACGCACGAACAACTACATCGTTCACATCGATATTTTTGTCAGAAATATTGTGGCAAATTCTATGAAACCATCGATGAGTGTGAACAACATGAATATGGACAGCATGAATATGAAATGTATAAATGTAATATTTGTTGTATAAGTGTAACCCAACGTGATCAATTATTTACACATCTACATGAACATAAATATCAGCCACGTTTTGATTGTTGTATATGTCGTTTATGTTTTCAAACTTCTTTGGAATTGCATGATCATTATTTGGCCAATGAAGatttttgtggaaaattttatgataaagaagCCTTTAAAAAACCAATTACCTCCTTAACAACAACACCTTATTTGGGTAAACCGGAAAGTTCGAATTTGGAAATTTCTCATACTTTCTCGTTAAAAGATATACCTCCTGCTAATAGTCAACATTTGGAACCTTTATATACAAAACCCAACACCTCAAAAACCTCCATGGAGCCACCTAATACACCAACCAACACACCCTTATCTTCGGCATTTAGCTTAGAACCTCATGAGTTTACCTTGGAACCACAGGTAGAGgtaaaaactgaaattaaagTAGAACCTGATTTTTATCCACCCATGGATCAAACAGATTATTCGAATTATGATCAAGATTATAATGCAACAGATTACAATTCGGGCTCCAATCAAAGTTTAGCTTTTTTACAAGATTATCAAGATAATGCTTCCAGTTCGACAAATTCATCATTTTCATTTAGCAATAATAACGATGCCATACAAGATGAAGATGCTATGTGTTGTGTACCCAAATGTGGTGTTAGCAAATACACTTCACCTTCCCTACAATTCTTTGGCTTCCCGCGTGATGAAAAGTATTTAGCCCAATGgctacataatttaaaaatgatttatgaTCCTAATGTTAATTATTCAGCGTATCGTATTTGTAGTTTACATTTTCCTAAACGTTGTATAGCTAAGTATTCTTTAAGTTATTGGGCTGTGCCCACTTTTAATTTGGGCCACGATGATGTGGGTAATTTATATCAGAATAGAGAAAGTTCAGGGGGGTTTCCAGCTGGTGAAATGGCTAAATGTAGTATGCCTGGCTGTCCATCACAGCGAGGTGAAACtaatgtaaaatttcatgtatTTCCTAGAGATTTAAAGACATTAATAAAATGGTGCCAGAATTCTCGTTTGCCAGTACATAGTAAAGATAATAGATTTTTCTGTTCTAGACATTTCGAAGAGAAATGTTTTGGTAAATTTAGACTAAAACCCTGGGCCATACCTACGCTTAACTTGGGTACTGTTTATGGTAAAATACACGATAATCCTAATATCTATCAAGAggagaaaaaatgttttttaccTTTTTGTCGACGTAGTCGTTCATATGATTGTAATTTATCTTTATATAGATTTCCAAGAGATGAAACTTTATTAAGACGTTGGTGTTATAATTTAAGATTAGATCCTAATATGTATAGAGGTAAGAAccataaaatttgttcttcACATTTCATTAAAGAAGCCTTGGGCTTAAGAAAACTAAATCCAGGGGCCGTGCCCACTTTAAATTTAGGTCATAATGATAGAtttaatatatatgaaaatgaATTATATACACCACCGCCACCACCTCCTCCACCTCAGCCTTCCACATCATCTAAGGCTCATAAGTTTGAAAGAATGTTTAAACAAGAAATGGGAGGTACGGGGTCTCATATATACGACAATGTTTTTATGAATTCCATGGTGCAAAAATACTCTTCCTCGTCATCTTCTAACAGTGGCAATAATTTAGATTTGGGTGATGTTTGTTTGGTGCCCTCGTGCAAGAGAACCCGCCACTCCGCTGACATAACTTTGCACACGGTACCCAAACGTCCCGAGCAGTTAAAGAAATGGTGCCATAATTTGAAAATGGATTTAGAAAAGCTGCATAAaagtgttagaatttgtagtgCCCATTTCGAAAAGTATTGCATAGGTGGTTGTATGCGTCCCTTTGCCGTACCCACTTTGGAACTGGGTCATGATGATCCCAATATCTATCGTAATCCTGATGTTATTAAGAAACTGAATATAAGAGAAACTTGTTGCATACAATCTTGTAAAAGAAATCGCGATCGTGATCATGCCAATCTGCATAGATTCCCTACCCATCCAGAATTGTTGCAAAAATGGTGTGAGAATCTGCAAAAACCCATACCCGATGGTACTAAACTTTTCAATGATGCTGTTTGTGAAATACACTTTGAGGACAGATGTTTGCGCAATAAACGTTTAGAAAAATGGGCCATACCCACTTTAAATTTGGGTTGGGATGAGGCCCCTCACAGTTTGCCTTCGGAAGaggaaataaatgaaaattggGTTAAACCTTTTGCTCCCAATAATGGTGATGAACAAGGTGAATGTTGTGTGGCCTCCTGTAAACGTAATCCACAAATTGATGATGTTAAATTGTATAGACCACCCGAAGATGCTGAGCAGTTAGTTAAATGGGCCCATAATCTGCAAGTGGATGTTACTGAATTACcaaatcttaaaatttgtaATCTACACTTCGAGCAGCATTGTATAGGCAAAAGGTTGCTGAATTGGGCCATGCCTACTCTAAATTTGGGCGCTAAAGTGGAACATCTATTCGAAAATCCTCCTCCCATGCCGACtgtttacaaaaagaaaattaaacctGAAAGACTTTTATCTAATCAAGAAGCCATTAAATGGTCACCCAGATGTTGTCTGCCTCATTGTCGTAAAATGCGTTCTTTGGACAAGGTGCATCTGTTTCGTTTTCCCTATAATAATCGCCAAACTTTGGCCAAATGGTGTCACAATTTACAGCTACCTTTAGTGGGTTCCTCACATCGTCGTATATGTTCTTCACACTTTGAATCTTCGGTCTTAACTAAACGTTGTCCCATGTCTTTGGCAGTACCCACCTTGGATTTGAATTCTCCTCCGGGCTATAAAATCTATCAGAATCCCGCTCgcttaaaacaaataaaaccaGGTGCTCAAAGGCAATGTATTATAGAATCTTGCCGTAAAACTAAACTAGATGGTGTAACTCTCTACCGCTTCCCTAATAATCgttctattttatataaatggcgtcataatattaaaaattggcCTAAAGGTAAATTAAGCTCACAACTGAGAATTTGCGGCGAACACTTTGAGCCACATTCGGTGGGTGAGAAAAAACTATCACCCGGTGCTATACCTACTTTAAATCTGGGCCATGACTCTAAAGATTTGTATCCCAATGAAACAAGATCCTTCTTCGATTTAGAAAAATGTGTGGTAAATGGCTGTGATTCGCGCAAAGAAATGGAGGATATAAGACTTTTCCGTTTCCCCCGTGATGATGAGGAATTGCTAAAGAAATGGTGTCATAATTTACAAATGAATACCAATGATTGTGTAGGCATTAAAATATGTAGCAAACATTTTGAACCAGATTGTTTAGGTCCCAGGCAGCTATACAAATGGTCTATACCCACTTTAAAATTGGGACACAAAGAAGATGAATTAGTGGATATAATACCTAATCCACCACCTGAACAAAGAACTGGAGAATTCCTATTCAAATGTTGTGTACCCACTTGTGGCAAAACACGTAAATATGATGATGCCCAAATGAATAGTTTCCCCAAACATTTAAAACTATTCCGTAAATGGAAACATAATCTCAAATTAGATTTTCTCAATTTTaaagaaagagaaaaatataaGATATGTAATGATCATTTCGAACCAATTTGTGTAGGTAAAACTCGTTTAAATTTTGGCGCTTTACCTACTTTGAATTTGGGACATGATGAAGTGGATGATTTGTACCAAATTAATCCTGAGAGAATAAGACCAAATTTGTTTATCAAACAAAAAGATGCAGAGAGATTAGAGCGTAAAAGGATCTTACGTGAGGAGAACCAAGAACAATATGAATGTGAAGATCAAGAGGAACAAGATAATACAGATCCTTTAAGTTTAGAACCTACAGATATTAAATGTTGTGTAGTTGAGTGTACAGCTCCTAAATCCATTATGAGAGAACCCTATGATTTGCCTGAGacaatagaatttaaaaaattatggcTTAAGGAATTGTCTAACCAGGAACAAGAAGAATTGTCTGTAGAAAACAAAATCTGTGGTTTACATTTCCAAATGATTTTTAACAAACTAAAAGATAAAATGCAGGAATTGAGTGAAAATAAAGAGGAATTGaaaaccgattttaataaattattatacaaTTATCAAAAGTCCCTTATATCTTTGGTAGTCAATAGTTATCAGTGTCGTGTGGCTCAATGTTCttctaatttattaaattcttccATTAGACTATTTTTCTTTCCCTATGGAAAAAATTTGGTTAATAAATGGTCTCACAATACCGGTATTATACCCGATGAACATCGTCGTTATATGAATAAAGTATGTGCTTTACATTTTGAATCATATTGTATAACTGAAAATCAAAGATTAAGATCTTGGGCTATACCTACTCTTAATTTACCCGCCTCCAACGaggaaaataaaactttatataaaaatcctGATCTTACCAAAATTGATAAAAGAATGTTGGGTCCCCAGATTTTAAAATGTGCTGTAAACAATTGTACTTCGGCTAAAACGGGAGAAGATGATTccattaaattgtttaattttccCAGCGAtgataaattacttaaaaaatggTGTGATAACTTAAAAATGTCTCATCATTTTACtcctttgttaaaaatttgttccTTGCATTTTGAAAAGTTATGCTTTGGTAGTTGCCGCATTAGATCCTGGGCTATACCCACCTTAAATTTGGGCCATGACCAAGCACCCGAACATCTTAATAAATGTACCATAAACAAGGAGGTATACGATGCTCCTGAACAAATCTCGGAGATACAATTGAAACAAGTTAAAATTAAACGGTCTTTGGATAGTGCCAAATGTTTTATAGCCTCTTGCCGTAAAAGTCGTCTAAAACATGGTGTACGTTTCTATAGTTTACCCACGAATCCCAAAATGAAACGGAAATGGCTGcataatttacaaattaaacaattaaagtccaatcataaaatgcaaaatattaaaatatgtaatcTCCATTTCCACAAAAGATGTATGGAAGGTAAACAGCTTAAACCCTGGGCTGTACCCACTATGCATTTAGGTCATACGGACAATATATTTGATAATCCTCgtagatttaaaaatatgcctGATTTACGTTGTGCTTTAACGCATTGTAAAAATCATGCCAGTTTAAAAGGTGTGCGTTCTTTTGTGTTTCCCAAATCATtggaatttttacaaaaatggtctaaaaatttaaaattagatcTGGACAAATGTAAAGGCAAGTTATGTCAAGAACATTTCGAAAAAGAAGTTATAGGTGaaaggaaattaaaaagtgGTGCGGTGCCCACTTTAAATTTGGGTCATGAGGATAAGGATATTTATGATAATTCcgaattgaaagaaaaattgggatcaaaaaatatacaacaagTTAAAATTACTAGTGATTTTGAAGTGGAATATGAACAACAATCCGAGGAGGAAGATGAGGAATTATGGGAATCTGAAGTGGAGGATGAAGAAGAGGAAGAGGAACAAGAAGAACAAATTTATTATGATGATGAGGAAGAAGAGGAGGAAGATGAAGACCCAGAAGAAGAGGAGGAGGAGGAAGAGGAACAAGAAAGACCTTTGGATGAAGATAATATTAGTGTTAGTAATTCCATAAGTGATTGGagttcaattaaatttaaagaattacGTGTCTCTATTACACCCTTAACACCCGAAGACTTACTGGATTTATGTTCACGATCCTCTTACGAAAGAGAATTTGGTTCTCTAACCCCGGCCAGTAGTTTAAGAGGAAGAAGATCTATAACACCCGCCTCTAGTTGGAAAGATATACGCAGCGAAACTCCTGAACAAAAATCTAATGCAtttggtttaaatttaaaaaacaacgaggaaaaacaagaacaaaaatCCTTTAATATATTCAGAGAACCAAGATCTGTAACCCCCGATCAAAGATTGGAAAACAAAATTGAAGAAAACTTAAGGGAAACACCTAGTAAAACTTGTAATTTAACAAAATCTCctgaaaataatatgaaatcaggtttttcagaaaataatttaaaaagggAGTGTACGGAACTTAATAATGATGAAGCAAAACGTGAGCGTTTAGATTTAACAGAAGATGAAACCTCCTCTACTTCTCTACCCAACGATGATACAAAAACCAATCTAAGAACCGATAAAGCTCTTAACTCAGTGGCTCCTATATGTTGCCTAAAACATTGTGGCAAAGAAAAAACACCCGAACAACATCTAACTACTTATGGTTTTCCCAAAGATCCTCAACTTTTACAAAAATGGTGTGACAATTTGGGTTTACAGCCTGAAGAATGTATAGGACGCGTTTGCATAGACCATTTCGAACTACGAGTTATAGGTACTAGAAGACTTAAACCCGGAGCTGTACCCACTTTAAATTTAGGTCCTCAACGTATAGCTAAACATACTAATGTAGAAGAGAGCACCCAAAAGAAAACTATTAATAAAGAATGTTCAGACTCTAACCACATGCAAGAATTTGACTCGAGTTTAAAGCCCCCACCTCCCTATAAAACACCCAAACCTAGTAAACAATCGGTTTTTCGGCTATGTTGCCTCAAGCACTGTCGTCGCAAGAAATATATGCAACAGGAGAATCGAGAGAAACCGCAGGACAAGGAGAAAATGGAGCTAATGTTTAAATTTCCTAAGGATCccaagatattaaaaaaatggtttaaaaacttaagattaccagaaaatttaaatttatctaaTGATTTAGTTATTTGTTCTAGACATTTTGAAGcagaagtaataaaaaataataaattacttgCTATGGCAGTACCCACTTTAGAATTAAGTTATGCTAATCGTAAacctatttataaaaataatttcaaagtaAAAGACGAAGAAAATACCTACAAAACAGAAgaggaaaaatgttttttaaaacattgtGCTAAACAAGAAAaggataatatatttttaatcagttttcctaaaaatgatttaataacTCTTAGAAAAtggtgtaaaaatttaaaactaaattatgaATTAATACTTCATGATAGTAGACACAAAATTTGCAATCAACACTTTGAgccatatgtattttataaaaccaAACATTTAAGAGTGGGAGCCATACCCACCTTAAACTTAGGACACTCAGATGCAATAATTAGAAATTGCCGCAGATTACGCTTGAGGCGCAGTAATagttttaaactaaaagagaaatGTTGTGTTAGTCAATGTCAAGAAACTgaactaaaattatttagttttcccCACAGTTCCGAATTGCGTAAAATTTGGTGTAATAATTTACAATTAGAAGTGAGGCAGGTACTcaataatcatttaaaaatatgtgcTAAACATTTTCCCGCCGAAAGTTTTATAGGGGGCAtggataatttaaaattaaatgctaTACCTATATTAAATTTAGGTCTGAAAACCGAGCAACATGTGGTGAGATCTTCTAATCCagaggaaaaaaaatgtttagtagAAAATTGTCAAAGTACTCCTAGTGTGGATAAAGTGAAATTATTTGGATTTCCTGAAAAGCGTGATATATTAAAGAAATGgttatttaacttaaatttatctCCAGACACTTTTAATAAATCGGATGTCATTTGCAGTAAACATTTTGATAAAAGTTGCATTAAAAACGGTCAATTACATGAAAAAGCCATACCTACCCAGTTTTTGGAATTATCAGAAAAAAGTTGGTTTTATAATAACTCCGAGGAATTATATGAATTACAAAAAATCTGCTGTGTTAAGGAATGCCAACAAACGGCTGAACAAgctaaacatttatataaatttcccAAACATAAAGAAGATGTGGAAAAATggttatataatttaaaattacccCTAGAAGAAACTGAAGTCAAAGACTTAAGAGTTTGCGATAGACATTTTGAACAAAGTTGTAAAATCTCTAATAAGGATTTAATAACCCAGGCTTTGCCTACTTTAAATTTGGGTCACAATGATGCTGATATCTATGgtaatcattttattaaatgcTGTTTGGATTCTTGTTCTATAGAGGGTTTTTACTATCACAAATTACCCGAAGATTTAATGTTACAAAGTTTTTGGTTCCAAGAACTGGAAATGGAATCCTCCTTTAATAATTCTGCTTACATATGTTCAGTACATTTTGTGgctttttttgaaagaattttagaaaaatatagtgTTTTTCTTAAAGAGTCTAAGGAATATGTTAAATTATCTTTAACTTATAATGAATTAAAAACATTACCTGCCCTACAAACCTATAAATGTCATATTAACAAATGTAATTCaggttttaaattaatatggaaattatttaaatttcccaAAGATCATAATCTATTTAATAAATGGTTACATAATACTGGTTTACAATTCGATTATACACAACGTCCTCAGTATCGTTTGTGTGCCCAACATTTTGAGGAAAGATGTTTAAGTGAGAAAAAATTACATCGTTGGTCTTTACCCACTTTAAATTTGCCTTTCAATAATAGTTTATATGTTAATCCTCCAGAAGCTTTACCTCCCCAACATGAAAATCTTAAACATTGTTGTGTTTCCAATTGTGTTAATCTTAAGGGTcccttttataaatttcctgTTAAGCAATTGGATATAAAGAAATGGATCCATAATTTAGATTTGGGTTCACAACAATGTACTCTCAACTTAAGAGTttgttataaacattttgaaaattattgttttgcCAAAGCTAATGAGGAtaatataaaacctttaaaatCTTGGTCAGTTCCTACTctaaagttaaaaagaaaaacagatTTGTATCTTAATCCTGCtgataaaatagatttttatgtttgcTGTCTAAACAACTGCAAACAAATGCTTAATAAATCCAAAGATATATATCTTTATAAATTCCCTTTAagtaatactttaaaacaaaaatggttacataatttaaatttatctcGAGAAACCTACAAAGATACTATGAGACTTTGTTCTTTACACTTTGAAATGGATTGTTTTTATAAAGGTTACAAAAATTTACGCAAACATTCAGTACCCACTTTATGTTTAAATAATCCACCAAAAAATCTTTATACAAATCCTGTAAGACGTCCCTATTTGAAATGTTGTGTCAAAGTTTGCAAATCAACGGGACAACATTTACACAATTTCcctaaacaaaaaatacttttaagaaAATGGTGCCATAATTTACAATTGGATAAGGAAATTAAATGGGAATCTTTAAGGGAATGGAAAATTTgtaatgaacattttgaaaagcaatgttttaataaattaggCTGCTTAAGAAATATGTCTGTGCCTACTTTAAAGTTGGGCCATCGCAAGAAACTATTCAAAAATCCTGATTTTAAAAGGAAATCTATTAGCAGAAGGtatgatgaaaataaaagcTCTAATatatttaaggataaaaaagattttgatttttcaaaacaGGAGGAAATGGAAGTTGGACAAAACTTTGCTATGCAGCAGCAGGAAGAAGAGACTGTTATAGAAAACCCCAATATTAAGAataggaaacaaaaaaatctgaAGGTAAAGGAGCAAAGCTTAAAAGAAATTTCTATTTCTATCAAacaagaattaaacaaaatggataataaaactaaaatgcaaaatttaagatCACAAAATTCCGCTAACAAACTACAACAACAAGAAAATGAAGAAatcttaaaagaaaattcagaaaaacaaattttaaaatctcaAGATGAAAAGACTACAGAAAATTCTTTAATAGAAATGCTGGAAAAACAAACAGCAACATCATTATCCGGGAAACTAAAAGAACAAAGAAATCCAGAGGAAATCTTAAGGGCGAAATCTTTAAGtattaaacaagaaattaattCATCTaacgataaaaatttaatagcctGCGGTTCAATCAGCAAAACCCAAGATCAAGAAAAGGAACCAGAATCCTTAAGTATACAACAAGATAACGCCTTATCTCaagttgaaaatttaaaacttaaacttCTAAAGGCCCTTGAGGGTTTCAAAAAACTTCAAGAACGGGAAAGCAATAGAAATTCTCAAGAATCTTTAACAATAACTAAAAGAAAATCTAAagctaaaaacttaaaatcccCAAATACAAATCCTCAAACTCAAGAACAGCAAAAGAAATCGGAAAACTTACAAATAGAACATTCTCAAGagcaaaaaaaagaaacaggAAATAAAGCAAAAGGAGATATAAAACATAAAGATACAAACGCACTAGAGGACTttaaaacatttcaagaaaTAGAAAGTAATGAAAGTTCTCAAGATTCTTTAAATTTGCAAcaagaacaaaatttaactaatgATGAAACAAAAGTTAAAAGATCCCATAACGCAAACTCTAAACCTCAAGAACAAAAGAACTTAAGTTCTCAACCTCAAGAACCAGcaaatcaaaatattatttcctTAGAAGAAGATTCACTTGATGAAGATATAGTCTTAAGTGAAGCTGTGGCTAAACTTAAAGCTAATAAACAAAAACCTTCTCAAACTACCCGCAGATCTTTAAGaacagcaaataaaaatatttatcaaaataaaattccagaaaatcatttacaaataataaaagaaactcCAGTTTTACCAAATATTACTCAAGAGCAAAGTACCACCTTTACCATCTATAAAATTgaacaagaaaataataatgaaaattatgatGATAATTCAAATAATTGCTCACAAGAAGAACATCAAATAGATTACCTTCAAGCTAAACTTAAAGcagagaaaaatattaaaaaacaattacaaaaaaataaacttcttGTGGCCTGTTGCATTAAAATCTGCTACAATTTCAATAATCCCCAATCTGCAACACCTCTCTACCAAATGCCCCTTCATGCCAAATTAAGAAATCATTGGCTGGAAAATTGTAAAATCGATTTTGAAGAATACGAACCCATTGAAGATTTAACAGAACTTAAAGTATGTATTCTACACTTTGATCCTGCATGTCTAAGAGGTAATCATCGTCTTCTCTATGGTGCAGTACCTACACTAAGATTAGATCgtacaatattaaaatattatccatctttatataattataaagctTTAAGATGTAGACTAACATTTTGTCAGCGTTCTAAACAATATGATGGCGTACAGCATGTAAAATTTCCTCAGgatgaattaaagaaaaaatggtGTTTCAAATTACGCATAAAGGAAGAAAATATAATGGAAAAAGATTGGATTTGTAATATACATTTTAGGAAAAATGATTTATCAGCTGGCTGCAAACCTAAAAAGGGAGTAATACCTACATTATTGTTAAATAAAGAAGCTGATTATAAACAAGATGAAGAAGcaggaaatattaaaatatgttgTGTTCCAAAATGTAGACAGAGTGTAAggggacaaatttttaaatttccttatgAAAATCATgatctttattttaaatggttgcatcaattaaaattaaaagatagTGATTTTACACGAACAAAAGCATTTGTTTGTAGTAAACATTTTACTAAGTATAGTTTTAAtcccaaaaataaacaattaagaGAAAGGGCAGTGCCGGAATTATATTTGGGCCAAGAGGAGGATGAAGAGGAGAACAACGAAGAAGAAAATGAGGAAGAGAAGAAGAAGGAGGAGGAAGAAAAGGAAAATGAACAAGAAAAAGAAGCAGAAGATAGTTCTATAGAAATGGAAAATAAATGCTGGCAACCTTTGTGCAAagaaaattctacaaaaaatttatataattggcCTAATAAAGGTATCTGGGGCACATTATGtaaaaatttaaaaaatgtcgaAGGCCTTAAACAATACACCATATTTGTTTTTCAACAATTATCTGCTCTACCCGAATTCTATACTCAGAAATGTGCcgtaaaaatatgtaaaactgATCATCATTTAAAAGTCTATAAAGGTTTAAAACTATTTCCCTTTCCCAAAAGTGATTTAGCTAAAACATGGTGTCATAATATACAAATGGACTATAATTCATTGCTGGAAAAACCTTTACAAAAAGTTTGTCAATTACATTTTACCAGTTATTGTATGTTTCGTAGACGTCTTTTAAATTTTGCTGTACCCACCTTAAATTTATCATTACCCCCCACGGAAATTATACCAATTGAACGTGTAAAAATTTCTCTACTTACTGCTTGTTGCTGTATACCCTCGTGTGTAAATGCCAAGGGTTTGAATGGTGATGTGGTCACTAAACTCTATAAATTTCCTCAAGATCCCAGAATGTTAAAGAAATGGTTGAATATAACCAAATGTGAGgattttaaaaagaattctACACGTATATGTGGTTTACATTTTGATAATaacgatatatataaaaatttaacacttAAAGCAAATGCTATACCCCGTTATAATTTACAGCAACCAACAGAGGAGACGCAACCACAagaaaatgctttaaatatttttgaaatagaTGAAAATATACAAGTAAAACAAGAATTGGATAATTCGGAAGAATGGGATGAGCAAGAAATTGGCTCTAATAATTTATTAGATCTTAGAGATATTACTAAAGATTTAAATGTTAATGAAAATGAATTGgtagaaacaaaaacaaactatAACTTGAAAGCCACTAATATTGAAGCAAATACCCTAGAAATctgtaatttaaatgaaaatatccaaataaaacaagaatTAGATATTATGGAGGAATGGCGGGAACAAGAACAATTTGAAATCCCTAAACAATCCTTAAATTATGACCTAACTTTAGAAGAACCTTGCGGTAATTATCCCCTAATGAATCTAAAACAAGAAATTTTAGATATAGCTAATGAAGAACCTTTAGATACCTCCCCACATACCCAAGAAATTACTTcaactaattttattataactgACATTAAATCTCAAATCTATATATGTTGTGTACAAAAATGTCCTAATAATTCTAAAACTCCCAACATACAAATGATAACAGAATTTCCCCGTGATACGGAAATCTTTATTAAATggtgttttaatttaaaaattgatccTCGTCTCTATCAAGAAAATCAATATGCCATATGtcaaaaacattttgaaaatatatgctTTAATCAAGAAAATCTTTTACATCCCTGGGCTGTGCCCACACTTCAgcttaatttaaatgaaaattctttTATTCACCAAAATGATATACCCGATCATATGAAACCCTCTAATGAACAATGTCTAGTCTATGGTTGTATAAATCCCTTACAGCCTCTTTATAAATTCCCTTTTAAACCCGAGTTATCGCACAAATGGTTTGCCaatttaaaattagattttaccGATTTTAGATCACAAAACTATCGCATTTGTAAAAGACATTTTCCCTGCTCAgcttttgaattaaataatcaaaataaattaaaaccagAAGCAGTACCCTCACTACAACTAGGACACAatgataaaattatatatttaaatccctTAGAAGATGTGCCACAAGAACAAGATATAATTATTAATCAAGATAATAGTCGTGGCAGTAGTCAGGGTTCTTTAGCCAGAATAATATCACCTAATGATCTAGAAGATCATGACAGTAGCTATTTTGAAGATTTTGAAGAATATTATGGACAAgatgaataa
Protein Sequence
MSQNNQRKHYHIHAPYQHPQQQQHQQQQAQHHHHHLTSSSQQLHHQQQQQQQQHQQWYSQQQHYQHGLHLRESRHMQHAQHAHHAAAHHHQTQHQQPHHNHAMSAPHMFTSGYVGMTASSSGGAGGGVGGVSNPGSGVAHSATATMGSTHNIPASSSSSSSSSVHHHYSATALAASSANNTASAATGGAGGSTAYAAGRNRMFDLEMLTPQQQQQHSHQSTASATHAHSMLPTASTSGRSGFDAYSHSSLYAQQNQRHHTTPSSSHHHHLAATHHSLHSHHSQHHPQSAAVAPPPPHHHPHQQHPQTSSLHHHQQQHPHHHHQQQQHYYHHAQQTSLHRPHTQVMGPMLQHIKSEPVEQITVTPSIQTEEVIIKSEPVDDSGYHKSAPQIENNSFHMEEKRKQHEFHQQQQQQQLQQKQQQEQQRVQQQQLHEQRQQQLLQHQQQQQQIQIKEEPHDYPEHQHHHEHQQSEHTHNEDISQQTQKRTNSENSTTIQPAVVVEQKTEKQQQQQPEQQQQQQQISLTNIKTEAKPLNFPRRKLQTERSSTLPICQRCKQVFLKRQNYTQHVALSSCNIVEYDFKCSVCPMSFMSNEELQTHEQLHRSHRYFCQKYCGKFYETIDECEQHEYGQHEYEMYKCNICCISVTQRDQLFTHLHEHKYQPRFDCCICRLCFQTSLELHDHYLANEDFCGKFYDKEAFKKPITSLTTTPYLGKPESSNLEISHTFSLKDIPPANSQHLEPLYTKPNTSKTSMEPPNTPTNTPLSSAFSLEPHEFTLEPQVEVKTEIKVEPDFYPPMDQTDYSNYDQDYNATDYNSGSNQSLAFLQDYQDNASSSTNSSFSFSNNNDAIQDEDAMCCVPKCGVSKYTSPSLQFFGFPRDEKYLAQWLHNLKMIYDPNVNYSAYRICSLHFPKRCIAKYSLSYWAVPTFNLGHDDVGNLYQNRESSGGFPAGEMAKCSMPGCPSQRGETNVKFHVFPRDLKTLIKWCQNSRLPVHSKDNRFFCSRHFEEKCFGKFRLKPWAIPTLNLGTVYGKIHDNPNIYQEEKKCFLPFCRRSRSYDCNLSLYRFPRDETLLRRWCYNLRLDPNMYRGKNHKICSSHFIKEALGLRKLNPGAVPTLNLGHNDRFNIYENELYTPPPPPPPPQPSTSSKAHKFERMFKQEMGGTGSHIYDNVFMNSMVQKYSSSSSSNSGNNLDLGDVCLVPSCKRTRHSADITLHTVPKRPEQLKKWCHNLKMDLEKLHKSVRICSAHFEKYCIGGCMRPFAVPTLELGHDDPNIYRNPDVIKKLNIRETCCIQSCKRNRDRDHANLHRFPTHPELLQKWCENLQKPIPDGTKLFNDAVCEIHFEDRCLRNKRLEKWAIPTLNLGWDEAPHSLPSEEEINENWVKPFAPNNGDEQGECCVASCKRNPQIDDVKLYRPPEDAEQLVKWAHNLQVDVTELPNLKICNLHFEQHCIGKRLLNWAMPTLNLGAKVEHLFENPPPMPTVYKKKIKPERLLSNQEAIKWSPRCCLPHCRKMRSLDKVHLFRFPYNNRQTLAKWCHNLQLPLVGSSHRRICSSHFESSVLTKRCPMSLAVPTLDLNSPPGYKIYQNPARLKQIKPGAQRQCIIESCRKTKLDGVTLYRFPNNRSILYKWRHNIKNWPKGKLSSQLRICGEHFEPHSVGEKKLSPGAIPTLNLGHDSKDLYPNETRSFFDLEKCVVNGCDSRKEMEDIRLFRFPRDDEELLKKWCHNLQMNTNDCVGIKICSKHFEPDCLGPRQLYKWSIPTLKLGHKEDELVDIIPNPPPEQRTGEFLFKCCVPTCGKTRKYDDAQMNSFPKHLKLFRKWKHNLKLDFLNFKEREKYKICNDHFEPICVGKTRLNFGALPTLNLGHDEVDDLYQINPERIRPNLFIKQKDAERLERKRILREENQEQYECEDQEEQDNTDPLSLEPTDIKCCVVECTAPKSIMREPYDLPETIEFKKLWLKELSNQEQEELSVENKICGLHFQMIFNKLKDKMQELSENKEELKTDFNKLLYNYQKSLISLVVNSYQCRVAQCSSNLLNSSIRLFFFPYGKNLVNKWSHNTGIIPDEHRRYMNKVCALHFESYCITENQRLRSWAIPTLNLPASNEENKTLYKNPDLTKIDKRMLGPQILKCAVNNCTSAKTGEDDSIKLFNFPSDDKLLKKWCDNLKMSHHFTPLLKICSLHFEKLCFGSCRIRSWAIPTLNLGHDQAPEHLNKCTINKEVYDAPEQISEIQLKQVKIKRSLDSAKCFIASCRKSRLKHGVRFYSLPTNPKMKRKWLHNLQIKQLKSNHKMQNIKICNLHFHKRCMEGKQLKPWAVPTMHLGHTDNIFDNPRRFKNMPDLRCALTHCKNHASLKGVRSFVFPKSLEFLQKWSKNLKLDLDKCKGKLCQEHFEKEVIGERKLKSGAVPTLNLGHEDKDIYDNSELKEKLGSKNIQQVKITSDFEVEYEQQSEEEDEELWESEVEDEEEEEEQEEQIYYDDEEEEEEDEDPEEEEEEEEEQERPLDEDNISVSNSISDWSSIKFKELRVSITPLTPEDLLDLCSRSSYEREFGSLTPASSLRGRRSITPASSWKDIRSETPEQKSNAFGLNLKNNEEKQEQKSFNIFREPRSVTPDQRLENKIEENLRETPSKTCNLTKSPENNMKSGFSENNLKRECTELNNDEAKRERLDLTEDETSSTSLPNDDTKTNLRTDKALNSVAPICCLKHCGKEKTPEQHLTTYGFPKDPQLLQKWCDNLGLQPEECIGRVCIDHFELRVIGTRRLKPGAVPTLNLGPQRIAKHTNVEESTQKKTINKECSDSNHMQEFDSSLKPPPPYKTPKPSKQSVFRLCCLKHCRRKKYMQQENREKPQDKEKMELMFKFPKDPKILKKWFKNLRLPENLNLSNDLVICSRHFEAEVIKNNKLLAMAVPTLELSYANRKPIYKNNFKVKDEENTYKTEEEKCFLKHCAKQEKDNIFLISFPKNDLITLRKWCKNLKLNYELILHDSRHKICNQHFEPYVFYKTKHLRVGAIPTLNLGHSDAIIRNCRRLRLRRSNSFKLKEKCCVSQCQETELKLFSFPHSSELRKIWCNNLQLEVRQVLNNHLKICAKHFPAESFIGGMDNLKLNAIPILNLGLKTEQHVVRSSNPEEKKCLVENCQSTPSVDKVKLFGFPEKRDILKKWLFNLNLSPDTFNKSDVICSKHFDKSCIKNGQLHEKAIPTQFLELSEKSWFYNNSEELYELQKICCVKECQQTAEQAKHLYKFPKHKEDVEKWLYNLKLPLEETEVKDLRVCDRHFEQSCKISNKDLITQALPTLNLGHNDADIYGNHFIKCCLDSCSIEGFYYHKLPEDLMLQSFWFQELEMESSFNNSAYICSVHFVAFFERILEKYSVFLKESKEYVKLSLTYNELKTLPALQTYKCHINKCNSGFKLIWKLFKFPKDHNLFNKWLHNTGLQFDYTQRPQYRLCAQHFEERCLSEKKLHRWSLPTLNLPFNNSLYVNPPEALPPQHENLKHCCVSNCVNLKGPFYKFPVKQLDIKKWIHNLDLGSQQCTLNLRVCYKHFENYCFAKANEDNIKPLKSWSVPTLKLKRKTDLYLNPADKIDFYVCCLNNCKQMLNKSKDIYLYKFPLSNTLKQKWLHNLNLSRETYKDTMRLCSLHFEMDCFYKGYKNLRKHSVPTLCLNNPPKNLYTNPVRRPYLKCCVKVCKSTGQHLHNFPKQKILLRKWCHNLQLDKEIKWESLREWKICNEHFEKQCFNKLGCLRNMSVPTLKLGHRKKLFKNPDFKRKSISRRYDENKSSNIFKDKKDFDFSKQEEMEVGQNFAMQQQEEETVIENPNIKNRKQKNLKVKEQSLKEISISIKQELNKMDNKTKMQNLRSQNSANKLQQQENEEILKENSEKQILKSQDEKTTENSLIEMLEKQTATSLSGKLKEQRNPEEILRAKSLSIKQEINSSNDKNLIACGSISKTQDQEKEPESLSIQQDNALSQVENLKLKLLKALEGFKKLQERESNRNSQESLTITKRKSKAKNLKSPNTNPQTQEQQKKSENLQIEHSQEQKKETGNKAKGDIKHKDTNALEDFKTFQEIESNESSQDSLNLQQEQNLTNDETKVKRSHNANSKPQEQKNLSSQPQEPANQNIISLEEDSLDEDIVLSEAVAKLKANKQKPSQTTRRSLRTANKNIYQNKIPENHLQIIKETPVLPNITQEQSTTFTIYKIEQENNNENYDDNSNNCSQEEHQIDYLQAKLKAEKNIKKQLQKNKLLVACCIKICYNFNNPQSATPLYQMPLHAKLRNHWLENCKIDFEEYEPIEDLTELKVCILHFDPACLRGNHRLLYGAVPTLRLDRTILKYYPSLYNYKALRCRLTFCQRSKQYDGVQHVKFPQDELKKKWCFKLRIKEENIMEKDWICNIHFRKNDLSAGCKPKKGVIPTLLLNKEADYKQDEEAGNIKICCVPKCRQSVRGQIFKFPYENHDLYFKWLHQLKLKDSDFTRTKAFVCSKHFTKYSFNPKNKQLRERAVPELYLGQEEDEEENNEEENEEEKKKEEEEKENEQEKEAEDSSIEMENKCWQPLCKENSTKNLYNWPNKGIWGTLCKNLKNVEGLKQYTIFVFQQLSALPEFYTQKCAVKICKTDHHLKVYKGLKLFPFPKSDLAKTWCHNIQMDYNSLLEKPLQKVCQLHFTSYCMFRRRLLNFAVPTLNLSLPPTEIIPIERVKISLLTACCCIPSCVNAKGLNGDVVTKLYKFPQDPRMLKKWLNITKCEDFKKNSTRICGLHFDNNDIYKNLTLKANAIPRYNLQQPTEETQPQENALNIFEIDENIQVKQELDNSEEWDEQEIGSNNLLDLRDITKDLNVNENELVETKTNYNLKATNIEANTLEICNLNENIQIKQELDIMEEWREQEQFEIPKQSLNYDLTLEEPCGNYPLMNLKQEILDIANEEPLDTSPHTQEITSTNFIITDIKSQIYICCVQKCPNNSKTPNIQMITEFPRDTEIFIKWCFNLKIDPRLYQENQYAICQKHFENICFNQENLLHPWAVPTLQLNLNENSFIHQNDIPDHMKPSNEQCLVYGCINPLQPLYKFPFKPELSHKWFANLKLDFTDFRSQNYRICKRHFPCSAFELNNQNKLKPEAVPSLQLGHNDKIIYLNPLEDVPQEQDIIINQDNSRGSSQGSLARIISPNDLEDHDSSYFEDFEEYYGQDE

Similar Transcription Factors

Sequence clustering based on sequence similarity using MMseqs2

100% Identity
iTF_01194449;
90% Identity
-
80% Identity
-