Basic Information

Gene Symbol
-
Assembly
GCA_947859195.1
Location
OX401930.1:7003945-7036673[+]

Transcription Factor Domain

TF Family
zf-C2H2
Domain
zf-C2H2 domain
PFAM
PF00096
TF Group
Zinc-Coordinating Group
Description
The C2H2 zinc finger is the classical zinc finger domain. The two conserved cysteines and histidines co-ordinate a zinc ion. The following pattern describes the zinc finger. #-X-C-X(1-5)-C-X3-#-X5-#-X2-H-X(3-6)-[H/C] Where X can be any amino acid, and numbers in brackets indicate the number of residues. The positions marked # are those that are important for the stable fold of the zinc finger. The final position can be either his or cys. The C2H2 zinc finger is composed of two short beta strands followed by an alpha helix. The amino terminal part of the helix binds the major groove in DNA binding zinc fingers. The accepted consensus binding sequence for Sp1 is usually defined by the asymmetric hexanucleotide core GGGCGG but this sequence does not include, among others, the GAG (=CTC) repeat that constitutes a high-affinity site for Sp1 binding to the wt1 promoter [1].
Hmmscan Out
# of c-Evalue i-Evalue score bias hmm coord from hmm coord to ali coord from ali coord to env coord from env coord to acc
1 28 0.096 5.8 7.7 0.7 1 23 474 496 474 496 0.97
2 28 6.4e-05 0.0039 17.6 1.5 1 23 511 533 511 533 0.97
3 28 2.5e-05 0.0015 19.0 1.4 1 23 539 561 539 561 0.98
4 28 0.00025 0.015 15.8 2.3 1 23 568 590 568 590 0.99
5 28 2.3e-05 0.0014 19.0 0.4 1 23 596 618 596 618 0.93
6 28 2.6e-05 0.0016 18.9 0.1 1 23 624 646 624 646 0.98
7 28 0.00013 0.0081 16.6 1.2 1 23 652 675 652 675 0.95
8 28 0.14 8.4 7.1 1.8 1 14 681 694 681 698 0.90
9 28 0.14 8.4 7.1 1.8 1 14 742 755 742 759 0.90
10 28 0.14 8.4 7.1 1.8 1 14 803 816 803 820 0.90
11 28 0.14 8.4 7.1 1.8 1 14 864 877 864 881 0.90
12 28 0.14 8.4 7.1 1.8 1 14 925 938 925 942 0.90
13 28 0.14 8.4 7.1 1.8 1 14 986 999 986 1003 0.90
14 28 0.14 8.4 7.1 1.8 1 14 1047 1060 1047 1064 0.90
15 28 0.14 8.4 7.1 1.8 1 14 1108 1121 1108 1125 0.90
16 28 0.14 8.4 7.1 1.8 1 14 1169 1182 1169 1186 0.90
17 28 0.14 8.4 7.1 1.8 1 14 1230 1243 1230 1247 0.90
18 28 0.14 8.4 7.1 1.8 1 14 1291 1304 1291 1308 0.90
19 28 0.14 8.4 7.1 1.8 1 14 1352 1365 1352 1369 0.90
20 28 0.14 8.4 7.1 1.8 1 14 1413 1426 1413 1430 0.90
21 28 0.14 8.4 7.1 1.8 1 14 1474 1487 1474 1491 0.90
22 28 0.14 8.4 7.1 1.8 1 14 1535 1548 1535 1552 0.90
23 28 0.14 8.4 7.1 1.8 1 14 1596 1609 1596 1613 0.90
24 28 0.00067 0.04 14.4 6.5 1 23 1657 1680 1657 1680 0.97
25 28 0.00066 0.04 14.5 0.3 2 23 4571 4592 4570 4592 0.96
26 28 6.2e-05 0.0037 17.7 1.0 1 23 4598 4620 4598 4620 0.97
27 28 0.044 2.6 8.7 0.1 1 22 4626 4647 4626 4647 0.97
28 28 0.044 2.6 8.7 0.1 1 22 4650 4671 4650 4671 0.97

Sequence Information

Coding Sequence
ATGAATTATTGTTGTTTGATATGCAATAACCGAAATGGTTTGGCTCTCAGAAACGCTACCAGTATATTCGCTGAAACTAATACACTACCATCCGGCAAGCAAGTAGCTGAAGTATTATGCGAGATACTAGGCAAGACCGTGCAAGAAAAAAATGCACATGCAAACATATTGTGCAAGAAATGTTTCAGGTCTTGTTTTGACTACGATTCTATGCAAGTACGATTGCAAGCAATCAAATACCAATTAATGGATCAGTTCAAACAATCGCTATCATCAATCAATTTGGATTATGAAACGTATGAGCAACAAGGTACTATTGCACCCAAACCTTCACCGAGAAAGCTGGTGTTGCCAGCGTCAAAACTACAACCTATCCCACCAGATTTACTTCTAAAAGTGGGGAAAATGGCGGCTCTTTCGAAACATTCTATTGTTATTCCTAAACCAAAGCCTGTATCATCATCAACAGTGAATCTCAAAGTGACAGTGGGCTCGTCAGTACTAACACACACAATCAAAACCACTACAGCTAAAGCCGCTGAGACGGAAACAGTTTTATCTCTCTCTAACACACTGAAAAATGAGATAGAGAGCATGGTGGCGTCGAAAGAAAGTTTACCACAGATTATTAATGAATTAAAGACGGAAAATACTGATGATTCAATGGAGTTGGATGATGATCCGCTCACTGTCGTGACAACATCCGAGGGGGGGGATTTGGTGCTGCAAGTGGAAGGAGCCGAGACGGAGTCTAACGAGGTGTCGTTAGAAGAGTACATGCAGCTGGGCGGGGGCGGCGCGCGGGACTATGTACTGGGCACCTGCCAGGATGATGACGACGATGAAGATGATGATGATGATGAACACACAATAGTATTGAACAGCGAGACGGGATCCATCCTTCGCATGGTGTCCGGCCAGAAGCTGGTGTACGAGGACGGCGAGATCTCGTTCGTCATGCCCGACGACGAGCAGCGCGCCGACGCCGACACCGACCCCGCCGACACCGCCGACACCGCCGACACCGCCGACACCGCCGACAACGATAACGACCAGCCCGACAGCCAGGATTCCAACGACGAGTCTCAGATAGAGTTGCAGGTGTCAGGGGACGAGGAGACTGCGAACGCTATCATAGCCGCCGCGCAGGAACAAGGCGGTGCGTTCATAAAGGTGGAGTCTGGCGAGATGTACCGCGTCAAGTCCGTGCTGGCGGGCGGCGCGCTGCAGCTGCGCGCGGCGCGTGCGCACGCGCAGGTGCACCACGCGGCCGCGCAGCTCCTCGCAAGAGACGGGGACAACTACCGCTGCCTGCTCTGTAACAACAACCATGATGATAACGACGATAATGAGGAAGCGGTAGTGGGCAACGCGGACGAAATAATGCAGCACTTGAAGTCGGTCCACGACGCACGCGCCTACATCTGCCGCGCGTGCGGCGCCACCATGCGCAAGCGCAGCGACTACACCAAACACATGGATACACACAAGCCCAAGCAGTCGGTGCTGGGCTCCGGCAGGAGCAAGCAGTACCCTTGTACTGTGTGCGGCAAGGGATTCAGCAGCCGCACACTGCTGCGGGACCACCAGCACCAGCACTCGGGCGCGCGGCCCTACGCCTGCGCGCACTGCAACAAGGCGTTCGGCTCCAAGTACACGCTGCAGGCGCATCTCAAGACACACCAGGATCGTCCGCGGCCGTTCAAGTGCGGCAAATGCGACAAGTCGTTCCTGACGCAGCAGAACTTGAACCAGCACGAGAAAACGCACTTGGGGATCAAAGACTTCGTGTGCAACGTGTGCAACAAGGCGTTCAGCACACAACACAATTTGGAAGTGCACGGCGTCGTGCACTCCGGAAACAAGGCATTCCGCTGCTCCGCCTGCGGGAAGGCCTTCGCCAGACGCGCAGAGCTCAGGGACCATGTCAGGATCCACACTGGCGAGCGTCCGTTCGCGTGCGACATATGCCCGGCGCGGTTCACGCAGAGATCGAACCTGCACTCGCACCGCCGCGCCACGCATCTGGACGACAAGCGCTACCACTGCACCCACTGCCCCAAGCGGTTCAAACGACGCAGGTACACACTACGACAAGCGCTACCACTGCACCCACTGCCCCAAGCGGTTCAAACGACGCAGGTACACACTACGACAAGCGCTACCACTGCACCCACTGCCCCAAGCGGTTCAAACGACGCAGGTACACACTACGACAAGCGCTACCACTGCACCCACTGCCCCAAGCGGTTCAAACGACGCAGGTACACACTACGACAAGCGCTACCACTGCACCCACTGCCCCAAGCGGTTCAAACGACGCAGGTACACACTACGACAAGCGCTACCACTGCACCCACTGCCCCAAGCGGTTCAAACGACGCAGGTACACACTACGACAAGCGCTACCACTGCACCCACTGCCCCAAGCGGTTCAAACGACGCAGGTACACACTACGACAAGCGCTACCACTGCACCCACTGCCCCAAGCGGTTCAAACGACGCAGGTACACACTACGACAAGCGCTACCACTGCACCCACTGCCCCAAGCGGTTCAAACGACGCAGGTACACACTACGACAAGCGCTACCACTGCACCCACTGCCCCAAGCGGTTCAAACGACGCAGGTACACACTACGACAAGCGCTACCACTGCACCCACTGCCCCAAGCGGTTCAAACGACGCAGGTACACACTACGACAAGCGCTACCACTGCACCCACTGCCCCAAGCGGTTCAAACGACGCAGGTACACACTACGACAAGCGCTACCACTGCACCCACTGCCCCAAGCGGTTCAAACGACGCAGGTACACACTACGACAAGCGCTACCACTGCACCCACTGCCCCAAGCGGTTCAAACGACGCAGGTACACACTACGACAAGCGCTACCACTGCACCCACTGCCCCAAGCGGTTCAAACGACGCAGGTACACACTACGACAAGCGCTACCACTGCACCCACTGCCCCAAGCGGTTCAAACGACGCAGGTACACACTACGACAAGCGCTACCACTGCACCCACTGCCCCAAGCGGTTCAAACGACGCAGGTACACACTACGACAAGCGCTACCACTGCACCCACTGCCCCAAGCGGTTCAAACGACGCAGGTACACACTACGACAAGCGCTACCACTGCACCCACTGCCCCAAGCGGTTCAAACGACGCAGGTACACACTACGACAAGCGCTACCACTGCACCCACTGCCCCAAGCGGTTCAAACGACGCAGGTACACACTACGACAAGCGCTACCACTGCACCCACTGCCCCAAGCGGTTCAAACGACGCAGGTACACACTACGACAAGCGCTACCACTGCACCCACTGCCCCAAGCGGTTCAAACGACGCAGGTACACACTACGACAAGCGCTACCACTGCACCCACTGCCCCAAGCGGTTCAAACGACGCAGGTACACACTACGACAAGCGCTACCACTGCACCCACTGCCCCAAGCGGTTCAAACGACGCAGGTACACACTACGACAAGCGCTACCACTGCACCCACTGCCCCAAGCGGTTCAAACGACGCAGGTACACACTACGACAAGCGCTACCACTGCACCCACTGCCCCAAGCGGTTCAAACGACGCAGGTACACACTACGACAAGCGCTACCACTGCACCCACTGCCCCAAGCGGTTCAAACGACGCAGGTACACACTACGACAAGCGCTACCACTGCACCCACTGCCCCAAGCGGTTCAAACGACGCAGGTACACACTACGACAAGCGCTACCACTGCACCCACTGCCCCAAGCGGTTCAAACGACGCAGGTACACACTACGACAAGCGCTACCACTGCACCCACTGCCCCAAGCGGTTCAAACGACGCAGGTACACACTACGACAAGCGCTACCACTGCACCCACTGCCCCAAGCGGTTCAAACGACGCAGGTACACACTACGACAAGCGCTACCACTGCACCCACTGCCCCAAGCGGTTCAAACGACGCAGGTACACACTACGACAAGCGCTACCACTGCACCCACTGCCCCAAGCGGTTCAAACGACGCAGGTACACACTACGACAAGCGCTACCACTGCACCCACTGCCCCAAGCGGTTCAAACGACGCAGGTACACACTACGACAAGCGCTACCACTGCACCCACTGCCCCAAGCGGTTCAAACGACGCAGGTACACACTACGACAAGCGCTACCACTGCACCCACTGCCCCAAGCGGTTCAAACGACGCAGGTACACACTACGACAAGCGCTACCACTGCACCCACTGCCCCAAGCGGTTCAAACGACGCAGGTACACACTACGACAAGCGCTACCACTGCACCCACTGCCCCAAGCGGTTCAAACGACGCAGGTACACACTACGACAAGCGCTACCACTGCACCCACTGCCCCAAGCGGTTCAAACGACGCAGGTACACACTACGACAAGCGCTACCACTGCACCCACTGCCCCAAGCGGTTCAAACGACGCAGGTACACACTACGACAAGCGCTACCACTGCACCCACTGCCCCAAGCGGTTCAAACGACGCAGGTACACACTACGACAAGCGCTACCACTGCACCCACTGCCCCAAGCGGTTCAAACGACGCAGGTACACACTACGACAAGCGCTACCACTGCACCCACTGCCCCAAGCGGTTCAAACGACGCAGGTACACACTACGACAAGCGCTACCACTGCACCCACTGCCCCAAGCGGTTCAAACGACGCAGGTACACACTACGACAAGCGCTACCACTGCACCCACTGCCCCAAGCGGTTCAAACGACGCAGGTACACACTACGACAAGCGCTACCACTGCACCCACTGCCCCAAGCGGTTCAAACGACGCAGGTACACACTACGACAAGCGCTACCACTGCACCCACTGCCCCAAGCGGTTCAAACGACGCAGGTACACACTACGACAAGCGCTACCACTGCACCCACTGCCCCAAGCGGTTCAAACGACGCAGGTACACACTACGACAAGCGCTACCACTGCACCCACTGCCCCAAGCGGTTCAAACGACGCAGGCTGCTGGAGTACCACATAAAGTCTATGCACACGGGCGAGCGGCCGCTGGTGTACTATATCATGTGTGTATTCGGTTGTGTCAGGCTGCTGGAGTACCACATAAAGTCTATGCACACGGGCGAGCGGCCGCTGGTGTACTATATCATGTGTGTATTCGGTTGTGTCAGGCTGCTGGAGTACCACATAAAGTCTATGCACACGGGCGAGCGGCCGCTGGTGTACTATATCATGTGTGTATTCGGTTGTGTCAGGCTGCTGGAGTACCACATAAAGTCTATGCACACGGGCGAGCGGCCGCTGGTGTACTATATCATGTGTGTATTCGGTTGTGTCAGGCTGCTGGAGTACCACATAAAGTCTATGCACACGGGCGAGCGGCCGCTGGTGTACTATATCATGTGTGTATTCGGTTGTGTCAGGCTGCTGGAGTACCACATAAAGTCTATGCACACGGGCGAGCGGCCGCTGGTGTACTATATCATGTGTGTATTCGGTTGTGTCAGGCTGCTGGAGTACCACATAAAGTCTATGCACACGGGCGAGCGGCCGCTGGTGTACTATATCATGTGTGTATTCGGTTGTGTCAGGCTGCTGGAGTACCACATAAAGTCTATGCACACGGGCGAGCGGCCGCTGGTGTACTATATCATGTGTGTATTCGGTTGTGTCAGGCTGCTGGAGTACCACATAAAGTCTATGCACACGGGCGAGCGGCCGCTGGTGTACTATATCATGTGTGTATTCGGTTGTGTCAGGCTGCTGGAGTACCACATAAAGTCTATGCACACGGGCGAGCGGCCGCTGGTGTACTATATCATGTGTGTATTCGGTTGTGTCAGGCTGCTGGAGTACCACATAAAGTCTATGCACACGGGCGAGCGGCCGCTGGTGTACTATATCATGTGTGTATTCGGTTGTGTCAGGCTGCTGGAGTACCACATAAAGTCTATGCACACGGGCGAGCGGCCGCTGGTGTACTATATCATGTGTGTATTCGGTTGTGTCAGGCTGCTGGAGTACCACATAAAGTCTATGCACACGGGCGAGCGGCCGCTGGTGTACTATATCATGTGTGTATTCGGTTGTGTCAGGCTGCTGGAGTACCACATAAAGTCTATGCACACGGGCGAGCGGCCGCTGGTGTACTATATCATGTGTGTATTCGGTTGTGTCAGGCTGCTGGAGTACCACATAAAGTCTATGCACACGGGCGAGCGGCCGCTGGTGTACTATATCATGTGTGTATTCGGTTGTGTCAGGCTGCTGGAGTACCACATAAAGTCTATGCACACGGGCGAGCGGCCGCTGGTGTACTATATCATGTGTGTATTCGGTTGTGTCAGGCTGCTGGAGTACCACATAAAGTCTATGCACACGGGCGAGCGGCCGCTGGTGTACTATATCATGTGTGTATTCGGTTGTGTCAGGCTGCTGGAGTACCACATAAAGTCTATGCACACGGGCGAGCGGCCGCTGGTGTACTATATCATGTGTGTATTCGGTTGTGTCAGGCTGCTGGAGTACCACATAAAGTCTATGCACACGGGCGAGCGGCCGCTGGTGTACTATATCATGTGTGTATTCGGTTGTGTCAGGCTGCTGGAGTACCACATAAAGTCTATGCACACGGGCGAGCGGCCGCTGGTGTACTATATCATGTGTGTATTCGGTTGTGTCAGGCTGCTGGAGTACCACATAAAGTCTATGCACACGGGCGAGCGGCCGCTGGTGTACTATATCATGTGTGTATTCGGTTGTGTCAGGCTGCTGGAGTACCACATAAAGTCTATGCACACGGGCGAGCGGCCGCTGGTGTACTATATCATGTGTGTATTCGGTTGTGTCAGGCTGCTGGAGTACCACATAAAGTCTATGCACACGGGCGAGCGGCCGCTGGTGTACTATATCATGTGTGTATTCGGTTGTGTCAGGCTGCTGGAGTACCACATAAAGTCTATGCACACGGGCGAGCGGCCGCTGGTGTACTATATCATGTGTGTATTCGGTTGTGTCAGGCTGCTGGAGTACCACATAAAGTCTATGCACACGGGCGAGCGGCCGCTGGTGTACTATATCATGTGTGTATTCGGTTGTGTCAGGCTGCTGGAGTACCACATAAAGTCTATGCACACGGGCGAGCGGCCGCTGGTGTACTATATCATGTGTGTATTCGGTTGTGTCAGGCTGCTGGAGTACCACATAAAGTCTATGCACACGGGCGAGCGGCCGCTGGTGTACTATATCATGTGTGTATTCGGTTGTGTCAGGCTGCTGGAGTACCACATAAAGTCTATGCACACGGGCGAGCGGCCGCTGGTGTACTATATCATGTGTGTATTCGGTTGTGTCAGGCTGCTGGAGTACCACATAAAGTCTATGCACACGGGCGAGCGGCCGCTGGTGTACTATATCATGTGTGTATTCGGTTGTGTCAGGCTGCTGGAGTACCACATAAAGTCTATGCACACGGGCGAGCGGCCGCTGGTGTACTATATCATGTGTGTATTCGGTTGTGTCAGGCTGCTGGAGTACCACATAAAGTCTATGCACACGGGCGAGCGGCCGCTGGTGTACTATATCATGTGTGTATTCGGTTGTGTCAGGCTGCTGGAGTACCACATAAAGTCTATGCACACGGGCGAGCGGCCGCTGGTGTACTATATCATGTGTGTATTCGGTTGTGTCAGGCTGCTGGAGTACCACATAAAGTCTATGCACACGGGCGAGCGGCCGCTGGTGTACTATATCATGTGTGTATTCGGTTGTGTCAGGCTGCTGGAGTACCACATAAAGTCTATGCACACGGGCGAGCGGCCGCTGGTGTACTATATCATGTGTGTATTCGGTTGTGTCAGGCTGCTGGAGTACCACATAAAGTCTATGCACACGGGCGAGCGGCCGCTGGTGTACTATATCATGTGTGTATTCGGTTGTGTCAGGCTGCTGGAGTACCACATAAAGTCTATGCACACGGGCGAGCGGCCGCTGGTGTACTATATCATGTGTGTATTCGGTTGTGTCAGGCTGCTGGAGTACCACATAAAGTCTATGCACACGGGCGAGCGGCCGCTGGTGTACTATATCATGTGTGTATTCGGTTGTGTCAGGCTGCTGGAGTACCACATAAAGTCTATGCACACGGGCGAGCGGCCGCTGGTGTACTATATCATGTGTGTATTCGGTTGTGTCAGGCTGCTGGAGTACCACATAAAGTCTATGCACACGGGCGAGCGGCCGCTGGTGTACTATATCATGTGTGTATTCGGTTGTGTCAGGCTGCTGGAGTACCACATAAAGTCTATGCACACGGGCGAGCGGCCGCTGGTGTACTATATCATGTGTGTATTCGGTTGTGTCAGGCTGCTGGAGTACCACATAAAGTCTATGCACACGGGCGAGCGGCCGCTGGTGTACTATATCATGTGTGTATTCGGTTGTGTCAGGCTGCTGGAGTACCACATAAAGTCTATGCACACGGGCGAGCGGCCGCTGGTGTACTATATCATGTGTGTATTCGGTTGTGTCAGGCTGCTGGAGTACCACATAAAGTCTATGCACACGGGCGAGCGGCCGCTGGTGTACTATATCATGTGTGTATTCGGTTGTGTCAGGCTGCTGGAGTACCACATAAAGTCTATGCACACGGGCGAGCGGCCGCTGGTGTACTATATCATGTGTGTATTCGGTTGTGTCAGGCTGCTGGAGTACCACATAAAGTCTATGCACACGGGCGAGCGGCCGCTGGTGTACTATATCATGTGTGTATTCGGTTGTGTCAGGCTGCTGGAGTACCACATAAAGTCTATGCACACGGGCGAGCGGCCGCTGGTGTACTATATCATGTGTGTATTCGGTTGTGTCAGGCTGCTGGAGTACCACATAAAGTCTATGCACACGGGCGAGCGGCCGCTGGTGTACTATATCATGTGTGTATTCGGTTGTGTCAGGCTGCTGGAGTACCACATAAAGTCTATGCACACGGGCGAGCGGCCGCTGGTGTACTATATCATGTGTGTATTCGGTTGTGTCAGGCTGCTGGAGTACCACATAAAGTCTATGCACACGGGCGAGCGGCCGCTGGTGTACTATATCATGTGTGTATTCGGTTGTGTCAGGCTGCTGGAGTACCACATAAAGTCTATGCACACGGGCGAGCGGCCGCTGGTGTACTATATCATGTGTGTATTCGGTTGTGTCAGGCTGCTGGAGTACCACATAAAGTCTATGCACACGGGCGAGCGGCCGCTGGTGTACTATATCATGTGTGTATTCGGTTGTGTCAGGCTGCTGGAGTACCACATAAAGTCTATGCACACGGGCGAGCGGCCGCTGGTGTACTATATCATGTGTGTATTCGGTTGTGTCAGGCTGCTGGAGTACCACATAAAGTCTATGCACACGGGCGAGCGGCCGCTGGTGTACTATATCATGTGTGTATTCGGTTGTGTCAGGCTGCTGGAGTACCACATAAAGTCTATGCACACGGGCGAGCGGCCGCTGGTGTACTATATCATGTGTGTATTCGGTTGTGTCAGGCTGCTGGAGTACCACATAAAGTCTATGCACACGGGCGAGCGGCCGCTGGTGTACTATATCATGTGTGTATTCGGTTGTGTCAGGCTGCTGGAGTACCACATAAAGTCTATGCACACGGGCGAGCGGCCGCTGGTGTACTATATCATGTGTGTATTCGGTTGTGTCAGGCTGCTGGAGTACCACATAAAGTCTATGCACACGGGCGAGCGGCCGCTGGTGTACTATATCATGTGTGTATTCGGTTGTGTCAGGCTGCTGGAGTACCACATAAAGTCGTCGCACACGGGCGAGCGGCCGCTGGTGTACTATATCATGTGTGTATTCGGTTGTGTCAGGCTGCTGGAGTACCACATAAAGTCGTCGCACACGGGCGAGCGGCCGCTGGTGTACTATATCATGTGTGTATTCGGTTGTGTCAGGCTGCTGGAGTACCACATAAAGTCTATGCACACGGGCGAGCGGCCGCTGGTGTACTATATCATGTGTGTATTCGGTTGTGTCAGGCTGCTGGAGTACCACATAAAGTCTATGCACACGGGCGAGCGGCCGCTGGTGTACTATATCATGTGTGTATTCGGTTGTGTCAGGCTGCTGGAGTACCACATAAAGTCGTCGCACACGGGCGAGCGGCCGCTGGTGTACTATATCATGTGTGTATTCGGTTGTGTCAGGCTGCTGGAGTACCACATAAAGTCTATGCACACGGGCGAGCGGCCGCTGGTGTACTATATCATGTGTGTATTCGGTTGTGTCAGGCTGCTGGAGTACCACATAAAGTCTATGCACACGGGCGAGCGGCCGCTGGTGTACTATATCATGTGTGTATTCGGTTGTGTCAGGCTGCTGGAGTACCACATAAAGTCGTCGCACACGGGCGAGCGGCCGCTGGTGTACTATATCATGTGTGTATTCGGTTGTGTCAGGCTGCTGGAGTACCACATAAAGTCTATGCACACGGGCGAGCGGCCGCTGGTGTACTATATCATGTGTGTATTCGGTTGTGTCAGGCTGCTGGAGTACCACATAAAGTCTATGCACACGGGCGAGCGGCCGCTGGTGTACTATATCATGTGTGTATTCGGTTGTGTCAGGCTGCTGGAGTACCACATAAAGTCGTCGCACACGGGCGAGCGGCCGCTGGTGTACTATATCATGTGTGTATTCGGTTGTGTCAGGCTGCTGGAGTACCACATAAAGTCTATGCACACGGGCGAGCGGCCGCTGGTGTACTATATCATGTGTGTATTCGGTTGTGTCAGGCTGCTGGAGTACCACATAAAGTCGTCGCACACGGGCGAGCGGCCGCTGGTGTACTATATCATGTGTGTATTCGGTTGTGTCAGGCTGCTGGAGTACCACATAAAGTCTATGCACACGGGCGAGCGGCCGCTGGTGTACTATATCATGTGTGTATTCGGTTGTGTCAGGCTGCTGGAGTACCACATAAAGTCGTCGCACACGGGCGAGCGGCCGCTGGTGTACTATATCATGTGTGTATTCGGTTGTGTCAGGCTGCTGGAGTACCACATAAAGTCGTCGCACACGGGCGAGCGGCCGCTGGTGTACTATATCATGTGTGTATTCGGTTGTGTCAGGCTGCTGGAGTACCACATAAAGTCTATGCACACGGGCGAGCGGCCGCTGGTGTACTATATCATGTGTGTATTCGGTTGTGTCAGGCTGCTGGAGTACCACATAAAGTCGTCGCACACGGGCGAGCGGCCGCTGGTGTACTATATCATGTGTGTATTCGGTTGTGTCAGGCTGCTGGAGTACCACATAAAGTCGTCGCACACGGGCGAGCGGCCGCTGGTGTACTATATCATGTGTGTATTCGGTTGTGTCAGGCTGCTGGAGTACCACATAAAGTCGTCGCACACGGGCGAGCGGCCGCTGGTGTACTATATCATGTGTGTATTCGGTTGTGTCAGGCTGCTGGAGTACCACATAAAGTCTATGCACACGGGCGAGCGGCCGCTGGTGTACTATATCATGTGTGTATTCGGTTGTGTCAGGCTGCTGGAGTACCACATAAAGTCTATGCACACGGGCGAGCGGCCGCTGGTGTACTATATCATGTGTGTATTCGGTTGTGTCAGGCTGCTGGAGTACCACATAAAGTCGTCGCACACGGGCGAGCGGCCGCTGGTGTACTATATCATGTGTGTATTCGGTTGTGTCAGGCTGCTGGAGTACCACATAAAGTCTATGCACACGGGCGAGCGGCCGCTGGTGTACTATATCATGTGTGTATTCGGTTGTGTCAGGCTGCTGGAGTACCACATAAAGTCGTCGCACACGGGCGAGCGGCCGCTGGTGTACTATATCATGTGTGTATTCGGTTGTGTCAGGCTGCTGGAGTACCACATAAAGTCTATGCACACGGGCGAGCGGCCGCTGGTGTACTATATCATGTGTGTATTCGGTTGTGTCAGGCTGCTGGAGTACCACATAAAGTCGTCGCACACGGGCGAGCGGCCGCTGGTGTACTATATCATGTGTGTATTCGGTTGTGTCAGGCTGCTGGAGTACCACATAAAGTCTATGCACACGGGCGAGCGGCCGCTGGTGTACTATATCATGTGTGTATTCGGTTGTGTCAGGCTGCTGGAGTACCACATAAAGTCGTCGCACACGGGCGAGCGGCCGCTGGTGTACTATATCATGTGTGTATTCGGTTGTGTCAGGCTGCTGGAGTACCACATAAAGTCTATGCACACGGGCGAGCGGCCGCTGGTGTACTATATCATGTGTGTATTCGGTTGTGTCAGGCTGCTGGAGTACCACATAAAGTCTATGCACACGGGCGAGCGGCCGCTGGTGTACTATATCATGTGTGTATTCGGTTGTGTCAGGCTGCTGGAGTACCACATAAAGTCGTCGCACACGGGCGAGCGGCCGCTGGTGTACTATATCATGTGTGTATTCGGTTGTGTCAGGCTGCTGGAGTACCACATAAAGTCGTCGCACACGGGCGAGCGGCCGCTGGTGTACTATATCATGTGTGTATTCGGTTGTGTCAGGCTGCTGGAGTACCACATAAAGTCTATGCACACGGGCGAGCGGCCGCTGGTGTACTATATCATGTGTGTATTCGGTTGTGTCAGGCTGCTGGAGTACCACATAAAGTCTATGCACACGGGCGAGCGGCCGCTGGTGTACTATATCATGTGTGTATTCGGTTGTGTCAGGCTGCTGGAGTACCACATAAAGTCTATGCACACGGGCGAGCGGCCGCTGGTGTACTATATCATGTGTGTATTCGGTTGTGTCAGGCTGCTGGAGTACCACATAAAGTCTATGCACACGGGCGAGCGGCCGCTGGTGTACTATATCATGTGTGTATTCGGTTGTGTCAGGCTGCTGGAGTACCACATAAAGTCTATGCACACGGGCGAGCGGCCGCTGGTGTACTATATCATGTGTGTATTCGGTTGTGTCAGGCTGCTGGAGTACCACATAAAGTCTATGCACACGGGCGAGCGGCCGCTGGTGTACTATATCATGTGTGTATTCGGTTGTGTCAGGCTGCTGGAGTACCACATAAAGTCTATGCACACGGGCGAGCGGCCGCTGGTGTACTATATCATGTGTGTATTCGGTTGTGTCAGGCTGCTGGAGTACCACATAAAGTCTATGCACACGGGCGAGCGGCCGCTGGTGTACTATATCATGTGTGTATTCGGTTGTGTCAGGCTGCTGGAGTACCACATAAAGTCTATGCACACGGGCGAGCGGCCGCTGGTGTACTATATCATGTGTGTATTCGGTTGTGTCAGGCTGCTGGAGTACCACATAAAGTCTATGCACACGGGCGAGCGGCCGCTGGTGTACTATATCATGTGTGTATTCGGTTGTGTCAGGCTGCTGGAGTACCACATAAAGTCTATGCACACGGGCGAGCGGCCGCTGGTGTACTATATCATGTGTGTATTCGGTTGTGTCAGGCTGCTGGAGTACCACATAAAGTCTATGCACACGGGCGAGCGGCCGCTGGTGTACTATATCATGTGTGTATTCGGTTGTGTCAGGCTGCTGGAGTACCACATAAAGTCTATGCACACGGGCGAGCGGCCGCTGGTGTACTATATCATGTGTGTATTCGGTTGTGTCAGGCTGCTGGAGTACCACATAAAGTCGTCGCACACGGGCGAGCGGCCGCTGGTGTGCGGCGTGTGCAACGCGTCCTTCGTGTACCCCGAGCACTACAAGAAGCACGTGCGCATACACAGCGGCGAGCGGCCATACGTCTGCGAGATCTGCGGCAAGTCGTTCAACTCGCGCGACAACCGCAACACGCACCGGTTCGTGCACAGCGACAAGAAACCGTACGAGTGCGTGCAGTGCGGCGCCGGCTACATGCGCAAGCAGCTGCTCTACGCGCACATGAACACCAGCCCGTACGAGTGCGTGCAGTGCGGCGCCGGCTACATGCGCAAGCAGCTGCTCTACGCGCACATGAACACCAGCTGCGGCGCCGGCTACATGCGCAAGCAGCTGCTCTACGCGCACATGAACACCAGCTGCGGCGCCGGCTACATGCGCAAGCAGCTGCTCTACGCGCACATGAACACCAGCTGCGGCGCCGGCTACATGCGCAAGCAGCTGCTCTACGCGCACATGAACACCAGCTGCGGCGCCGGCTACATGCGCAAGCAGCTGCTCTACGCGCACATGAACACCAGCTGCGGCGCCGGCTACATGCGCAAGCAGCTGCTCTACGCGCACATGAACACCAGCTGCGGCGCCGGCTACATGCGCAAGCAGCTGCTCTACGCGCACATGAACACCAGCTGCGGCGCCGGCTACATGCGCAAGCAGCTGCTCTACGCGCACATGAACACCAGCTGCGGCGCCGGCTACATGCGCAAGCAGCTGCTCTACGCGCACATGAACACCAGCTGCGGCGCCGGCTACATGCGCAAGCAGCTGCTCTACGCGCACATGAACACCAGCGTGAGTACACCACACTACTACACTACACCACACCACACTACACTACAAGCAGCCGTACGAGTGCGTGCAGTGCGGCGCCGGCTACATGCGCAAGCAGCTGCTCTACGCGCACATGAACACCAGCAGCAAGCTTCTTTGAATCTAATCCAAAATGGCGATGACAACGGTCTGCTGACTATACACAATATAGAGGAGAGGCCGGTGGGGACAATCCTGGAATCCATAGACAGTATAGACCCCGACCAGTTGGGAGATCAAACCGAGATCGTGGCCAACTGCGAGGGAGGAGGGGTGGTGCGGCTCATACAGGTGAAGCTGCCCGACGGGAACAGCGGCTGGGTCGCGCTCGACCGGTGA
Protein Sequence
MNYCCLICNNRNGLALRNATSIFAETNTLPSGKQVAEVLCEILGKTVQEKNAHANILCKKCFRSCFDYDSMQVRLQAIKYQLMDQFKQSLSSINLDYETYEQQGTIAPKPSPRKLVLPASKLQPIPPDLLLKVGKMAALSKHSIVIPKPKPVSSSTVNLKVTVGSSVLTHTIKTTTAKAAETETVLSLSNTLKNEIESMVASKESLPQIINELKTENTDDSMELDDDPLTVVTTSEGGDLVLQVEGAETESNEVSLEEYMQLGGGGARDYVLGTCQDDDDDEDDDDDEHTIVLNSETGSILRMVSGQKLVYEDGEISFVMPDDEQRADADTDPADTADTADTADTADNDNDQPDSQDSNDESQIELQVSGDEETANAIIAAAQEQGGAFIKVESGEMYRVKSVLAGGALQLRAARAHAQVHHAAAQLLARDGDNYRCLLCNNNHDDNDDNEEAVVGNADEIMQHLKSVHDARAYICRACGATMRKRSDYTKHMDTHKPKQSVLGSGRSKQYPCTVCGKGFSSRTLLRDHQHQHSGARPYACAHCNKAFGSKYTLQAHLKTHQDRPRPFKCGKCDKSFLTQQNLNQHEKTHLGIKDFVCNVCNKAFSTQHNLEVHGVVHSGNKAFRCSACGKAFARRAELRDHVRIHTGERPFACDICPARFTQRSNLHSHRRATHLDDKRYHCTHCPKRFKRRRYTLRQALPLHPLPQAVQTTQVHTTTSATTAPTAPSGSNDAGTHYDKRYHCTHCPKRFKRRRYTLRQALPLHPLPQAVQTTQVHTTTSATTAPTAPSGSNDAGTHYDKRYHCTHCPKRFKRRRYTLRQALPLHPLPQAVQTTQVHTTTSATTAPTAPSGSNDAGTHYDKRYHCTHCPKRFKRRRYTLRQALPLHPLPQAVQTTQVHTTTSATTAPTAPSGSNDAGTHYDKRYHCTHCPKRFKRRRYTLRQALPLHPLPQAVQTTQVHTTTSATTAPTAPSGSNDAGTHYDKRYHCTHCPKRFKRRRYTLRQALPLHPLPQAVQTTQVHTTTSATTAPTAPSGSNDAGTHYDKRYHCTHCPKRFKRRRYTLRQALPLHPLPQAVQTTQVHTTTSATTAPTAPSGSNDAGTHYDKRYHCTHCPKRFKRRRYTLRQALPLHPLPQAVQTTQVHTTTSATTAPTAPSGSNDAGTHYDKRYHCTHCPKRFKRRRYTLRQALPLHPLPQAVQTTQVHTTTSATTAPTAPSGSNDAGTHYDKRYHCTHCPKRFKRRRYTLRQALPLHPLPQAVQTTQVHTTTSATTAPTAPSGSNDAGTHYDKRYHCTHCPKRFKRRRYTLRQALPLHPLPQAVQTTQVHTTTSATTAPTAPSGSNDAGTHYDKRYHCTHCPKRFKRRRYTLRQALPLHPLPQAVQTTQVHTTTSATTAPTAPSGSNDAGTHYDKRYHCTHCPKRFKRRRYTLRQALPLHPLPQAVQTTQVHTTTSATTAPTAPSGSNDAGTHYDKRYHCTHCPKRFKRRRYTLRQALPLHPLPQAVQTTQVHTTTSATTAPTAPSGSNDAGTHYDKRYHCTHCPKRFKRRRYTLRQALPLHPLPQAVQTTQVHTTTSATTAPTAPSGSNDAGTHYDKRYHCTHCPKRFKRRRYTLRQALPLHPLPQAVQTTQVHTTTSATTAPTAPSGSNDAGTHYDKRYHCTHCPKRFKRRRLLEYHIKSMHTGERPLVYYIMCVFGCVRLLEYHIKSMHTGERPLVYYIMCVFGCVRLLEYHIKSMHTGERPLVYYIMCVFGCVRLLEYHIKSMHTGERPLVYYIMCVFGCVRLLEYHIKSMHTGERPLVYYIMCVFGCVRLLEYHIKSMHTGERPLVYYIMCVFGCVRLLEYHIKSMHTGERPLVYYIMCVFGCVRLLEYHIKSMHTGERPLVYYIMCVFGCVRLLEYHIKSMHTGERPLVYYIMCVFGCVRLLEYHIKSMHTGERPLVYYIMCVFGCVRLLEYHIKSMHTGERPLVYYIMCVFGCVRLLEYHIKSMHTGERPLVYYIMCVFGCVRLLEYHIKSMHTGERPLVYYIMCVFGCVRLLEYHIKSMHTGERPLVYYIMCVFGCVRLLEYHIKSMHTGERPLVYYIMCVFGCVRLLEYHIKSMHTGERPLVYYIMCVFGCVRLLEYHIKSMHTGERPLVYYIMCVFGCVRLLEYHIKSMHTGERPLVYYIMCVFGCVRLLEYHIKSMHTGERPLVYYIMCVFGCVRLLEYHIKSMHTGERPLVYYIMCVFGCVRLLEYHIKSMHTGERPLVYYIMCVFGCVRLLEYHIKSMHTGERPLVYYIMCVFGCVRLLEYHIKSMHTGERPLVYYIMCVFGCVRLLEYHIKSMHTGERPLVYYIMCVFGCVRLLEYHIKSMHTGERPLVYYIMCVFGCVRLLEYHIKSMHTGERPLVYYIMCVFGCVRLLEYHIKSMHTGERPLVYYIMCVFGCVRLLEYHIKSMHTGERPLVYYIMCVFGCVRLLEYHIKSMHTGERPLVYYIMCVFGCVRLLEYHIKSMHTGERPLVYYIMCVFGCVRLLEYHIKSMHTGERPLVYYIMCVFGCVRLLEYHIKSMHTGERPLVYYIMCVFGCVRLLEYHIKSMHTGERPLVYYIMCVFGCVRLLEYHIKSMHTGERPLVYYIMCVFGCVRLLEYHIKSMHTGERPLVYYIMCVFGCVRLLEYHIKSMHTGERPLVYYIMCVFGCVRLLEYHIKSMHTGERPLVYYIMCVFGCVRLLEYHIKSMHTGERPLVYYIMCVFGCVRLLEYHIKSMHTGERPLVYYIMCVFGCVRLLEYHIKSMHTGERPLVYYIMCVFGCVRLLEYHIKSMHTGERPLVYYIMCVFGCVRLLEYHIKSMHTGERPLVYYIMCVFGCVRLLEYHIKSMHTGERPLVYYIMCVFGCVRLLEYHIKSMHTGERPLVYYIMCVFGCVRLLEYHIKSMHTGERPLVYYIMCVFGCVRLLEYHIKSMHTGERPLVYYIMCVFGCVRLLEYHIKSMHTGERPLVYYIMCVFGCVRLLEYHIKSMHTGERPLVYYIMCVFGCVRLLEYHIKSMHTGERPLVYYIMCVFGCVRLLEYHIKSMHTGERPLVYYIMCVFGCVRLLEYHIKSMHTGERPLVYYIMCVFGCVRLLEYHIKSMHTGERPLVYYIMCVFGCVRLLEYHIKSMHTGERPLVYYIMCVFGCVRLLEYHIKSMHTGERPLVYYIMCVFGCVRLLEYHIKSMHTGERPLVYYIMCVFGCVRLLEYHIKSMHTGERPLVYYIMCVFGCVRLLEYHIKSMHTGERPLVYYIMCVFGCVRLLEYHIKSSHTGERPLVYYIMCVFGCVRLLEYHIKSSHTGERPLVYYIMCVFGCVRLLEYHIKSMHTGERPLVYYIMCVFGCVRLLEYHIKSMHTGERPLVYYIMCVFGCVRLLEYHIKSSHTGERPLVYYIMCVFGCVRLLEYHIKSMHTGERPLVYYIMCVFGCVRLLEYHIKSMHTGERPLVYYIMCVFGCVRLLEYHIKSSHTGERPLVYYIMCVFGCVRLLEYHIKSMHTGERPLVYYIMCVFGCVRLLEYHIKSMHTGERPLVYYIMCVFGCVRLLEYHIKSSHTGERPLVYYIMCVFGCVRLLEYHIKSMHTGERPLVYYIMCVFGCVRLLEYHIKSSHTGERPLVYYIMCVFGCVRLLEYHIKSMHTGERPLVYYIMCVFGCVRLLEYHIKSSHTGERPLVYYIMCVFGCVRLLEYHIKSSHTGERPLVYYIMCVFGCVRLLEYHIKSMHTGERPLVYYIMCVFGCVRLLEYHIKSSHTGERPLVYYIMCVFGCVRLLEYHIKSSHTGERPLVYYIMCVFGCVRLLEYHIKSSHTGERPLVYYIMCVFGCVRLLEYHIKSMHTGERPLVYYIMCVFGCVRLLEYHIKSMHTGERPLVYYIMCVFGCVRLLEYHIKSSHTGERPLVYYIMCVFGCVRLLEYHIKSMHTGERPLVYYIMCVFGCVRLLEYHIKSSHTGERPLVYYIMCVFGCVRLLEYHIKSMHTGERPLVYYIMCVFGCVRLLEYHIKSSHTGERPLVYYIMCVFGCVRLLEYHIKSMHTGERPLVYYIMCVFGCVRLLEYHIKSSHTGERPLVYYIMCVFGCVRLLEYHIKSMHTGERPLVYYIMCVFGCVRLLEYHIKSMHTGERPLVYYIMCVFGCVRLLEYHIKSSHTGERPLVYYIMCVFGCVRLLEYHIKSSHTGERPLVYYIMCVFGCVRLLEYHIKSMHTGERPLVYYIMCVFGCVRLLEYHIKSMHTGERPLVYYIMCVFGCVRLLEYHIKSMHTGERPLVYYIMCVFGCVRLLEYHIKSMHTGERPLVYYIMCVFGCVRLLEYHIKSMHTGERPLVYYIMCVFGCVRLLEYHIKSMHTGERPLVYYIMCVFGCVRLLEYHIKSMHTGERPLVYYIMCVFGCVRLLEYHIKSMHTGERPLVYYIMCVFGCVRLLEYHIKSMHTGERPLVYYIMCVFGCVRLLEYHIKSMHTGERPLVYYIMCVFGCVRLLEYHIKSMHTGERPLVYYIMCVFGCVRLLEYHIKSMHTGERPLVYYIMCVFGCVRLLEYHIKSMHTGERPLVYYIMCVFGCVRLLEYHIKSSHTGERPLVCGVCNASFVYPEHYKKHVRIHSGERPYVCEICGKSFNSRDNRNTHRFVHSDKKPYECVQCGAGYMRKQLLYAHMNTSPYECVQCGAGYMRKQLLYAHMNTSCGAGYMRKQLLYAHMNTSCGAGYMRKQLLYAHMNTSCGAGYMRKQLLYAHMNTSCGAGYMRKQLLYAHMNTSCGAGYMRKQLLYAHMNTSCGAGYMRKQLLYAHMNTSCGAGYMRKQLLYAHMNTSCGAGYMRKQLLYAHMNTSCGAGYMRKQLLYAHMNTSVSTPHYYTTPHHTTLQAAVRVRAVRRRLHAQAAALRAHEHQQQASLNLIQNGDDNGLLTIHNIEERPVGTILESIDSIDPDQLGDQTEIVANCEGGGVVRLIQVKLPDGNSGWVALDR

Similar Transcription Factors

Sequence clustering based on sequence similarity using MMseqs2

100% Identity
-
90% Identity
-
80% Identity
-