Basic Information

Gene Symbol
maea
Assembly
GCA_905147815.1
Location
LR990630.1:3948088-3985015[+]

Transcription Factor Domain

TF Family
CTF_NFI
Domain
CTF/NFI and MH1 domain
PFAM
PF00859
TF Group
Unclassified Structure
Description
Nuclear factor I (NF-I) or CCAAT box-binding transcription factor (CTF) [2, 1, 5] (also known as TGGCA-binding proteins) are a family of vertebrate nuclear proteins which recognise and bind, as dimers, the palindromic DNA sequence 5'-TGGCANNNTGCCA-3'. This family was first described for its role in stimulating the initiation of adenovirus DNA replication [6]. In vertebrates there are four members NFIA, NFIB, NFIC, and NFIX and an orthologue from Caenorhabditis elegans has been described, called Nuclear factor I family protein (NFI-I) [4]. The CTF/NF-I proteins are individually capable of activating transcription and DNA replication, thus they function by regulating cell proliferation and differentiation. They are involved in normal development and have been associated with developmental abnormalities and cancer in humans [5]. In a given species, there are a large number of different CTF/NF-I proteins, generated both by alternative splicing and by the occurrence of four different genes. CTF/NF-1 proteins contain 400 to 600 amino acids. The N-terminal 200 amino-acid sequence, almost perfectly conserved in all species and genes sequenced, mediates site-specific DNA recognition, protein dimerisation and Adenovirus DNA replication. The C-terminal 100 amino acids contain the transcriptional activation domain. This activation domain is the target of gene expression regulatory pathways elicited by growth factors and it interacts with basal transcription factors and with histone H3 [3].
Hmmscan Out
# of c-Evalue i-Evalue score bias hmm coord from hmm coord to ali coord from ali coord to env coord from env coord to acc
1 26 0.0013 23 6.2 0.4 229 281 376 429 348 433 0.76
2 26 0.0013 22 6.3 0.3 231 281 527 578 498 582 0.76
3 26 0.0013 22 6.3 0.3 231 281 676 727 647 731 0.76
4 26 0.0013 22 6.3 0.3 231 281 825 876 796 880 0.76
5 26 0.0013 22 6.3 0.3 231 281 974 1025 945 1029 0.76
6 26 0.0013 22 6.3 0.3 231 281 1123 1174 1094 1178 0.76
7 26 0.0013 22 6.3 0.3 231 281 1272 1323 1243 1327 0.76
8 26 0.0013 22 6.3 0.3 231 281 1421 1472 1392 1476 0.76
9 26 0.0013 22 6.3 0.3 231 281 1570 1621 1541 1625 0.76
10 26 0.0013 22 6.3 0.3 231 281 1719 1770 1690 1774 0.76
11 26 0.0013 22 6.3 0.3 231 281 1868 1919 1839 1923 0.76
12 26 0.0013 22 6.3 0.3 231 281 2017 2068 1988 2072 0.76
13 26 0.0013 22 6.3 0.3 231 281 2166 2217 2137 2221 0.76
14 26 0.0013 22 6.3 0.3 231 281 2315 2366 2286 2370 0.76
15 26 0.0013 22 6.3 0.3 231 281 2464 2515 2435 2519 0.76
16 26 0.0013 22 6.3 0.3 231 281 2613 2664 2584 2668 0.76
17 26 0.0013 22 6.3 0.3 231 281 2859 2910 2830 2914 0.76
18 26 0.0013 23 6.2 0.5 229 281 3006 3059 2978 3063 0.76
19 26 0.0013 22 6.3 0.3 231 281 3157 3208 3128 3212 0.76
20 26 0.011 1.9e+02 3.2 0.3 232 281 3307 3357 3276 3361 0.75
21 26 0.0013 22 6.3 0.3 231 281 3455 3506 3426 3510 0.76
22 26 0.0013 22 6.3 0.3 231 281 3604 3655 3575 3659 0.76
23 26 0.0013 22 6.3 0.3 231 281 3753 3804 3724 3808 0.76
24 26 0.0012 21 6.3 0.3 229 281 3900 3953 3870 3957 0.76
25 26 0.0013 22 6.3 0.3 231 281 4051 4102 4022 4106 0.76
26 26 0.0013 22 6.2 0.3 231 281 4200 4251 4172 4255 0.75

Sequence Information

Coding Sequence
ATGAATGAATTAAAGTCGTTAGAACACGCGACACTCAAGgtCCCATATGAGGTGTTCAACAAGCGCTACCGCAATGCTCAGAGGGTCCTTGACGTAGAAGCAAGGCAGGTTGGCAGCGCAGCCTCTGAGCTTGATGCCTCAGCCAGGAAGCAGCCCGTCACAACTGGAGAGATTGACTCTTTACTTGGTGGAATGGTTGAAAAACTAACAACAATGAAACGCAAAGCTTCAGAAGCGATCACTGAGGAGGTGCAAGCAGCAATGGTGTGCAAGAAACGACTGGAGCATCTGAAAGAGCAAGCCGCTGCACTTTCCGAGCCCAGCACTCCACAAGTCAAGACTACGATGAACCAGTGGCGCAAAGTTCGTCTGGACCGCATGCTCGTGGACTACTTCCTGCGCAACGGGTACTATGATTCCGCGAACAAACTGACTGACGCTAGGGGCCTCAGGGACCTTACTAATGTCGACATATACGCGGCAGCGGCTGAAGTGGAGGCCGAGCTGAGCAGCCAGCGCACGGGCCGCTGCCTGCAGTGGTGCGCCGACAACAAGTCCAAGCTGCGCAAGCTCAACTCCAACATGGAGTTCAAGATACGGATACAGgAGTTTATAGAGCTAGTCCGCGAAGACAAACGCCTGGAAGCGGTCCGATACGCAAAGAAGCACTTCTCCCAGTACGAGGAGGGGCAACTTGAAGATATACAGCACTGCATGGGCATGCTCGCCTTCCCTAAGGACACAGAGGTGGAGCCGTACCGCTCGCTGCTGGTGCGCGGGCGCTGGGCGGCGCTGGTGGCGCAGTTCCGCTGGGAGCACGCGCGCCTGCTGCACCCGGCGCGCCTGCCCGCGCTGCCCGTCACGCTGCAGCTGGGGCTGGCGGCTCTTAATACGCCATATCCTTTATATATACTCGCCACTACATGCTACTCGGAGAGCACGAAGGTGTCGGGCTGCCCCGCGTGCCAGCCGCCGCTGTCCGCGCTGGCCCGCACGCTGCCGCACGCGCACTGCTCGCACTCGCGCCTCGTGTGCCGCATCTCCAACCGCCCGCTCAACGAGCACAACCAGCCCATGGTGCTGCCCAACGGGCAGGTCTACGGGGAGAAGGTACGTGGGGTGCTGCCCAACGGACAGGGTGCACGCTGCCGCACGCGCACTGCTCGCACTCGCGCCTCGTGTGCCGCATCTCCAACCGCCCGCTCAACGAGCACAACCAGCCCATGGTGCTGCCCAACGGGCAGGTCTACGGGGAGAAGGTACGTGGGGTGCTGCCCAACGGACAGGGTGCACGCTGCCGCACGCGCACTGCTCGCACTCGCGCCTCGTGTGCCGCATCTCCAACCGCCCGCTCAACGAGCACAACCAGCCCATGGTGCTGCCCAACGGGCAGGTCTACGGGGAGAAGGTACGTGGGGTGCTGCCCAACGGACAGGGTGCACGCTGCCGCACGCGCACTGCTCGCACTCGCGCCTCGTGTGCCGCATCTCCAACCGCCCGCTCAACGAGCACAACCAGCCCATGGTGCTGCCCAACGGGCAGGTCTACGGGGAGAAGGTACGTGGGGTGCTGCCCAACGGACAGGGTGCACGCTGCCGCACGCGCACTGCTCGCACTCGCGCCTCGTGTGCCGCATCTCCAACCGCCCGCTCAACGAGCACAACCAGCCCATGGTGCTGCCCAACGGGCAGGTCTACGGGGAGAAGGTACGTGGGGTGCTGCCCAACGGACAGGGTGCACGCTGCCGCACGCGCACTGCTCGCACTCGCGCCTCGTGTGCCGCATCTCCAACCGCCCGCTCAACGAGCACAACCAGCCCATGGTGCTGCCCAACGGGCAGGTCTACGGGGAGAAGGTACGTGGGGTGCTGCCCAACGGACAGGGTGCACGCTGCCGCACGCGCACTGCTCGCACTCGCGCCTCGTGTGCCGCATCTCCAACCGCCCGCTCAACGAGCACAACCAGCCCATGGTGCTGCCCAACGGGCAGGTCTACGGGGAGAAGGTACGTGGGGTGCTGCCCAACGGACAGGGTGCACGCTGCCGCACGCGCACTGCTCGCACTCGCGCCTCGTGTGCCGCATCTCCAACCGCCCGCTCAACGAGCACAACCAGCCCATGGTGCTGCCCAACGGGCAGGTCTACGGGGAGAAGGTACGTGGGGTGCTGCCCAACGGACAGGGTGCACGCTGCCGCACGCGCACTGCTCGCACTCGCGCCTCGTGTGCCGCATCTCCAACCGCCCGCTCAACGAGCACAACCAGCCCATGGTGCTGCCCAACGGGCAGGTCTACGGGGAGAAGGTACGTGGGGTGCTGCCCAACGGACAGGGTGCACGCTGCCGCACGCGCACTGCTCGCACTCGCGCCTCGTGTGCCGCATCTCCAACCGCCCGCTCAACGAGCACAACCAGCCCATGGTGCTGCCCAACGGGCAGGTCTACGGGGAGAAGGTACGTGGGGTGCTGCCCAACGGACAGGGTGCACGCTGCCGCACGCGCACTGCTCGCACTCGCGCCTCGTGTGCCGCATCTCCAACCGCCCGCTCAACGAGCACAACCAGCCCATGGTGCTGCCCAACGGGCAGGTCTACGGGGAGAAGGTACGTGGGGTGCTGCCCAACGGACAGGGTGCACGCTGCCGCACGCGCACTGCTCGCACTCGCGCCTCGTGTGCCGCATCTCCAACCGCCCGCTCAACGAGCACAACCAGCCCATGGTGCTGCCCAACGGGCAGGTCTACGGGGAGAAGGTACGTGGGGTGCTGCCCAACGGACAGGGTGCACGCTGCCGCACGCGCACTGCTCGCACTCGCGCCTCGTGTGCCGCATCTCCAACCGCCCGCTCAACGAGCACAACCAGCCCATGGTGCTGCCCAACGGGCAGGTCTACGGGGAGAAGGTACGTGGGGTGCTGCCCAACGGACAGGGTGCACGCTGCCGCACGCGCACTGCTCGCACTCGCGCCTCGTGTGCCGCATCTCCAACCGCCCGCTCAACGAGCACAACCAGCCCATGGTGCTGCCCAACGGGCAGGTCTACGGGGAGAAGGTACGTGGGGTGCTGCCCAACGGACAGGGTGCACGCTGCCGCACGCGCACTGCTCGCACTCGCGCCTCGTGTGCCGCATCTCCAACCGCCCGCTCAACGAGCACAACCAGCCCATGGTGCTGCCCAACGGGCAGGTCTACGGGGAGAAGGTACGTGGGGTGCTGCCCAACGGACAGGGTGCACGCTGCCGCACGCGCACTGCTCGCACTCGCGCCTCGTGTGCCGCATCTCCAACCGCCCGCTCAACGAGCACAACCAGCCCATGGTGCTGCCCAACGGGCAGGTCTACGGGGAGAAGGTACGTGGGGTGCTGCCCAACGGACAGGGTGCACGCTGCCGCACGCGCACTGCTCGCACTCGCGCCTCGTGTGCCGCATCTCCAACCGCCCGCTCAACGAGCACAACCAGCCCATGGTGCTGCCCAACGGGCAGGTCTACGGGGAGAAGGTACGTGGGGTGCTGCCCAACGGACAGGGTGCACGCTGCCGCACGCGCACTGCTCGCACTCGCGCCTCGTGTGCCGCATCTCCAACCGCCCGCTCAACGAGCACAACCAGCCCATGGTGCTGCCCAACGGGCAGGTCTACGGGGAGAAGGTACGTGGGGTGCTGCCCAACGGACAGGGTGCACGCTGCCGCACGCGCACTGCTCGCACTCGCGCCTCGTGTGCCGCATCTCCAACCGCCCGCTCAACGAGCACAACCAGCCCATGGTGCTGCCCAACGGGCAGGTCTACGGGGAGAAGGTACGTGGGGTGCTGCCCAACGGACAGGGTGCACGCTGCCGCACGCGCACTGCTCGCACTCGCGCCTCGTGTGCCGCATCTCCAACCGCCCGCTCAACGAGCACAACCAGCCCATGGTGCTGCCCAACGGGCAGGTCTACGGGGAGAAGGTACGTGGGGTGCTGCCCAACGGACAGGGTGCACGCTGCCGCACGCGCACTGCTCGCACTCGCGCCTCGTGTGCCGCATCTCCAACCGCCCGCTCAACGAGCACAACCAGCCCATGGTGCTGCCCAACGGGCAGGTCTACGGGGAGAAGGTACGTGGGGTGCTGCCCAACGGACAGGGTGCACGCTGCCGCACGCGCACTGCTCGCACTCGCGCCTCGTGTGCCGCATCTCCAACCGCCCGCTCAACGAGCACAACCAGCCCATGGTGCTGCCCAACGGGCAGGTCTACGGGGAGAAGGTACGTGGGGTGCTGCCCAACGGACAGGGTGCACGCTGCCGCACGCGCACTGCTCGCACTCGCGCCTCGTGTGCCGCATCTCCAACCGCCCGCTCAACGAGCACAACCAGCCCATGGTGCTGCCCAACGGGCAGGTCTACGGGGAGAAGGTACGTGGGGTGCTGCCCAACGGACAGGGTGCACGCTGCCGCACGCGCACTGCTCGCACTCGCGCCTCGTGTGCCGCATCTCCAACCGCCCGCTCAACGAGCACAACCAGCCCATGGTGCTGCCCAACGGGCAGGTCTACGGGGAGAAGGTACGTGGGGTGCTGCCCAACGGACAGGGTGCACGCTGCCGCACGCGCACTGCTCGCACTCGCGCCTCGTGTGCCGCATCTCCAACCGCCCGCTCAACGAGCACAACCAGCCCATGGTGCTGCCCAACGGGCAGGTCTACGGGGAGAAGGTACGTGGGGTGCTGCCCAACGGACAGGGTGCACGCTGCCGCACGCGCACTGCTCGCACTCGCGCCTCGTGTGCCGCATCTCCAACCGCCCGCTCAACGAGCACAACCAGCCCATGGTGCTGCCCAACGGGCAGGTCTACGGGGAGAAGGTACGTGGGGTGCTGCCCAACGGACAGGGTGCACGCTGCCGCACGCGCACTGCTCGCACTCGCGCCTCGTGTGCCGCATCTCCAACCGCCCGCTCAACGAGCACAACCAGCCCATGGTGCTGCCCAACGGGCAGGTCTACGGGGAGAAGGTACGTGGGGTGCTGCCCAACGGACAGGGTGCACGCTGCCGCACGCGCACTGCTCGCACTCGCGCCTCGTGTGCCGCATCTCCAACCGCCCGCTCAACGAGCACAACCAGCCCATGGTGCTGCCCAACGGGCAGGTCTACGGGGAGAAGGTACGTGGGGTGCTGCCCAACGGACAGGGTGCACGCTGCCGCACGCGCACTGCTCGCACTCGCGCCTCGTGTGCCGCATCTCCAACCGCCCGCTCAACGAGCACAACCAGCCCATGGTGCTGCCCAACGGGCAGGTCTACGGGGAGAAGGTACGTGGGGTGCTGCCCAACGGACAGGGTGCACGCTGCCGCACGCGCACTGCTCGCACTCGCGCCTCGTGTGCCGCATCTCCAACCGCCCGCTCAACGAGCACAACCAGCCCATGGTGCTGCCCAACGGGCAGGTCTACGGGGAGAAGGTACGTGGGGTGCTGCCCAACGGACAGGGTGCACGCTGCCGCACGCGCACTGCTCGCACTCGCGCCTCGTGTGCCGCATCTCCAACCGCCCGCTCAACGAGCACAACCAGCCCATGGTGCTGCCCAACGGGCAGGTCTACGGGGAGAAGGTACGTGGGGTGCTGCCCAACGGACAGGGTGCACGCTGCCGCACGCGCACTGCTCGCACTCGCGCCTCGTGTGCCGCATCTCCAACCGCCCGCTCAACGAGCACAACCAGCCCATGGTGCTGCCCAACGGGCAGGTCTACGGGGAGAAGGTACGTGGGGTGCTGCCCAACGGACAGGGTGCACGCTGCCGCACGCGCACTGCTCGCACTCGCGCCTCGTGTGCCGCATCTCCAACCGCCCGCTCAACGAGCACAACCAGCCCATGGTGCTGCCCAACGGGCAGGTCTACGGGGAGAAGGTACGTGGGGTGCTGCCCAACGGACAGGGTGCACGCTGCCGCACGCGCACTGCTCGCACTCGCGCCTCGTGTGCCGCATCTCCAACCGCCCGCTCAACGAGCACAACCAGCCCATGGTGCTGCCCAACGGGCAGGTCTACGGGGAGAAGGTACGTGGGGTGCTGCCCAACGGACAGGGTGCACGCTGCCGCACGCGCACTGCTCGCACTCGCGCCTCGTGTGCCGCATCTCCAACCGCCCGCTCAACGAGCACAACCAGCCCATGGTGCTGCCCAACGGGCAGGTCTACGGGGAGAAGGTACGTGGGGTGCTGCCCAACGGACAGGGTGCACGCTGCCGCACGCGCACTGCTCGCACTCGCGCCTCGTGTGCCGCATCTCCAACCGCCCGCTCAACGAGCACAACCAGCCCATGGTGCTGCCCAACGGGCAGGTCTACGGGGAGAAGGTACGTGGGGTGCTGCCCAACGGACAGGGTGCACGCTGCCGCACGCGCACTGCTCGCACTCGCGCCTCGTGTGCCGCATCTCCAACCGCCCGCTCAACGAGCACAACCAGCCCATGGTGCTGCCCAACGGGCAGGTCTACGGGGAGAAGGTACGTGGGGTGCTGCCCAACGGACAGGGTGCACGCTGCCGCACGCGCACTGCTCGCACTCGCGCCTCGTGTGCCGCATCTCCAACCGCCCGCTCAACGAGCACAACCAGCCCATGGTGCTGCCCAACGGGCAGGTCTACGGGGAGAAGGTACGTGGGGTGCTGCCCAACGGACAGGGTGCACGCTGCCGCACGCGCACTGCTCGCACTCGCGCCTCGTGTGCCGCATCTCCAACCGCCCGCTCAACGAGCACAACCAGCCCATGGTGCTGCCCAACGGGCAGGTCTACGGGGAGAAGGTACGTGGGGTGCTGCCCAACGGACAGGGTGCACGCTGCCGCACGCGCACTGCTCGCACTCGCGCCTCGTGTGCCGCATCTCCAACCGCCCGCTCAACGAGCACAACCAGCCCATGGTGCTGCCCAACGGGCAGGTCTACGGGGAGAAGGTACGTGGGGTGCTGCCCAACGGACAGGGTGCACGCTGCCGCACGCGCACTGCTCGCACTCGCGCCTCGTGTGCCGCATCTCCAACCGCCCGCTCAACGAGCACAACCAGCCCATGGTGCTGCCCAACGGGCAGGTCTACGGGGAGAAGGTACGTGGGGTGCTGCCCAACGGACAGGGTGCACGCTGCCGCACGCGCACTGCTCGCACTCGCGCCTCGTGTGCCGCATCTCCAACCGCCCGCTCAACGAGCACAACCAGCCCATGGTGCTGCCCAACGGGCAGGTCTACGGGGAGAAGGTACGTGGGGTGCTGCCCAACGGACAGGGTGCACGCTGCCGCACGCGCACTGCTCGCACTCGCGCCTCGTGTGCCGCATCTCCAACCGCCCGCTCAACGAGCACAACCAGCCCATGGTGCTGCCCAACGGGCAGGTCTACGGGGAGAAGGTACGTGGGGTGCTGCCCAACGGACAGGGTGCACGCTGCCGCACGCGCACTGCTCGCACTCGCGCCTCGTGTGCCGCATCTCCAACCGCCCGCTCAACGAGCACAACCAGCCCATGGTGCTGCCCAACGGGCAGGTCTACGGGGAGAAGGTACGTGGGGTGCTGCCCAACGGACAGGGTGCACGCTGCCGCACGCGCACTGCTCGCACTCGCGCCTCGTGTGCCGCATCTCCAACCGCCCGCTCAACGAGCACAACCAGCCCATGGTGCTGCCCAACGGGCAGGTCTACGGGGAGAAGGTACGTGGGGTGCTGCCCAACGGACAGGGTGCACGCTGCCGCACGCGCACTGCTCGCACTCGCGCCTCGTGTGCCGCATCTCCAACCGCCCGCTCAACGAGCACAACCAGCCCATGGTGCTGCCCAACGGGCAGGTCTACGGGGAGAAGGTACGTGGGGTGCTGCCCAACGGACAGGGTGCACGCTGCCGCACGCGCACTGCTCGCACTCGCGCCTCGTGTGCCGCATCTCCAACCGCCCGCTCAACGAGCACAACCAGCCCATGGTGCTGCCCAACGGGCAGGTCTACGGGGAGAAGGTACGTGGGGTGCTGCCCAACGGACAGGGTGCACGCTGCCGCACGCGCACTGCTCGCACTCGCGCCTCGTGTGCCGCATCTCCAACCGCCCGCTCAACGAGCACAACCAGCCCATGGTGCTGCCCAACGGGCAGGTCTACGGGGAGAAGGTACGTGGGGTGCTGCCCAACGGACAGGGTGCACGCTGCCGCACGCGCACTGCTCGCACTCGCGCCTCGTGTGCCGCATCTCCAACCGCCCGCTCAACGAGCACAACCAGCCCATGGTGCTGCCCAACGGGCAGGTCTACGGGGAGAAGGTACGTGGGGTGCTGCCCAACGGACAGGGGGCTGCACGCGCACTGCTCGCACTCGCGCCTCGTGTGCCGCATCTCCAACCGCCCGCTCAACGAGCACAACCAGCCCATGGTGCTGCCCAACGGGCAGGTCTACGGGGAGAAGGTACGTGGGGTGCTGCCCAACGGACAGGGTGCACGCTGCCGCACGCGCACTGCTCGCACTCGCGCCTCGTGTGCCGCATCTCCAACCGCCCGCTCAACGAGCACAACCAGCCCATGGTGCTGCCCAACGGGCAGGTCTACGGGGAGAAGGTACGTGGGGTGCTGCCCAACGGACAGGGTGCACGCTGCCGCACGCGCACTGCTCGCACTCGCGCCTCGTGTGCCGCATCTCCAACCGCCCGCTCAACGAGCACAACCAGCCCATGGTGCTGCCCAACGGGCAGGTCTACGGGGAGAAGGTACGTGGGGTGCTGCCCAACGGACAGGGTGCACGCTGCCGCACGCGCACTGCTCGCACTCGCGCCTCGTGTGCCGCATCTCCAACCGCCCGCTCAACGAGCACAACCAGCCCATGGTGCTGCCCAACGGGCAGGTCTACGGGGAGAAGGTACGTGGGGTGCTGCCCAACGGACAGGGTGCACGCTGCCGCACGCGCACTGCTCGCACTCGCGCCTCGTGTGCCGCATCTCCAACCGCCCGCTCAACGAGCACAACCAGCCCATGGTGCTGCCCAACGGGCAGGTCTACGGGGAGAAGGTACGTGGGGTGCAGCCCAACGGACAGGGTGCACGCTGCCGCACGCGCACTGCTCGCACTCGCGCCTCGTGTGCCGCATCTCCAACCGCCCGCTCAACGAGCACAACCAGCCCATGGTGCTGCCCAACGGGCAGGTCTACGGGGAGAAGGTACGTGGGGTGCTGCCCAACGGACAGGGTGCACGCTGCCGCACGCGCACTGCTCGCACTCGCGCCTCGTGTGCCGCATCTCCAACCGCCCGCTCAACGAGCACAACCAGCCCATGGTGCTGCCCAACGGGCAGGTCTACGGGGAGAAGGTACGTGGGGTGCTGCCCAACGGACAGGGTGCACGCTGCCGCACGCGCACTGCTCGCACTCGCGCCTCGTGTGCCGCATCTCCAACCGCCCGCTCAACGAGCACAACCAGCCCATGGTGCTGCCCAACGGGCAGGTCTACGGGGAGAAGGTACGTGGGGTGCTGCCCAACGGACAGGGTGCACGCTGCCGCACGCGCACTGCTCGCACTCGCGCCTCGTGTGCCGCATCTCCAACCGCCCGCTCAACGAGCACAACCAGCCCATGGTGCTGCCCAACGGGCAGGTCTACGGGGAGAAGGTACGTGGGGTGCTGCCCAACGGACAGGGTGCACGCTGCCGCACGCGCACTGCTCGCACTCGCGCCTCGTGTGCCGCATCTCCAACCGCCCGCTCAACGAGCACAACCAGCCCATGGTGCTGCCCAACGGGCAGGTCTACGGGGAGAAGGTACGTGGGGTGCTGCCCAACGGACAGGGTGCACGCTGCCGCACGCGCACTGCTCGCACTCGCGCCTCGTGTGCCGCATCTCCAACCGCCCGCTCAACGAGCAAAACCAGCCCATGGTGCTGCCCAACGGGCAGGTCTACGGGGAGAAGGTACGTGGGGTGCTGCCCAACGGACAGGGTGCACGCTGCCGCACGCGCACTGCTCGCACTCGCGCCTCGTGTGCCGCATCTCCAACCGCCCGCTCAACGAGCACAACCAGCCCATGGTGCTGCCCAACGGGCAGGTTTACGGGGAGAAGGTACGTGGGGTGCTGCCCAACGGACAGGGTGCACGCTGCCGCACGCGCACTGCTCGCACTCGCGCCTCGTGTGCCGCATCTCCAACCGCCCGCTCAACGAGCACAACCAGCCCATGGTGCTGCCCAACGGGCAGGTCTACGGGGAGAAGGTACGTGGGGTGCTGCCCAACGGACAGGGTGCACGCTGCCGCACGCGCACTGCTCGCACTCGCGCCTCGTGTGCCGCATCTCCAACCGCCCGCTCAACGAGCACAACCAGCCCATGGTGCTGCCCAACGGGCAGGTCTACGGGGAGAAGGTACGTGGGGTGCTGCCCAACGGACAGGGTGCACGCTGCCGCACGCGCACTGCTCGCACTCGCGCCTCGTGTGCCGCATCTCCAACCGCCCGCTCAACGAGCACAACCAGCCCATGGTGCTGCCCAACGGGCAGGTCTACGGGGAGAAGGTACGTGGGGTGCTGCCCAACGGACAGGGTGCACGCTGCCGCACGCGCACTGCTCGCACTCGCGCCTCGTGTGCCGCATCTCCAACCGCCCGCTCAACGAGCACAACCAGCCAATGGTGCTGCCCAACGGGCAGGTCTACGGGGAGAAGGTACGTGGGGTGCTGCCCAACGGACAGGGTGCACGCTGCCGCACGCGCACTGCTCGCACTCGCGCCTCGTGTGCCGCATCTCCAACCGCCCGCTCAACGAGCACAACCAGCCCATGGTGCTGCCCAACGGGCAGGTCTACGGGGAGAAGGTACGTGGGGTGCTGCCCAACGGACAGGGTGCACGCTGCCGCACGCGCACTGCTCGCACTCGCGCCTCGTGTGCCGCATCTCCAACCGCCCGCTCAACGAGCACAACCAGCCCATGGTGCTGCCCAACGGGCAGGTCTACGGGGAGAAGGTACGTGGGGTGCTGCCCAACGGACAGGGTGCACGCTGCCGCACGCGCACTGCTCGCACTCGCGCCTCGTGTGCCGCATCTCCAACCGCCCGCTCAACGAGCACAACCAGCCCATGGTGCTGCCCAACGGGCAGGTCTACGGGGAGAAGGTACGTGGGGTGCTGCCCAACGGACAGGGTGCACGCTGCCGCACGCGCACTGCTCGCACTCGCGCCTCGTGTGCCGCATCTCCAACCGCCCGCTCAACGAGCACAACCAGCCCATGGTGCTGCCCAACGGGCAGGTCTACGGGGAGAAGGTACGTGGGGTGCTGCCCAACGGACAGGGTGCACGCTGCCGCACGCGCACTGCTCGCACTCGCGCCTCGTGTGCCGCATCTCCAACCGCCCGCTCAACGAGCACAACCAGCCCATGGTGCTGCCCAACGGGCAGGTCTACGGGGAGAAGGTACGTGGGGTGCTGCCCAACGGACAGGGTGCACGCTGCCGCACGCGCACTGCTCGCACTCGCGCCTCGTGTGCCGCATCTCCAACCGCCCGCTCAACGAGCACAACCAGCCCATGGTGCTGCCCAACGGGCAGGTCTACGGGGAGAAGGTACGTGGGGTGCTGCCCAACGGACAGGGTGCACGCTGCCGCACGCGCACTGCTCGCACTCGCGCCTCGTGTGCCACATCTCCAACCGCCCGCTCAACGAGCACAACCAGCCCATGGTGCTGCCCAACGGGCAGGTCTACGGGGAGAAGGTACGTGGGGTGCTGCCCAACGGACAGGGTGCACGCTGCCGCACGCGCACTGCTCGCACTCGCGCCTCGTGTGCCGCATCTCCAACCGCCCGCTCAACGAGCACAACCAGCCCATGGTGCTGCCCAACGGGCAGGTCTACGGGGAGAAGGTACGTGGGGTGCTGCCCAACGGACAGGGTGCACGCTGCCGCACGCGCACTGCTCGCACTCGCGCCTCGTGTGCCGCATCTCCAACCGCCCGCTCAACGAGCACAACCAGCCCATGGTGCTGCCCAACGGGCAGGTCTACGGGGAGAAGGTACGTGGGGTGCTGCCCAACGGACAGGGTGCACGCTGCCGCACGCGCACTGCTCGCACTCGCGCCTCGTGTGCCGCATCTCCAACCGCCCGCTCAACGAGCACAACCAGCCCATGGTGCTGCCCAACGGGCAGGTCTACGGGGAGAAGGTACGTGGGGTGCTGCCCAACGGACAGGGTGCACGCTGCCGCACGCGCACTGCTCGCACTCGCGCCTCGTGTGCCGCATCTCCAACCGCCCGCTCAACGAGCACAACCAGCCCATGGTGCTGCCCAACGGGCAGGTCTACGGGGAGAAGGTACGTGGGGTGCTGCCCAACGGACAGGGTGCACGCTGCCGCACGCGCACTGCTCGCACTCGCGCCTCGTGTGCCGCATCTCCAACCGCCCGCTCAACGAGCACAACCAGCCCATGGTGCTGCCCAACGGGCAGGTCTACGGGGAGAAGGTACGTGGGGTGCTGCCCAACGGACAGGGTGCACGCTGCCGCACGCGCACTGCTGGCACTCGCGCCTCGTGTGCCGCATCTCCAACCGCCCGCTCAACGAGCACAACCAGCCCATGGTGCTGCCCAACGGGCAGGTCTACGGGGAGAAGGTACGTGGGGTGCTGCCCAACGGACAGGGTGCACGCTGTCGCACGCGCACTGCTCGCACTCGCGCCTCGTGTGCCGCATCTCCAACCGCCCGCTCAACGAGCACAACCAGCCCATGGTGCTGCCCAACGGGCAGGTCTACGGGGAGAAGGTACGTGGGGTGCTGCCCAACGGACAGGGTGCACGCTGCCGCACGCGCACTGCTCGCACTCGCGCCTCGTGTGCCGCATCTCCAACCGCCCGCTCAACGAGCACAACCAGCCCATGGTGCTGCCCAACGGGCAGGTCTACGGGGAGAAGGTACGTGGGGTGCTGCCCAACGGACAGGGTGCACGCTGCCGCACGCGCACTGCTCGCACTCGCGCCTCGTGTGCCGCATCTCCAACCGCCCGCTCAACGAGCACAACCAGCCCATGGTGCTGCCCAACGGGCAGGTCTACGGGGAGAAGGCTCTCAAAGAGATGATGAAGGAGCACGGCTCGATCATCTGCCCGAAGACCAAGGAGGTGTTCTGCATGAAGCGTGTGGAGAAGGTGTACGTCATGTGA
Protein Sequence
MNELKSLEHATLKVPYEVFNKRYRNAQRVLDVEARQVGSAASELDASARKQPVTTGEIDSLLGGMVEKLTTMKRKASEAITEEVQAAMVCKKRLEHLKEQAAALSEPSTPQVKTTMNQWRKVRLDRMLVDYFLRNGYYDSANKLTDARGLRDLTNVDIYAAAAEVEAELSSQRTGRCLQWCADNKSKLRKLNSNMEFKIRIQEFIELVREDKRLEAVRYAKKHFSQYEEGQLEDIQHCMGMLAFPKDTEVEPYRSLLVRGRWAALVAQFRWEHARLLHPARLPALPVTLQLGLAALNTPYPLYILATTCYSESTKVSGCPACQPPLSALARTLPHAHCSHSRLVCRISNRPLNEHNQPMVLPNGQVYGEKVRGVLPNGQGARCRTRTARTRASCAASPTARSTSTTSPWCCPTGRSTGRRYVGCCPTDRVHAAARALLALAPRVPHLQPPAQRAQPAHGAAQRAGLRGEGTWGAAQRTGCTLPHAHCSHSRLVCRISNRPLNEHNQPMVLPNGQVYGEKVRGVLPNGQGARCRTRTARTRASCAASPTARSTSTTSPWCCPTGRSTGRRYVGCCPTDRVHAAARALLALAPRVPHLQPPAQRAQPAHGAAQRAGLRGEGTWGAAQRTGCTLPHAHCSHSRLVCRISNRPLNEHNQPMVLPNGQVYGEKVRGVLPNGQGARCRTRTARTRASCAASPTARSTSTTSPWCCPTGRSTGRRYVGCCPTDRVHAAARALLALAPRVPHLQPPAQRAQPAHGAAQRAGLRGEGTWGAAQRTGCTLPHAHCSHSRLVCRISNRPLNEHNQPMVLPNGQVYGEKVRGVLPNGQGARCRTRTARTRASCAASPTARSTSTTSPWCCPTGRSTGRRYVGCCPTDRVHAAARALLALAPRVPHLQPPAQRAQPAHGAAQRAGLRGEGTWGAAQRTGCTLPHAHCSHSRLVCRISNRPLNEHNQPMVLPNGQVYGEKVRGVLPNGQGARCRTRTARTRASCAASPTARSTSTTSPWCCPTGRSTGRRYVGCCPTDRVHAAARALLALAPRVPHLQPPAQRAQPAHGAAQRAGLRGEGTWGAAQRTGCTLPHAHCSHSRLVCRISNRPLNEHNQPMVLPNGQVYGEKVRGVLPNGQGARCRTRTARTRASCAASPTARSTSTTSPWCCPTGRSTGRRYVGCCPTDRVHAAARALLALAPRVPHLQPPAQRAQPAHGAAQRAGLRGEGTWGAAQRTGCTLPHAHCSHSRLVCRISNRPLNEHNQPMVLPNGQVYGEKVRGVLPNGQGARCRTRTARTRASCAASPTARSTSTTSPWCCPTGRSTGRRYVGCCPTDRVHAAARALLALAPRVPHLQPPAQRAQPAHGAAQRAGLRGEGTWGAAQRTGCTLPHAHCSHSRLVCRISNRPLNEHNQPMVLPNGQVYGEKVRGVLPNGQGARCRTRTARTRASCAASPTARSTSTTSPWCCPTGRSTGRRYVGCCPTDRVHAAARALLALAPRVPHLQPPAQRAQPAHGAAQRAGLRGEGTWGAAQRTGCTLPHAHCSHSRLVCRISNRPLNEHNQPMVLPNGQVYGEKVRGVLPNGQGARCRTRTARTRASCAASPTARSTSTTSPWCCPTGRSTGRRYVGCCPTDRVHAAARALLALAPRVPHLQPPAQRAQPAHGAAQRAGLRGEGTWGAAQRTGCTLPHAHCSHSRLVCRISNRPLNEHNQPMVLPNGQVYGEKVRGVLPNGQGARCRTRTARTRASCAASPTARSTSTTSPWCCPTGRSTGRRYVGCCPTDRVHAAARALLALAPRVPHLQPPAQRAQPAHGAAQRAGLRGEGTWGAAQRTGCTLPHAHCSHSRLVCRISNRPLNEHNQPMVLPNGQVYGEKVRGVLPNGQGARCRTRTARTRASCAASPTARSTSTTSPWCCPTGRSTGRRYVGCCPTDRVHAAARALLALAPRVPHLQPPAQRAQPAHGAAQRAGLRGEGTWGAAQRTGCTLPHAHCSHSRLVCRISNRPLNEHNQPMVLPNGQVYGEKVRGVLPNGQGARCRTRTARTRASCAASPTARSTSTTSPWCCPTGRSTGRRYVGCCPTDRVHAAARALLALAPRVPHLQPPAQRAQPAHGAAQRAGLRGEGTWGAAQRTGCTLPHAHCSHSRLVCRISNRPLNEHNQPMVLPNGQVYGEKVRGVLPNGQGARCRTRTARTRASCAASPTARSTSTTSPWCCPTGRSTGRRYVGCCPTDRVHAAARALLALAPRVPHLQPPAQRAQPAHGAAQRAGLRGEGTWGAAQRTGCTLPHAHCSHSRLVCRISNRPLNEHNQPMVLPNGQVYGEKVRGVLPNGQGARCRTRTARTRASCAASPTARSTSTTSPWCCPTGRSTGRRYVGCCPTDRVHAAARALLALAPRVPHLQPPAQRAQPAHGAAQRAGLRGEGTWGAAQRTGCTLPHAHCSHSRLVCRISNRPLNEHNQPMVLPNGQVYGEKVRGVLPNGQGARCRTRTARTRASCAASPTARSTSTTSPWCCPTGRSTGRRYVGCCPTDRVHAAARALLALAPRVPHLQPPAQRAQPAHGAAQRAGLRGEGTWGAAQRTGCTLPHAHCSHSRLVCRISNRPLNEHNQPMVLPNGQVYGEKVRGVLPNGQGARCRTRTARTRASCAASPTARSTSTTSPWCCPTGRSTGRRYVGCCPTDRVHAAARALLALAPRVPHLQPPAQRAQPAHGAAQRAGLRGEGTWGAAQRTGCTLPHAHCSHSRLVCRISNRPLNEHNQPMVLPNGQVYGEKVRGVLPNGQGAARALLALAPRVPHLQPPAQRAQPAHGAAQRAGLRGEGTWGAAQRTGCTLPHAHCSHSRLVCRISNRPLNEHNQPMVLPNGQVYGEKVRGVLPNGQGARCRTRTARTRASCAASPTARSTSTTSPWCCPTGRSTGRRYVGCCPTDRVHAAARALLALAPRVPHLQPPAQRAQPAHGAAQRAGLRGEGTWGAAQRTGCTLPHAHCSHSRLVCRISNRPLNEHNQPMVLPNGQVYGEKVRGVQPNGQGARCRTRTARTRASCAASPTARSTSTTSPWCCPTGRSTGRRYVGCCPTDRVHAAARALLALAPRVPHLQPPAQRAQPAHGAAQRAGLRGEGTWGAAQRTGCTLPHAHCSHSRLVCRISNRPLNEHNQPMVLPNGQVYGEKVRGVLPNGQGARCRTRTARTRASCAASPTARSTSTTSPWCCPTGRSTGRRYVGCCPTDRVHAAARALLALAPRVPHLQPPAQRAQPAHGAAQRAGLRGEGTWGAAQRTGCTLPHAHCSHSRLVCRISNRPLNEQNQPMVLPNGQVYGEKVRGVLPNGQGARCRTRTARTRASCAASPTARSTSTTSPWCCPTGRFTGRRYVGCCPTDRVHAAARALLALAPRVPHLQPPAQRAQPAHGAAQRAGLRGEGTWGAAQRTGCTLPHAHCSHSRLVCRISNRPLNEHNQPMVLPNGQVYGEKVRGVLPNGQGARCRTRTARTRASCAASPTARSTSTTSPWCCPTGRSTGRRYVGCCPTDRVHAAARALLALAPRVPHLQPPAQRAQPANGAAQRAGLRGEGTWGAAQRTGCTLPHAHCSHSRLVCRISNRPLNEHNQPMVLPNGQVYGEKVRGVLPNGQGARCRTRTARTRASCAASPTARSTSTTSPWCCPTGRSTGRRYVGCCPTDRVHAAARALLALAPRVPHLQPPAQRAQPAHGAAQRAGLRGEGTWGAAQRTGCTLPHAHCSHSRLVCRISNRPLNEHNQPMVLPNGQVYGEKVRGVLPNGQGARCRTRTARTRASCAASPTARSTSTTSPWCCPTGRSTGRRYVGCCPTDRVHAAARALLALAPRVPHLQPPAQRAQPAHGAAQRAGLRGEGTWGAAQRTGCTLPHAHCSHSRLVCHISNRPLNEHNQPMVLPNGQVYGEKVRGVLPNGQGARCRTRTARTRASCAASPTARSTSTTSPWCCPTGRSTGRRYVGCCPTDRVHAAARALLALAPRVPHLQPPAQRAQPAHGAAQRAGLRGEGTWGAAQRTGCTLPHAHCSHSRLVCRISNRPLNEHNQPMVLPNGQVYGEKVRGVLPNGQGARCRTRTARTRASCAASPTARSTSTTSPWCCPTGRSTGRRYVGCCPTDRVHAAARALLALAPRVPHLQPPAQRAQPAHGAAQRAGLRGEGTWGAAQRTGCTLPHAHCWHSRLVCRISNRPLNEHNQPMVLPNGQVYGEKVRGVLPNGQGARCRTRTARTRASCAASPTARSTSTTSPWCCPTGRSTGRRYVGCCPTDRVHAAARALLALAPRVPHLQPPAQRAQPAHGAAQRAGLRGEGTWGAAQRTGCTLPHAHCSHSRLVCRISNRPLNEHNQPMVLPNGQVYGEKALKEMMKEHGSIICPKTKEVFCMKRVEKVYVM*

Similar Transcription Factors

Sequence clustering based on sequence similarity using MMseqs2

100% Identity
-
90% Identity
-
80% Identity
-