Basic Information

Transcription Factor Domain

TF Family: HMGA
Domain: HMGA domain
PFAM: AnimalTFDB
TF Group: Unclassified Structure
Description: This entry represents the HMGA family, whose members contain DNA-binding domains, also known as AT hooks due to their ability to interact with the narrow minor groove of AT-rich DNA sequences. They play an important role in chromatin organisation [1]. The high mobility group (HMG) proteins are the most abundant and ubiquitous nonhistone chromosomal proteins. They bind to DNA and to nucleosomes and are involved in the regulation of DNA-dependent processes such as transcription, replication, recombination, and DNA repair. They can be grouped into three families: HMGB (HMG 1/2), HMGN (HMG 14/17) and HMGA (HMG I/Y). The characteristic domains are: AT-hook for the HMGA family, the HMG Box for the HMGB family, and the nucleosome-binding domain (NBD) for the members of the HMGN family [2].
Hmmscan Out: # of c-Evalue i-Evalue score bias hmm coord from hmm coord to ali coord from ali coord to env coord from env coord to acc

1 3 0.27 7.2e+03 -2.7 4.6 10 15 175 180 174 181 0.83

2 3 2.1e-09 5.5e-05 23.2 3.3 9 21 209 221 206 222 0.93

3 3 1 2.6e+04 -5.5 3.9 7 18 231 243 231 244 0.71

#	of	c-Evalue	i-Evalue	score	bias	hmm coord from	hmm coord to	ali coord from	ali coord to	env coord from	env coord to	acc
1	3	0.27	7.2e+03	-2.7	4.6	10	15	175	180	174	181	0.83
2	3	2.1e-09	5.5e-05	23.2	3.3	9	21	209	221	206	222	0.93
3	3	1	2.6e+04	-5.5	3.9	7	18	231	243	231	244	0.71

Coding Sequence: ATGTTGAACTACGGCAGAGAGCCAGTGCCTCCCGGAACCAAGAGGAGGGAACAAGAGCAGGCAGTGGAAGAGGTAGCTGCTCGAGAGGAGGCGGAAGCCTGGTCAGAGAGGATGAAAAACCTCAGCAATATGCTAAACGACGCTGGTCACAGgtcaaaaaaagaacaagagcGTCATGCTGAGGTATACGACGCCAGGCTGCTAGAACCGAAATTCGAAGTCGGAGATCGCGTGTGGAAAAAGAATCAGAAGAGATGGCTAAACACGTATAAACTGGTGGACCAGGAAGGAGATATAGAAGATCTGGTCCACGCAGAACATCTGAAGCCATTTGACGCCGAAAGAGCGCCCGAGGATAACGAAGACGAACCACAGTCGTGCTACagcgaagaagaagatgacCAGGCCCGACCCCCGCGGGATTCTAGCGGAACGGTGAAGAGCGACCCGCCGCATGCGAGAATTCAATCGCCAGCGGGCACTGAGCGAAATCAGGACGAGGTTGGTGTAAATATTCAAACTCGCGGGAGAGGTAGACCAAGGAAGACTACTTTAGTTATACAGAAGCAAGTCGATCCTACTCCCGCACCAGCCAGCCCCGTACCTGTTGCGAGCGAGCCCCTTAAGAGACCGCGCGGCCGACCGAAAGGGTCGCAGAATCGCGTACTAACCAGCGACCCCGTTTCCGCTAGCCCCCGGAGAACACGCGCAAATCCGAGAAAAGGTTCCCGAGGATAA
Protein Sequence: MLNYGREPVPPGTKRREQEQAVEEVAAREEAEAWSERMKNLSNMLNDAGHRSKKEQERHAEVYDARLLEPKFEVGDRVWKKNQKRWLNTYKLVDQEGDIEDLVHAEHLKPFDAERAPEDNEDEPQSCYSEEEDDQARPPRDSSGTVKSDPPHARIQSPAGTERNQDEVGVNIQTRGRGRPRKTTLVIQKQVDPTPAPASPVPVASEPLKRPRGRPKGSQNRVLTSDPVSASPRRTRANPRKGSRG

Sequence clustering based on sequence similarity using MMseqs2