Basic Information

Insect: Macrocentrus cingulum
Gene Symbol: -
Assembly: GCA_002156465.1
Location: MVJL01010768.1:3521-7671[-]

Transcription Factor Domain

TF Family: HMGA
Domain: HMGA domain
PFAM: AnimalTFDB
TF Group: Unclassified Structure
Description: This entry represents the HMGA family, whose members contain DNA-binding domains, also known as AT hooks due to their ability to interact with the narrow minor groove of AT-rich DNA sequences. They play an important role in chromatin organisation [1]. The high mobility group (HMG) proteins are the most abundant and ubiquitous nonhistone chromosomal proteins. They bind to DNA and to nucleosomes and are involved in the regulation of DNA-dependent processes such as transcription, replication, recombination, and DNA repair. They can be grouped into three families: HMGB (HMG 1/2), HMGN (HMG 14/17) and HMGA (HMG I/Y). The characteristic domains are: AT-hook for the HMGA family, the HMG Box for the HMGB family, and the nucleosome-binding domain (NBD) for the members of the HMGN family [2].
Hmmscan Out: # of c-Evalue i-Evalue score bias hmm coord from hmm coord to ali coord from ali coord to env coord from env coord to acc

1 3 6.5e-08 0.0013 18.5 5.4 5 20 188 204 185 205 0.86

2 3 4.1e-07 0.008 15.9 3.6 9 18 216 225 214 227 0.87

3 3 5.3e-07 0.01 15.6 10.3 9 21 239 252 236 253 0.85

#	of	c-Evalue	i-Evalue	score	bias	hmm coord from	hmm coord to	ali coord from	ali coord to	env coord from	env coord to	acc
1	3	6.5e-08	0.0013	18.5	5.4	5	20	188	204	185	205	0.86
2	3	4.1e-07	0.008	15.9	3.6	9	18	216	225	214	227	0.87
3	3	5.3e-07	0.01	15.6	10.3	9	21	239	252	236	253	0.85

Sequence Information

Coding Sequence: ATGTGGGGTACCTACGTAAAGGCAATCAATACATCTATGTTTAAacaaacagtaaaaataccCTCATTGGAAACAGGAGAGCACCACGAAGGGGAGAATTTAGGGGCAACAGACGTCTTGGGGGAGAATTTAGGGGCAACAGACGTCTTGGTACACAGAATACATACCACTGACGAAATCCCCGTCTTCAAGAAACAATATCGTTTTCCACCCATTcataaagaagaaataaataaacaagtaaAAGAATTAGAAGAAAAGGTCGCGCCAAGGCCAAAGAAGAGGAAGGCCGAAGGAGAAGAAAATATTCGAAACGTAAAACCACGCACAGATAAGAATATAGAGCAAAGCGAGGCTGATCCCCTCAACGAGAGTGTCATTGACCTCGGGCAAATAGCGAGACGGTATGCACCCGATGCAGGAGTAATCGACGACTCTTTTGACAaaggattaattaataattcaacgaAAACAAATCACCTTGAGATGTCACTCACCGAATGCCTGCAAGTCGAATTACCGGAAGGAAGCCCAGATGAAATGAACCCGCATCAAGAAATGGAACCAATACCTCAAAAAAGGCCTCGTGGACGACCGAAAGGAACTAAAAAACCTAAACAACCTACTGCACTATGCTCTACTCAAAAAAGGCCTCGTGGACGACCGAAGGGAGCCAATAAACCCCAACAGCTTACTATACTATGCTCCCCAAAAAAAAGACCTCGTGGACGACCAAAAGGaagcacaaaaaataaacaacgagCCAGTATAGAATACTCCCCGCGGCGGACTCGCAGCACACAAGGAAAAACAAGGACCATTCGGGATAATTCGGCGGATAGCTCCGAGAAGGAAACAATAAGCAGAGCTTTTAATCCGGAATGGGACCCAGCCGATCTTGGCCATCCCACATTCTCCGGAGATTGGCTAAAAGAACTTGGGGTGAGAGGGAGCACTACATCTACTATGTCCCCCGATCGAGAAGAAGTCATCCATTTACCAGAACTAGGAAAGAACAAGGAGCACCAAACAGGGGACCCGAACATCTCAGGACACACTGTATGGGATGAGGATGATTCCTTCGACCCTATAGCACACTACCCTGAGGTCGTAATCACAACACCAGAAGACAATCTAGATTTTCCAACAACACAAAGAGATGAGGAACCTAATCCACAAGAACAATTTGACTCCTCATCAGAAGACGAGGGTCCCGAGGATTGGAACTATCGCACAACTCCGATCTCGAGAGCACTGACTCCAAATGTTATTGAAACCAGAGATAGGCTGCAAATGCAGAAAGATAATATCATCATATGCATGACAGAAGACCAACGTCCTTGTGATAGCGGGGCAGAAGAAATGTCGAGACTAGATTCAGGAAGAATTTGCTTACCTGACCAACTGACTTTCTGCAGAGTTGCACAGACATCCTACGGAAAACATCACTGTTTACATTGCTTACTGATCAAGGCACAAATTTAA
Protein Sequence: MWGTYVKAINTSMFKQTVKIPSLETGEHHEGENLGATDVLGENLGATDVLVHRIHTTDEIPVFKKQYRFPPIHKEEINKQVKELEEKVAPRPKKRKAEGEENIRNVKPRTDKNIEQSEADPLNESVIDLGQIARRYAPDAGVIDDSFDKGLINNSTKTNHLEMSLTECLQVELPEGSPDEMNPHQEMEPIPQKRPRGRPKGTKKPKQPTALCSTQKRPRGRPKGANKPQQLTILCSPKKRPRGRPKGSTKNKQRASIEYSPRRTRSTQGKTRTIRDNSADSSEKETISRAFNPEWDPADLGHPTFSGDWLKELGVRGSTTSTMSPDREEVIHLPELGKNKEHQTGDPNISGHTVWDEDDSFDPIAHYPEVVITTPEDNLDFPTTQRDEEPNPQEQFDSSSEDEGPEDWNYRTTPISRALTPNVIETRDRLQMQKDNIIICMTEDQRPCDSGAEEMSRLDSGRICLPDQLTFCRVAQTSYGKHHCLHCLLIKAQI

Similar Transcription Factors

Sequence clustering based on sequence similarity using MMseqs2

100% Identity: -
90% Identity: -
80% Identity: -