Basic Information

Insect: Torymus tubicola
Gene Symbol: ORF_1
Assembly: GCA_035583055.1
Location: JAWWEQ010047995.1:11325-14510[-]

Transcription Factor Domain

TF Family: HMGA
Domain: HMGA domain
PFAM: AnimalTFDB
TF Group: Unclassified Structure
Description: This entry represents the HMGA family, whose members contain DNA-binding domains, also known as AT hooks due to their ability to interact with the narrow minor groove of AT-rich DNA sequences. They play an important role in chromatin organisation [1]. The high mobility group (HMG) proteins are the most abundant and ubiquitous nonhistone chromosomal proteins. They bind to DNA and to nucleosomes and are involved in the regulation of DNA-dependent processes such as transcription, replication, recombination, and DNA repair. They can be grouped into three families: HMGB (HMG 1/2), HMGN (HMG 14/17) and HMGA (HMG I/Y). The characteristic domains are: AT-hook for the HMGA family, the HMG Box for the HMGB family, and the nucleosome-binding domain (NBD) for the members of the HMGN family [2].
Hmmscan Out: # of c-Evalue i-Evalue score bias hmm coord from hmm coord to ali coord from ali coord to env coord from env coord to acc

1 2 8 5.3e+04 -6.8 6.9 10 15 675 680 675 681 0.81

2 2 7.7e-09 5.1e-05 24.3 10.1 8 21 708 721 705 722 0.93

#	of	c-Evalue	i-Evalue	score	bias	hmm coord from	hmm coord to	ali coord from	ali coord to	env coord from	env coord to	acc
1	2	8	5.3e+04	-6.8	6.9	10	15	675	680	675	681	0.81
2	2	7.7e-09	5.1e-05	24.3	10.1	8	21	708	721	705	722	0.93

Sequence Information

Coding Sequence: ATGGAAGAAGATCGACTTCGGCCAAGAAATGAGAACGTACATTTGCAGGATACGTACACTTGGATAGTGAGGAAATGGAATGTATCCTTCTCTGTCGAAAGGGGCCAGAGCATCGAAGCCTTCCTAGAAAGAGTTGAAGCGTGCAGAGGCTCGACAAGCTTAACGGAAGCAGCTCCAAGCTATTCCAAGCTCTGCCAGACTCCTGAAAGGCGTTGCAGCCATGTGGTTTCAAGTGGAGAAGAATCGCTGGAACACATGGATAGGTTATCGGCGATCGTTCTGACCAATTTGCTCGGGAAACGAGAGTTAGCGCGATTAGAAGGGCCTAAATCCGCCGAGACCACGCTAGAGGCCCCGATATTGTCTAAAAAGGAAGGAAGACGACCAATTGACTTGGCCGTCACCGTTAGCCAAGTCAAAGTTGAGCAAGGAAACACTTCCAAGGAGCTCGAACGCAACTCGAATCAGATCCTATTGGGCGGGGTCAAACGAGATGTGCTGGTATCGATTATACCAGACTTGGAAGTTGACTGTTACGTCGGTTCCAATTTCGTTCGAGCATTCGAGATAATGCACGACCCCGCAGAGAACAGGTTGATAGTGGAAAAATGCGGTAAAAGTATTGGACTAGAACTAGCCTGTGTCTCTTCGTCAAATCCTGATGATCCGAGTCAGATCGGGATAGCTTCCTTAAACATGATGAAAGCTTCTTCAGCAGGTCTAGCTGATATAACGCTGGAAGAACACCAGCGTTTACAAGATCTTTTGAAGAGAGTATTACCGCCGGATGATGCCCCGCTCGGTTGCACGAGCTGTGCCGAACACGAGATAAATGTTGGCACTACTCGGCCGATCCGGCAAAAACAATACCCCATCTCGAGGAAATTAGAAGACGAAATGCACCGACAAGTGCGAGAGATGTTAAAAGCCGGGTTGCTCGAACCATCATCAAGTCCCTGGTCTAATCCTGCATTCATGGTGCCGAAAGCTGGCAATAAACATAGCATGGTGATAGACATGCGCAAAGTGAACGCGGCCGCAAAGGGAGATGCATATCCCCTGCCAAATATGGAGCAGATCTTACTGTTATATGACATCATCATCGCCACGGAGACATTTGAAGATCTGGTGATGTTAGAACGCGTATTGGCCAGAATCAATGAAGCAGGCCTCACGATCAACCGAGAGAAGAGCGTATTCGGTAGAAATGAGGTGAAATATCTCGGCGTTCTCGTCAACCGAAATGGATTTAGACCAGATCCGGATAAGATAGCTCCGGTTATGCAGTATCCCGAGCCTAAGAACCTTAAGCAACTAAGGCGATTCCTTGGTACATGTGGGAAGAGGAACAACAGCGAGCCTTTGACCACATCAAGGCACTTATCGCGACAGGTGCTACACCAGCCAGACTTTAACTCGCGTTTTGTAATACAAACGGACACTAATGATACTGGCCTGGGAGCGGTATTATACCAGGTGATAGATGGCCAGGAGCGTGTCTTGGAGTTCGCGAGTCGTTCGCCGTCAAAAGCGGAGAGGAATTACTCGGCAACCGAAGGAGAATGCCTTGCTGTGTTGTGGCCCATCGAAAAGTTTCGGGTTTACGTAGAGGGATATCATTTCCTCGTAGTGACCGACCATAGTAGTTTACGTTGGATTCGGACACTGCGTAGTCCGACAGGTAGGCGCGCACAAGGAGTGATGGCGAAATTGGCACCAAAATACGTTAACCCTTATGAAATTTTAGAGAAGAGAGGGCCAAACACGTATAAATTAGTGGACCAAGAAGGAGATATAGAAGATCTGGTCCACGCAGAACACCTGAAGCCATTTTACGCCGAAAGGGTGTCCGAGGATAACGAAGACGAAACACAGTTATGTTAcggcgaagaagaagatgacATCGCCCGACCACCGAGGGATTCTATCGAAACGGCAAAGAGCGACCCGCCGCAAGCGAGAACTCAGTCGCCATCGGGCACTGAGCAAGATCAGGACGAGGTTGGTATAACTATTCAAGCTCGCGGGAGGGGTAGGCCAAGGAAGACTACTTTAGTTATACAGAAGCAGGTCGATCCTACTCCCGTATCAGCCAACCCCGTGCCTATTGCGAGCGAACCCCCTAAGAGACCGCGCGGTCGGCCAAAAGGGTCGAAAAATCGCGTGTTAAACAGCGACCCCGTTCCCGTTAGCTCCCGGAGAACACGCGCAAATCCGAACCAAGGTTTACGAGGATAA
Protein Sequence: MEEDRLRPRNENVHLQDTYTWIVRKWNVSFSVERGQSIEAFLERVEACRGSTSLTEAAPSYSKLCQTPERRCSHVVSSGEESLEHMDRLSAIVLTNLLGKRELARLEGPKSAETTLEAPILSKKEGRRPIDLAVTVSQVKVEQGNTSKELERNSNQILLGGVKRDVLVSIIPDLEVDCYVGSNFVRAFEIMHDPAENRLIVEKCGKSIGLELACVSSSNPDDPSQIGIASLNMMKASSAGLADITLEEHQRLQDLLKRVLPPDDAPLGCTSCAEHEINVGTTRPIRQKQYPISRKLEDEMHRQVREMLKAGLLEPSSSPWSNPAFMVPKAGNKHSMVIDMRKVNAAAKGDAYPLPNMEQILLLYDIIIATETFEDLVMLERVLARINEAGLTINREKSVFGRNEVKYLGVLVNRNGFRPDPDKIAPVMQYPEPKNLKQLRRFLGTCGKRNNSEPLTTSRHLSRQVLHQPDFNSRFVIQTDTNDTGLGAVLYQVIDGQERVLEFASRSPSKAERNYSATEGECLAVLWPIEKFRVYVEGYHFLVVTDHSSLRWIRTLRSPTGRRAQGVMAKLAPKYVNPYEILEKRGPNTYKLVDQEGDIEDLVHAEHLKPFYAERVSEDNEDETQLCYGEEEDDIARPPRDSIETAKSDPPQARTQSPSGTEQDQDEVGITIQARGRGRPRKTTLVIQKQVDPTPVSANPVPIASEPPKRPRGRPKGSKNRVLNSDPVPVSSRRTRANPNQGLRG

Similar Transcription Factors

Sequence clustering based on sequence similarity using MMseqs2

100% Identity: -
90% Identity: -
80% Identity: -