Basic Information

Insect: Zygaena filipendulae
Gene Symbol: -
Assembly: GCA_907165275.1
Location: OU015665.1:11864156-11867338[-]

Transcription Factor Domain

TF Family: HMGA
Domain: HMGA domain
PFAM: AnimalTFDB
TF Group: Unclassified Structure
Description: This entry represents the HMGA family, whose members contain DNA-binding domains, also known as AT hooks due to their ability to interact with the narrow minor groove of AT-rich DNA sequences. They play an important role in chromatin organisation [1]. The high mobility group (HMG) proteins are the most abundant and ubiquitous nonhistone chromosomal proteins. They bind to DNA and to nucleosomes and are involved in the regulation of DNA-dependent processes such as transcription, replication, recombination, and DNA repair. They can be grouped into three families: HMGB (HMG 1/2), HMGN (HMG 14/17) and HMGA (HMG I/Y). The characteristic domains are: AT-hook for the HMGA family, the HMG Box for the HMGB family, and the nucleosome-binding domain (NBD) for the members of the HMGN family [2].
Hmmscan Out: # of c-Evalue i-Evalue score bias hmm coord from hmm coord to ali coord from ali coord to env coord from env coord to acc

1 9 0.00033 0.73 10.1 4.0 5 13 118 126 116 127 0.89

2 9 0.00033 0.73 10.1 4.0 5 13 168 176 166 177 0.89

3 9 0.00033 0.73 10.1 4.0 5 13 218 226 216 227 0.89

4 9 0.00014 0.32 11.2 2.8 5 13 275 283 273 284 0.89

5 9 0.00033 0.73 10.1 4.0 5 13 465 473 463 474 0.89

6 9 0.00033 0.73 10.1 4.0 5 13 515 523 513 524 0.89

7 9 0.00033 0.73 10.1 4.0 5 13 565 573 563 574 0.89

8 9 0.00033 0.73 10.1 4.0 5 13 615 623 613 624 0.89

9 9 0.00014 0.32 11.2 2.8 5 13 672 680 670 681 0.89

#	of	c-Evalue	i-Evalue	score	bias	hmm coord from	hmm coord to	ali coord from	ali coord to	env coord from	env coord to	acc
1	9	0.00033	0.73	10.1	4.0	5	13	118	126	116	127	0.89
2	9	0.00033	0.73	10.1	4.0	5	13	168	176	166	177	0.89
3	9	0.00033	0.73	10.1	4.0	5	13	218	226	216	227	0.89
4	9	0.00014	0.32	11.2	2.8	5	13	275	283	273	284	0.89
5	9	0.00033	0.73	10.1	4.0	5	13	465	473	463	474	0.89
6	9	0.00033	0.73	10.1	4.0	5	13	515	523	513	524	0.89
7	9	0.00033	0.73	10.1	4.0	5	13	565	573	563	574	0.89
8	9	0.00033	0.73	10.1	4.0	5	13	615	623	613	624	0.89
9	9	0.00014	0.32	11.2	2.8	5	13	672	680	670	681	0.89

Sequence Information

Coding Sequence: ATGACCGGCGCCCAAGGCCCCCTGCGACGGGTCAGCCCCTCCACGCCGCCAATCACCGGGGCGGCCCCGTCGAGGCCGCAGAGGAAAAGCATCTCCACGGCCTCTAACACTCAGCCGCGGTGCTCCCCGAGCCACCGCGGCCCGCCTCAGTGGCGCCGCCGCCCCGGAGGACGACAGCGCCACCTACATGGGCCGCCTCGACCACGTGCTTGCTGCCTGCAAGTGGGTGAGACGGCCCCCTCCCGGTGCCTCATGCCGGGCGCGGCGTCGGATGAAATCGACGGCGCCGCACCCGAACATTCCGGCCCTTCTCCCGGCCACGGTTTTTACGCCGCGACCCGCCTCAGCCGCGCCCCCACGCCAAAGCGCCCGAGAGGCACGGCCTACCCGTCCCGGTGCCGCATGCCGGGCGCGGCGTCGGATGAAATCGACGGCGCCGCACCCGAGCATTCCGGCCCTTCTCCCGGCCACGGTTTTTACGCCGCGACCCGCCTCAGCCGCGCCCCCACGCCAAAGCGCCCGAGAGGCACGGCCTACCCGTCCCGGTGCCGCGTGCCGGGCGCGGCGTCGGATGAAATCGACGGCGCCGCACCCGAACATTCCGGCCCCTCTCCCGGCCACGGTTTATACGCCGCGACCCGCCTCAGCCGCGCCCCCACGCCAAAGCGCCCGAGAGGCACGGCCTACGCTCCCCTCTCCCGGCCACGGTTTTTTACGCCGCGGCCCACCTCAGTTGCACCCCCACGCCAAAGCGCCCGAGAGGCGCAACCTACCGTCCCCTCTCCCGGCCACGGTTTTTACGCCGCGGCCCGCCTCAGTCGCGCCCCCACGCCAAAGCGCCCGAGAGGCGCAACCTACCCGTCTCGGTGCCTCATGTCGGGCGCAGCGCTGGCCCTTCTCAGCGCCGCACTCACCGGCATTCCGGCCCGCCTCAGGGTTCCTCTTGGCTTCACCAATGACGACGATGCGCCGGAACACGCGACGCACCGCCGCCCTCCTCCCTCTCTCGGGGACCTTGTGCAAAGGACGCCGGTCGGGCCCATGACCGGCGCCCAAGGCCCCCTGCGACGGGTCAGCCCCTCCACGCCGCCAATCACCGGGGCGGCACCGTCGAGGCCGCAGAGGAAAAGCATCTCCACGGCCTCTAACACTCAGCCGCGGTGCTCCCCGAGCCACCGCGGCCCGCCTCAGTGGCGCCGCCGCCCTGGAGGACGACAGCGCCACCTACATGGGCCGCCTCGACCACGTGCTTGCTGCCTGCAAGTGGGTGAGACGGCCCCCTCCCGGTGCCTCATGCCGGGCGCGGCGTCGGATGAAATCGACGGCGCCGCACCCGAACATTCCGGCCCTTCTCCCGGCCACGGTTTTTACGCCGCGACCCGCCTCAGCCGCGCCCCCACGCCAAAGCGCCCGAGAGGCACGGCCTACCCGTCCCGGTGCCGCATGCCGGGCGCGGCGTCGGATGAAATCGACGGCGCCGCACCCGAGCATTCCGGCCCTTCTCCCGGCCACGGTTTTTACGCCGCGACCCGCCTCAGCCGCGCCCCCACGCCAAAGCGCCCGAGAGGCACGGCCTACCCGTCCCGGTGCCGCATGCCGGGCGCGGCGTCGGATGAAATCGACGGCGCCGCACCCGAACATTCCGGCCCTTCTCCCGGCCACGGTTTTTACGCCGCGACCCGCCTCAGCCGCGCCCCCACGCCAAAGCGCCCGAGAGGCACGGCCTACCCGTCCCGGTGCCGCATGCCGGGCGCGGCGTCGGATGAAATCGACGGCGCCGCACCCGAACATTCCGGCCCTTCTCCCGGCCACGGTTTTTACGCCGCGACCCGCCTCAGCCGCGCCCCCACGCCAAAGCGCCCGAGAGGCACGGCCTACGCTCCCCTCTCCCGGCCACGGTTTTTTACGCCGCGGCCCACCTCAGTTGCACCCCCACGCCAAAGCGCCCGAGAGGCGCAACCTACCGTCCCCTCTCCCGGCCACGGTTTTTACGCCGCGACCCGCCTCAGTCGCGCCCCCACGCCAAAGCGCCCGAGAGGCGCAACCTACCCGTCTCGGTGCCTCATGTCGGGCGCAGCGCTGGCCCTTCTCAGCGCCGCACTCACCGGCATTCCGGCCCGCCTCAGGGTTCCTCTTGGCTTCACCAACGCGCCCTCCCTCCTCGTACCTCTATGTGAAGACGCCCCGCCCCCGCGGGACGCCCCCGAGGCATGA
Protein Sequence: MTGAQGPLRRVSPSTPPITGAAPSRPQRKSISTASNTQPRCSPSHRGPPQWRRRPGGRQRHLHGPPRPRACCLQVGETAPSRCLMPGAASDEIDGAAPEHSGPSPGHGFYAATRLSRAPTPKRPRGTAYPSRCRMPGAASDEIDGAAPEHSGPSPGHGFYAATRLSRAPTPKRPRGTAYPSRCRVPGAASDEIDGAAPEHSGPSPGHGLYAATRLSRAPTPKRPRGTAYAPLSRPRFFTPRPTSVAPPRQSAREAQPTVPSPGHGFYAAARLSRAPTPKRPRGATYPSRCLMSGAALALLSAALTGIPARLRVPLGFTNDDDAPEHATHRRPPPSLGDLVQRTPVGPMTGAQGPLRRVSPSTPPITGAAPSRPQRKSISTASNTQPRCSPSHRGPPQWRRRPGGRQRHLHGPPRPRACCLQVGETAPSRCLMPGAASDEIDGAAPEHSGPSPGHGFYAATRLSRAPTPKRPRGTAYPSRCRMPGAASDEIDGAAPEHSGPSPGHGFYAATRLSRAPTPKRPRGTAYPSRCRMPGAASDEIDGAAPEHSGPSPGHGFYAATRLSRAPTPKRPRGTAYPSRCRMPGAASDEIDGAAPEHSGPSPGHGFYAATRLSRAPTPKRPRGTAYAPLSRPRFFTPRPTSVAPPRQSAREAQPTVPSPGHGFYAATRLSRAPTPKRPRGATYPSRCLMSGAALALLSAALTGIPARLRVPLGFTNAPSLLVPLCEDAPPPRDAPEA

Similar Transcription Factors

Sequence clustering based on sequence similarity using MMseqs2

100% Identity: iTF_01569355; iTF_01569363; iTF_01569364;
90% Identity: iTF_01569355;
80% Identity: -