Basic Information

Insect: Zygaena filipendulae
Gene Symbol: -
Assembly: GCA_907165275.1
Location: OU015655.1:1-8853[+]

Transcription Factor Domain

TF Family: HMGA
Domain: HMGA domain
PFAM: AnimalTFDB
TF Group: Unclassified Structure
Description: This entry represents the HMGA family, whose members contain DNA-binding domains, also known as AT hooks due to their ability to interact with the narrow minor groove of AT-rich DNA sequences. They play an important role in chromatin organisation [1]. The high mobility group (HMG) proteins are the most abundant and ubiquitous nonhistone chromosomal proteins. They bind to DNA and to nucleosomes and are involved in the regulation of DNA-dependent processes such as transcription, replication, recombination, and DNA repair. They can be grouped into three families: HMGB (HMG 1/2), HMGN (HMG 14/17) and HMGA (HMG I/Y). The characteristic domains are: AT-hook for the HMGA family, the HMG Box for the HMGB family, and the nucleosome-binding domain (NBD) for the members of the HMGN family [2].
Hmmscan Out: # of c-Evalue i-Evalue score bias hmm coord from hmm coord to ali coord from ali coord to env coord from env coord to acc

1 7 0.00029 0.65 10.3 4.0 5 13 147 155 145 156 0.89

2 7 0.00029 0.65 10.3 4.0 5 13 197 205 195 206 0.89

3 7 0.00029 0.65 10.3 4.0 5 13 247 255 245 256 0.89

4 7 0.00013 0.29 11.4 2.8 5 13 304 312 302 313 0.89

5 7 0.00029 0.65 10.3 4.0 5 13 522 530 520 531 0.89

6 7 0.00029 0.65 10.3 4.0 5 13 572 580 570 581 0.89

7 7 0.00029 0.65 10.3 4.0 5 13 622 630 620 631 0.89

#	of	c-Evalue	i-Evalue	score	bias	hmm coord from	hmm coord to	ali coord from	ali coord to	env coord from	env coord to	acc
1	7	0.00029	0.65	10.3	4.0	5	13	147	155	145	156	0.89
2	7	0.00029	0.65	10.3	4.0	5	13	197	205	195	206	0.89
3	7	0.00029	0.65	10.3	4.0	5	13	247	255	245	256	0.89
4	7	0.00013	0.29	11.4	2.8	5	13	304	312	302	313	0.89
5	7	0.00029	0.65	10.3	4.0	5	13	522	530	520	531	0.89
6	7	0.00029	0.65	10.3	4.0	5	13	572	580	570	581	0.89
7	7	0.00029	0.65	10.3	4.0	5	13	622	630	620	631	0.89

Sequence Information

Coding Sequence: AATGACGACGATGCGCCGGAACACGCGGCGCACCGCCGCCCTCCTCCCTCTCTCGGGGACCTTGTGCAAAGGACGCCGGTCGGGCCCATGACCGGCGCCCAAGGCCCCCTGCGACGGGTCAGCCCCTCCACGCCGCCAATCACCGGGGCGGCCCCGTCGAGGCCGCAGAGGAAAAGCATCTCCACGGCCTCTAACACTCAGCCGCGGTGCTCCCCGAGCCACCGCGGCCCGCCTCAGTGGCGCCGCCGCCCCGGAGGACGACAGCGCCACCTACATGGGCCGCCTCGACCACGTGCTTGCTGCCTGCAAGTGGGTGAGACGGCCCCCTCCCGGTGCCTCATGCCGGGCGCGGCGTCGGATGAAATCGACGGCGCCGCACCCGAACATTCCGGCCCTTCTCCCGGCCACGGTTTTTACGCCGCGACCCGCCTCAGCCGCGCCCCCACGCCAAAGCGCCCGAGAGGCACGGCCTACCCGTCCCGGTGCCGCATGCCGGGCGCGGCGTCGGATGAAATCGACGGCGCCGCACCCGAGCATTCCGGCCCTTCTCCCGGCCACGGTTTTTACGCCGCGACCCGCCTCAGCCGCGCCCCCACGCCAAAGCGCCCGAGAGGCACGGCCTACCCGTCCCGGTGCCGCATGCCGGGCGCGGCGTCGGATGAAATCGACGGCGCCGCACCCGAACATTCCGGCCCTTCTCCCGGCCACGGTTTTTACGCCGCGACCCGCCTCAGCCGCGCCCCCACGCCAAAGCGCCCGAGAGGCACGGCCTACGCTCCCCTCTCCCGGCCACGGTTTTTTACGCCGCGGCCCACCTCAGTTGCACCCCCACGCCAAAGCGCCCGAGAGGCGCAACCTACCGTCCCCTCTCCCGGCCACGGTTTTTACGCCGCGACCCGCCTCAGTCGCGCCCCCACGCCAAAGCGCCCGAGAGGCGCAACCTACCCGTCTCGGTGCCTCATGTCGGGCGCAGCGCTGGCCCTTCTCAGCGCCGCACTCACCGGCATTCCGGCCCGCCTCAGGGTTCCTCTTGGCTTCACCAATGACGACGATGCGCCGGAACACGCGACGCACCGCCGCCCTCCTCCCTCTCTCGGGGACCTTGTGCAGAGGACGCCGGTCGGGCCCATGACCGGCGCCCAAGGCCCCCTGCGACGGGTCGGGCCAGTGGCCCCGCCGCCCACCACGACGGCCGCAGGGGGTGAGGAGGGCCGACTAGCTCCGCGCCAGCACTCCCCTCCCCCCGAAGCCCCTCCACGCCGCCACTCACCGGGGCGGCCCCGTCGAGGTCGCAGAGGAAAACACCCCCACGGCCTCCAACCCCCGGCCGCGGCGCTCGAGCTACGCCGCAGCCCGCCTCAGTGGCGCCGCCGCCCCGGAGGACGACAGCGCCACCTACATGGGCCGCCTCGACCACGTGCTTGCTGCCTGCAAGTGGGTGAGACGGCCCCCTCCCGGTGCCTCATGCCGGGCGCGGCGTCGGATGAAATCGACGGCGCCGCACCCGAACATTCCGGCCCTTCTCCCGGCCACGGTTTTTACGCCGCGACCCGCCTCAGCCGCGCCCCCACGCCAAAGCGCCCGAGAGGCACGGCCTACCCGTCCCGGTGCCGTATGCCGGGCGCGGCGTCGGATGAAATCGACGGCGCCGCACCCGAACATTCCGGCCCTTCTCCCGGCCACGGTTTTCACGCCGCGACCCGCCTCAGCCGCGCCCCCACGCCAAAGCGCCCGAGAGGCACGGCCTACCCGTCCCGGTGCCGCATGCCGGGCGCGGCGTCGGATGAAATCGACGGCGCCGCACCCGGACATTCCGGCCCTTCTCCCGGCCACGGTTTTTACGCCGCGACCCGCCTCAGCCGCGCCCCCACGCCAAAGCGCCCGAGAGGCACGGCCTACCCGTCACGGTGCCTCATGTCGGGCGCAGCGCTGGTCATTCCTAGTCAGCGCCGCACTCGCCGGCATTCTGGCCCGCCTCTGGGTTCCTCTTAG
Protein Sequence: NDDDAPEHAAHRRPPPSLGDLVQRTPVGPMTGAQGPLRRVSPSTPPITGAAPSRPQRKSISTASNTQPRCSPSHRGPPQWRRRPGGRQRHLHGPPRPRACCLQVGETAPSRCLMPGAASDEIDGAAPEHSGPSPGHGFYAATRLSRAPTPKRPRGTAYPSRCRMPGAASDEIDGAAPEHSGPSPGHGFYAATRLSRAPTPKRPRGTAYPSRCRMPGAASDEIDGAAPEHSGPSPGHGFYAATRLSRAPTPKRPRGTAYAPLSRPRFFTPRPTSVAPPRQSAREAQPTVPSPGHGFYAATRLSRAPTPKRPRGATYPSRCLMSGAALALLSAALTGIPARLRVPLGFTNDDDAPEHATHRRPPPSLGDLVQRTPVGPMTGAQGPLRRVGPVAPPPTTTAAGGEEGRLAPRQHSPPPEAPPRRHSPGRPRRGRRGKHPHGLQPPAAALELRRSPPQWRRRPGGRQRHLHGPPRPRACCLQVGETAPSRCLMPGAASDEIDGAAPEHSGPSPGHGFYAATRLSRAPTPKRPRGTAYPSRCRMPGAASDEIDGAAPEHSGPSPGHGFHAATRLSRAPTPKRPRGTAYPSRCRMPGAASDEIDGAAPGHSGPSPGHGFYAATRLSRAPTPKRPRGTAYPSRCLMSGAALVIPSQRRTRRHSGPPLGSS

Similar Transcription Factors

Sequence clustering based on sequence similarity using MMseqs2

100% Identity: iTF_01569354;
90% Identity: -
80% Identity: -