Basic Information

Insect: Zygaena filipendulae
Gene Symbol: -
Assembly: GCA_907165275.1
Location: OU015665.1:11852094-11856100[-]

Transcription Factor Domain

TF Family: HMGA
Domain: HMGA domain
PFAM: AnimalTFDB
TF Group: Unclassified Structure
Description: This entry represents the HMGA family, whose members contain DNA-binding domains, also known as AT hooks due to their ability to interact with the narrow minor groove of AT-rich DNA sequences. They play an important role in chromatin organisation [1]. The high mobility group (HMG) proteins are the most abundant and ubiquitous nonhistone chromosomal proteins. They bind to DNA and to nucleosomes and are involved in the regulation of DNA-dependent processes such as transcription, replication, recombination, and DNA repair. They can be grouped into three families: HMGB (HMG 1/2), HMGN (HMG 14/17) and HMGA (HMG I/Y). The characteristic domains are: AT-hook for the HMGA family, the HMG Box for the HMGB family, and the nucleosome-binding domain (NBD) for the members of the HMGN family [2].
Hmmscan Out: # of c-Evalue i-Evalue score bias hmm coord from hmm coord to ali coord from ali coord to env coord from env coord to acc

1 10 0.00045 1 9.7 4.0 5 13 313 321 311 322 0.89

2 10 0.00045 1 9.7 4.0 5 13 363 371 361 372 0.89

3 10 0.00045 1 9.7 4.0 5 13 413 421 411 422 0.89

4 10 0.00045 1 9.7 4.0 5 13 463 471 461 472 0.89

5 10 0.0002 0.44 10.8 2.8 5 13 520 528 518 529 0.89

6 10 0.00045 1 9.7 4.0 5 13 710 718 708 719 0.89

7 10 0.00045 1 9.7 4.0 5 13 760 768 758 769 0.89

8 10 0.00045 1 9.7 4.0 5 13 810 818 808 819 0.89

9 10 0.00045 1 9.7 4.0 5 13 860 868 858 869 0.89

10 10 0.0002 0.44 10.8 2.8 5 13 917 925 915 926 0.89

#	of	c-Evalue	i-Evalue	score	bias	hmm coord from	hmm coord to	ali coord from	ali coord to	env coord from	env coord to	acc
1	10	0.00045	1	9.7	4.0	5	13	313	321	311	322	0.89
2	10	0.00045	1	9.7	4.0	5	13	363	371	361	372	0.89
3	10	0.00045	1	9.7	4.0	5	13	413	421	411	422	0.89
4	10	0.00045	1	9.7	4.0	5	13	463	471	461	472	0.89
5	10	0.0002	0.44	10.8	2.8	5	13	520	528	518	529	0.89
6	10	0.00045	1	9.7	4.0	5	13	710	718	708	719	0.89
7	10	0.00045	1	9.7	4.0	5	13	760	768	758	769	0.89
8	10	0.00045	1	9.7	4.0	5	13	810	818	808	819	0.89
9	10	0.00045	1	9.7	4.0	5	13	860	868	858	869	0.89
10	10	0.0002	0.44	10.8	2.8	5	13	917	925	915	926	0.89

Sequence Information

Coding Sequence: ATGACGACGATGCGCCGGAACACGCGACGCACCGCCGTCCTCCTCCTTCTCGGGGACCTTGTGCAAAGGACGCCGGTCGGGCCCATGACCGGCGCCCGAGGCCCCCTGCGACGAGTCGGGTCAGTGGCCCCGCCGCCCACCACGACGGCCGCAGAGGGTGAGGAGGGCCGACTAGCTCCGCGCCAGCACTCCCCTCCCCCCGCAGCCCCTCCACGCCGCCAATCACCGGGGCGGCCCCGTCGAGGCCGCAGAGGAAAACCATCTCCACGGCCTCTAACCCTCAGCCGCGGTGCTCCCCGAGCCACCGCGGCCCGCCTCAGTCGCGCCGCCGCTCCGAAGGGCGACGGCGCCACCTACTCGGGCCGCCTCATCACGGGTTTCCCCGAAAACCCGGAGAGGCGGCCCAGTGGCCTCGAGCCGGGCAGCGCCGGGAGCAGCTCAACCGGCGCCGCCGACTATACTGGCCCCGCCTCTGGGTTCCTCTTAGCTTCACCGCGGAATGACGACGATGCGCCGGAACACGCGACGCACCGCCGCCCTCCTCCCTCTCTCGGGGACCTTGTGCAAAGGACGCCGGTCGGGCCCATGACCGGCGCCCAAGGCCCCCTGCGACGGGTCAGCCCCTCCACGCCGCCAATCACCGGGGCGGCACCGTCGAGGCCGCAGAGGAAAAGCATCTCCACGGCCTCTAACACTCAGCCGCGGTGCTCCCCGAGCCACCGCGGCCCGCCTCAGTGGCGCCGCCGCCCCGGAGGACGACAGCGCCACCTACATGGGCCGCCTCGACCACGTGCTTGCTGCCTGCAAGTGGGTGAGACGGCCCCCTCCCGGTGCCTCATGCCGGGCGCGGCGTCGGATGAAATCGACGGCGCCGCACCCGAACATTCCGGCCCTTCTCCCGGCCACGGTTTTTACGCCGCGACCCGCCTCAGCCGCGCCCCCACGCCAAAGCGCCCGAGAGGCACGGCCTACCCGTCCCGGTGCCGCATGCCGGGCGCGGCGTCGGATGAAATCGACGGCGCCGCACCCGAGCATTCCGGCCCTTCTCCCGGCCACGGTTTTTACGCCGCGACCCGCCTCAGCCGCGCCCCCACGCCAAAGCGCCCGAGAGGCACGGCCTACCCGTCCCGGTGCCGCATGCCGGGCGCGGCGTCGGATGAAATCGACGGCGCCGCACCCGAACATTCCGGCCCTTCTCCCGGCCACGGTTTTTACGCCGCGACCCGCCTCAGCCGCGCCCCCACGCCAAAGCGCCCGAGAGGCACGGCCTACCCGTCCCGGTGCCGCATGCCGGGCGCGGCGTCGGATGAAATCGACGGCGCCGCACCCGAACATTCCGGCCCTTCTCCCGGCCACGGTTTTTACGCCGCGACCCGCCTCAGCCGCGCCCCCACGCCAAAGCGCCCGAGAGGCACGGCCTACGCTCCCCTCTCCCGGCCACGGTTTTTTACGCCGCGGCCCACCTCAGTTGCACCCCCACGCCAAAGCGCCCGAGAGGCGCAACCTACCGTCCCCTCTCCCGGCCACGGTTTTTACGCCGCGACCCGCCTCAGTCGCGCCCCCACGCCAAAGCGCCCGAGAGGCGCAACCTACCCGTCTCGGTGCCTCATGTCGGGCGCAGCGCTGGCCCTTCTCAGCGCCGCACTCACCGGCATTCCGGCCCGCCTCAGGGTTCCTCTTGGCTTCACCAATGACGACGATGCGCCGGAACACGCGACGCACCGCCGCCCTCCTCCCTCTCTCGGGGACCTTGTGCAAAGGACGCCGGTCGGGCCCATGACCGGCGCCCAAGGCCCCCTGCGACGGGTCAGCCCCTCCACGCCGCCAATCACCGGGGCGGCACCGTCGAGGCCGCAGAGGAAAAGCATCTCCACGGCCTCTAACACTCAGCCGCGGTGCTCCCCGAGCCACCGCGGCCCGCCTCAGTGGCGCCGCCGCCCCGGAGGACGACAGCGCCACCTACATGGGCCGCCTCGACCACGTGCTTGCTGCCTGCAAGTGGGTGAGACGGCCCCCTCCCGGTGCCTCATGCCGGGCGCGGCGTCGGATGAAATCGACGGCGCCGCACCCGAACATTCCGGCCCTTCTCCCGGCCACGGTTTTTACGCCGCGACCCGCCTCAGCCGCGCCCCCACGCCAAAGCGCCCGAGAGGCACGGCCTACCCGTCCCGGTGCCGCATGCCGGGCGCGGCGTCGGATGAAATCGACGGCGCCGCACCCGAGCATTCCGGCCCTTCTCCCGGCCACGGTTTTTACGCCGCGACCCGCCTCAGCCGCGCCCCCACGCCAAAGCGCCCGAGAGGCACGGCCTACCCGTCCCGGTGCCGCATGCCGGGCGCGGCGTCGGATGAAATCGACGGCGCCGCACCCGAACATTCCGGCCCTTCTCCCGGCCACGGTTTTTACGCCGCGACCCGCCTCAGCCGCGCCCCCACGCCAAAGCGCCCGAGAGGCACGGCCTACCCGTCCCGGTGCCGCATGCCGGGCGCGGCGTCGGATGAAATCGACGGCGCCGCACCCGAACATTCCGGCCCTTCTCCCGGCCACGGTTTTTACGCCGCGACCCGCCTCAGCCGCGCCCCCACGCCAAAGCGCCCGAGAGGCACGGCCTACGCTCCCCTCTCCCGGCCACGGTTTTTTACGCCGCGGCCCACCTCAGTTGCACCCCCACGCCAAAGCGCCCGAGAGGCGCAACCTACCGTCCCCTCTCCCGGCCACGGTTTTTACGCCGCGACCCGCCTCAGTCGCGCCCCCACGCCAAAGCGCCCGAGAGGCGCAACCTACCCGTCTCGGTGCCTCATGTCGGGCGCAGCGCTGGCCCTTCTCAGCGCCGCACTCACCGGCATTCCGGCCCGCCTCAGGGTTCCTCTTGGCTTCACCGTGGGTGGACAGTACCCACGGCTACTAAGCCCCCCCGCCACGACAAGGCGGGAACCCAATTCGGGGGGGGGAACCCAATTCGGGGGGGAACCTAACCTAACCTAA
Protein Sequence: MTTMRRNTRRTAVLLLLGDLVQRTPVGPMTGARGPLRRVGSVAPPPTTTAAEGEEGRLAPRQHSPPPAAPPRRQSPGRPRRGRRGKPSPRPLTLSRGAPRATAARLSRAAAPKGDGATYSGRLITGFPENPERRPSGLEPGSAGSSSTGAADYTGPASGFLLASPRNDDDAPEHATHRRPPPSLGDLVQRTPVGPMTGAQGPLRRVSPSTPPITGAAPSRPQRKSISTASNTQPRCSPSHRGPPQWRRRPGGRQRHLHGPPRPRACCLQVGETAPSRCLMPGAASDEIDGAAPEHSGPSPGHGFYAATRLSRAPTPKRPRGTAYPSRCRMPGAASDEIDGAAPEHSGPSPGHGFYAATRLSRAPTPKRPRGTAYPSRCRMPGAASDEIDGAAPEHSGPSPGHGFYAATRLSRAPTPKRPRGTAYPSRCRMPGAASDEIDGAAPEHSGPSPGHGFYAATRLSRAPTPKRPRGTAYAPLSRPRFFTPRPTSVAPPRQSAREAQPTVPSPGHGFYAATRLSRAPTPKRPRGATYPSRCLMSGAALALLSAALTGIPARLRVPLGFTNDDDAPEHATHRRPPPSLGDLVQRTPVGPMTGAQGPLRRVSPSTPPITGAAPSRPQRKSISTASNTQPRCSPSHRGPPQWRRRPGGRQRHLHGPPRPRACCLQVGETAPSRCLMPGAASDEIDGAAPEHSGPSPGHGFYAATRLSRAPTPKRPRGTAYPSRCRMPGAASDEIDGAAPEHSGPSPGHGFYAATRLSRAPTPKRPRGTAYPSRCRMPGAASDEIDGAAPEHSGPSPGHGFYAATRLSRAPTPKRPRGTAYPSRCRMPGAASDEIDGAAPEHSGPSPGHGFYAATRLSRAPTPKRPRGTAYAPLSRPRFFTPRPTSVAPPRQSAREAQPTVPSPGHGFYAATRLSRAPTPKRPRGATYPSRCLMSGAALALLSAALTGIPARLRVPLGFTVGGQYPRLLSPPATTRREPNSGGGTQFGGEPNLT

Similar Transcription Factors

Sequence clustering based on sequence similarity using MMseqs2

100% Identity: -
90% Identity: -
80% Identity: -