Basic Information

Insect: Zygaena filipendulae
Gene Symbol: -
Assembly: GCA_907165275.1
Location: OU015665.1:11822836-11831563[-]

Transcription Factor Domain

TF Family: HMGA
Domain: HMGA domain
PFAM: AnimalTFDB
TF Group: Unclassified Structure
Description: This entry represents the HMGA family, whose members contain DNA-binding domains, also known as AT hooks due to their ability to interact with the narrow minor groove of AT-rich DNA sequences. They play an important role in chromatin organisation [1]. The high mobility group (HMG) proteins are the most abundant and ubiquitous nonhistone chromosomal proteins. They bind to DNA and to nucleosomes and are involved in the regulation of DNA-dependent processes such as transcription, replication, recombination, and DNA repair. They can be grouped into three families: HMGB (HMG 1/2), HMGN (HMG 14/17) and HMGA (HMG I/Y). The characteristic domains are: AT-hook for the HMGA family, the HMG Box for the HMGB family, and the nucleosome-binding domain (NBD) for the members of the HMGN family [2].
Hmmscan Out: # of c-Evalue i-Evalue score bias hmm coord from hmm coord to ali coord from ali coord to env coord from env coord to acc

1 21 0.00091 2 8.7 4.0 5 13 132 140 130 141 0.89

2 21 0.00091 2 8.7 4.0 5 13 182 190 180 191 0.89

3 21 0.00091 2 8.7 4.0 5 13 232 240 230 241 0.89

4 21 0.0004 0.9 9.8 2.8 5 13 289 297 287 298 0.89

5 21 0.00091 2 8.7 4.0 5 13 507 515 505 516 0.89

6 21 0.00091 2 8.7 4.0 5 13 557 565 555 566 0.89

7 21 0.00091 2 8.7 4.0 5 13 607 615 605 616 0.89

8 21 0.0004 0.9 9.8 2.8 5 13 664 672 662 673 0.89

9 21 0.029 65 3.9 2.9 5 13 854 862 852 863 0.89

10 21 0.00091 2 8.7 4.0 5 13 954 962 952 963 0.89

11 21 0.00043 0.95 9.7 2.9 6 13 1005 1012 1002 1017 0.88

12 21 0.00091 2 8.7 4.0 5 13 1196 1204 1194 1205 0.89

13 21 0.00091 2 8.7 4.0 5 13 1246 1254 1244 1255 0.89

14 21 0.00091 2 8.7 4.0 5 13 1296 1304 1294 1305 0.89

15 21 0.00091 2 8.7 4.0 5 13 1346 1354 1344 1355 0.89

16 21 0.0004 0.9 9.8 2.8 5 13 1403 1411 1401 1412 0.89

17 21 0.00091 2 8.7 4.0 5 13 1593 1601 1591 1602 0.89

18 21 0.00091 2 8.7 4.0 5 13 1643 1651 1641 1652 0.89

19 21 0.00091 2 8.7 4.0 5 13 1693 1701 1691 1702 0.89

20 21 0.00091 2 8.7 4.0 5 13 1743 1751 1741 1752 0.89

21 21 0.0004 0.9 9.8 2.8 5 13 1800 1808 1798 1809 0.89

#	of	c-Evalue	i-Evalue	score	bias	hmm coord from	hmm coord to	ali coord from	ali coord to	env coord from	env coord to	acc
1	21	0.00091	2	8.7	4.0	5	13	132	140	130	141	0.89
2	21	0.00091	2	8.7	4.0	5	13	182	190	180	191	0.89
3	21	0.00091	2	8.7	4.0	5	13	232	240	230	241	0.89
4	21	0.0004	0.9	9.8	2.8	5	13	289	297	287	298	0.89
5	21	0.00091	2	8.7	4.0	5	13	507	515	505	516	0.89
6	21	0.00091	2	8.7	4.0	5	13	557	565	555	566	0.89
7	21	0.00091	2	8.7	4.0	5	13	607	615	605	616	0.89
8	21	0.0004	0.9	9.8	2.8	5	13	664	672	662	673	0.89
9	21	0.029	65	3.9	2.9	5	13	854	862	852	863	0.89
10	21	0.00091	2	8.7	4.0	5	13	954	962	952	963	0.89
11	21	0.00043	0.95	9.7	2.9	6	13	1005	1012	1002	1017	0.88
12	21	0.00091	2	8.7	4.0	5	13	1196	1204	1194	1205	0.89
13	21	0.00091	2	8.7	4.0	5	13	1246	1254	1244	1255	0.89
14	21	0.00091	2	8.7	4.0	5	13	1296	1304	1294	1305	0.89
15	21	0.00091	2	8.7	4.0	5	13	1346	1354	1344	1355	0.89
16	21	0.0004	0.9	9.8	2.8	5	13	1403	1411	1401	1412	0.89
17	21	0.00091	2	8.7	4.0	5	13	1593	1601	1591	1602	0.89
18	21	0.00091	2	8.7	4.0	5	13	1643	1651	1641	1652	0.89
19	21	0.00091	2	8.7	4.0	5	13	1693	1701	1691	1702	0.89
20	21	0.00091	2	8.7	4.0	5	13	1743	1751	1741	1752	0.89
21	21	0.0004	0.9	9.8	2.8	5	13	1800	1808	1798	1809	0.89

Sequence Information

Coding Sequence: ATGACGACGATGCGCCGGAACACGCGACGCACCGCCGCCCTCCTCCCTCTCTCGGGGACCTTGTGCAGAGGACGCCGCCCCTCCACGCCGCCGATCACCGGGGCGGCCCCGTCGAGGCCGCAGAGGAAAAGCATCTCCACGGCCTCTAACACTCAGCCGCGGTGCTCCCCGAGCCACCGCGGCCCGCCTCAGTGGCGCCGCCGCCCCGGAGGACGACAGCGCCACCTACATGGGCCGCCTCGACCAAGTGCTTGCTGCCTGCAAGTGGGTGAGACGGCCCCCTCCCGGTGCCTCATGCCGGGCGCGGCGTCGGATGAAATCGACGGCGCCGCACCCGAACATTCCGGCCCTTCTCCCGGCCACGGTTTTTACGCCGCGACCCGCCTCAGCCGAGCCCCCACGCCAAAGCGCCCGAGAGGCACGGCCTACCCGTCCCGGTGCCGCATGCCGGGCGCGGCGTCGGATGAAATCGACGGCGCCGCACCCGAGCATTCCGGCCCTTCTCCCGGCCACGGTTTTTACGCCGCGACCCGCCTCAGCCGCGCCCCCACGCCAAAGCGCCCGAGAGGCACGGCCTACCCGTCCCGGTGCCGCATGCCGGGCGCGGCGTCGGATGAAATCGACGGCGCCGCACCCGAACATTCCGGCCCTTCTCCCGGCCACGGTTTTTACGCCGCGACCCGCCTCAGCCGCGCCCCCACGCCAAAGCGCCCGAGAGGCACGGCCTACGCTCCCCTCTCCCGGCCACGGTTTTTTACGCCGCGGCCCACCTCAGTTGCACCCCCACGCCAAAGCGCCCGAGAGGCGCAACCTACCGTCCCCTCTCCCGGCCACGGTTTTTACGCCGCGACCCGCCTCAGCCGCGCCCCCACGCCAAAGCGCCCGAGAGGCGCAACCTACCCGTCTCGGTGCCTCATGTCGGGCGCAGCGCTGGCCCTTCTCAGCGCCGCACTCACCGGCATTCCGGCCCGCCTCAGGGTTCCTCTTGGCTTCACCAATGACGACGATGCGCCGGAACACGCGACGCACCGCCGCCCTCCTCCCTCTCTCGGGGACCTTGTGCAGAGGACGCCGGTCGGGCCCATGACCGGCGCCCAAGGCCCCCTGCGACGGGTCGGGCCAGTGGCCCCGCCGCCCACCACGACGGCCGCAGGGGGTGAGGAGGGCCGACTAGCTCCGCGCCAGCACTCCCCTCCCCCCGAAGCCCCTCCACGCCGCCACTCACCGGGGCGGCCCCGTCGAGGTCGCAGAGGAAAACACCCCCACGGCCTCCAACCCCCGGCCGCGGCGCTCGAGCTACGCCGCAGCCCGCCTCAGTGGCGCCGCCGCCCCGGAGGACGACAGCGCCACCTACAAGGGCCGCCTCGACCACGTGCTTGCTGCCTGCAAGTGGGTGAGACGGCCCCCTCCCGGTGCCTCATGCCGGGCGCGGCGTCGGATGAAATCGACGGCGCCGCACCCGAACATTCCGGCCCTTCTCCCGGCCACGGTTTTTACGCCGCGACCCGCCTCAGCCGCGCCCCCACGCCAAAGCGCCCGAGAGGCACGGCCTACCCGTCCCGGTGCCGCATGCCGGGCGCGGCGTCGGATGAAATCGACGGCGCCGCACCCGAGCATTCCGGCCCTTCTCCCGGCCACGGTTTTTACGCCGCGACCCGCCTCAGCCGCGCCCCCACGCCAAAGCGCCCGAGAGGCACGGCCTACCCGTCCCGGTGCCGCATGCCGGGCGCGGCGTCGGATGAAATCGACGGCGCCGCACCCGAACATTCCGGCCCTTCTCCCGGCCACGGTTTTTACGCCGCGACCCGCCTCAGCCGCGCCCCCACGCCAAAGCGCCCGAGAGGCACGGCCTACGCTCCCCTCTCCCGGCCACGGTTTTTTACGCCGCGGCCCACCTCAGTTGCACCCCCACGCCAAAGCGCCCGAGAGGCGCAACCTACCGTCCCCTCTCCCGGCCACGGTTTTTACGCCGCGACCCGCCTCAGTCGCGCCCCCACGCCAAAGCGCCCGAGAGGCGCAACCTACCCGTCTCGGTGCCTCATGTCGGGCGCAGCGCTGGCCCTTCTCAGCGCCGCACTCACCGGCATTCCGGCCCGCCTCAGGGTTCCTCTTGGCTTCACCAATGACGACGATGCGCCGGAACACGCGACGCACCGCCGCCCTCCTCCCTCTCTCGGGGACCTTGTGCAAAGGACGCCGGTCGGGCCCATGACCGGCGCCCAAGGCCCCCTGCGACGGGTCAGCCCCTCCACGCCGCCAATCACCGGGGCGGCACCGTCGAGGCCGCAGAGGAAAAGCATCTCCACGGCCTCTAACACTCAGCCGCGGTGCTCCCCGAGCCACCGCGGCCCGCCTCAGTGGCGCCGCCGCCCCGGAGGACGACAGCGCCACCTACATGGGCCGCCTCGACCACGTGCTTGCCGCCTGCAAGTGGGTGAGACGGCCCCCTCCCGGTGCCTCATGCCGGGCGCGGCGTCGGATGAAATCGACGGCGCCGCACCCGAACATTCCGGCCCTTCTCCCGGCCACGGTTTTTACGCCGCGACCCGCCTCAGCCGCGCCCCCACGCCAGAGCGCCCGAGAGGCACGGCCTACCCGTCCCGGTGCCGCATGCCGGGCGCGGCGTCGGATGAAATCGACGGCGCCGCACCCGAACATTCCGGACCTTCTCCCGGCCACGGTTTTTTACGCCGCGACCCGCCTCAGCCGCGCCCCCACGCCAAAGCGCCCGAGAGGCACAGCCTACCCGTCCCGTGCCGCATGCCGGGCGCGGCGTCGGATGAAATCGACGGCGCCGCACCCGAACATTCCGGCCCTTCTCCCGGCCACGGTTTTTACGCCGCGACCCGCCTCAGCCGCGCCCCCACGCCAAAGCGCCCGAGAGGCACGGCCTACCCGTCCCGGTGCCGCATGCCGGGCGCGGCGTCGGATGAAATCGACGGCGCCGCACCCGAACATTCCGGACCTTCTCCCGGCCACGGTTTTTACGCCGCGGCCCACCTCAGTTGCACCCCCACGCCAAAGCGCCCGAGAGGCGCAACCTACCGTCCCCTCTCCCGGCCACGGTTTTTACGCCGCGACCCGCCTCAGCCGCGCCCCCACGCCAAAGCGCCCGAGAGGCACGGCCTACCCGTCTCGGCGCCTCATAATGACGACGATGCGCCGGAACACGCGACGCACCGCCGCCCTCCTCCCTCTCTCGGGGACCTTGTGCAAAGGACGCCGGTCGGGCCCATGACCGGCGCCCAAGGCCCCCTGCGACGGGTCAGCCCCTCCACGCCGCCAATCACCGGGGCGGCACCGTCGAGGCCGCAGAGGAAAAGCATCTCCACGGCCTCTAACACTCAGCCGCGGTGCTCCCCGAGCCACCGCGGCCCGCCTCAGTGGCGCCGCCGCCCCGGAGGACGACAGCGCCCCCTACATGGGCCGCCCCGACCACGTGCTTGCTGCCTGCAAGTGGGTGAGACGGCCCCCTCCCGGTGCCTCATGCCGGGCGCGGCGTCGGATGAAATCGACGGCGCCGCACCCGAACATTCCGGCCCTTCTCCCGGCCACGGTTTTTACGCCGCGACCCGCCTCAGCCGCGCCCCCACGCCAAAGCGCCCGAGAGGCACGGCCTACCCGTCCCGGTGCCGCATGCCGGGCGCGGCGTCGGATGAAATCGACGGCGCCGCACCCGAGCATTCCGGCCCTTCTCCCGGCCACGGTTTTTACGCCGCGACCCGCCTCAGCCGCGCCCCCACGCCAAAGCGCCCGAGAGGCACGGCCTACCCGTCCCGGTGCCGCATGCCGGGCGCGGCGTCGGATGAAATCGACGGCGCCGCACCCGAACATTCCGGCCCTTCTCCCGGCCACGGTTTTTACGCCGCGACCCGCCTCAGCCGCGCCCCCACGCCAAAGCGCCCGAGAGGCACGGCCTACCCGTCCCGGTGCCGCATGCCGGGCGCGGCGTCGGATGAAATCGACGGCGCCGCACCCGAACATTCCGGCCCTTCTCCCGGCCACGGTTTTTACGCCGCGACCCGCCTCAGCCGCGCCCCCACGCCAAAGCGCCCGAGAGGCACGGCCTACGCTCCCCTCTCCCGGCCACGGTTTTTTACGCCGCGGCCCACCTCAGTTGCACCCCCACGCCAAAGCGCCCGAGAGGCGCAACCTACCGTCCCCTCTCCCGGCCACGGTTTTTACGCCGCGACCCGCCTCAGTCGCGCCCCCACGCCAAAGCGCCCGAGAGGCGCAACCTACCCGTCTCGGTGCCTCATGTCGGGCGCAGCGCTGGCCCTTCTCAGCGCCGCACTCACCGGCATTCCGGCCCGCCTCAGGGTTCCTCTTGGCTTCACCAATGACGACGATGCGCCGGAACACGCGACGCACCGCCGCCCTCCTCCCTCTCTCGGGGACCTTGTGCAAAGGACGCCGGTCGGGCCCATGACCGGCGCCCAAGGCCCCCTGCGACGGGTCAGCCCCTCCACGCCGCCAATCACCGGGGCGGCACCGTCGAGGCCGCAGAGGAAAAGCATCTCCACGGCCTCTAACACTCAGCCGCGGTGCTCCCCGAGCCACCGCGGCCCGCCTCAGTGGCGCCGCCGCCCCGGAGGACGACAGCGCCACCTACATGGGCCGCCTCGACCACGTGCTTGCTGCCTGCAAGTGGGTGAGACGGCCCCCTCCCGGTGCCTCATGCCGGGCGCGGCGTCGGATGAAATCGACGGCGCCGCACCCGAACATTCCGGCCCTTCTCCCGGCCACGGTTTTTACGCCGCGACCCGCCTCAGCCGCGCCCCCACGCCAAAGCGCCCGAGAGGCACGGCCTACCCGTCCCGGTGCCGCATGCCGGGCGCGGCGTCGGATGAAATCGACGGCGCCGCACCCGAGCATTCCGGCCCTTCTCCCGGCCACGGTTTTTACGCCGCGACCCGCCTCAGCCGCGCCCCCACGCCAAAGCGCCCGAGAGGCACGGCCTACCCGTCCCGGTGCCGCATGCCGGGCGCGGCGTCGGATGAAATCGACGGCGCCGCACCCGAACATTCCGGCCCTTCTCCCGGCCACGGTTTTTACGCCGCGACCCGCCTCAGCCGCGCCCCCACGCCAAAGCGCCCGAGAGGCACGGCCTACCCGTCCCGGTGCCGCATGCCGGGCGCGGCGTCGGATGAAATCGACGGCGCCGCACCCGAACATTCCGGCCCTTCTCCCGGCCACGGTTTTTACGCCGCGACCCGCCTCAGCCGCGCCCCCACGCCAAAGCGCCCGAGAGGCACGGCCTACGCTCCCCTCTCCCGGCCACGGTTTTTTACGCCGCGGCCCACCTCAGTTGCACCCCCACGCCAAAGCGCCCGAGAGGCGCAACCTACCGTCCCCTCTCCCGGCCACGGTTTTTACGCCGCGACCCGCCTCAGTCGCGCCCCCACGCCAAAGCGCCCGAGAGGCGCAACCTACCCGTCTCGGTGCCTCATGTCGGGCGCAGCGCTGGCCCTTCTCAGCGCCGCACTCACCGGCATTCCGGCCCGCCTCAGGGTTCCTCTTGGCTTCACCGTAAAGGCGCGCCGGGATGTCCGGAACGCGCCTTTCTTCCTCGTGCTCCTTGATGAGGACGCCCGTCCCCACGGAACGCCCCCAGGAGCAACGAAGGTGGGTGAGGGGGGTGTCAGCTCGCGTCCATCGCTCCCTCTGAAAGCAGAGGGTCGCGGGAACGGGCTGTCCCAGCCTGTGCCACCGTCGCGGGTGACTCTTGCCCAGCCACGGGCCGGGCAGCACCGACGGCAACCGGAGTCACTCCGGTTGTCTTAG
Protein Sequence: MTTMRRNTRRTAALLPLSGTLCRGRRPSTPPITGAAPSRPQRKSISTASNTQPRCSPSHRGPPQWRRRPGGRQRHLHGPPRPSACCLQVGETAPSRCLMPGAASDEIDGAAPEHSGPSPGHGFYAATRLSRAPTPKRPRGTAYPSRCRMPGAASDEIDGAAPEHSGPSPGHGFYAATRLSRAPTPKRPRGTAYPSRCRMPGAASDEIDGAAPEHSGPSPGHGFYAATRLSRAPTPKRPRGTAYAPLSRPRFFTPRPTSVAPPRQSAREAQPTVPSPGHGFYAATRLSRAPTPKRPRGATYPSRCLMSGAALALLSAALTGIPARLRVPLGFTNDDDAPEHATHRRPPPSLGDLVQRTPVGPMTGAQGPLRRVGPVAPPPTTTAAGGEEGRLAPRQHSPPPEAPPRRHSPGRPRRGRRGKHPHGLQPPAAALELRRSPPQWRRRPGGRQRHLQGPPRPRACCLQVGETAPSRCLMPGAASDEIDGAAPEHSGPSPGHGFYAATRLSRAPTPKRPRGTAYPSRCRMPGAASDEIDGAAPEHSGPSPGHGFYAATRLSRAPTPKRPRGTAYPSRCRMPGAASDEIDGAAPEHSGPSPGHGFYAATRLSRAPTPKRPRGTAYAPLSRPRFFTPRPTSVAPPRQSAREAQPTVPSPGHGFYAATRLSRAPTPKRPRGATYPSRCLMSGAALALLSAALTGIPARLRVPLGFTNDDDAPEHATHRRPPPSLGDLVQRTPVGPMTGAQGPLRRVSPSTPPITGAAPSRPQRKSISTASNTQPRCSPSHRGPPQWRRRPGGRQRHLHGPPRPRACRLQVGETAPSRCLMPGAASDEIDGAAPEHSGPSPGHGFYAATRLSRAPTPERPRGTAYPSRCRMPGAASDEIDGAAPEHSGPSPGHGFLRRDPPQPRPHAKAPERHSLPVPCRMPGAASDEIDGAAPEHSGPSPGHGFYAATRLSRAPTPKRPRGTAYPSRCRMPGAASDEIDGAAPEHSGPSPGHGFYAAAHLSCTPTPKRPRGATYRPLSRPRFLRRDPPQPRPHAKAPERHGLPVSAPHNDDDAPEHATHRRPPPSLGDLVQRTPVGPMTGAQGPLRRVSPSTPPITGAAPSRPQRKSISTASNTQPRCSPSHRGPPQWRRRPGGRQRPLHGPPRPRACCLQVGETAPSRCLMPGAASDEIDGAAPEHSGPSPGHGFYAATRLSRAPTPKRPRGTAYPSRCRMPGAASDEIDGAAPEHSGPSPGHGFYAATRLSRAPTPKRPRGTAYPSRCRMPGAASDEIDGAAPEHSGPSPGHGFYAATRLSRAPTPKRPRGTAYPSRCRMPGAASDEIDGAAPEHSGPSPGHGFYAATRLSRAPTPKRPRGTAYAPLSRPRFFTPRPTSVAPPRQSAREAQPTVPSPGHGFYAATRLSRAPTPKRPRGATYPSRCLMSGAALALLSAALTGIPARLRVPLGFTNDDDAPEHATHRRPPPSLGDLVQRTPVGPMTGAQGPLRRVSPSTPPITGAAPSRPQRKSISTASNTQPRCSPSHRGPPQWRRRPGGRQRHLHGPPRPRACCLQVGETAPSRCLMPGAASDEIDGAAPEHSGPSPGHGFYAATRLSRAPTPKRPRGTAYPSRCRMPGAASDEIDGAAPEHSGPSPGHGFYAATRLSRAPTPKRPRGTAYPSRCRMPGAASDEIDGAAPEHSGPSPGHGFYAATRLSRAPTPKRPRGTAYPSRCRMPGAASDEIDGAAPEHSGPSPGHGFYAATRLSRAPTPKRPRGTAYAPLSRPRFFTPRPTSVAPPRQSAREAQPTVPSPGHGFYAATRLSRAPTPKRPRGATYPSRCLMSGAALALLSAALTGIPARLRVPLGFTVKARRDVRNAPFFLVLLDEDARPHGTPPGATKVGEGGVSSRPSLPLKAEGRGNGLSQPVPPSRVTLAQPRAGQHRRQPESLRLS

Similar Transcription Factors

Sequence clustering based on sequence similarity using MMseqs2

100% Identity: -
90% Identity: -
80% Identity: -