Basic Information

Insect: Zaprionus taronus
Gene Symbol: wek_1
Assembly: GCA_018901805.1
Location: JAEIFH010000683.1:1843252-1845312[-]

Transcription Factor Domain

TF Family: HMGA
Domain: HMGA domain
PFAM: AnimalTFDB
TF Group: Unclassified Structure
Description: This entry represents the HMGA family, whose members contain DNA-binding domains, also known as AT hooks due to their ability to interact with the narrow minor groove of AT-rich DNA sequences. They play an important role in chromatin organisation [1]. The high mobility group (HMG) proteins are the most abundant and ubiquitous nonhistone chromosomal proteins. They bind to DNA and to nucleosomes and are involved in the regulation of DNA-dependent processes such as transcription, replication, recombination, and DNA repair. They can be grouped into three families: HMGB (HMG 1/2), HMGN (HMG 14/17) and HMGA (HMG I/Y). The characteristic domains are: AT-hook for the HMGA family, the HMG Box for the HMGB family, and the nucleosome-binding domain (NBD) for the members of the HMGN family [2].
Hmmscan Out: # of c-Evalue i-Evalue score bias hmm coord from hmm coord to ali coord from ali coord to env coord from env coord to acc

1 3 1.6e-06 0.027 14.1 0.5 9 16 203 210 196 210 0.88

2 3 3.9e-07 0.0067 16.0 1.0 9 21 336 349 329 350 0.80

3 3 0.34 5.8e+03 -3.0 0.1 14 20 396 402 395 403 0.78

#	of	c-Evalue	i-Evalue	score	bias	hmm coord from	hmm coord to	ali coord from	ali coord to	env coord from	env coord to	acc
1	3	1.6e-06	0.027	14.1	0.5	9	16	203	210	196	210	0.88
2	3	3.9e-07	0.0067	16.0	1.0	9	21	336	349	329	350	0.80
3	3	0.34	5.8e+03	-3.0	0.1	14	20	396	402	395	403	0.78

Sequence Information

Coding Sequence: ATGGCTGAACAGAACGAGAATGAAGCTATTGAGTGCCACTGGGTAAATTGGTGTCGTCTCTGCGCCAAGGACGATGTTCTTGGCAACGTAAAGATCGACTCGAGCGAGAAGGGGACCGACTGGAACAGCGTCTTGCTTATGGCCATCCGAAAGTATTTCGATGTACATATGCGACCGGAGGATGAGCTTAGCGGTGTGATCTGCAAGGAATGCTATACATTAATAAGCGAACTTATTGACTTTGCGGAACGTGTCAACAAGGTTCAGGCAATCTTTGAAGTGCTACGGCATTCTGAGCCGAATAAGATGCTTGACGTGAAGGCTCTTCGTCAGCAATACGCACTTCAAGATGGCGACTGGACGCACATAATCAAGCCAGTTTCGGATATCGACAACAATGTGTCAAAACAAGCTGTTATCGCGGAAGAATTTCCAGTGGAAATGCTCGCGCCGAAACAGGAATTTCTCAACTTGAGCCAAGAAGTGGAAGTCGAGCAACCAAACCTTCTTGACCACTGTGAGGAACCGATTGTAAGTCAGTTGCCTACTGAGGAAATTTTTGTTGATAGATGTGATGCCAAAAATACGACTCAAAATAGTTCCCTCAAAAGACCTCGGGGTCGTCCAAAAAAACATTTAATGAACGCCGACAAAGGCGATAAGACAGTTTCTGACCTTAATGAAGATCTACCGAATGATTCTGCCAAACAACAAATTCCAATATCTGACTCCACAGAACCAGATGTTCCTGGAACTTCATCCATTCCAGACTGGACGCACATGTTCACGCCAGTTTCGGATATCGACAACAATGTGTCAGAACAAGCTGTTATCGCGGAAGAATTTCCTGTGGAAATGCTCATGCCGAAACAGGAATTTCTCAACTTGAGCTATGAAATGGAAGACGAACAACCAAATCCTCTTGAACACTGTGAAGAACCGATTGTAAAGCCAGAAGTCGGTGAAAGATGTGATGCCAAAGATACGACTCAAAATAGTTCCCTCAAAAGACCTCGGGGTCGTCCAAAAAAGTATTCAAAGAACACCGACAAAAGCGATAAGTCAGTTAATGAAGAGATACCGAGTAAACGTCGCAAATCGAAGTGTAAATGGTGCAGCAAATTGTACCATAATCCCAAGTCCTACGAAAAGCATTTAAGGGATGGCTGCCGCAAAGTGGAACCACGACCAAAGGTGGATAAGAATACATTCTGCAATATTTGCAATAAAAATTTGTCGTCTGCAGCTGCCTTCAAGCTGCACATGGAGGGCATGCACGATAATTCCAAGCCCTTTGTGTGTGATCACTGTGGCAAGCAGCTAAAGTCTTTAACAGCTCTTAATGAGCACAAACTGGTGCACACGGAGGATCGTCCGTTTAAATGTACGATGTGTGATGCTTGCTTCAAGAACAAAGCTCGTCTTAGAATTCACTACCAGACCCATGAAGAACCAAACTATATTTGCAACATCTGCGGCAAAAAGTTGCAGACTCGACGCACGTGGAACCAGCACAAGTTGGTACACGTTGAGGAACGCAGATTCAAGTGTGATGTTTGCGGTGCCCTCTTCAAACGTTCGAAAACTCTTAAGACGCATCTACTTATCCACGCAGGATTGCGGCCGTACGTTTGCAAATACTGCGGTCAAACATTCTCATGTAATGCGAATTGTCGTGCCCACAAGATGAAAAAACATACAAAGGAGTTAATGGAAGAGGAGAACGAGGACTTTCCCAATCGCATAAGTGTGCCTTCTCTGGATGAACTTCGGGTGATGTAA
Protein Sequence: MAEQNENEAIECHWVNWCRLCAKDDVLGNVKIDSSEKGTDWNSVLLMAIRKYFDVHMRPEDELSGVICKECYTLISELIDFAERVNKVQAIFEVLRHSEPNKMLDVKALRQQYALQDGDWTHIIKPVSDIDNNVSKQAVIAEEFPVEMLAPKQEFLNLSQEVEVEQPNLLDHCEEPIVSQLPTEEIFVDRCDAKNTTQNSSLKRPRGRPKKHLMNADKGDKTVSDLNEDLPNDSAKQQIPISDSTEPDVPGTSSIPDWTHMFTPVSDIDNNVSEQAVIAEEFPVEMLMPKQEFLNLSYEMEDEQPNPLEHCEEPIVKPEVGERCDAKDTTQNSSLKRPRGRPKKYSKNTDKSDKSVNEEIPSKRRKSKCKWCSKLYHNPKSYEKHLRDGCRKVEPRPKVDKNTFCNICNKNLSSAAAFKLHMEGMHDNSKPFVCDHCGKQLKSLTALNEHKLVHTEDRPFKCTMCDACFKNKARLRIHYQTHEEPNYICNICGKKLQTRRTWNQHKLVHVEERRFKCDVCGALFKRSKTLKTHLLIHAGLRPYVCKYCGQTFSCNANCRAHKMKKHTKELMEEENEDFPNRISVPSLDELRVM

Similar Transcription Factors

Sequence clustering based on sequence similarity using MMseqs2

100% Identity: iTF_01551722;
90% Identity: iTF_01558578;
80% Identity: iTF_01558578;