Basic Information

Insect: Cydalima perspectalis
Gene Symbol: Zmiz1_1
Assembly: GCA_951394215.1
Location: OX596204.1:10033671-10043412[-]

Transcription Factor Domain

TF Family: zf-MIZ
Domain: zf-MIZ domain
PFAM: PF02891
TF Group: Zinc-Coordinating Group
Description: This domain has SUMO (small ubiquitin-like modifier) ligase activity and is involved in DNA repair and chromosome organisation [1][2].
Hmmscan Out: # of c-Evalue i-Evalue score bias hmm coord from hmm coord to ali coord from ali coord to env coord from env coord to acc

1 3 0.087 1.1e+03 -0.0 0.0 41 48 27 42 13 44 0.63

2 3 0.083 1.1e+03 0.0 0.9 4 24 505 525 502 530 0.88

3 3 7.7e-26 1e-21 77.0 4.6 1 50 588 637 588 637 0.98

#	of	c-Evalue	i-Evalue	score	bias	hmm coord from	hmm coord to	ali coord from	ali coord to	env coord from	env coord to	acc
1	3	0.087	1.1e+03	-0.0	0.0	41	48	27	42	13	44	0.63
2	3	0.083	1.1e+03	0.0	0.9	4	24	505	525	502	530	0.88
3	3	7.7e-26	1e-21	77.0	4.6	1	50	588	637	588	637	0.98

Sequence Information

Coding Sequence: ATGAACGAATGGCTCGAACGTAATTTACGCGCGCCTCTCGATAACAGAAAATATGTTACGCTCGCAGCTGACACGAATACAATATTGGAGGAAATTGCAATTGGATGGATTTGCCGAGTTTGTCTGACGATGAAGAGCAGTCAGTTGGGTGTTGTGGCTCTACAACGTGCTGGGACGTGTTTCAGGGGGTGTCTTGGAATCGACAGGACGGCGAACACTGGTAGTACGGCTGGATACGTGGGCTCTTCTGGTGTCTACGGGGGAGCGCAAGCTCCTGACCCTGGCAAACACAACCCTCAGCAAGGGACAATTGGATACCGAGTCAACACACCTAGCGGCTATGGGTGCGCCGGCGGTACGGGCGCGATGAGCGGCGGCGGCGAGAACGCGCAGTTCGGCGCCACCGCCGCAATGGTCGCCGCGGCCACCACGGCCGCGATGCAGGACTCGCAGCCATTCTCGCAGATGCAAAACAACATGACTATGGGTAATCCCCAATATGGCGCGATGAATGGCTATGGCCAACAGCGCAGCCATAATCCAGCCATGACTGGCATGGGGATGGGAGGAAATGGCGGTATGAACGGTATGACCAGCATGGGTCAGATGGGAAACGCGGGCATGAATGGCATGAACCCCATGGCACAGATGGCCAATATGGGCATGCACGCTAATATGATGCCTTCGCAGATGGGGCCAGCCCAGATGACTGGCTCGGCGAAAATGGGCCCTGGATACCGGCAGCGGCATACCCCTTACCCCTCCGGTACCATGATTATGGGCCGGAAAACTCAATATATGGGCGGCCAACCCGGCTTTGGCCCTGGCCAATATCCTGCCGGTTACGGAGGCCGACCAGGATTTCAGGGGCAGTACCCACCTCAGCAGCCACTAGGACCCTCTGGGAACTTCGGCGCAACGATGAGAGGAAGCATGAGACAGTCGACGCCGCCTTACTCAAATCAGGGACAGTACTTTAACGGTGGTGTGCCTGGTCAATTCCCACAGCATCCAGGTGGCAATGGCCAATACGCAGGACAGTACAGTGGACAATTTGCGCAAGAAGTGGCCATGCGAACGAACATGAGCTATCAGCATAGTCCTGTCCCCGGAAACCCCACACCGCCTTTAACGCCTGCAAGCAGTATGCCTCCTTACATCAGCCCTAATGCTGATGTGAAACCCCATTTTAATGAGCTCAAACCACCAATGGGCATGCAAAATGATGAGCTCCGGTTAACATTCCCTGTTAGAGATGGTATTATATTACCACCATTTAGGTTAGAACATAATTTAGCAGTTAGCAATCATGTATTCCAATTGAAGCAAACGGTCCACTCAACGTTAGTTTGGAGGTCGGACCTGGAGTTACAACTAAAATGCTTCCATCACGAAGATCGGCAGATGAACACGAACTGGCCTGCGAGTGTTCAAGTGTCAGTTAACGCAACACCATTAGTCATAGATAGAGGCGAGAACAAAACATCACACAAACCATTGTACCTGAAAGAAGTGTGCCAGCCGGGCAGGAATACGATACAGATTACTGTCTCCGCCTGCTGTTGTTCACATCTATTTGTACTACAATTAGTCCACCGGCCGAGCGTCCGAAGTGTCCTCCAAGGATTGCTGAGGAAGAGGCTATTGACAGCGGACCACTGCATCGCCAAAATTAAGATGAACTTCAACCAGTCTCCTGCGAACAACAATGGCTCGAACACAGCGAACGATCGGGACAGCGTCGAGCAAACCGCCTTAaaagtgtcattaaaatgtCCAATCACGTTCAAAAAGATCACGCTACCTGCGCGCGGGCATGAGTGCAAACACATACAGTGTTTCGATTTAGAATCGTATTTACAACTCAACTGCGAACGGGGATCGTGGAGGTGTCCAGTTtgcaaCAAACCAGCACAGTTAGAAGGCCTAGAAGTTGATCAGTATATGTGGGGCATCCTCAACACACTAAATAGCTCCGACGTAGACGAAGTGACGATTGACAGTGGGGCGAACTGGAAAGCAGCGAAGAGTCCCAACAGTAGTGGCATCAAGCAGGAAGACGACAGCAATGACAACAGCGTCGGAAAGAGAGGCAAAGCGGTATCGCCAGGATCCATGAACATGCCTACAATGAACAACTGGGACATGAACCAGGCGTTATCACCTTACCTACCACCTGACATGAACACGATTGCCAGCGGTTCCATGATCTCCTCGTATAACCAAAGCGGACAGAATAGAAACTCTGGGTCGAACAATCAGAACTATGACTTCGGTATGAATAACGGTCCTGGCAGCAACGAGTTTGCGGGCAACGGTCCCTTATCACACCTAAACGATAGCGTCAATTCACTAGACCCGCTAAACGCGATGGAGAAGAGCCTAAACGAACAGATGCCGCACACACCCCACACGCCTCACACGCCCGGGTCGGCGCACAcgccgggcggcggcggcggcgcgcacaCGCCGGGCTCCTCGCATACGCCGGGCCCGCCGTCCGTCGGCCACCACAGCCTCACCGACGTTGACATACCTGCCGATCTCAATTTCGACCCGGCGGCTGTTATTGACGGCGAGGGCACAGACAATCTCAATCTTCTGCCGGAAACGAGTGTAGACCCGATGGAGCTGCTATCGTACTTAGATGCGCCGGCGCTGGGCGAACTCCTAGCAACGCCGCCCTCCTCATCATCGTCCGCCGGCTCCCACCCGCCACGCGCGCCTTCGTCCGACGACCTCCTCGCGCTCTTCGAGTGA
Protein Sequence: MNEWLERNLRAPLDNRKYVTLAADTNTILEEIAIGWICRVCLTMKSSQLGVVALQRAGTCFRGCLGIDRTANTGSTAGYVGSSGVYGGAQAPDPGKHNPQQGTIGYRVNTPSGYGCAGGTGAMSGGGENAQFGATAAMVAAATTAAMQDSQPFSQMQNNMTMGNPQYGAMNGYGQQRSHNPAMTGMGMGGNGGMNGMTSMGQMGNAGMNGMNPMAQMANMGMHANMMPSQMGPAQMTGSAKMGPGYRQRHTPYPSGTMIMGRKTQYMGGQPGFGPGQYPAGYGGRPGFQGQYPPQQPLGPSGNFGATMRGSMRQSTPPYSNQGQYFNGGVPGQFPQHPGGNGQYAGQYSGQFAQEVAMRTNMSYQHSPVPGNPTPPLTPASSMPPYISPNADVKPHFNELKPPMGMQNDELRLTFPVRDGIILPPFRLEHNLAVSNHVFQLKQTVHSTLVWRSDLELQLKCFHHEDRQMNTNWPASVQVSVNATPLVIDRGENKTSHKPLYLKEVCQPGRNTIQITVSACCCSHLFVLQLVHRPSVRSVLQGLLRKRLLTADHCIAKIKMNFNQSPANNNGSNTANDRDSVEQTALKVSLKCPITFKKITLPARGHECKHIQCFDLESYLQLNCERGSWRCPVCNKPAQLEGLEVDQYMWGILNTLNSSDVDEVTIDSGANWKAAKSPNSSGIKQEDDSNDNSVGKRGKAVSPGSMNMPTMNNWDMNQALSPYLPPDMNTIASGSMISSYNQSGQNRNSGSNNQNYDFGMNNGPGSNEFAGNGPLSHLNDSVNSLDPLNAMEKSLNEQMPHTPHTPHTPGSAHTPGGGGGAHTPGSSHTPGPPSVGHHSLTDVDIPADLNFDPAAVIDGEGTDNLNLLPETSVDPMELLSYLDAPALGELLATPPSSSSSAGSHPPRAPSSDDLLALFE

Similar Transcription Factors

Sequence clustering based on sequence similarity using MMseqs2

100% Identity: iTF_00357101;
90% Identity: iTF_00050494;
80% Identity: -