Basic Information

Insect: Epirrhoe tristata
Gene Symbol: Zmiz1_1
Assembly: GCA_951394285.1
Location: OX596144.1:7655714-7673359[+]

Transcription Factor Domain

TF Family: zf-MIZ
Domain: zf-MIZ domain
PFAM: PF02891
TF Group: Zinc-Coordinating Group
Description: This domain has SUMO (small ubiquitin-like modifier) ligase activity and is involved in DNA repair and chromosome organisation [1][2].
Hmmscan Out: # of c-Evalue i-Evalue score bias hmm coord from hmm coord to ali coord from ali coord to env coord from env coord to acc

1 3 1.4 8.9e+03 -3.0 0.2 20 32 720 732 718 738 0.78

2 3 0.33 2e+03 -0.9 0.9 4 24 1288 1308 1285 1313 0.88

3 3 1.7e-25 1e-21 76.9 4.8 1 50 1372 1421 1372 1421 0.98

#	of	c-Evalue	i-Evalue	score	bias	hmm coord from	hmm coord to	ali coord from	ali coord to	env coord from	env coord to	acc
1	3	1.4	8.9e+03	-3.0	0.2	20	32	720	732	718	738	0.78
2	3	0.33	2e+03	-0.9	0.9	4	24	1288	1308	1285	1313	0.88
3	3	1.7e-25	1e-21	76.9	4.8	1	50	1372	1421	1372	1421	0.98

Sequence Information

Coding Sequence: ATGAATCACGCCCTAAACAAACGGCCCTCAGTCCCCGGCAGCCCCGCTATTCCGAGTTCTGGCAGCGGCTCCGGTTCCGGCGGGGCAGAGGGTGCGAAGAATCTCCGGAAGATTCCCTGCTGCCCAACCACACTGACCTTGGCAACGTATAATACGAAAACCCTGAGTACTGACGATCGGCTTTTAGAGTTATTAGAGGAATTAGAAGAAATTCATTGGGATGTGATTGGACTATCTGAAGTTAGACGGATAGGAGAACATCTTAGTAAACTTGAAAGTGGTCATCTATTTTTCCATAAAGGACACGACGATACGACATATGGCGGAGTAGGATTCCTCATACACAAAAGGAATGCTGCTACAGTAACTAATGTTACGAGTATATCAGCTCGAGTATGTTATGTTAATGTATCTCTCAATAAAAGGTATTCCCTAAAGATCATTCAGGTTTATGCTCCTACTTCAACGCATCCCGATGACGAAGTAGAAGTTTTCTATGAAGAAATAGAGAAAGCGTATGATGAAAATCCCTGCCACTATACAGTGATGAAGTCCCCCATGGACTTCAACGCCAAGATTGGCCCTCCTttggaaaatgaaaaatttgtagAAACTATCAAGCAAAATAGAGGCCCAAAAGTATTTAGACGTAAATTAGCGACACATaaatcagaaataaataagcttAAAAACAGGACTGGTGAAATTGTGACAAATCGAGACGGCATTATTCAAATCGTTGAAGAGTTCTATGGCGAGTTATACTCGTCCAAAGAAGTGGAACCAAATTCGCCAAATTCTCCGGACCTTCGAGCAAACCCAATTGAACGTATGGAAACGGAACAAATACCTCCCATACTCGAAAACGAAATTGGGTTTGCCTTATCTCGAATGAAGCGCGGGAAAGCATCTGGCGAAGATGGCGTTTACGTTGAGATGTTACAAGCAGCAGGACTCACGGTACTTAAACCACTTGCTGACctcttcaataaaattatatctgAGACCATCACACCAGATGCATGGAAAAATGCCATCGTCTCGATACTCCACAAAAAGGGcgataaaactaatttaaaaaactatagGCCCATAAGCCTCCTCTCCCAGGTATATAAGTTATTCTCCAAGGTCTTATGCAATCGACTGTCGCGAACACTCGACGACTACCAACCAGTCGAGCAGGCAGGTTTCCGAAGCGGTTACTCTACCTTAGACCATTTACACACTGTCAAGCAATTGATGGAGAGATGTAGAGAGTATAACCGCCCACTGTGTTTTGCTTTTGTAGACTATGAAAAAGCTTTCGACAGCGTCGAGCACTGGGCGGTGTTTCACTCTCTCCATCGTTGCAATATTGACAAGCGCTACGTCAATATTCTTCGGGAGCTTTATAAATCTGCAACTATGCAAGTACGCATGCATAAATTATCCGACCTAATACCCATAAGCCGTGGAGTACGTCAAGGAGATACGATATCCCCGAAACTCTTCACGTGTCTTTTGGAGGATGTTATGAAAACTTTAGATTGGGAAGAGAGAGGCGTTAGGATTAACGGCCGGAACATGTCACACTTGCGGTTTGCTGACGACCTTATCCTCGTTGCCGAGTCCGCCGCAGAACTCCAGATCATGCTCGCCCAACTGCATGAGGCCTCCTTGAGCGTCGGCCTTAGGATGAACATGTCGAAGACTAAGGTAATGACAAATAATCCGTCCCACATACCTAACATCGATGTCGACAACCACCGAATAGAGACAGTCGATGAGTATGTTTACCTTGGTCACCGTTTGTCCTTTGGCCGGGGCTCCCAGTTGAGGGAAATTGCTAGGCGCATCCAACTGGGGTGGGCTGCTTTTGGTAAATTGgaagatgttttcaagtccAAAATCCCGCAATGTCTCAAAACCAAGACATTCAACCAATGTGTCCTTCCCATTCTTACTTATGGATCCGAAACATGGCCTCTCACAAATGAGCACATGCACACGATAAGGGTTGCTCAAAGAGCCATGGAGCGGGCCATGCTAGGTATCCACCTCGTGGACCGTATACCAAACGTCGAGATTCGACGCCGCACTAAGGTCgaggatgtagAAGACGTGCAGCGGCACGTCGCGAGTCGCGTCGCAAGGACATGGGACAAGTCGGCCGTCCTCTGCCGTCATGCGCAGAGCATTCATCATATTTCATACACGCTCTACTTTGATCGCTGGACCAATAATCGCATAGAGAGCGTCCGGCGTCGCATCGCAACTAGCGCGATCGCGGTATGGCGCTCGATTGAGGACCGTTACGTGAAAACGTCAAGCGTGCTGCGGGGTGGGGCAGTCGGCTCTCCGATAGCGCGACGCGACAGTGGCGCCCTGCTCGGCCGAGTGCCGAGTGCCGAGACGACGACTTACGAGCGAGGGACGCGGGGGTGCGCCACTTATCGCGGCGAGCTGGCAACGCCGCGCGGGTGGCAGCACCCCGCGCCGCAACCTCTCACTCACCGTCGCCGTCGCCGGCTCACCATCGCCATCATCCAGTGGGGTGCTCAAGCCAACAGGACGGCGAACTCTGGTGGTTCGGTTGGTTACGTGGGATACTCTGACCACTACGCGGGAGCCCAAGCTCCCGAGACTAGCAAACACAACCCTCAGCAAGGGACCATTGGATACAGAGTCAACGCCCCTAGCGGCTATGGGTGCGCTGGCGGTTCGGGCGCGATGAGCGGCGGCGGCGAGAACGCGCAGTTCGGCGCCACCGCCGCTATGGTCGCCGCGGCCACCACGGCTGCGATGCAGGACTCGCAGCCTTTCTCCCAGATGCAAAACAACATGACTATGGGAAATCCCCAGTATGGCGCGATGAACGGCTACGGCCAGCAGCGCAGCCACAATCCGGGCATGACCGGAATGGGGATGGGAGGCAACGGTGGCATGAATGGCATGACGGGGATGGGGCAGATGGGAAACGGAGCCATGAACGGCATGAACCCCATGGCCCAGATGGCAAACATGGGCATGCATCCGAACATGATGTCCTCGCAGATGGGGCCTGGCCAGATGGCGGGCTCAGCTAAAATGGGTCCCGGATACCAAAGGCGGCACACGCCGTACCCTTCCGGCCAAATGCTAATGGGTCAGCGGAAGCCCCAATATATTGGTCAACAACCTGGATTTGGGCCGAGTCAATACCCAGCGGGCTATGGAGGCCGGCCTGGCTTCCAAGGCCAATACCCTCCCCAACAACCTCTCGGGCCGAGCGGGAACTTTGGAGCGGCAATGAGAGGATCCATGAGACAGACAACGCCTCCCTACTCAAACCAGGGGCAATATTTCAATGGTGGTGTTCCTAGTCAATTTCCGCAGCACCAGGGTGGAAATGGGCAGTATGGGGGGCAATATGGTGGTCAGTTTGCGCAGGAGGTAGCCATGAGAACTAATATGAACTATCAGCATAGTCCTGTTCCTGGCAATCCTACGCCACCTCTTACCCCTGCAAGTAGCATGCCGCCTTATACTAGCCCTAATGCTGATATAAAACCCCACTTTAATGAGCTCAAACCACCGATGGGTATGCAAAATGATGAGCTCCGGTTAACATTCCCTGTAAGAGATGGTATTATCCTACCACCATTTAGATTAGAACATAATTTAGCTGTTAGCAATCATGTATTCCAATTAAAACCCACGGTCCATTCAACGTTAATATGGAGGTCGGACCTCGAGTTACAACTGAAATGCTTCCATCACGAGGATCGGCAAATGAATACAAATTGGCCCGCGAGTGTTCAGGTGTCCGTAAATGCAACACCGCTGATGATAGATAGAGGAGAGCCTAAAACCTCGCATAAACCGTTGTACCTGAAAGAAGTCTGCCAGCCAGGCAGAAACACGATACAGATTACGGTCTCCGCCTGTTGTTGTtcgCATCTGTTCGTATTACAATTAGTCCATCGGCCGAGTGTCCGAAGTGTATTGCAAGGATTACTACGGAAGCGCTTGCTTACTGCGGATCACTGCATCGCAAAGATCAAGATGAACTTCAACCAGACACCAACGAACGGAAGTAACGGTTCCAACACCGCGAATGACAGGGACAGCATCGAACAAACAGCCTTAAAAGTATCATTAAAATGTCCAATCACGTTCAAGAAGATCACGCTGCCGGCGCGCGGTCACGAATGCAAGCACATACAGTGCTTCGATTTAGAATCGTACTTACAAATGAATTGCGAACGGGGAGCGTGGAGGTGTCCGGTTTGCAATAAACCAGCACAATTAGAAGGCCTCGAGGTGGACCAGTACATGTGGGGCATACTAAACACGCTAAACGGATCCGATGTCGACGAAGTCACAATCGACAGCGGGGCTAACTGGAAGGCAGCTAAAAGCCCATCAGTTCCTGGCATAAAGCAAGAGCAAGACGACAGCAATGATAATAGCGGCGTCGGCAAAAGAAGCAAAGCGATGTCGCCAGGATCAATGAACATGCCGACTATGAACAACTGGGATATGAACCAGGCTCTATCTCCTTACCTTCCTCCTGACATGAACACCATTGCAAGCGGTTCTATGATCTCGACCTACAATCAGAGCTCGCAGAATAGGAATGCGAATTCCAACAACCATAGCTACGATTTCGGGATGAACAATGGTTCAGGCAGCAGCGAATTTTCTGGGAATGGTCCGTTGTCACATCTAAATGAAAGTGTGAACTCCTTGGATCCTCTTAATGCGATGGAGAAGAGTTTGAATGATCAGATGCCACACACACCCCATACGCCGCATACACCAGGTTCAGCCCACACGCCGGGTGGTGGTGGAGGCGCCCATACTCCTGGCTCCTCGCACACACCAGGTCCACCTTCAGTCGACCATCATTCATTGACCGATGTGGACATCCCTGCTGATCTCAACTTTGACCCCGCGGCGGTTATCGATGGCGAGGGCACTGATAATctaaatcTTCTACCAGAAACGAGTGTAGATCCGATGGAATTGCTGTCGTACTTAGACGCGCCTGCGCTAGGAGAACTCCTCGCGACCCCGCCTTCCTCCTCCTCATCTGCAGGATCGCACCCTCCCCGCGCGCCCTCCTCAGACGACCTTCTGGCACTGTTTGAGTGA
Protein Sequence: MNHALNKRPSVPGSPAIPSSGSGSGSGGAEGAKNLRKIPCCPTTLTLATYNTKTLSTDDRLLELLEELEEIHWDVIGLSEVRRIGEHLSKLESGHLFFHKGHDDTTYGGVGFLIHKRNAATVTNVTSISARVCYVNVSLNKRYSLKIIQVYAPTSTHPDDEVEVFYEEIEKAYDENPCHYTVMKSPMDFNAKIGPPLENEKFVETIKQNRGPKVFRRKLATHKSEINKLKNRTGEIVTNRDGIIQIVEEFYGELYSSKEVEPNSPNSPDLRANPIERMETEQIPPILENEIGFALSRMKRGKASGEDGVYVEMLQAAGLTVLKPLADLFNKIISETITPDAWKNAIVSILHKKGDKTNLKNYRPISLLSQVYKLFSKVLCNRLSRTLDDYQPVEQAGFRSGYSTLDHLHTVKQLMERCREYNRPLCFAFVDYEKAFDSVEHWAVFHSLHRCNIDKRYVNILRELYKSATMQVRMHKLSDLIPISRGVRQGDTISPKLFTCLLEDVMKTLDWEERGVRINGRNMSHLRFADDLILVAESAAELQIMLAQLHEASLSVGLRMNMSKTKVMTNNPSHIPNIDVDNHRIETVDEYVYLGHRLSFGRGSQLREIARRIQLGWAAFGKLEDVFKSKIPQCLKTKTFNQCVLPILTYGSETWPLTNEHMHTIRVAQRAMERAMLGIHLVDRIPNVEIRRRTKVEDVEDVQRHVASRVARTWDKSAVLCRHAQSIHHISYTLYFDRWTNNRIESVRRRIATSAIAVWRSIEDRYVKTSSVLRGGAVGSPIARRDSGALLGRVPSAETTTYERGTRGCATYRGELATPRGWQHPAPQPLTHRRRRRLTIAIIQWGAQANRTANSGGSVGYVGYSDHYAGAQAPETSKHNPQQGTIGYRVNAPSGYGCAGGSGAMSGGGENAQFGATAAMVAAATTAAMQDSQPFSQMQNNMTMGNPQYGAMNGYGQQRSHNPGMTGMGMGGNGGMNGMTGMGQMGNGAMNGMNPMAQMANMGMHPNMMSSQMGPGQMAGSAKMGPGYQRRHTPYPSGQMLMGQRKPQYIGQQPGFGPSQYPAGYGGRPGFQGQYPPQQPLGPSGNFGAAMRGSMRQTTPPYSNQGQYFNGGVPSQFPQHQGGNGQYGGQYGGQFAQEVAMRTNMNYQHSPVPGNPTPPLTPASSMPPYTSPNADIKPHFNELKPPMGMQNDELRLTFPVRDGIILPPFRLEHNLAVSNHVFQLKPTVHSTLIWRSDLELQLKCFHHEDRQMNTNWPASVQVSVNATPLMIDRGEPKTSHKPLYLKEVCQPGRNTIQITVSACCCSHLFVLQLVHRPSVRSVLQGLLRKRLLTADHCIAKIKMNFNQTPTNGSNGSNTANDRDSIEQTALKVSLKCPITFKKITLPARGHECKHIQCFDLESYLQMNCERGAWRCPVCNKPAQLEGLEVDQYMWGILNTLNGSDVDEVTIDSGANWKAAKSPSVPGIKQEQDDSNDNSGVGKRSKAMSPGSMNMPTMNNWDMNQALSPYLPPDMNTIASGSMISTYNQSSQNRNANSNNHSYDFGMNNGSGSSEFSGNGPLSHLNESVNSLDPLNAMEKSLNDQMPHTPHTPHTPGSAHTPGGGGGAHTPGSSHTPGPPSVDHHSLTDVDIPADLNFDPAAVIDGEGTDNLNLLPETSVDPMELLSYLDAPALGELLATPPSSSSSAGSHPPRAPSSDDLLALFE

Similar Transcription Factors

Sequence clustering based on sequence similarity using MMseqs2

100% Identity: -
90% Identity: -
80% Identity: -