Basic Information

Insect: Chrysops caecutiens
Gene Symbol: ZMIZ1_1
Assembly: GCA_963971475.1
Location: OZ020568.1:64054206-64059517[-]

Transcription Factor Domain

TF Family: zf-MIZ
Domain: zf-MIZ domain
PFAM: PF02891
TF Group: Zinc-Coordinating Group
Description: This domain has SUMO (small ubiquitin-like modifier) ligase activity and is involved in DNA repair and chromosome organisation [1][2].
Hmmscan Out: # of c-Evalue i-Evalue score bias hmm coord from hmm coord to ali coord from ali coord to env coord from env coord to acc

1 2 0.12 1.9e+03 0.1 1.2 4 24 409 429 406 434 0.88

2 2 7.7e-25 1.2e-20 74.3 3.9 1 50 492 541 492 541 0.98

#	of	c-Evalue	i-Evalue	score	bias	hmm coord from	hmm coord to	ali coord from	ali coord to	env coord from	env coord to	acc
1	2	0.12	1.9e+03	0.1	1.2	4	24	409	429	406	434	0.88
2	2	7.7e-25	1.2e-20	74.3	3.9	1	50	492	541	492	541	0.98

Sequence Information

Coding Sequence: ATGGTAGCTGCAACTGGAACACAACAAGGCATGGATGGAATGGGTTTTAATTCACAGatGAATAATATGGCAGCAATGCATGGTGGTGGAGGTGGTGGACAACCCCATCATCATCAGTACATGAACGGAGGGATGAATGGTATGACGGGTATGACAGCAGCTGGTAATATGAATGCAATGACAAATCTAAATGGTATGAATACCATGAACGGTATGAACAGTATGGGTACCATGAATGGTATGGCCGGAATGAATGCAATGGCTGGAATGAATTCGATGCAAATGAACTCAATGGGGCCAATGAATGGAATGAGTTATAATGCGTCAAGGCATCATCAtATGAATCCAATGAATCAAATGCAAAATATGAGTATGGGTATGAATCCAATGAATAATATGGGTCCAACTGCAGCAGCTATGAATCACCAAATGAACGGTATGAATCCTATGGCAAAAATGCAAGGAATGGCAAATGGTGGTTATCCTCCAAGACGTATGTCACCATATCCAAATCCTCAAATGCATGCCGCACAAAAACGGGCAATGTACCCAATGaatcaaaatccacaaaatgtTCCTCCACCGGGGCCACTTCAATTTCCCCATCATCAGCCAAATGGTGTACCAGTTCCTATGCAAGCCGGTTATGGTCGTGCTAGTTCAGTTAATCCGTATGGTAGAGCTGGACCACCAATGATGCCACAACAAAGGCAAAATACACCACCTTATACAGGTACAGCGCATGGACAACAGTTTTATGGAAATAGTGCTGGAACGCCTAATGGTTACCAAAATGTACAAggATTTCAACAAGATGTTCGTATGAGCTATCAACATAGTCCTGTTCCTGGTAATCCCACACCTCCTCTTACACCCGCCTCTTCGATGCCATATGTTAGTCCAAATCCGGACATGAAGACAAATATTAATCACAAAGATGATGAACTTCGATTAACGTTTCCTGTACGGGATGGAATAATATTAGCGCCATTCCGATTAGAACACAACCTCGCAGTTAGTAATCATGTATTTCAATTGAAACCAACAGTGTATAATACTTTAATGTGCAGATCCGATTTAGAACTACAATTAAAATGTTTCCATCATGAAGATCGGCAAATGAATACAAATTGGCCAAACACAGTACAAGTATCAGCAAATGCAACACCATTAGTGATTGAACGTGCTGAGAAAACAGCTCATCGGCCTTTGTATTTGAAACAAGTGTGTCAACCAGGACGCAATACGATACAGATAACAGTGAGCGCATGCTGTTGTTCACATCTATTCGTCTTGCAATTAGTTCATCGACCATCAGTGAGGCAGGTACTGCAAGGTCTTCACAGACGAAATTTGCTCTCTGTAGAACACAGTGTGGCAAAGATCAAACGTAACTTTGCTATGGGAATGGTATCATCTGGTGCAACACCACCATCTGGGAATGATGGATCTGTTGATCAGCTGTTTGTTAAAGTTTCATTAAAATGTCCAATTACAAAAAATAGAATACGATTACCAGCAAGAGGACATGATTGTAAACACATACAATGTTTCGATTTGGAAAGTTATCTAACACTGAATTGTGAACGTGGTAGTTGGAGATGTCCTGAATGCAAcaAACCTGCCTTGACAGAAGGTCTAGAAATTGACCAGTATATGTGGGCCATATTGAACACATTGAAAAATACTGATGTTGATGAAGTCACAATAGATTCATCAGCTAATTGGAAAAGTCAAAAAGTTAGTGGCATGCATGGGGTTAATATAAAATCCGAAGAAGATATAAATAGTGGAAAAGTATTAGCTAAAGTTATGTCACCTGGATCAACAACACTACCAACATGGGATAATTCGCAGGCGATGAGTCCTTATATGTGTCATGATATGAATTCAATAGCCAGTGGAAATATGATGGGCCAAAActacaataataacaatcgaACTTCCTTTGAATCATATAATGGACAGAATGAAAGTTCTAGTGGAGGTGATCCTTTGTCACATTTAAGTGAATCTGTCAACTCACTGGATCCTTTGAATGCAAtggaaaaatcattaaatgaTCAAATGCCACATACTCCACATACACCACACACACCCGGAGGAGCATCAGGTGGTCATCCTCTGACACCAGGTGGACCACCAAGTGTGTCTTCAATACATAATGAATGCGGAACTGGTGGTGGCGGTGGAAGTAATAGCAATGGTGGAAGTAGTAATGGTTCCTCGGGATCAAATaatggaaataataataacggtGGGCCTAATAgtaattcaatgaattcaCCACAACATTCGTCACCACATCAACCATCCACACCAAACAAATCTTCCACGAATTCATCATCCGGTGTCCAGAACGATTCATCACCGAATCATGGAATGAATTCACAACAGCAAATCATTAATTCCTTAATGAATCCACAAAATGATGCTTTGGTAAATCTAACTGATGCTGATTTAAATGCTGATCTCAATTTTGATCCATCAACTGTTATCGATGGAGATACAACAAATGATCTTAATCTCCTGTCCGATAGTGTTGTTGATCCAATGGAGATATTATCTTATCTAGATCCACCAGATCTAAATACACCACCATCAAGTGGTTCAAGTAACAATCCTAATCAGGACGATATCCTCGCTTCATTATTCGATTAA
Protein Sequence: MVAATGTQQGMDGMGFNSQMNNMAAMHGGGGGGQPHHHQYMNGGMNGMTGMTAAGNMNAMTNLNGMNTMNGMNSMGTMNGMAGMNAMAGMNSMQMNSMGPMNGMSYNASRHHHMNPMNQMQNMSMGMNPMNNMGPTAAAMNHQMNGMNPMAKMQGMANGGYPPRRMSPYPNPQMHAAQKRAMYPMNQNPQNVPPPGPLQFPHHQPNGVPVPMQAGYGRASSVNPYGRAGPPMMPQQRQNTPPYTGTAHGQQFYGNSAGTPNGYQNVQGFQQDVRMSYQHSPVPGNPTPPLTPASSMPYVSPNPDMKTNINHKDDELRLTFPVRDGIILAPFRLEHNLAVSNHVFQLKPTVYNTLMCRSDLELQLKCFHHEDRQMNTNWPNTVQVSANATPLVIERAEKTAHRPLYLKQVCQPGRNTIQITVSACCCSHLFVLQLVHRPSVRQVLQGLHRRNLLSVEHSVAKIKRNFAMGMVSSGATPPSGNDGSVDQLFVKVSLKCPITKNRIRLPARGHDCKHIQCFDLESYLTLNCERGSWRCPECNKPALTEGLEIDQYMWAILNTLKNTDVDEVTIDSSANWKSQKVSGMHGVNIKSEEDINSGKVLAKVMSPGSTTLPTWDNSQAMSPYMCHDMNSIASGNMMGQNYNNNNRTSFESYNGQNESSSGGDPLSHLSESVNSLDPLNAMEKSLNDQMPHTPHTPHTPGGASGGHPLTPGGPPSVSSIHNECGTGGGGGSNSNGGSSNGSSGSNNGNNNNGGPNSNSMNSPQHSSPHQPSTPNKSSTNSSSGVQNDSSPNHGMNSQQQIINSLMNPQNDALVNLTDADLNADLNFDPSTVIDGDTTNDLNLLSDSVVDPMEILSYLDPPDLNTPPSSGSSNNPNQDDILASLFD

Similar Transcription Factors

Sequence clustering based on sequence similarity using MMseqs2

100% Identity: -
90% Identity: -
80% Identity: -