Basic Information

Insect: Anopheles arabiensis
Gene Symbol: ZMIZ1_1
Assembly: GCA_016920715.1
Location: NC:107495291-107595987[+]

Transcription Factor Domain

TF Family: zf-MIZ
Domain: zf-MIZ domain
PFAM: PF02891
TF Group: Zinc-Coordinating Group
Description: This domain has SUMO (small ubiquitin-like modifier) ligase activity and is involved in DNA repair and chromosome organisation [1][2].
Hmmscan Out: # of c-Evalue i-Evalue score bias hmm coord from hmm coord to ali coord from ali coord to env coord from env coord to acc

1 2 0.1 6.3e+02 -0.3 1.3 4 24 622 642 619 647 0.88

2 2 3.2e-24 2e-20 71.8 3.3 1 50 711 760 711 760 0.98

#	of	c-Evalue	i-Evalue	score	bias	hmm coord from	hmm coord to	ali coord from	ali coord to	env coord from	env coord to	acc
1	2	0.1	6.3e+02	-0.3	1.3	4	24	622	642	619	647	0.88
2	2	3.2e-24	2e-20	71.8	3.3	1	50	711	760	711	760	0.98

Sequence Information

Coding Sequence: ATGAGTGCCCAGGGGGGCTCCCTAGGGGCTCCAACATTGGGTGATCGTCGATCTCCTTACATTGGAGGCTATCCCGacatacagcagcagcagcaccagcagcacccccaccatcaccatcagcaacaacagcagcaaagctATCAACAGTTGCAGAATCCTCATCACGCAGATTACCATCGGGGAGTGCTGCACCCGGAAGCAGCGGCCGGTTATTTGGacgtgaagcagcagcagcagctccagaaAGGATACGCTAAACAGGCTCAGCTACAGGCAGCTGCGggccaacagcaacaaccacaacaacaacagcagcagcagcgatcggCAGCTGGAGCGACAGCCGGTGGACGAGCAGCTGCCGGTGCGCCAACAGGTTTCAACAGTCAAAGTATGGTGGCAGCGGCCGGCGGGCAGCAGGGCAACATGGACGTCGGCTACAATCCACAGATGAATAACATGGCGATGCATTCGCAGTCGTCGTGGAATCAGATGAACGGCATGAACCAAATGGGCGGCATGGGTGGCCAGATGAACGGCATGAACcagatgggtggtggtggcggcggaggCGGAGGCGCCGGAGGTGGTGTCGGTGGCGCCGGCGGCATGGGACCGATGGGTCAGATGGGTGGCGGCGGTGCGACCGGTGGCATGGTGCCCGGCATGGGCCAGatgggcggcggtggcggtggcactGGTGGCGGTGCGGGCGGTGGATACGGCCGGCACCATCAGCAGATGAACCCGATGGCGCAGATGATGAACATGGGCATGGGTATGGGCggaggcggcggtggcggcggtggccagATGGGGCCGGGCGGTGCGGGCGGTATGAACGGGATGGCGGCGGCCCAGATGGGCGGCATGAACCCGCTCAGCCAGATGAACCAGATGTCGCCGATGTCGAAGATGCAGGGCATGGCGAACGGGTACCCGCAGCACCCGCGGAGGATGGCCCCCTACCCGAACCCCCAGATGCAGATGGCCCAGAAGCGGTCGATGTACGGGATGGGCCAGGGGCAGGGTATGCCGGGCGCGGGTGGACCCTTCCCGCCGCATcaggcggcggcagcggcggccgctGCAGCAGCCGCCGGCGTTCCCTTGCCGATGCAGGCCAGCGCCGGGTACGGGCGGCATCATGGGCCGATGGGTCCGATGAACTATCGCGGCGGACCGCCGATGATGCAGCAGCGACAGAACACGCCACCGTACGGTGGACCGGGCGTCGGACCGGTAGGAGCACCCGTAGGCCCTGGAGCGCTGAtgggccaccagcagcagcagcaccagcagcagcagcaacagcagcagcagcaacagcagcagcaacagcatcatcctcagcaccagcagcaccagcagcagcagacgcaacagcaacagcagcagtattaCAACACGGGCTACCAGAACATGCAGGGCTACCAGCCGGACATTCGCATGAACTTCCAGCACAGTCCGGTGCCGGGTAATCCTACGCCACCGCTAACGCCCGCCTCTTCCATGACGCCCTACATCAGCCCCAATCCGGACGTGAAGCCAAACAATCTGCCGCAGAaAGATGAAGAACTGCGGTTGACATTCCCGGTGCGAGACGGCATACTGCTGCCACCGTTCCGGCTCGAGCACAATCTCGCTGTCAGCAACCACGTGTTTCAGCTAAAGTCCACCGTCTACAACACGCTCATGTGCCGGCCGGATCTCGAGCTGCAGCTGAAGTGTTTCCACCACGAGGACCGGCAGATGAACACGAACTGGCCGGCGAGCGTGCAGGTGTCGGCCAACTCGACGCCGCTCGAAATCGACCGGGGCGACAACAAGAACACGCACCGGCCGCTCTACCTGAAACAGGTCTGCCAGCCGGGCCGCAACACGATCCAAATCACCGTCAGCACCTGCTGCTGTTCCCATCTGTTCGTGCTACAGCTGGTGCATCGGCCGTCGGTAAACCATGTGCTGCACACGCTGCTGAAGCGTAACCTCCTGTCCGCGGAGCATGCGGTGGCCAAAATCAAGCGCACCTTTGCCGTCAATCACACAACGAACCCGAACCAACCGCTGGGCGGCGGCCCCGACAAGGATCCGCTTGCGGCGGACGCGTCGGCAACGTCTGCAAAGGTATCACTCAAGTGTACGCTAACCACCAAGCGGATAACGTTGCCAGCGCGCGGCCATGACTGCAAGCACATCCAGTGCTTCGATCTGGAGGCCTATCTGGCGCTGAACTGCGAGCGTGGCAACTGGCGGTGTCCGGTGTGCAGTAAACCGGCACTAACGGAAGGGCTCGAGATCGATCAGTACATGTGGGCGATACTGAACACGCTCAACTCCTCCAACACGCCGAACGGCATGGACACGGAGGAGGTGATCATCGATGCGCAAGCGAACTGGCGAGCGGTCAAACCACCGGGCAGTGTCAATAATCCCAACATTGGAGGCAGTCTCAACCCTCAACAACcgtcacagcagcagcagcagcaacagcaacaacatccacagcagcatcaacaacaacaagcaccaccaatgcagcagcagcaccaacagcagcagcaaccgcccGTACCATCGGAACCGAGTGGCGGCAATGCGCGCGGCGCTGGCACGCCCGGCCTGCCCGTGATCAAACCGGACCCGGACGGTGTCGACGCGAAGCACTTCAACAAGGTGATGTCACCTGGATCCACCTCGCTCCCGACCTGGGACAACATGAACGCAATGAGCCCCTACATGAGCCCGGACATGAGCTCGATCGCTAGCGGCAGCATGATGGGTTCCAACTACAACCGAACGCCCCAGTACGATTCGTACGGCAATGCGATCATCAAGCAAGAACCGGGCACGAACCCCGGATCGGTCGGCGGCCCTGGAAGCGTCGGTAACAATAACGGCCCCGGAACAcccggaggtggtggtggcagcggTGGCAATGGTGGTGAATTCCACGCCGGCAATCCTTTGGCACATCTGAGCGATTCGGTCAACTCGCTCGATCCGCTGAACGCGATGGAGAAATCTCTGAACGATCAGATGCCccacacaccgcacacaccgcacacaccgGGCGGTGGCAACTCGTCCGGCCATCCGATGACGCCGGGCGGACCGCCAAGCGTACCGCCGGCGAACGACATCAACAACACCTCCAACCCGCAGCAACAGTCCACCGGCAGCAACAGTGGCGGCAACGCGAACGGGCAACCgaacggcggcagcagcagtagcgtgAACGGCAACATGAGCCACAGCCCCGGCCATGCCGGGCATGGCAACAGCATGCAGCAGCTACATTcacctcagcagcagcagcatctggGCCTTGGGCCCAACAACCCTGCCGCGAACATCATGAACTCACCGCAAAGTCTCATGAACTCACCGCAGAACATGATGAACTCGCCCCAGAGCAtgatgcagcaacagcagcagcagcagcagcaaaatctcCTCTCAATGGGCTCGATGatgggccagcagcagcagcagcaaagccaTCAAAATGCGCTGGCCGGTCTTACCGATGTCGATCTGCCGGCAGATCTCAACTTCGATCCGGCCGCCGTCATTGAGGGTGAAGGAGGCAACGATCTTAACCTACTACCGGACAACGGCATTGTCGATCCGATGGAATTGCTCTCCTATCTCGATCCGCCGGATCTGAACACGCCCCCGTCAAGCGGTTCCAGCAACAACGCCAACAGCGACGACATTCTGGCCGCACTGTTCGACTAA
Protein Sequence: MSAQGGSLGAPTLGDRRSPYIGGYPDIQQQQHQQHPHHHHQQQQQQSYQQLQNPHHADYHRGVLHPEAAAGYLDVKQQQQLQKGYAKQAQLQAAAGQQQQPQQQQQQQRSAAGATAGGRAAAGAPTGFNSQSMVAAAGGQQGNMDVGYNPQMNNMAMHSQSSWNQMNGMNQMGGMGGQMNGMNQMGGGGGGGGGAGGGVGGAGGMGPMGQMGGGGATGGMVPGMGQMGGGGGGTGGGAGGGYGRHHQQMNPMAQMMNMGMGMGGGGGGGGGQMGPGGAGGMNGMAAAQMGGMNPLSQMNQMSPMSKMQGMANGYPQHPRRMAPYPNPQMQMAQKRSMYGMGQGQGMPGAGGPFPPHQAAAAAAAAAAAGVPLPMQASAGYGRHHGPMGPMNYRGGPPMMQQRQNTPPYGGPGVGPVGAPVGPGALMGHQQQQHQQQQQQQQQQQQQQQHHPQHQQHQQQQTQQQQQQYYNTGYQNMQGYQPDIRMNFQHSPVPGNPTPPLTPASSMTPYISPNPDVKPNNLPQKDEELRLTFPVRDGILLPPFRLEHNLAVSNHVFQLKSTVYNTLMCRPDLELQLKCFHHEDRQMNTNWPASVQVSANSTPLEIDRGDNKNTHRPLYLKQVCQPGRNTIQITVSTCCCSHLFVLQLVHRPSVNHVLHTLLKRNLLSAEHAVAKIKRTFAVNHTTNPNQPLGGGPDKDPLAADASATSAKVSLKCTLTTKRITLPARGHDCKHIQCFDLEAYLALNCERGNWRCPVCSKPALTEGLEIDQYMWAILNTLNSSNTPNGMDTEEVIIDAQANWRAVKPPGSVNNPNIGGSLNPQQPSQQQQQQQQQHPQQHQQQQAPPMQQQHQQQQQPPVPSEPSGGNARGAGTPGLPVIKPDPDGVDAKHFNKVMSPGSTSLPTWDNMNAMSPYMSPDMSSIASGSMMGSNYNRTPQYDSYGNAIIKQEPGTNPGSVGGPGSVGNNNGPGTPGGGGGSGGNGGEFHAGNPLAHLSDSVNSLDPLNAMEKSLNDQMPHTPHTPHTPGGGNSSGHPMTPGGPPSVPPANDINNTSNPQQQSTGSNSGGNANGQPNGGSSSSVNGNMSHSPGHAGHGNSMQQLHSPQQQQHLGLGPNNPAANIMNSPQSLMNSPQNMMNSPQSMMQQQQQQQQQNLLSMGSMMGQQQQQQSHQNALAGLTDVDLPADLNFDPAAVIEGEGGNDLNLLPDNGIVDPMELLSYLDPPDLNTPPSSGSSNNANSDDILAALFD

Similar Transcription Factors

Sequence clustering based on sequence similarity using MMseqs2

100% Identity: iTF_00100010;
90% Identity: -
80% Identity: -