Basic Information

Insect: Coenonympha glycerion
Gene Symbol: alpha-Spec_1
Assembly: GCA_963855885.1
Location: OY979630.1:1770474-1788174[-]

Transcription Factor Domain

TF Family: zf-MIZ
Domain: zf-MIZ domain
PFAM: PF02891
TF Group: Zinc-Coordinating Group
Description: This domain has SUMO (small ubiquitin-like modifier) ligase activity and is involved in DNA repair and chromosome organisation [1][2].
Hmmscan Out: # of c-Evalue i-Evalue score bias hmm coord from hmm coord to ali coord from ali coord to env coord from env coord to acc

1 7 0.0021 12 6.4 0.2 24 43 468 487 464 487 0.94

2 7 0.0021 12 6.4 0.2 24 43 530 549 526 549 0.94

3 7 0.0021 12 6.4 0.2 24 43 578 597 574 597 0.94

4 7 0.0021 12 6.4 0.2 24 43 626 645 622 645 0.94

5 7 0.0021 12 6.4 0.2 24 43 674 693 670 693 0.94

6 7 0.0021 12 6.4 0.2 24 43 744 763 740 763 0.94

7 7 0.0018 10 6.7 0.2 24 43 792 811 788 811 0.94

#	of	c-Evalue	i-Evalue	score	bias	hmm coord from	hmm coord to	ali coord from	ali coord to	env coord from	env coord to	acc
1	7	0.0021	12	6.4	0.2	24	43	468	487	464	487	0.94
2	7	0.0021	12	6.4	0.2	24	43	530	549	526	549	0.94
3	7	0.0021	12	6.4	0.2	24	43	578	597	574	597	0.94
4	7	0.0021	12	6.4	0.2	24	43	626	645	622	645	0.94
5	7	0.0021	12	6.4	0.2	24	43	674	693	670	693	0.94
6	7	0.0021	12	6.4	0.2	24	43	744	763	740	763	0.94
7	7	0.0018	10	6.7	0.2	24	43	792	811	788	811	0.94

Sequence Information

Coding Sequence: ATGGAGCAGATACCACCCCCAAAGGAGGTGAAAATCCTCGAGACTGCTGAGGACATTCAGGAGCGGCGCGAACAGGTGCTGAACCGCTATGAGGACTTCAAGCAAGAGGCGCGCGCCAAGCGCGAGAAGCTGGAGGACTCGCGCCGCTTCCAGTACTTCAAGCGCGATGCCGACGAGCTGGAGTCCTGGATCCAGGAGAAGCTGCAGGCGGCCAGCGACGAGAGCTACAAGGACCCTACCAACCTACAGGCCAAGATCCAGAAACACCAAGCGTTCGAAGCTGAAGTGGCCGCACACTCCAATGCCATTGTGGTTCTGGACAACACCGGCAGCGAGATGATCTCGGCGGGCCACTTCGCCTCGGAGACCATCCGCAAACGGCTCGACGAGCTGCACCGCCTGTGGGAGCTGCTGCTGTCCAGGCTGGCGGAGAAGGGCATGAAGCTGCAGCAGGCCTTGGTGCTGGTGCAGTTCCTGCGACACTGTGATGAAGTCATGTTCTGGATTCATGACAAGGAAACATTCGTATGCGCTGACGAGTTCGGCTCAGATCTGGAACACGTGGAAGTCCTGCAGCGCAAGTTCGACGAGTTCCAAAAGGACATGGCGGCGCAGGAGTACCGCGTCACCGAGGTCAACCAGCTCGCTGAGCGACTCGTGCTGGAGGGGCACCCCGAGAGAGAGACCATCGTCAAGAGGAAGGATGAACTGAACGAGGCGTGGCAGCGCCTCCGGCAGATGGCGCTCATGCGCCAGGAGCGTCTGTTCGGCGCGCACGAGATCCAGCGCTTCAACCGCGACGCGGACGAGACCATCGCCTGGATCTCCGAGAAGGACGTCGTTCTCGGCTCCGACGACTACGGCCGGGACCTGGCCACCGTGCAGACGCTgcagCGCAAGCACGAAGGCGTGGAGCGCGACCTGGCGGCTCTAGAAGACAAGGTGGCCACGCTGGACGGCGAGGCCGCGCGCTTGGCCGCCATACACGCCGACCACGCGCCCGCCATCCACTCCAAGCGCGACGAGATCACGCAGGCCTGGCAGAGGCTCGTGCAGAAGGCGCAGGAACGCCGCACGGAGCTGGAGTCGTCGTACGCGCTGCACCGCTTCCTGGCGGACTACCGCGACCTGATCTCGTGGATGAGCGACATCCGCGCGCTCATCGCCGCCGACGACCTCGCCAAGGACGTGCCCGGAGCAGAGGCGCTGCTCGAACGACACCAGGAGCACAAGGGTGAAATGGACGCGCGCGAGGACGTGATGAGCGCGTGCGTGGCGAGCGGGCAGGCGCTGGTGGCGGGCGGGCACCGCGGCGCGGCGGAGGTGCAGGCGGCGCTGGACACGCTGCACCGCGACCGCGCGGCGCTGCACGCGCTGTGGGAGCAGCGCCGCGTGCTGTACCTGCAGTGCATGGACCTGCAGCTGTTCTACCGCGACACCGAGCAGGCGGACGCGTGGATGCACAAGCAGGAGGCGCTGGTGGCGGGCGGGCACCGCGGCGCGGCGGAGGTGCAGGCGGCGCTGGACACGCTGCACCGCGACCGCGCAGCGCTGCACGCGCTGTGGGAGCAGCGCCGCGTGCTGTACCTGCAGTGCATGGACCTGCAGCTGTTCTACCGCGACACCGAGCAGGCGGACGCGTGGATGCACAAGCAGGAGGCGGCGCTGGACACGCTGCACCGCGACCGCGCGGCGCTGCACGCGCTGTGGGAGCAGCGCCGCGTGCTGTACCTGCAGTGCATGGACCTGCAGCTGTTCTACCGCGACACCGAGCAGGCGGACGCGTGGATGCACAAGCAGGAGGCGGCGCTGGACACGCTGCACCGCGACCGCGCGGCGCTGCACGCGCTGTGGGAGCAGCGCCGCGTGCTGTACCTGCAGTGCATGGACCTGCAGCTGTTCTACCGCGACACCGAGCAGGCGGACGCGTGGATGCACAAGCAGGAGGCGGCGCTGGACACGCTGCACCGCGACCGCGCGGCGCTGCACGCGCTGTGGGAGCAGCGCCGCGTGCTGTACCTGCAGTGCATGGACCTGCAGCTGTTCTACCGCGACACCGAGCAGGCGGACGCGTGGATGCACAAGCAGGAGGTTAGTGTGCGTGGCGAGCGGGCAGGCGCTGGTGGCGGGCGGGCACCGCGGCGCGGCGGAGGGCAGGCGGCGCTGGACACGCTGCACCGCGACCGCGCGGCGCTGCACGCGCTGTGGGAGCAGCGCCGCGTGCTATACCTGCAGTGCATGGACCTGCAGCTGTTCTACCGCGACACCGAGCAGGCGGACGCGTGGATGCACAAGCAGGAGGCGGCGCTGGACACGCTGCACCGCGACCGCGCGGCGCTGCACGCGCTGTGGGAGCAGCGCCGCGTGCTGTACCTGCAGTGCATGGACCTGCAGCTGTTCTACCGCGACACCGAGCAGGCGGACTCGTGGATGCACAAGCAGGAGGCTTTCCTCGCCAACGAGGACGTGGGTGACTCGCTGGACTCCGTAGAAGCGTTGTTGAAGAAACACGAAGACTTCGAGAAGTCGCTCGCCGCGCAGGAAGAGAAAATCAAGGCGCTGGACGAGTTCGCCACCAAGCTTATCGAAGGACAGCACTACGCGGCTGATGACGTAGCGCAGCGAAGAGAGATGCTCCTGGAGCGGCGTGCTGCTCTGCTGGAGAAGTCTAGCCAGCGCCGCGCCCTTCTAGAAGACGCGTACAAGTACCAGCAGTTCGAGCGAGACTGCGACGAGACCAAGGGCTGGATCAACGAGAAGCTGAAGTTCGCGACTGACGACTCCTACCTGGACCCTACGAATCTGAACGGCAAGGTGCAGAAGCACGGCAACTTCGAGCAGGAGCTGCAGGCCAACAAGCCGCGCGTCGACGAGATCAACGCGCTGGGCTCCAAGCTGCTTGAGCAGGAGCACTTCGCTAAACCTCAAATTGAGGCTCGCTTGGACGAACTGGGCTCCCTCTGGGAGAGGCTGGTCCAAGCTTCGGAGCTGAAGGGCAGCAAACTCCAGGAGGCCGCCGCGCAGCAGCAGTTCAACCGCGCCTCCGAGGACATCGAGCTGTGGCTCTCAGAGGTCGAGGGGCAGCTGCTTAGTGAGGACTATGGCAAGGACTTGACAAGCGTGCAGAACCTGCAAAAGAAGCACGCGCTGTTGGAGGCGGACGTGAGCTCGCACGCGGAGCGCATCGACGCGCTGCGCGAGCAGGCCGAGCAGTTCATCGAGCGCGGCCACTTCGACGCGGACAACATCAAGGCGAAGAGGGTAAGAGGCTTGTTGTTCGCGTTTCAAAAGAAGCACGCGCTGCTGGAGGCGGACGTGAGCTCGCACGCGGAGCGCATCGACGCGCTGCGCGAGCAGGCCGAGCAGTTCATCGAGCGCGGCCACTTCGACGCGGACAACATCAAGGCGAAGAGGGTAAGAGGCTTGTTGTTCGCGTTTCAAAAGAAGCACGCGCTGCTGGAGGCGGACGTGAGCTCGCACGCGGAGCGCATCGACGCGCTGCGCGAGCAGGCCGAGCAGTTCATCGAGCGCGGCCACTTCGACGCGGACAACATCAAGGCGAAGAGGGTAAGAGGCTTGTTGTTCGCGTTTCAAAAGAAGCACGCGCTGCTGGAGGCGGACGTGAGCTCGCACGCGGAGCGCATCGACGCGCTGCGCGAGCAGGCCGAGCAGTTCATCGAGCGCGGCCACTTCGACGCGGACAACATCAAGGCGAAGAGGGTAAGAGGCTTGTTGTTCGCGTTTCAAAAGAAGCACGCGCTGCTGGAGGCGGACGTGAGCTCGCACGCGGAGCGCATCGACGCGCTGCGCGAGCAGGCCGAGCAGTTCATCGAGCGCGGCCACTTCGACGCGGACAACATCAAGGCGAAAAGGGACGCGCTAGTGGCGCGCTACGCGGCGCTGGACAAGCCGATGGCGGTGCGCAAGCGGCGGCTGCTGGACTCGCTGCAGGCGCAGCAGTTGTTCCGCGACCTGGACGACGAGGCCGCCTGGATCCGCGAGAAGGAGCCCATCATTGCCTCCACCAACAGGGGTCGCGATCTGATCGGAGTCCAGAACTTAATGAAGAAGCACCAAGCCGTGATGGGCGAGATGGCCCAGCACGAGGCGCGCGTGGAGGCGGTCCGCGCGGCCGGCGCCGCGCTGCGGGACGCGGGCCACTTCGCCGCCGCCGACATCGCCGCGCGCCTGCACGCGCTGCACACCACGTGGACGCAGCTGCAGGAGaaggctctgcagCGCAAGCAAGACCTCGAAGACTCGCTACAAGCGCAGCAATACTTCGCGGACGCCAACGAGGCGGAGTCGTGGATGCGCGAGAAGGAGCCCATGGCCAACACGCAGGACTACGGCAAGGACGAGGACTCCTCCGAGGCCCTGCTGAAGAAGCACGAGGCCCTGCTGTCGGACTTGGAGGCCTTCGGCAACACCATCAAGGCGCTGAGGGAACAGGCCAACTCTTGTCGCGTAAGTGCTACTGTCCCTTCAGTGACAGCCTGTTGA
Protein Sequence: MEQIPPPKEVKILETAEDIQERREQVLNRYEDFKQEARAKREKLEDSRRFQYFKRDADELESWIQEKLQAASDESYKDPTNLQAKIQKHQAFEAEVAAHSNAIVVLDNTGSEMISAGHFASETIRKRLDELHRLWELLLSRLAEKGMKLQQALVLVQFLRHCDEVMFWIHDKETFVCADEFGSDLEHVEVLQRKFDEFQKDMAAQEYRVTEVNQLAERLVLEGHPERETIVKRKDELNEAWQRLRQMALMRQERLFGAHEIQRFNRDADETIAWISEKDVVLGSDDYGRDLATVQTLQRKHEGVERDLAALEDKVATLDGEAARLAAIHADHAPAIHSKRDEITQAWQRLVQKAQERRTELESSYALHRFLADYRDLISWMSDIRALIAADDLAKDVPGAEALLERHQEHKGEMDAREDVMSACVASGQALVAGGHRGAAEVQAALDTLHRDRAALHALWEQRRVLYLQCMDLQLFYRDTEQADAWMHKQEALVAGGHRGAAEVQAALDTLHRDRAALHALWEQRRVLYLQCMDLQLFYRDTEQADAWMHKQEAALDTLHRDRAALHALWEQRRVLYLQCMDLQLFYRDTEQADAWMHKQEAALDTLHRDRAALHALWEQRRVLYLQCMDLQLFYRDTEQADAWMHKQEAALDTLHRDRAALHALWEQRRVLYLQCMDLQLFYRDTEQADAWMHKQEVSVRGERAGAGGGRAPRRGGGQAALDTLHRDRAALHALWEQRRVLYLQCMDLQLFYRDTEQADAWMHKQEAALDTLHRDRAALHALWEQRRVLYLQCMDLQLFYRDTEQADSWMHKQEAFLANEDVGDSLDSVEALLKKHEDFEKSLAAQEEKIKALDEFATKLIEGQHYAADDVAQRREMLLERRAALLEKSSQRRALLEDAYKYQQFERDCDETKGWINEKLKFATDDSYLDPTNLNGKVQKHGNFEQELQANKPRVDEINALGSKLLEQEHFAKPQIEARLDELGSLWERLVQASELKGSKLQEAAAQQQFNRASEDIELWLSEVEGQLLSEDYGKDLTSVQNLQKKHALLEADVSSHAERIDALREQAEQFIERGHFDADNIKAKRVRGLLFAFQKKHALLEADVSSHAERIDALREQAEQFIERGHFDADNIKAKRVRGLLFAFQKKHALLEADVSSHAERIDALREQAEQFIERGHFDADNIKAKRVRGLLFAFQKKHALLEADVSSHAERIDALREQAEQFIERGHFDADNIKAKRVRGLLFAFQKKHALLEADVSSHAERIDALREQAEQFIERGHFDADNIKAKRDALVARYAALDKPMAVRKRRLLDSLQAQQLFRDLDDEAAWIREKEPIIASTNRGRDLIGVQNLMKKHQAVMGEMAQHEARVEAVRAAGAALRDAGHFAAADIAARLHALHTTWTQLQEKALQRKQDLEDSLQAQQYFADANEAESWMREKEPMANTQDYGKDEDSSEALLKKHEALLSDLEAFGNTIKALREQANSCRVSATVPSVTAC

Similar Transcription Factors

Sequence clustering based on sequence similarity using MMseqs2

100% Identity: -
90% Identity: -
80% Identity: -