Emi040153.1
Basic Information
- Insect
- Euclidia mi
- Gene Symbol
- Nploc4
- Assembly
- GCA_944738845.2
- Location
- CALYKX020000396.1:343507-351758[+]
Transcription Factor Domain
- TF Family
- zf-MIZ
- Domain
- zf-MIZ domain
- PFAM
- PF02891
- TF Group
- Zinc-Coordinating Group
- Description
- This domain has SUMO (small ubiquitin-like modifier) ligase activity and is involved in DNA repair and chromosome organisation [1][2].
- Hmmscan Out
-
# of c-Evalue i-Evalue score bias hmm coord from hmm coord to ali coord from ali coord to env coord from env coord to acc 1 16 0.017 2.9e+02 3.5 0.2 41 48 190 197 184 199 0.85 2 16 0.0015 26 6.9 0.2 33 48 293 308 289 310 0.82 3 16 1.2 2.1e+04 -2.5 0.1 39 48 410 419 403 420 0.71 4 16 0.0015 26 6.9 0.2 33 48 515 530 511 532 0.82 5 16 0.0015 26 6.9 0.2 33 48 626 641 622 643 0.82 6 16 1.2 2.1e+04 -2.5 0.1 39 48 743 752 736 753 0.71 7 16 0.0015 26 6.9 0.2 33 48 848 863 844 865 0.82 8 16 0.0015 26 6.9 0.2 33 48 959 974 955 976 0.82 9 16 0.0015 26 6.9 0.2 33 48 1070 1085 1066 1087 0.82 10 16 0.0015 26 6.9 0.2 33 48 1181 1196 1177 1198 0.82 11 16 1.2 2.1e+04 -2.5 0.1 39 48 1298 1307 1291 1308 0.71 12 16 1.2 2.1e+04 -2.5 0.1 39 48 1409 1418 1402 1419 0.71 13 16 1.2 2.1e+04 -2.5 0.1 39 48 1520 1529 1513 1530 0.71 14 16 0.0015 26 6.9 0.2 33 48 1625 1640 1621 1642 0.82 15 16 0.0015 26 6.9 0.2 33 48 1736 1751 1732 1753 0.82 16 16 0.0015 26 6.9 0.2 33 48 1847 1862 1843 1864 0.82
Sequence Information
- Coding Sequence
- ATGGCTCGGCCGCTCGGTCGCTCGCCCGCGGCGGCACACGCGCTTGCCTCAGCCGGGGCGCGTCCACACAGAGCGCGCAGCCTCGCGCGCCAATTCCTCGCGAGGCTGCGCGCTCTGTGTGGACGTGAGCGCGACGTGTACGGCAACGAGGTGGGCGTGTCGGCGAAGCGCGTGCCGGTGGCGTACCTGCTGGTGGACGTGCCGTGCGGCGTGGCGGGTGCCGCCCCGCCCACCTTCAACCCGCGCGCCACTTTCCCCCCCGCCAACCGCCCGCTGCACCATCAGCTGCAGACCCTGCGCGCGCTGCACGCGCAGCTGGCCAACGAGGAGTCGTTCCTGGCGGGCGTGTCCGACCTGCACGCGCTGCTGTTCCTCGCCACCAACGACGCCATGCCGCTGAGCGTGGACGCGCTGGCGCCGCTGCTGGACGCCGTGGTGGCGCGCGACGAGGCGGCGGCGGACGCGTGGCGCCGCGAGCCGCACCACGCCACGCTCGAGCACCTGGTGCACGCGTCCGCCGAGCACGACGCCGCGCCCGCGCACGTCGGCGACGCGGCGCCGGGCGGCGTGTGGACGTGCCCGCTCTGCACCTTCCACAACGCGCCGCACAGCGACGCCTGCGAGATGTGCGCCATGCCCAGGTGCGTACTCACTAGTCACTACACACACCTACAGAGACACGCGTGTGGACGTGCCCGCTCTGCACCTTCCACAACGCGCCGCACAGCGACGCCTGCGAGATGTGCGCCATGCCCAGGTGCGTACTCACTAGTCACTACACACACCTACAGAGACACGCGTGTGGACGTGCCCGCTCTGCACCTTCCACAACGCGCCGCACAGCGACGCCTGCGAGATGTGCGCCATGCCCAGTCACTACACACACCTACAGAGACACGCGTGTGGACGTGCCCGCTCTGCACCTTCCACAACGCGCCGCACAGCGACGCCTGCGAGATGTGCGCCATGCCCAGGTGCGTACTCACTAGTCACTACACACACCTACAGAGACACGCGTGTGGACGTGCCCGCTCTGCACCTTCCACAACGCGCCGCACAGCGACGCCTGCGAGATGTGCGCCATGCCCAGGTGCGTACTCACTAGTCACTACACACACCTACAGAGACACGCGTGTGGACGTGCCCGCTCTGCACCTTCCACAACGCGCCGCACAGCGACGCCTGCGAGATGTGCGCCATGCCCAGTCACTACACACACCTACAGAGACACGCGTGTCGACGTGCCCGCTCTGCACCTTCCACAACGCGCCGCACAGCGACGCCTGCGAGATGTGCGCCATGCCCAGGTGCGTACTCACTAGTCACTACACACACCTACAGAGACACGCGTGTGGACGTGCCCGCTCTGCACCTTCCACAACGCGCCGCACAGCGACGCCTGCGAGATGTGCGCCATGCCCAGGTGCGTACTCACTAGTCACTACACACACCTACAGAGACACGCGAGTGGACGTGCCCGCTCTGCACCTTCCACAACGCGCCGCACAGCGACGCCTGCGAGATGTGCGCCATGCCCAGTCACTACACACACCTACAGAGACACGCGTGTGGACGTGCCCGCTCTGCACCTTCCACAACGCGCCGCACAGCGACGCCTGCGAGATGTGCGCCATGCCCAGGTGCGTACTCACTAGTCACTACACACACCTACAGAGACACGCGTGTCGACGTGCCCGCTCTGCACCTTCCACAACGTGCCGCACAGCGACGCCTGCGAGATGTGCGCCATGCCCAGGTGCGTACTCACTAGTCACTACACACACCTACAGAGACACGCGTGTGGACGTGCCCGCTCTGCACCTTCCACAACGCGCCGCACAGCGACGCCTGCGAGATGTGCGCCATGCCCAGTCACTACACACACCTACAGAGACACGCGTGTGGACGTGCCCGCTCTGCACCTTCCACAACGCGCCGCACAGCGACGCCTGCGAGATGTGCGCCATGCCCAGGTGCGTACTCACTAGTCACTACACACACCTACAGAGACACGCGTGTCGACGTGCCCGCTCTGCACCTTCCACAACGCGCCGCACAGCGACGCCTGCGAGATGTGCGCCATGCCCAGGTGCGTACTCACTAGTCACTCCACACACCTACAGAGACACGCGTGTCGACGTGCCCGCTCTGCACCTTCCACAACGCGCCGCACAGCGACGCCTGCGAGATGTGCGCCATGCCCAGTCACTACACACACCTACAGAGACACGCGTGTCGACGTGCCCGCTCTGCACCTTCCACAACGCGCCGCACAGCGACGCCTGCGAGATGTGCGCCATGCCCAGGTGCGTACTCACTAGTCACTACACACACCTACAGAGACACGCGTGTCGACGTGCCCGCTCTGCACCTTCCACAACGCGCCGCACAGCGACGCCTGCGAGATGTGCGCCATGCCCAGGTGCGTACTCACTAGTCACTACACACACCTACAGAGACACGCGTGTCGACGTGCCCGCTCTGCACCTTCCACAACGCGCCGCACAGCGACGCCTGCGAGATGTGCGCCATGCCCAGTCACTACACACACCTACAGAGACACGCGTGTGGACGTGCCCGCTCTGCACCTTCCACAACGCGCCGCACAGCGACGCCTGCGAGATGTGCGCCATGCCCAGGTGCGTACTCACTAGTCACTACACACACCTACAGAGACACGCGTGTGGACGTGCCCGCTCTGCACCTTCCACAACGCGCCGCACAGCGACGCCTGCGAGATGTGCGCCATGCCCAGGTGCGCACTCACTAGTCACTACACACACCTACAGAGACACGCGTGTGGACGTGCCCGCTCTGCACCTTCCACAACGCGCCGCACAGCGACGCCTGCGAGATGTGCGCCATGCCCAGTCACTACACACACCTACAGAGACACGCGTGTGGACGTGCCCGCTCTGCACCTTCCACAACGCGCCGCACAGCGACGCCTGCGAGATGTGCGCCATGCCCAGGTGCGTACTCACTAGTCACTACACACACCTACAGAGACACGCGTGTGGACGTGCCCGCTCTGCACCTTCCACAACGCGCCGCACAGCGACGCCTGCGAGATGTGCGCCATGCCCAGGTGCGTACTCACTAGTCACTACACACACCTACAGAGACACGCGTGTGGACGTGCCCGCTCTGCACCTTCCACAACGCGCCGCACAGCGACGCCTGCGAGATGTGCGCCATGCCCAGTCACTACACACACCTACAGAGACACGCGTGTGGACGTGCCCGCTCTGCACCTTCCACAACGCGCCGCACAGCGACGCCTGCGAGATGTGCGCCATGCCCAGGTGCGTACTCACTAGTCACTACACACACCTACAGAGACACGCGTGTCGACGTGCCCGCTCTGCACCTTCCACAACGCGCCGCACAGCGACGCCTGCGAGATGTGCGCCATGCCCAGGTGCGTACTCACTAGTCACTACACACACCTACAGAGACACGCGTGTGGACGTGCCCGCTCTGCACCTTCCACAACGCGCCGCACAGCGACGCCTGCGAGATGTGCGCCATGCCCAGTCACTACACACACCTACAGAGACACGCGTGTGGACGTGCCCGCTCTGCACCTTCCACAACGCGCCGCACAGCGACGCCTGCGAGATGTGCGCCATGCCCAGGTGCGTACTCACTAGTCACTACACACACCTACAGAGACACGCGTGTGGACGTGCCCGCTCTGCACCTTCCACAACGCGCCGCACAGCGACGCCTGCGAGATGTGCGCCATGCCCAGGTGCGTACTCACTAGTCACTACACACACCTACAGAGACACGCGTGTCGACGTGCCCGCTCTGCACCTTCCACAACGCGCCGCACAGCGACGCCTGCGAGATGTGCGCCATGCCCAGTCACTACACACACCTACAGAGACACGCGTGTCGACGTGCCCGCTCTGCACCTTCCACAACGCGCCGCACAGCGACGCCTGCGAGATGTGCGCCATGCCCAGGTGCGTACTCACTAGTCACTACACACACCTACAGAGACACGCGTGTGGACGTGCCCGCTCTGCACCTTCCACAACGCGCCGCACAGCGACGCCTGCGAGATGTGCGCCATGCCCAGGTGCGTACTCACTAGTCACTACACACACCTACAGAGACACGCGTGTGGACGTGCCCGCTCTGCACCTTCCACAACGCGCCGCACAGCGACGCCTGCGAGATGTGCGCCATGCCCAGTCACTACACACACCTACAGAGACACGCGTGTCGACGTGCCCGCTCTGCACCTTCCACAACGCGCCGCACAGCGACGCCTGCGAGATGTGCGCCATGCCCAGGTGCGTACTCACTAGTCACTACACACACCTACAGAGACACGCGTGTGGACGTGCCCGCTCTGCACCTTCCACAACGCGCCGCACAGCGACGCCTGCGAGATGTGCGCCATGCCCAGGTGCGTACTCACTAGTCACTACACACACCTACAGAGACACGCGTGTCGACGTGCCCGCTCTGCACCTTCCACAACGCGCCGCACAGCGACGCCTGCGAGATGTGCGCCATGCCCAGTCACTACACACACCTACAGAGACACGCGTGTCGACGTGCCCGCTCTGCACCTTCCACAACGCGCCGCACAGCGACGCCTGCGAGATGTGCGCCATGCCCAGGTGCGTACTCACTAGTCACTACACACACCTACAGAGACACGCGTGTGGACGTGCCCGCTCTGCACCTTCCACAACGCGCCGCACAGCGACGCCTGCGAGATGTGCGCCATGCCCAGGTGCGTACTCACTAGTCACTACACACACCTACAGAGACACGCGTGTGGACGTGCCCGCTCTGCACCTTCCACAACGCGCCGCACAGCGACGCCTGCGAGATGTGCGCCATGCCCAGTCACTACACACACCTACAGAGACACGCGTGTGGACGTGCCCGCTCTGCACCTTCCACAACGCGCCGCACAGCGACGCCTGCGAGATGTGCGCCATGCCCAGGTGCGTACTCACTAGTCACTCCACACACCTACAGAGACACGCGTGTGGACGTGCCCGCTCTGCACCTTCCACAACGCGCCGCACAGCGACGCCTGCGAGATGTGCGCCATGCCCAGGTGCGTACTCACTAGTCACTACACACACCTACAGAGACACGCGTGTGGACGTGCCCGCTCTGCACCTTCCACAACGCGCCGCACAGCGACGCCTGCGAGATGTGCGCCATGCCCAGTCACTACACACACCTACAGAGACACGCGTGTGGACGTGCCCGCTCTGCACCTTCCACAACGCGCCGCACAGCGACGCCTGCGAGATGTGCGCCATGCCCAGGTGCGTACTCACTAGTCACTACACACACCTACAGAGACACGCGTGTGGACGTGCCCGCTCTGCACCTTCCACAACGCGCCGCACAGCGACGCCTGCGAGATGTGCGCCATGCCCAGGTGCGTACTCACTAGTCACTACACACACCTACAGAGACACGCGTGTCGACGTGCCCGCTCTGCACCTTCCACAACGCGCCGCACAGCGACGCCTGCGAGATGTGCGCCATGCCCAGTCACTACACACACCTACAGAGACACGCGTGTGGACGTGCCCGCTCTGCACCTTCCACAACGCGCCGCACAGTGACGCCTGCGAGATGTGCGCCATGCCCAGGTGCGTACTCACTAGTCACTACACACACCTACAGAGACACGCGTGTGGACGTGCCCGCTCTGCACCTTCCACAACGCGCCGCACAGTGACGCCTGCGAGATGTGCGCCATGCCCAGGTGCGTACTCACTAGTCACTACACACACCTACAGAGACACGCGTGTGGACGTGCCCGCTCTGCACCTTCCACAACGCGCCGCACAGTGA
- Protein Sequence
- MARPLGRSPAAAHALASAGARPHRARSLARQFLARLRALCGRERDVYGNEVGVSAKRVPVAYLLVDVPCGVAGAAPPTFNPRATFPPANRPLHHQLQTLRALHAQLANEESFLAGVSDLHALLFLATNDAMPLSVDALAPLLDAVVARDEAAADAWRREPHHATLEHLVHASAEHDAAPAHVGDAAPGGVWTCPLCTFHNAPHSDACEMCAMPRCVLTSHYTHLQRHACGRARSAPSTTRRTATPARCAPCPGAYSLVTTHTYRDTRVDVPALHLPQRAAQRRLRDVRHAQSLHTPTETRVWTCPLCTFHNAPHSDACEMCAMPRCVLTSHYTHLQRHACGRARSAPSTTRRTATPARCAPCPGAYSLVTTHTYRDTRVDVPALHLPQRAAQRRLRDVRHAQSLHTPTETRVSTCPLCTFHNAPHSDACEMCAMPRCVLTSHYTHLQRHACGRARSAPSTTRRTATPARCAPCPGAYSLVTTHTYRDTRVDVPALHLPQRAAQRRLRDVRHAQSLHTPTETRVWTCPLCTFHNAPHSDACEMCAMPRCVLTSHYTHLQRHACRRARSAPSTTCRTATPARCAPCPGAYSLVTTHTYRDTRVDVPALHLPQRAAQRRLRDVRHAQSLHTPTETRVWTCPLCTFHNAPHSDACEMCAMPRCVLTSHYTHLQRHACRRARSAPSTTRRTATPARCAPCPGAYSLVTPHTYRDTRVDVPALHLPQRAAQRRLRDVRHAQSLHTPTETRVSTCPLCTFHNAPHSDACEMCAMPRCVLTSHYTHLQRHACRRARSAPSTTRRTATPARCAPCPGAYSLVTTHTYRDTRVDVPALHLPQRAAQRRLRDVRHAQSLHTPTETRVWTCPLCTFHNAPHSDACEMCAMPRCVLTSHYTHLQRHACGRARSAPSTTRRTATPARCAPCPGAHSLVTTHTYRDTRVDVPALHLPQRAAQRRLRDVRHAQSLHTPTETRVWTCPLCTFHNAPHSDACEMCAMPRCVLTSHYTHLQRHACGRARSAPSTTRRTATPARCAPCPGAYSLVTTHTYRDTRVDVPALHLPQRAAQRRLRDVRHAQSLHTPTETRVWTCPLCTFHNAPHSDACEMCAMPRCVLTSHYTHLQRHACRRARSAPSTTRRTATPARCAPCPGAYSLVTTHTYRDTRVDVPALHLPQRAAQRRLRDVRHAQSLHTPTETRVWTCPLCTFHNAPHSDACEMCAMPRCVLTSHYTHLQRHACGRARSAPSTTRRTATPARCAPCPGAYSLVTTHTYRDTRVDVPALHLPQRAAQRRLRDVRHAQSLHTPTETRVSTCPLCTFHNAPHSDACEMCAMPRCVLTSHYTHLQRHACGRARSAPSTTRRTATPARCAPCPGAYSLVTTHTYRDTRVDVPALHLPQRAAQRRLRDVRHAQSLHTPTETRVSTCPLCTFHNAPHSDACEMCAMPRCVLTSHYTHLQRHACGRARSAPSTTRRTATPARCAPCPGAYSLVTTHTYRDTRVDVPALHLPQRAAQRRLRDVRHAQSLHTPTETRVSTCPLCTFHNAPHSDACEMCAMPRCVLTSHYTHLQRHACGRARSAPSTTRRTATPARCAPCPGAYSLVTTHTYRDTRVDVPALHLPQRAAQRRLRDVRHAQSLHTPTETRVWTCPLCTFHNAPHSDACEMCAMPRCVLTSHSTHLQRHACGRARSAPSTTRRTATPARCAPCPGAYSLVTTHTYRDTRVDVPALHLPQRAAQRRLRDVRHAQSLHTPTETRVWTCPLCTFHNAPHSDACEMCAMPRCVLTSHYTHLQRHACGRARSAPSTTRRTATPARCAPCPGAYSLVTTHTYRDTRVDVPALHLPQRAAQRRLRDVRHAQSLHTPTETRVWTCPLCTFHNAPHSDACEMCAMPRCVLTSHYTHLQRHACGRARSAPSTTRRTVTPARCAPCPGAYSLVTTHTYRDTRVDVPALHLPQRAAQ
Similar Transcription Factors
Sequence clustering based on sequence similarity using MMseqs2
- 100% Identity
- -
- 90% Identity
- -
- 80% Identity
- -