Basic Information

Insect
Euclidia mi
Gene Symbol
Nploc4
Assembly
GCA_944738845.2
Location
CALYKX020000396.1:343507-351758[+]

Transcription Factor Domain

TF Family
zf-MIZ
Domain
zf-MIZ domain
PFAM
PF02891
TF Group
Zinc-Coordinating Group
Description
This domain has SUMO (small ubiquitin-like modifier) ligase activity and is involved in DNA repair and chromosome organisation [1][2].
Hmmscan Out
# of c-Evalue i-Evalue score bias hmm coord from hmm coord to ali coord from ali coord to env coord from env coord to acc
1 16 0.017 2.9e+02 3.5 0.2 41 48 190 197 184 199 0.85
2 16 0.0015 26 6.9 0.2 33 48 293 308 289 310 0.82
3 16 1.2 2.1e+04 -2.5 0.1 39 48 410 419 403 420 0.71
4 16 0.0015 26 6.9 0.2 33 48 515 530 511 532 0.82
5 16 0.0015 26 6.9 0.2 33 48 626 641 622 643 0.82
6 16 1.2 2.1e+04 -2.5 0.1 39 48 743 752 736 753 0.71
7 16 0.0015 26 6.9 0.2 33 48 848 863 844 865 0.82
8 16 0.0015 26 6.9 0.2 33 48 959 974 955 976 0.82
9 16 0.0015 26 6.9 0.2 33 48 1070 1085 1066 1087 0.82
10 16 0.0015 26 6.9 0.2 33 48 1181 1196 1177 1198 0.82
11 16 1.2 2.1e+04 -2.5 0.1 39 48 1298 1307 1291 1308 0.71
12 16 1.2 2.1e+04 -2.5 0.1 39 48 1409 1418 1402 1419 0.71
13 16 1.2 2.1e+04 -2.5 0.1 39 48 1520 1529 1513 1530 0.71
14 16 0.0015 26 6.9 0.2 33 48 1625 1640 1621 1642 0.82
15 16 0.0015 26 6.9 0.2 33 48 1736 1751 1732 1753 0.82
16 16 0.0015 26 6.9 0.2 33 48 1847 1862 1843 1864 0.82

Sequence Information

Coding Sequence
ATGGCTCGGCCGCTCGGTCGCTCGCCCGCGGCGGCACACGCGCTTGCCTCAGCCGGGGCGCGTCCACACAGAGCGCGCAGCCTCGCGCGCCAATTCCTCGCGAGGCTGCGCGCTCTGTGTGGACGTGAGCGCGACGTGTACGGCAACGAGGTGGGCGTGTCGGCGAAGCGCGTGCCGGTGGCGTACCTGCTGGTGGACGTGCCGTGCGGCGTGGCGGGTGCCGCCCCGCCCACCTTCAACCCGCGCGCCACTTTCCCCCCCGCCAACCGCCCGCTGCACCATCAGCTGCAGACCCTGCGCGCGCTGCACGCGCAGCTGGCCAACGAGGAGTCGTTCCTGGCGGGCGTGTCCGACCTGCACGCGCTGCTGTTCCTCGCCACCAACGACGCCATGCCGCTGAGCGTGGACGCGCTGGCGCCGCTGCTGGACGCCGTGGTGGCGCGCGACGAGGCGGCGGCGGACGCGTGGCGCCGCGAGCCGCACCACGCCACGCTCGAGCACCTGGTGCACGCGTCCGCCGAGCACGACGCCGCGCCCGCGCACGTCGGCGACGCGGCGCCGGGCGGCGTGTGGACGTGCCCGCTCTGCACCTTCCACAACGCGCCGCACAGCGACGCCTGCGAGATGTGCGCCATGCCCAGGTGCGTACTCACTAGTCACTACACACACCTACAGAGACACGCGTGTGGACGTGCCCGCTCTGCACCTTCCACAACGCGCCGCACAGCGACGCCTGCGAGATGTGCGCCATGCCCAGGTGCGTACTCACTAGTCACTACACACACCTACAGAGACACGCGTGTGGACGTGCCCGCTCTGCACCTTCCACAACGCGCCGCACAGCGACGCCTGCGAGATGTGCGCCATGCCCAGTCACTACACACACCTACAGAGACACGCGTGTGGACGTGCCCGCTCTGCACCTTCCACAACGCGCCGCACAGCGACGCCTGCGAGATGTGCGCCATGCCCAGGTGCGTACTCACTAGTCACTACACACACCTACAGAGACACGCGTGTGGACGTGCCCGCTCTGCACCTTCCACAACGCGCCGCACAGCGACGCCTGCGAGATGTGCGCCATGCCCAGGTGCGTACTCACTAGTCACTACACACACCTACAGAGACACGCGTGTGGACGTGCCCGCTCTGCACCTTCCACAACGCGCCGCACAGCGACGCCTGCGAGATGTGCGCCATGCCCAGTCACTACACACACCTACAGAGACACGCGTGTCGACGTGCCCGCTCTGCACCTTCCACAACGCGCCGCACAGCGACGCCTGCGAGATGTGCGCCATGCCCAGGTGCGTACTCACTAGTCACTACACACACCTACAGAGACACGCGTGTGGACGTGCCCGCTCTGCACCTTCCACAACGCGCCGCACAGCGACGCCTGCGAGATGTGCGCCATGCCCAGGTGCGTACTCACTAGTCACTACACACACCTACAGAGACACGCGAGTGGACGTGCCCGCTCTGCACCTTCCACAACGCGCCGCACAGCGACGCCTGCGAGATGTGCGCCATGCCCAGTCACTACACACACCTACAGAGACACGCGTGTGGACGTGCCCGCTCTGCACCTTCCACAACGCGCCGCACAGCGACGCCTGCGAGATGTGCGCCATGCCCAGGTGCGTACTCACTAGTCACTACACACACCTACAGAGACACGCGTGTCGACGTGCCCGCTCTGCACCTTCCACAACGTGCCGCACAGCGACGCCTGCGAGATGTGCGCCATGCCCAGGTGCGTACTCACTAGTCACTACACACACCTACAGAGACACGCGTGTGGACGTGCCCGCTCTGCACCTTCCACAACGCGCCGCACAGCGACGCCTGCGAGATGTGCGCCATGCCCAGTCACTACACACACCTACAGAGACACGCGTGTGGACGTGCCCGCTCTGCACCTTCCACAACGCGCCGCACAGCGACGCCTGCGAGATGTGCGCCATGCCCAGGTGCGTACTCACTAGTCACTACACACACCTACAGAGACACGCGTGTCGACGTGCCCGCTCTGCACCTTCCACAACGCGCCGCACAGCGACGCCTGCGAGATGTGCGCCATGCCCAGGTGCGTACTCACTAGTCACTCCACACACCTACAGAGACACGCGTGTCGACGTGCCCGCTCTGCACCTTCCACAACGCGCCGCACAGCGACGCCTGCGAGATGTGCGCCATGCCCAGTCACTACACACACCTACAGAGACACGCGTGTCGACGTGCCCGCTCTGCACCTTCCACAACGCGCCGCACAGCGACGCCTGCGAGATGTGCGCCATGCCCAGGTGCGTACTCACTAGTCACTACACACACCTACAGAGACACGCGTGTCGACGTGCCCGCTCTGCACCTTCCACAACGCGCCGCACAGCGACGCCTGCGAGATGTGCGCCATGCCCAGGTGCGTACTCACTAGTCACTACACACACCTACAGAGACACGCGTGTCGACGTGCCCGCTCTGCACCTTCCACAACGCGCCGCACAGCGACGCCTGCGAGATGTGCGCCATGCCCAGTCACTACACACACCTACAGAGACACGCGTGTGGACGTGCCCGCTCTGCACCTTCCACAACGCGCCGCACAGCGACGCCTGCGAGATGTGCGCCATGCCCAGGTGCGTACTCACTAGTCACTACACACACCTACAGAGACACGCGTGTGGACGTGCCCGCTCTGCACCTTCCACAACGCGCCGCACAGCGACGCCTGCGAGATGTGCGCCATGCCCAGGTGCGCACTCACTAGTCACTACACACACCTACAGAGACACGCGTGTGGACGTGCCCGCTCTGCACCTTCCACAACGCGCCGCACAGCGACGCCTGCGAGATGTGCGCCATGCCCAGTCACTACACACACCTACAGAGACACGCGTGTGGACGTGCCCGCTCTGCACCTTCCACAACGCGCCGCACAGCGACGCCTGCGAGATGTGCGCCATGCCCAGGTGCGTACTCACTAGTCACTACACACACCTACAGAGACACGCGTGTGGACGTGCCCGCTCTGCACCTTCCACAACGCGCCGCACAGCGACGCCTGCGAGATGTGCGCCATGCCCAGGTGCGTACTCACTAGTCACTACACACACCTACAGAGACACGCGTGTGGACGTGCCCGCTCTGCACCTTCCACAACGCGCCGCACAGCGACGCCTGCGAGATGTGCGCCATGCCCAGTCACTACACACACCTACAGAGACACGCGTGTGGACGTGCCCGCTCTGCACCTTCCACAACGCGCCGCACAGCGACGCCTGCGAGATGTGCGCCATGCCCAGGTGCGTACTCACTAGTCACTACACACACCTACAGAGACACGCGTGTCGACGTGCCCGCTCTGCACCTTCCACAACGCGCCGCACAGCGACGCCTGCGAGATGTGCGCCATGCCCAGGTGCGTACTCACTAGTCACTACACACACCTACAGAGACACGCGTGTGGACGTGCCCGCTCTGCACCTTCCACAACGCGCCGCACAGCGACGCCTGCGAGATGTGCGCCATGCCCAGTCACTACACACACCTACAGAGACACGCGTGTGGACGTGCCCGCTCTGCACCTTCCACAACGCGCCGCACAGCGACGCCTGCGAGATGTGCGCCATGCCCAGGTGCGTACTCACTAGTCACTACACACACCTACAGAGACACGCGTGTGGACGTGCCCGCTCTGCACCTTCCACAACGCGCCGCACAGCGACGCCTGCGAGATGTGCGCCATGCCCAGGTGCGTACTCACTAGTCACTACACACACCTACAGAGACACGCGTGTCGACGTGCCCGCTCTGCACCTTCCACAACGCGCCGCACAGCGACGCCTGCGAGATGTGCGCCATGCCCAGTCACTACACACACCTACAGAGACACGCGTGTCGACGTGCCCGCTCTGCACCTTCCACAACGCGCCGCACAGCGACGCCTGCGAGATGTGCGCCATGCCCAGGTGCGTACTCACTAGTCACTACACACACCTACAGAGACACGCGTGTGGACGTGCCCGCTCTGCACCTTCCACAACGCGCCGCACAGCGACGCCTGCGAGATGTGCGCCATGCCCAGGTGCGTACTCACTAGTCACTACACACACCTACAGAGACACGCGTGTGGACGTGCCCGCTCTGCACCTTCCACAACGCGCCGCACAGCGACGCCTGCGAGATGTGCGCCATGCCCAGTCACTACACACACCTACAGAGACACGCGTGTCGACGTGCCCGCTCTGCACCTTCCACAACGCGCCGCACAGCGACGCCTGCGAGATGTGCGCCATGCCCAGGTGCGTACTCACTAGTCACTACACACACCTACAGAGACACGCGTGTGGACGTGCCCGCTCTGCACCTTCCACAACGCGCCGCACAGCGACGCCTGCGAGATGTGCGCCATGCCCAGGTGCGTACTCACTAGTCACTACACACACCTACAGAGACACGCGTGTCGACGTGCCCGCTCTGCACCTTCCACAACGCGCCGCACAGCGACGCCTGCGAGATGTGCGCCATGCCCAGTCACTACACACACCTACAGAGACACGCGTGTCGACGTGCCCGCTCTGCACCTTCCACAACGCGCCGCACAGCGACGCCTGCGAGATGTGCGCCATGCCCAGGTGCGTACTCACTAGTCACTACACACACCTACAGAGACACGCGTGTGGACGTGCCCGCTCTGCACCTTCCACAACGCGCCGCACAGCGACGCCTGCGAGATGTGCGCCATGCCCAGGTGCGTACTCACTAGTCACTACACACACCTACAGAGACACGCGTGTGGACGTGCCCGCTCTGCACCTTCCACAACGCGCCGCACAGCGACGCCTGCGAGATGTGCGCCATGCCCAGTCACTACACACACCTACAGAGACACGCGTGTGGACGTGCCCGCTCTGCACCTTCCACAACGCGCCGCACAGCGACGCCTGCGAGATGTGCGCCATGCCCAGGTGCGTACTCACTAGTCACTCCACACACCTACAGAGACACGCGTGTGGACGTGCCCGCTCTGCACCTTCCACAACGCGCCGCACAGCGACGCCTGCGAGATGTGCGCCATGCCCAGGTGCGTACTCACTAGTCACTACACACACCTACAGAGACACGCGTGTGGACGTGCCCGCTCTGCACCTTCCACAACGCGCCGCACAGCGACGCCTGCGAGATGTGCGCCATGCCCAGTCACTACACACACCTACAGAGACACGCGTGTGGACGTGCCCGCTCTGCACCTTCCACAACGCGCCGCACAGCGACGCCTGCGAGATGTGCGCCATGCCCAGGTGCGTACTCACTAGTCACTACACACACCTACAGAGACACGCGTGTGGACGTGCCCGCTCTGCACCTTCCACAACGCGCCGCACAGCGACGCCTGCGAGATGTGCGCCATGCCCAGGTGCGTACTCACTAGTCACTACACACACCTACAGAGACACGCGTGTCGACGTGCCCGCTCTGCACCTTCCACAACGCGCCGCACAGCGACGCCTGCGAGATGTGCGCCATGCCCAGTCACTACACACACCTACAGAGACACGCGTGTGGACGTGCCCGCTCTGCACCTTCCACAACGCGCCGCACAGTGACGCCTGCGAGATGTGCGCCATGCCCAGGTGCGTACTCACTAGTCACTACACACACCTACAGAGACACGCGTGTGGACGTGCCCGCTCTGCACCTTCCACAACGCGCCGCACAGTGACGCCTGCGAGATGTGCGCCATGCCCAGGTGCGTACTCACTAGTCACTACACACACCTACAGAGACACGCGTGTGGACGTGCCCGCTCTGCACCTTCCACAACGCGCCGCACAGTGA
Protein Sequence
MARPLGRSPAAAHALASAGARPHRARSLARQFLARLRALCGRERDVYGNEVGVSAKRVPVAYLLVDVPCGVAGAAPPTFNPRATFPPANRPLHHQLQTLRALHAQLANEESFLAGVSDLHALLFLATNDAMPLSVDALAPLLDAVVARDEAAADAWRREPHHATLEHLVHASAEHDAAPAHVGDAAPGGVWTCPLCTFHNAPHSDACEMCAMPRCVLTSHYTHLQRHACGRARSAPSTTRRTATPARCAPCPGAYSLVTTHTYRDTRVDVPALHLPQRAAQRRLRDVRHAQSLHTPTETRVWTCPLCTFHNAPHSDACEMCAMPRCVLTSHYTHLQRHACGRARSAPSTTRRTATPARCAPCPGAYSLVTTHTYRDTRVDVPALHLPQRAAQRRLRDVRHAQSLHTPTETRVSTCPLCTFHNAPHSDACEMCAMPRCVLTSHYTHLQRHACGRARSAPSTTRRTATPARCAPCPGAYSLVTTHTYRDTRVDVPALHLPQRAAQRRLRDVRHAQSLHTPTETRVWTCPLCTFHNAPHSDACEMCAMPRCVLTSHYTHLQRHACRRARSAPSTTCRTATPARCAPCPGAYSLVTTHTYRDTRVDVPALHLPQRAAQRRLRDVRHAQSLHTPTETRVWTCPLCTFHNAPHSDACEMCAMPRCVLTSHYTHLQRHACRRARSAPSTTRRTATPARCAPCPGAYSLVTPHTYRDTRVDVPALHLPQRAAQRRLRDVRHAQSLHTPTETRVSTCPLCTFHNAPHSDACEMCAMPRCVLTSHYTHLQRHACRRARSAPSTTRRTATPARCAPCPGAYSLVTTHTYRDTRVDVPALHLPQRAAQRRLRDVRHAQSLHTPTETRVWTCPLCTFHNAPHSDACEMCAMPRCVLTSHYTHLQRHACGRARSAPSTTRRTATPARCAPCPGAHSLVTTHTYRDTRVDVPALHLPQRAAQRRLRDVRHAQSLHTPTETRVWTCPLCTFHNAPHSDACEMCAMPRCVLTSHYTHLQRHACGRARSAPSTTRRTATPARCAPCPGAYSLVTTHTYRDTRVDVPALHLPQRAAQRRLRDVRHAQSLHTPTETRVWTCPLCTFHNAPHSDACEMCAMPRCVLTSHYTHLQRHACRRARSAPSTTRRTATPARCAPCPGAYSLVTTHTYRDTRVDVPALHLPQRAAQRRLRDVRHAQSLHTPTETRVWTCPLCTFHNAPHSDACEMCAMPRCVLTSHYTHLQRHACGRARSAPSTTRRTATPARCAPCPGAYSLVTTHTYRDTRVDVPALHLPQRAAQRRLRDVRHAQSLHTPTETRVSTCPLCTFHNAPHSDACEMCAMPRCVLTSHYTHLQRHACGRARSAPSTTRRTATPARCAPCPGAYSLVTTHTYRDTRVDVPALHLPQRAAQRRLRDVRHAQSLHTPTETRVSTCPLCTFHNAPHSDACEMCAMPRCVLTSHYTHLQRHACGRARSAPSTTRRTATPARCAPCPGAYSLVTTHTYRDTRVDVPALHLPQRAAQRRLRDVRHAQSLHTPTETRVSTCPLCTFHNAPHSDACEMCAMPRCVLTSHYTHLQRHACGRARSAPSTTRRTATPARCAPCPGAYSLVTTHTYRDTRVDVPALHLPQRAAQRRLRDVRHAQSLHTPTETRVWTCPLCTFHNAPHSDACEMCAMPRCVLTSHSTHLQRHACGRARSAPSTTRRTATPARCAPCPGAYSLVTTHTYRDTRVDVPALHLPQRAAQRRLRDVRHAQSLHTPTETRVWTCPLCTFHNAPHSDACEMCAMPRCVLTSHYTHLQRHACGRARSAPSTTRRTATPARCAPCPGAYSLVTTHTYRDTRVDVPALHLPQRAAQRRLRDVRHAQSLHTPTETRVWTCPLCTFHNAPHSDACEMCAMPRCVLTSHYTHLQRHACGRARSAPSTTRRTVTPARCAPCPGAYSLVTTHTYRDTRVDVPALHLPQRAAQ

Similar Transcription Factors

Sequence clustering based on sequence similarity using MMseqs2

100% Identity
-
90% Identity
-
80% Identity
-