Basic Information

Insect: Euclidia mi
Gene Symbol: Nploc4_1
Assembly: GCA_944738845.2
Location: CALYKX020000396.1:343507-351758[+]

Transcription Factor Domain

TF Family: zf-MIZ
Domain: zf-MIZ domain
PFAM: PF02891
TF Group: Zinc-Coordinating Group
Description: This domain has SUMO (small ubiquitin-like modifier) ligase activity and is involved in DNA repair and chromosome organisation [1][2].
Hmmscan Out: # of c-Evalue i-Evalue score bias hmm coord from hmm coord to ali coord from ali coord to env coord from env coord to acc

1 16 0.017 2.9e+02 3.5 0.2 41 48 190 197 184 199 0.85

2 16 0.0015 26 6.9 0.2 33 48 293 308 289 310 0.82

3 16 1.2 2.1e+04 -2.5 0.1 39 48 410 419 403 420 0.71

4 16 0.0015 26 6.9 0.2 33 48 515 530 511 532 0.82

5 16 0.0015 26 6.9 0.2 33 48 626 641 622 643 0.82

6 16 1.2 2.1e+04 -2.5 0.1 39 48 743 752 736 753 0.71

7 16 0.0015 26 6.9 0.2 33 48 848 863 844 865 0.82

8 16 0.0015 26 6.9 0.2 33 48 959 974 955 976 0.82

9 16 0.0015 26 6.9 0.2 33 48 1070 1085 1066 1087 0.82

10 16 0.0015 26 6.9 0.2 33 48 1181 1196 1177 1198 0.82

11 16 1.2 2.1e+04 -2.5 0.1 39 48 1298 1307 1291 1308 0.71

12 16 1.2 2.1e+04 -2.5 0.1 39 48 1409 1418 1402 1419 0.71

13 16 1.2 2.1e+04 -2.5 0.1 39 48 1520 1529 1513 1530 0.71

14 16 0.0015 26 6.9 0.2 33 48 1625 1640 1621 1642 0.82

15 16 0.0015 26 6.9 0.2 33 48 1736 1751 1732 1753 0.82

16 16 0.0015 26 6.9 0.2 33 48 1847 1862 1843 1864 0.82

#	of	c-Evalue	i-Evalue	score	bias	hmm coord from	hmm coord to	ali coord from	ali coord to	env coord from	env coord to	acc
1	16	0.017	2.9e+02	3.5	0.2	41	48	190	197	184	199	0.85
2	16	0.0015	26	6.9	0.2	33	48	293	308	289	310	0.82
3	16	1.2	2.1e+04	-2.5	0.1	39	48	410	419	403	420	0.71
4	16	0.0015	26	6.9	0.2	33	48	515	530	511	532	0.82
5	16	0.0015	26	6.9	0.2	33	48	626	641	622	643	0.82
6	16	1.2	2.1e+04	-2.5	0.1	39	48	743	752	736	753	0.71
7	16	0.0015	26	6.9	0.2	33	48	848	863	844	865	0.82
8	16	0.0015	26	6.9	0.2	33	48	959	974	955	976	0.82
9	16	0.0015	26	6.9	0.2	33	48	1070	1085	1066	1087	0.82
10	16	0.0015	26	6.9	0.2	33	48	1181	1196	1177	1198	0.82
11	16	1.2	2.1e+04	-2.5	0.1	39	48	1298	1307	1291	1308	0.71
12	16	1.2	2.1e+04	-2.5	0.1	39	48	1409	1418	1402	1419	0.71
13	16	1.2	2.1e+04	-2.5	0.1	39	48	1520	1529	1513	1530	0.71
14	16	0.0015	26	6.9	0.2	33	48	1625	1640	1621	1642	0.82
15	16	0.0015	26	6.9	0.2	33	48	1736	1751	1732	1753	0.82
16	16	0.0015	26	6.9	0.2	33	48	1847	1862	1843	1864	0.82

Sequence Information

Coding Sequence: ATGGCTCGGCCGCTCGGTCGCTCGCCCGCGGCGGCACACGCGCTTGCCTCAGCCGGGGCGCGTCCACACAGAGCGCGCAGCCTCGCGCGCCAATTCCTCGCGAGGCTGCGCGCTCTGTGTGGACGTGAGCGCGACGTGTACGGCAACGAGGTGGGCGTGTCGGCGAAGCGCGTGCCGGTGGCGTACCTGCTGGTGGACGTGCCGTGCGGCGTGGCGGGTGCCGCCCCGCCCACCTTCAACCCGCGCGCCACTTTCCCCCCCGCCAACCGCCCGCTGCACCATCAGCTGCAGACCCTGCGCGCGCTGCACGCGCAGCTGGCCAACGAGGAGTCGTTCCTGGCGGGCGTGTCCGACCTGCACGCGCTGCTGTTCCTCGCCACCAACGACGCCATGCCGCTGAGCGTGGACGCGCTGGCGCCGCTGCTGGACGCCGTGGTGGCGCGCGACGAGGCGGCGGCGGACGCGTGGCGCCGCGAGCCGCACCACGCCACGCTCGAGCACCTGGTGCACGCGTCCGCCGAGCACGACGCCGCGCCCGCGCACGTCGGCGACGCGGCGCCGGGCGGCGTGTGGACGTGCCCGCTCTGCACCTTCCACAACGCGCCGCACAGCGACGCCTGCGAGATGTGCGCCATGCCCAGGTGCGTACTCACTAGTCACTACACACACCTACAGAGACACGCGTGTGGACGTGCCCGCTCTGCACCTTCCACAACGCGCCGCACAGCGACGCCTGCGAGATGTGCGCCATGCCCAGGTGCGTACTCACTAGTCACTACACACACCTACAGAGACACGCGTGTGGACGTGCCCGCTCTGCACCTTCCACAACGCGCCGCACAGCGACGCCTGCGAGATGTGCGCCATGCCCAGTCACTACACACACCTACAGAGACACGCGTGTGGACGTGCCCGCTCTGCACCTTCCACAACGCGCCGCACAGCGACGCCTGCGAGATGTGCGCCATGCCCAGGTGCGTACTCACTAGTCACTACACACACCTACAGAGACACGCGTGTGGACGTGCCCGCTCTGCACCTTCCACAACGCGCCGCACAGCGACGCCTGCGAGATGTGCGCCATGCCCAGGTGCGTACTCACTAGTCACTACACACACCTACAGAGACACGCGTGTGGACGTGCCCGCTCTGCACCTTCCACAACGCGCCGCACAGCGACGCCTGCGAGATGTGCGCCATGCCCAGTCACTACACACACCTACAGAGACACGCGTGTCGACGTGCCCGCTCTGCACCTTCCACAACGCGCCGCACAGCGACGCCTGCGAGATGTGCGCCATGCCCAGGTGCGTACTCACTAGTCACTACACACACCTACAGAGACACGCGTGTGGACGTGCCCGCTCTGCACCTTCCACAACGCGCCGCACAGCGACGCCTGCGAGATGTGCGCCATGCCCAGGTGCGTACTCACTAGTCACTACACACACCTACAGAGACACGCGAGTGGACGTGCCCGCTCTGCACCTTCCACAACGCGCCGCACAGCGACGCCTGCGAGATGTGCGCCATGCCCAGTCACTACACACACCTACAGAGACACGCGTGTGGACGTGCCCGCTCTGCACCTTCCACAACGCGCCGCACAGCGACGCCTGCGAGATGTGCGCCATGCCCAGGTGCGTACTCACTAGTCACTACACACACCTACAGAGACACGCGTGTCGACGTGCCCGCTCTGCACCTTCCACAACGTGCCGCACAGCGACGCCTGCGAGATGTGCGCCATGCCCAGGTGCGTACTCACTAGTCACTACACACACCTACAGAGACACGCGTGTGGACGTGCCCGCTCTGCACCTTCCACAACGCGCCGCACAGCGACGCCTGCGAGATGTGCGCCATGCCCAGTCACTACACACACCTACAGAGACACGCGTGTGGACGTGCCCGCTCTGCACCTTCCACAACGCGCCGCACAGCGACGCCTGCGAGATGTGCGCCATGCCCAGGTGCGTACTCACTAGTCACTACACACACCTACAGAGACACGCGTGTCGACGTGCCCGCTCTGCACCTTCCACAACGCGCCGCACAGCGACGCCTGCGAGATGTGCGCCATGCCCAGGTGCGTACTCACTAGTCACTCCACACACCTACAGAGACACGCGTGTCGACGTGCCCGCTCTGCACCTTCCACAACGCGCCGCACAGCGACGCCTGCGAGATGTGCGCCATGCCCAGTCACTACACACACCTACAGAGACACGCGTGTCGACGTGCCCGCTCTGCACCTTCCACAACGCGCCGCACAGCGACGCCTGCGAGATGTGCGCCATGCCCAGGTGCGTACTCACTAGTCACTACACACACCTACAGAGACACGCGTGTCGACGTGCCCGCTCTGCACCTTCCACAACGCGCCGCACAGCGACGCCTGCGAGATGTGCGCCATGCCCAGGTGCGTACTCACTAGTCACTACACACACCTACAGAGACACGCGTGTCGACGTGCCCGCTCTGCACCTTCCACAACGCGCCGCACAGCGACGCCTGCGAGATGTGCGCCATGCCCAGTCACTACACACACCTACAGAGACACGCGTGTGGACGTGCCCGCTCTGCACCTTCCACAACGCGCCGCACAGCGACGCCTGCGAGATGTGCGCCATGCCCAGGTGCGTACTCACTAGTCACTACACACACCTACAGAGACACGCGTGTGGACGTGCCCGCTCTGCACCTTCCACAACGCGCCGCACAGCGACGCCTGCGAGATGTGCGCCATGCCCAGGTGCGCACTCACTAGTCACTACACACACCTACAGAGACACGCGTGTGGACGTGCCCGCTCTGCACCTTCCACAACGCGCCGCACAGCGACGCCTGCGAGATGTGCGCCATGCCCAGTCACTACACACACCTACAGAGACACGCGTGTGGACGTGCCCGCTCTGCACCTTCCACAACGCGCCGCACAGCGACGCCTGCGAGATGTGCGCCATGCCCAGGTGCGTACTCACTAGTCACTACACACACCTACAGAGACACGCGTGTGGACGTGCCCGCTCTGCACCTTCCACAACGCGCCGCACAGCGACGCCTGCGAGATGTGCGCCATGCCCAGGTGCGTACTCACTAGTCACTACACACACCTACAGAGACACGCGTGTGGACGTGCCCGCTCTGCACCTTCCACAACGCGCCGCACAGCGACGCCTGCGAGATGTGCGCCATGCCCAGTCACTACACACACCTACAGAGACACGCGTGTGGACGTGCCCGCTCTGCACCTTCCACAACGCGCCGCACAGCGACGCCTGCGAGATGTGCGCCATGCCCAGGTGCGTACTCACTAGTCACTACACACACCTACAGAGACACGCGTGTCGACGTGCCCGCTCTGCACCTTCCACAACGCGCCGCACAGCGACGCCTGCGAGATGTGCGCCATGCCCAGGTGCGTACTCACTAGTCACTACACACACCTACAGAGACACGCGTGTGGACGTGCCCGCTCTGCACCTTCCACAACGCGCCGCACAGCGACGCCTGCGAGATGTGCGCCATGCCCAGTCACTACACACACCTACAGAGACACGCGTGTGGACGTGCCCGCTCTGCACCTTCCACAACGCGCCGCACAGCGACGCCTGCGAGATGTGCGCCATGCCCAGGTGCGTACTCACTAGTCACTACACACACCTACAGAGACACGCGTGTGGACGTGCCCGCTCTGCACCTTCCACAACGCGCCGCACAGCGACGCCTGCGAGATGTGCGCCATGCCCAGGTGCGTACTCACTAGTCACTACACACACCTACAGAGACACGCGTGTCGACGTGCCCGCTCTGCACCTTCCACAACGCGCCGCACAGCGACGCCTGCGAGATGTGCGCCATGCCCAGTCACTACACACACCTACAGAGACACGCGTGTCGACGTGCCCGCTCTGCACCTTCCACAACGCGCCGCACAGCGACGCCTGCGAGATGTGCGCCATGCCCAGGTGCGTACTCACTAGTCACTACACACACCTACAGAGACACGCGTGTGGACGTGCCCGCTCTGCACCTTCCACAACGCGCCGCACAGCGACGCCTGCGAGATGTGCGCCATGCCCAGGTGCGTACTCACTAGTCACTACACACACCTACAGAGACACGCGTGTGGACGTGCCCGCTCTGCACCTTCCACAACGCGCCGCACAGCGACGCCTGCGAGATGTGCGCCATGCCCAGTCACTACACACACCTACAGAGACACGCGTGTCGACGTGCCCGCTCTGCACCTTCCACAACGCGCCGCACAGCGACGCCTGCGAGATGTGCGCCATGCCCAGGTGCGTACTCACTAGTCACTACACACACCTACAGAGACACGCGTGTGGACGTGCCCGCTCTGCACCTTCCACAACGCGCCGCACAGCGACGCCTGCGAGATGTGCGCCATGCCCAGGTGCGTACTCACTAGTCACTACACACACCTACAGAGACACGCGTGTCGACGTGCCCGCTCTGCACCTTCCACAACGCGCCGCACAGCGACGCCTGCGAGATGTGCGCCATGCCCAGTCACTACACACACCTACAGAGACACGCGTGTCGACGTGCCCGCTCTGCACCTTCCACAACGCGCCGCACAGCGACGCCTGCGAGATGTGCGCCATGCCCAGGTGCGTACTCACTAGTCACTACACACACCTACAGAGACACGCGTGTGGACGTGCCCGCTCTGCACCTTCCACAACGCGCCGCACAGCGACGCCTGCGAGATGTGCGCCATGCCCAGGTGCGTACTCACTAGTCACTACACACACCTACAGAGACACGCGTGTGGACGTGCCCGCTCTGCACCTTCCACAACGCGCCGCACAGCGACGCCTGCGAGATGTGCGCCATGCCCAGTCACTACACACACCTACAGAGACACGCGTGTGGACGTGCCCGCTCTGCACCTTCCACAACGCGCCGCACAGCGACGCCTGCGAGATGTGCGCCATGCCCAGGTGCGTACTCACTAGTCACTCCACACACCTACAGAGACACGCGTGTGGACGTGCCCGCTCTGCACCTTCCACAACGCGCCGCACAGCGACGCCTGCGAGATGTGCGCCATGCCCAGGTGCGTACTCACTAGTCACTACACACACCTACAGAGACACGCGTGTGGACGTGCCCGCTCTGCACCTTCCACAACGCGCCGCACAGCGACGCCTGCGAGATGTGCGCCATGCCCAGTCACTACACACACCTACAGAGACACGCGTGTGGACGTGCCCGCTCTGCACCTTCCACAACGCGCCGCACAGCGACGCCTGCGAGATGTGCGCCATGCCCAGGTGCGTACTCACTAGTCACTACACACACCTACAGAGACACGCGTGTGGACGTGCCCGCTCTGCACCTTCCACAACGCGCCGCACAGCGACGCCTGCGAGATGTGCGCCATGCCCAGGTGCGTACTCACTAGTCACTACACACACCTACAGAGACACGCGTGTCGACGTGCCCGCTCTGCACCTTCCACAACGCGCCGCACAGCGACGCCTGCGAGATGTGCGCCATGCCCAGTCACTACACACACCTACAGAGACACGCGTGTGGACGTGCCCGCTCTGCACCTTCCACAACGCGCCGCACAGTGACGCCTGCGAGATGTGCGCCATGCCCAGGTGCGTACTCACTAGTCACTACACACACCTACAGAGACACGCGTGTGGACGTGCCCGCTCTGCACCTTCCACAACGCGCCGCACAGTGACGCCTGCGAGATGTGCGCCATGCCCAGGTGCGTACTCACTAGTCACTACACACACCTACAGAGACACGCGTGTGGACGTGCCCGCTCTGCACCTTCCACAACGCGCCGCACAGTGA
Protein Sequence: MARPLGRSPAAAHALASAGARPHRARSLARQFLARLRALCGRERDVYGNEVGVSAKRVPVAYLLVDVPCGVAGAAPPTFNPRATFPPANRPLHHQLQTLRALHAQLANEESFLAGVSDLHALLFLATNDAMPLSVDALAPLLDAVVARDEAAADAWRREPHHATLEHLVHASAEHDAAPAHVGDAAPGGVWTCPLCTFHNAPHSDACEMCAMPRCVLTSHYTHLQRHACGRARSAPSTTRRTATPARCAPCPGAYSLVTTHTYRDTRVDVPALHLPQRAAQRRLRDVRHAQSLHTPTETRVWTCPLCTFHNAPHSDACEMCAMPRCVLTSHYTHLQRHACGRARSAPSTTRRTATPARCAPCPGAYSLVTTHTYRDTRVDVPALHLPQRAAQRRLRDVRHAQSLHTPTETRVSTCPLCTFHNAPHSDACEMCAMPRCVLTSHYTHLQRHACGRARSAPSTTRRTATPARCAPCPGAYSLVTTHTYRDTRVDVPALHLPQRAAQRRLRDVRHAQSLHTPTETRVWTCPLCTFHNAPHSDACEMCAMPRCVLTSHYTHLQRHACRRARSAPSTTCRTATPARCAPCPGAYSLVTTHTYRDTRVDVPALHLPQRAAQRRLRDVRHAQSLHTPTETRVWTCPLCTFHNAPHSDACEMCAMPRCVLTSHYTHLQRHACRRARSAPSTTRRTATPARCAPCPGAYSLVTPHTYRDTRVDVPALHLPQRAAQRRLRDVRHAQSLHTPTETRVSTCPLCTFHNAPHSDACEMCAMPRCVLTSHYTHLQRHACRRARSAPSTTRRTATPARCAPCPGAYSLVTTHTYRDTRVDVPALHLPQRAAQRRLRDVRHAQSLHTPTETRVWTCPLCTFHNAPHSDACEMCAMPRCVLTSHYTHLQRHACGRARSAPSTTRRTATPARCAPCPGAHSLVTTHTYRDTRVDVPALHLPQRAAQRRLRDVRHAQSLHTPTETRVWTCPLCTFHNAPHSDACEMCAMPRCVLTSHYTHLQRHACGRARSAPSTTRRTATPARCAPCPGAYSLVTTHTYRDTRVDVPALHLPQRAAQRRLRDVRHAQSLHTPTETRVWTCPLCTFHNAPHSDACEMCAMPRCVLTSHYTHLQRHACRRARSAPSTTRRTATPARCAPCPGAYSLVTTHTYRDTRVDVPALHLPQRAAQRRLRDVRHAQSLHTPTETRVWTCPLCTFHNAPHSDACEMCAMPRCVLTSHYTHLQRHACGRARSAPSTTRRTATPARCAPCPGAYSLVTTHTYRDTRVDVPALHLPQRAAQRRLRDVRHAQSLHTPTETRVSTCPLCTFHNAPHSDACEMCAMPRCVLTSHYTHLQRHACGRARSAPSTTRRTATPARCAPCPGAYSLVTTHTYRDTRVDVPALHLPQRAAQRRLRDVRHAQSLHTPTETRVSTCPLCTFHNAPHSDACEMCAMPRCVLTSHYTHLQRHACGRARSAPSTTRRTATPARCAPCPGAYSLVTTHTYRDTRVDVPALHLPQRAAQRRLRDVRHAQSLHTPTETRVSTCPLCTFHNAPHSDACEMCAMPRCVLTSHYTHLQRHACGRARSAPSTTRRTATPARCAPCPGAYSLVTTHTYRDTRVDVPALHLPQRAAQRRLRDVRHAQSLHTPTETRVWTCPLCTFHNAPHSDACEMCAMPRCVLTSHSTHLQRHACGRARSAPSTTRRTATPARCAPCPGAYSLVTTHTYRDTRVDVPALHLPQRAAQRRLRDVRHAQSLHTPTETRVWTCPLCTFHNAPHSDACEMCAMPRCVLTSHYTHLQRHACGRARSAPSTTRRTATPARCAPCPGAYSLVTTHTYRDTRVDVPALHLPQRAAQRRLRDVRHAQSLHTPTETRVWTCPLCTFHNAPHSDACEMCAMPRCVLTSHYTHLQRHACGRARSAPSTTRRTVTPARCAPCPGAYSLVTTHTYRDTRVDVPALHLPQRAAQ

Similar Transcription Factors

Sequence clustering based on sequence similarity using MMseqs2

100% Identity: -
90% Identity: -
80% Identity: -