Basic Information

Insect: Monochamus alternatus
Gene Symbol: -
Assembly: GCA_037114965.1
Location: CM073434.1:43527084-43543312[-]

Transcription Factor Domain

TF Family: zf-C2H2
Domain: zf-C2H2 domain
PFAM: PF00096
TF Group: Zinc-Coordinating Group
Description: The C2H2 zinc finger is the classical zinc finger domain. The two conserved cysteines and histidines co-ordinate a zinc ion. The following pattern describes the zinc finger. #-X-C-X(1-5)-C-X3-#-X5-#-X2-H-X(3-6)-[H/C] Where X can be any amino acid, and numbers in brackets indicate the number of residues. The positions marked # are those that are important for the stable fold of the zinc finger. The final position can be either his or cys. The C2H2 zinc finger is composed of two short beta strands followed by an alpha helix. The amino terminal part of the helix binds the major groove in DNA binding zinc fingers. The accepted consensus binding sequence for Sp1 is usually defined by the asymmetric hexanucleotide core GGGCGG but this sequence does not include, among others, the GAG (=CTC) repeat that constitutes a high-affinity site for Sp1 binding to the wt1 promoter [1].
Hmmscan Out: # of c-Evalue i-Evalue score bias hmm coord from hmm coord to ali coord from ali coord to env coord from env coord to acc

1 41 0.023 1.7 10.8 3.5 1 23 188 210 188 210 0.99

2 41 0.036 2.6 10.1 1.5 1 23 219 241 219 241 0.99

3 41 0.59 43 6.3 4.3 1 23 250 272 250 272 0.97

4 41 0.017 1.2 11.2 3.7 1 23 281 303 281 303 0.98

5 41 2.3 1.7e+02 4.4 9.3 1 23 308 330 308 330 0.98

6 41 0.027 2 10.5 2.8 1 23 339 362 339 362 0.97

7 41 0.013 0.91 11.6 3.3 1 23 371 394 371 394 0.96

8 41 8.5 6.2e+02 2.7 9.4 1 23 403 425 403 425 0.99

9 41 0.0032 0.23 13.4 2.8 1 23 434 456 434 456 0.99

10 41 0.061 4.4 9.4 4.0 1 23 465 488 465 488 0.97

11 41 0.0094 0.68 12.0 2.2 1 23 497 519 497 519 0.99

12 41 0.04 2.9 10.0 4.2 1 23 528 550 528 550 0.99

13 41 0.012 0.9 11.6 2.8 1 23 559 581 559 581 0.99

14 41 0.31 23 7.2 0.8 1 20 590 609 590 611 0.96

15 41 0.012 0.86 11.6 1.1 1 23 689 711 689 711 0.99

16 41 0.23 17 7.6 8.4 1 23 720 742 720 742 0.98

17 41 1 74 5.6 4.2 1 23 747 769 747 769 0.98

18 41 1.1 80 5.4 5.5 1 23 778 800 778 800 0.99

19 41 0.0072 0.52 12.3 2.5 1 23 805 828 805 828 0.97

20 41 0.011 0.8 11.7 2.0 1 23 837 859 837 859 0.99

21 41 0.13 9.1 8.4 1.1 1 23 868 891 868 891 0.97

22 41 0.00069 0.05 15.5 2.9 1 23 900 922 900 922 0.98

23 41 0.00093 0.067 15.1 1.8 1 23 931 954 931 954 0.97

24 41 0.036 2.6 10.1 3.5 1 23 963 985 963 985 0.98

25 41 0.13 9.1 8.4 1.1 1 23 994 1017 994 1017 0.97

26 41 0.022 1.6 10.8 0.4 1 23 1026 1048 1026 1048 0.98

27 41 0.0046 0.33 12.9 2.1 1 23 1057 1080 1057 1080 0.97

28 41 0.0014 0.1 14.6 4.7 1 23 1089 1111 1089 1111 0.99

29 41 0.15 11 8.2 0.8 1 23 1225 1247 1225 1247 0.99

30 41 3 2.2e+02 4.1 7.8 1 23 1256 1278 1256 1278 0.98

31 41 0.049 3.5 9.7 3.3 1 23 1283 1305 1283 1305 0.97

32 41 0.0081 0.59 12.2 5.3 1 23 1314 1336 1314 1336 0.98

33 41 0.77 55 5.9 3.6 1 23 1345 1367 1345 1367 0.98

34 41 0.2 15 7.8 2.3 1 23 1376 1399 1376 1399 0.95

35 41 0.013 0.96 11.5 5.5 1 23 1408 1430 1408 1430 0.98

36 41 0.13 9.3 8.4 0.8 1 23 1439 1462 1439 1462 0.96

37 41 0.0057 0.41 12.7 2.6 1 23 1471 1493 1471 1493 0.99

38 41 0.026 1.9 10.6 4.8 1 23 1502 1525 1502 1525 0.97

39 41 0.0032 0.23 13.4 3.1 1 23 1534 1556 1534 1556 0.98

40 41 0.0034 0.25 13.4 3.9 1 23 1585 1608 1585 1608 0.97

41 41 1.3 94 5.2 7.6 1 23 1617 1639 1617 1639 0.98

#	of	c-Evalue	i-Evalue	score	bias	hmm coord from	hmm coord to	ali coord from	ali coord to	env coord from	env coord to	acc
1	41	0.023	1.7	10.8	3.5	1	23	188	210	188	210	0.99
2	41	0.036	2.6	10.1	1.5	1	23	219	241	219	241	0.99
3	41	0.59	43	6.3	4.3	1	23	250	272	250	272	0.97
4	41	0.017	1.2	11.2	3.7	1	23	281	303	281	303	0.98
5	41	2.3	1.7e+02	4.4	9.3	1	23	308	330	308	330	0.98
6	41	0.027	2	10.5	2.8	1	23	339	362	339	362	0.97
7	41	0.013	0.91	11.6	3.3	1	23	371	394	371	394	0.96
8	41	8.5	6.2e+02	2.7	9.4	1	23	403	425	403	425	0.99
9	41	0.0032	0.23	13.4	2.8	1	23	434	456	434	456	0.99
10	41	0.061	4.4	9.4	4.0	1	23	465	488	465	488	0.97
11	41	0.0094	0.68	12.0	2.2	1	23	497	519	497	519	0.99
12	41	0.04	2.9	10.0	4.2	1	23	528	550	528	550	0.99
13	41	0.012	0.9	11.6	2.8	1	23	559	581	559	581	0.99
14	41	0.31	23	7.2	0.8	1	20	590	609	590	611	0.96
15	41	0.012	0.86	11.6	1.1	1	23	689	711	689	711	0.99
16	41	0.23	17	7.6	8.4	1	23	720	742	720	742	0.98
17	41	1	74	5.6	4.2	1	23	747	769	747	769	0.98
18	41	1.1	80	5.4	5.5	1	23	778	800	778	800	0.99
19	41	0.0072	0.52	12.3	2.5	1	23	805	828	805	828	0.97
20	41	0.011	0.8	11.7	2.0	1	23	837	859	837	859	0.99
21	41	0.13	9.1	8.4	1.1	1	23	868	891	868	891	0.97
22	41	0.00069	0.05	15.5	2.9	1	23	900	922	900	922	0.98
23	41	0.00093	0.067	15.1	1.8	1	23	931	954	931	954	0.97
24	41	0.036	2.6	10.1	3.5	1	23	963	985	963	985	0.98
25	41	0.13	9.1	8.4	1.1	1	23	994	1017	994	1017	0.97
26	41	0.022	1.6	10.8	0.4	1	23	1026	1048	1026	1048	0.98
27	41	0.0046	0.33	12.9	2.1	1	23	1057	1080	1057	1080	0.97
28	41	0.0014	0.1	14.6	4.7	1	23	1089	1111	1089	1111	0.99
29	41	0.15	11	8.2	0.8	1	23	1225	1247	1225	1247	0.99
30	41	3	2.2e+02	4.1	7.8	1	23	1256	1278	1256	1278	0.98
31	41	0.049	3.5	9.7	3.3	1	23	1283	1305	1283	1305	0.97
32	41	0.0081	0.59	12.2	5.3	1	23	1314	1336	1314	1336	0.98
33	41	0.77	55	5.9	3.6	1	23	1345	1367	1345	1367	0.98
34	41	0.2	15	7.8	2.3	1	23	1376	1399	1376	1399	0.95
35	41	0.013	0.96	11.5	5.5	1	23	1408	1430	1408	1430	0.98
36	41	0.13	9.3	8.4	0.8	1	23	1439	1462	1439	1462	0.96
37	41	0.0057	0.41	12.7	2.6	1	23	1471	1493	1471	1493	0.99
38	41	0.026	1.9	10.6	4.8	1	23	1502	1525	1502	1525	0.97
39	41	0.0032	0.23	13.4	3.1	1	23	1534	1556	1534	1556	0.98
40	41	0.0034	0.25	13.4	3.9	1	23	1585	1608	1585	1608	0.97
41	41	1.3	94	5.2	7.6	1	23	1617	1639	1617	1639	0.98

Sequence Information

Coding Sequence: ATGGAAGGTCTATCGAATATCAAATGTGAAGATTTGAAAATCAAATCTGGAGAGAATTATAGTGATACCAACTTAGAGAATTTAAAAGATGAACTTATCGACTGCACTCACATAAGTCTATTAGGGAACTGCTTGAGTGCAAAGGAGGAGATTAAAGATATTTGTGACGACAGTATAGAAATTTTATCCAGTATTAAGTGTGAAGATATTGAAATCAAATCGGAAGAGAATTATAGTGATGCCAGCTTACCGAATTTAAAAGATGAACCTGTCGACTGCACCGGCACAAGTTTATTAACGAACTGTTTGAGTACGAAGGAGGAAATTAAAGGTATATGTGAGGACAACGCCATAGAAAGCTTGTCCAGTATTAAATGTGAAGATATTGAAATCAAATCGGAAGAGAATTATAGTGACACTTCCTTACAAAACTCGAAAGATGGGTCTGACGATTGCACGAttgaaaaaaagaataattttactTTGAAGTGCAAAAGGAAGCAATATGATTCAGAAGACAAATACTACGAGTTAAACGACAGAGTCTTTGAAAAGGAGATGTACAAATGTAACGCTTGTGACTATAAAACTAATCAGAAGaggtattttattaaacatcagcTTAGACATGAGGATGTCTCTGAAGAACggatgtataaatgtgatttgtgtgattataaaaccgtTTATGACAACGCTTTTACACGACATCAGCTAAGACACAGAGACATACCCGagaagagaatatttaaatgtaaatccTGTGATTACGAAACATTTTATAAACCTAATTTTAAAAACCATAAGCTGAAACACAAAGACGTGCCTGAGGAGcagatgtttaaatgtgattcgtgcgattataaaaccatttataacAGCTACTTTACAAAACATCAATTAAAACACAACACGCGGATGTATGAATGTGATTCATGTGATTTTAAAAGTATCCATAAGCACAGTTTTAAACATCATCAGCAAAAACACGAGAACATCAGTGAAGATCAAATGTATAAGTGTGAATCGTGcgattataaaaccatttataagaaTTATCTTACACAACATCAGTTAAGACGGCACAAGGACTTTCCTAAAGCGCAGATGTATGAATGCGGtttgtgtgattttaaaacaaaatataagttCAACCTTACAAAACACCAGTACATGAAACATAAAGATATCCCCGAAGAAGatatgtataaatgtgattccTGTGATTTTAAAACTGTCTACAAGTACCGTTTTACGCATCATCACCGAAAACATCAGAACATCAGTGAAGATCAAATGTATAAGTGTGATtcatgtgattataaaaccatttataagaGTTATCTAACACAACATCAATTAAAGCACAAATACATTCCTAAAGCGCAGATGTATCGATGCGATTCGTGTGATTTTAAAGCGAAATACAAGAAAAACCTTAAACAACATCAGTCAAAGAAACATAAAGATATTCCCGAAGAAGatatgtataaatgtgattcgtgtgattttaaaacaatttataaaagcTATCTTATACAACATCAGTTAAAACACAAAGACATTTATAAAACCCAGATGTATCAATGTGATTCGTGTGATTTCAAAACTGTCTACAAATACAGTTTTACACAGCATCAGAAAAAACATGAGAACATCAGTGAAGATCAAATGTATAAGTGTGATtcatgtgattataaaaccatttataagacTTATCTCACACAACATCAGTTAAGACACAAAGACATTCCTAAAGCGCAGATGTAtcaatgtgatttgtgtgaGTTTAGAACGAAATATAAGAGAAACATTAGACAACATCAGGAGGAAGTTGAAGATGTCGATTACGGCCAAGCCACAGAAAGTCCGCCTGATATTAAACATGAAAATGTCGAAATCAAATCTGAAGAGATATATATAAGTGACACCATCTTGAAAGATGAACCCACTGAAGACACACCTGAATATGTACAAACAACGAATAATTTTACGGTCAAGGGCAAAAGGAAGCGACAAGGGTTGAAGGAAGAATACCGTGAGTTAAAATGTAGGAACTATACATATAAATGTGATTTCTGTGAATATGAGAGCGATCAAATCAAAAGTCTGGCACGACATCAGCGGAGACATAAAGAAATATCAGAAAAACAGTGGTATCACTGTCATTTATGCGATTATAAGTCTGATCATAAAGGAAACTTCACACAACACCAGCTTAAACACAAAAAACCAAAGTATAAGTGTGATtcatgtgattataaaaccaatTATAAAAAACGTCTTGCAGAACATCATTTGAGACATACGGGCGTCCCCGAAGATcagatgtataaatgtgattcatgtgattataaaaccatcTATAAGAACTGCTTTATGCAGCATCAGTTGAAACACAAAGAGCAGATGTATGAATGTGATTCGTGtgattttaaaacgaaatataagaCCAACCTTACGCAACATCAGCTCATGAAACACAAAAATATCCCCGAAGAAGatatgtataaatgtgattcgtGTGAGTTTAAAACGATTTATAAGAGCGGTCTTACACGACATCAGTTAAAACACAGAGACGTTCTCAAAGCGCAGATGTATgaatgtgatttgtgtgattttaaaacgaaatataagaACAACCTTGTACCACATCAGTTAACGAAACATAAAAATATCCCCGAAGAAGatatgtataaatgtgatttgtgtgattataaaaccatttataagaGCCATCTTGCACGACATCAGTTAAACCACAAAGACTTTCCCGGAGCGCAGATGTATGAATGCGAtttgtgtgattttaaaacaaaatataaggaCAACCTTACAACACATCAGTTaatgaaacataaaaatatcCCCGAAGAGGATATGCATAAGTGTGATTCCTGTGACTTTAAAAGCATTTATAAGAGCGGTCTTACACGACATCAGTTAAAACACAGAGACGTTCTCAAAGCGCAGATGTATgaatgtgatttgtgtgattttaaaacgaaatataagaACAACCTTGTACCACATCAGTTAACGAAACATAAAAATATCCCGGAAGAAGatatgtataaatgtgattcgtgtgattataaaaccatttataagaTTAGCCTTGCACAACATCAAATAATACACAAAGATATCGCAGAAGTGCAGATGTATGAATGTGACTCGTGTGATTTTAAAACCAAATATAAAGGGAACCTTATGAAACACCAGTCTATGAAACATAAAGATATCCCCGAAGAAGatatgtataaatgtgatttgtgtgattttaaaacCGTTAATAAGAGGCATCTCACACGACATCAGTTAAAACACAAAGCGCAGATAGACGTTCGtttacagaatttaaaaaatgaacccgTTGACTGTATTCACACAAGTCTGTTAACGAACTGCTTAAATGTGAAGGAGGAAAGTGAAGATATTTGTGAGGATAACGCCAGAAAAGATTCGTCCAGTATTAACTTTGAATATGTTGAAATCAAATCGGAAGAGGATCATAGTGGCAACCTCTTGAATGATGAACCGATAAGTGAATGCACATGCAAAGGTGCAAAAACAACAAATGATTCTTTGCTTCAACGCAAAAGGAAGCAGCGTGGGTCAAAGAACAAATACCATGGGTTAAAATACAACTCTTCCCGAGTCCAGAAATATAAATGTGATTTCTGTGCATATGAGAGTGATCAAATCAAAAGTCTTGCACGACATCAACAGAGACACAAAGACATGCCAGAAAAACAGATGTATCACTGTCATTCATGTGATTATAAGTCCGATCAAACAGAAAACTTCATACACCATCAGCTTAAACACAAAAAACAGATGTATAAGTGTGATTTGTGTGACTTTAAAACCTATTATAAAAACTACCTTACACAACATCAGTTACAGCATAAGGACATCCCTGAAGATCAGATGTATAGATGTGATTCATGcgattataaaacttatcgaaAGCAAAATCTTAACCACCATCAGTTAAGACACAAGAACATACCCGAAAAACGGATGTATAAGTGTGATTCATGTAATTacaaaaccatttataagaACTATTTTTCACAACATCAGTTACAACACAAAGACGTTCTCAAAGTGCAGATGTATGAATGTTATTCATGTGActttaaaactatttataagACCAACCTTACACAACATCTGTCAAATAAACATAAAGATATTCCTGAAGAAGATATGCATAAGTGTGATTCATGcgattataaaactatttacaagAGCCATCTTGCGCGACATCAGTTAAAACACAAAGACGTTCCCAAAGCGCAGATGTATGAATGCAATTTGTGCGATTTTAAAACGAAGTATAAGGCCAGCCTTACACCACATCAGTtagtaaaacataaaattatccCCAAAGAGGATCTGTATAAATGTGATTCATGTGATTTTACAACCATGTATAAGAGCTATCTTATACGACATCAGTTAAAACACGAAGACGATCTCAAAGCTCAGATGTATAGCTGCGATTTGTGTcattttaaaacgaaatataagaGCAACCTCATACAACACCGGTCTATGAAACATAAAAATGCCCCCGAAGAAGATCTGTATAAATGTGCttcgtgtgattataaaaccagttaTAAGAGCTATCTATCGCGACATCAGTTAAAACACAAAGACGTAATTCGTAAAACGAAACATAAGACCAATCTTATATCCCAGCCAACGAAACATAAAGATATCCTCAAAGAAGATATGTATAAATGCAAtttgtgtgattttaaaacgaaatataagaACAACCTTACACAACACCAGTCCATGAAACACAAAAATATCCCCGAAGAAGATACGCATAAGTGTGATTCATGTGATTTTAAAACCGTTTATAAGAGGTGTCTTACAAGACATCAGTTAAAACACAAAAACATTCTCGAAGTGcagaataaaacaaaataccAATCGTGCGCAACACCAATCCTTGAAACGTAA
Protein Sequence: MEGLSNIKCEDLKIKSGENYSDTNLENLKDELIDCTHISLLGNCLSAKEEIKDICDDSIEILSSIKCEDIEIKSEENYSDASLPNLKDEPVDCTGTSLLTNCLSTKEEIKGICEDNAIESLSSIKCEDIEIKSEENYSDTSLQNSKDGSDDCTIEKKNNFTLKCKRKQYDSEDKYYELNDRVFEKEMYKCNACDYKTNQKRYFIKHQLRHEDVSEERMYKCDLCDYKTVYDNAFTRHQLRHRDIPEKRIFKCKSCDYETFYKPNFKNHKLKHKDVPEEQMFKCDSCDYKTIYNSYFTKHQLKHNTRMYECDSCDFKSIHKHSFKHHQQKHENISEDQMYKCESCDYKTIYKNYLTQHQLRRHKDFPKAQMYECGLCDFKTKYKFNLTKHQYMKHKDIPEEDMYKCDSCDFKTVYKYRFTHHHRKHQNISEDQMYKCDSCDYKTIYKSYLTQHQLKHKYIPKAQMYRCDSCDFKAKYKKNLKQHQSKKHKDIPEEDMYKCDSCDFKTIYKSYLIQHQLKHKDIYKTQMYQCDSCDFKTVYKYSFTQHQKKHENISEDQMYKCDSCDYKTIYKTYLTQHQLRHKDIPKAQMYQCDLCEFRTKYKRNIRQHQEEVEDVDYGQATESPPDIKHENVEIKSEEIYISDTILKDEPTEDTPEYVQTTNNFTVKGKRKRQGLKEEYRELKCRNYTYKCDFCEYESDQIKSLARHQRRHKEISEKQWYHCHLCDYKSDHKGNFTQHQLKHKKPKYKCDSCDYKTNYKKRLAEHHLRHTGVPEDQMYKCDSCDYKTIYKNCFMQHQLKHKEQMYECDSCDFKTKYKTNLTQHQLMKHKNIPEEDMYKCDSCEFKTIYKSGLTRHQLKHRDVLKAQMYECDLCDFKTKYKNNLVPHQLTKHKNIPEEDMYKCDLCDYKTIYKSHLARHQLNHKDFPGAQMYECDLCDFKTKYKDNLTTHQLMKHKNIPEEDMHKCDSCDFKSIYKSGLTRHQLKHRDVLKAQMYECDLCDFKTKYKNNLVPHQLTKHKNIPEEDMYKCDSCDYKTIYKISLAQHQIIHKDIAEVQMYECDSCDFKTKYKGNLMKHQSMKHKDIPEEDMYKCDLCDFKTVNKRHLTRHQLKHKAQIDVRLQNLKNEPVDCIHTSLLTNCLNVKEESEDICEDNARKDSSSINFEYVEIKSEEDHSGNLLNDEPISECTCKGAKTTNDSLLQRKRKQRGSKNKYHGLKYNSSRVQKYKCDFCAYESDQIKSLARHQQRHKDMPEKQMYHCHSCDYKSDQTENFIHHQLKHKKQMYKCDLCDFKTYYKNYLTQHQLQHKDIPEDQMYRCDSCDYKTYRKQNLNHHQLRHKNIPEKRMYKCDSCNYKTIYKNYFSQHQLQHKDVLKVQMYECYSCDFKTIYKTNLTQHLSNKHKDIPEEDMHKCDSCDYKTIYKSHLARHQLKHKDVPKAQMYECNLCDFKTKYKASLTPHQLVKHKIIPKEDLYKCDSCDFTTMYKSYLIRHQLKHEDDLKAQMYSCDLCHFKTKYKSNLIQHRSMKHKNAPEEDLYKCASCDYKTSYKSYLSRHQLKHKDVIRKTKHKTNLISQPTKHKDILKEDMYKCNLCDFKTKYKNNLTQHQSMKHKNIPEEDTHKCDSCDFKTVYKRCLTRHQLKHKNILEVQNKTKYQSCATPILET

Similar Transcription Factors

Sequence clustering based on sequence similarity using MMseqs2

100% Identity: -
90% Identity: -
80% Identity: -