Basic Information

Insect: Anoplophora glabripennis
Gene Symbol: -
Assembly: GCA_000390285.2
Location: NW:252905-353355[-]

Transcription Factor Domain

TF Family: zf-C2H2
Domain: zf-C2H2 domain
PFAM: PF00096
TF Group: Zinc-Coordinating Group
Description: The C2H2 zinc finger is the classical zinc finger domain. The two conserved cysteines and histidines co-ordinate a zinc ion. The following pattern describes the zinc finger. #-X-C-X(1-5)-C-X3-#-X5-#-X2-H-X(3-6)-[H/C] Where X can be any amino acid, and numbers in brackets indicate the number of residues. The positions marked # are those that are important for the stable fold of the zinc finger. The final position can be either his or cys. The C2H2 zinc finger is composed of two short beta strands followed by an alpha helix. The amino terminal part of the helix binds the major groove in DNA binding zinc fingers. The accepted consensus binding sequence for Sp1 is usually defined by the asymmetric hexanucleotide core GGGCGG but this sequence does not include, among others, the GAG (=CTC) repeat that constitutes a high-affinity site for Sp1 binding to the wt1 promoter [1].
Hmmscan Out: # of c-Evalue i-Evalue score bias hmm coord from hmm coord to ali coord from ali coord to env coord from env coord to acc

1 32 0.0071 0.22 11.8 1.9 1 23 393 415 393 415 0.98

2 32 0.013 0.4 11.0 2.8 1 23 424 446 424 446 0.98

3 32 0.48 15 6.0 2.2 1 23 455 477 455 477 0.97

4 32 0.0017 0.052 13.7 3.7 1 23 486 508 486 508 0.97

5 32 0.0013 0.04 14.1 4.0 1 23 517 539 517 539 0.98

6 32 0.00051 0.016 15.4 4.4 1 23 548 570 548 570 0.98

7 32 0.049 1.5 9.1 1.7 1 23 579 601 579 601 0.96

8 32 0.0013 0.04 14.1 0.7 1 23 610 632 610 632 0.96

9 32 0.0012 0.036 14.2 1.5 1 23 641 663 641 663 0.98

10 32 0.0091 0.28 11.4 3.1 1 23 672 694 672 694 0.99

11 32 0.0019 0.058 13.6 3.7 1 23 703 725 703 725 0.98

12 32 0.024 0.73 10.1 3.1 1 23 734 756 734 756 0.97

13 32 0.0025 0.076 13.2 1.4 1 23 765 787 765 787 0.98

14 32 0.0057 0.18 12.1 1.0 1 23 796 818 796 818 0.98

15 32 0.0083 0.25 11.6 0.6 1 23 827 849 827 849 0.96

16 32 0.27 8.4 6.8 4.0 1 23 858 880 858 880 0.97

17 32 0.045 1.4 9.3 1.2 1 23 889 911 889 911 0.93

18 32 0.4 12 6.3 1.2 1 23 920 942 920 942 0.95

19 32 0.0067 0.21 11.9 2.9 1 23 951 973 951 973 0.98

20 32 0.18 5.6 7.3 4.5 1 23 982 1004 982 1004 0.97

21 32 0.011 0.33 11.2 1.9 1 23 1013 1035 1013 1035 0.96

22 32 0.0013 0.04 14.1 2.2 1 23 1044 1066 1044 1066 0.97

23 32 0.35 11 6.4 4.8 1 23 1075 1097 1075 1097 0.97

24 32 0.012 0.37 11.1 1.6 1 23 1106 1128 1106 1128 0.96

25 32 0.007 0.21 11.8 2.7 1 23 1137 1159 1137 1159 0.96

26 32 0.0002 0.0061 16.7 0.7 1 23 1167 1189 1167 1189 0.99

27 32 0.0085 0.26 11.5 1.9 1 23 1198 1220 1198 1220 0.98

28 32 0.00012 0.0036 17.4 0.9 1 23 1229 1251 1229 1251 0.97

29 32 0.0033 0.1 12.8 2.0 1 23 1260 1282 1260 1282 0.98

30 32 0.012 0.36 11.1 1.6 1 23 1291 1313 1291 1313 0.97

31 32 0.23 7.1 7.0 1.7 1 23 1322 1344 1322 1344 0.96

32 32 0.024 0.73 10.1 7.1 1 23 1353 1375 1353 1375 0.97

#	of	c-Evalue	i-Evalue	score	bias	hmm coord from	hmm coord to	ali coord from	ali coord to	env coord from	env coord to	acc
1	32	0.0071	0.22	11.8	1.9	1	23	393	415	393	415	0.98
2	32	0.013	0.4	11.0	2.8	1	23	424	446	424	446	0.98
3	32	0.48	15	6.0	2.2	1	23	455	477	455	477	0.97
4	32	0.0017	0.052	13.7	3.7	1	23	486	508	486	508	0.97
5	32	0.0013	0.04	14.1	4.0	1	23	517	539	517	539	0.98
6	32	0.00051	0.016	15.4	4.4	1	23	548	570	548	570	0.98
7	32	0.049	1.5	9.1	1.7	1	23	579	601	579	601	0.96
8	32	0.0013	0.04	14.1	0.7	1	23	610	632	610	632	0.96
9	32	0.0012	0.036	14.2	1.5	1	23	641	663	641	663	0.98
10	32	0.0091	0.28	11.4	3.1	1	23	672	694	672	694	0.99
11	32	0.0019	0.058	13.6	3.7	1	23	703	725	703	725	0.98
12	32	0.024	0.73	10.1	3.1	1	23	734	756	734	756	0.97
13	32	0.0025	0.076	13.2	1.4	1	23	765	787	765	787	0.98
14	32	0.0057	0.18	12.1	1.0	1	23	796	818	796	818	0.98
15	32	0.0083	0.25	11.6	0.6	1	23	827	849	827	849	0.96
16	32	0.27	8.4	6.8	4.0	1	23	858	880	858	880	0.97
17	32	0.045	1.4	9.3	1.2	1	23	889	911	889	911	0.93
18	32	0.4	12	6.3	1.2	1	23	920	942	920	942	0.95
19	32	0.0067	0.21	11.9	2.9	1	23	951	973	951	973	0.98
20	32	0.18	5.6	7.3	4.5	1	23	982	1004	982	1004	0.97
21	32	0.011	0.33	11.2	1.9	1	23	1013	1035	1013	1035	0.96
22	32	0.0013	0.04	14.1	2.2	1	23	1044	1066	1044	1066	0.97
23	32	0.35	11	6.4	4.8	1	23	1075	1097	1075	1097	0.97
24	32	0.012	0.37	11.1	1.6	1	23	1106	1128	1106	1128	0.96
25	32	0.007	0.21	11.8	2.7	1	23	1137	1159	1137	1159	0.96
26	32	0.0002	0.0061	16.7	0.7	1	23	1167	1189	1167	1189	0.99
27	32	0.0085	0.26	11.5	1.9	1	23	1198	1220	1198	1220	0.98
28	32	0.00012	0.0036	17.4	0.9	1	23	1229	1251	1229	1251	0.97
29	32	0.0033	0.1	12.8	2.0	1	23	1260	1282	1260	1282	0.98
30	32	0.012	0.36	11.1	1.6	1	23	1291	1313	1291	1313	0.97
31	32	0.23	7.1	7.0	1.7	1	23	1322	1344	1322	1344	0.96
32	32	0.024	0.73	10.1	7.1	1	23	1353	1375	1353	1375	0.97

Sequence Information

Coding Sequence: ATGGACAATAAAAAGGAATATCTGTGCAGACTGTGTCTTAGTGCaatatgtgatgaaaatttcgAAGTGATAAACGaaattactacaaaaaacttAGAGATGATCTTACCAAACACAAATTTGGAGGTAAGCGAAAAGCCAGTGATGTGTAATATTTGTTCCGATAGACTCAAAGATGCATTCAGTTTTAAGTCTGCCTGCCTTAGTAACAGTAACTGCGCGAGTGTCGTGGAAAACGTACCCAAAATTAAAGTGGAATGTTCTGATGAAAATATTTGTGACAGTAAATCTTTTgatgagaaaaaatgttttctgtgtGTGCAGTTGATAGTTGACCATCCTATCTCATTAGCTGCAGAAGGAGAGGAAATTAGTTCGGCTAGAAATATGATCCAGAAATATATACCCGAGATGgaCTTAAAAGACAAGAACCCTGTGATTTGCGAAACCTGCCACCAAAGCGTTCAACAAATTTGCAACTTCCTCCAAAGCTGCATGgatgtagaagaaaaaataatggaCTTTCGTAAACGTAAAGAAAAAGACATTACGTTTATCGATTTAAAGGACGTGATACAATTTTCATCGGAAGAACAGGAGGAAGGTCTGAAACAAAACGAGATGTGTGGCCCAGAAACGAATGTGCCTGAAAGTAACATTAAAACGGAGGCTTTCATGGAAGCTGACTATTTGAATGTGTGCATTAAAACCGAAGAGCCCAGCAACGATGAAATAGAAATTGAACCCGAGGAACAGATCACACTGAAtgaaaatatcaatatcaaGAATGAGGAAGTCGATGTTAAATTGGAAGTAACTTACAGTGAAAGCGCCACGTCAGTACCCTGCACGGACGTCTTGTTAGAGGAAAGCAACGATGTGTGGGACATCCTCAGAGAAGAGAGCCACAATTTTTCAGAAGAAGAAGGCAACTCACACAGAAAGAGAAGTAGCTCATCTTTAGACTTTTTACCTGTTTCAACAGCTATGAAGATCCGGTGCGGGTCGTGCAGGAAAATCGTGAAAAGCGGCCCTAACTTCATGCACTCGAAGATCTTCTTTCGAGACACAGTCCTCGACAACACCTCCTATAAGTGCGAGACTTGTAAACGCGAAACCGTTGACTCGCTCTACTCGCCTAACCTAACCTATAACAATCGTTTTGAAGCGGTGAAGTTCAAATGtagtatatgtatgtatgagACAAAATACCGCAGTGCTCTCAAGTCTCATATGTTGAAACATAAAGACAGGTCGGaagttaaaatgtataaatgcGACTACTGTAACTATGAAACCAGACACAAAACGGCATTGAAACCCCACATTTTGAAACACCAGGATCCATCGCAAGTTGAGATGTTCCACTGCGACTCCTGCGAATATCAGACAAGATACAAACCTGCTCTGAAGTCTCATCTGCTCAACCACAAAGACCCGTCGGAGATCAACATGCATTCTTGCGACATGTGCGATTACAACACAAGGTTCAAAAGTTCCCTCAACTCGCATATGCTCAAGCATATGGACCCGTCGGAGATTCAGATGTTTAAATGCGAGATCTGCACCTATGAGACTAAACATAAAACGTCGTTAAAGTCTCATATGCTTAACCATAAAGATCCGTCAGAGGTGAAGATGCATAAATGCGAAGAGTGTGACTACAACACTAAGTTTAAGAGTTCCTTGAAGTCACACATGCTAAAGCACAAAGATTCTTCTGAAATTCACATGTATAAGTGCGACTCCTGCGAATATGAGACTAGACATAAAAGCGCGTTGGCGTCTCACAGTTTAAACCACAAAGACAACTCTGAGGTGCCACTTTATCTGTGCAACTTGTGCCCTTACGAGACCAAGCGAAGGGCCAACTACAAATTGCACATCATGACCCATAAAGACCCCtcagaaatccaaatgtacacATGCGAGACATGCGGATACAGCACCAAGTACAAAAGCGTCCTCAAATCTCACAAATTAATTCACCAGGATCCGTCAGAAGTGGAAATGTACCGGTGCCACCTGTGCGACTACGAAACCAGACGGaggcaaaatataaaaatgcacGTTCTGACACATATGGACCCCTCCGAAATTCCCATGTACACGTGCGACCACTGCGAGTACAAAACCAAGTACAAGAGTGCTCTCAAGTCGCATCTTCTAAACCACAAAGATCCCTCCGAAATACAAATGTTCAACTGCGAGAGCTGCGAGTACAAAACAAAGTACAAGTTCTCGCTCAAATCGCACATGCTGAGTCACAAATCCGCCTCAGAAGTACCCACGTTCACTTGCGAGTTGTGCCCGTATGAGACCAAGCGTAAAGCGAACTACCACTCGCACATTTTAATCCACAAAGACCCGTCTGAGGTCAAAATGTTCGAGTGCGACACGTGCGAGTACAAGACAAGGTACAGAAGCGCGCTCAGCTCGCACTTGCTCAGTCACAAAGATCGAACCGAGACGCAGATGTACAACTGCGATGAATGTCCGTACGAGACCAAGTACAAAGGCGCGCTTAGGACACACAAACTGAACCACAAAGATTCTTCGGAACTGAAAACATACTCGTGCACTTTGTGCACGTACGAGACGAAACGTAAGATGAACTTCCATGCTCACAGTTTGAGCCATAAGGATCCGTCGGAGGTTCAGATGCACGCTTGTGACACTTGCGAGTACAAAACTAGGTACAAAAGCGCGCTTAAATCTCACGCCTTGGCCCACAAAGATCCCTCGGAGATTGAAATGTACAAGTGCGAGTTCTGTGAGTATCAATCCAGGTATAAGAGTGCGATTAAGACACACGTTGTGAACCACAAACAACCCTCGGAGATTCAGATGTTCAAGTGTGAAAGCTGCGAGTATCAAACTAGGCATAAAGGTTCGCTCAAAGCGCATTTGTTGAAGCATAAAAGTCCCTCGGAAGTACCTATGTTCACTTGCGAATGTTGCCCGTACGAGACCAAGCGTAAGACCAGCTTCAAGTCGCACATGTTGATGCATATGGACCCCTCGCAGATACAAATGCACGCTTGCGACAAATGCGAGTACaaaacgaaatataaaagtgccCTTAACTCGCACGTTTTATCCCACAAGGACCCGTCGGAGATAAAGATGCATACTTGCGAGGTCTGCCAATACACCACAAAGTATAAAGGAGCGTTAAAGTCGCACATGCTTAACCACAAAGATGCGTCCGAGGTCACGGTGTACACCTGCGAGTTTTGTACGTACGAGACGAGGCGTAAGACTAACTTTCACATACATTCACTGTCCCACAAGCAACCGTCAGAGATACAAATGCACTCGTGCGACGTATGCGAgtacaaaacaaaatacaagAGCGCTCTGAACTCGCACGCCTTGTCCCACAAAGACCCCTCGGAGATACAGATGTTCAAATGTCACACTTGCGAGTACGAGACGCGGTACAAAAGCGCCTTAAAATCACACGTAGCGAACCACAAACCCAACGAAGGGCAGTCGTACAAATGCGACGGTTGCGAGTTCGAAACCAACAACAAATCTACGTTAAAATCGCATATTATCACACATAAAGATCCGTTGGAGGTGGTTATCTACACTTGCGACTCTTGCAGCTACGAAACGAAGCGCAAAACTAACTACCAATCGCATTTGTTGATACACAAGGATCCGGCAGACGTTAAGATGTACCAGTGCGACGAGTGCGACTACGCGACGAAATACAAGAGCTCCTTGAAGTCGCACGTGTTGAACCACAAGGACCCATCGGAGATCGAGATGTTTAAATGCGACATGTGCAGCTACGAATCGAGATTTAAGAGTAGCCTCAAGTCACACATTCTCAACCACAAAGATCCCTCGGAAATAGACATGTTCAAGTGCGACGAGTGCGACTACGAGACGAAGTATAAGCGCGCGTTGTCTTCGCACAAACTGAACCACATGGACCCGTCGCAGATTCCCATGTTCAAGTGCGCGTCTTGCGACTACGAGACCAAGTATAAGAACGCGTTGAAGTTACACGTGGCGCACCACAAGGATCCGTCGGAAGTGGAGATGCATTCGTGCGAAAAGTGCGATTATAAATCGAAGTACAAGTCGTGTCTGAAGTCGCACATGGCGAAGCACGAGGAGCTTTCCGTCATTTGA
Protein Sequence: MDNKKEYLCRLCLSAICDENFEVINEITTKNLEMILPNTNLEVSEKPVMCNICSDRLKDAFSFKSACLSNSNCASVVENVPKIKVECSDENICDSKSFDEKKCFLCVQLIVDHPISLAAEGEEISSARNMIQKYIPEMDLKDKNPVICETCHQSVQQICNFLQSCMDVEEKIMDFRKRKEKDITFIDLKDVIQFSSEEQEEGLKQNEMCGPETNVPESNIKTEAFMEADYLNVCIKTEEPSNDEIEIEPEEQITLNENINIKNEEVDVKLEVTYSESATSVPCTDVLLEESNDVWDILREESHNFSEEEGNSHRKRSSSSLDFLPVSTAMKIRCGSCRKIVKSGPNFMHSKIFFRDTVLDNTSYKCETCKRETVDSLYSPNLTYNNRFEAVKFKCSICMYETKYRSALKSHMLKHKDRSEVKMYKCDYCNYETRHKTALKPHILKHQDPSQVEMFHCDSCEYQTRYKPALKSHLLNHKDPSEINMHSCDMCDYNTRFKSSLNSHMLKHMDPSEIQMFKCEICTYETKHKTSLKSHMLNHKDPSEVKMHKCEECDYNTKFKSSLKSHMLKHKDSSEIHMYKCDSCEYETRHKSALASHSLNHKDNSEVPLYLCNLCPYETKRRANYKLHIMTHKDPSEIQMYTCETCGYSTKYKSVLKSHKLIHQDPSEVEMYRCHLCDYETRRRQNIKMHVLTHMDPSEIPMYTCDHCEYKTKYKSALKSHLLNHKDPSEIQMFNCESCEYKTKYKFSLKSHMLSHKSASEVPTFTCELCPYETKRKANYHSHILIHKDPSEVKMFECDTCEYKTRYRSALSSHLLSHKDRTETQMYNCDECPYETKYKGALRTHKLNHKDSSELKTYSCTLCTYETKRKMNFHAHSLSHKDPSEVQMHACDTCEYKTRYKSALKSHALAHKDPSEIEMYKCEFCEYQSRYKSAIKTHVVNHKQPSEIQMFKCESCEYQTRHKGSLKAHLLKHKSPSEVPMFTCECCPYETKRKTSFKSHMLMHMDPSQIQMHACDKCEYKTKYKSALNSHVLSHKDPSEIKMHTCEVCQYTTKYKGALKSHMLNHKDASEVTVYTCEFCTYETRRKTNFHIHSLSHKQPSEIQMHSCDVCEYKTKYKSALNSHALSHKDPSEIQMFKCHTCEYETRYKSALKSHVANHKPNEGQSYKCDGCEFETNNKSTLKSHIITHKDPLEVVIYTCDSCSYETKRKTNYQSHLLIHKDPADVKMYQCDECDYATKYKSSLKSHVLNHKDPSEIEMFKCDMCSYESRFKSSLKSHILNHKDPSEIDMFKCDECDYETKYKRALSSHKLNHMDPSQIPMFKCASCDYETKYKNALKLHVAHHKDPSEVEMHSCEKCDYKSKYKSCLKSHMAKHEELSVI

Similar Transcription Factors

Sequence clustering based on sequence similarity using MMseqs2

100% Identity: iTF_01014847;
90% Identity: -
80% Identity: -