Basic Information

Insect: Agrilus cyanescens
Gene Symbol: -
Assembly: GCA_947389935.1
Location: OX376711.1:2106906-2115934[+]

Transcription Factor Domain

TF Family: zf-C2H2
Domain: zf-C2H2 domain
PFAM: PF00096
TF Group: Zinc-Coordinating Group
Description: The C2H2 zinc finger is the classical zinc finger domain. The two conserved cysteines and histidines co-ordinate a zinc ion. The following pattern describes the zinc finger. #-X-C-X(1-5)-C-X3-#-X5-#-X2-H-X(3-6)-[H/C] Where X can be any amino acid, and numbers in brackets indicate the number of residues. The positions marked # are those that are important for the stable fold of the zinc finger. The final position can be either his or cys. The C2H2 zinc finger is composed of two short beta strands followed by an alpha helix. The amino terminal part of the helix binds the major groove in DNA binding zinc fingers. The accepted consensus binding sequence for Sp1 is usually defined by the asymmetric hexanucleotide core GGGCGG but this sequence does not include, among others, the GAG (=CTC) repeat that constitutes a high-affinity site for Sp1 binding to the wt1 promoter [1].
Hmmscan Out: # of c-Evalue i-Evalue score bias hmm coord from hmm coord to ali coord from ali coord to env coord from env coord to acc

1 32 0.0032 0.78 11.8 0.8 1 23 16 38 16 39 0.93

2 32 0.069 17 7.5 0.1 3 23 155 175 154 175 0.97

3 32 5.9 1.4e+03 1.5 2.3 1 23 179 201 179 202 0.82

4 32 0.0046 1.1 11.2 0.3 1 23 207 229 207 229 0.98

5 32 2.4 5.9e+02 2.7 5.3 1 23 235 258 235 258 0.96

6 32 0.0017 0.41 12.6 0.5 1 23 264 286 264 286 0.97

7 32 0.028 6.9 8.8 6.1 3 23 296 316 294 317 0.94

8 32 9.1e-06 0.0023 19.7 0.4 1 22 322 343 322 343 0.96

9 32 2.1 5.2e+02 2.9 1.5 3 23 464 484 463 484 0.95

10 32 0.01 2.5 10.1 0.2 1 23 516 538 516 538 0.97

11 32 0.0077 1.9 10.5 1.4 1 23 544 567 544 567 0.94

12 32 0.022 5.4 9.1 0.2 2 15 574 587 573 587 0.89

13 32 0.16 39 6.4 1.3 2 14 658 670 658 671 0.88

14 32 0.00023 0.056 15.3 0.3 2 23 736 757 735 757 0.96

15 32 0.4 98 5.1 2.6 1 23 761 783 761 783 0.97

16 32 0.0002 0.05 15.5 0.1 2 23 839 860 838 860 0.96

17 32 0.089 22 7.2 1.1 1 23 864 886 864 886 0.96

18 32 1 2.6e+02 3.8 0.1 1 23 892 915 892 915 0.89

19 32 0.045 11 8.1 2.2 1 23 921 944 921 944 0.94

20 32 0.0051 1.3 11.1 4.2 1 23 949 972 949 973 0.95

21 32 0.00074 0.18 13.7 2.1 1 23 980 1003 980 1003 0.98

22 32 0.11 26 6.9 0.4 1 23 1099 1121 1099 1121 0.91

23 32 0.024 5.9 9.0 1.9 1 20 1125 1144 1125 1147 0.89

24 32 0.00011 0.028 16.3 4.8 1 23 1182 1204 1182 1204 0.99

25 32 0.035 8.7 8.5 2.8 2 23 1225 1247 1224 1247 0.96

26 32 0.00021 0.052 15.5 0.6 2 23 1252 1273 1251 1273 0.97

27 32 0.038 9.5 8.3 0.8 2 23 1280 1301 1279 1301 0.95

28 32 0.75 1.9e+02 4.3 3.4 1 23 1307 1330 1307 1330 0.96

29 32 0.25 62 5.8 0.2 2 20 1337 1355 1336 1357 0.92

30 32 0.18 43 6.3 2.2 2 20 1370 1388 1369 1390 0.91

31 32 0.0011 0.27 13.2 4.7 1 21 1400 1420 1400 1421 0.94

32 32 0.027 6.7 8.8 1.8 2 22 1429 1449 1429 1449 0.94

#	of	c-Evalue	i-Evalue	score	bias	hmm coord from	hmm coord to	ali coord from	ali coord to	env coord from	env coord to	acc
1	32	0.0032	0.78	11.8	0.8	1	23	16	38	16	39	0.93
2	32	0.069	17	7.5	0.1	3	23	155	175	154	175	0.97
3	32	5.9	1.4e+03	1.5	2.3	1	23	179	201	179	202	0.82
4	32	0.0046	1.1	11.2	0.3	1	23	207	229	207	229	0.98
5	32	2.4	5.9e+02	2.7	5.3	1	23	235	258	235	258	0.96
6	32	0.0017	0.41	12.6	0.5	1	23	264	286	264	286	0.97
7	32	0.028	6.9	8.8	6.1	3	23	296	316	294	317	0.94
8	32	9.1e-06	0.0023	19.7	0.4	1	22	322	343	322	343	0.96
9	32	2.1	5.2e+02	2.9	1.5	3	23	464	484	463	484	0.95
10	32	0.01	2.5	10.1	0.2	1	23	516	538	516	538	0.97
11	32	0.0077	1.9	10.5	1.4	1	23	544	567	544	567	0.94
12	32	0.022	5.4	9.1	0.2	2	15	574	587	573	587	0.89
13	32	0.16	39	6.4	1.3	2	14	658	670	658	671	0.88
14	32	0.00023	0.056	15.3	0.3	2	23	736	757	735	757	0.96
15	32	0.4	98	5.1	2.6	1	23	761	783	761	783	0.97
16	32	0.0002	0.05	15.5	0.1	2	23	839	860	838	860	0.96
17	32	0.089	22	7.2	1.1	1	23	864	886	864	886	0.96
18	32	1	2.6e+02	3.8	0.1	1	23	892	915	892	915	0.89
19	32	0.045	11	8.1	2.2	1	23	921	944	921	944	0.94
20	32	0.0051	1.3	11.1	4.2	1	23	949	972	949	973	0.95
21	32	0.00074	0.18	13.7	2.1	1	23	980	1003	980	1003	0.98
22	32	0.11	26	6.9	0.4	1	23	1099	1121	1099	1121	0.91
23	32	0.024	5.9	9.0	1.9	1	20	1125	1144	1125	1147	0.89
24	32	0.00011	0.028	16.3	4.8	1	23	1182	1204	1182	1204	0.99
25	32	0.035	8.7	8.5	2.8	2	23	1225	1247	1224	1247	0.96
26	32	0.00021	0.052	15.5	0.6	2	23	1252	1273	1251	1273	0.97
27	32	0.038	9.5	8.3	0.8	2	23	1280	1301	1279	1301	0.95
28	32	0.75	1.9e+02	4.3	3.4	1	23	1307	1330	1307	1330	0.96
29	32	0.25	62	5.8	0.2	2	20	1337	1355	1336	1357	0.92
30	32	0.18	43	6.3	2.2	2	20	1370	1388	1369	1390	0.91
31	32	0.0011	0.27	13.2	4.7	1	21	1400	1420	1400	1421	0.94
32	32	0.027	6.7	8.8	1.8	2	22	1429	1449	1429	1449	0.94

Sequence Information

Coding Sequence: ATGGATTACGTCTGTCATGCACAAACCCACCACGAAAACAAATTGTTCACCTGCCCCCTTTGTGGAACCACAACAGAAAAAAGGTTTCCTATGAGAAAACACTTAAACAAACACGTTCAATTTAGGCGATTCAAGTGTGAAAAGGAAGGCTGTAGCATAAAAATTGAAATCAGTGAATGTAAAATAGAAGAACCATGGAATAAGGAAACCGAGAAAACTATAGAAGAAAATGCGTACTGCCCAGTATGTCGTGCCAAAACATTTGATCTTCATCAAAAACACGTAGTCTCGATGGAATCAAAGGAATTTTATTGTCACAATCACTCGTGGTGTACTGAAAAATTCACGAAACACGAACTTGTTAGCCACTGTCACGAGCATGGAATAATAATAGAAAATATGTATTCGTTTTTTCGTAAAGCGTCACGAAAATATCCAAAAATCCAACAATACGAAGAAGCTTGCGAAATATGTTTTGAACTTTTCAAAAATAGAACCGACGCAGAAGCTCATTACGAAACCCACGACGACCAGTACACTTGTGAAATGTGTACAATTGGCTTTAAAAAAGTTATGGATTACATTTGTCACGCGCAAATTCATCATAAAAACCGATTGTTCACTTGTCCAATTTGTGGATTTACTGCGGACACTCGGACTCCTATGAAAAAACATTTAGAAAAACACGAAGAGTTCAGACGTTACAAATGTAAACCTTGCGAAAAAAAGTTCGCCAATTACTCAATTTATTGCGAACATATAAATTCTTGTCACAGTGATACGAACGTCTTTCCATGTGATATTTGTGGAGAAAAATTGAAAAGTCGACGTAGACTAAATGTTCATAAACGCGACCACAAATGGCAGTCAATGGGAAAAACACATTGTGAAATTTGCAATTTCAAATTCACTTCTTATGATTCGATGAAAAATCACTACTCAAAGCACCATCCTCAAACAATATTTGTGTGCGATGAGTGTGGAATCCGTTTTAAAGTGAAAAGAAATTTTAATGCTCATATGAGGAAAACTGTGAGTATGAAAGTTGAAGTTGATGAACAGAAAATCGAAACGTCGTTGAATGATGACGATGTAAAGACAAAAAAGAATTCGAAACGTTCGAGACTTGACGTTACTAAAAGTGGGGTTAGGTACTGTAAAATATGCCAGTACAAAAGCTTCGAAAGCGACGAGATCCATGAGAAACATATCGCGTTAAAAGAATCAAAAGAATATTATTGTCACAGACACTTGTCGTGCACCGAAAAATTTACGAAACACGAACTGATCTGGCACTGTAACGAATACGGAATAAAAATAGAAAACTCAAGAACCTTTTTTCGAAGGGCCAtgcaagaaaatccaaaagccgaacgtttaggagaaccctgcgaaatatgtttcgaacttttCAAAAACAAACGCGTTCTGGAATGTCATTACAAAATTCACGACAATCAATATATTTGTGAAGTCTGTATGGAAGGTTTCAAAAAGATCATGGACTATATCTGTCACGGGCAGGAGCATCGCGAAGATAAAAAGTTCGCATGTCCCCTATGTGAAGTTACTACGAAAAAGAGCACGGAAATGAGAGTGCACATCCAAAATCACGAACAATTTAAAAAATACAAGTGCAAAATATGCGAAAAGCGATTTGCTGGCCATGCAGTTTATAGAGAACACATAGAATACTACCACAGTGGAATAAACGCCTTAGTATGTGACGTTTGTGGTAAGAAATTCAAGACCCCGAGGAATCCTGATGGATACGAACAAGACAACAGGGCTGAAGATTGTCAGATTTTTTCCCAGTTCGAAAGTAAATTAAGCAATTCTGACATATATCTAGACGAAGAAGAGTCATCTGATTCCTCTGGATCATCAGACAAAGAAGAAGAAGTAAAAAACAACAAGACGAAACACAGAAAGATTAAGGCTAATCTGAATAAGAATATATTGGGCAAGGGTTACTGCAAACATTGTCGAAAAACATTCAAAACAGCCGAAGACCACAAAGACTTCGTTTCTACCCACGAAGAACGAAAATATTACTGCAGGGACCATCCGACATGTACCCAAAAATACGCCAGACACGAACTCCTCGTACATTGTAAAGAACACGGAATCGTCATACCAGACATTAGACAATATTTTCAAAAGGCCCGTTGTAAAGCGACCCGGATTAAAAATTTGGAAGGCCAACCGTGCGAAATTTGTTCGAAAATGTTTCAAACAAAAAACGCTTTGGAAGATCACTACAACAGTCACGAAGATCAGTATCAGTGCGCCACCTGCAACACCGGATTCAAGAAGATAATGGACTACGTGTGTCATATGCAGACCCATAGTAACGACAAACTGTTGCAGTGCCCAATTTGTTCAGTGACAATGGCAAAAATAGCGCACAATGATGAAATGGATGTAAAAGACACATTCCTTGTGAAGATGGAATTCGAAAAACCTGAAGAAAACATGAGAACAACAAACCGCAGACAGAACATACTCGAAAAGCCTTGCGAAATATGTTTAAAAATGTTCGCGAACGCTGAGGAATTACAACAACACTACGACACACACGACGACCAACACTTTTGCGACATTTGCAACGACAGTTTTAAACTTTTAATGGATTACATTGTTCACATGCAAAACCACAGCGACGACATGCTCTTCAAGTGTCCAGTTTGTCCAGCGAAAGACAAAGAGTTAATCACCTTGCAAAAACATATTTACGTCAACCACGTGCAATTCAGAAAATACAAGTGTCAAAAGTGCAATAAACTATTTCCCTTCCAAGGGCCTTATCGAGAACACGTGAAGTTCTTCCACGCAGAAAAGACCTTCGCGTGCAATACTTGCGGAAAGCAATTTGTATTTTTCCGATATCTTCTAAACCACAGAAGAAACTATCATCACGAAAAAACCTCGACGAGCTTCAAGTGTCATCATTGTGAAGAAGAATTTCCCAAAATTGCTTCTATGGAACGCCATATCAAAGTGCAACACGCCGACATAATGTCAAATGGACGTGACAAACACCAGAAGAAATGCGAAACAAGCGTAGAAGATACTGTCAAACTCGGTTATAGCGTCATCCTGGGAACAGACCACGAAATTCAAATTGAGCGCATAGAGAACAATATCGAGACAGTTTTTATAAAAGAGGAGACTTCGTCAGACGTCGAGATAGTTGGTGAGATGGAGATACATGGTAGCCAATTGCTTCCATGGAACATGGATCCAAAAATGCAACTCCAACGCTTGAGAGCGAATAACCAGAACGACGTTGTGTACCCATGCGAAATTTGTTACGAAATGTTCAACAACGTAGACGCCCTGCGCTTCCATTACACGTACCACGAACCCCAACACACTTGCAGAAAGTGCGACAAAAAGTTCAAAACCATAATCGACTACATATCTCACGTGCCCACTCACACAAAAGGAGTCAAAACGTACAAATGTCCGCAATGTACGTTCGAACACCGTGAGATATTTGTGTTAGAAAAACATTTGTACTCTCACAACGAGTACAAAAAATACAAGTGCCAAAAGTGCGGCAGGCGCTTCTCTTTTTACGCGCAGTACAACAAGCACACGCAAAAACATGTGACAGAAAACAAGAAAGAAAAACCTGAACAGAAAACTAAAACTAACGCTTCTTCCACACAGTGCGGTCATTGTCGCAAAAAGTTTGCTACCGTTCGTCTAATGCGCGGCCACGTTCGCAAAAATCATGTTGATATTGTAGAGTGTAAAGTGTGCGGTAAAAATCTTGCGAACAAGAGACGTCTTTTGGATCACATGCGCAAACACGTCAAAGGCACCGAATTAAAATGTTTGTTCTGCGACAAAACGTTCGCGTCCGAATACACCAAAGACATGCACGAACGAGTCCATTTTGGTAACAAACCATTTCAGTGTTTCAAATGCAAAAATACGTTTATGTTTTACGGAACTTACCGAGAACACGCACGATTGTATCACAAACAAACGAAAGCTACTGTGTGTCTCAATTGCGGCAACGATTTTCGACAAATCCGGAAACTGAAAGCTCACGAGAAAGATTGTCTCACCAAAGTCAGTCCCACGACATGCGATTTGAATTGCCACAATTGCGGAAACGATTTTGAAACTCGAGAGGATTTCGAAAGTCACGAATGTAAGGATATGTTGAAGTATGACGTTGAACGCTTCAAATGTACCAACTGTGATAAGGAATTTAAGTTTCGGAGTGGCTTAAACAACCACAAATGTAAACGTGACAATAAACAGTCCAACGTCTGTCGAACATGCAAAAAAGCTTTCCCATCAAACGGCTCTTTGAAATGTCATATGAAAACCTGCGAAAAACGAAAAACTAACCAACAGAGGAACAAGAAGCAAACGAAATCTAAATAA
Protein Sequence: MDYVCHAQTHHENKLFTCPLCGTTTEKRFPMRKHLNKHVQFRRFKCEKEGCSIKIEISECKIEEPWNKETEKTIEENAYCPVCRAKTFDLHQKHVVSMESKEFYCHNHSWCTEKFTKHELVSHCHEHGIIIENMYSFFRKASRKYPKIQQYEEACEICFELFKNRTDAEAHYETHDDQYTCEMCTIGFKKVMDYICHAQIHHKNRLFTCPICGFTADTRTPMKKHLEKHEEFRRYKCKPCEKKFANYSIYCEHINSCHSDTNVFPCDICGEKLKSRRRLNVHKRDHKWQSMGKTHCEICNFKFTSYDSMKNHYSKHHPQTIFVCDECGIRFKVKRNFNAHMRKTVSMKVEVDEQKIETSLNDDDVKTKKNSKRSRLDVTKSGVRYCKICQYKSFESDEIHEKHIALKESKEYYCHRHLSCTEKFTKHELIWHCNEYGIKIENSRTFFRRAMQENPKAERLGEPCEICFELFKNKRVLECHYKIHDNQYICEVCMEGFKKIMDYICHGQEHREDKKFACPLCEVTTKKSTEMRVHIQNHEQFKKYKCKICEKRFAGHAVYREHIEYYHSGINALVCDVCGKKFKTPRNPDGYEQDNRAEDCQIFSQFESKLSNSDIYLDEEESSDSSGSSDKEEEVKNNKTKHRKIKANLNKNILGKGYCKHCRKTFKTAEDHKDFVSTHEERKYYCRDHPTCTQKYARHELLVHCKEHGIVIPDIRQYFQKARCKATRIKNLEGQPCEICSKMFQTKNALEDHYNSHEDQYQCATCNTGFKKIMDYVCHMQTHSNDKLLQCPICSVTMAKIAHNDEMDVKDTFLVKMEFEKPEENMRTTNRRQNILEKPCEICLKMFANAEELQQHYDTHDDQHFCDICNDSFKLLMDYIVHMQNHSDDMLFKCPVCPAKDKELITLQKHIYVNHVQFRKYKCQKCNKLFPFQGPYREHVKFFHAEKTFACNTCGKQFVFFRYLLNHRRNYHHEKTSTSFKCHHCEEEFPKIASMERHIKVQHADIMSNGRDKHQKKCETSVEDTVKLGYSVILGTDHEIQIERIENNIETVFIKEETSSDVEIVGEMEIHGSQLLPWNMDPKMQLQRLRANNQNDVVYPCEICYEMFNNVDALRFHYTYHEPQHTCRKCDKKFKTIIDYISHVPTHTKGVKTYKCPQCTFEHREIFVLEKHLYSHNEYKKYKCQKCGRRFSFYAQYNKHTQKHVTENKKEKPEQKTKTNASSTQCGHCRKKFATVRLMRGHVRKNHVDIVECKVCGKNLANKRRLLDHMRKHVKGTELKCLFCDKTFASEYTKDMHERVHFGNKPFQCFKCKNTFMFYGTYREHARLYHKQTKATVCLNCGNDFRQIRKLKAHEKDCLTKVSPTTCDLNCHNCGNDFETREDFESHECKDMLKYDVERFKCTNCDKEFKFRSGLNNHKCKRDNKQSNVCRTCKKAFPSNGSLKCHMKTCEKRKTNQQRNKKQTKSK

Similar Transcription Factors

Sequence clustering based on sequence similarity using MMseqs2

100% Identity: -
90% Identity: -
80% Identity: -