Basic Information

Insect: Corythucha ciliata
Gene Symbol: -
Assembly: GCA_038030265.1
Location: CM075942.1:49974360-49986009[+]

Transcription Factor Domain

TF Family: zf-C2H2
Domain: zf-C2H2 domain
PFAM: PF00096
TF Group: Zinc-Coordinating Group
Description: The C2H2 zinc finger is the classical zinc finger domain. The two conserved cysteines and histidines co-ordinate a zinc ion. The following pattern describes the zinc finger. #-X-C-X(1-5)-C-X3-#-X5-#-X2-H-X(3-6)-[H/C] Where X can be any amino acid, and numbers in brackets indicate the number of residues. The positions marked # are those that are important for the stable fold of the zinc finger. The final position can be either his or cys. The C2H2 zinc finger is composed of two short beta strands followed by an alpha helix. The amino terminal part of the helix binds the major groove in DNA binding zinc fingers. The accepted consensus binding sequence for Sp1 is usually defined by the asymmetric hexanucleotide core GGGCGG but this sequence does not include, among others, the GAG (=CTC) repeat that constitutes a high-affinity site for Sp1 binding to the wt1 promoter [1].
Hmmscan Out: # of c-Evalue i-Evalue score bias hmm coord from hmm coord to ali coord from ali coord to env coord from env coord to acc

1 31 4e-05 0.0078 17.8 2.0 1 23 199 221 199 221 0.96

2 31 2.7e-05 0.0051 18.4 1.2 1 23 233 255 233 255 0.98

3 31 0.00033 0.063 15.0 0.9 1 23 276 299 276 299 0.97

4 31 0.00046 0.089 14.5 0.7 2 23 306 328 305 328 0.96

5 31 0.33 64 5.5 0.5 1 23 417 441 417 441 0.94

6 31 0.00078 0.15 13.8 1.3 1 23 472 495 472 495 0.95

7 31 0.57 1.1e+02 4.8 3.6 3 23 503 524 502 524 0.96

8 31 5 9.7e+02 1.8 1.5 1 23 534 556 534 556 0.96

9 31 0.00046 0.089 14.5 1.4 2 23 597 619 597 619 0.96

10 31 7.4 1.4e+03 1.3 0.6 1 23 637 660 637 660 0.88

11 31 0.18 35 6.4 0.8 2 23 667 690 666 691 0.84

12 31 0.0073 1.4 10.7 0.1 2 23 700 722 700 722 0.95

13 31 0.00098 0.19 13.5 0.4 1 23 728 751 728 751 0.96

14 31 8.3e-05 0.016 16.9 0.9 1 23 759 781 759 781 0.98

15 31 0.0013 0.25 13.1 0.6 2 23 842 864 841 864 0.95

16 31 0.022 4.3 9.2 1.7 2 23 871 892 870 893 0.94

17 31 0.02 3.8 9.4 3.9 1 20 923 942 923 944 0.93

18 31 8.7e-05 0.017 16.8 1.4 1 23 963 986 963 986 0.97

19 31 0.022 4.2 9.2 0.9 1 23 989 1012 989 1012 0.97

20 31 7.8 1.5e+03 1.2 0.5 4 23 1021 1042 1019 1042 0.84

21 31 0.0083 1.6 10.6 2.7 1 23 1049 1072 1049 1072 0.96

22 31 0.29 56 5.7 0.9 1 23 1078 1101 1078 1101 0.94

23 31 0.0011 0.22 13.3 1.1 2 23 1110 1131 1110 1131 0.97

24 31 0.03 5.9 8.8 1.1 2 23 1137 1158 1137 1158 0.97

25 31 0.026 4.9 9.0 0.5 2 23 1218 1240 1217 1240 0.95

26 31 0.054 10 8.0 0.4 2 23 1306 1328 1305 1328 0.95

27 31 0.72 1.4e+02 4.5 0.4 2 23 1369 1390 1368 1390 0.94

28 31 0.76 1.5e+02 4.4 3.3 1 23 1402 1425 1402 1425 0.97

29 31 0.0055 1.1 11.1 0.0 2 23 1456 1477 1455 1477 0.96

30 31 0.00018 0.036 15.8 0.5 1 23 1483 1506 1483 1506 0.92

31 31 0.014 2.8 9.8 0.1 1 21 1511 1531 1511 1532 0.94

#	of	c-Evalue	i-Evalue	score	bias	hmm coord from	hmm coord to	ali coord from	ali coord to	env coord from	env coord to	acc
1	31	4e-05	0.0078	17.8	2.0	1	23	199	221	199	221	0.96
2	31	2.7e-05	0.0051	18.4	1.2	1	23	233	255	233	255	0.98
3	31	0.00033	0.063	15.0	0.9	1	23	276	299	276	299	0.97
4	31	0.00046	0.089	14.5	0.7	2	23	306	328	305	328	0.96
5	31	0.33	64	5.5	0.5	1	23	417	441	417	441	0.94
6	31	0.00078	0.15	13.8	1.3	1	23	472	495	472	495	0.95
7	31	0.57	1.1e+02	4.8	3.6	3	23	503	524	502	524	0.96
8	31	5	9.7e+02	1.8	1.5	1	23	534	556	534	556	0.96
9	31	0.00046	0.089	14.5	1.4	2	23	597	619	597	619	0.96
10	31	7.4	1.4e+03	1.3	0.6	1	23	637	660	637	660	0.88
11	31	0.18	35	6.4	0.8	2	23	667	690	666	691	0.84
12	31	0.0073	1.4	10.7	0.1	2	23	700	722	700	722	0.95
13	31	0.00098	0.19	13.5	0.4	1	23	728	751	728	751	0.96
14	31	8.3e-05	0.016	16.9	0.9	1	23	759	781	759	781	0.98
15	31	0.0013	0.25	13.1	0.6	2	23	842	864	841	864	0.95
16	31	0.022	4.3	9.2	1.7	2	23	871	892	870	893	0.94
17	31	0.02	3.8	9.4	3.9	1	20	923	942	923	944	0.93
18	31	8.7e-05	0.017	16.8	1.4	1	23	963	986	963	986	0.97
19	31	0.022	4.2	9.2	0.9	1	23	989	1012	989	1012	0.97
20	31	7.8	1.5e+03	1.2	0.5	4	23	1021	1042	1019	1042	0.84
21	31	0.0083	1.6	10.6	2.7	1	23	1049	1072	1049	1072	0.96
22	31	0.29	56	5.7	0.9	1	23	1078	1101	1078	1101	0.94
23	31	0.0011	0.22	13.3	1.1	2	23	1110	1131	1110	1131	0.97
24	31	0.03	5.9	8.8	1.1	2	23	1137	1158	1137	1158	0.97
25	31	0.026	4.9	9.0	0.5	2	23	1218	1240	1217	1240	0.95
26	31	0.054	10	8.0	0.4	2	23	1306	1328	1305	1328	0.95
27	31	0.72	1.4e+02	4.5	0.4	2	23	1369	1390	1368	1390	0.94
28	31	0.76	1.5e+02	4.4	3.3	1	23	1402	1425	1402	1425	0.97
29	31	0.0055	1.1	11.1	0.0	2	23	1456	1477	1455	1477	0.96
30	31	0.00018	0.036	15.8	0.5	1	23	1483	1506	1483	1506	0.92
31	31	0.014	2.8	9.8	0.1	1	21	1511	1531	1511	1532	0.94

Sequence Information

Coding Sequence: ATGACCCAACAAACGAGCCCGAGTTACGAGGACTTGTGCCGCCTCTGCGCCTCCTACGACGCCATCAAAATGGACATATTCAGCGAGAGCGGCCGCGAAAGAAAACTCGCCGACAAAATAACCACATGCCTGCCATTCGGAGTCTCTGAAGATGACATCTACCCGAAGTCTCTGTGTTTTCGTTGTATTTATAACCTTGAAAATTTCTACGATTTTCGTCGCGGTTGTATCGACGCACGAGGAAAACTCGAACGAGTTCACAGAGAGactcaagccaaaaacaacgcctGCCCGGTCACTCCAAAGCCACCACGCGGCAACATTGAATTGCCCCAGCTTAATCCGAAAGTGGAGCCTTCGGTACAAATCAAACAAGAAGAAGTAGACGACGACGTCGAAATGATACCATCGGACTGCGAGGAGGAGGAAGAACATCCCAATCCGGCTGATTTTCTCGAAGCGTGTCTCGGTGAACCACCTCATTGCAGCTATGGAGGTGGTGGTGGATCCGGAACTGGTGGCGGAGGAGGTGGTGGAGGCGGCGGTGGCATGGTTCACGGAGGCGTCCGTATGTTGGATGATGAACAAGGGCCGTTCACTTGTAGAACCTGCGGCCGCATGTTCAACTCGAAGAGCTCTTTGACTATACACGCAAAATTTCACCAGGAAAAATCCCGCGAATCCGAACGGGAGGCGTACTCGTGTTTCGTCTGCGAAAAGGTTTTCTCCAGCAAGGGGCACTTGGCACTTCATTCGAGGGTGCACATCGGTGAAACGGGTCCTCCGATGCCGTCAAATCGTCCTAGTCCAGCGCCGTTCAAacTGTACCGTTGTGACTTATGCAATAAGTCTTACTCTATGGCGAAACATCTCTGGGGGCACGTCAGCACAGTGCATAAAGGTGATCCATTGGTCACGTGCTCTTTGTGTCTACGGACGTTTTCGTCCATTTCTAATTTGGAAGATCATAAAAGAGTAAAACACAAGGATGACCCTAGCGTTCAAGCGCGAAACGGTCAGCAAGATCCGATTTCGGCGTCGGAGCCTCACTCGCCTCGAATGTTCGAAGGAGGGTCGCCTCCGAATCGAAGAAAAAATTCGACTCCGAGAAAAATCAAAAGAGACGACAGTGGTTCGTTCAACTCGGACGATAACGCCAGGGGTGACGCTGATGACACCGAGGAAGGTGGTGGTGGCGCCGGAGGAGGAGGAGCTGGAGCGAATCCACCGGGTGGCCCCCCTATGGTGTACTCGTGTCTTGTGTGCGGGCACAGAAAGTTTAGCGACACTCAAGCTCTGAGCGACCATTTAGCCAACGACCACGGCTATAACGATTTAATCGATTTTGAGAGCGTCAAACGGGAGTACGGTGAAAATGAGTACCTGGAGAACATGATGGAGGCTGAAACCGTGTTCTGTTGCGAAATTTGTTACCGCGAATTTAACGATCGCGCGAGCCTGTGGCTTCACATGCTCTATTCACACCGTGACGAAGCGTCCAAAGCGTGCGGTATTTGCCTCAAAATATGCCAGGACAATGAAAGTTTGACTCATCACGTTGAAACCTGTCACCCGAGAAATAAAACTGAACAGCGACGGTACAGTTGTCAAGTATGCGCTCGACAGCATGATTCGAGGAAAAAACTAGTCACTCACGCTCGAATTCATAAGCTAACCGACTCGTCTGGCAATCTTGTTGATCCTGAGACGGTTGTAGTTTTGAACAGCGAGTTCTATGGAAATGAAAATCAAACGGCGCAGCCACCTGTTGATGACGGCATAATGCCCAGCTGTAATATTTGCTTCAAAGTGTTTGAAACTGACGCAAAGTTGAACAAGCACCGTAGGAGTACCCACCGTGAAGCTTTAGGGTTGAATACGTCCACATCAGGCGGTTATCATTTTTATTTCGCGTGCGAGCTCTGCGGGTTATCTCATCTGTCCAGGTCGGAGCGGTGGAAGCACATGGCGACGTCGCACGCCGGTGATCCGAGCGTCACCTGTGAGTTTAAGGACTGCGGTAAAGTTTTCCCGACGAGCGCCGTGAAAAAAGAACACGAAACGAATCACCACGCCGCCCAGGGACAGTTTCCCAATACTTGTGAAGTGTGCGGGAAAATGTGGAAAACTCGGGTCGAGTATTGGAAACACATGATGGGCGTACACGCTGAGTGTTTGCCCTATATTTGCGGAGTGTGCTTGAAAGTTTTCTGCACTTTGCCTAATTTGGTGAGTCACGTCCGTGAAAGGCACTACCCGCTCATTGGAGGTGATTTTAGTTGTGACATCTGCGGTCGGGCGTATTCGAAAGTGTCGAAGATGACGCGGCACCGGAAAATTCATTATGTTCCGGACACTCCGCCAGAACTGAGGGATTTATTGGAAAATCCTAAAGTCGACAATGAGCCGCATTTTTTGCAACAGCCCAGCGTGTTGACGTGCGATCTCTGTCAAGGCAGCACGGTCGAATACGAGAACCTCGAAACTTTGGGTAAGCACAGACACGAGGCACACGATGTAATGCCCtgcgatttgtgccctaaataCTACGGGAGGACTTCCCATCTTTGGAAACATGTCAATAAAATACACAAGGGTCATCCGGACATCACTTGTCCCCTTTGTCAGCGAACGTCCGCCTCAAAATTACATTTGGCGACTCACGTCGCCAAGCACCACAGAGAGGGCGGTGAGGATGGTGTTGTGCTGGGTGAAGACGGTGACCCATCGTGGAGTACGAGCATCGACGGGGAAATGGGTGAAATGCACACGTGCTCCAAGTGTTCCAAAGTGTTCAGAAAGGAGTCGCTCGTTCGTAAACATTCGAAACATTGTAAAGGACCGCGAATTATGCCCATAGCGATACCTCCGCCTATCAACGGCGTGTACACGTGCGAGCGCTGTTCAAAAACATTCGCCGCTCAGAACCTTTTGTACCGGCACATGAGAAACTCTCATGTCAACTATAAATGTGAGATTTGCGCCGCTTCGGCGAACACCAAAACGGATTTATTCACTCACGTCCGTGAGTGTCACGCCGATCATCCAAACGTTCGCTGCGCGGTGCCGGGCTGTGACAAATTGCTTCGCTGCCGCGCGGATTTGGATCGTCACCAGCGGGATCACCGTCAGAGTGCTCAGTTCCATATTTGTAAGTTCTGCGCAGAGATTTTTACTAGTAAattaaaactcaaaaaacatTTGAAGTCGATTCACGCTAAAGAGACACGATTTCTATGCTATCTGTGTCTCAAAGCCTACACGGCTTTTCACGACTTGAAAAATCACGTAGAAACGGCGCACGCCGCCGCTGTCGACCGTCCGAACGTGTGTCCACTGTGCGCCAAACCGTGTTCAAGCCGTTCAAAATTAATGGATCACCTCAGGTACCACGGCTCGGATTTGAACACTTGTAAACAGTGTATGGCGATTTTTGAAACCAAAGAAGAACTGGAGCATCACATTAATAATCATCCGGGGGAGAGCGGTGACGAGGATTTGGTGGAAGAAGTGAGCGAGCTCGACCCTAATAGCATCATGGACATAATTGGCGCTCCTCAGGGAGGAGTTCGAGTTAAAAGAGAGTTGGACGATGAGGACGGTAATGGCGTTGAGGTTGGGCCAGTggtaaaaaaatcgaaaaagatgTCGAGGTGTCGCGCTTGTTCTCAAATTTTCAGCTCGAGCGCGGACCTTGATAAGCACGTCAAGAGTTACCATCCGTCTAAAAATGAAAGAAGTATTTTAGCAAAGGCGCTGAGCAAGGCGAACAGTGGGTCGAAAGATTCTCTTTCCGATCTTGAGGAAAATGACGACTTCAAGGACCCGTCCTTTTCCCGAAGCTTACCTCCAAACAAATTGAAACAATCGTCGCCTAGAAGTCGCAAAGTGTACtcggacgatttcacgccaagtcgATGCGAAGTTTGTGGCAAAGTCTGGCCGGCTAAGCGTCACCTTTGGCAACACTTGATACGATTCCATCGATCCGAAGCTGGAAAATGCTGTGGGATTTGCCTCAAACTGTGCCCTAGCTATGAAGCGCTCAGCATTCACCTCGCTCAATACCACGCGTCCAGTTTTGACCGTGAGGGCACCAATTTAACCTGCCGCGTGTGTGGAAAGTATCAAAACGCCAAATCGAAACTTCAGAATCATGCTCTCATTCATCCGGATCACATGAAACGAGCTCAAGACTCCGAACATGTTTGTCTTCTCTGTAACGGTGCTTTCACAGAATTTAAAACACTCTGCGAACACTTTCGAACGATCCATAACATCACAGGTGACACTGGCAACGACTCGTCGCCACCGACATCAGCCCCTCAATCGTACAACGGTACAGCTAAAAAGTTACCATTCCTAAGCTGCGACGTCTGTTCCTTAGTGTTTGCCAGTGAAGTCGGCCTGGCGAATCATAAACGAGTTCACGAACACTCGGACAGTTTCAAGTGTGGTCAGTGCGGTGAAATGTTCGCCACGTCCGACGGGTTGAGCAAGCACAAAACTGAGAAACACTCGTCAGCCGATTTTGTTTGCGTCGACTGTAAAGCGAATTTCAGGTCATACACGGAACTCATTAATCACAATCGAGTGTGTCGAGTCAAACGGCCGCTGCCGCCGCCGCCAACGGCCACCACAGCACAGACGGCAGCAACACCCAACAGTGACGATTCAGCTAGTGAAGTGGCTTCGTCTCCTCGAAGTCGCTCGTTGGACGATGAAGAGGACGATGACCTCACAGAAGAAAGTGACGACGATCTATCAGAAACCGACGTCGATAAAAATGAAGCGGTTGAAGAGGATGACGGTGAAAACGACGACTCCTCGTCGTCTTCGTCTTCCTCCTCGAGCAGCAGCAGCAGTAGTAGCGATAGCAGCAGTGAAGATGAAGCCGAAGACGTGGACGAAGAGGCTGACGGTGACGCCGAGGAAGAGGAAGCAGAGGAGGAAGTAGAAGACGCTGACGATGACGATGACACTTCAGAAGCCGAAGAAGTCAAATCTCCCGTGAAAGAAGTTCGGGCAGTTGAGGCTTTCGTGTCAAATGATGACAATATGGTTGAAGTGGTTCAGATTGACCTGATGGACGAATGA
Protein Sequence: MTQQTSPSYEDLCRLCASYDAIKMDIFSESGRERKLADKITTCLPFGVSEDDIYPKSLCFRCIYNLENFYDFRRGCIDARGKLERVHRETQAKNNACPVTPKPPRGNIELPQLNPKVEPSVQIKQEEVDDDVEMIPSDCEEEEEHPNPADFLEACLGEPPHCSYGGGGGSGTGGGGGGGGGGGMVHGGVRMLDDEQGPFTCRTCGRMFNSKSSLTIHAKFHQEKSRESEREAYSCFVCEKVFSSKGHLALHSRVHIGETGPPMPSNRPSPAPFKLYRCDLCNKSYSMAKHLWGHVSTVHKGDPLVTCSLCLRTFSSISNLEDHKRVKHKDDPSVQARNGQQDPISASEPHSPRMFEGGSPPNRRKNSTPRKIKRDDSGSFNSDDNARGDADDTEEGGGGAGGGGAGANPPGGPPMVYSCLVCGHRKFSDTQALSDHLANDHGYNDLIDFESVKREYGENEYLENMMEAETVFCCEICYREFNDRASLWLHMLYSHRDEASKACGICLKICQDNESLTHHVETCHPRNKTEQRRYSCQVCARQHDSRKKLVTHARIHKLTDSSGNLVDPETVVVLNSEFYGNENQTAQPPVDDGIMPSCNICFKVFETDAKLNKHRRSTHREALGLNTSTSGGYHFYFACELCGLSHLSRSERWKHMATSHAGDPSVTCEFKDCGKVFPTSAVKKEHETNHHAAQGQFPNTCEVCGKMWKTRVEYWKHMMGVHAECLPYICGVCLKVFCTLPNLVSHVRERHYPLIGGDFSCDICGRAYSKVSKMTRHRKIHYVPDTPPELRDLLENPKVDNEPHFLQQPSVLTCDLCQGSTVEYENLETLGKHRHEAHDVMPCDLCPKYYGRTSHLWKHVNKIHKGHPDITCPLCQRTSASKLHLATHVAKHHREGGEDGVVLGEDGDPSWSTSIDGEMGEMHTCSKCSKVFRKESLVRKHSKHCKGPRIMPIAIPPPINGVYTCERCSKTFAAQNLLYRHMRNSHVNYKCEICAASANTKTDLFTHVRECHADHPNVRCAVPGCDKLLRCRADLDRHQRDHRQSAQFHICKFCAEIFTSKLKLKKHLKSIHAKETRFLCYLCLKAYTAFHDLKNHVETAHAAAVDRPNVCPLCAKPCSSRSKLMDHLRYHGSDLNTCKQCMAIFETKEELEHHINNHPGESGDEDLVEEVSELDPNSIMDIIGAPQGGVRVKRELDDEDGNGVEVGPVVKKSKKMSRCRACSQIFSSSADLDKHVKSYHPSKNERSILAKALSKANSGSKDSLSDLEENDDFKDPSFSRSLPPNKLKQSSPRSRKVYSDDFTPSRCEVCGKVWPAKRHLWQHLIRFHRSEAGKCCGICLKLCPSYEALSIHLAQYHASSFDREGTNLTCRVCGKYQNAKSKLQNHALIHPDHMKRAQDSEHVCLLCNGAFTEFKTLCEHFRTIHNITGDTGNDSSPPTSAPQSYNGTAKKLPFLSCDVCSLVFASEVGLANHKRVHEHSDSFKCGQCGEMFATSDGLSKHKTEKHSSADFVCVDCKANFRSYTELINHNRVCRVKRPLPPPPTATTAQTAATPNSDDSASEVASSPRSRSLDDEEDDDLTEESDDDLSETDVDKNEAVEEDDGENDDSSSSSSSSSSSSSSSSDSSSEDEAEDVDEEADGDAEEEEAEEEVEDADDDDDTSEAEEVKSPVKEVRAVEAFVSNDDNMVEVVQIDLMDE

Similar Transcription Factors

Sequence clustering based on sequence similarity using MMseqs2

100% Identity: -
90% Identity: -
80% Identity: -