Basic Information

Insect: Cenopis cana
Gene Symbol: -
Assembly: GCA_951800055.1
Location: OX637496.1:5137261-5152029[-]

Transcription Factor Domain

TF Family: zf-C2H2
Domain: zf-C2H2 domain
PFAM: PF00096
TF Group: Zinc-Coordinating Group
Description: The C2H2 zinc finger is the classical zinc finger domain. The two conserved cysteines and histidines co-ordinate a zinc ion. The following pattern describes the zinc finger. #-X-C-X(1-5)-C-X3-#-X5-#-X2-H-X(3-6)-[H/C] Where X can be any amino acid, and numbers in brackets indicate the number of residues. The positions marked # are those that are important for the stable fold of the zinc finger. The final position can be either his or cys. The C2H2 zinc finger is composed of two short beta strands followed by an alpha helix. The amino terminal part of the helix binds the major groove in DNA binding zinc fingers. The accepted consensus binding sequence for Sp1 is usually defined by the asymmetric hexanucleotide core GGGCGG but this sequence does not include, among others, the GAG (=CTC) repeat that constitutes a high-affinity site for Sp1 binding to the wt1 promoter [1].
Hmmscan Out: # of c-Evalue i-Evalue score bias hmm coord from hmm coord to ali coord from ali coord to env coord from env coord to acc

1 31 0.84 64 5.4 0.5 1 23 241 263 241 263 0.95

2 31 0.23 18 7.2 0.1 2 23 292 314 291 314 0.91

3 31 2.1 1.6e+02 4.1 0.2 2 23 335 357 334 357 0.93

4 31 0.002 0.15 13.7 2.1 2 23 363 385 362 385 0.95

5 31 0.0087 0.67 11.7 0.8 1 23 390 413 390 413 0.96

6 31 0.58 45 5.9 0.1 2 23 416 438 415 438 0.95

7 31 0.037 2.8 9.7 1.6 2 22 445 465 444 465 0.94

8 31 0.0092 0.71 11.6 0.3 1 23 526 549 526 549 0.95

9 31 1.1 88 5.0 0.0 3 23 578 599 576 599 0.92

10 31 0.54 42 6.0 0.7 3 23 623 645 621 645 0.94

11 31 0.0018 0.14 13.8 0.6 3 20 652 669 650 673 0.90

12 31 0.029 2.2 10.0 0.4 1 23 678 701 678 701 0.97

13 31 0.0028 0.21 13.2 0.4 2 23 707 729 707 729 0.94

14 31 0.00013 0.0099 17.4 4.9 1 23 733 756 733 756 0.97

15 31 0.00058 0.045 15.4 0.6 2 23 763 784 762 784 0.96

16 31 0.41 31 6.4 0.6 3 23 825 845 823 845 0.97

17 31 0.073 5.6 8.7 0.0 2 23 873 895 872 895 0.96

18 31 8.9e-05 0.0069 17.9 1.2 2 23 916 938 915 938 0.96

19 31 0.00076 0.059 15.0 1.5 2 23 944 966 943 966 0.92

20 31 5.1e-05 0.0039 18.7 4.3 1 23 971 994 971 994 0.97

21 31 0.2 15 7.4 4.8 1 23 1070 1093 1070 1093 0.96

22 31 0.62 47 5.8 2.7 1 23 1166 1188 1166 1188 0.98

23 31 0.74 57 5.6 0.1 2 23 1214 1236 1213 1236 0.95

24 31 5.3 4.1e+02 2.9 0.1 2 23 1257 1279 1256 1279 0.82

25 31 0.007 0.54 11.9 0.6 2 23 1285 1307 1284 1307 0.94

26 31 0.01 0.77 11.5 0.1 2 23 1493 1515 1492 1515 0.95

27 31 5.5e-05 0.0042 18.6 0.5 2 23 1521 1543 1520 1543 0.92

28 31 0.01 0.78 11.4 0.7 1 23 1548 1571 1548 1571 0.93

29 31 0.00085 0.066 14.8 3.6 1 23 1575 1598 1575 1598 0.97

30 31 0.0076 0.58 11.8 0.7 2 23 1605 1626 1604 1626 0.96

31 31 0.014 1.1 11.0 1.9 1 23 1632 1654 1632 1654 0.97

#	of	c-Evalue	i-Evalue	score	bias	hmm coord from	hmm coord to	ali coord from	ali coord to	env coord from	env coord to	acc
1	31	0.84	64	5.4	0.5	1	23	241	263	241	263	0.95
2	31	0.23	18	7.2	0.1	2	23	292	314	291	314	0.91
3	31	2.1	1.6e+02	4.1	0.2	2	23	335	357	334	357	0.93
4	31	0.002	0.15	13.7	2.1	2	23	363	385	362	385	0.95
5	31	0.0087	0.67	11.7	0.8	1	23	390	413	390	413	0.96
6	31	0.58	45	5.9	0.1	2	23	416	438	415	438	0.95
7	31	0.037	2.8	9.7	1.6	2	22	445	465	444	465	0.94
8	31	0.0092	0.71	11.6	0.3	1	23	526	549	526	549	0.95
9	31	1.1	88	5.0	0.0	3	23	578	599	576	599	0.92
10	31	0.54	42	6.0	0.7	3	23	623	645	621	645	0.94
11	31	0.0018	0.14	13.8	0.6	3	20	652	669	650	673	0.90
12	31	0.029	2.2	10.0	0.4	1	23	678	701	678	701	0.97
13	31	0.0028	0.21	13.2	0.4	2	23	707	729	707	729	0.94
14	31	0.00013	0.0099	17.4	4.9	1	23	733	756	733	756	0.97
15	31	0.00058	0.045	15.4	0.6	2	23	763	784	762	784	0.96
16	31	0.41	31	6.4	0.6	3	23	825	845	823	845	0.97
17	31	0.073	5.6	8.7	0.0	2	23	873	895	872	895	0.96
18	31	8.9e-05	0.0069	17.9	1.2	2	23	916	938	915	938	0.96
19	31	0.00076	0.059	15.0	1.5	2	23	944	966	943	966	0.92
20	31	5.1e-05	0.0039	18.7	4.3	1	23	971	994	971	994	0.97
21	31	0.2	15	7.4	4.8	1	23	1070	1093	1070	1093	0.96
22	31	0.62	47	5.8	2.7	1	23	1166	1188	1166	1188	0.98
23	31	0.74	57	5.6	0.1	2	23	1214	1236	1213	1236	0.95
24	31	5.3	4.1e+02	2.9	0.1	2	23	1257	1279	1256	1279	0.82
25	31	0.007	0.54	11.9	0.6	2	23	1285	1307	1284	1307	0.94
26	31	0.01	0.77	11.5	0.1	2	23	1493	1515	1492	1515	0.95
27	31	5.5e-05	0.0042	18.6	0.5	2	23	1521	1543	1520	1543	0.92
28	31	0.01	0.78	11.4	0.7	1	23	1548	1571	1548	1571	0.93
29	31	0.00085	0.066	14.8	3.6	1	23	1575	1598	1575	1598	0.97
30	31	0.0076	0.58	11.8	0.7	2	23	1605	1626	1604	1626	0.96
31	31	0.014	1.1	11.0	1.9	1	23	1632	1654	1632	1654	0.97

Sequence Information

Coding Sequence: ATGGATTTCGATGAAATTGTAGTAAAAGAAAGCCCCGGCTTGTGCCGGTGCTGTCTGTCCGAAGGATGCTACAAAGACTTGGGTTCGGAATATAGTTGGATGAATGAGACGGAAATTTACGCCGATATGTTACTGGAATGCTTCGATATTAGTATATCCCAACATCCCACGGGGCCCAATGGCTCCAACCGCCTCATCTGCGAGGTGTGCATCACGCGGCTGCGGGACGCCTGCAACTTCAAGAAGCAGGTCCTGGAGTCGGAGAAGAAGTTTGTGGACATGATCGGCCGGGGGGAGTTCAGGCCCAAAGTGCTCCTGTACCAGCCACAGATGAAGACGGAGCTGTCGATGGAACTGGACGAAGAGACGGCCGTCGACGACGGAGGCGAGGTGGAGTACCTCGAGGAAGATGTAGACTTTGTTGATGAGGACCTCCTCAAAAACGAAGACTATGGAGAAGCCTCAGTGTCCGAAGACATTACTGTCTCGGCCTTGGCCGTGAAAGGCAAGCGAGGCCGCCCCAAGAAGACTTCGGCCAAGCCAGTGAAGAAGGCCAAAGTGGCCAAGGTGGAGGAGAAACCGAGCAAATCGAGGGCCGTCGCTAAAGATGTAAAACCGCGGAAATACAAAGGCTGCGAATCGTCTTCGATGCGCAGACGGAAAAACCTCACAATACTTTTCAACAATACCTCAATCATACCCTTCAAATGGAGGGGCAAATACCTCTGCTTCTATTGCAGTAAAGACATAGCCGAATATCCCGCGCTCCGAAAACATACCAAGTCCCACGGACACTGTTCCACCCGCGACCATTCCCTAAAAGTTCTCAAAGGAGGCCAAAACATGGAAATCAAAATCGACATATCCGATATCACTTGTGAAATCTGCAGCGAACCTTTTCCTACCTTCGATGATATCATCACTCAcctatttaataaacataagtTAGAGTATGACAGAAGCGTCGAAATGGCCATAGAAGAGTATAGGCTAGTCGATCTTAAATGTTTAGCTTGTGAAGAAAAATTCGCGTATTTCGGTTACCTAGTATCACACGTCAACAATAGCCATCCCAAAAACTGCCTCATCTGTGATAAGTGCGAGCAAAAGTTTAATAAGAAACGAGATCTGTTTTCGCACATGAAGAACTATCATAGAGAAGGAGGTTATCAGTGCGAACTCTGCCCTTTAAGTTTCAGCTCTCTAAATATACTTAGGAAACATAGAAATAACCGTCATTTGACTAGGTGTAGTATTTGCCAACTGAAATTACCTTCAGCGGCTCTAAAACAAAAGCATATGGAAGTTGAGCATCCTGACGATGGCTCTTTGCAATGTGATAATTGCTTCAAAGAGTTCCACACGAAACAAGGTCTCCGAATGCATGTTAGAAAGTGCAAAGGTGAAGATGAGCTGTTCAATgtagaaataaggaaaaaagacTACGACCCTATGGATCTTGATCAGAATTATGAAGACCCTGTTAAAAGGCCGAGCGTAAAACAAATTAGGGAAAATATAGTCATAGTTATCAACATGTCAACAGCTATTCCTTTTAATttctataaaaacaaatttaactGCTTTTACTGTTCCAAAGACTTTCCCGATTCAGACTTAATGCGAGAACATACTATAATAGAACACCCTACGTGCGACGTGAAACAGAAATGTATTAGAAAATGTAGGGAGTCGGTAGCATGCGTTAAAATTGACATTTCTTCCCTAGCGTGTAAACTATGCTTCGAATCCCTGCCAGACTTAGACACTCTTATAGACCATCTAATCTTAAAACATGACGCGAACTACGACAAATCAATAACGACCTGCTTACAACCGTACAGGCTTATCAAAGACCATATGGCCTGCCCACATTGTCCAGGCGAAGACTTCAGATTCTTCGGTACTCTCTTAAAACACATGAACAACAAACATActaacaataacattatttgcGTATATTGCGGCCAAACTTTTAGGCGTGATCAGAACCTGCGTGTTCATATATGGCGTCACCATAGAGATGGTAGATTCAAATGTAATATTTGCGGTGCAGAATGTAACATACCCTCTAGGTTATATATGCATATGGCTAAAGCTCACGGAGTCAAGGCTGCTAAATGTCCTAAATGCTCAGAGAGTTTTGCCACACAGTACTTAAGACAGAAACACCTGATTGAAGCCCACGATTCAGGCCACAAGTGTACGTATTGTGGGAAATTATTCACTAGGAACTCTTTCATGAGGGACCACATAAGGAGGACCCATCTGAAGGAGAAAAACGTAGAATGCTCAATCTGTAATATGAAGTTCTTCAACAATATTCTTCTCAGACGTCATATGGTGAAGCATAGCGATATAAAACACCGGTCAATCGGCGGGCTGAGCGCTACTGAACGTAGGAGAAAAAACCTCGTCATACTTTTCAACAACACAACAGTAGTACCCTTTAAAAGCGGCAGCCAATATGGCTGCTTCTACTGCGGGGACAAATACCCCGACTATAAGGAGTTCGTTAAACACACAAAGTCTCACGGCCCGTGCAACGTTAAACACAAGTCATTAGTCAGCCAAAAGTTTGGCACTGTAGAAGTCAAGTTAGACATATCAAACATCACCTGTGAATTGTGCGAAGAACCTTTCAATAATTTAGACGATATCGTATCCCATCTAATTACTAAACACAGTCTAAATTATGATAGAGAAGCCCCCATGTCTCTGTCCGCTTACCGACTAGTAGATCTCAAGTGCACGGAATGCGGCAAAACTTTTGAATATTTCCGTAATCTAGTTATGCATGTGAGGAAAAATCATATGGAGAAGCTCTTGCCATGCGAACAATGTGATAGAAGCTTTAATAAGAAATCAGAATTGATGGCTCACTGTAGGATATACCACAGACGTGCCGGGTACCAGTGTACGAAGTGTGAACGATGCTTCCGCACCTCTAGCTTGCTGAGGCTACATCTCATGAATACCCACGGTTCCTCTGAACGCAAATGCACAAGAATCCTATCCAGTTTGAGAGCGAGGAGCTCCCACTATCTAAAAATTCCCGAAAACATCGAGGATTCGGAGGACTGTGTAATAGAAACGCAGCGTAAAAGACTACGCGAACGAAACGCATTAGCTAAAAGGAATCGCGAGAATATAGCATGCATTCTGAACATGACTACCGCTATACCGTTCAAGTACTATCAAAACAGATTCACGTGTTTTCATTGTTCTAAAGACTTCAACGAGCACGAAGACATGCGAACACATACGCTAATGGAACACCCGTTTTTTGATTTGGAGAGAAAATGCCCTAAAAGTCTTAAAGGTGTTAATTTGTGCATTAAACTCGACATTTCGTCGCTATCTTGTAGAATTTGTTTCGAGTCGTTCAATGATTTTGATGATACGCACAAAATGGCCTGCGAAACGGCGAGGCAGCAAAATCTGCAAATACTGTTTCGCAGCACCAGCGTCATACCATTCCGATGGAACAAGCGTTTTTCGTGTAGCTACTGTAGCTATAGCGAGATTCAGTGCGACGAACTAGTCAAACATACCAAGTCGCACGACAAAAGCGTAATAGAGGACTTTTTGTCGAAACTTCAGCCTAAAGTCATTCTTAAAGTCGACGTTTCTGAAACCACTTGCGAGCTTTGCGATGCGAACTCCCAAAACTTAGATAGTCTTACGGATCACCTCGTTACGGTGCATGATTTGAAGTACCATAGGCAAGTCGAAATGCGCATAGAGCTATTTAAATTGATAAACCTCAGTTGTCCATTGTGTGAGGAACATTTTACAGAAATGGAAATTCTAAATGCTCATGTCGTTTCACGGCATTCAAACGTCAATTTACAATGTGAATTGTGTTCTGAAATGTTCGCTAAGAAAAAGGATTTAAAATTACACAAGCAACTGGATCACTCtgataattatgattatgatgctCAGATTATCCGTATCAAAGAAGAACCAGATGTTAGAGTGAGTAAGAAAGACGTCGCCGCAATAGATAAGAAGAGGATAGCTAAGCTCAGGCGGGAGAATATTGCTTGTATCTTAAACACGTCCACGGCTTTGCCTTTTAAGTTCTACATGAATCGATTTCGTTGTTTTTATTGTTCGAAGAATCATACAGaatttgaatcaatcaaaagcCATATGGTCACCATACATCCTTACTGCGATCCGGCGGGGAAAGCCCTGAAAGCAGTGAAAGGGAAAGATGCTATCGTTAAAGTAGACATTAGTTCCCTCGCTTGCAAGTTGTGTTGCATGTCAATTAGCGATCTAGACGCCCTCTACGACCATCTAATATCAAATCATAAAATGAAATACGATAAGTCGATGACGAGTATAGTACAACCTTTTAAAATAGCGAAGGACAACATGGCATGCCCACTCTGTCCCGACGTTGGTTTTAGGTATTTTGTAAAGCTGTTAGAACACATGAATGAAAGCCATTCCGATAACAACGTAGTGTGCGTATATTGCGGCCAAACTTTTAGGAGTACACCGTCATATAGAGGTCATATAGCGAGGTATCACAGACCAAACTCGTGCCAGTGTCCTGAATGTGATTTGAATTTTTCTAATCCATCCAAACTTACGGCTCATAGAGCTAACGCTCACGGAATAAATGCATTCAAATGCTCAAAATGCGACGAGAAGTTTGCTACAATATATCTTAGACAGAAACATCTAATAGACGCCCATAGCTCGGGACACAAATGTACTTTCTGCGACAGACTATTCGCTAGGAACTCCTATATGAAGGACCATATAAGGAGGTTGCATTTGAAAGAAAAGAACGTGGAATGTTCAGTCTGCAAAGAGAAGTTCTTTGACAAGACTAGACTGAACATACACATGGTGAAACATATCGGGGAGAGAAATTATCACTGTGATATATGCGGAAAAACTTTTCTATGGAAGAAAAACTTAAGAGGCCACATGTCTTCACACAAACGGAGTGCTTGA
Protein Sequence: MDFDEIVVKESPGLCRCCLSEGCYKDLGSEYSWMNETEIYADMLLECFDISISQHPTGPNGSNRLICEVCITRLRDACNFKKQVLESEKKFVDMIGRGEFRPKVLLYQPQMKTELSMELDEETAVDDGGEVEYLEEDVDFVDEDLLKNEDYGEASVSEDITVSALAVKGKRGRPKKTSAKPVKKAKVAKVEEKPSKSRAVAKDVKPRKYKGCESSSMRRRKNLTILFNNTSIIPFKWRGKYLCFYCSKDIAEYPALRKHTKSHGHCSTRDHSLKVLKGGQNMEIKIDISDITCEICSEPFPTFDDIITHLFNKHKLEYDRSVEMAIEEYRLVDLKCLACEEKFAYFGYLVSHVNNSHPKNCLICDKCEQKFNKKRDLFSHMKNYHREGGYQCELCPLSFSSLNILRKHRNNRHLTRCSICQLKLPSAALKQKHMEVEHPDDGSLQCDNCFKEFHTKQGLRMHVRKCKGEDELFNVEIRKKDYDPMDLDQNYEDPVKRPSVKQIRENIVIVINMSTAIPFNFYKNKFNCFYCSKDFPDSDLMREHTIIEHPTCDVKQKCIRKCRESVACVKIDISSLACKLCFESLPDLDTLIDHLILKHDANYDKSITTCLQPYRLIKDHMACPHCPGEDFRFFGTLLKHMNNKHTNNNIICVYCGQTFRRDQNLRVHIWRHHRDGRFKCNICGAECNIPSRLYMHMAKAHGVKAAKCPKCSESFATQYLRQKHLIEAHDSGHKCTYCGKLFTRNSFMRDHIRRTHLKEKNVECSICNMKFFNNILLRRHMVKHSDIKHRSIGGLSATERRRKNLVILFNNTTVVPFKSGSQYGCFYCGDKYPDYKEFVKHTKSHGPCNVKHKSLVSQKFGTVEVKLDISNITCELCEEPFNNLDDIVSHLITKHSLNYDREAPMSLSAYRLVDLKCTECGKTFEYFRNLVMHVRKNHMEKLLPCEQCDRSFNKKSELMAHCRIYHRRAGYQCTKCERCFRTSSLLRLHLMNTHGSSERKCTRILSSLRARSSHYLKIPENIEDSEDCVIETQRKRLRERNALAKRNRENIACILNMTTAIPFKYYQNRFTCFHCSKDFNEHEDMRTHTLMEHPFFDLERKCPKSLKGVNLCIKLDISSLSCRICFESFNDFDDTHKMACETARQQNLQILFRSTSVIPFRWNKRFSCSYCSYSEIQCDELVKHTKSHDKSVIEDFLSKLQPKVILKVDVSETTCELCDANSQNLDSLTDHLVTVHDLKYHRQVEMRIELFKLINLSCPLCEEHFTEMEILNAHVVSRHSNVNLQCELCSEMFAKKKDLKLHKQLDHSDNYDYDAQIIRIKEEPDVRVSKKDVAAIDKKRIAKLRRENIACILNTSTALPFKFYMNRFRCFYCSKNHTEFESIKSHMVTIHPYCDPAGKALKAVKGKDAIVKVDISSLACKLCCMSISDLDALYDHLISNHKMKYDKSMTSIVQPFKIAKDNMACPLCPDVGFRYFVKLLEHMNESHSDNNVVCVYCGQTFRSTPSYRGHIARYHRPNSCQCPECDLNFSNPSKLTAHRANAHGINAFKCSKCDEKFATIYLRQKHLIDAHSSGHKCTFCDRLFARNSYMKDHIRRLHLKEKNVECSVCKEKFFDKTRLNIHMVKHIGERNYHCDICGKTFLWKKNLRGHMSSHKRSA

Similar Transcription Factors

Sequence clustering based on sequence similarity using MMseqs2

100% Identity: -
90% Identity: -
80% Identity: -