Basic Information

Insect: Cenopis cana
Gene Symbol: -
Assembly: GCA_951800055.1
Location: OX637482.1:7039425-7058810[-]

Transcription Factor Domain

TF Family: zf-C2H2
Domain: zf-C2H2 domain
PFAM: PF00096
TF Group: Zinc-Coordinating Group
Description: The C2H2 zinc finger is the classical zinc finger domain. The two conserved cysteines and histidines co-ordinate a zinc ion. The following pattern describes the zinc finger. #-X-C-X(1-5)-C-X3-#-X5-#-X2-H-X(3-6)-[H/C] Where X can be any amino acid, and numbers in brackets indicate the number of residues. The positions marked # are those that are important for the stable fold of the zinc finger. The final position can be either his or cys. The C2H2 zinc finger is composed of two short beta strands followed by an alpha helix. The amino terminal part of the helix binds the major groove in DNA binding zinc fingers. The accepted consensus binding sequence for Sp1 is usually defined by the asymmetric hexanucleotide core GGGCGG but this sequence does not include, among others, the GAG (=CTC) repeat that constitutes a high-affinity site for Sp1 binding to the wt1 promoter [1].
Hmmscan Out: # of c-Evalue i-Evalue score bias hmm coord from hmm coord to ali coord from ali coord to env coord from env coord to acc

1 21 0.00013 0.01 17.4 1.5 1 23 405 427 405 427 0.96

2 21 0.0064 0.49 12.1 0.6 1 20 433 452 433 455 0.94

3 21 4.5e-05 0.0035 18.8 4.6 1 23 474 496 474 496 0.98

4 21 0.00029 0.022 16.3 4.7 1 23 502 524 502 524 0.99

5 21 5.7e-05 0.0044 18.5 5.3 1 23 530 552 530 552 0.97

6 21 1.2e-05 0.00094 20.6 7.1 1 23 558 580 558 580 0.97

7 21 1.1e-06 8.4e-05 23.9 2.9 1 23 586 608 586 608 0.97

8 21 0.00016 0.012 17.1 6.7 1 23 614 636 614 636 0.97

9 21 3e-05 0.0023 19.4 6.4 1 23 642 664 642 664 0.98

10 21 7.4e-07 5.7e-05 24.4 1.9 1 23 670 692 670 692 0.98

11 21 7.6e-05 0.0058 18.1 7.9 1 23 698 720 698 720 0.98

12 21 2.9e-05 0.0022 19.4 2.2 1 21 726 746 726 746 0.96

13 21 7.6e-06 0.00058 21.3 2.6 2 23 746 767 745 767 0.97

14 21 2e-05 0.0015 20.0 5.4 1 23 773 795 773 795 0.98

15 21 1.2e-05 0.00094 20.6 5.9 1 23 801 823 801 823 0.97

16 21 3.4e-05 0.0026 19.2 7.1 1 23 829 851 829 851 0.97

17 21 4.7e-06 0.00036 21.9 6.0 1 23 857 879 857 879 0.98

18 21 0.00021 0.016 16.8 10.0 1 23 885 907 885 907 0.97

19 21 1.5e-06 0.00011 23.5 4.2 1 23 913 935 913 935 0.98

20 21 0.0011 0.086 14.5 0.3 1 23 942 964 942 964 0.96

21 21 0.048 3.7 9.3 5.1 1 23 974 996 974 996 0.99

#	of	c-Evalue	i-Evalue	score	bias	hmm coord from	hmm coord to	ali coord from	ali coord to	env coord from	env coord to	acc
1	21	0.00013	0.01	17.4	1.5	1	23	405	427	405	427	0.96
2	21	0.0064	0.49	12.1	0.6	1	20	433	452	433	455	0.94
3	21	4.5e-05	0.0035	18.8	4.6	1	23	474	496	474	496	0.98
4	21	0.00029	0.022	16.3	4.7	1	23	502	524	502	524	0.99
5	21	5.7e-05	0.0044	18.5	5.3	1	23	530	552	530	552	0.97
6	21	1.2e-05	0.00094	20.6	7.1	1	23	558	580	558	580	0.97
7	21	1.1e-06	8.4e-05	23.9	2.9	1	23	586	608	586	608	0.97
8	21	0.00016	0.012	17.1	6.7	1	23	614	636	614	636	0.97
9	21	3e-05	0.0023	19.4	6.4	1	23	642	664	642	664	0.98
10	21	7.4e-07	5.7e-05	24.4	1.9	1	23	670	692	670	692	0.98
11	21	7.6e-05	0.0058	18.1	7.9	1	23	698	720	698	720	0.98
12	21	2.9e-05	0.0022	19.4	2.2	1	21	726	746	726	746	0.96
13	21	7.6e-06	0.00058	21.3	2.6	2	23	746	767	745	767	0.97
14	21	2e-05	0.0015	20.0	5.4	1	23	773	795	773	795	0.98
15	21	1.2e-05	0.00094	20.6	5.9	1	23	801	823	801	823	0.97
16	21	3.4e-05	0.0026	19.2	7.1	1	23	829	851	829	851	0.97
17	21	4.7e-06	0.00036	21.9	6.0	1	23	857	879	857	879	0.98
18	21	0.00021	0.016	16.8	10.0	1	23	885	907	885	907	0.97
19	21	1.5e-06	0.00011	23.5	4.2	1	23	913	935	913	935	0.98
20	21	0.0011	0.086	14.5	0.3	1	23	942	964	942	964	0.96
21	21	0.048	3.7	9.3	5.1	1	23	974	996	974	996	0.99

Sequence Information

Coding Sequence: ATGAATTCGGAGCATCACAATATCAACACGGGTGGCGGCCAGCCCCCAGGAAATTCAGAGCAGCAGTCGGCGAATCTGACTCCGACGACGTCCGCCACAGACCTACGGGTGAACTCCGCGGCTGTAAATGTCGCTTTGTCTAGCGTTGCAAAGTACTGGGTGTTTACAAATCTTTTTCCGGGACCCATACCGCAAGTGTCGGTGTACGGGTTGCCCACTGGAACGAGGATAGAAAATGGGAAACCAGTGCAGGACCTTGGTCAAGCCCATGCGAGCATACTCAATGGGGACCCCAACATTATACTTGGACATCCGGGACAGACTCAAGTCACTGTCTCGGCAGCGCAACAGTTACCACAAATCATTGCTACACAGACACAAACACATGATGTCCTAGCCCATGTTCAGCAACAAGAGCTAGCATCCCAGCATGGTACAGGCAGCTCCGGTCAGGTCACAGCTAATACGGGTCAAACAACGCATCAGCAGGTAGCCAATAATCGGGTCGAGTTTGTACACCATAACATTGATATGGGTCACCACTCGCAACAACACATAATGCAGCAGCAGCTGATGGCGGCAACGCGTCCAGAACACTCCAACCAGCAGATCCAGCTAACAGTGAGTGAAGACGGGATCGTCACAGTGGTAGACCCGGGCGGGGGCAAACTTGTGGATAAAGAAGAGTTGCATGAAGCCATCAAAATGCCTGCGGACCACACCCTTACTGTGCACCAGCTACAGCAAATTGTGGGGCAACAGGTGCTAGAAAACGTAGTCCGCATCGAGCAGGCCACGGGCGAGCCGGCCAACATCCTCGTTACGCAGAACCCAGATGGCACCACGTCGATAGAGGCCAGCGCCGCGGATCCGCTCGCCATCGTCAAGGACGAGAAAAGTGCATCGAAGATAGAGACCGCGCACTTCGCGCTGCCCGCCGAGATCAAGGACCTTAAGAGCATCGACTTAAAGAGTGTAGGAGCGATGGGAATGGAAGGAGCAGTAGTGAAGATATCCGCGGGAGCCGCGGACCACGACATGCACGCCATGTACAAGGTCAACGTGGAAGATCTCTCGCAACTGCTGGCCTACCACGAAGTCTTTGGCAAACTCAATGCCGATGGCCAGCCCCAAGCCAAAGTAATAGGTGAAGTGGAGGTGGAAGCAGGGACTAGCGCTGCCATGTCCGCGGAAGAGAACTCACCCGGACACCATGCGTGCGATATTTGTGGGAAAATATTCCAATTTCGATATCAACTCATTGTTCATAGACGATACCACGGCGAAAGGAAACCGTTCACGTGTCAAGTATGCGGCTCGGCCTTCGCCAATCCCGTGGAGCTGTCGAGACACGGGAAATGCCATCTTGCCGGCGACTCTGCAGACAGGACCGCCAAGCGGTTGACCCAGGACAAACCCTACGCGTGCACCACCTGCCATAAAACGTTCGCGCGGAAGGAGCATCTCGACAACCACGTGCGCAGCCATACCGGGGAGACACCCTACAGATGTCAATTCTGCGCCAAGACGTTCACCCGGAAGGAGCATATGGTGAACCACGTGCGCAAGCACACGGGCGAGACGCCGCATCGCTGCGATATCTGCAAAAAGAGTTTTACCAGGAAGGAGCACTTCATGAACCACGTCATGTGGCACACAGGTGAAACTCCACACCATTGTCAAATTTGCGGCAAGAAGTATACTAGGAAGGAGCACTTAGCGAACCATATGAGATCACATACGAATGATACCCCATTCCGCTGCGAGCTCTGTGGCAAGTCTTTCACGAGAAAGGAACACTTCACCAATCACATACTGTGGCATACCGgcgAAACGCCCCACCGCTGCGACTTCTGTTCGAAGACATTCACCCGCAAAGAACACTTACTGAACCACGTGCGACAACACACGGGCGAGTCTCCGCACCGCTGCAACTACTGCTCCAAGTCGTTCACTCGCCGCGAGCACCTCGTCAACCACGTGCGCCAGCACACCGGCGAGACGCCCTTCCAGTGCGGCTACTGTCCCAAGGCCTTCACGAGGAAGGACCACTTAGTGAACCACGTGCGCCAGCACACCGGCGAGTCCCCGCACAAGTGCTCGTTCTGCACCAAGTCGTTCACCCGCAAGGAGCACCTCACCAACCACGTGCGCCAGCACACGGGCGAGTCCCCGCACCGGTGCACGTACTGCGCCAAGTCGTTCACGAGGAAGGAGCACCTCAACAACCACGTCAGGTGCACGTACTGCGCCAAGTCGTTCACGAGGAAGGAGCACCTCAACAACCACGTCAGACAGCATACGGGGGAAACGCCGCACAAGTGCACGTTCTGTCCGAAGGCGTACTCGAGGAAGGAACATCTCAACAACCACATCAGACAACACACGGGTGACGCGCCACACTCGTGCTCCTACTGCAACAAGAGCTTCTCCAGGAAGGAGCATCTCGTTAACCACGTGCGGCAACACACAGGCGAGACGCCGTTTAAATGCACGTATTGCTCGAAGTCGTTTTCGCGCAAGGAGCATCTCACGAACCACGTCCACCTACATACCGGTGAGACGCCGCACAAGTGCCCCTTCTGTACCAAGACCTTCTCGCGTAAGGAGCACTTGACCAACCACGTCAGAATACACACCGGCGAATCCCCTCACCGCTGCGAATTCTGCCACAAGACGTTCACCCGCAAGGAGCACCTCACCAACCACCTGAAGCAGCACACCGGCGACACGCCGCACACCTGCAAGGTGTGCTCCAAGGCTTTCACGCGCAAGGAGCATCTCGTCGCGCACATGAGATCGCACAGTTGCGGCGAGCGGCCGTTCAGCTGCGGCGAGTGCGGCAAGTCGTTCCCTCTGAAGGGCAACCTGCTGTTCCACGAGCGCTCGCACAACAAGAACGCCGGCGGCGCCCGGCCCTTCCGCTGCGACGTCTGCTCTAAGGACTTCATGTGCAAAGGGCACCTGGCGTCGCACCGGCGCACGCACGCGGCGGCCGCGGACGCGGAGCCGGCGCCGGAGCCCGAGGACTGCGGCGACTGCGTCAAGTGCGAGAAGGAACCCGAGCCCGAGAGGAAGCACGACGTCAGacCGGCAGCGGAAACGAGGCCGGCCGACGGAGCTGTAGCACAAACCCCCCAAGCAAACGCAACTGTGATGCAAATTACCAGCCAACAAGTCCGCGCGCCGACCGTGGGGCTGGACGCGGCAGGCGCCGCCTTCGCGCACCCCGTCACCGTCAACTATTAA
Protein Sequence: MNSEHHNINTGGGQPPGNSEQQSANLTPTTSATDLRVNSAAVNVALSSVAKYWVFTNLFPGPIPQVSVYGLPTGTRIENGKPVQDLGQAHASILNGDPNIILGHPGQTQVTVSAAQQLPQIIATQTQTHDVLAHVQQQELASQHGTGSSGQVTANTGQTTHQQVANNRVEFVHHNIDMGHHSQQHIMQQQLMAATRPEHSNQQIQLTVSEDGIVTVVDPGGGKLVDKEELHEAIKMPADHTLTVHQLQQIVGQQVLENVVRIEQATGEPANILVTQNPDGTTSIEASAADPLAIVKDEKSASKIETAHFALPAEIKDLKSIDLKSVGAMGMEGAVVKISAGAADHDMHAMYKVNVEDLSQLLAYHEVFGKLNADGQPQAKVIGEVEVEAGTSAAMSAEENSPGHHACDICGKIFQFRYQLIVHRRYHGERKPFTCQVCGSAFANPVELSRHGKCHLAGDSADRTAKRLTQDKPYACTTCHKTFARKEHLDNHVRSHTGETPYRCQFCAKTFTRKEHMVNHVRKHTGETPHRCDICKKSFTRKEHFMNHVMWHTGETPHHCQICGKKYTRKEHLANHMRSHTNDTPFRCELCGKSFTRKEHFTNHILWHTGETPHRCDFCSKTFTRKEHLLNHVRQHTGESPHRCNYCSKSFTRREHLVNHVRQHTGETPFQCGYCPKAFTRKDHLVNHVRQHTGESPHKCSFCTKSFTRKEHLTNHVRQHTGESPHRCTYCAKSFTRKEHLNNHVRCTYCAKSFTRKEHLNNHVRQHTGETPHKCTFCPKAYSRKEHLNNHIRQHTGDAPHSCSYCNKSFSRKEHLVNHVRQHTGETPFKCTYCSKSFSRKEHLTNHVHLHTGETPHKCPFCTKTFSRKEHLTNHVRIHTGESPHRCEFCHKTFTRKEHLTNHLKQHTGDTPHTCKVCSKAFTRKEHLVAHMRSHSCGERPFSCGECGKSFPLKGNLLFHERSHNKNAGGARPFRCDVCSKDFMCKGHLASHRRTHAAAADAEPAPEPEDCGDCVKCEKEPEPERKHDVRPAAETRPADGAVAQTPQANATVMQITSQQVRAPTVGLDAAGAAFAHPVTVNY

Similar Transcription Factors

Sequence clustering based on sequence similarity using MMseqs2

100% Identity: iTF_00654500; iTF_01265028; iTF_01246113; iTF_01463492; iTF_00660519; iTF_00462598; iTF_00021518; iTF_00155502; iTF_00325634; iTF_00156453; iTF_00658638; iTF_01072771; iTF_01464363; iTF_00022997; iTF_00656346; iTF_00680814; iTF_00773070; iTF_01135983; iTF_00410531; iTF_01135004; iTF_00148661; iTF_00149653; iTF_01438226; iTF_00412726; iTF_00871543; iTF_01134018; iTF_00659613; iTF_00659620; iTF_00010400; iTF_00009313;
90% Identity: iTF_00680814;
80% Identity: -