Basic Information

Insect: Anisolabis maritima
Gene Symbol: -
Assembly: GCA_010014785.1
Location: JAAAKE010007611.1:2225-7781[+]

Transcription Factor Domain

TF Family: zf-C2H2
Domain: zf-C2H2 domain
PFAM: PF00096
TF Group: Zinc-Coordinating Group
Description: The C2H2 zinc finger is the classical zinc finger domain. The two conserved cysteines and histidines co-ordinate a zinc ion. The following pattern describes the zinc finger. #-X-C-X(1-5)-C-X3-#-X5-#-X2-H-X(3-6)-[H/C] Where X can be any amino acid, and numbers in brackets indicate the number of residues. The positions marked # are those that are important for the stable fold of the zinc finger. The final position can be either his or cys. The C2H2 zinc finger is composed of two short beta strands followed by an alpha helix. The amino terminal part of the helix binds the major groove in DNA binding zinc fingers. The accepted consensus binding sequence for Sp1 is usually defined by the asymmetric hexanucleotide core GGGCGG but this sequence does not include, among others, the GAG (=CTC) repeat that constitutes a high-affinity site for Sp1 binding to the wt1 promoter [1].
Hmmscan Out: # of c-Evalue i-Evalue score bias hmm coord from hmm coord to ali coord from ali coord to env coord from env coord to acc

1 49 0.0006 0.2 14.0 1.1 1 23 12 34 12 34 0.97

2 49 0.052 17 7.9 2.9 1 23 116 138 116 138 0.98

3 49 0.00048 0.16 14.3 2.5 1 23 173 196 173 196 0.95

4 49 0.4 1.3e+02 5.1 1.2 1 23 199 221 199 221 0.96

5 49 0.011 3.8 10.0 3.3 1 19 227 245 227 245 0.98

6 49 0.00064 0.21 13.9 0.7 1 23 270 293 270 293 0.93

7 49 1.6 5.2e+02 3.3 1.1 1 23 296 318 296 318 0.95

8 49 0.0032 1.1 11.7 3.8 1 23 324 347 324 347 0.97

9 49 2.9e-06 0.00096 21.3 0.6 2 23 350 371 350 371 0.98

10 49 0.0028 0.94 11.9 2.9 1 23 418 441 418 441 0.97

11 49 3.7e-05 0.012 17.8 0.4 2 23 444 465 443 465 0.97

12 49 0.00033 0.11 14.8 3.0 1 23 467 490 467 490 0.97

13 49 0.00036 0.12 14.7 0.2 2 23 492 514 492 514 0.95

14 49 0.0012 0.4 13.1 3.4 1 23 516 539 516 539 0.97

15 49 0.0017 0.57 12.6 0.2 2 23 542 563 541 563 0.97

16 49 0.00014 0.046 16.0 2.2 1 23 565 587 565 587 0.97

17 49 5.2e-05 0.017 17.4 0.2 2 23 592 613 591 613 0.97

18 49 0.0048 1.6 11.2 0.7 1 23 615 638 615 638 0.97

19 49 6.4e-05 0.021 17.1 4.1 1 23 662 685 662 685 0.97

20 49 0.0083 2.7 10.4 0.1 2 23 687 708 686 708 0.97

21 49 0.0012 0.4 13.0 1.7 1 23 710 733 710 733 0.96

22 49 0.0012 0.41 13.0 0.3 2 23 735 756 734 756 0.97

23 49 0.011 3.6 10.0 4.7 1 23 758 781 758 781 0.97

24 49 0.0046 1.5 11.2 0.1 2 23 783 804 782 804 0.96

25 49 2.8e-06 0.00094 21.3 3.8 1 23 806 828 806 829 0.96

26 49 0.45 1.5e+02 5.0 0.3 2 23 831 851 831 851 0.95

27 49 1.7e-05 0.0058 18.9 5.6 1 23 853 876 853 876 0.97

28 49 0.091 30 7.2 0.4 2 23 878 898 878 898 0.96

29 49 4.4e-07 0.00015 23.9 2.0 1 23 900 923 900 923 0.97

30 49 1.3e-05 0.0044 19.2 2.0 1 23 944 967 944 967 0.97

31 49 5.7 1.9e+03 1.5 0.4 2 23 969 989 969 989 0.76

32 49 0.013 4.4 9.8 1.2 2 23 992 1014 991 1014 0.95

33 49 0.22 74 5.9 0.5 2 23 1016 1036 1016 1036 0.96

34 49 3.3e-05 0.011 18.0 2.4 1 23 1038 1061 1038 1061 0.97

35 49 0.026 8.6 8.9 0.2 2 23 1063 1084 1062 1084 0.97

36 49 1.9e-06 0.00063 21.9 1.7 2 23 1087 1109 1086 1109 0.95

37 49 0.00044 0.14 14.4 0.2 2 23 1111 1132 1111 1132 0.97

38 49 4.6e-07 0.00015 23.8 2.1 1 23 1134 1156 1134 1156 0.98

39 49 1.4e-05 0.0048 19.1 1.2 1 23 1164 1186 1164 1186 0.97

40 49 0.00037 0.12 14.7 0.2 2 23 1188 1209 1188 1209 0.98

41 49 2.4e-05 0.008 18.4 3.5 1 23 1211 1234 1211 1234 0.93

42 49 1.4e-05 0.0048 19.1 0.6 1 23 1256 1278 1256 1278 0.97

43 49 6.7e-05 0.022 17.0 4.0 1 23 1298 1321 1298 1321 0.97

44 49 1.7e-05 0.0055 18.9 1.7 2 23 1324 1345 1323 1345 0.98

45 49 0.56 1.8e+02 4.7 0.5 5 23 1355 1374 1351 1374 0.88

46 49 1.5 5.1e+02 3.3 0.6 1 23 1377 1399 1377 1399 0.91

47 49 1.2e-05 0.004 19.3 1.0 1 23 1406 1429 1406 1429 0.97

48 49 0.00026 0.085 15.2 5.9 1 23 1484 1506 1484 1507 0.95

49 49 1.7 5.6e+02 3.2 6.1 2 21 1600 1619 1599 1624 0.92

#	of	c-Evalue	i-Evalue	score	bias	hmm coord from	hmm coord to	ali coord from	ali coord to	env coord from	env coord to	acc
1	49	0.0006	0.2	14.0	1.1	1	23	12	34	12	34	0.97
2	49	0.052	17	7.9	2.9	1	23	116	138	116	138	0.98
3	49	0.00048	0.16	14.3	2.5	1	23	173	196	173	196	0.95
4	49	0.4	1.3e+02	5.1	1.2	1	23	199	221	199	221	0.96
5	49	0.011	3.8	10.0	3.3	1	19	227	245	227	245	0.98
6	49	0.00064	0.21	13.9	0.7	1	23	270	293	270	293	0.93
7	49	1.6	5.2e+02	3.3	1.1	1	23	296	318	296	318	0.95
8	49	0.0032	1.1	11.7	3.8	1	23	324	347	324	347	0.97
9	49	2.9e-06	0.00096	21.3	0.6	2	23	350	371	350	371	0.98
10	49	0.0028	0.94	11.9	2.9	1	23	418	441	418	441	0.97
11	49	3.7e-05	0.012	17.8	0.4	2	23	444	465	443	465	0.97
12	49	0.00033	0.11	14.8	3.0	1	23	467	490	467	490	0.97
13	49	0.00036	0.12	14.7	0.2	2	23	492	514	492	514	0.95
14	49	0.0012	0.4	13.1	3.4	1	23	516	539	516	539	0.97
15	49	0.0017	0.57	12.6	0.2	2	23	542	563	541	563	0.97
16	49	0.00014	0.046	16.0	2.2	1	23	565	587	565	587	0.97
17	49	5.2e-05	0.017	17.4	0.2	2	23	592	613	591	613	0.97
18	49	0.0048	1.6	11.2	0.7	1	23	615	638	615	638	0.97
19	49	6.4e-05	0.021	17.1	4.1	1	23	662	685	662	685	0.97
20	49	0.0083	2.7	10.4	0.1	2	23	687	708	686	708	0.97
21	49	0.0012	0.4	13.0	1.7	1	23	710	733	710	733	0.96
22	49	0.0012	0.41	13.0	0.3	2	23	735	756	734	756	0.97
23	49	0.011	3.6	10.0	4.7	1	23	758	781	758	781	0.97
24	49	0.0046	1.5	11.2	0.1	2	23	783	804	782	804	0.96
25	49	2.8e-06	0.00094	21.3	3.8	1	23	806	828	806	829	0.96
26	49	0.45	1.5e+02	5.0	0.3	2	23	831	851	831	851	0.95
27	49	1.7e-05	0.0058	18.9	5.6	1	23	853	876	853	876	0.97
28	49	0.091	30	7.2	0.4	2	23	878	898	878	898	0.96
29	49	4.4e-07	0.00015	23.9	2.0	1	23	900	923	900	923	0.97
30	49	1.3e-05	0.0044	19.2	2.0	1	23	944	967	944	967	0.97
31	49	5.7	1.9e+03	1.5	0.4	2	23	969	989	969	989	0.76
32	49	0.013	4.4	9.8	1.2	2	23	992	1014	991	1014	0.95
33	49	0.22	74	5.9	0.5	2	23	1016	1036	1016	1036	0.96
34	49	3.3e-05	0.011	18.0	2.4	1	23	1038	1061	1038	1061	0.97
35	49	0.026	8.6	8.9	0.2	2	23	1063	1084	1062	1084	0.97
36	49	1.9e-06	0.00063	21.9	1.7	2	23	1087	1109	1086	1109	0.95
37	49	0.00044	0.14	14.4	0.2	2	23	1111	1132	1111	1132	0.97
38	49	4.6e-07	0.00015	23.8	2.1	1	23	1134	1156	1134	1156	0.98
39	49	1.4e-05	0.0048	19.1	1.2	1	23	1164	1186	1164	1186	0.97
40	49	0.00037	0.12	14.7	0.2	2	23	1188	1209	1188	1209	0.98
41	49	2.4e-05	0.008	18.4	3.5	1	23	1211	1234	1211	1234	0.93
42	49	1.4e-05	0.0048	19.1	0.6	1	23	1256	1278	1256	1278	0.97
43	49	6.7e-05	0.022	17.0	4.0	1	23	1298	1321	1298	1321	0.97
44	49	1.7e-05	0.0055	18.9	1.7	2	23	1324	1345	1323	1345	0.98
45	49	0.56	1.8e+02	4.7	0.5	5	23	1355	1374	1351	1374	0.88
46	49	1.5	5.1e+02	3.3	0.6	1	23	1377	1399	1377	1399	0.91
47	49	1.2e-05	0.004	19.3	1.0	1	23	1406	1429	1406	1429	0.97
48	49	0.00026	0.085	15.2	5.9	1	23	1484	1506	1484	1507	0.95
49	49	1.7	5.6e+02	3.2	6.1	2	21	1600	1619	1599	1624	0.92

Sequence Information

Coding Sequence: AtgggaaacaaaaataatcctttaaaaactttgtttacttgtaaaatttgtaaaaaagtatTTGGAAATAACAAATCTTTTGATGAACATGTTTTAAATCATAGAGaaatatatctatcttttattcttcctggtgaattatttgaacaaaatgattccaaagaaaaatctaaagaaattctCGCTGGTgaattatttgaacaaaatgatttcaaagaaaaatctaaagaaactCTCGGCGGTGAATTATTTGAACAGaataattccaaagaaaaatctctaaaggtTATCCGtgttaagttatttaaacaaaatgttactgaaaaaaaatcggaaaatgtTCATTTTCAATGTCTCGTATGTAATCGTTTATTTTTACGAGCATGTGACTTAACAAATCATAAAAGAatgcattttaagaaaaaaaatataaaagtgaaaaaaaaaatttatcaaaataagttaaaagCTAAAATTAGGAAGAGTGAATATCCTTTATCGCATGACCAATCACTATTTCAATGCCAtctctgtaaaataaaatttgaatctgaaagtgatttaaaaaaccATAAAGCTTCTAATCATGATATTTACGAATGTGAATTTtgtaaagatttgtttttagataAGGACAATTTTGACAAACATATGCAATCACATTCgaaaattgattcatttagtTGTGAACATTGTAATCATGAATTTACTAATGATGATGAGCTGAAGAAACATGATTGTAAACAAAACCTTATGAAAAAAACTACAATTAAggataaaggattttatttttttaaaaaaaccttatttcCTTGCAAATTATGCAAAAAGGAATTTCCTTCAAAATATGATTTAGTTTTACATAAAGAAAATTCTCATGATATATTTGAATGTGTAATTTGTTCtcaacaatttttagaaaaaaagaaccttGATGAACACCATTTATTGCATGGAGATAAAACTGTTTTTAAATGTGACTTATGTAATATGGAATATTCAAAACAGTGTGATTTAACCAAGCATAAACAAAGTGAACACAaggaaaaatgtgaaatttgtgataaagaattttcaaataaagataaattatctgAACATATACTAACACATTCCATTAGGGTGATTTGCGATAGTAATTTTTCAGGAGTTTCAGACTTGAATAGACAGCAACTCCAAAGCGAAGAAGTAAATGAACAAGAAGAATcccctaatgaaaaaaaattaactgaatatGACTTGTCACACTATTTTAAATGTGAGATGTGCAGTCTTAATTTTCAACGACAAATAGATTTTACTAGACATCTAAAatacaaacatgaaaaaaaatgtgaaatatgcgATAAAGAATTCCCTAATAAAGAACAATTAGCTGAACATAAGTTATCACacaattttaaatgtgaattgtGCGACCGTAGATTTTTACGACAAACAGATTTGACTAAACATCAAAAATACCAACATAGAAAATGCGAAATATGTgaacaaaaattctctaatgaagaaaaattagctgtacatatgCTGCTACTACATTCTTTTAAGTGTGAAATGTGCGATcgtaaatttttaaagcaaacaGACTTGACTAAACATCAAAAATACCAACATGAATCGAAGTGCGAAATATGTGAACAAGAATTTCCTAATGAAGAGAAATTAGCTAAACATAAACTGTCACATTCTTTTAAGTGTGAATTGTGCAATCGTTATTTTTCACGGTCTGTAGACTtgattaaacataataaatatcaccaaaaaaaaaaaaaatgtaaaatttgtggaCAAAAATTCCCTAATGAAGAAGAATTAGCTGAACATCAGTtatcacattattttaaatgtgaaatgtgtaaaatttatttttcattacaattAGACTTGgccaatcatcaaaaaaatgagCATGAAAAGTGCGAAATTTGTGAACAAGAAGTGCCTACAGAGAAAATAGCTGAGCATAAACTAACTCATTCTTTTAGGTGTGAAAAGTGCGATTGCAATTTTTCACGACAAGTCGACttaattaaacatcaaaaataccaacataaaaaatgtgaaatatgtgaacaagaattctctaatgaagaaatattagCTGAACATATGCAGTCACATTCTTTTAGTTGTCAAATgtgtaatctaaattttatactcCAACAAGACTTGACTAGACATCAAAAATACCAACATAAAAAATGCGAAATATGTGAGgaagaattttctaataaagaaaaatttgctgAACATGTGCTGTCACATTCATTTAGGTGTCATATgtgtaatctaaattttttacaacaacAAGACTTAACtaaacatcaaaaatatcaacataaaaaatgtgtaatttgTGGACAAGAATTCcccaatgaagaaaaattagctGAACATAAGATTTCACATTATTTTAGGTGTGAAACGTGCGATCGTAATTTTTCACGGCAAGCAGATTTGACTAGACATCTAAAATACCACCATGAAAAATGCCAAATTTGTGAACAAgaatttcctaaagaaaaattagctgTTCATAAGCTCTCACATTATTTTAGGTGTGAAATATGCGATCATAATTTTTCAAGACATTCAGACTTGACCAGACATCAGAAAAATCAACATGAAAAATGTGATATATGTGAGCAAGAATTCTCTAAAGGAAAATTAGCTGAGCATAAACTCTCACATTCTTTTAAGTGCGAAATGTGCGATCGTAATTTTTCAAGACAATCAGATTTGATTAAACATCAGAAAAATCAACATGAAAAATGTGAGCAAgaatttcctaaagaaaaattaactgaaCATAAGCTATCACATTCTTTTAGGTGCGAAATATGCGATCGTAATTTTTCAAGACAATTAGACTTGAGTAAACATCAGAAATATCAACatgaaaaatgtgaaatatgtgagcaagaatttccaaaagaaaaaataactgaacATAAGCTATTACATTCTATTAGGTGCGAAATGTGCGATcgtaattttttaagacaattaGACTTGAGTAAACATCAGAAATATCAACatgaaaaatgtgaaatatgtgaGCAAgaatttcctaaagaaaaattaactgaaCATAAGCTATCACATTCTTTTAGGTGCGAAATGTGCGATCGTAATTTTTCAAGACAATTAGACTTGAGTAAACATCAGaaatatcaacataaaaaatgtgtaatttgtgaacaagaattccccaatgaagaaaaattagctGAGCATAAGCTATCACATACTCTTAGGTGTGAAATGTGCGATCGTAATTTTTCTAGACAATCAGACTTGACTAAACATCTGAAATATCAACatgaaaaatgtgaaatttgtaaagaaGAATTCGGAAATAAGGATAAATTAGCCGAACACATGTTATTACATTCTTTTAAGTGTGAAGTTTGCAATCGTGAATTTTCCAGGCAATCAGATTTAACTCAACATAGACGAAATCACAAAGACaagggagaaaataattttaattgtgaaatttgtgACATTTACTTTTCTCGGCACTCAGAATTGATCATACATCAACGTAATCatgaaaaatgtgaaatatgtaaAGAAGATTttccagataaaaataaattagctgaACATATGTTGTCGCATTCATTTAGTTGTGATATTTGTAAACGTAATTTTTCCCGACAATCCGATTTGCAGAAACATAAAGAACATCTTCACATGGAGGATTGTGTAATCATTGATGTTACAGATGATAACCAATTAGATGATATTAGTCTTTTGTTTCCTTGTAATTTATGTAATCAAACCTTTTCGCAACTTTctgatttaaatatacataaagatACTCATTCATCACCAGAAATTATTtgcgaagaaaatttaaataaaactaattctcaagatatttttaaatgtaaaatttgtaatagtGGTTTTACCACAAAGTCTGACTTAAACCACCATAAACAAatgaatcatttgaaaaaatgtgaaatttgtcaAAAAGAATTTACAGATCACGATAATTTAGAATTGCATGTGAAAATGCATATAAAGGAAAATCCATTTCTAtgtattctttgtaaaaaacgATTCCGCACTGAAAATGATATAATGAATCATAAGGCTATTGATCATGATATTCATGAATGTGATATATGtaaagaacaatttttggaaaaggaTGTATTTGATGAACATATGCTCTCACATGCTTTATGTAATCGAGTATATATGTGTGATATTTGTAATCGTCAATTTCCTCGACAAAATGATCTCACACGACATAATCGTATTTTCCATACGAGTGAAGAAGTAGATGCTAGTGAAATTGAAGaactatttaacaaaaatgaagaGATTGCGAAATCACAAGATCAACAAAATAATGTAGAACCAGAAGAGGGTACCTCAAGCgtttctcatataaaaattaccaaAGTAACAAGTGGCagtataaattcatatatatgtaggtattgtaataaatattatactcgACAATACTATTTGTTTAAACATATAGAAAAACACCACCCTGAACATAGAAAACAAGAAATTCAGACAAATATACCTTCTCATActcaacaaaatgaaaaagaaataaacgcaCTTTCTGTTTGTAAATcatcatcaatattaaaaaacgcACTAATTAGAGCGCCTAAAGAAAAATCGATAAactcacaaaatataattaatttaaatccaaatccAATAATCTCCACATCTCAGAGTGAGGAGGCAAATTTACTGAGAAATAGGCCATTTGTAATAACTAATCAACcaacaaatttccaaattaacaaTTCTAAATGCACTGCATgtcataaatgttttaattcagAATTAGAACTAATGTATCATCGACAAGTACAGCGATGTCATTTATCTTATACTCATGATTaa
Protein Sequence: MGNKNNPLKTLFTCKICKKVFGNNKSFDEHVLNHREIYLSFILPGELFEQNDSKEKSKEILAGELFEQNDFKEKSKETLGGELFEQNNSKEKSLKVIRVKLFKQNVTEKKSENVHFQCLVCNRLFLRACDLTNHKRMHFKKKNIKVKKKIYQNKLKAKIRKSEYPLSHDQSLFQCHLCKIKFESESDLKNHKASNHDIYECEFCKDLFLDKDNFDKHMQSHSKIDSFSCEHCNHEFTNDDELKKHDCKQNLMKKTTIKDKGFYFFKKTLFPCKLCKKEFPSKYDLVLHKENSHDIFECVICSQQFLEKKNLDEHHLLHGDKTVFKCDLCNMEYSKQCDLTKHKQSEHKEKCEICDKEFSNKDKLSEHILTHSIRVICDSNFSGVSDLNRQQLQSEEVNEQEESPNEKKLTEYDLSHYFKCEMCSLNFQRQIDFTRHLKYKHEKKCEICDKEFPNKEQLAEHKLSHNFKCELCDRRFLRQTDLTKHQKYQHRKCEICEQKFSNEEKLAVHMLLLHSFKCEMCDRKFLKQTDLTKHQKYQHESKCEICEQEFPNEEKLAKHKLSHSFKCELCNRYFSRSVDLIKHNKYHQKKKKCKICGQKFPNEEELAEHQLSHYFKCEMCKIYFSLQLDLANHQKNEHEKCEICEQEVPTEKIAEHKLTHSFRCEKCDCNFSRQVDLIKHQKYQHKKCEICEQEFSNEEILAEHMQSHSFSCQMCNLNFILQQDLTRHQKYQHKKCEICEEEFSNKEKFAEHVLSHSFRCHMCNLNFLQQQDLTKHQKYQHKKCVICGQEFPNEEKLAEHKISHYFRCETCDRNFSRQADLTRHLKYHHEKCQICEQEFPKEKLAVHKLSHYFRCEICDHNFSRHSDLTRHQKNQHEKCDICEQEFSKGKLAEHKLSHSFKCEMCDRNFSRQSDLIKHQKNQHEKCEQEFPKEKLTEHKLSHSFRCEICDRNFSRQLDLSKHQKYQHEKCEICEQEFPKEKITEHKLLHSIRCEMCDRNFLRQLDLSKHQKYQHEKCEICEQEFPKEKLTEHKLSHSFRCEMCDRNFSRQLDLSKHQKYQHKKCVICEQEFPNEEKLAEHKLSHTLRCEMCDRNFSRQSDLTKHLKYQHEKCEICKEEFGNKDKLAEHMLLHSFKCEVCNREFSRQSDLTQHRRNHKDKGENNFNCEICDIYFSRHSELIIHQRNHEKCEICKEDFPDKNKLAEHMLSHSFSCDICKRNFSRQSDLQKHKEHLHMEDCVIIDVTDDNQLDDISLLFPCNLCNQTFSQLSDLNIHKDTHSSPEIICEENLNKTNSQDIFKCKICNSGFTTKSDLNHHKQMNHLKKCEICQKEFTDHDNLELHVKMHIKENPFLCILCKKRFRTENDIMNHKAIDHDIHECDICKEQFLEKDVFDEHMLSHALCNRVYMCDICNRQFPRQNDLTRHNRIFHTSEEVDASEIEELFNKNEEIAKSQDQQNNVEPEEGTSSVSHIKITKVTSGSINSYICRYCNKYYTRQYYLFKHIEKHHPEHRKQEIQTNIPSHTQQNEKEINALSVCKSSSILKNALIRAPKEKSINSQNIINLNPNPIISTSQSEEANLLRNRPFVITNQPTNFQINNSKCTACHKCFNSELELMYHRQVQRCHLSYTHD

Similar Transcription Factors

Sequence clustering based on sequence similarity using MMseqs2

100% Identity: -
90% Identity: -
80% Identity: -