Basic Information

Insect: Laupala kohalensis
Gene Symbol: ZBTB41_1
Assembly: GCA_002313205.1
Location: NNCF01126728.1:912848-970236[-]

Transcription Factor Domain

TF Family: zf-C2H2
Domain: zf-C2H2 domain
PFAM: PF00096
TF Group: Zinc-Coordinating Group
Description: The C2H2 zinc finger is the classical zinc finger domain. The two conserved cysteines and histidines co-ordinate a zinc ion. The following pattern describes the zinc finger. #-X-C-X(1-5)-C-X3-#-X5-#-X2-H-X(3-6)-[H/C] Where X can be any amino acid, and numbers in brackets indicate the number of residues. The positions marked # are those that are important for the stable fold of the zinc finger. The final position can be either his or cys. The C2H2 zinc finger is composed of two short beta strands followed by an alpha helix. The amino terminal part of the helix binds the major groove in DNA binding zinc fingers. The accepted consensus binding sequence for Sp1 is usually defined by the asymmetric hexanucleotide core GGGCGG but this sequence does not include, among others, the GAG (=CTC) repeat that constitutes a high-affinity site for Sp1 binding to the wt1 promoter [1].
Hmmscan Out: # of c-Evalue i-Evalue score bias hmm coord from hmm coord to ali coord from ali coord to env coord from env coord to acc

1 34 7.2e-06 0.00034 20.5 0.4 1 23 239 261 239 261 0.97

2 34 2.2e-05 0.001 18.9 3.6 1 23 267 289 267 289 0.99

3 34 0.0031 0.15 12.2 2.2 1 23 295 317 295 317 0.98

4 34 0.00026 0.012 15.6 5.0 1 23 404 426 404 426 0.97

5 34 1.1e-06 5.4e-05 23.0 0.5 1 23 432 454 432 454 0.98

6 34 6.3e-06 0.0003 20.7 1.8 1 23 460 482 460 482 0.98

7 34 0.00013 0.0063 16.5 10.7 1 23 488 510 488 511 0.96

8 34 0.0041 0.19 11.8 0.5 1 23 582 604 582 604 0.92

9 34 8.4e-05 0.004 17.1 2.1 1 23 610 632 610 632 0.95

10 34 0.00099 0.047 13.7 1.6 1 23 638 661 638 661 0.96

11 34 3.6e-06 0.00017 21.4 0.5 1 23 667 689 667 689 0.98

12 34 0.0044 0.21 11.7 1.7 1 23 768 790 768 790 0.99

13 34 1.1e-05 0.00052 19.9 3.6 1 23 796 818 796 818 0.98

14 34 2e-06 9.2e-05 22.3 1.2 1 23 824 846 824 846 0.98

15 34 0.068 3.2 8.0 2.8 1 23 961 983 961 983 0.97

16 34 0.00011 0.0054 16.7 0.8 1 23 989 1011 989 1011 0.99

17 34 1.4e-05 0.00065 19.6 3.3 1 23 1017 1039 1017 1039 0.98

18 34 0.0034 0.16 12.1 7.0 1 23 1142 1164 1142 1164 0.99

19 34 0.0057 0.27 11.3 0.5 1 14 1170 1183 1170 1184 0.92

20 34 0.00019 0.009 16.0 3.9 1 23 1213 1235 1213 1235 0.98

21 34 0.047 2.2 8.5 0.2 1 23 1241 1263 1241 1263 0.95

22 34 0.00016 0.0077 16.2 4.4 1 23 1269 1291 1269 1291 0.97

23 34 1.7e-06 8e-05 22.5 3.4 1 23 1297 1319 1297 1319 0.99

24 34 0.00013 0.0061 16.5 0.9 1 23 1325 1347 1325 1347 0.98

25 34 0.00082 0.039 14.0 1.1 1 23 1402 1424 1402 1424 0.98

26 34 9.8e-06 0.00046 20.1 2.6 1 21 1430 1450 1430 1451 0.96

27 34 0.00067 0.031 14.3 0.4 1 23 1503 1525 1503 1525 0.98

28 34 1.9e-05 0.00091 19.1 0.3 3 23 1533 1553 1532 1553 0.99

29 34 1.4e-05 0.00067 19.5 4.5 1 23 1559 1581 1559 1581 0.99

30 34 8.7e-07 4.1e-05 23.4 1.1 1 23 1587 1609 1587 1609 0.99

31 34 5.8e-07 2.7e-05 23.9 4.1 1 23 1615 1638 1615 1638 0.98

32 34 4.4e-05 0.0021 18.0 4.6 2 23 1723 1744 1723 1744 0.98

33 34 0.00019 0.0089 16.0 1.5 1 23 1750 1772 1750 1772 0.98

34 34 0.001 0.048 13.7 4.6 1 23 1778 1801 1778 1801 0.96

#	of	c-Evalue	i-Evalue	score	bias	hmm coord from	hmm coord to	ali coord from	ali coord to	env coord from	env coord to	acc
1	34	7.2e-06	0.00034	20.5	0.4	1	23	239	261	239	261	0.97
2	34	2.2e-05	0.001	18.9	3.6	1	23	267	289	267	289	0.99
3	34	0.0031	0.15	12.2	2.2	1	23	295	317	295	317	0.98
4	34	0.00026	0.012	15.6	5.0	1	23	404	426	404	426	0.97
5	34	1.1e-06	5.4e-05	23.0	0.5	1	23	432	454	432	454	0.98
6	34	6.3e-06	0.0003	20.7	1.8	1	23	460	482	460	482	0.98
7	34	0.00013	0.0063	16.5	10.7	1	23	488	510	488	511	0.96
8	34	0.0041	0.19	11.8	0.5	1	23	582	604	582	604	0.92
9	34	8.4e-05	0.004	17.1	2.1	1	23	610	632	610	632	0.95
10	34	0.00099	0.047	13.7	1.6	1	23	638	661	638	661	0.96
11	34	3.6e-06	0.00017	21.4	0.5	1	23	667	689	667	689	0.98
12	34	0.0044	0.21	11.7	1.7	1	23	768	790	768	790	0.99
13	34	1.1e-05	0.00052	19.9	3.6	1	23	796	818	796	818	0.98
14	34	2e-06	9.2e-05	22.3	1.2	1	23	824	846	824	846	0.98
15	34	0.068	3.2	8.0	2.8	1	23	961	983	961	983	0.97
16	34	0.00011	0.0054	16.7	0.8	1	23	989	1011	989	1011	0.99
17	34	1.4e-05	0.00065	19.6	3.3	1	23	1017	1039	1017	1039	0.98
18	34	0.0034	0.16	12.1	7.0	1	23	1142	1164	1142	1164	0.99
19	34	0.0057	0.27	11.3	0.5	1	14	1170	1183	1170	1184	0.92
20	34	0.00019	0.009	16.0	3.9	1	23	1213	1235	1213	1235	0.98
21	34	0.047	2.2	8.5	0.2	1	23	1241	1263	1241	1263	0.95
22	34	0.00016	0.0077	16.2	4.4	1	23	1269	1291	1269	1291	0.97
23	34	1.7e-06	8e-05	22.5	3.4	1	23	1297	1319	1297	1319	0.99
24	34	0.00013	0.0061	16.5	0.9	1	23	1325	1347	1325	1347	0.98
25	34	0.00082	0.039	14.0	1.1	1	23	1402	1424	1402	1424	0.98
26	34	9.8e-06	0.00046	20.1	2.6	1	21	1430	1450	1430	1451	0.96
27	34	0.00067	0.031	14.3	0.4	1	23	1503	1525	1503	1525	0.98
28	34	1.9e-05	0.00091	19.1	0.3	3	23	1533	1553	1532	1553	0.99
29	34	1.4e-05	0.00067	19.5	4.5	1	23	1559	1581	1559	1581	0.99
30	34	8.7e-07	4.1e-05	23.4	1.1	1	23	1587	1609	1587	1609	0.99
31	34	5.8e-07	2.7e-05	23.9	4.1	1	23	1615	1638	1615	1638	0.98
32	34	4.4e-05	0.0021	18.0	4.6	2	23	1723	1744	1723	1744	0.98
33	34	0.00019	0.0089	16.0	1.5	1	23	1750	1772	1750	1772	0.98
34	34	0.001	0.048	13.7	4.6	1	23	1778	1801	1778	1801	0.96

Sequence Information

Coding Sequence: ATGACTATCAATGACACATTAAGAATGGCCAatctggaaaacctggaaaagatAGGGAAATTTGTACGAAGCCTGGgaaatggGGAACCAGATCTTATTGAAGGCTTGAATTTCTTCCTTCCTATTGTGATTGaggAAGTTCGTGCTCTCGCCCATAAACCGGAACTTACAAACATTTACCATAACCGTTCTGTCCGCCAGGGTCCGCTGCAGTCACCGAGCCGTTGTCTTTTAGTGCGCACAGCTACGCGGGAGCGCGATCAGATGGTTTGTGGACGCGACGGCTCCGCCGAGACGTCGTGGTCACCGCGACCGCGCCGCGCGATGATGACAACAACTCGTGCCCCTCGCCTCATCCGGCGCCGGTCCGCTGTCCCGTGTGTAACAAACATATTTCAAACTACACATGCGCCTGCACACGGGGCAAAAGCTGCATCGGTGCACGCTGTGTCCAGCCACGTTCCTCTCAGCCTGTCACCTCACGGAGCACATCCGTGTACATACGGGAGAGCGACCGTTTCAATGCTACCTGTGCCCCAAGACGTGCAGCAAGAAAAGCAACTTGCGTGCACACATCAGGAACACTCACAAACTCCTGCCGCTCGCCGCCCCATCTTCAATGAATCGCCCTCCATGTCGAGGTGGAAGAGACGCTCCAATACCACAGGTCCCAAGTTCACTGAACCACACTCATTTAATCCGACACGCAATATGCACGAGTGTTGGCAGTGTCGGAAGGTGTTCCCCACACCATCGGAGCTGAAGATCCACGTTCGGGTCCATACGGGAGAGAGACCGTTCCGCTGCCACCTGTGCTCTTCCGCGTTCTCTCAGAAGGGCACCCTGCAGCGTCATCTACGCACTCATACCGGCGAGAAACCCTTTCGCTGCCCTGCGTGCGGAGGACACTTCACGCGACGCACGGCGCTTGCAACGCACAGATGCGTTCACCGGACAGTGTCTCGTACAGACATGTCGCTGCTCAAATCGACGTTGCCTCAGCGGACTCCGTGGCACGTAGTAACGAATCCGGATTTCGAGGAGGACCACGCGGAACCTCCGGAAAGCGAGGACGAAGCACCCTGCGACTTATCTAGCGCCAAAGAGTCGTCGTCACCGCCACTGCCATCCCAACCTCGCGCATCGGCGTCCGCGGTGAGCAGTTGGTCGACGGCGCGACGGCGTCGCCATCGACCGTCCACAAAGGGACACGTATGCCTCACCTGCCACAAGCAGTTCATGTATCCCACGCAGCTGACTCGCCACATCCGAACTCATACAGGGGAGAAACCTTTCTCCTGCGAAGTGTGCCAGTTGACGTTCACAGAGTCAGGCAATCTTCAGAAACACATGCGCGTTCACACGGACGAGCGACCCTTCCAGTGTCCGTACTGCCTGAAGACTTTTCGCCAAAAAGCGCATCTGCAAGGCCACGTGATAACTCATACGGGCGAGAGACCCTACGTGTGCAAGGACTGTGGTCGTTCCTTCAGTCACACGCGTAACTTACGTCATCACCGTCATACGCATCATCCTCCGGTTAGTGAGCGTGAGCACTCCAGAGAGGTGCTGCACCCAGACCGACCGAAGAGTCAACGCTGTTCTCAATCGAAGCGATTCAATAGTAGCTTGCTCTACGGGTCATGTCGAGAAGAAGAGATTTTGGAGTTGCGTTTCGCAGCTGAAAGTGGCTCAGATGCAAGTTTACTCGAAGACCTAAATATTCTCAATAGTCGACGGACATTCGAATGTGTAGTGTGCAGAAGATTTTTTTATAGTAAGGAAGGTTTGAGAAGACATGCAGTTTTGCACGAAGACGTGAAACCTCACGCTTGTGCGTTTTGTCCGCTAACTTTCAAACACTCGGGAAATTTAAAGAAACACATCTTAATTCATACCGGGGAGCGTCCGTATCAGTGCGAGTTTTGTCCTCAAAAATTCACTCAAGTCAACTCTCTACAGTATCACACGAGGGCTAAACACACTGGCGAACGTCCGTTCAAATGTGAACAATGTGGGCATTCATTTATTCGCGCTGCCGCCCTAAGACGACATCTGGAGGTGCATCTTAAACGTTCcttgaaaaatatgaacaaatgcACTACTGAAGTCCGCGATAATGGCCGGTTTTTACACTCGTCCCTTTTGTCTTCAGGCAACATCTTTCGTGTGACGCCGCCGACAACGTACCTTGGAGGTATTGAAGTGGTCGAAGAAACTCCAATCGTTGGAGAACCGATCGGAATGCTTGATGATTGCGACTTCAGTGCGGCTGAGGTGACTTGTGGACTTGTAAAACGCTTCCAGTGTCCCAGATGCTTCAGACAGACCAAGTCCCGAGCCGCGCTCCGTGACCATTTCCGCATGCACACCGGCGAGAAGCCGTTTTGCTGTCCGGTGTGCTCGAAGAGGTTCTCCTTCCGAGGAAACCTTCAGAGGCACGAGCGGATGCACACCAATGAGAAACCCTATGAGTGCTCAGTCTGTACGAAAAGGTTCAGGTCGTCGTCTACTCTGCAAGATCACATGACAGTACATACTGGCTTGAAACCACACGTCTGTAAACTCTCTTTGGATGATATtgcagcagcagtagcagctcATGTGAGTGACGGCGAAATGTCTGTTGAAGATAGGGACACATGTCCGAAAGAGCAAATTATAGCCAAGACTAGCTGCCACAGTATTGAACTATGCCTTTGCTGTGTGCGCTTAGGCCGTGCCATCTGGAACGCAGGGATACGCAGGGGCGGCTGGACCGGCGGAGACTATGCCAACACTAATACCGCATTCCAGACGCAAAGCACCCGCGGAAGGAAAAGCAGTTCAAGAGGAAGAATAACAGTTCGCACAGTGTTGAATAACGACGGAGCGAAAGGATTCCAGTGCTGTGaatgcgaaaaaatatttttttcgaagcAAGGAGCTCAGAGGCACTTTCTTATTCACACAGGGGAAAGACCGTATCGTTGCGAGTTTTGTTGGAAGGGTTTTATTAACGGAAATGATCTTAAAAAGCATCGACGAATACACACTGGCGAACGGCCATACCCGTGTACTGTGTGCTCAAAGAGTTTCAAACGGCGGACGCACATGAACCGACATTTATTGATTCACGCTAATGACACTCGGAACTTTTCGGAGTTTGCTTCTTTTAACTTCgctgttataatattgtattgtatcgCGGGGCTTCGATTACGTCCTTCTCCCGTAGAACCCTTGAAGTACGTGTCGCCTCCTGTGTTTTATACGCACCTCACCTTTTCTTCAGGACCAACCGTGTTGCAACGGCCGTGTGAGGATCGCCTCGTCCTTCAGGCAGCACCATCGATCATTGACATGGTTCCCAGTGCCGGAGAGGATCGCAGCGCTTCCTGTTCGGAGAGGAACCCGTCGCAACTGGTTGATCCTACCAAGAGATTCCAGTGTCCTGTGTGCCCCAAGGGCTTTCACTTCTATTGCCATTTCCGGTTACACATGCGCGTTCACACCGGCGAGAGACCATTTCGTTGTAATATTTGCCACAAAATGTTCAGGCAGAGCTCTGCCGACAGTATGTCACACAATCTCATCCCGGGTGACCGAGTGACTGACAGCTACGACGCAAGAGGCAGATCACTACACGTGAAGAAATTCCAGTGTCCAGAATGCCATAAGTTGTTTAAGTTTGAATACGATTTTCGGAGgcacttactttctcataaagGAGAAATACCCTATACTTGCATTCTTTGTGGCGAAAGGTTTATGGAAACCAgtaaattgataaaacatttagCCATTCATACTGGCGAAAGGCGTTTTGCATGTCTAATATGCAAGAAACGATTTGCTCATAATCATTCCTTGAAAGATCATATCAAATCCCATACAGGGGAAAAGCCATACCAATGTTCGTATTGTGCAAAAAGATTCAATCGGTCGTATAGCTTGAGCAGGCATCTCCGAACTCACACACGGGAGAGTTCGTTTTCTTGTCTACTTTGCCCAATGGTGTTTACGGAAAATGATCATTTGATGAATCACGTAAAGACGCACAATATCTGGGTGGGTCAAGAAGTAGAGAGCGGATCCAGCCTTAGTGCCATGACACCCactcaaataaattatcaattctcGAGCTCCATTAATGATACTGATCCAAATACCGTGATCTCGCAAAATAAGTTGCAGAAACCCAAGCAGAGTGCCAAAAAACCTTATTCTTGTTCTGTTTGCCCCGCCCGATTTTGTTATCCCAAAGATTTGGTTTCCCATTTTCGTATTCATACTGGTGAGAAACCATTCGAGTGTCAGATGTGCGGACAAAGATTCAGAAGGCaacatcatttaaaaatgcaTATGCAGATCTTGACTTCCTCCTTTAACTCAGGCCTTTTTTCTTCAGGCTCCAGCAGCGGCTCTGCTGTACAATGGTCCAGGTACGAAAAAGGGCAAGAAAGGCGTGACGAGACTGGCGCTGCTGTCACGAACAGGGAGCAAGAGTTCCAAGTGATCAAAGGATACCAGTGTCCGGAATGCCCTCGCTCGTTCCTCTCCGAAGACGCCTTTCGGAAACATAAGATATCGCACGCCGTCGACAGACCACACGGCTGTCCTCACTGTCCGGCCAAGTTCGCGGTGGCAAGCAACTTGAACCAGCATCTTCGGACGCACACGGGAGAGCGTCCTTACGAATGCATGTACTGCAAGAAGCGATTCGCTCACAACAAGACCCTCAAGGATCATATTCGTACTCATACGGGCGAGCGACCGTATCAGTGTGTGTATTGCAAGAAGGGCTTCTCACAATCGGTTAATCTGAGAACTCACATTCTTACTCACACGGGTGAACTTCCATTTGAGTGTAACTTCTGTGATAAGTCATTCCGACAGAGAGCTCATTTGCAAAATCATTTGCGCACTACTCATCCTCATGAATATCAGTATTTAATTATCAGAGGTGTAAATAACTTTAGAGTCATTTCTCTGCCATCTGCTGAATCCATCTCTATTCAGTCCATTCTGTTTGCTTCAGGCAGCGGCATCGTCATTCGACCATGGCTGATTCCTGCGGGAGGAAACGCAGTAGATCAAACGGCTCCTCTTGAGTACTTCATGAAGAGAGAAGAGCACTTCCAGACATTAGCCGGAGGCAGTCTATCTCGTCCATCCAAGGAAGCACAATGTCCCAAATGCAAGAAGTACTTTAGACACAAATATGTCTTAACCCGACACATGCTGACGCATTCTGGAGAGAAACCACATCAATGCCCGCATTGTCCTTTAAAATTCACATTCGCAGGAAATATGGTGAAGCATCTCCTAGTGCACACGGGTGAACGACCGTATCGTTGCGACATATGTTTCCGATCGTTCAGACAAAGACCTCATTTGACATACCATGTGCAACATGTGCATGCGCCTAGAGATCCCCTAAATGTTAAACCACGATAA
Protein Sequence: MTINDTLRMANLENLEKIGKFVRSLGNGEPDLIEGLNFFLPIVIEEVRALAHKPELTNIYHNRSVRQGPLQSPSRCLLVRTATRERDQMVCGRDGSAETSWSPRPRRAMMTTTRAPRLIRRRSAVPCVTNIFQTTHAPAHGAKAASVHAVSSHVPLSLSPHGAHPCTYGRATVSMLPVPQDVQQEKQLACTHQEHSQTPAARRPIFNESPSMSRWKRRSNTTGPKFTEPHSFNPTRNMHECWQCRKVFPTPSELKIHVRVHTGERPFRCHLCSSAFSQKGTLQRHLRTHTGEKPFRCPACGGHFTRRTALATHRCVHRTVSRTDMSLLKSTLPQRTPWHVVTNPDFEEDHAEPPESEDEAPCDLSSAKESSSPPLPSQPRASASAVSSWSTARRRRHRPSTKGHVCLTCHKQFMYPTQLTRHIRTHTGEKPFSCEVCQLTFTESGNLQKHMRVHTDERPFQCPYCLKTFRQKAHLQGHVITHTGERPYVCKDCGRSFSHTRNLRHHRHTHHPPVSEREHSREVLHPDRPKSQRCSQSKRFNSSLLYGSCREEEILELRFAAESGSDASLLEDLNILNSRRTFECVVCRRFFYSKEGLRRHAVLHEDVKPHACAFCPLTFKHSGNLKKHILIHTGERPYQCEFCPQKFTQVNSLQYHTRAKHTGERPFKCEQCGHSFIRAAALRRHLEVHLKRSLKNMNKCTTEVRDNGRFLHSSLLSSGNIFRVTPPTTYLGGIEVVEETPIVGEPIGMLDDCDFSAAEVTCGLVKRFQCPRCFRQTKSRAALRDHFRMHTGEKPFCCPVCSKRFSFRGNLQRHERMHTNEKPYECSVCTKRFRSSSTLQDHMTVHTGLKPHVCKLSLDDIAAAVAAHVSDGEMSVEDRDTCPKEQIIAKTSCHSIELCLCCVRLGRAIWNAGIRRGGWTGGDYANTNTAFQTQSTRGRKSSSRGRITVRTVLNNDGAKGFQCCECEKIFFSKQGAQRHFLIHTGERPYRCEFCWKGFINGNDLKKHRRIHTGERPYPCTVCSKSFKRRTHMNRHLLIHANDTRNFSEFASFNFAVIILYCIAGLRLRPSPVEPLKYVSPPVFYTHLTFSSGPTVLQRPCEDRLVLQAAPSIIDMVPSAGEDRSASCSERNPSQLVDPTKRFQCPVCPKGFHFYCHFRLHMRVHTGERPFRCNICHKMFRQSSADSMSHNLIPGDRVTDSYDARGRSLHVKKFQCPECHKLFKFEYDFRRHLLSHKGEIPYTCILCGERFMETSKLIKHLAIHTGERRFACLICKKRFAHNHSLKDHIKSHTGEKPYQCSYCAKRFNRSYSLSRHLRTHTRESSFSCLLCPMVFTENDHLMNHVKTHNIWVGQEVESGSSLSAMTPTQINYQFSSSINDTDPNTVISQNKLQKPKQSAKKPYSCSVCPARFCYPKDLVSHFRIHTGEKPFECQMCGQRFRRQHHLKMHMQILTSSFNSGLFSSGSSSGSAVQWSRYEKGQERRDETGAAVTNREQEFQVIKGYQCPECPRSFLSEDAFRKHKISHAVDRPHGCPHCPAKFAVASNLNQHLRTHTGERPYECMYCKKRFAHNKTLKDHIRTHTGERPYQCVYCKKGFSQSVNLRTHILTHTGELPFECNFCDKSFRQRAHLQNHLRTTHPHEYQYLIIRGVNNFRVISLPSAESISIQSILFASGSGIVIRPWLIPAGGNAVDQTAPLEYFMKREEHFQTLAGGSLSRPSKEAQCPKCKKYFRHKYVLTRHMLTHSGEKPHQCPHCPLKFTFAGNMVKHLLVHTGERPYRCDICFRSFRQRPHLTYHVQHVHAPRDPLNVKPR

Similar Transcription Factors

Sequence clustering based on sequence similarity using MMseqs2

100% Identity: -
90% Identity: -
80% Identity: -