Basic Information

Insect: Myrrha octodecimguttata
Gene Symbol: -
Assembly: GCA_958510865.1
Location: OY294060.1:45603499-45616189[+]

Transcription Factor Domain

TF Family: zf-C2H2
Domain: zf-C2H2 domain
PFAM: PF00096
TF Group: Zinc-Coordinating Group
Description: The C2H2 zinc finger is the classical zinc finger domain. The two conserved cysteines and histidines co-ordinate a zinc ion. The following pattern describes the zinc finger. #-X-C-X(1-5)-C-X3-#-X5-#-X2-H-X(3-6)-[H/C] Where X can be any amino acid, and numbers in brackets indicate the number of residues. The positions marked # are those that are important for the stable fold of the zinc finger. The final position can be either his or cys. The C2H2 zinc finger is composed of two short beta strands followed by an alpha helix. The amino terminal part of the helix binds the major groove in DNA binding zinc fingers. The accepted consensus binding sequence for Sp1 is usually defined by the asymmetric hexanucleotide core GGGCGG but this sequence does not include, among others, the GAG (=CTC) repeat that constitutes a high-affinity site for Sp1 binding to the wt1 promoter [1].
Hmmscan Out: # of c-Evalue i-Evalue score bias hmm coord from hmm coord to ali coord from ali coord to env coord from env coord to acc

1 24 0.0024 0.4 12.4 1.1 2 23 48 69 47 69 0.97

2 24 0.00013 0.022 16.4 2.3 2 23 76 97 75 97 0.97

3 24 0.0073 1.2 11.0 0.1 1 23 103 125 103 125 0.96

4 24 0.00012 0.019 16.6 0.1 2 23 130 151 129 151 0.96

5 24 0.0018 0.3 12.9 0.6 1 23 157 179 157 179 0.98

6 24 0.021 3.4 9.5 0.0 2 20 190 208 189 209 0.93

7 24 5.9e-07 9.7e-05 23.8 1.9 1 23 236 258 236 258 0.98

8 24 4.9e-06 0.00081 20.9 0.4 1 23 264 286 264 286 0.98

9 24 0.0005 0.082 14.6 1.9 1 23 292 315 292 315 0.97

10 24 0.0013 0.22 13.3 1.6 1 23 325 348 325 348 0.97

11 24 1e-06 0.00017 23.1 0.7 1 23 424 446 424 446 0.98

12 24 0.0028 0.46 12.3 0.5 1 23 452 474 452 474 0.98

13 24 0.24 39 6.2 0.7 2 23 478 499 477 499 0.97

14 24 0.00019 0.032 15.9 0.7 1 23 529 551 529 551 0.98

15 24 0.0001 0.017 16.8 0.5 1 23 557 579 557 579 0.98

16 24 6.7e-06 0.0011 20.5 3.0 1 23 585 607 585 607 0.97

17 24 0.014 2.3 10.1 3.2 1 23 613 635 613 635 0.92

18 24 9.3e-05 0.015 16.9 0.6 1 23 975 997 975 997 0.98

19 24 5.7e-05 0.0093 17.6 4.7 1 23 1005 1027 1005 1027 0.98

20 24 4.7e-06 0.00077 21.0 1.2 1 23 1033 1055 1033 1055 0.97

21 24 0.0019 0.32 12.8 0.6 1 23 1063 1085 1063 1085 0.98

22 24 0.0022 0.37 12.6 0.1 1 23 1238 1260 1238 1260 0.97

23 24 0.35 58 5.7 0.1 1 23 1264 1286 1264 1286 0.98

24 24 0.0039 0.64 11.8 0.1 1 22 1292 1313 1292 1313 0.96

#	of	c-Evalue	i-Evalue	score	bias	hmm coord from	hmm coord to	ali coord from	ali coord to	env coord from	env coord to	acc
1	24	0.0024	0.4	12.4	1.1	2	23	48	69	47	69	0.97
2	24	0.00013	0.022	16.4	2.3	2	23	76	97	75	97	0.97
3	24	0.0073	1.2	11.0	0.1	1	23	103	125	103	125	0.96
4	24	0.00012	0.019	16.6	0.1	2	23	130	151	129	151	0.96
5	24	0.0018	0.3	12.9	0.6	1	23	157	179	157	179	0.98
6	24	0.021	3.4	9.5	0.0	2	20	190	208	189	209	0.93
7	24	5.9e-07	9.7e-05	23.8	1.9	1	23	236	258	236	258	0.98
8	24	4.9e-06	0.00081	20.9	0.4	1	23	264	286	264	286	0.98
9	24	0.0005	0.082	14.6	1.9	1	23	292	315	292	315	0.97
10	24	0.0013	0.22	13.3	1.6	1	23	325	348	325	348	0.97
11	24	1e-06	0.00017	23.1	0.7	1	23	424	446	424	446	0.98
12	24	0.0028	0.46	12.3	0.5	1	23	452	474	452	474	0.98
13	24	0.24	39	6.2	0.7	2	23	478	499	477	499	0.97
14	24	0.00019	0.032	15.9	0.7	1	23	529	551	529	551	0.98
15	24	0.0001	0.017	16.8	0.5	1	23	557	579	557	579	0.98
16	24	6.7e-06	0.0011	20.5	3.0	1	23	585	607	585	607	0.97
17	24	0.014	2.3	10.1	3.2	1	23	613	635	613	635	0.92
18	24	9.3e-05	0.015	16.9	0.6	1	23	975	997	975	997	0.98
19	24	5.7e-05	0.0093	17.6	4.7	1	23	1005	1027	1005	1027	0.98
20	24	4.7e-06	0.00077	21.0	1.2	1	23	1033	1055	1033	1055	0.97
21	24	0.0019	0.32	12.8	0.6	1	23	1063	1085	1063	1085	0.98
22	24	0.0022	0.37	12.6	0.1	1	23	1238	1260	1238	1260	0.97
23	24	0.35	58	5.7	0.1	1	23	1264	1286	1264	1286	0.98
24	24	0.0039	0.64	11.8	0.1	1	22	1292	1313	1292	1313	0.96

Sequence Information

Coding Sequence: ATGCTTCACAACGTTGAGTTTTTAGTTCCTAAGAATACAGAGGATAGTGAGTTCGTCTCTAATGATAATTTGGTTCTTGAACCAACTTATTCAAATAAAGAAGTGGACTCAGAGAATAGACCATCAGAAAAGAGAATAATTCAATGTTCACACTGTGGGGATACATTCAATGACTATGATTTATACACAATACATGAAAAAACCCACCAGGTTGAAGATGAATTAGAATGTGCAAAATGTAAAAAGTCTTTCAAGAAGATATCTACTTATAGAAGGCATTTATTAACTCATCAAGATGATAAGCTTTTCAATTGTGTTATATGTGAAGCTGGctttaattctgaaaataattataatgtACATATGGCCCTCCATGGAAGTTCTTCAACTTGTCCTATCTGTGGTTTGTCATTTCAAAGAATGGCCAGTTTGAAGTCTCATTTAGCAATTCATCAAGTTGAGGAATTCCATACTTGTCCAGAATGTGCATCAGAGTTTGAGAATATGATTGAATTGAGAAAACACATCAAAACTCATACACAAGTGACCACAGAATCAAAGTTATTGATTTGTAATTATTGTAAAGTTAAATTTGATACTCCtatattattgaaacaacatgTTGCCTGCCATATGAAGGTTAAGAAACTTGTTCTAAATGGAAAGAAAACAAAGAAAGAACAAGTCTCGACAAAAGAACATAAACATAAGTGTAAGGTGTGTGATAAGAGTTTTCCAAAATTATCCTTACTGGAACGACATTTGAGGATTCATAATGGAGAACGTCCATTTGTTtgcCAAATTTGTTATAAAGGCTTTGCACAAAAAGGTACTCTACAAATCCATATGATGAAGCATTCAGGTATAAAACCATTCAGCTGTACACTATGTCCTGCAAAGTTCCACCAGAAAGGCAATTTGAAAGTGCATGTTCAAAAAACTCATACTGCATCTTCAGAaggggaaaaaattttcaaatgctcTGAATGTGACTGCATATTCAAGAAAGTAGCATCTTTGAATGGTCATATGACAAAAATTCATGCAGATACTAGCTTAATCAGCATAACCACAGTTATTGATCAATTGAAGACTTTAGAAAAGCAATTGGGTAGTAAATCAGTTGaagtgaaagaaaatgaaaacatGAAGGATAccaaaaaaatgtataaaatagACAATCCTGATGAAGCACTCTCTGAAAGTAAGATCAACCAAGGCTGCAAAGTCTATTCTCTCATGCAAAAATCCATAGGAACCAATAAGGTATACATGTGTTCATATTGTGATAGAGAAACTAAAAAACCTTCTGATTTGATACGTCATATTCGAACTCACACTAAAGAGAAGCCATTTAAGTGCCTGCAATGCAATAGTTCTTTCGCAATAAAATCAACACTCCTAGGACACATGCAAATACATAAAGGAAAGAAATGTGGAAAATGCTCCAAGGTTATTTACTCTAGCAAAGTATGGAGAGCCCATGCCAGaaaacatGAGAATAACTCTATATATAAATTTGATCCCAAGCCACAAGAAAGTCATGACAATGGACCGAAACGAAAAAAAGTCATAGAAAATCCATTCAAATGTTCATTATGTTCAGCATCATTTTTAAGGCCAGTCAACCTTAAAAGACATTTGCGATTACATACTGGAGAAAGTACATTCAAATGCTTGATATGCTCAAGatcaTTGGCCACAAAATATGCATTGAAAGAGCACATTAATAGTCATACTGGTATAAAAAACTTCAATTGCCATCTGTGTGATAAAAAATTTATGACTTCTTCATTATTAAAACGCCATATTGCCTCTCATGATGACACAAAACCATATGAATGTCCATATTGcaaaaaaagattcaaaaaCTTGATAGTGTGCAGAAAACATATCGATTCTCACAGGGAATCTAGAGAAGCTGAGAATACCTTAGACGAATGTAATTTTTTAACCGAAGATGGAAATATTCCTGTTGTTGAATCAACAGAAATGTCACCAAGGAAGACCACCATATTGAGAGTGGATACAGAAGGAGTAGTATTTGATAGCGCTTTTGACATTCAACAAAACAATAGTGTAGTGGAGAGTTCAGTTCTTGAGTCGACTCAATCTACCGATCAACCAGTCATAGCAGAATCAACCCCAATTTTAGCATCAGATCAGCATCAAAATCTGCAAACCATTTTAGTGGATTGTCAGGATTTACAAAATAGGGAGGTGCAAAACTATATTTTATCCCAGTTAAAACTTCAGTCCAATGATGCCATTGTACTTAATGCAGTTAATGAAAACAATGAACAATCTCAAATTGTGTTCAATGTACAAACACTTAATGTTGACACTTTATCTGATGTTGGGAATGCTATAAATGACGTTACATATGCTGATGAATTTGTGGAAAAATCATTGGACCCAGTATTTAGTTTCCCAGATAAGAGatcattattgaaaaaaaatcaaattatcgCTGTTGATACTCCAGAAAATTGTATTCCCAATGATATTGGAGATAATTTTCTGTCGAACAATGCATCTTTATATCCAAATACACAAATAAATTTCGATAGTACAACAGAAATGAATTCCACGATAAGTATGATAGATTCGACACACCATGAATTCATTGACGAATTGGGGAAAACTACCACTAATGCAGAATGTAATTTACTATTTGATGTCCCTTCGGAAACTTCAGAAAATGTTAATCTAAACGTGATCCATTGCATgagttgtaaaaaaatgttcgatgcAATGGAATCTTATCAGATGCATGTGTGCGAAAAATCCGTGTCTAAAAGGAGTAACATTATTTCCTCATCTCCTGATAATCTTAATCAAAGATTCAGTCAGATTGATGAAAGAGAAAGAAGAAATACTGAGGAagccaaaaataattcaaaaaaacctGCCAAGAAGTTTTTCAGTTGTGTTTATTGTGGGAAAGAATTCAGTAGTAGAGGTGTTTATATGAGACATGTCAACTCAcatcaaaaaaaagaaaatggtTTGCATAAATGTAAGTTTTGCTTCAAAGAGTTCAAGAAACCTTCAGATTTGGGACGACATTTGAGAACACATACTGGAGAAAAACCATTTGCTTGTGACCAATGTGACAAAAAATTCTCTTTAAAATCCACGTTGGAAGCTCACTACAAAACACACAATCCAAGTGCCGTTAAACATTTTGTTTGCGAAGTTTGCAATTCCTTCTTCAGTTCGAAAGCAAGTAGAAAGTTGCATATGCTTGTGCATACTGGAGCTAAACCAAATAAATGTTTCTTCTGTGACCAACACTTCAGAACTGCTGCTCACAGGAAATGCCATGAAAAGAAAATTCACTTTTCTGGTCGTAAAAAGGTGAACCAGAGTAGTGCTAAGAAAATTACTAATTTGTTAGCTGCTGCAGTAGATATGGCTGTGAATGAAGCAAATTTAGATAATCAAGACTTGGAACAATCAAAAATTCCTGAATATTCTGAGATACAGGTGGAAtatactgatgaaaaatattcttcagagtCTATTCCTATCGACCAAGTGCTATTACAACAACTACAGAGTTCAGACATCCTTCTAGAAGAGATAGACCCTGAGGTTCTCGCTTGCACTGAAAGTGTAAATGATTTGGAGGTTATAGAAGCCACTGGTATTATTAGCAGTGATTGCTTCGAGGAGAATGTCAACTCCATCAGTCATATTGTAGGTAATTTTGTTTGCGAAATATGCCAGCAAGATTGTTCTGGTCCTGAAGCTTTAAAAGAACATATGGAGCTACATCTGAAAAAGTTTGAATGTGGACAGTGCAGTTTGTGGTTTTCGTCAGTTGAGGCTTTGTCCGAACATGAAAGATCACATTTGGTCACTGAATCATATTCTTGTTTTATTTGTGATATTGTCTTTTACGGAATACAACAATTGAAAGCCCACTTAAGAAGGTGA
Protein Sequence: MLHNVEFLVPKNTEDSEFVSNDNLVLEPTYSNKEVDSENRPSEKRIIQCSHCGDTFNDYDLYTIHEKTHQVEDELECAKCKKSFKKISTYRRHLLTHQDDKLFNCVICEAGFNSENNYNVHMALHGSSSTCPICGLSFQRMASLKSHLAIHQVEEFHTCPECASEFENMIELRKHIKTHTQVTTESKLLICNYCKVKFDTPILLKQHVACHMKVKKLVLNGKKTKKEQVSTKEHKHKCKVCDKSFPKLSLLERHLRIHNGERPFVCQICYKGFAQKGTLQIHMMKHSGIKPFSCTLCPAKFHQKGNLKVHVQKTHTASSEGEKIFKCSECDCIFKKVASLNGHMTKIHADTSLISITTVIDQLKTLEKQLGSKSVEVKENENMKDTKKMYKIDNPDEALSESKINQGCKVYSLMQKSIGTNKVYMCSYCDRETKKPSDLIRHIRTHTKEKPFKCLQCNSSFAIKSTLLGHMQIHKGKKCGKCSKVIYSSKVWRAHARKHENNSIYKFDPKPQESHDNGPKRKKVIENPFKCSLCSASFLRPVNLKRHLRLHTGESTFKCLICSRSLATKYALKEHINSHTGIKNFNCHLCDKKFMTSSLLKRHIASHDDTKPYECPYCKKRFKNLIVCRKHIDSHRESREAENTLDECNFLTEDGNIPVVESTEMSPRKTTILRVDTEGVVFDSAFDIQQNNSVVESSVLESTQSTDQPVIAESTPILASDQHQNLQTILVDCQDLQNREVQNYILSQLKLQSNDAIVLNAVNENNEQSQIVFNVQTLNVDTLSDVGNAINDVTYADEFVEKSLDPVFSFPDKRSLLKKNQIIAVDTPENCIPNDIGDNFLSNNASLYPNTQINFDSTTEMNSTISMIDSTHHEFIDELGKTTTNAECNLLFDVPSETSENVNLNVIHCMSCKKMFDAMESYQMHVCEKSVSKRSNIISSSPDNLNQRFSQIDERERRNTEEAKNNSKKPAKKFFSCVYCGKEFSSRGVYMRHVNSHQKKENGLHKCKFCFKEFKKPSDLGRHLRTHTGEKPFACDQCDKKFSLKSTLEAHYKTHNPSAVKHFVCEVCNSFFSSKASRKLHMLVHTGAKPNKCFFCDQHFRTAAHRKCHEKKIHFSGRKKVNQSSAKKITNLLAAAVDMAVNEANLDNQDLEQSKIPEYSEIQVEYTDEKYSSESIPIDQVLLQQLQSSDILLEEIDPEVLACTESVNDLEVIEATGIISSDCFEENVNSISHIVGNFVCEICQQDCSGPEALKEHMELHLKKFECGQCSLWFSSVEALSEHERSHLVTESYSCFICDIVFYGIQQLKAHLRR

Similar Transcription Factors

Sequence clustering based on sequence similarity using MMseqs2

100% Identity: -
90% Identity: -
80% Identity: -