Basic Information

Insect: Leptophobia aripa
Gene Symbol: ZNF341_1
Assembly: GCA_951799465.1
Location: OX637266.1:206534-209346[-]

Transcription Factor Domain

TF Family: zf-C2H2
Domain: zf-C2H2 domain
PFAM: PF00096
TF Group: Zinc-Coordinating Group
Description: The C2H2 zinc finger is the classical zinc finger domain. The two conserved cysteines and histidines co-ordinate a zinc ion. The following pattern describes the zinc finger. #-X-C-X(1-5)-C-X3-#-X5-#-X2-H-X(3-6)-[H/C] Where X can be any amino acid, and numbers in brackets indicate the number of residues. The positions marked # are those that are important for the stable fold of the zinc finger. The final position can be either his or cys. The C2H2 zinc finger is composed of two short beta strands followed by an alpha helix. The amino terminal part of the helix binds the major groove in DNA binding zinc fingers. The accepted consensus binding sequence for Sp1 is usually defined by the asymmetric hexanucleotide core GGGCGG but this sequence does not include, among others, the GAG (=CTC) repeat that constitutes a high-affinity site for Sp1 binding to the wt1 promoter [1].
Hmmscan Out: # of c-Evalue i-Evalue score bias hmm coord from hmm coord to ali coord from ali coord to env coord from env coord to acc

1 15 0.14 8.8 7.1 1.7 3 23 25 45 23 45 0.94

2 15 0.025 1.6 9.5 3.5 1 19 53 71 53 76 0.89

3 15 6.9e-07 4.3e-05 23.8 0.9 1 23 82 105 82 105 0.95

4 15 0.54 34 5.2 2.4 2 23 108 129 108 129 0.94

5 15 0.91 57 4.5 0.8 1 23 163 185 163 186 0.66

6 15 4.2 2.6e+02 2.5 0.2 3 19 208 224 206 226 0.92

7 15 0.017 1.1 10.0 1.3 1 23 236 258 236 258 0.92

8 15 6.7e-05 0.0042 17.6 0.6 1 21 264 284 264 285 0.95

9 15 5.5 3.4e+02 2.1 3.6 1 23 296 319 296 319 0.92

10 15 0.4 25 5.7 1.0 2 23 325 348 324 348 0.90

11 15 1.3 79 4.1 0.3 3 23 356 376 356 376 0.92

12 15 0.0015 0.092 13.3 0.2 1 20 381 400 381 403 0.94

13 15 0.00064 0.04 14.5 1.4 1 23 409 431 409 431 0.98

14 15 0.00026 0.017 15.7 2.2 3 23 439 459 438 459 0.98

15 15 0.028 1.8 9.3 2.3 1 23 465 488 465 488 0.96

#	of	c-Evalue	i-Evalue	score	bias	hmm coord from	hmm coord to	ali coord from	ali coord to	env coord from	env coord to	acc
1	15	0.14	8.8	7.1	1.7	3	23	25	45	23	45	0.94
2	15	0.025	1.6	9.5	3.5	1	19	53	71	53	76	0.89
3	15	6.9e-07	4.3e-05	23.8	0.9	1	23	82	105	82	105	0.95
4	15	0.54	34	5.2	2.4	2	23	108	129	108	129	0.94
5	15	0.91	57	4.5	0.8	1	23	163	185	163	186	0.66
6	15	4.2	2.6e+02	2.5	0.2	3	19	208	224	206	226	0.92
7	15	0.017	1.1	10.0	1.3	1	23	236	258	236	258	0.92
8	15	6.7e-05	0.0042	17.6	0.6	1	21	264	284	264	285	0.95
9	15	5.5	3.4e+02	2.1	3.6	1	23	296	319	296	319	0.92
10	15	0.4	25	5.7	1.0	2	23	325	348	324	348	0.90
11	15	1.3	79	4.1	0.3	3	23	356	376	356	376	0.92
12	15	0.0015	0.092	13.3	0.2	1	20	381	400	381	403	0.94
13	15	0.00064	0.04	14.5	1.4	1	23	409	431	409	431	0.98
14	15	0.00026	0.017	15.7	2.2	3	23	439	459	438	459	0.98
15	15	0.028	1.8	9.3	2.3	1	23	465	488	465	488	0.96

Sequence Information

Coding Sequence: ATGACTTCATGGGAGGCTTTACAATATCTTCAAAAACCATTAACCACAATCGAAAAAGTTGGTGGAATCAATTgcaaattatgtaaaacaatcTACAAAAGTAAACAAGAATTTGACTCTCACTATACAAATCACACTGGATATCAGGAAATTGTGTACCAATGCGTTGTTTGTAGCAAAGAATTCTCAAGATACTCAGCATTCCGTGGCCATTGCTATACTAATCATGTCAATAAGAACAGATACATGTGTACACAATgtgataaaatgttttcaaagcAGTATAATTTACAGCAACATATTGAATTAGTTCATGGAGCACAATGTAAAGCTTGCATGAGaagaTTTCCATCAAAAAAAGAACTGCACCTCCATCAAGTCTACCACAACAAAAGCATGGTTGACAACTCCTGTCAAGTTTgtcaaaagaaaattcttacggtTGAAGCCTGCCAACAGCACATTGATTTGCACTTGTCCCAAGCCTACACCTGTCCGATATGCCAAGAAACAATACTGAACAAAAGCAAGTCTGCCGAACATTTGAAGAAACACTTCTGGAAAAATGGTTTTGATGAAAGCGATCCCGTTAGAATCGTTAAACAGTTGGCTGCCACAGCTTGCGGGTTATGTTCAATGATTTTCCAAGACCATGTCGAGTTTGAAACTCACTTCAATTGTGACCACACCCACAAAGATATGTTTTACACCTGCATTGTGTGTGGCAAACAGTTTGATAAATTGTCAGAATTCCACAAACACGTCGGCCTCCATTACGCTGATGGCCAATTTAGATGTGATAGTTGCGACAAAACATTCCCAAACCTCTCCGATCTCGTGTCCCACTTGTGTGTGTGCAGCGAAGAGTACAAGAAACACAAGCCGTACATGTGCTTCCACTGCGGCAACAGATACCTTCTGGAGCACTCGCTCCTGAAGCACATCACCAACTCCCACAACGGATTCGATCTGCGTTGCAGGGAACCTGGCTGCGAACAGATATTCGACAAACGCCGGGAGCTCTTGCTCCACTCCCGCCACCACGAGCACCGCGTGCAGAGCTGGTGCCGCATTTGCGGGCAGGACTTTCCCTCGTTGCCTTCCTGCGCCCAACACCTCGAGGTCCACAAGAAGAAGCTCTACGCCTGCCCGCTCTGCAGCAAGTCCTACGCTGAGAGGTCCTACCTCCTCAAACACGTCCCCAATCACTTCAGAGCCGTGCTGCACGTCTGCAAGATCTGCGGGAAGATTTACGACGCGAAGAGGCGGCTCCTGGAGCATCAGAAGACGCATCGGGAGGTGAAGGTGCACGGCTGCTCGCGGTGCCCGAAGACGTTCGCCAAGAAGTTCCACCTGCTGCAGCATCTCAACATCCACAGTTTGGACAATAAGTTCCAGTGCATCGTGTGCGAGAAGAGATTCTCTTGCTCACCCAATCTTTCCAAGCATCAAATGAGAGTGCACTGCGTCAGTTCCAAGCAGTTGGTGATTTGCGAAGCGCGGGATCAGGGAATCCAGCCGATCGTTGAAAATAAGGAAGTGGAGACGTCGCAGAGAAGACATTGGTACGTTTACTTGGACCGAGAGATTGAGACCGACGCCATCGACGAAGCCGTCATCGAGGAGGAGTCGAAGCTGTTCGAGAGCCAAGAGAGAGCCAAGCGAGTGGACCTCATGCAGGTGGAGATCCAACACGAAGCGTTCAAAGTGGACGCCATTCATTCGAGTCTCTTAAAGAGCGAAAAGTGTTTCCAGGCGGTGTCGTTGTCTGATGTGGCCCAGGGCACCGCGGACGCCGTGCCCCCGGAGTACGGGCCGGAGCTGGCGTCCGCCGGGCTGGACGACTGCATCCTGCCGCACATCGACCCCCTGCTCACGATCCTCACCGACGCCGTTCCGGAGCCGCCGCAGCCCAGCGCGGTGCCGCCGCCGCACATCCCCGCCGAGGCGTGGAACCCGCCCCTCATCGCCAAGGTCTACTCCCACTTCTACGACGACTACCAGGACGACTGCCTGTCTGTGCACACGGACATCTATTGA
Protein Sequence: MTSWEALQYLQKPLTTIEKVGGINCKLCKTIYKSKQEFDSHYTNHTGYQEIVYQCVVCSKEFSRYSAFRGHCYTNHVNKNRYMCTQCDKMFSKQYNLQQHIELVHGAQCKACMRRFPSKKELHLHQVYHNKSMVDNSCQVCQKKILTVEACQQHIDLHLSQAYTCPICQETILNKSKSAEHLKKHFWKNGFDESDPVRIVKQLAATACGLCSMIFQDHVEFETHFNCDHTHKDMFYTCIVCGKQFDKLSEFHKHVGLHYADGQFRCDSCDKTFPNLSDLVSHLCVCSEEYKKHKPYMCFHCGNRYLLEHSLLKHITNSHNGFDLRCREPGCEQIFDKRRELLLHSRHHEHRVQSWCRICGQDFPSLPSCAQHLEVHKKKLYACPLCSKSYAERSYLLKHVPNHFRAVLHVCKICGKIYDAKRRLLEHQKTHREVKVHGCSRCPKTFAKKFHLLQHLNIHSLDNKFQCIVCEKRFSCSPNLSKHQMRVHCVSSKQLVICEARDQGIQPIVENKEVETSQRRHWYVYLDREIETDAIDEAVIEEESKLFESQERAKRVDLMQVEIQHEAFKVDAIHSSLLKSEKCFQAVSLSDVAQGTADAVPPEYGPELASAGLDDCILPHIDPLLTILTDAVPEPPQPSAVPPPHIPAEAWNPPLIAKVYSHFYDDYQDDCLSVHTDIY

Similar Transcription Factors

Sequence clustering based on sequence similarity using MMseqs2

100% Identity: -
90% Identity: -
80% Identity: -