Basic Information

Insect: Thrips palmi
Gene Symbol: ZNF236_1
Assembly: GCA_012932325.1
Location: NW:18122643-18132012[+]

Transcription Factor Domain

TF Family: zf-C2H2
Domain: zf-C2H2 domain
PFAM: PF00096
TF Group: Zinc-Coordinating Group
Description: The C2H2 zinc finger is the classical zinc finger domain. The two conserved cysteines and histidines co-ordinate a zinc ion. The following pattern describes the zinc finger. #-X-C-X(1-5)-C-X3-#-X5-#-X2-H-X(3-6)-[H/C] Where X can be any amino acid, and numbers in brackets indicate the number of residues. The positions marked # are those that are important for the stable fold of the zinc finger. The final position can be either his or cys. The C2H2 zinc finger is composed of two short beta strands followed by an alpha helix. The amino terminal part of the helix binds the major groove in DNA binding zinc fingers. The accepted consensus binding sequence for Sp1 is usually defined by the asymmetric hexanucleotide core GGGCGG but this sequence does not include, among others, the GAG (=CTC) repeat that constitutes a high-affinity site for Sp1 binding to the wt1 promoter [1].
Hmmscan Out: # of c-Evalue i-Evalue score bias hmm coord from hmm coord to ali coord from ali coord to env coord from env coord to acc

1 28 0.072 2.3 8.5 0.2 1 23 282 304 282 304 0.97

2 28 0.00035 0.011 15.8 0.4 1 23 310 332 310 332 0.98

3 28 2.5e-05 0.00079 19.4 0.2 2 23 338 359 337 359 0.97

4 28 0.49 15 5.9 0.1 3 23 367 387 365 387 0.95

5 28 5.5e-06 0.00018 21.5 0.6 1 23 400 422 400 422 0.98

6 28 4.8e-06 0.00015 21.7 1.2 1 23 445 467 445 467 0.98

7 28 2e-07 6.5e-06 26.0 0.2 1 23 473 495 473 495 0.98

8 28 1.1e-05 0.00034 20.6 0.6 1 23 501 524 501 524 0.98

9 28 0.00026 0.0084 16.2 1.2 1 23 534 557 534 557 0.96

10 28 0.00044 0.014 15.5 4.4 1 23 707 729 707 729 0.98

11 28 6.2e-06 0.0002 21.3 3.0 1 23 735 757 735 757 0.99

12 28 6.4e-05 0.002 18.1 0.3 1 23 763 785 763 785 0.98

13 28 0.002 0.064 13.4 4.3 1 23 791 813 791 813 0.97

14 28 0.00011 0.0034 17.4 2.4 1 23 874 896 874 896 0.98

15 28 3e-05 0.00096 19.2 1.4 1 23 902 924 902 924 0.98

16 28 1.9e-05 0.0006 19.8 0.4 1 23 930 952 930 952 0.98

17 28 0.008 0.25 11.5 8.3 1 23 958 980 958 980 0.97

18 28 1.9e-06 6.2e-05 22.9 2.2 2 23 1275 1297 1275 1297 0.97

19 28 0.00041 0.013 15.6 1.2 3 23 1306 1326 1305 1326 0.97

20 28 0.00031 0.0097 16.0 2.8 1 23 1332 1354 1332 1354 0.96

21 28 0.00029 0.0091 16.1 1.6 1 23 1360 1382 1360 1382 0.98

22 28 6.4e-07 2e-05 24.4 0.8 2 23 1456 1477 1455 1477 0.98

23 28 1.5e-05 0.00047 20.1 3.0 1 23 1483 1505 1483 1505 0.99

24 28 5.6e-06 0.00018 21.5 1.5 1 23 1513 1535 1513 1535 0.98

25 28 0.0023 0.072 13.3 5.3 1 23 1541 1563 1541 1563 0.99

26 28 1e-07 3.2e-06 26.9 1.2 1 23 1817 1839 1817 1839 0.98

27 28 3.8e-06 0.00012 22.0 0.7 1 23 1845 1867 1845 1867 0.98

28 28 4e-06 0.00013 21.9 2.3 1 23 1873 1896 1873 1896 0.96

#	of	c-Evalue	i-Evalue	score	bias	hmm coord from	hmm coord to	ali coord from	ali coord to	env coord from	env coord to	acc
1	28	0.072	2.3	8.5	0.2	1	23	282	304	282	304	0.97
2	28	0.00035	0.011	15.8	0.4	1	23	310	332	310	332	0.98
3	28	2.5e-05	0.00079	19.4	0.2	2	23	338	359	337	359	0.97
4	28	0.49	15	5.9	0.1	3	23	367	387	365	387	0.95
5	28	5.5e-06	0.00018	21.5	0.6	1	23	400	422	400	422	0.98
6	28	4.8e-06	0.00015	21.7	1.2	1	23	445	467	445	467	0.98
7	28	2e-07	6.5e-06	26.0	0.2	1	23	473	495	473	495	0.98
8	28	1.1e-05	0.00034	20.6	0.6	1	23	501	524	501	524	0.98
9	28	0.00026	0.0084	16.2	1.2	1	23	534	557	534	557	0.96
10	28	0.00044	0.014	15.5	4.4	1	23	707	729	707	729	0.98
11	28	6.2e-06	0.0002	21.3	3.0	1	23	735	757	735	757	0.99
12	28	6.4e-05	0.002	18.1	0.3	1	23	763	785	763	785	0.98
13	28	0.002	0.064	13.4	4.3	1	23	791	813	791	813	0.97
14	28	0.00011	0.0034	17.4	2.4	1	23	874	896	874	896	0.98
15	28	3e-05	0.00096	19.2	1.4	1	23	902	924	902	924	0.98
16	28	1.9e-05	0.0006	19.8	0.4	1	23	930	952	930	952	0.98
17	28	0.008	0.25	11.5	8.3	1	23	958	980	958	980	0.97
18	28	1.9e-06	6.2e-05	22.9	2.2	2	23	1275	1297	1275	1297	0.97
19	28	0.00041	0.013	15.6	1.2	3	23	1306	1326	1305	1326	0.97
20	28	0.00031	0.0097	16.0	2.8	1	23	1332	1354	1332	1354	0.96
21	28	0.00029	0.0091	16.1	1.6	1	23	1360	1382	1360	1382	0.98
22	28	6.4e-07	2e-05	24.4	0.8	2	23	1456	1477	1455	1477	0.98
23	28	1.5e-05	0.00047	20.1	3.0	1	23	1483	1505	1483	1505	0.99
24	28	5.6e-06	0.00018	21.5	1.5	1	23	1513	1535	1513	1535	0.98
25	28	0.0023	0.072	13.3	5.3	1	23	1541	1563	1541	1563	0.99
26	28	1e-07	3.2e-06	26.9	1.2	1	23	1817	1839	1817	1839	0.98
27	28	3.8e-06	0.00012	22.0	0.7	1	23	1845	1867	1845	1867	0.98
28	28	4e-06	0.00013	21.9	2.3	1	23	1873	1896	1873	1896	0.96

Sequence Information

Coding Sequence: ATGGAGTCTGTACAGCTCCTTGCCGATTCATCTGAGGTTTTAGGAGGGCATGTGCTTTCTCTCCAAAATGGAGATGTCCTGAGAGATAGTGGAATTTTATTTACTCAAGATGGGTTATCATCGAACATCATAACAGCAGATGCATCAAATGAAGAAGTCCAGAGTTTTATGTCGTTACCAGTTCATGTTCTGCAAGACAACTCCTTTGTCGGTCCAGTGTTAGTAAAAAATGCAGCTGGAGAAACGTTTCTCATTGACCCAAGACAGtgtagCGTGATTGGGAATGCAACTGATGAAGCTCAACCTCAATACATCCTAGCTCCGAGCACTGAACTAGTCGATGCTGATCAAGCATCAACATCAGGAATCATGGGGCTCGACATGGACTTTTCTTACATTACAAATGTTGGGAATGTGGTACTGGGTGAAAATGCTGCTGTGCCTGAGAACAACATGGATGTTAACTCATCAACTATTTTACAATTAGGCAGTGAAGTCCTTCAAGGGGCAAACAAACTACTTCCTGAAGGAATGTGTATTGATATGTCTCAATTAAGCATTGTAACTCCCAATGGTATTGTGTCATATGTGACATCCACTGATGATGGTATACTTTCTGTAGACACAGAAACTGAACATGCTATGCCAGAGCCCAGTAGAGGTGAAGAAGTGGATATGAAAGATCTTGTTCTTCACACTGAGGATGAGATCGGATTTGATGATTCAGAACAAATAGACCAAGAAATTTCTCCCTCTGTACGTGCCAAGAGAGGACGAGGAAGACCCAGGAAAAGTGACCCCCAACAGGATGATGTAATGGATCCTCCAGTAGGAAAGCCTCCTTATAAATGTGACACATGCGGATATGAAGCAGTTCTTTGGGGAAGACTTAAAAGGCACAAAGAAAGTcacaaaaatgaaaaaccACACCGTTGTAAAGAATGTGGTGCGTCATACAATGTTGAAATAAATTTAACTTTGCACATGGCTACACACAGTCAAGGTGAACTGAAGTGCCCAGAATGCCAGAGGGCTTTCTCCAGAGTAGCCAGCCTAAGATCACACCTCATGATGCATGAACGGGAAGATAACCTTTTCTGTACTGAGTGTGGAGATGAGTTTGCTTTGCAGTATCAGCTTGATAGTCATGTAATGGAGCATCAAGATGAATGGGTTGCCAAAAACTTAGAAAGGGTTTATGAGTGTGTAAAGTGTCAACGTCAGTTCTCTCGAGCATCTGCCCTGAAAGAACACATGCGTGAACATGTCAAGGTAAAGCACTCCTTAGTCAGAAGAAAACATGACCGTTCTCAAGATCGCTCGGATTTCTCTCACAAGTGTCCTACTTGTGCTAAAGTCTTCCAGAAGCCCAGCCAACTTGTCCGACACATGCGTATACACACGGGAGAGCGACCTTACCCGTGTGATATTTGTGGGAAAGCTTTCAGTCAAAAGGGCTCCCTTCAAATACACATGACGAAGCACAATGGAGACAAACCTTATCAATGTGACTTCTGCAGTGCGAGATTTAGCCAGAAAGGCAACCTGAGGGCTCATATTCAGAGAGTACACTCAATTCCACAACAGGGCACTGTAACTTATCAATGTACTGAGTGCCCATGTATGTTCCGAAAATTAGGAAGTTTAAATTCTCACATGGGTCGTGCTCATAATCATCAAGGAGACACTACACAGCCATTGAAAAACAATGCTCTGAGCTCTGAACAAATGATGCAAGTAAATGTTAACCAAATTATGGCACAACTGGCTGCCCTAGAAAAGGCCACATCTAGTGGAGCACCCACAAATCCAGGTGTGTCAAGTGACCCTAAGGAGCAACAGTCTCAGCATGTCAATTTTAATAACTCTCAAAATGCTGAAAATTCCGTGGTAACTTCAGACATTAGCTCATCAACCACAGCAGATGCTGGCACCAAAGATATTCTTCAACAAGCTATTAGCAAAAGCGGGTTGGAAGGGAAGTCTGAAACAGAACCTGTTGTTGGTAAGGAGAAAACTACACCCAGTACTGGTTTCATAACTTTGGCTGATAAGTCCCTTGATGGGACAGTAAGGCGATACACTATACGTCAAAGAAGAGTGGCAGGTGTGCGATGGCATCAGTGTTCATACTGCTGCAAAGAATTCAAAAAGCCATCTGATCTTGTTCGACATATTCGAGTTCATACACATGAAAAACCATACAAATGCTCTCATTGTTTCCAAGCGTTTTCTGTTAAATCTACTTTAACAGCTCACATTCGCACTCATGGTGGTCTGAAAAACTACTCATGTGCCGAATGCAATGCAAAATTCTCTTCGGGTAGCAGCCTCAAAGTTCACATGCGACTGCACAATGGGGAGAGGCCATTTTCTTGCAATGTATGCAACCGTACTTTCCGCACCTCTGGCCACAGACAGACCCATTCTCTCACTCATTGTGCCTCTGATGCAACAGTGTCTCCcaagaagaagagaaaaagaaagctTAGGAAACAGGAACTGCAGCCAGGGGAGAGCCTCCCAGATGTTTTGTTGGAGGAGCCAATTGTCATTACAGAGACAGGCTCAGTACAAGAAGATGTTTCAAAGCCAAGTAAACCACCTGCCCCCAAAGCTTTCAGCTGTGACACATGCTCCGCAGCTTTCCGCAAACGTAGTCATCTTAATGTCCATCTTAGAAGCCATACTGGCGAACGACCTTTCCAATGCCATATTTGCAACAGGAGCTTTGTTTCAAGTGGTGTGTTGAAGTCCCATGTTTTAACACATGAAGCTGTGAAGCCTTTCAAGTGTGATATTTGTTCTGGAACATTTTCCACTCAAGCAAGTCTTAAGCGGCACCTCATCATACACAATACCAACAAGCCCTTCATGTGCCCCTACTGCCATAAAACTTTCAAAAATAGACTTAATTGTAAAAAACACATAAAGAATCATAAAATAGAAGTTGCCAGAGCTGTTGCACAACAAACAAATGAAATGCAGGAACAACAATTTGTTGTGGCCGTTGGAGATGGTTATGACGGAGGAGAAATAATTGTTCCCAGCTGTCAGGCATTTTCAAGTAATGCTCTTGGTGCTGATGGTAGTCTTGGTGAAACAGTTCCAGTGGGGGACAAACTTCTCCATACTGGAAGTGTTATTACTCACACCCTACTGGCTGATGCTTCTGGAACCATAACATTGCCTGCTTCTTTGACTCAGGAAAATATCCGTGAGATAGAGGATACTCTGAACCAACAGCTGTCATCTGTGGGTGGTAACACAGTACTTATCAATGCGTCAGAGCAAGCTGGTATTTCTCTTGGTGCTTTGTCGGCTGAAACAGCTGTCCAAGGGACAAGTGTCATCGATTTTGCTGATGCCTCGGAAGCTGCTCATGCTGAAgatgttgctgctgctgctaatCTGGCAGCGAGTGAAGCCCCTCCAGATTCTGGCTTAAACAATGACCCCAAGGACTCAAACTTAGCTCAGGAATCATCTGATTTGAACTCAGCTATATTTGGACAGCCATTTGACCAACAAGCCTATGACTCGTGTACATTCCCTGCTATCACATTACAGGGTGACCAGTTAAATCTTGGGGGTATTGATCAAGGAGCCACATTGTCAGCAAACATGGAGGCCATTTTGCCACAGTCAAGGGGCAATGAGCGTAGAAGGAACGCACAGGATGAGAATGCTGATAATTCTGAAGCTCATGATGATATGACAGACATAGGCGAACTTTGTCTGCATGATGTGGAGGTGCACAGTATGACCAATGAACAGTTAGTAGAACCAGAACCTGTTCAAGAAACTAGTCCTGCCTTACCAACATGTGAAACTTGTAATAAAAGTTTTAAAAGACTTTCCCAACTCAAGTTACATATGAGATCTGTTCATCAAGCCAGTCCAAAGCCTAATATGTGCTCTCATTGTGACCGAAGCTTTAGCTCAGTGAATGCTTTACGGTTACATGCTCGAATACACAATGAAGATAAACAACATGCCTGTGAGCATTGTTCTTTGACTTTTTCAACAATGGCCTCTCTGACCAGGCATATGACTGTTCACACCGATGCTAAGCCTTATTCATGTGCCAAGTGTTCTGCAACTTTCCGTACTCAGATGCAACTTCGTAAACATGCCAAAAGTCATGATTCCAGCTCTTCAAGGCGCCAAAGAACTGGAAGGAAATTTCCAGCCATTATCTTTTCAGAAGAGCAGACAACTGCCTTGGCTACTCAGGATGCTGAAACGGCTGGTACTGTTTCTGAACAAATGCTCATTGCTTCGGCAATAGAAACTGTAGAAATGAGTAAAATAGCCAACAATGAGGGCTCTAAGAAGTTTGATCCAGAGACAGTATTTGCAAATAAATGCAAATATTGCCCCAAAAGTTTTCGGAAGCCATCCGACTTGGTGCGCCACGTTCGTATTCACACGGGAGAGCGACCGTTTCGTTGTGATTACTGCTACAGATCATTTACTGTGAAATCAACTCTTATATCACATCAAAAGACTCACATGGCTGACATGCCAAAAAAGTTCCCGTGCCATGTATGTAACCTCAGGTTTTCAACCAAGGGTAGCTTAAAAGTCCACATTCGATTGCATACAGGTTACAAGCCATTCAAGTGTCATCTATGCAGTGCAAGATTTAGGACTTCCGGCCACCGCAAAGCTCACATTCAAACTCACATTAATGGGTCCACTGGTGCACGTGGTCGCAAAAATCAACAGGTTCTACCGATTCCTGAAGAAGAACCAAACAATGAAGGAGAGCAGATGCTTGAAGGAAATCCTACTGAAGTTCATCAGATAATCACTGAGGATGGATCAGTTTTGGAAGTTGACACTGCAGCTTTACTTGCGGCCGGTGCCACACTTGATGGAACCTCATTGCAGTTTCAAATTAATGATGAGATACTTCAACAATTACAGCTTCAAAATGGAGGAAATGTTGTTATTCAAGAAAATGGTACTGTTGAGTTTGTGACCAATGGAGAGGATGTCAATGCCAATGAGGAGATCATTGCTTCTCAAATTAATATGGCAAATCAAGAATTGCCATCATTGTTACCAACTATTGAAGAAATGGATGTGGTTCAACACGAGGAACTGGAACATCAAGACAATCATCATGATAGCATGGCAGGCATGCATTTTGAAATCCACACGGATGAGCATGGCCAAATTGTTAACATTCAACAAACATTAGACGGAAGTGGGGTTGTGCTTGCAGATATGAGTGACGCCAACATTGGAgaTATGACAAGAGTAATTGATGGGTCCCAGTTTCATATTTTGGATAGTGTTACTGGAGTGGATACTGTTAACAAAGTAGATTCAAATGGATTTGTGACACTGGACATTAGCGACATTATAATGCCTCCTCCTAGCAACAGCAAAAAGGGCAAGGGTGGAAAGGGCAAGGCTGATTCGTCGGGTCCGACTGCTCACACCTGCTCAGTATGCGGCAAGGTGTTTTCTAAACCAAGCCAACTTCAGCGGCATGTTAGGATTCACACTGGGGAAAGACCTTTCCCTTGCACTCAGTGCTGGAAGGCATTTAATCAGAAAAATGCACTGAAAGCTCACATGAAGCGACACACAGGTGAGCGTCCCTACAAGTGCCCACACTGTGATCATGCTTTCACTCAAAGAGGAAATTTAAAGACACACATTGGAAGAGCACATCCCCATTCAACTGACGCTGTAATACCAAAGAAGAGAAGTAAGAAGGTGGCATCACTACCAAAGAGCAACATACTTGATGATGTTACATTCAGGCTTGATCTAGATGGTGTTGTAGGTGACTTATTTCCGCAAATGCAAAATACAGCTGTTGCAGAGGCTGACTAA
Protein Sequence: MESVQLLADSSEVLGGHVLSLQNGDVLRDSGILFTQDGLSSNIITADASNEEVQSFMSLPVHVLQDNSFVGPVLVKNAAGETFLIDPRQCSVIGNATDEAQPQYILAPSTELVDADQASTSGIMGLDMDFSYITNVGNVVLGENAAVPENNMDVNSSTILQLGSEVLQGANKLLPEGMCIDMSQLSIVTPNGIVSYVTSTDDGILSVDTETEHAMPEPSRGEEVDMKDLVLHTEDEIGFDDSEQIDQEISPSVRAKRGRGRPRKSDPQQDDVMDPPVGKPPYKCDTCGYEAVLWGRLKRHKESHKNEKPHRCKECGASYNVEINLTLHMATHSQGELKCPECQRAFSRVASLRSHLMMHEREDNLFCTECGDEFALQYQLDSHVMEHQDEWVAKNLERVYECVKCQRQFSRASALKEHMREHVKVKHSLVRRKHDRSQDRSDFSHKCPTCAKVFQKPSQLVRHMRIHTGERPYPCDICGKAFSQKGSLQIHMTKHNGDKPYQCDFCSARFSQKGNLRAHIQRVHSIPQQGTVTYQCTECPCMFRKLGSLNSHMGRAHNHQGDTTQPLKNNALSSEQMMQVNVNQIMAQLAALEKATSSGAPTNPGVSSDPKEQQSQHVNFNNSQNAENSVVTSDISSSTTADAGTKDILQQAISKSGLEGKSETEPVVGKEKTTPSTGFITLADKSLDGTVRRYTIRQRRVAGVRWHQCSYCCKEFKKPSDLVRHIRVHTHEKPYKCSHCFQAFSVKSTLTAHIRTHGGLKNYSCAECNAKFSSGSSLKVHMRLHNGERPFSCNVCNRTFRTSGHRQTHSLTHCASDATVSPKKKRKRKLRKQELQPGESLPDVLLEEPIVITETGSVQEDVSKPSKPPAPKAFSCDTCSAAFRKRSHLNVHLRSHTGERPFQCHICNRSFVSSGVLKSHVLTHEAVKPFKCDICSGTFSTQASLKRHLIIHNTNKPFMCPYCHKTFKNRLNCKKHIKNHKIEVARAVAQQTNEMQEQQFVVAVGDGYDGGEIIVPSCQAFSSNALGADGSLGETVPVGDKLLHTGSVITHTLLADASGTITLPASLTQENIREIEDTLNQQLSSVGGNTVLINASEQAGISLGALSAETAVQGTSVIDFADASEAAHAEDVAAAANLAASEAPPDSGLNNDPKDSNLAQESSDLNSAIFGQPFDQQAYDSCTFPAITLQGDQLNLGGIDQGATLSANMEAILPQSRGNERRRNAQDENADNSEAHDDMTDIGELCLHDVEVHSMTNEQLVEPEPVQETSPALPTCETCNKSFKRLSQLKLHMRSVHQASPKPNMCSHCDRSFSSVNALRLHARIHNEDKQHACEHCSLTFSTMASLTRHMTVHTDAKPYSCAKCSATFRTQMQLRKHAKSHDSSSSRRQRTGRKFPAIIFSEEQTTALATQDAETAGTVSEQMLIASAIETVEMSKIANNEGSKKFDPETVFANKCKYCPKSFRKPSDLVRHVRIHTGERPFRCDYCYRSFTVKSTLISHQKTHMADMPKKFPCHVCNLRFSTKGSLKVHIRLHTGYKPFKCHLCSARFRTSGHRKAHIQTHINGSTGARGRKNQQVLPIPEEEPNNEGEQMLEGNPTEVHQIITEDGSVLEVDTAALLAAGATLDGTSLQFQINDEILQQLQLQNGGNVVIQENGTVEFVTNGEDVNANEEIIASQINMANQELPSLLPTIEEMDVVQHEELEHQDNHHDSMAGMHFEIHTDEHGQIVNIQQTLDGSGVVLADMSDANIGDMTRVIDGSQFHILDSVTGVDTVNKVDSNGFVTLDISDIIMPPPSNSKKGKGGKGKADSSGPTAHTCSVCGKVFSKPSQLQRHVRIHTGERPFPCTQCWKAFNQKNALKAHMKRHTGERPYKCPHCDHAFTQRGNLKTHIGRAHPHSTDAVIPKKRSKKVASLPKSNILDDVTFRLDLDGVVGDLFPQMQNTAVAEAD

Similar Transcription Factors

Sequence clustering based on sequence similarity using MMseqs2

100% Identity: -
90% Identity: -
80% Identity: -