Basic Information

Insect: Lasioglossum vierecki
Gene Symbol: ZNF236_1
Assembly: GCA_028455595.1
Location: CM052343.1:20450700-20458354[+]

Transcription Factor Domain

TF Family: zf-C2H2
Domain: zf-C2H2 domain
PFAM: PF00096
TF Group: Zinc-Coordinating Group
Description: The C2H2 zinc finger is the classical zinc finger domain. The two conserved cysteines and histidines co-ordinate a zinc ion. The following pattern describes the zinc finger. #-X-C-X(1-5)-C-X3-#-X5-#-X2-H-X(3-6)-[H/C] Where X can be any amino acid, and numbers in brackets indicate the number of residues. The positions marked # are those that are important for the stable fold of the zinc finger. The final position can be either his or cys. The C2H2 zinc finger is composed of two short beta strands followed by an alpha helix. The amino terminal part of the helix binds the major groove in DNA binding zinc fingers. The accepted consensus binding sequence for Sp1 is usually defined by the asymmetric hexanucleotide core GGGCGG but this sequence does not include, among others, the GAG (=CTC) repeat that constitutes a high-affinity site for Sp1 binding to the wt1 promoter [1].
Hmmscan Out: # of c-Evalue i-Evalue score bias hmm coord from hmm coord to ali coord from ali coord to env coord from env coord to acc

1 25 0.0014 0.12 13.1 0.6 2 23 165 186 164 186 0.96

2 25 0.00012 0.01 16.4 1.1 1 23 192 214 192 214 0.98

3 25 2.1e-06 0.00018 22.0 0.7 2 23 220 241 220 241 0.97

4 25 0.0053 0.44 11.3 0.2 3 23 249 269 247 269 0.96

5 25 0.0001 0.0087 16.7 1.1 2 23 280 301 280 301 0.98

6 25 8.7e-07 7.3e-05 23.2 1.1 1 23 322 344 322 344 0.99

7 25 6.8e-06 0.00057 20.4 0.7 1 20 350 369 350 372 0.95

8 25 5.6e-05 0.0047 17.5 0.5 1 23 378 401 378 401 0.94

9 25 0.00038 0.032 14.9 3.6 1 23 410 433 410 433 0.98

10 25 2.2e-06 0.00018 21.9 2.1 1 23 562 584 562 584 0.98

11 25 0.00037 0.031 14.9 3.3 1 23 590 612 590 612 0.99

12 25 0.0045 0.38 11.5 5.2 1 23 618 640 618 640 0.99

13 25 0.00031 0.026 15.2 4.1 1 23 749 771 749 771 0.98

14 25 5.5e-05 0.0046 17.5 4.8 1 23 777 799 777 799 0.99

15 25 0.00024 0.02 15.5 0.8 3 23 807 827 805 827 0.97

16 25 0.0001 0.0087 16.7 5.4 1 23 833 855 833 855 0.98

17 25 0.23 19 6.2 1.9 2 23 1248 1269 1247 1269 0.96

18 25 0.00069 0.058 14.1 1.2 1 23 1275 1297 1275 1297 0.98

19 25 6.3e-08 5.3e-06 26.8 1.4 2 23 1397 1418 1396 1418 0.98

20 25 0.00085 0.072 13.8 3.5 1 23 1424 1446 1424 1446 0.99

21 25 0.00029 0.024 15.3 1.9 1 23 1452 1474 1452 1474 0.98

22 25 0.0017 0.14 12.9 3.6 1 23 1480 1502 1480 1502 0.98

23 25 5.8e-06 0.00048 20.6 0.6 2 23 1737 1758 1736 1758 0.97

24 25 3.6e-05 0.003 18.1 3.6 1 23 1764 1786 1764 1786 0.98

25 25 4.2e-06 0.00036 21.0 1.5 1 23 1792 1815 1792 1815 0.96

#	of	c-Evalue	i-Evalue	score	bias	hmm coord from	hmm coord to	ali coord from	ali coord to	env coord from	env coord to	acc
1	25	0.0014	0.12	13.1	0.6	2	23	165	186	164	186	0.96
2	25	0.00012	0.01	16.4	1.1	1	23	192	214	192	214	0.98
3	25	2.1e-06	0.00018	22.0	0.7	2	23	220	241	220	241	0.97
4	25	0.0053	0.44	11.3	0.2	3	23	249	269	247	269	0.96
5	25	0.0001	0.0087	16.7	1.1	2	23	280	301	280	301	0.98
6	25	8.7e-07	7.3e-05	23.2	1.1	1	23	322	344	322	344	0.99
7	25	6.8e-06	0.00057	20.4	0.7	1	20	350	369	350	372	0.95
8	25	5.6e-05	0.0047	17.5	0.5	1	23	378	401	378	401	0.94
9	25	0.00038	0.032	14.9	3.6	1	23	410	433	410	433	0.98
10	25	2.2e-06	0.00018	21.9	2.1	1	23	562	584	562	584	0.98
11	25	0.00037	0.031	14.9	3.3	1	23	590	612	590	612	0.99
12	25	0.0045	0.38	11.5	5.2	1	23	618	640	618	640	0.99
13	25	0.00031	0.026	15.2	4.1	1	23	749	771	749	771	0.98
14	25	5.5e-05	0.0046	17.5	4.8	1	23	777	799	777	799	0.99
15	25	0.00024	0.02	15.5	0.8	3	23	807	827	805	827	0.97
16	25	0.0001	0.0087	16.7	5.4	1	23	833	855	833	855	0.98
17	25	0.23	19	6.2	1.9	2	23	1248	1269	1247	1269	0.96
18	25	0.00069	0.058	14.1	1.2	1	23	1275	1297	1275	1297	0.98
19	25	6.3e-08	5.3e-06	26.8	1.4	2	23	1397	1418	1396	1418	0.98
20	25	0.00085	0.072	13.8	3.5	1	23	1424	1446	1424	1446	0.99
21	25	0.00029	0.024	15.3	1.9	1	23	1452	1474	1452	1474	0.98
22	25	0.0017	0.14	12.9	3.6	1	23	1480	1502	1480	1502	0.98
23	25	5.8e-06	0.00048	20.6	0.6	2	23	1737	1758	1736	1758	0.97
24	25	3.6e-05	0.003	18.1	3.6	1	23	1764	1786	1764	1786	0.98
25	25	4.2e-06	0.00036	21.0	1.5	1	23	1792	1815	1792	1815	0.96

Sequence Information

Coding Sequence: ATGTTGACACGACAAGCTGTAATCACAGAATCTAACCCGGTCGCGGCAGTGCCAATAAATATCGTTGCAACCGAAGATGGTAGAACGTTACTAGCAGTGACAGAAGACAAAGATGGGCTATTGGAAGTCATTGCGACTCCGGTTACTCTCATCGGTCACAATGTCACAGCTGGGTCGTTGATGGATATCAAGAATGTAAACGGTTGTTTGATATTACACCCGTCTCCTCTTCAAATTGGTTTGGACTCCAGCGAAGGTTTGGATCTCGAACTGTCCAAGCAATGTGTTCGAGTCGATTCTGACGCTCCGAGTCGAATCAAAACCAAAGTAGGCTTGGATACAATTAGCGGTTTCCTTGACGAAGAGTCTTCGCAGAGAGAGAAGAGCAATGAAATTGTCAAGGGGAAGTCGACTGCCATAATTACGAGAACAAATAGTCCTGGAAGGCCCAAAAAAAGTTCTGCCGTTGCATTGAAAGGCAAAGAGGGCTTGAGATGCGACATATGCCAGCAAGAATTTTCCAAGCAAGCTCCGTACAAAAAACACATGGACAATCATGCGGAAGAGAAGCCACATCGCTGCCCAAAATGTTCGGCATCCTTTAATGTACCGACAAACTTCACGCTTCACATGGCTACACATAATTCCGGCGACCCGAGGTGCCCCGAGTGCGGTAAGAAATTTACGAGAATGGCCAGCTTAAAATCTCATATGCTGTTACACGAGAAGGAAGAGAACTTGTTTTGTACCGAGTGCGAAGACGTTTTCTCGACCAAGGCTCAATTAGATGCGCATTTGAAACTTCACGGAGAAAAGTGGACGACCGAAGAAGCAAGGAAATGTAAGCTGTGTAACAAGCAGTTCAGGCAACCGGCGTTGTATCGATTACACATTCGTGAACATTACAGGTTGCAGACGAAGGTAGTAAAGCAAACAAAAAGAGGGGCCAAACATAAAACGGTATACAAATGCACGATATGCTTAAAATCCTTCCAAAAGCCAAGCCAATTAATGCGTCACATCCGAGTGCATACGGGTGAGAAGCCGTTCAAGTGTACAGTGTGCGGTCGTGCGTTCACGCAAAAGAGTTCTTTACAAATTCATACGTGGCAGCACAATGGTATACGACCTCATGCTTGCGAGCTCTGTAACGCCAGATTTAGTCAGAAAGGCAATTTAAATGCTCATATAACGAGAGTCCACAATGTGCCAGAGGGAGAGCCTATATACAGATGCAACTACTGTTCTTGCGTTTTCAAGAAGCTTGGCAGCTTGAACGGTCACATGAAACGTATGCATACAGGAGTGAACGAGGACAGTGCTACCGTTAGAATCTCCGAATCAGCCGACACCATCGAATCGGACATACGAGCGACGGTAAACAACGTTATAACGCAACTGGCGTCTTTAGAGTCGAACACGGATGAAGTTGAAAATGGAAAACCAGAAAACTTTGAGGAGAGCGGGTTATTAGCAAATGTCCCTACCAAGAAAGATATTCTACAACAGGCACTGAAAAATTGCGGGTTACCCAGTAGAAACAAAAGTTCGTGCGATGATCTATCCGAGGCAAAAAAGTTGGATGCACGCACGAATTTCGTTACCTTGCTGGACCGAGCATCGGACAGCGGTACCAGAAAATACCTGACGATAAAGCAACGGTGTGTAGGGAACATAAGATGGTACGCGTGTACGTTTTGCCATAAAGAGTTCAAGAAACCGTCAGACCTGATACGGCATTTACGAGTGCACACGCAGGAAAAACCATTCAAGTGCACGCACTGTTATCGTTCTTTCGCTTTAAAGTCCACCATGATAGCGCACGAGCGTACTCATATAGGTACCAAGAGATACACCTGCGGCACTTGCGATAAAACGTTCACGTGCCACAGTAGCTTGGTTATTCATACAAGATCGCACGGGAACTCTGACGAATGTTTTAGCatatcgattggtaacgaaaatgataacggtactggtcacgatcataataatgataacgataacaacaccgataacggtaatgccgatattgacgcaacggttaacgTAGCCGCTCGTTGCAGTAATCGACAGAAAATTAACGCAAACAAGTCGATGATGTCTCCGAAAACGGAGAGCCTCGCGTCTCAAGTGATACTGTCGGAGCCGTTGGTAATCAGTGACTCCGGAAATAACATATGCGTGGTACAGATACCTTCGAAGAAGCGTGTTTACGATGCTGCGATCGATCCAGCTAGGCCGCATAAATGTTGGGAATGCGAAGCGGCATTTCGAAAAATCAGTCATTTGAAGCAACACCAACGACGACACACCGGAGAACGTCCTTACAGGTGTTCCAAATGCGACAGGAGATTCACGTCTAACAGCGTTTTGAAATCGCATCTGCACACGCACGAAGACTCGAGACCGTACGGGTGTTCCATTTGTACCGCAAAATTTTCAACGCAGAGCAGCATGAAAAGACATTTGGTTACTCACAGCAACAAACGACCGTTCATGTGTCCGTATTGTAACAAGACGTTCAAGACTTACGTGAACTGCCGTAAACACATGAAAATACACAAACACGAGTTGGTGCAACGGCAACTGGAGCAAGAGAAACTGGAATCGCAAGAACAGACTACGAATAAGTTGAATGCCAAGGAGAGCTCTAAACAAGAAACAACGTCCGAGTTATCTTGCTGCTCTCCGTCCAATTTTGCTTCTGGCAATGTTAACGATGTTCCACTCGACGTCTCTGCAAACACCGACACCGGCACCGTTGTCGCAACAACTTCCACGTTTTCCGACAATCAGCTGTCTTCGGTCAACTTATCTTTCCAAGAACGAATGGGATCAACCTTTCCGCATACTTTCCCGCATCAATTTCAAAGTGTGATCGAACCGAAAGAGAAAATAAGACCACTTTTATCGACGAACTTCGCCACCTCTACATCTATTAATCAGAATATGACTGAGATAACCGTGACAAATCTAGAAAATCCTCAGATGTTGCACATCGATGAAAGCGGTTCGGTTACGTTGCCAGTTTATTCGACCGATCAAGCTCTAACACCGGAGAGCATACAAGAAATCGAGGAGACATTGAACCAGCAGATTTTCAACATCGAAATGAACCTTGGCTTGGGAAGCGATCATTCGAAACATTCCTTCGATACCAGCGAATTGCAGAATGCAAAATTGCAGCATCAACAACCTGCGTTAAATGTCATTTACACGAGTAACAACAATTCTAATAACGGTAACAGCACAGAACAGTCTGAAGAGCAAGTGTTCGCGTCGCAGCTGGATTCGTTCGAGATTGATCATATTACTTTGCAACCAGATGCTGAAATGACACTGGACAATATTGGCCTCGAAACGAATAATTCGACGAGTATGGCAAGCATATTGCCGCAAAGCGTGAAAGGAGAGTTATCGAGTCAACTTGCTATTTCAGCTGTTTCGCCTGAGAATTTGACCGACGGTCACCAAGCAAGTGGGTACATGCAAACCGTGTTGTTAATTTCCGAGCAGAATCTTACAGGAAAAGGAAACGCGAGCGATCAATTGAAAATACGCGAGAGTGAAAAGAATGCGGATGGAGTCGTCAACGATCCAACGTTCCTAACGGAACAGTTTCGAAGGACGTCCAAGGTTTCGTCAAAGAGCCAGGAAGTATCTTTGACGTTCGAGTCGCCACTTTGTCGAAACGATGAGATCGATCCAAATCAATCGCAGCAGGGGGAGTCTTTGTTGCAGTGCCATATGTGTAGCCAGCAAGGATTTACGGCAACCAAGTTGAAGGAGCACTTGAAGATCCATCGCGGTAAGAAGGAATATCAGTGTACGGAATGCTCTTCAAGATTTTACACGAACGGTGGATTAAACAGACACTCGAAAATACATACGAATAAACAACACTGGAAGAGTAGTTCGTCGTGCGAAAAATATCTCAGTGATAGAACGCAATCGCGATCGCATAGCAAGGTTCATGAAAGCTTCTCGTGGAACGAGAAGGATGTTTCGATTTTGTCGCAAATACCAGCAACGGTAGATAACGAATCTTCGTTGAACGAAGTTTCAGTAGATTCCGATTCAACCGTGTCCGAAAGGGTTCTGTTGGACACGGTTGCGGAACGAGAGGTGATGGAACGAATACAGCACGTAGCAACGGAGGAAAAGGAACGAAAGGAGTACACGAATAAATGTAAATATTGTCCGaaaacgtttcgtaaaccaagcgatctcgttagacacatccgtacgcacacaggtgaacgtccatacaagtgcgactattgcagcaaaagtttcgctgtaaagtgcacgttggattctcacactaaagttcataccggcaaaaagacgttccgttgtcacgtgtgtagcagtttgttcgcgacgaagggcagcttgaaagtgcatatgcgtttgcatacagGTTCGAAACCGTTTAAATGTTCCATCTGCGATTCGAGATTCCGAACCTCGGGGCATAGGAAAGTGCACTTGTTGAAACACGCCCGAGAACAGAAAGGTAATTTCAAGAGGAAACAGAAACATTTGAAAGTTGCTGCCATAGCAGAAGTCGCTATGGCGACAGACATTGAAAAGTCTGGCGATGACGGTCGACAAAAGGTGTGCACCTACGAACAGGAACAAGAATCGCAACATCAAGAACAGCATTATGAGCAAACGTCGCAAACAACGGAGGCAGAATACTCGAATTTGCAAGCAATCAATGTCGAAACCACTGCTTCGTGTTTGACCGACCAAATCACATTCGAGTCGGAGGGATCCGTTCCAAACAATAATTCGATACTGTCCGTAAACGATGGTAACCGATTGGTGGCCAACTTACATTTCCTTCTGACGAACGGTCTCGTTACCATACAGACCGCAGAATCGTTATTAACGCAGCCGGCGTCGACTGACAATACGCTGCATCCACAATCGACTGTTGTCGCCGATTCCGTCTGCGCGTCGATGATCAATATTACCCCCGAGATCGGTACCAATCAAAGTATAGCTGCTAAGGAAACGATTCACGCGGAGAACGCATTGAAAGCGCAAATGTCTCCGTATCAATTGCAGTCGAACAACTGTCTTTTAACCAGCGTCGCAGCTCCATCTCGGATGGAACAGTTCGCAAAGGTTTCTACCGTCGAGAAGTGTCTGCCGACACTGGAGAAACCCTCTACCAAGGGAACTCCGTCTAAGAAAgagtgcgacgtttgtgggaaaacgttcacgaagccgtatcaagtcgaacgtcataaacgaattcacacgggcgaacgaccgtacaagtgcgatttgtgtgtaaaatcgttcgctcagaaatccacgctgcagatgcatcaaaagcaccatacaggcgaTCGACCACATCCTTGTCCACGCTGCGAATATTCTTTCACGCAGAAAGGCAATCTTCGCACGCACATGAGCCGGGCTCATCGGATGGATACTGTCGACTCGAAAAAGTCGAAACACAATCAGCAGTCGTTGCAACGCAAGTCTCCCGAGAGAAATTTGACCGAGGTTAAAAGTCTGAACTTAGATGACATGTCGTTCATTGAATTTCTTAAATAA
Protein Sequence: MLTRQAVITESNPVAAVPINIVATEDGRTLLAVTEDKDGLLEVIATPVTLIGHNVTAGSLMDIKNVNGCLILHPSPLQIGLDSSEGLDLELSKQCVRVDSDAPSRIKTKVGLDTISGFLDEESSQREKSNEIVKGKSTAIITRTNSPGRPKKSSAVALKGKEGLRCDICQQEFSKQAPYKKHMDNHAEEKPHRCPKCSASFNVPTNFTLHMATHNSGDPRCPECGKKFTRMASLKSHMLLHEKEENLFCTECEDVFSTKAQLDAHLKLHGEKWTTEEARKCKLCNKQFRQPALYRLHIREHYRLQTKVVKQTKRGAKHKTVYKCTICLKSFQKPSQLMRHIRVHTGEKPFKCTVCGRAFTQKSSLQIHTWQHNGIRPHACELCNARFSQKGNLNAHITRVHNVPEGEPIYRCNYCSCVFKKLGSLNGHMKRMHTGVNEDSATVRISESADTIESDIRATVNNVITQLASLESNTDEVENGKPENFEESGLLANVPTKKDILQQALKNCGLPSRNKSSCDDLSEAKKLDARTNFVTLLDRASDSGTRKYLTIKQRCVGNIRWYACTFCHKEFKKPSDLIRHLRVHTQEKPFKCTHCYRSFALKSTMIAHERTHIGTKRYTCGTCDKTFTCHSSLVIHTRSHGNSDECFSISIGNENDNGTGHDHNNDNDNNTDNGNADIDATVNVAARCSNRQKINANKSMMSPKTESLASQVILSEPLVISDSGNNICVVQIPSKKRVYDAAIDPARPHKCWECEAAFRKISHLKQHQRRHTGERPYRCSKCDRRFTSNSVLKSHLHTHEDSRPYGCSICTAKFSTQSSMKRHLVTHSNKRPFMCPYCNKTFKTYVNCRKHMKIHKHELVQRQLEQEKLESQEQTTNKLNAKESSKQETTSELSCCSPSNFASGNVNDVPLDVSANTDTGTVVATTSTFSDNQLSSVNLSFQERMGSTFPHTFPHQFQSVIEPKEKIRPLLSTNFATSTSINQNMTEITVTNLENPQMLHIDESGSVTLPVYSTDQALTPESIQEIEETLNQQIFNIEMNLGLGSDHSKHSFDTSELQNAKLQHQQPALNVIYTSNNNSNNGNSTEQSEEQVFASQLDSFEIDHITLQPDAEMTLDNIGLETNNSTSMASILPQSVKGELSSQLAISAVSPENLTDGHQASGYMQTVLLISEQNLTGKGNASDQLKIRESEKNADGVVNDPTFLTEQFRRTSKVSSKSQEVSLTFESPLCRNDEIDPNQSQQGESLLQCHMCSQQGFTATKLKEHLKIHRGKKEYQCTECSSRFYTNGGLNRHSKIHTNKQHWKSSSSCEKYLSDRTQSRSHSKVHESFSWNEKDVSILSQIPATVDNESSLNEVSVDSDSTVSERVLLDTVAEREVMERIQHVATEEKERKEYTNKCKYCPKTFRKPSDLVRHIRTHTGERPYKCDYCSKSFAVKCTLDSHTKVHTGKKTFRCHVCSSLFATKGSLKVHMRLHTGSKPFKCSICDSRFRTSGHRKVHLLKHAREQKGNFKRKQKHLKVAAIAEVAMATDIEKSGDDGRQKVCTYEQEQESQHQEQHYEQTSQTTEAEYSNLQAINVETTASCLTDQITFESEGSVPNNNSILSVNDGNRLVANLHFLLTNGLVTIQTAESLLTQPASTDNTLHPQSTVVADSVCASMINITPEIGTNQSIAAKETIHAENALKAQMSPYQLQSNNCLLTSVAAPSRMEQFAKVSTVEKCLPTLEKPSTKGTPSKKECDVCGKTFTKPYQVERHKRIHTGERPYKCDLCVKSFAQKSTLQMHQKHHTGDRPHPCPRCEYSFTQKGNLRTHMSRAHRMDTVDSKKSKHNQQSLQRKSPERNLTEVKSLNLDDMSFIEFLK

Similar Transcription Factors

Sequence clustering based on sequence similarity using MMseqs2

100% Identity: iTF_00763369;
90% Identity: iTF_00862032;
80% Identity: -