Basic Information

Insect: Osmia lignaria
Gene Symbol: ZNF236_1
Assembly: GCA_012274295.1
Location: NW:186753-194714[+]

Transcription Factor Domain

TF Family: zf-C2H2
Domain: zf-C2H2 domain
PFAM: PF00096
TF Group: Zinc-Coordinating Group
Description: The C2H2 zinc finger is the classical zinc finger domain. The two conserved cysteines and histidines co-ordinate a zinc ion. The following pattern describes the zinc finger. #-X-C-X(1-5)-C-X3-#-X5-#-X2-H-X(3-6)-[H/C] Where X can be any amino acid, and numbers in brackets indicate the number of residues. The positions marked # are those that are important for the stable fold of the zinc finger. The final position can be either his or cys. The C2H2 zinc finger is composed of two short beta strands followed by an alpha helix. The amino terminal part of the helix binds the major groove in DNA binding zinc fingers. The accepted consensus binding sequence for Sp1 is usually defined by the asymmetric hexanucleotide core GGGCGG but this sequence does not include, among others, the GAG (=CTC) repeat that constitutes a high-affinity site for Sp1 binding to the wt1 promoter [1].
Hmmscan Out: # of c-Evalue i-Evalue score bias hmm coord from hmm coord to ali coord from ali coord to env coord from env coord to acc

1 26 0.001 0.071 12.8 2.6 2 23 175 196 174 196 0.96

2 26 7e-05 0.0049 16.5 1.1 1 23 202 224 202 224 0.98

3 26 9.5e-07 6.6e-05 22.3 0.7 2 23 230 251 230 251 0.97

4 26 0.005 0.35 10.6 0.2 3 23 259 279 257 279 0.96

5 26 4.5e-05 0.0031 17.1 0.9 2 23 290 311 290 311 0.98

6 26 5e-07 3.5e-05 23.2 1.1 1 23 332 354 332 354 0.99

7 26 3.7e-05 0.0026 17.3 1.0 1 20 360 379 360 382 0.95

8 26 1.3e-05 0.00092 18.7 0.5 1 23 388 411 388 411 0.95

9 26 0.0052 0.36 10.6 2.3 3 23 422 443 420 443 0.97

10 26 2.4e-06 0.00017 21.0 3.0 1 23 572 594 572 594 0.98

11 26 0.0008 0.056 13.1 2.9 1 23 600 622 600 622 0.99

12 26 0.12 8.2 6.3 2.0 1 23 628 650 628 650 0.96

13 26 0.007 0.49 10.2 7.1 1 23 745 767 745 767 0.98

14 26 2.1e-05 0.0015 18.1 4.0 1 23 773 795 773 795 0.98

15 26 1.1e-05 0.00079 18.9 0.3 3 23 803 823 801 823 0.97

16 26 0.00027 0.019 14.6 7.6 1 23 829 851 829 851 0.98

17 26 0.1 7.3 6.5 1.0 2 23 1236 1257 1235 1257 0.96

18 26 0.00061 0.043 13.5 2.9 1 23 1263 1285 1263 1285 0.98

19 26 0.001 0.07 12.8 2.2 2 23 1292 1313 1291 1313 0.96

20 26 7.4e-07 5.1e-05 22.7 1.4 2 23 1387 1408 1386 1408 0.98

21 26 0.0025 0.17 11.6 3.7 1 23 1414 1436 1414 1436 0.98

22 26 6.8e-06 0.00048 19.6 2.1 1 23 1442 1464 1442 1464 0.98

23 26 0.00034 0.024 14.3 2.6 1 23 1470 1492 1470 1492 0.98

24 26 1.8e-06 0.00013 21.4 0.6 2 23 1721 1742 1720 1742 0.97

25 26 8.9e-06 0.00062 19.3 4.5 1 23 1748 1770 1748 1770 0.98

26 26 2.3e-07 1.6e-05 24.3 0.6 1 23 1776 1799 1776 1799 0.97

#	of	c-Evalue	i-Evalue	score	bias	hmm coord from	hmm coord to	ali coord from	ali coord to	env coord from	env coord to	acc
1	26	0.001	0.071	12.8	2.6	2	23	175	196	174	196	0.96
2	26	7e-05	0.0049	16.5	1.1	1	23	202	224	202	224	0.98
3	26	9.5e-07	6.6e-05	22.3	0.7	2	23	230	251	230	251	0.97
4	26	0.005	0.35	10.6	0.2	3	23	259	279	257	279	0.96
5	26	4.5e-05	0.0031	17.1	0.9	2	23	290	311	290	311	0.98
6	26	5e-07	3.5e-05	23.2	1.1	1	23	332	354	332	354	0.99
7	26	3.7e-05	0.0026	17.3	1.0	1	20	360	379	360	382	0.95
8	26	1.3e-05	0.00092	18.7	0.5	1	23	388	411	388	411	0.95
9	26	0.0052	0.36	10.6	2.3	3	23	422	443	420	443	0.97
10	26	2.4e-06	0.00017	21.0	3.0	1	23	572	594	572	594	0.98
11	26	0.0008	0.056	13.1	2.9	1	23	600	622	600	622	0.99
12	26	0.12	8.2	6.3	2.0	1	23	628	650	628	650	0.96
13	26	0.007	0.49	10.2	7.1	1	23	745	767	745	767	0.98
14	26	2.1e-05	0.0015	18.1	4.0	1	23	773	795	773	795	0.98
15	26	1.1e-05	0.00079	18.9	0.3	3	23	803	823	801	823	0.97
16	26	0.00027	0.019	14.6	7.6	1	23	829	851	829	851	0.98
17	26	0.1	7.3	6.5	1.0	2	23	1236	1257	1235	1257	0.96
18	26	0.00061	0.043	13.5	2.9	1	23	1263	1285	1263	1285	0.98
19	26	0.001	0.07	12.8	2.2	2	23	1292	1313	1291	1313	0.96
20	26	7.4e-07	5.1e-05	22.7	1.4	2	23	1387	1408	1386	1408	0.98
21	26	0.0025	0.17	11.6	3.7	1	23	1414	1436	1414	1436	0.98
22	26	6.8e-06	0.00048	19.6	2.1	1	23	1442	1464	1442	1464	0.98
23	26	0.00034	0.024	14.3	2.6	1	23	1470	1492	1470	1492	0.98
24	26	1.8e-06	0.00013	21.4	0.6	2	23	1721	1742	1720	1742	0.97
25	26	8.9e-06	0.00062	19.3	4.5	1	23	1748	1770	1748	1770	0.98
26	26	2.3e-07	1.6e-05	24.3	0.6	1	23	1776	1799	1776	1799	0.97

Sequence Information

Coding Sequence: ATGTTGACGCGGCATAATATAATCACAGAATCACCTCACGTTGAGGCTATACCGATTAATCTTGTTACCACCGAGGATGGTCGAACGCTTTTGGCAGTGACAGAACATAAAGATGGTATGATGGAAATCGTTGCAACTCCAGTTACGCTCATCGGTCAAAACGGTTCACCAACTTCCTTGGTTGATGTAAAAAACTTTAATGAAAACTTTATACTGCACTCTCCTATTTTTCAACTGAACATAGAAGATATCGTAGATGGGACAGATCTACAACAGCCTACAGAAAATGTTGAATCTGGTACTGCTACTGACGACAGATTAAAGTCACAAATGTCCATGGAAGCAAAGTGCAAGACAGAAACTAGTTGGGAATACCGATCTCCTTTGCAAAATGATTTAACAACAATTAACAAACAGGATGAAAGCTCTGTGCAAAAGTCAGTAAACGATGGTGTCAAAAGAAATAGCCCTGGAAGACCTAAGAAAACTGCAACAGTTTCCTTACAAGGTACAGAATGTTTAAGATGCGACATATGCCATCAAGAATTTGTCAAACGGACTTTATATCGGAAACACATGGAAAATCATGCGGAAGAGAAACCGCATCGGTGTCCAAAATGCTCTGCATCGTTCAATGTACCGACCAATTTTACTCTTCATATGGCGACTCATAATACGGGCGAACCAAAGTGCCCAGAATGTGGgaaaaaatttacaagaatGGCTAGTTTAAAGTCTCATATGTTGCTAcacgaaaaagaagaaaatttgttcTGTACAGAATGCGAAGACGCTTTTTCAACTAAAGCTCAATTGGATGCACATTTGAAACTTCACGGAGAAAAGTGGGCGACGGAAGAGGCGCGAAAGTGTAAGCTATGCAATAAACAATTTAGTCAACCGGCTTTGTACAGGCTTCATATTCGTGAACATTACAGGTTGCAGACTAAAGTGACAAAACagacgaaaaaaggaacgaaacaTAAAACTGTATATAAATGTACGATATGCTTAAAGTCTTTCCAGAAACCGAGTCAATTAATGCGCCATATCAGAGTGCATACCGGTGAAAAACCTTTCAAATGTACCGTGTGCAGTCGTGCATTTACACAAAAAAGTTCGCTGCAGATTCATACGTGGCAGCACAATGGTATTCGGCCTCATGCTTGCGAACTTTGTAACGCGAAATTCAGTCAGAAAGGTAATTTGAACGCTCATATAATGAGAGTTCACAATGTGCCAGAGGGAGAGCCAATATATGGATGTAACTATTGTTCgtgcatatttaaaaagctTGGAAGTTTGAACGGCCATATGAAACGCATGCATGCCGATATAGACGAGGAAGGAACcactgctgctgctgctagTGATGCTCATCCGGCCGATATCATGGAATCCGATATACGTGCGACCGTGGACAGTGTTATAACACAGTTGGCGTCATTGGAAGCGAACacagaagaaattgaaaaatcgtcAAATAGCAAAGCGAATTTATCGTCGGAAGGAACTATGAAAAAGGATATATTACAAGAAGCACTGAAAAATAGTGGTCTCCctagtaaaaataaaaccctGAACGAAGGTACGACGGAAACGAAAAAGCTTGGGGCGCGTACTAATTTTGTAACGTTATTGGATCGAGCGCCCGACGGTGGCACTAGaaaatatttaaccatAAAACAGCGATGCGTAGGGAACATAAGGTGGTACGCGTGTACCTTTTGTCATAAGGAGTTTAAAAAGTCGTCAGATTTGATACGTCATCTTCGTGTACACACGCAGGAGAAACCTTTCAAGTGCATGCATTGTTATCGTTCGTTCGCTTTGAAGTCTACCATGATAGCACACGAACGAACTCATTCTGGTACGAAAAGATATGCTTGCGATTCTTGTGATAAAACATTTGCGTGTCATGGAAGTTTAGTTGGCCATACCAGATTGCATGGAAAATCTAAAAACAAttgtaataaaacaattgtCGACGATGATAAGAACAGCGGTGTGCACACCAGAGAAAGTATCAGCGGTGTCTGTCAGTCTGTCAATCAGTCGAAAGTTCAAGCTAAGAATAAGTCAAAGTTATCACCCGAAGCGGAGAGCCTAGCACAGCAAGTAGTGTTACAAGAACCCTTGGTAATCAGTGATACGGGGAATAAAATTTGCGTCGCGCAAGTAGCATCAAAGGAAAAACGTGCTTACGATGCGTCTACCGATCCAGCTAGACCGCACAAATGTTTGGTCTGCCAAGCGGCATTCAGAAAAATCAGTCACTTGAAGCAACATCATCGTCGGCACACCGGTGAACGCCCTTACGAATGCACCAAATGCGACAGGAGATTCACATCGAACAGCGTGTTAAAATCACATTTACACACGCACGAAGATTGGAGACCGTACGGTTGTCCCATATGCGATGCGAAATTTTCTACGCAAAGTAGCATGAAAAGGCATTTAGTTACTCACAGTAACAAAAGACCATTCATGTGTCCGTACTGTCACAAGACTTTCAAGACTTACGTGAATTGTCGGAAGCATATGAAAATCCATAAACACGAATTGGCACAACGGCAATTGGAGCAACAGAAACTTCAAATGCAGGAACAATCGACGGAGCAGATTTTCCGTGAAGATTCCAAAGAAATGAGAACTCTCGAATCGAGCTGTTCGCCCTCTGTTTCGAACGCTACCAGTACAAATGTCGTCACGACCGTCGCTGCCACTTCTGCGATTATTACAACGGCCGTTTCTACGTTTTCCGACAATCTTACGTCGTTTTCTCGTCTTGGCGCGGTTGAAATATCGTTTCAGCCACAACTCGGTACCGATTTTTCACAAACTTTCCCGGAGCAGGAGAAGACGAGACCAGTTTTATCAGGAAATTGCGACGCTTCGACGTTTATTAATCacAACATATCGGAAACGGTAATGGCGAATCTTGAAAATACACAAATGTTACACGCTGATGAAACTGGTTCGGTTACATTGCCCCCCGTTTATTCCGGTGATCAAGCACTTACACCGgAGAGTATacgagaaatagaagaaacatTGAACCAGCAGTTTTTTAACATCGGAATGAACATTAATCTTGAAAATAGTCATTCGAGACATTCAAACAACGCGAATGCGAATGATTTTGATGGTGCAAAAGGCATAGAGGAAGAGCAACGAACGGTGCTGAACGTTATGTACGAAAACACTGACAATGATAATACCagtaacaataacaataatgataaaaaagaggaaggggATGACAGCAACGTAGAACCATCCGAGGAGCATGTATTTTCATCGCAATTGGATTCATTCGAGATGGATCATATTGCATTGCAATCGGACACTGAAATTGATATCGGATTGGTTGCAAGCGATTCGACGAGTATGGTAAGTATACTCCCTAGAACTGCGAAAGAACATCGGCTGTCTGAGGATGCCCAGGACAGAGAAGAATCGGGAAAAACTAGTATTCAAACGGTAGTGTTCATTTCGCAAGAAAATCTTTCGAGAAAGGAAGATGCAACGACGGAATTGGAAGGAGTGAACGAAGACGCTATACGAAAACAATGTGTAATGAGTCCGATGCTATTGACAGAAGAGTTCGGAGGATCGGTACAACAAGAATCGATAAAGAATCAATCAGAAGTGAACGCGATGTCCTCCTGTACGAATAAAATATCACACGGTGAATCTTTGTTACAATGCCATATGTGTAGTCAACAAGGATTTACGGCAATCGGATTAAAGGAACATTTAAAGACTCATCGTGGAACAAAGGAATATCAATGTACAGAGTGCTCTTCAAGATTTTGCACAAACGGTGGACTGAACAGACATTCGAAGATACATGTTGTTAAGCAGTCATGGAAGTGTTCGTCTTGTGAGAAATATTTCAGTAGCAGAACGCAGTTGCGATCGCATAgcaaaattcatgaaatctCGATTTGGAACGCAATGTCTACGGAGACTTCGGTTTCGTCAGATTTACAACCAGTTACGAATAACAGCGACCCGTGTTTAAACGATATCGCGATAGATCCAGACTCAGCTGTCTCTGAAAAGGTTCTGTTGGACACAATGGCGGAAAAGGCAGTGATGGATCAAATAGAAACTGTTTCAGGGGAGAAAAGGGAACGAAAAGAATACACGAATAAGTGTAAGTCTTGTCCGAAAACTTTTCGCAAGCCGAGTGATCTTATAAGGCACGTGCGTACACATACAGGAGAACGACCTTACAAGTGCGATTTCTGTAGCAAAAGCTTTGCCGTGAAATGTACTTTGGATTCGCATACGAAAGTTCATACCGGTAAGAAGACGTTCCGATGCCATGTTTGTAACAGTATGTTTGCGACCAAGGGCAGTCTAAAGGTTCACATGCGGTTACATACAGGTTCGAAGCCATTCAAATGTCCTGTATGCGACTCGAGATTTCGGACTTCGGGCCACAGAAAAGTACATTTATTGAAACACGCGCGGGAACATAAGGAGAGTCCAAAGAGGAAACAGAAACATCTAAAAGTTGCTGCCATAGCAGAAGTAGCGGCTGATTTAGAAAATCTTGGTAGAAATATAGAGAAAACGAGTAACTTCGAACTGAatcaacagcagcaacaattGCCGCAGACAAAGGATTATCCTCGCTTGGATACAATTAGCGTCGAGGCAGCTGCAACCTGTTTAACTGATCAAATCAACTTTGATACCGATACCGATGCGGCTATCGTATCGAACAATAATCCAACAATGGCAGCGAGCGAAGGAAATCAGCAGTTAGTTACTAatctacattttcttttaacgaaCGGACTGGTGACTATTCAAACCGAGGAATCGTTATTGTCGCAATCGACGTCGGTTAATAACGTGTCCTACAATCGTTCGACTATGACGTCCGATTCCGTGTGTATACCGACCCTCTGTATTTCATCCGGTACCAGCAACAACGATCATGCCAAGGAAGATATTCATACAGCACAATtaccgtcgtcgtcgtcgtcgtcgtcgtcgtcgtcgcatCAACAGAAATCTAACAACTGTCTGTTAACGGTTGCAACTTCGACGATGCAAATGGAGCAACCATTGTCAAAAGTGTTTGCCGataaaactttaccgacaACAACTAAAACGTTAACCAAAGGAAACTCGGCCAGAAAAGAGTGTGACATTTGTGGAAAGACATTTACGAAGCCTTATCAGGTTGAAAGGCATAAGAGGATTCATACGGGTGATCGACCGTACAAGTGCGATTTGTGTACAAAATCATTCGCTCAAAAATCTACTCTACAAATGCATCAGAAACATCACACGGGGGATCGTCCGTACGCCTGTCCGTACTGCGAATATTCTTTCACACAGAAAGGCAACTTGCGAACACACGTGAGACGGGTACATCAGTTGGATACGATCAATGCGAAGAAATTGAAGCGCGGGCgtcaatattttctacctaAATCAATTCAAGACAGCGTACTTGAAACAAAGACTTTGAATTTAGATGACATACCATTCGTTGAATTCCTTAAATAG
Protein Sequence: MLTRHNIITESPHVEAIPINLVTTEDGRTLLAVTEHKDGMMEIVATPVTLIGQNGSPTSLVDVKNFNENFILHSPIFQLNIEDIVDGTDLQQPTENVESGTATDDRLKSQMSMEAKCKTETSWEYRSPLQNDLTTINKQDESSVQKSVNDGVKRNSPGRPKKTATVSLQGTECLRCDICHQEFVKRTLYRKHMENHAEEKPHRCPKCSASFNVPTNFTLHMATHNTGEPKCPECGKKFTRMASLKSHMLLHEKEENLFCTECEDAFSTKAQLDAHLKLHGEKWATEEARKCKLCNKQFSQPALYRLHIREHYRLQTKVTKQTKKGTKHKTVYKCTICLKSFQKPSQLMRHIRVHTGEKPFKCTVCSRAFTQKSSLQIHTWQHNGIRPHACELCNAKFSQKGNLNAHIMRVHNVPEGEPIYGCNYCSCIFKKLGSLNGHMKRMHADIDEEGTTAAAASDAHPADIMESDIRATVDSVITQLASLEANTEEIEKSSNSKANLSSEGTMKKDILQEALKNSGLPSKNKTLNEGTTETKKLGARTNFVTLLDRAPDGGTRKYLTIKQRCVGNIRWYACTFCHKEFKKSSDLIRHLRVHTQEKPFKCMHCYRSFALKSTMIAHERTHSGTKRYACDSCDKTFACHGSLVGHTRLHGKSKNNCNKTIVDDDKNSGVHTRESISGVCQSVNQSKVQAKNKSKLSPEAESLAQQVVLQEPLVISDTGNKICVAQVASKEKRAYDASTDPARPHKCLVCQAAFRKISHLKQHHRRHTGERPYECTKCDRRFTSNSVLKSHLHTHEDWRPYGCPICDAKFSTQSSMKRHLVTHSNKRPFMCPYCHKTFKTYVNCRKHMKIHKHELAQRQLEQQKLQMQEQSTEQIFREDSKEMRTLESSCSPSVSNATSTNVVTTVAATSAIITTAVSTFSDNLTSFSRLGAVEISFQPQLGTDFSQTFPEQEKTRPVLSGNCDASTFINHNISETVMANLENTQMLHADETGSVTLPPVYSGDQALTPESIREIEETLNQQFFNIGMNINLENSHSRHSNNANANDFDGAKGIEEEQRTVLNVMYENTDNDNTSNNNNNDKKEEGDDSNVEPSEEHVFSSQLDSFEMDHIALQSDTEIDIGLVASDSTSMVSILPRTAKEHRLSEDAQDREESGKTSIQTVVFISQENLSRKEDATTELEGVNEDAIRKQCVMSPMLLTEEFGGSVQQESIKNQSEVNAMSSCTNKISHGESLLQCHMCSQQGFTAIGLKEHLKTHRGTKEYQCTECSSRFCTNGGLNRHSKIHVVKQSWKCSSCEKYFSSRTQLRSHSKIHEISIWNAMSTETSVSSDLQPVTNNSDPCLNDIAIDPDSAVSEKVLLDTMAEKAVMDQIETVSGEKRERKEYTNKCKSCPKTFRKPSDLIRHVRTHTGERPYKCDFCSKSFAVKCTLDSHTKVHTGKKTFRCHVCNSMFATKGSLKVHMRLHTGSKPFKCPVCDSRFRTSGHRKVHLLKHAREHKESPKRKQKHLKVAAIAEVAADLENLGRNIEKTSNFELNQQQQQLPQTKDYPRLDTISVEAAATCLTDQINFDTDTDAAIVSNNNPTMAASEGNQQLVTNLHFLLTNGLVTIQTEESLLSQSTSVNNVSYNRSTMTSDSVCIPTLCISSGTSNNDHAKEDIHTAQLPSSSSSSSSSSHQQKSNNCLLTVATSTMQMEQPLSKVFADKTLPTTTKTLTKGNSARKECDICGKTFTKPYQVERHKRIHTGDRPYKCDLCTKSFAQKSTLQMHQKHHTGDRPYACPYCEYSFTQKGNLRTHVRRVHQLDTINAKKLKRGRQYFLPKSIQDSVLETKTLNLDDIPFVEFLK

Similar Transcription Factors

Sequence clustering based on sequence similarity using MMseqs2

100% Identity: iTF_01122584;
90% Identity: iTF_01122584;
80% Identity: -