Basic Information

Insect: Cantharis flavilabris
Gene Symbol: -
Assembly: GCA_949152465.1
Location: OX424437.1:4487819-4492156[+]

Transcription Factor Domain

TF Family: zf-C2H2
Domain: zf-C2H2 domain
PFAM: PF00096
TF Group: Zinc-Coordinating Group
Description: The C2H2 zinc finger is the classical zinc finger domain. The two conserved cysteines and histidines co-ordinate a zinc ion. The following pattern describes the zinc finger. #-X-C-X(1-5)-C-X3-#-X5-#-X2-H-X(3-6)-[H/C] Where X can be any amino acid, and numbers in brackets indicate the number of residues. The positions marked # are those that are important for the stable fold of the zinc finger. The final position can be either his or cys. The C2H2 zinc finger is composed of two short beta strands followed by an alpha helix. The amino terminal part of the helix binds the major groove in DNA binding zinc fingers. The accepted consensus binding sequence for Sp1 is usually defined by the asymmetric hexanucleotide core GGGCGG but this sequence does not include, among others, the GAG (=CTC) repeat that constitutes a high-affinity site for Sp1 binding to the wt1 promoter [1].
Hmmscan Out: # of c-Evalue i-Evalue score bias hmm coord from hmm coord to ali coord from ali coord to env coord from env coord to acc

1 47 0.006 0.39 12.4 2.8 2 23 45 66 44 66 0.97

2 47 6.9e-05 0.0044 18.5 1.3 1 23 72 94 72 94 0.98

3 47 0.00016 0.01 17.3 4.8 1 23 100 122 100 122 0.99

4 47 0.014 0.92 11.2 1.7 1 23 128 150 128 150 0.97

5 47 0.00011 0.0071 17.8 4.0 1 23 156 178 156 178 0.99

6 47 0.00021 0.013 17.0 1.5 1 23 184 206 184 206 0.97

7 47 0.0004 0.026 16.1 2.9 1 23 212 234 212 234 0.98

8 47 0.00098 0.063 14.9 3.8 1 23 240 262 240 262 0.99

9 47 1.7e-06 0.00011 23.5 1.6 1 23 283 305 283 305 0.98

10 47 0.0035 0.22 13.1 0.4 3 23 313 333 311 333 0.98

11 47 3.3e-05 0.0021 19.5 1.4 1 23 339 361 339 361 0.98

12 47 0.0016 0.1 14.2 2.3 3 23 369 389 367 389 0.98

13 47 0.0015 0.096 14.3 1.5 1 23 395 417 395 417 0.98

14 47 0.009 0.58 11.8 1.8 3 23 425 445 423 445 0.97

15 47 0.0023 0.15 13.7 5.3 1 23 462 484 462 484 0.98

16 47 0.0096 0.61 11.7 2.6 1 23 490 512 490 512 0.98

17 47 0.0001 0.0065 17.9 5.4 1 23 518 540 518 540 0.98

18 47 5.8e-05 0.0037 18.7 2.0 1 23 546 568 546 568 0.97

19 47 0.00091 0.058 15.0 1.1 3 23 576 596 574 596 0.98

20 47 0.0011 0.072 14.7 5.4 1 23 602 624 602 624 0.98

21 47 0.00056 0.036 15.6 0.4 1 23 630 652 630 652 0.96

22 47 0.0011 0.069 14.7 4.7 1 23 658 680 658 680 0.98

23 47 0.0042 0.27 12.9 5.9 1 23 686 708 686 708 0.98

24 47 0.001 0.064 14.8 1.6 1 23 714 736 714 736 0.96

25 47 0.00079 0.05 15.2 0.1 1 23 762 784 762 784 0.98

26 47 0.0049 0.31 12.7 4.5 1 23 790 812 790 812 0.98

27 47 0.0014 0.087 14.4 4.5 1 23 818 840 818 840 0.97

28 47 0.00014 0.0087 17.6 1.6 1 23 846 868 846 868 0.98

29 47 1.9e-05 0.0012 20.3 3.2 1 23 874 896 874 896 0.99

30 47 5.1e-06 0.00032 22.1 1.9 1 23 902 924 902 924 0.99

31 47 0.071 4.5 9.0 4.0 3 23 932 952 930 952 0.98

32 47 0.00045 0.029 15.9 2.2 1 23 958 980 958 980 0.98

33 47 5e-07 3.2e-05 25.2 0.7 1 23 986 1008 986 1008 0.99

34 47 0.0049 0.31 12.7 2.6 3 23 1016 1036 1014 1036 0.98

35 47 0.0024 0.15 13.7 0.2 1 23 1042 1064 1042 1064 0.97

36 47 0.00017 0.011 17.2 0.7 1 23 1105 1127 1105 1127 0.97

37 47 0.00028 0.018 16.6 1.6 1 23 1133 1155 1133 1155 0.98

38 47 0.00018 0.011 17.2 2.7 1 23 1161 1183 1161 1183 0.99

39 47 0.00062 0.039 15.5 2.4 1 23 1189 1211 1189 1211 0.98

40 47 0.067 4.3 9.1 4.4 1 20 1217 1236 1217 1239 0.93

41 47 0.0002 0.013 17.0 2.8 1 23 1245 1267 1245 1267 0.98

42 47 0.00085 0.055 15.0 2.4 1 23 1273 1295 1273 1295 0.98

43 47 0.00048 0.031 15.8 1.2 1 23 1301 1323 1301 1323 0.97

44 47 0.00042 0.027 16.0 3.6 1 23 1329 1351 1329 1351 0.98

45 47 0.0049 0.32 12.7 0.9 1 23 1357 1379 1357 1379 0.97

46 47 5.6e-05 0.0036 18.8 1.0 1 23 1385 1407 1385 1407 0.99

47 47 0.0053 0.34 12.5 7.6 1 23 1413 1435 1413 1435 0.98

#	of	c-Evalue	i-Evalue	score	bias	hmm coord from	hmm coord to	ali coord from	ali coord to	env coord from	env coord to	acc
1	47	0.006	0.39	12.4	2.8	2	23	45	66	44	66	0.97
2	47	6.9e-05	0.0044	18.5	1.3	1	23	72	94	72	94	0.98
3	47	0.00016	0.01	17.3	4.8	1	23	100	122	100	122	0.99
4	47	0.014	0.92	11.2	1.7	1	23	128	150	128	150	0.97
5	47	0.00011	0.0071	17.8	4.0	1	23	156	178	156	178	0.99
6	47	0.00021	0.013	17.0	1.5	1	23	184	206	184	206	0.97
7	47	0.0004	0.026	16.1	2.9	1	23	212	234	212	234	0.98
8	47	0.00098	0.063	14.9	3.8	1	23	240	262	240	262	0.99
9	47	1.7e-06	0.00011	23.5	1.6	1	23	283	305	283	305	0.98
10	47	0.0035	0.22	13.1	0.4	3	23	313	333	311	333	0.98
11	47	3.3e-05	0.0021	19.5	1.4	1	23	339	361	339	361	0.98
12	47	0.0016	0.1	14.2	2.3	3	23	369	389	367	389	0.98
13	47	0.0015	0.096	14.3	1.5	1	23	395	417	395	417	0.98
14	47	0.009	0.58	11.8	1.8	3	23	425	445	423	445	0.97
15	47	0.0023	0.15	13.7	5.3	1	23	462	484	462	484	0.98
16	47	0.0096	0.61	11.7	2.6	1	23	490	512	490	512	0.98
17	47	0.0001	0.0065	17.9	5.4	1	23	518	540	518	540	0.98
18	47	5.8e-05	0.0037	18.7	2.0	1	23	546	568	546	568	0.97
19	47	0.00091	0.058	15.0	1.1	3	23	576	596	574	596	0.98
20	47	0.0011	0.072	14.7	5.4	1	23	602	624	602	624	0.98
21	47	0.00056	0.036	15.6	0.4	1	23	630	652	630	652	0.96
22	47	0.0011	0.069	14.7	4.7	1	23	658	680	658	680	0.98
23	47	0.0042	0.27	12.9	5.9	1	23	686	708	686	708	0.98
24	47	0.001	0.064	14.8	1.6	1	23	714	736	714	736	0.96
25	47	0.00079	0.05	15.2	0.1	1	23	762	784	762	784	0.98
26	47	0.0049	0.31	12.7	4.5	1	23	790	812	790	812	0.98
27	47	0.0014	0.087	14.4	4.5	1	23	818	840	818	840	0.97
28	47	0.00014	0.0087	17.6	1.6	1	23	846	868	846	868	0.98
29	47	1.9e-05	0.0012	20.3	3.2	1	23	874	896	874	896	0.99
30	47	5.1e-06	0.00032	22.1	1.9	1	23	902	924	902	924	0.99
31	47	0.071	4.5	9.0	4.0	3	23	932	952	930	952	0.98
32	47	0.00045	0.029	15.9	2.2	1	23	958	980	958	980	0.98
33	47	5e-07	3.2e-05	25.2	0.7	1	23	986	1008	986	1008	0.99
34	47	0.0049	0.31	12.7	2.6	3	23	1016	1036	1014	1036	0.98
35	47	0.0024	0.15	13.7	0.2	1	23	1042	1064	1042	1064	0.97
36	47	0.00017	0.011	17.2	0.7	1	23	1105	1127	1105	1127	0.97
37	47	0.00028	0.018	16.6	1.6	1	23	1133	1155	1133	1155	0.98
38	47	0.00018	0.011	17.2	2.7	1	23	1161	1183	1161	1183	0.99
39	47	0.00062	0.039	15.5	2.4	1	23	1189	1211	1189	1211	0.98
40	47	0.067	4.3	9.1	4.4	1	20	1217	1236	1217	1239	0.93
41	47	0.0002	0.013	17.0	2.8	1	23	1245	1267	1245	1267	0.98
42	47	0.00085	0.055	15.0	2.4	1	23	1273	1295	1273	1295	0.98
43	47	0.00048	0.031	15.8	1.2	1	23	1301	1323	1301	1323	0.97
44	47	0.00042	0.027	16.0	3.6	1	23	1329	1351	1329	1351	0.98
45	47	0.0049	0.32	12.7	0.9	1	23	1357	1379	1357	1379	0.97
46	47	5.6e-05	0.0036	18.8	1.0	1	23	1385	1407	1385	1407	0.99
47	47	0.0053	0.34	12.5	7.6	1	23	1413	1435	1413	1435	0.98

Sequence Information

Coding Sequence: ATGAAGATAGAGGAACAAATGGAAATCAAGTTGGAAGAGCTGAATCACACGTACGATATCAAAGAAGAGAAGTCAACCGCAGTGTATCTACCCGATGGAGAATGCAAATCGGAAGAAAATGACAAAACGCTTTCGTGCGAACTTTGTGATTACAAATGTAAACTTAAACGGAACTTAAAAGTTCATTTATTGACTCATTCTACGGAAAAACCGTATACTTGCGCTGTTTGCGGTTATAAATGTGTACGCAAAGGAGATTTGAAGAGACACTTGGTAACTCATAGTAACGTGAAATCGTTTGAATGTAAGATTTGCGATTATCGGTGTGCTCATCGGGGAAGTTTAAAATCTCATTTGAGAACCCATACAGGCGAGAAGCCGTTTGCTTGCAAATTTTGTGATTACAAATGCACCCTGGGGGGGAATCTTAAAATTCATTTGAGGAttcatacgggggaaaaaccgtatacGTGCGGAATTTGCGATTACAGATGTGCGCACAAGGGAAGCTTAAAATCGCATTTAAGAAcacataccggggaaaaaccgttcgcTTGCGAaatttgcgattacaaatgtaCGGAGAAGGGAAGTTTAAAAAAGCATGTACGGATCCACACAGGCGAGAAGCCGTACATGTGTGAAttatgcgattataaatgtacgGAAAAGGGGAGTTTGAAGTCGCATTTAAGGACTCATACAGGAGAGAAACCGTATACTTGTGAGTTTTGCGATTACAAGAGCGCACATAAGAGGAGTTTGAAAATTCATTTGAGAACTCACTCGGTCGATCAAGAGTTTATCGAGAATATAGTTTACGGTCCACTATCGAACACGAAAGTGTTTCCGTGTGATATCTGCGGCTACACATGCAGCAGTAGAGGAAATTTAAGAAGCCATTTGAGAACTCATacaggcgagaaaccgtttggaTGCGATATTTGTGACTTCAAGACTACACTGGCCGGAAATCTTAAAATGCATTTAAGAACgcatacgggggaaaaaccgtacaTGTGCCcaatttgtgactataaatctGCGCATAAGGGAAGTTTGAAATCTCATTTACGAACTCacacgggggaaaaaccgtttggaTGCCATATCTGTGATTATAAGACTGCACATCGGGTGAGTTTGAAAGCTCACTTGAGAGTACATTCCGGCGAAAAGCCGTATGTATGCGAAATATGCGACTATAGATGTATAGAAAAGGGAAGTTTAAAATCTCATTTGTTTACCCATACTGGTGAGAAGCCCTTCGGATGTGCAATGTGCGACTACAAATGCGCTCGAAAGGGAGACTTAAAAGTCCACTTCAAAACTCATCGGAGTGCAAAACCAGTAATTTTGGAATTCAATCCGGACGTTAAGCAGTTTGAATGTAAactttgcgattataaatgcgCGCACAAGACCGGCTTACGAAATCACTTAAGAagtcataccggggaaaaaccgtatgcTTGTCATTTATGCGACTACAGGTGCACGCTTATTGGAAATTTACGAATCCACACGAGAgttcataccggggaaaaaccgttttccTGCGAAATTTGCGATTACCGATGCTCGCACAAAGGAAGTTTGAGAACCCACTTAAGAAcgcataccggggaaaaaccgtttgctTGTAATATCTGCGATTACAAATGCACCGAGAAGGGAAGTTTGAAGAAACATATCAGAAttcacaccggggaaaaaccgtacgGTTGCGAAATTTGCAACTATAAATGTACTGAAAAGGGAAGTTTAAAAGCGCATTTAAGAATacacaccggggaaaaaccgtatatGTGTGAATTTTGTGATTACAAATGTGCACACAAGGGAAGTTTGAAGTCTCATTTGAGAACTCACACCGGCGAGAGACCGTTCTCTTGTGAAATTTGCGATTACAAGTGTGCACGTAAGGCAGATTTGAAAATCCATGCGATTAttcacaccggggaaaaaccgtatatGTGCGCACATTGCGATTATAAGTGTGCGTATAAGGCCAGCTTGAAATCACACTTACGGACCCATACAGGTGAGAAGCCCTTCTCCTGTCacttttgcgattataaatgttccgaGAAGGGAGGTTTAAAGTCACATTTGCGGAcccatacgggcgagaaaccttACCTTTGCGAATTTTGTGACTACAAATGTGCACGTAAAGGCGACTTGAAGGTTCATTTAAAAGTGCATCTTGGCGACAGTCCGCTCAAGTTGGAAGATATTCCGAATGACTGTGAAGAGTTAGGGGAATCACCGGAAAAACAGTTTTCATGCgatatttgcgattataaaacgGCACAGCGAGCGAGTTTGGTGAGTCACGTAAGAATCCATacaggggaaaaaccgttttccTGTGAATTCTGCGACTACAAATGTGCGCATAGGGGAAGTTTAAAGACCCACGTGAGGATccatacgggggaaaaaccgttcgcCTGCAGTCTTTGCGACTACAAATGCTCTCATAGGGGCAGTCTCAAAACTCACTTGAGGGTACATACAGGGGAAAAACCGTACGCCTGCGAAATTTGTGATTACAAATGTACAGAACGGGGAAGTTTAAAGAAACATTTAAGAATacacaccggggaaaaaccgtttcaATGTGAAATATGCGATTACAAATGCACAGAGAAGGGAAGCCTGAAGTCGCATATGCGGACccacaccggggaaaaaccctATACCTGCGGAATTTGTGATTACAAGTTCACCCAGAAAggatatttcaaaattcatcTGAGGACACACACTGGAGAGAAGCCGTTCGGATGTCATCTGTGCGACTATAAAAGTGCACACAAAGGCAGCTTGAAATCCCATTTCAGAATTCACACCGGTGAGaagccgtttacgtgtgaagtttgcgattataaatgtgcccGCAAGGGGGATTTGAAGATTCACTCTAAAACTCACACTGGCGAGAAGCCGTATACGTGCGACATATGCGGTTATAAATTTGCTCAAAAAGGATATTTGAAAATTCACTTAAGGACTCATACAGGTGAGAAGCCGTTCGGCTGCTATATGTGCGACTATAAATGCGCATATAAGGGGAGTTTGAGAACACACCTAAGAAcgcataccggggaaaaaccgtatgcTTGTGATATTTGCGACTATAAGAGTACATTTGAGGCCAACTTAAAAAGTCATTTAATCTCTCATCAAAgtgaaaaattgtttaaatctgaagatttccatcattccatcgacattaaagaagaaaatgTATACTTCGAGTATCAATCGGGCACCGAGTCCAAACCACCGACTGTCTGGAAGCCATTCGCATGTGACGTTTGTGATTACAAATGCGCACGTAAAGGAGATTTGAAAGTTCATTTGAAAATTCATAGCGGCGTTAAGCCGTACGCCTGCGAactttgtgactataaatgtgcgTATAGAGGAAGTTTAAAATCTCACATCAGAactcacaccggggaaaaaccgtactCCTGCGAAGtctgcgattataaatgtacgGAAAAGGGAAGTTTAAAATCCCATTTACGAACCCACACAGGCGAGAAGCCGTACACTTGTGGAATTTGCGATTATAAGTGCGCACACAAGGGAAGTCTAAAAACTCACTTAATAATACAttccggggaaaaaccgttttcctgcgatatttgcgattataaatgcgCCCGTAAGGCCGATTTGAAAATCCATTCCAAGTGCCATTCCAGCGAGAAGACCTTCATCTGCGAAATTTGTTATGCGAAGTTTACACATAAGGGTAGCTTAAAATATCActtaagaactcataccggcgagaaaccgtatatGTGTGGAatttgcgactataaatgtgCGCATAAGGGCAGTTTAAAATCTCATGCTAGAATACATACCGGTGAGAAGCCATTTGCCTGCgatatttgcgattataaatgtactGAAAAGGGCAGTTTAAAATCGCATGTAAGAATTCACACTGGGGAGAAGCCGTTTTCGTGTGAAATATGCGGTTACAAGTGCGGCCATAAGGGAagcttaaaaattcatttaaagacTCATACAGGCGAAAAGCCGTTCGCTTGTGATCtgtgtgattataaatgtataCTGAGGGGAAAcctaaaaattcatttattaacccacactggcgagaaaccgtatacCTGTGACGTTTGTGACTACAAGACGGCTCATAAGGGAAGCCTAAAGGCTCACTTGAGAATCCACACTGGTGAGAAGCCCTTCATGTGCGAGCATTGCGACTACAAGTGTGCACATAAAGTAAGCCTAAAAAGCCATTTAAAAACTCACAAGAAGAGAAGAACAAGAAAAACTCGCAAGTGA
Protein Sequence: MKIEEQMEIKLEELNHTYDIKEEKSTAVYLPDGECKSEENDKTLSCELCDYKCKLKRNLKVHLLTHSTEKPYTCAVCGYKCVRKGDLKRHLVTHSNVKSFECKICDYRCAHRGSLKSHLRTHTGEKPFACKFCDYKCTLGGNLKIHLRIHTGEKPYTCGICDYRCAHKGSLKSHLRTHTGEKPFACEICDYKCTEKGSLKKHVRIHTGEKPYMCELCDYKCTEKGSLKSHLRTHTGEKPYTCEFCDYKSAHKRSLKIHLRTHSVDQEFIENIVYGPLSNTKVFPCDICGYTCSSRGNLRSHLRTHTGEKPFGCDICDFKTTLAGNLKMHLRTHTGEKPYMCPICDYKSAHKGSLKSHLRTHTGEKPFGCHICDYKTAHRVSLKAHLRVHSGEKPYVCEICDYRCIEKGSLKSHLFTHTGEKPFGCAMCDYKCARKGDLKVHFKTHRSAKPVILEFNPDVKQFECKLCDYKCAHKTGLRNHLRSHTGEKPYACHLCDYRCTLIGNLRIHTRVHTGEKPFSCEICDYRCSHKGSLRTHLRTHTGEKPFACNICDYKCTEKGSLKKHIRIHTGEKPYGCEICNYKCTEKGSLKAHLRIHTGEKPYMCEFCDYKCAHKGSLKSHLRTHTGERPFSCEICDYKCARKADLKIHAIIHTGEKPYMCAHCDYKCAYKASLKSHLRTHTGEKPFSCHFCDYKCSEKGGLKSHLRTHTGEKPYLCEFCDYKCARKGDLKVHLKVHLGDSPLKLEDIPNDCEELGESPEKQFSCDICDYKTAQRASLVSHVRIHTGEKPFSCEFCDYKCAHRGSLKTHVRIHTGEKPFACSLCDYKCSHRGSLKTHLRVHTGEKPYACEICDYKCTERGSLKKHLRIHTGEKPFQCEICDYKCTEKGSLKSHMRTHTGEKPYTCGICDYKFTQKGYFKIHLRTHTGEKPFGCHLCDYKSAHKGSLKSHFRIHTGEKPFTCEVCDYKCARKGDLKIHSKTHTGEKPYTCDICGYKFAQKGYLKIHLRTHTGEKPFGCYMCDYKCAYKGSLRTHLRTHTGEKPYACDICDYKSTFEANLKSHLISHQSEKLFKSEDFHHSIDIKEENVYFEYQSGTESKPPTVWKPFACDVCDYKCARKGDLKVHLKIHSGVKPYACELCDYKCAYRGSLKSHIRTHTGEKPYSCEVCDYKCTEKGSLKSHLRTHTGEKPYTCGICDYKCAHKGSLKTHLIIHSGEKPFSCDICDYKCARKADLKIHSKCHSSEKTFICEICYAKFTHKGSLKYHLRTHTGEKPYMCGICDYKCAHKGSLKSHARIHTGEKPFACDICDYKCTEKGSLKSHVRIHTGEKPFSCEICGYKCGHKGSLKIHLKTHTGEKPFACDLCDYKCILRGNLKIHLLTHTGEKPYTCDVCDYKTAHKGSLKAHLRIHTGEKPFMCEHCDYKCAHKVSLKSHLKTHKKRRTRKTRK

Similar Transcription Factors

Sequence clustering based on sequence similarity using MMseqs2

100% Identity: -
90% Identity: -
80% Identity: -