Basic Information

Insect: Pycnomerus fuliginosus
Gene Symbol: B0310.2_1
Assembly: GCA_963924575.1
Location: OZ004618.1:15206583-15212393[-]

Transcription Factor Domain

TF Family: zf-C2H2
Domain: zf-C2H2 domain
PFAM: PF00096
TF Group: Zinc-Coordinating Group
Description: The C2H2 zinc finger is the classical zinc finger domain. The two conserved cysteines and histidines co-ordinate a zinc ion. The following pattern describes the zinc finger. #-X-C-X(1-5)-C-X3-#-X5-#-X2-H-X(3-6)-[H/C] Where X can be any amino acid, and numbers in brackets indicate the number of residues. The positions marked # are those that are important for the stable fold of the zinc finger. The final position can be either his or cys. The C2H2 zinc finger is composed of two short beta strands followed by an alpha helix. The amino terminal part of the helix binds the major groove in DNA binding zinc fingers. The accepted consensus binding sequence for Sp1 is usually defined by the asymmetric hexanucleotide core GGGCGG but this sequence does not include, among others, the GAG (=CTC) repeat that constitutes a high-affinity site for Sp1 binding to the wt1 promoter [1].
Hmmscan Out: # of c-Evalue i-Evalue score bias hmm coord from hmm coord to ali coord from ali coord to env coord from env coord to acc

1 42 0.0012 0.07 14.5 2.1 1 23 45 68 45 68 0.97

2 42 0.0014 0.081 14.3 0.6 1 23 73 96 73 96 0.93

3 42 1.9 1.1e+02 4.5 1.0 1 23 131 154 131 154 0.92

4 42 0.09 5.3 8.6 4.4 1 23 159 181 159 181 0.98

5 42 1.6e-06 9.4e-05 23.5 0.5 1 23 219 241 219 241 0.98

6 42 8.5e-05 0.005 18.1 0.3 1 23 247 269 247 269 0.98

7 42 1.1e-07 6.7e-06 27.1 2.0 1 23 275 297 275 297 0.99

8 42 0.00051 0.03 15.7 1.8 1 23 310 332 310 332 0.98

9 42 0.38 22 6.6 1.0 2 23 338 360 337 360 0.95

10 42 0.0034 0.2 13.1 4.5 1 23 366 388 366 388 0.97

11 42 0.0013 0.074 14.4 0.3 1 23 394 417 394 417 0.98

12 42 0.0002 0.012 16.9 4.6 3 23 424 444 422 444 0.96

13 42 0.079 4.6 8.8 0.9 2 23 453 474 452 474 0.97

14 42 0.027 1.6 10.2 0.1 2 23 483 503 482 503 0.96

15 42 0.0002 0.012 17.0 1.1 1 23 509 531 509 531 0.99

16 42 4.6e-06 0.00027 22.1 0.3 1 23 537 559 537 559 0.98

17 42 0.77 45 5.7 0.2 2 14 588 600 587 608 0.77

18 42 8.3e-05 0.0049 18.1 0.8 1 23 659 681 659 681 0.98

19 42 1.4e-05 0.00084 20.5 1.6 2 23 689 710 688 710 0.97

20 42 0.0013 0.074 14.4 2.3 1 23 716 738 716 738 0.97

21 42 3.9e-06 0.00023 22.3 0.3 2 23 746 767 745 767 0.97

22 42 0.00082 0.048 15.0 0.5 1 23 774 796 774 796 0.98

23 42 5.5e-05 0.0032 18.7 3.2 1 23 802 824 802 824 0.98

24 42 0.00091 0.053 14.9 0.1 1 23 830 852 830 852 0.97

25 42 0.00025 0.015 16.6 0.4 1 21 858 878 858 879 0.93

26 42 0.003 0.18 13.2 1.4 1 20 881 900 881 902 0.95

27 42 0.052 3 9.3 2.0 3 23 910 930 908 930 0.97

28 42 0.073 4.2 8.9 0.6 1 20 1019 1038 1019 1040 0.94

29 42 0.084 4.9 8.7 0.4 3 23 1048 1069 1047 1069 0.92

30 42 0.017 1 10.9 1.6 3 23 1075 1095 1074 1095 0.97

31 42 0.013 0.75 11.3 4.5 1 23 1101 1124 1101 1124 0.96

32 42 9.7e-07 5.7e-05 24.2 1.2 1 23 1129 1151 1129 1151 0.98

33 42 0.32 19 6.9 8.9 1 23 1256 1278 1256 1278 0.97

34 42 0.0043 0.25 12.7 1.7 1 23 1284 1306 1284 1306 0.97

35 42 0.00011 0.0062 17.8 5.6 1 23 1311 1333 1311 1333 0.99

36 42 0.01 0.58 11.6 0.7 2 23 1340 1362 1340 1362 0.93

37 42 0.11 6.2 8.4 0.2 3 23 1369 1389 1367 1389 0.95

38 42 0.00095 0.056 14.8 0.6 1 23 1399 1421 1399 1421 0.97

39 42 0.0017 0.1 14.0 0.6 1 23 1427 1449 1427 1449 0.97

40 42 6e-06 0.00035 21.7 0.7 1 23 1455 1477 1455 1477 0.97

41 42 2.1e-06 0.00012 23.2 3.9 1 23 1483 1505 1483 1505 0.97

42 42 0.00026 0.015 16.6 2.7 5 23 1514 1532 1511 1532 0.95

#	of	c-Evalue	i-Evalue	score	bias	hmm coord from	hmm coord to	ali coord from	ali coord to	env coord from	env coord to	acc
1	42	0.0012	0.07	14.5	2.1	1	23	45	68	45	68	0.97
2	42	0.0014	0.081	14.3	0.6	1	23	73	96	73	96	0.93
3	42	1.9	1.1e+02	4.5	1.0	1	23	131	154	131	154	0.92
4	42	0.09	5.3	8.6	4.4	1	23	159	181	159	181	0.98
5	42	1.6e-06	9.4e-05	23.5	0.5	1	23	219	241	219	241	0.98
6	42	8.5e-05	0.005	18.1	0.3	1	23	247	269	247	269	0.98
7	42	1.1e-07	6.7e-06	27.1	2.0	1	23	275	297	275	297	0.99
8	42	0.00051	0.03	15.7	1.8	1	23	310	332	310	332	0.98
9	42	0.38	22	6.6	1.0	2	23	338	360	337	360	0.95
10	42	0.0034	0.2	13.1	4.5	1	23	366	388	366	388	0.97
11	42	0.0013	0.074	14.4	0.3	1	23	394	417	394	417	0.98
12	42	0.0002	0.012	16.9	4.6	3	23	424	444	422	444	0.96
13	42	0.079	4.6	8.8	0.9	2	23	453	474	452	474	0.97
14	42	0.027	1.6	10.2	0.1	2	23	483	503	482	503	0.96
15	42	0.0002	0.012	17.0	1.1	1	23	509	531	509	531	0.99
16	42	4.6e-06	0.00027	22.1	0.3	1	23	537	559	537	559	0.98
17	42	0.77	45	5.7	0.2	2	14	588	600	587	608	0.77
18	42	8.3e-05	0.0049	18.1	0.8	1	23	659	681	659	681	0.98
19	42	1.4e-05	0.00084	20.5	1.6	2	23	689	710	688	710	0.97
20	42	0.0013	0.074	14.4	2.3	1	23	716	738	716	738	0.97
21	42	3.9e-06	0.00023	22.3	0.3	2	23	746	767	745	767	0.97
22	42	0.00082	0.048	15.0	0.5	1	23	774	796	774	796	0.98
23	42	5.5e-05	0.0032	18.7	3.2	1	23	802	824	802	824	0.98
24	42	0.00091	0.053	14.9	0.1	1	23	830	852	830	852	0.97
25	42	0.00025	0.015	16.6	0.4	1	21	858	878	858	879	0.93
26	42	0.003	0.18	13.2	1.4	1	20	881	900	881	902	0.95
27	42	0.052	3	9.3	2.0	3	23	910	930	908	930	0.97
28	42	0.073	4.2	8.9	0.6	1	20	1019	1038	1019	1040	0.94
29	42	0.084	4.9	8.7	0.4	3	23	1048	1069	1047	1069	0.92
30	42	0.017	1	10.9	1.6	3	23	1075	1095	1074	1095	0.97
31	42	0.013	0.75	11.3	4.5	1	23	1101	1124	1101	1124	0.96
32	42	9.7e-07	5.7e-05	24.2	1.2	1	23	1129	1151	1129	1151	0.98
33	42	0.32	19	6.9	8.9	1	23	1256	1278	1256	1278	0.97
34	42	0.0043	0.25	12.7	1.7	1	23	1284	1306	1284	1306	0.97
35	42	0.00011	0.0062	17.8	5.6	1	23	1311	1333	1311	1333	0.99
36	42	0.01	0.58	11.6	0.7	2	23	1340	1362	1340	1362	0.93
37	42	0.11	6.2	8.4	0.2	3	23	1369	1389	1367	1389	0.95
38	42	0.00095	0.056	14.8	0.6	1	23	1399	1421	1399	1421	0.97
39	42	0.0017	0.1	14.0	0.6	1	23	1427	1449	1427	1449	0.97
40	42	6e-06	0.00035	21.7	0.7	1	23	1455	1477	1455	1477	0.97
41	42	2.1e-06	0.00012	23.2	3.9	1	23	1483	1505	1483	1505	0.97
42	42	0.00026	0.015	16.6	2.7	5	23	1514	1532	1511	1532	0.95

Sequence Information

Coding Sequence: ATGTTTCTGGTAGTAAAGGAATTGGCTATGCCGAAGCCGTCACAATTTTTCCGTGCCCCCCATCAAATCTACCATGCTAAAATGTACGGCTATTGCTTGATTTCGTTTTATTTTAGGTCGACCGATTTAATTTATTTCTGCAACGGCTGCAACAAATTCTACGCCAGTCTAAGAAATTACAAAGCCCACAGGAAGGTCTACCATAACGTTCTCAGATATTTCTGCGGCACCTGCGGGAAGGGCTTCACCATCGAATCGCTCTTAAAGAAACACGTCTCGCAGACTCACGAGAAAGAGCATCGATTCATCTGCGAGTTTTGCAATCACGCCTGCTTGACCGTCACCATATTGAGGAATCACGTGATAAGAAGCCACACCAAGGACTTCCCTTACAAATGCGATCTCTGCGAGTTCGGCACGTTCACCACGAAGAAGTTGCAGCAGCATAAAGTCGTGGTTCACGAAGGTAAACGATTTGTCTGCGAGGTCTGCAAGAAGATCTACCGGTGCCCCAAACATTTCAAAATCCACCAGGCCACTCATGATTCGAACTATGTACGGACCGAGATCGTGTGTGAGATTTGTTCGAAGATCATCTACAGTCACACGGGTTATAAGTTTCATATGAATTTGCACAAGGGAACGAGTATGAAGTATGTTTGCGATGTTTGTGGGAAGAGTTTTACTTCTACGAGCAGTTTATCGGCACATAAACGACTTCACTCGGGGGAGAAACCATTCCCTTGTAGGTTTTGTGGCAAGGCTTTTTCGAGAGGGGTGAATTTGAGGCTGCACGAGCGGATCCATACAAAGGAGAAGCCTTATCAGTGCACGCTTTGCCAGAAGAGGTTTAGCCAAAAGTCTTCTTTGAATGTTCACATGAGGGTGCATACGGGGGAAAGGCCTTACAAGTTTTCCGAAGAGGTTTTCCCTTGCCCCGACTGCCCCCGACTCTGTCCCTCAAAGTCGAAACTCCGCACACACAGGAAATCCCACAAAGAAAAGGGCCTCCCCTGCCCTCTCTGCTTCAAACTTTATAAATACCAGCATCAAATTGACGTCCACATTCGCCAGTTCCACGAGAATAGGAGACCATTTGAGTGCACTCTTTGCGAAAAGTCCTTCAAAACCAGACAGAACCTCACGTGCCACACCATAACACACACGCGTCAGTATTTGTTCAAGTGCGAAATCTGTGAAATGGGTTTTACTTTTAAAGCCCAAGTCAGTCAGCACATGGACACGGAGCACCGAGGAGTACGCCATCTCTGCGAATTCTGCAATAAAGAATTCAAGAACTTGTACAGTTTGAAGAAGCACATCAAGAAGCACAAGGAGGGGCACTCCGAGGCTCAAACGTGCGAAATTTGCTCCAAAGTGATTTTGAACAAGAGAAATTTTAAGATTCACATGGAAAAGCATTCCGGAGAGAATGTTAATACTACTGTTTGCGATATTTGTGGCAAGGTTCTAGCTAAGGATGGTTTGAAACTTCACATGATGAGCCACTCGGGGGAGAAGCCGTTTAagtgtgaattttgcaaaaagggCTTTTCCGTTAATAGGCTGCTGATCGAGCATAGGAGGATCCATACCAAGGAAAAGCCTTTCGTGTGCAGTACTTGTGGAAAGGGCTTCACGCAGAAAGGGGCTTTGAATATTCACGTGAGATATCATACTGGAGAGAGGCCGTTCAAGTGTGAGAAgaACTATTACTTCTCCTTTAAAGAAGCTGCATCTAATGGCCCAGGTATTATCATCTCATGTGCAACCTGCAACAAGAGATTTAAAACAGAAAGCATGATACTGCACGCAGCGACCCACGCGAAAGATTTTCATTTTGACTGCGAGTCATGTTCGAGGGACCACACCACGAAATCGGCATTCCAAACAGTCAAAAATTCTGAGCATGAAAATGGACTATACATCCGTGAGAACAAACAAGAAATCTCCACCTCTGAAAGACAGTCAGTCTATGAATGCGAGCTTTGCTCCAAGCTTTTCTCTTCCAAGAAATCTCTCAAGAGCCATATAGAGGTTCACAATGGCGTTCAAGAAAAACTCGTTTGCGAAATTTGTGGAAAATGCTACGAAAAGAACTATCTTCTCAATAACCACCAGAGGAGCCACGATGAGGAACGTCCTTTCGTCTGTGAAACTTGTGGAAAGCGCTTCACCTATTTGAAGCATTTAATTCCACATCGAAACAGTCACGACGAAAGCAACCAGTCTTCGGTCTGTGTTACTTGTGGTAAAGTCTTTTCTTCCAATAGATACCTGGAGGCCCACATCAGGAGACACTTGGGAAATATGCGGAAGTACGAGTGCGAAGTTTGTAGTAAACAATATTCTTCCGTGACTTTCCTGAGGGAGCATATGAACATCCACCTGGGCCTTCGGCCTTACGAATGTGAACACTGTGATAAAAAATTCACTATGAAGAAATATTTGGTGGAGCACACCAGGATTCATACGAAGGAGAAACCTTACATCTGTATGATCTGCGCTAAGGGTTTTGCGTTGAAATATACGCTTACTGTTCATATGCGGGGGCATACTGGCGAGAGGCCTTATGCCTGTGAGTTTTGCCCTCGGAAGTTCCCTTCTAGCAGTAATTTAAGGAGTCACAGATCTTCGAAATATTCCTGCAACATTTGTTCAGAGATATTTTCAAACCGAGACGATTTTCTAAAGCACCATATACACCAATATGGCGAAACTTTCGGTTGTTGCAAATGTGGAAATCGATTCAAAACTATTTCTGCCCTTTACTCTCACTTGGAGTCTCACAAAACCGAGGAAGAGGTAGCTGTTGATAACTTGGAGCTCTTGTACATTCTAGAAGACCAGCAGTGTATCAACGAGGTCGTTATCGAAGAGCAAGTAGTAGAAGAACCTATTTCTGATTTGGTACAACAGGAGCATGGGTATTTCAAGCGAGATAAATCCGAGAAAGAAATTAAACCGCGAGCACCGGTTAAGCGTCGTAATGTAGATTTTTCCACCACTAGTTTTCTCTACCTTGAGCCCACTTCTGATGTCGAGGTTCCGCACTACAAGTGTTTGAAGTGCGAGCAGATTTTCATCAGTAAATTCGGTTTCTCTCGTCACGTGGAGAAGGGGAAGTGTTTCATAAACAGTTGTGATGCTTGCCCCCTCAGCTTTAAGAAAAACAGCGATTTCTATTCCCACTATATTAATGATCACGCTGACAGGGCCATCTGCAATTTTTGCTTCAAAACTTTCATGTACGAGAAGAATGTCAAGGAGCATATGTTGAGGCACTTGGATCAGTTTAGACATAAATGCAACGGCTGCAATAAAGGATTCTACACTGTTCGAGAGTATCGTAATCACTACAAGAATCGACATATGGGAATTCGGCACAAGTGTCCTATTTGCGGCAGGAGCTTTGCTGATGAATACTATTTTAAGCGGCATATAGCCACTCATGAACAGGCAGGtttatACCAAGAGCATCATTATACCACGAATTATATGGACCTCCCAAGCCCTCAAGCCGAAAATTTGCAGCTGCAATGCAAATACTTAATGTCAATGGTTGATCCTAAAGCACAAATGCCAGATAATATTCTAGACTCAGATACTGATCTCATTAATCTTCTAACAGCAGAAGATGACTGTTCAGATATTTTGAGTAACATCGCCACTAATGAACAATTCGAAAGTTTAATCAACAGCAGTACAAACTTCGTGGAAGAGCTTATCAGCGAGATGAAAAGCGAGCCTCAGAAAGTTGACACTTTTAGGTGCTATCACTGCTGtaaagaattcaaatccaagAAACTTCTAAGAAAGCATCTTTTTATCCACACAGGGATTAAAAAGTTCGCCTGTGAGATTTGTTCCAAGGCATTCAAGTATCGCTGCGAAGTAGAAGCTCACAAGAAAAGTCACAATAACCCCACATTCCAATGCGAGATTTGCTCGAAAATGTTTATTCACAAATCACATCTCGACCTCCACAGACGCAAACATTTAAATGAATTCGTTGCTACTTGCAAGCAGTGTAATGAAGGATTCGTTagtaaattttcctacaaaACTCATATAGACCTTGTTCATAAGAAGCTGCAGTTGATTTGCGATGCTTGCGGGGCAAAGCTAAGCACAATGTCGTCACTTAAAGAACATAAGTTGACTCACGATCCGAATTATAAGAAAGAAAGAGCGCATGTTTGCGAAATCTGCGGGAAATCTTACCTGACGGTTAGAAACTTAAGGGGGCATATGAAGATCCACCAGTTAGCCAAGGCTCACGTTTGTGATATCTGCGGCAAGTCGGTCAGTAGCAAAAAGATCCTGGAGACTCACGTCAAGATGCACACTGGTCTTAAAGATTTCTTTTGCAATATTTGTGATAAAGCCTTCGCTTCTAAGGAGTATCTTGAGGTTCACTTTAGGACCCACACTGGGAATAAGCCCTTTTGCTGTGAAGTTTGCGGGAAGAGGTTTACGCAGAAGACGTCTCTTACCGTTCACATGAGGTACCATACTGGCGAGAGGCCGTATAAGTGTGAATGCGGTAAGGAGTTCACCACGAAGAGTCATTTGATGACACATTACAAGGTTCACGATGTTGGAGGGGTCGATATTGATTATATTTCTCGACCGTTGATGTAA
Protein Sequence: MFLVVKELAMPKPSQFFRAPHQIYHAKMYGYCLISFYFRSTDLIYFCNGCNKFYASLRNYKAHRKVYHNVLRYFCGTCGKGFTIESLLKKHVSQTHEKEHRFICEFCNHACLTVTILRNHVIRSHTKDFPYKCDLCEFGTFTTKKLQQHKVVVHEGKRFVCEVCKKIYRCPKHFKIHQATHDSNYVRTEIVCEICSKIIYSHTGYKFHMNLHKGTSMKYVCDVCGKSFTSTSSLSAHKRLHSGEKPFPCRFCGKAFSRGVNLRLHERIHTKEKPYQCTLCQKRFSQKSSLNVHMRVHTGERPYKFSEEVFPCPDCPRLCPSKSKLRTHRKSHKEKGLPCPLCFKLYKYQHQIDVHIRQFHENRRPFECTLCEKSFKTRQNLTCHTITHTRQYLFKCEICEMGFTFKAQVSQHMDTEHRGVRHLCEFCNKEFKNLYSLKKHIKKHKEGHSEAQTCEICSKVILNKRNFKIHMEKHSGENVNTTVCDICGKVLAKDGLKLHMMSHSGEKPFKCEFCKKGFSVNRLLIEHRRIHTKEKPFVCSTCGKGFTQKGALNIHVRYHTGERPFKCEKNYYFSFKEAASNGPGIIISCATCNKRFKTESMILHAATHAKDFHFDCESCSRDHTTKSAFQTVKNSEHENGLYIRENKQEISTSERQSVYECELCSKLFSSKKSLKSHIEVHNGVQEKLVCEICGKCYEKNYLLNNHQRSHDEERPFVCETCGKRFTYLKHLIPHRNSHDESNQSSVCVTCGKVFSSNRYLEAHIRRHLGNMRKYECEVCSKQYSSVTFLREHMNIHLGLRPYECEHCDKKFTMKKYLVEHTRIHTKEKPYICMICAKGFALKYTLTVHMRGHTGERPYACEFCPRKFPSSSNLRSHRSSKYSCNICSEIFSNRDDFLKHHIHQYGETFGCCKCGNRFKTISALYSHLESHKTEEEVAVDNLELLYILEDQQCINEVVIEEQVVEEPISDLVQQEHGYFKRDKSEKEIKPRAPVKRRNVDFSTTSFLYLEPTSDVEVPHYKCLKCEQIFISKFGFSRHVEKGKCFINSCDACPLSFKKNSDFYSHYINDHADRAICNFCFKTFMYEKNVKEHMLRHLDQFRHKCNGCNKGFYTVREYRNHYKNRHMGIRHKCPICGRSFADEYYFKRHIATHEQAGLYQEHHYTTNYMDLPSPQAENLQLQCKYLMSMVDPKAQMPDNILDSDTDLINLLTAEDDCSDILSNIATNEQFESLINSSTNFVEELISEMKSEPQKVDTFRCYHCCKEFKSKKLLRKHLFIHTGIKKFACEICSKAFKYRCEVEAHKKSHNNPTFQCEICSKMFIHKSHLDLHRRKHLNEFVATCKQCNEGFVSKFSYKTHIDLVHKKLQLICDACGAKLSTMSSLKEHKLTHDPNYKKERAHVCEICGKSYLTVRNLRGHMKIHQLAKAHVCDICGKSVSSKKILETHVKMHTGLKDFFCNICDKAFASKEYLEVHFRTHTGNKPFCCEVCGKRFTQKTSLTVHMRYHTGERPYKCECGKEFTTKSHLMTHYKVHDVGGVDIDYISRPLM

Similar Transcription Factors

Sequence clustering based on sequence similarity using MMseqs2

100% Identity: -
90% Identity: -
80% Identity: -