Basic Information

Insect: Fopius arisanus
Gene Symbol: -
Assembly: GCA_000806365.1
Location: NW:1851256-1862019[+]

Transcription Factor Domain

TF Family: zf-C2H2
Domain: zf-C2H2 domain
PFAM: PF00096
TF Group: Zinc-Coordinating Group
Description: The C2H2 zinc finger is the classical zinc finger domain. The two conserved cysteines and histidines co-ordinate a zinc ion. The following pattern describes the zinc finger. #-X-C-X(1-5)-C-X3-#-X5-#-X2-H-X(3-6)-[H/C] Where X can be any amino acid, and numbers in brackets indicate the number of residues. The positions marked # are those that are important for the stable fold of the zinc finger. The final position can be either his or cys. The C2H2 zinc finger is composed of two short beta strands followed by an alpha helix. The amino terminal part of the helix binds the major groove in DNA binding zinc fingers. The accepted consensus binding sequence for Sp1 is usually defined by the asymmetric hexanucleotide core GGGCGG but this sequence does not include, among others, the GAG (=CTC) repeat that constitutes a high-affinity site for Sp1 binding to the wt1 promoter [1].
Hmmscan Out: # of c-Evalue i-Evalue score bias hmm coord from hmm coord to ali coord from ali coord to env coord from env coord to acc

1 31 4.3e-06 0.00029 20.3 1.0 1 23 217 239 217 239 0.98

2 31 0.0019 0.13 12.0 1.9 1 23 262 285 262 285 0.96

3 31 0.00016 0.011 15.4 1.0 2 23 292 314 291 314 0.96

4 31 0.00015 0.01 15.5 0.5 1 21 334 354 334 355 0.95

5 31 0.0093 0.63 9.8 0.1 2 23 443 464 442 464 0.94

6 31 0.059 4 7.3 0.1 1 23 470 493 470 493 0.86

7 31 8.1e-05 0.0055 16.3 0.1 1 23 556 579 556 579 0.96

8 31 0.0072 0.49 10.2 0.4 1 23 585 608 585 608 0.96

9 31 0.1 6.9 6.6 1.9 1 23 621 643 621 643 0.97

10 31 1.1e-05 0.00075 19.0 1.1 3 23 684 705 682 705 0.95

11 31 0.0019 0.13 12.0 1.5 2 23 761 784 760 784 0.94

12 31 2.1 1.4e+02 2.4 0.0 2 23 793 815 793 815 0.84

13 31 0.91 61 3.6 0.2 2 23 822 844 821 844 0.91

14 31 8.9e-06 0.0006 19.3 1.2 1 23 852 874 852 874 0.98

15 31 0.13 8.7 6.3 0.3 3 23 906 928 904 928 0.87

16 31 0.00014 0.0098 15.5 3.3 1 23 931 954 931 954 0.97

17 31 0.0018 0.12 12.1 0.2 2 23 961 983 960 983 0.95

18 31 0.0022 0.15 11.8 5.1 1 21 1009 1029 1009 1030 0.95

19 31 0.0018 0.13 12.1 1.8 2 23 1044 1065 1043 1066 0.93

20 31 0.15 10 6.0 0.9 1 23 1069 1092 1069 1092 0.94

21 31 0.0012 0.08 12.7 2.0 2 23 1099 1120 1098 1120 0.95

22 31 0.66 45 4.0 0.2 2 23 1128 1150 1128 1150 0.95

23 31 2.5 1.7e+02 2.2 0.0 2 23 1157 1179 1156 1179 0.87

24 31 0.15 11 6.0 2.7 2 23 1188 1210 1188 1210 0.96

25 31 0.85 57 3.7 1.0 2 23 1216 1238 1216 1238 0.92

26 31 0.12 7.9 6.4 0.0 1 23 1293 1316 1293 1316 0.96

27 31 0.00037 0.025 14.2 0.8 1 21 1341 1361 1341 1362 0.94

28 31 0.34 23 4.9 1.3 2 23 1460 1482 1459 1482 0.94

29 31 0.25 17 5.3 1.1 2 23 1489 1511 1488 1511 0.94

30 31 0.48 32 4.5 2.5 1 23 1522 1544 1522 1544 0.97

31 31 0.21 14 5.6 0.2 3 20 1553 1570 1553 1572 0.95

#	of	c-Evalue	i-Evalue	score	bias	hmm coord from	hmm coord to	ali coord from	ali coord to	env coord from	env coord to	acc
1	31	4.3e-06	0.00029	20.3	1.0	1	23	217	239	217	239	0.98
2	31	0.0019	0.13	12.0	1.9	1	23	262	285	262	285	0.96
3	31	0.00016	0.011	15.4	1.0	2	23	292	314	291	314	0.96
4	31	0.00015	0.01	15.5	0.5	1	21	334	354	334	355	0.95
5	31	0.0093	0.63	9.8	0.1	2	23	443	464	442	464	0.94
6	31	0.059	4	7.3	0.1	1	23	470	493	470	493	0.86
7	31	8.1e-05	0.0055	16.3	0.1	1	23	556	579	556	579	0.96
8	31	0.0072	0.49	10.2	0.4	1	23	585	608	585	608	0.96
9	31	0.1	6.9	6.6	1.9	1	23	621	643	621	643	0.97
10	31	1.1e-05	0.00075	19.0	1.1	3	23	684	705	682	705	0.95
11	31	0.0019	0.13	12.0	1.5	2	23	761	784	760	784	0.94
12	31	2.1	1.4e+02	2.4	0.0	2	23	793	815	793	815	0.84
13	31	0.91	61	3.6	0.2	2	23	822	844	821	844	0.91
14	31	8.9e-06	0.0006	19.3	1.2	1	23	852	874	852	874	0.98
15	31	0.13	8.7	6.3	0.3	3	23	906	928	904	928	0.87
16	31	0.00014	0.0098	15.5	3.3	1	23	931	954	931	954	0.97
17	31	0.0018	0.12	12.1	0.2	2	23	961	983	960	983	0.95
18	31	0.0022	0.15	11.8	5.1	1	21	1009	1029	1009	1030	0.95
19	31	0.0018	0.13	12.1	1.8	2	23	1044	1065	1043	1066	0.93
20	31	0.15	10	6.0	0.9	1	23	1069	1092	1069	1092	0.94
21	31	0.0012	0.08	12.7	2.0	2	23	1099	1120	1098	1120	0.95
22	31	0.66	45	4.0	0.2	2	23	1128	1150	1128	1150	0.95
23	31	2.5	1.7e+02	2.2	0.0	2	23	1157	1179	1156	1179	0.87
24	31	0.15	11	6.0	2.7	2	23	1188	1210	1188	1210	0.96
25	31	0.85	57	3.7	1.0	2	23	1216	1238	1216	1238	0.92
26	31	0.12	7.9	6.4	0.0	1	23	1293	1316	1293	1316	0.96
27	31	0.00037	0.025	14.2	0.8	1	21	1341	1361	1341	1362	0.94
28	31	0.34	23	4.9	1.3	2	23	1460	1482	1459	1482	0.94
29	31	0.25	17	5.3	1.1	2	23	1489	1511	1488	1511	0.94
30	31	0.48	32	4.5	2.5	1	23	1522	1544	1522	1544	0.97
31	31	0.21	14	5.6	0.2	3	20	1553	1570	1553	1572	0.95

Sequence Information

Coding Sequence: ATGGAGTCGAGGGAACGTTACGAGCAATTGTGCAGGCTGTGTGCCTCCTACGATGCTGTTAAAATGGATATATTCGGACAGGAGGGCAAGAATCGTCAACTAGTCGACAAAATTCAGACGTGTCTACCCTTCAAGATCGCAGAGGATGATAGACTGCCAAAGTGCTTGTGCTACAGATGTATGTACAATCTTGAGAATTTCTACGACTTCAGGACGGCCTGTGTCAATGCTGTTGCTGTTTTGGAGAGATCTCTACCACCGAGTGAATCCAAAAATGGCGATGAACGAGACGTCACGGAGCAGCACTCAGAGTTGCGTTCGGAGTTACTcaaagagaaggaaaaaatgccaattttgATCCCAGAGGCGCCAATAGTAAATCCCAATGCAGCCCTGGGCACACCGCCCCGATTGAACTCAGACGGTGAAGCAGACCCCGAAATTGAAGAAGTGATGAACCAGAGTGGAACAGACGAagGAATGGACGACACAGAGGACAGGAAATCCGATGAATACGAGATGGATATGGAGACAAACCCCAGTGACTTCCTGGAGATGCCCCCTATGGTGACAGATGATGCAGAGGATCCCCAGAATCAGCATGTACCACCAGTCCCCTTTCAACACACCTCTGAGCAGCACGAGGTGTATGTTTGTTCGCTCTGCAACAAGGCATTCAGCTCCAAAGGCCACCTGTCCCTCCATGCGAGAATTCACGTGGGTGCGGGCGACGTAATTGGCGAGAAAGTCATCACCGACGATCACACGTCGTACAAACGTCCATATCAGTGCGATTTGTGCAACAAATCTTACTCAACAGCTAAGCACAGGTGGGGACATGTGTCGACGACTCATCGAGGACATCCAGCAGTCACCTGCAGATACTGCTCTCGAATATACTCGACGAGAACAAATCTCGAGGAGCACATTAAATCGAGACACACTGGCCTCCCACCACCCCCGGAGATGCCAGTGCCGTACGTCCAACAGGACACTAGGTATCAATGCAAAACTTGCCCCAAGATGTACACAAATGTCACGGATCTTAATAAACATAGCAGGGTTTGTCTGGGCGATCGTCAGTCAGAGTCCAGTCGTCTGCCCCAGCCCAAGGGGAGATGTCTCATGGACACATCAGATATGTCCAGTTTGGAATCCGACGAGGAGAGCAAGGATTATCGAAACGCCGAGGCCAAACTATCGAAAAATCCCCAGTTGACGATCCTCAAACAGGCCCTCACCAGGACAGATGACAAACGAGAAGAGCAGATATCTCCCTACAAATCCTTGAAATCAAAGAATGATACTAATCATGAGAAGAAATGGTACTGCGAATTTTGTCCTCTGAATTTTACCTCTACTGATGCACTCAAAGATCACGAGACAGTTCATGACTCTGATAAGCCCTACATATGCATTCTGTGCGAAAAAGATTTTGTTCTGAAGTCTTCTCTCAGTCGTCACATCGTTGCGTCCCATGGAGTTGATCCAGTGCCAATAATCGAGAGTGATCGTTGTCTGAAGAAGAATGTACTTGCTAAATCAAGGGTTGGGGAGTTGAAACATGAGACATCGGCCTCGCCATACTCACCAGAGCCCAGGATAGATAATGATGACGATGATCCCGAGAGTAGAGACGACAATATGATTGAGATTGAGACTGTATTTGTGTGTGAAATATGCACGAGGGATTTTAACGATCGTGCATCACTGTGGCTGCATATTCGAGCTACTCACAAGGAATTTGCAGCGTTTGCCTGTGGtgtttgtttaaaaatatgcTCGGATAATGAGCAGTTGTTGAGCCACGTCAACATGTATCACGGTGGATCGAAGCTGCTGGTATCAGAGCAGAGGAGATACAGTTGTACGATATGTGGACGTCAGCATGACTCGAGaaaaaaacttatgacccaCGTTTCCATCCACAACATCGATTCCACGTACGACCCAGCGAGTTTTGTCCAGCTCAACAGTAACTACTACAACGACAGTTTGAATAACGAGCAGGAAGGTGATTTTGATGCTGAAGACGGTGAGAAGGTCAACTGCTACGTctgcaaaaaatcatttcccaaTGAGGATCACTTGATTCGACACCAGAGAAATGCCCACAAGAGCGATCAGACTGAACCCTCGGCGAACGGTGGAATAAATCCCAATGGGAATAAAGCCCAGTATCATCTCTTCTTCGTCTGCGAGCTCTGTGGCAGCTCTCATCCCTCCAAATGGGAACGATGGCTTCATGTTAATAGTGTTCACAGTGATGAGACTACCATAAGGTGTGAGAGATCAGACTGCGGTAAAATATTTGCCACTAAATCACTGAGGAATGAGCACCAGCAGCACCACATGATGCAGGGCTCATCTCCTAATACCTGTGAAATATGTGGTAAACTTTGGGGTAGCAGAGTCGATTACTGGAAGCACGTGATGGGAGTACATGCCGACACTGTTCCCCTCATCTGTGGAGTATGTCTCAAGGTCTTTCCAGATGTTGGTCAACTGAGTTGCCACGTTAAATCCAATCACTGGCCACTCACCAATGGCGACTTCAGCTGTGATATCTGTGGACGTCCCTATTCCAATAAATCCAAAATGTCGAGACACCGGAAGATACACGGACTAGACAACGAGGGGATCAATAATGGAATCAACGATTCTATGAACGACACTATTAACTCTGAGCACAGCCCCCTCGAGGTCGACCTCAGCTGCGAAATGTGTGCTGAGCTGAGTTTTGCATCTTGGGAGGATTTGTGCAATCATCGTAGGCTCATTCATGCACTCTTCCCCTGTGATTTATGCAATAAGTGTTATGGAAGGACATCTCATCTGTGGAAACATGTCAACAGAGTTCACAAGGGACACAAGGACGTGACCTGTCCGTACTGCATGAAAACAAGTGCTTCCAAGGATCACTTAGCAGCGCATATCGCTAAAATTCATCGTTACGAACCTGAGACTAAGGAGAGCAAGGATTCAGGGAATTATGCGTCACAGAGCGCTGAGGAGGATGTAATTCATCACTGCGAGAAGTGCAACAAGGGCTTCCACAAGAGGTATCTCCTCAGACGTCATATGAAGGGCTGTCAAAATTATCGAAAGGATCCTGGCGCACTTTTGACACGGTGCAGGGCTTGCGAGAGAATATTCAAGGATCGTGCAAGCCTCCAGAAACATATCGAGAATCATCACAGTAGTTATACGTGTCACTTGTGTGATGAAACAATCACATCAAAACTGGGGATCATGACGCACAATAGAATTAATCACATGGATCATCCCGATCTAACTTGTAGCAATTGTAAAAAGCTTTTTAGAACGCGAGAGGACCTAGAGTCACACAAGAAGGACCACAAATATCATAATTCACCAAATGTCTGTGATTTTTGTGGAGATACtgttgagaataaattaaaactcaAGATGCACATTCTATCTCTACacagaaatgaaattggaGTTTCTTGTGGGGTGTGTCTCATTCCCATGAAGGATCCCAAGGATCTCAAGAAACACGTGGAAGATGTTCATGGTAGCATTCTCCGGAAGCCCAATACCTGCCAGGTGTGTGGTAAGCAGTATGCATCCAAGTGGAAGGCGTTCGATCACACGAAAAAGTGTCATGGCAAGGTCTTCAGGACGTGCAAACAGTGTTTGGCAGTGTTCACCACCGATTCTGATATCAAGTATCACTACGAGCATGTGCATAATGTACCCAAGGATCAGTTGTCAGGTTTTGAGAATCACGTGGAGCCAGTTAACAAGTCAAAAGAATCAGTGGCTGTTAAGGAGGAGCCTGAGGACGTTGATGATGAGGATAACTACGACGAGGGGCCCCGTGTGACTGAGAAACGCAAACGAACTGATACCTTTGACTGTGAGATCTGTCCAGAGATATTTCTCAACGATGAAACCCTAGCTGAGCACTATAGAATTGTCCACAACAGTGATCCGGAGAGAATGCTCAAGAAGATGAAGTTCAGCGCCAAGAAGAAGATGAGAGCTCGGGAGAATTTCGAGTGTAATAATTGCACCAAACAGTTCAGTACAAAAACGTTATACTGGAATCACATTGATACGTGCACTAGGAGAAGTTCCAAGGATGATTCGAGACCTGGTTCCACGTCGATCTTGGAGACTCATTTGAAGAATAACAATCAGATTAAGAAAGAGCCACAGGATGCGGAGATGAACGAGTCAGATCTCAATATACCAGACTTCAATCTCTTCGAGGATATTAATCTTCAGTTGTCTGCCCAGAAACCCATTCCAAACTTGATGCCACTGTCTCAGATGAAAATGGCTCAGAACCTCAAGTGTTACAGGAAGGACTCGAGGAAGGTGTACGACGAGTCCACGAATACTGTTTGCGCGTGTGAAGTGTGTGGAAAGCAGTGGCCAGCGAAGAAACACTTGTGGCAGcatttaattcgatttcatCGAGCCGAGGCTGCTGTCACCTGCGGCGTATGCTTAAAACTCTGTACCACTTATAAAGATCTCTCTCAACATCTCAAGGATGCACACGAGGCCATACTATCATGCGAGGGGAATAATTTCACGTGTAAGACGTGTGGGCGGTATCACAATGCCAGGAGTAAACTTTTACTCCACATGAGCAttcatatcaataataatgagcacGTCTGGTGCTCCAAGTGCGCAACGAGTTTTGAAACTCAGGATAAACTCGATCAACACGTTGATCAGTGTCTTGTCAAGAGGAGGGAGGCTGAGTCCGAGGATCACAGCAACGATAATGACGAGGACATGATGAAGCATGAGAATGAAGAGGATAAGGGTAGCTTGATTGGTGATGGGGCGTCACTCATGGAGGAGGTTGAGGAGGACGTTGATTTTGATTCTGAACAGGATGCCAGTGAGAATGGAGAGAACTCGGAGCACTCTGAGGACTCGGAGGGCAGTGATTCGGGTAATGAGGAGGAGAATGAGATCGAGTCGAGGGCCAATAGCAGAGTTACTGGTGATGTTAGTCAGAGTGATGAGGAGGATGGTGATTCAGATGTACCTGGTGGAGTTTCTGAAATGGCTGATGAGGGGGAGATATCCGTTAAAGATGAAGAATCCAGGACTGAAGCACCGAGTGTACCTGAAAGGGATGAACAGGGGGAGGAAAAGCCTCCGGAGTCTTTGAAATCACGGGGTAAAAAGCTGGGAAAATCTGCAGAGGATTCTGATGACGAAGGGCCACCGATACTCAGCCCCATGGTGCCACTGCCCTCTGAGAATGAAGAGGACCCTTCTGGTGATCGTGAGGGGGAGAGCTCGGAGAGGATGAGCAATGAGGGATCGGTGAGAAAGGGCGACGGAGAGGAGGGTgaggagggagaggagggAGATATTCCTGAGTTGGATGGAATTGAGGAGGAAGGGGAGAAGGAGCCGTTGTCTCCTCACTCAAATGATTATGACGATTACTCATCGACAGCGAAATCTGCTAGCGCAGTGGCATCTGCTGAGGAGGATTCCAATGATGAGATGGATGATGATGATAGTAGGCTGCAAATCGATCACGAGGATTCACAGTCCAAGGGTTCTGAGGAGGTGGCCGATGAAGAGGCTGACGGGGTTGAGGAGGGAGGCGAGGTGCAGATTGAGGGACTCGATGGGACTGTCCTCGTGGTTGCCAATGATGCTCAGGGCAATCAAATATTGATTCGACGAAGTATCGAGGAGATGGccgaggaggatgaggaggatgaaTCCATAGGAGATGTCGCTGGGTTTATCTATCAggaggagaatgaaaatgaaaatgaggatGAGGTTGTTGGTGAGGATGAAAATACACATGAGCAGGCGAATGGCGAGGAAGTTGtggatggggatggggatgaCGGGGAAGAGGAAGCAGAAGAGGAAGGGGAAGGCGAAGGCGAAGGCGAAGGCTACAGCAACGAACTTGATAATGAAGTTGAGGACGTGGAAGATATGGAGGTGGAGGAGAGTGATGACACTGATGATAATTCGAGTGCCAAAAACAATGTGTCAAGGACGTAG
Protein Sequence: MESRERYEQLCRLCASYDAVKMDIFGQEGKNRQLVDKIQTCLPFKIAEDDRLPKCLCYRCMYNLENFYDFRTACVNAVAVLERSLPPSESKNGDERDVTEQHSELRSELLKEKEKMPILIPEAPIVNPNAALGTPPRLNSDGEADPEIEEVMNQSGTDEGMDDTEDRKSDEYEMDMETNPSDFLEMPPMVTDDAEDPQNQHVPPVPFQHTSEQHEVYVCSLCNKAFSSKGHLSLHARIHVGAGDVIGEKVITDDHTSYKRPYQCDLCNKSYSTAKHRWGHVSTTHRGHPAVTCRYCSRIYSTRTNLEEHIKSRHTGLPPPPEMPVPYVQQDTRYQCKTCPKMYTNVTDLNKHSRVCLGDRQSESSRLPQPKGRCLMDTSDMSSLESDEESKDYRNAEAKLSKNPQLTILKQALTRTDDKREEQISPYKSLKSKNDTNHEKKWYCEFCPLNFTSTDALKDHETVHDSDKPYICILCEKDFVLKSSLSRHIVASHGVDPVPIIESDRCLKKNVLAKSRVGELKHETSASPYSPEPRIDNDDDDPESRDDNMIEIETVFVCEICTRDFNDRASLWLHIRATHKEFAAFACGVCLKICSDNEQLLSHVNMYHGGSKLLVSEQRRYSCTICGRQHDSRKKLMTHVSIHNIDSTYDPASFVQLNSNYYNDSLNNEQEGDFDAEDGEKVNCYVCKKSFPNEDHLIRHQRNAHKSDQTEPSANGGINPNGNKAQYHLFFVCELCGSSHPSKWERWLHVNSVHSDETTIRCERSDCGKIFATKSLRNEHQQHHMMQGSSPNTCEICGKLWGSRVDYWKHVMGVHADTVPLICGVCLKVFPDVGQLSCHVKSNHWPLTNGDFSCDICGRPYSNKSKMSRHRKIHGLDNEGINNGINDSMNDTINSEHSPLEVDLSCEMCAELSFASWEDLCNHRRLIHALFPCDLCNKCYGRTSHLWKHVNRVHKGHKDVTCPYCMKTSASKDHLAAHIAKIHRYEPETKESKDSGNYASQSAEEDVIHHCEKCNKGFHKRYLLRRHMKGCQNYRKDPGALLTRCRACERIFKDRASLQKHIENHHSSYTCHLCDETITSKLGIMTHNRINHMDHPDLTCSNCKKLFRTREDLESHKKDHKYHNSPNVCDFCGDTVENKLKLKMHILSLHRNEIGVSCGVCLIPMKDPKDLKKHVEDVHGSILRKPNTCQVCGKQYASKWKAFDHTKKCHGKVFRTCKQCLAVFTTDSDIKYHYEHVHNVPKDQLSGFENHVEPVNKSKESVAVKEEPEDVDDEDNYDEGPRVTEKRKRTDTFDCEICPEIFLNDETLAEHYRIVHNSDPERMLKKMKFSAKKKMRARENFECNNCTKQFSTKTLYWNHIDTCTRRSSKDDSRPGSTSILETHLKNNNQIKKEPQDAEMNESDLNIPDFNLFEDINLQLSAQKPIPNLMPLSQMKMAQNLKCYRKDSRKVYDESTNTVCACEVCGKQWPAKKHLWQHLIRFHRAEAAVTCGVCLKLCTTYKDLSQHLKDAHEAILSCEGNNFTCKTCGRYHNARSKLLLHMSIHINNNEHVWCSKCATSFETQDKLDQHVDQCLVKRREAESEDHSNDNDEDMMKHENEEDKGSLIGDGASLMEEVEEDVDFDSEQDASENGENSEHSEDSEGSDSGNEEENEIESRANSRVTGDVSQSDEEDGDSDVPGGVSEMADEGEISVKDEESRTEAPSVPERDEQGEEKPPESLKSRGKKLGKSAEDSDDEGPPILSPMVPLPSENEEDPSGDREGESSERMSNEGSVRKGDGEEGEEGEEGDIPELDGIEEEGEKEPLSPHSNDYDDYSSTAKSASAVASAEEDSNDEMDDDDSRLQIDHEDSQSKGSEEVADEEADGVEEGGEVQIEGLDGTVLVVANDAQGNQILIRRSIEEMAEEDEEDESIGDVAGFIYQEENENENEDEVVGEDENTHEQANGEEVVDGDGDDGEEEAEEEGEGEGEGEGYSNELDNEVEDVEDMEVEESDDTDDNSSAKNNVSRT

Similar Transcription Factors

Sequence clustering based on sequence similarity using MMseqs2

100% Identity: iTF_00438255;
90% Identity: -
80% Identity: -