Basic Information

Insect: Tenthredo scrophulariae
Gene Symbol: -
Assembly: GCA_963978835.1
Location: OZ022229.1:23171698-23180405[+]

Transcription Factor Domain

TF Family: zf-C2H2
Domain: zf-C2H2 domain
PFAM: PF00096
TF Group: Zinc-Coordinating Group
Description: The C2H2 zinc finger is the classical zinc finger domain. The two conserved cysteines and histidines co-ordinate a zinc ion. The following pattern describes the zinc finger. #-X-C-X(1-5)-C-X3-#-X5-#-X2-H-X(3-6)-[H/C] Where X can be any amino acid, and numbers in brackets indicate the number of residues. The positions marked # are those that are important for the stable fold of the zinc finger. The final position can be either his or cys. The C2H2 zinc finger is composed of two short beta strands followed by an alpha helix. The amino terminal part of the helix binds the major groove in DNA binding zinc fingers. The accepted consensus binding sequence for Sp1 is usually defined by the asymmetric hexanucleotide core GGGCGG but this sequence does not include, among others, the GAG (=CTC) repeat that constitutes a high-affinity site for Sp1 binding to the wt1 promoter [1].
Hmmscan Out: # of c-Evalue i-Evalue score bias hmm coord from hmm coord to ali coord from ali coord to env coord from env coord to acc

1 18 0.41 51 5.4 1.5 3 21 196 214 194 215 0.90

2 18 2.2e-06 0.00027 22.0 0.5 1 23 222 245 222 245 0.97

3 18 1.3 1.6e+02 3.8 3.6 1 23 257 280 257 280 0.90

4 18 0.19 24 6.4 3.9 2 23 819 841 818 841 0.87

5 18 0.017 2.2 9.7 2.8 2 23 848 869 847 869 0.96

6 18 0.0056 0.7 11.2 0.1 1 19 1025 1043 1025 1044 0.96

7 18 0.0042 0.53 11.6 2.4 1 23 1053 1075 1053 1075 0.96

8 18 0.0008 0.099 13.9 1.4 1 23 1084 1107 1084 1107 0.91

9 18 0.11 14 7.2 9.1 1 23 1189 1211 1189 1211 0.96

10 18 0.14 18 6.8 1.5 1 23 1223 1246 1223 1246 0.88

11 18 0.053 6.7 8.2 0.8 1 23 1367 1389 1367 1389 0.95

12 18 4.3 5.3e+02 2.2 0.7 2 9 1459 1466 1458 1477 0.82

13 18 0.014 1.8 10.0 1.2 2 23 1487 1509 1486 1509 0.95

14 18 0.063 7.8 7.9 0.3 2 23 1993 2014 1992 2014 0.96

15 18 0.0046 0.57 11.5 0.2 2 20 2019 2037 2018 2040 0.94

16 18 7.5 9.4e+02 1.4 1.0 2 23 2095 2117 2094 2117 0.93

17 18 0.00024 0.03 15.5 0.8 1 23 2120 2142 2120 2142 0.98

18 18 0.0075 0.94 10.8 0.3 1 23 2150 2172 2150 2172 0.98

#	of	c-Evalue	i-Evalue	score	bias	hmm coord from	hmm coord to	ali coord from	ali coord to	env coord from	env coord to	acc
1	18	0.41	51	5.4	1.5	3	21	196	214	194	215	0.90
2	18	2.2e-06	0.00027	22.0	0.5	1	23	222	245	222	245	0.97
3	18	1.3	1.6e+02	3.8	3.6	1	23	257	280	257	280	0.90
4	18	0.19	24	6.4	3.9	2	23	819	841	818	841	0.87
5	18	0.017	2.2	9.7	2.8	2	23	848	869	847	869	0.96
6	18	0.0056	0.7	11.2	0.1	1	19	1025	1043	1025	1044	0.96
7	18	0.0042	0.53	11.6	2.4	1	23	1053	1075	1053	1075	0.96
8	18	0.0008	0.099	13.9	1.4	1	23	1084	1107	1084	1107	0.91
9	18	0.11	14	7.2	9.1	1	23	1189	1211	1189	1211	0.96
10	18	0.14	18	6.8	1.5	1	23	1223	1246	1223	1246	0.88
11	18	0.053	6.7	8.2	0.8	1	23	1367	1389	1367	1389	0.95
12	18	4.3	5.3e+02	2.2	0.7	2	9	1459	1466	1458	1477	0.82
13	18	0.014	1.8	10.0	1.2	2	23	1487	1509	1486	1509	0.95
14	18	0.063	7.8	7.9	0.3	2	23	1993	2014	1992	2014	0.96
15	18	0.0046	0.57	11.5	0.2	2	20	2019	2037	2018	2040	0.94
16	18	7.5	9.4e+02	1.4	1.0	2	23	2095	2117	2094	2117	0.93
17	18	0.00024	0.03	15.5	0.8	1	23	2120	2142	2120	2142	0.98
18	18	0.0075	0.94	10.8	0.3	1	23	2150	2172	2150	2172	0.98

Sequence Information

Coding Sequence: ATGGCTCGGTCTATAGTTTACAAGAGATCCTTGGATGTCAAGGTATTGCCCAGCTCCGGAAATTCGAATCACGAATTCCAGtCTATCAAATTGGTGAAAATCAAGAAAGAAGTGAACAATGAATCGTTGGATATGGAAAGTGGACTCCCTCTTGGCGCAACAGTTACTAATTCAAGTGGCCTCCATGATGGTCACAATTCCGAGCTTCGTTCAGTCGATACATCCATACAGTTACACGAAAGTAATGATGCTGCTCATCCAAAGCTTGTGATAAGATTCCGTGATCTTTGGAAAAAATCAGAACAAAGCCTTGACTTTCCTCGAAAAAGGCAAAAAAGTGAGGGCCGAGAGTCGGAAAATCAGATGCTACCTGTGCACAAACGGATAGTTAATAAAACGTCAGAGTTGTGTATTTCATCGGAAGATTGTATCACCCCGTCTTCGTCATCGACACCAAGACCTTCAAACCGTAACAAAGAAAAGCAGAGTACATCAAATTGTTTACAACAGGAATCAGCCTCTaccgaaaaagaaagaaaagatgtTCAGAACTTTGACCGATCGAAAAATAACGTAAACATTTCATGTGAATGTTGCGGGCTGCAATTCAAAACATTGAGAAAATTGCAGGCACATAAACGTTACTACACCCCTGGTGGAGAATTTCATTGTCCTATTTGCGATGTAGAGTTCAGCCGCAGTTATCAACTAGCACGTCACATCAAAGTTATACACGCTACTATACCAGCCATTAGTGATAGCTATAGATTCAAATGCCACTATTGCATTGATCGTTTTGAGAAAAGATCGAGCTTGATTAGACACGTAGTGCATCTCCATAACAAGCATGTTGTATCAAATAAGAAAAGTACAAATGCTGATGGAGAGCCAGTTTTCAGTCCCAATTCAAGTGCCAGAAGAAAGAAGACAAAAGGATCTATAAGGAAATCCGAACGTATCAGCAATTCCAACTCTGAAAAAACTACATCCGATGGTGATTTTGGTCTGATCAAAGATCCAAGTGGATCGTGTAGAAATCTGTGCGACAAAAACGAACACTTGATCAATGAAGATTTGAGAGTGGAACAAAATGAGCCTAAAGCCAGCCAATTGACTGGAGATAATATAGTTTTTGAGACCGAGAAAGCTAACACAAATTCAATCCAGGATCCGATGAACACCGATCATTTACAAGAGAGGATGATTCTGGAAAAATCTAATCTCGAAGGAACGATGACATTacagaaaattaaatatttaatcaacGATTCAACTGCAAAGTCTATTAAAACCAGAGATATTGAGAAACCAATTGTCGATGCTGCCCTCAGTTCAAGCGAAGAATTATCCTCGATGAATACAGATGCTCCAATTCTACAGGAGTCTAATGAAGAACGAAGCCAAACACAGCGTTGGAGTCGAACAggcataaaaatttttccagaAAACGTTCAATCACAACAAATGAGGAATTTAGTGGATCACCTGGGTAATACCGTCGGTACATGGTCTATAACTCAATCATACGATCAGCCAGATAAACAGGATCATGTCTCTGGCAGTAACAGTGCAAGTACCACTGTTGATCTTGGAATTGCTAACATACTTCGATACACGAGAGGCAGTATTCTAAAGCCGACTATATCAAATAGCTGTATTCCGAATATCATGGATACTGTTTCATGCTCAGGTCATAAGTCAACACAGGATGAGGACTCATCTTTTCCGGAAAAAAGTATGAATGCTACGGAGAACAATAATAGCGTGGATGAAAGGCTAAAGGTTTTAACACAACATGGAGAATCGGTCAAACAGGTAGGCTCAGTTCAATCGCATCAAGCATTAGAGGACCTGGAGACTGCAAGATGGAACGTTGATGCTGAGGATGCAGCTATCGGATGTGATGATTCTGATATTGATTCAATTCAAATTGATGATTTTGGAGGGATTTCCGTGAAAATTGAGGATGAAGAGGTAAATGGTGATAGCTGTAAACCAATTTCTTTGAAGATGACTGCTTCTTCCTCTAATATTTCTGTCACAGATTCGTTGAGTCCTAAATTTGACCATGTAACCACtctgaaaaattgtaatactCGGAATTATCCGAAAATGAAAGATGTAAGAGTTTTGCTAGTAAAACTAGAAAATACGTTAAATGTATCGATGAAAAATAGTCCTCCAGAATCGTCCCTACTTGATAATTATAGTTTAGTAAAAACTGAAACACCTCATTGCGATTCGTGCGAAGAACAGTCTACAAGCAATCTAGCATCACGGCAATATTCTAGAAGTAACCATGATAGTCGGGTAGTTCATCCCGAAAAGGACTCGGGATCAACAATTAGAAAATACCGTGATACTACttacaattttcgaaaggtaatttcaaaaaagaaCGGATTGCGGGAACTTCGGAAATTGGGAAAGGGGACCGCTAAAGCGACGGAAAAACGATGCCATCTTTGCGATAAGGTGTTTCGGCATAACTTTACATCAGCATCTCATTATTTATCGGTACATACTGAGGTTGGAAGGCTTGAATGTTGTGTATGCAATAGAAGTTGCGCAAACTTAGGAAAATTGCGAATCCATCTGTTGAGACATTTCAGTGAAACGCCTAGGAAAAGGTTACGCAAATCTTGTGTAGTTTGTAAGAAAACATTGAGTATTTCTAGTTCATACCAACGTTGTCCGAACTGTAATGAGAATTCCAACGCCAAACAAGGTAGGGAGAAGCGAAGCGAGCAAGTACCGAATGTAAAAGATTCAATCAAACATGCTCACACGCAAGTAAGCAATAAAGTTGATGCCTCAGGAAATAGATCATTATCTGAAATATCATCTGTATCAATGTCGAAGAGGAAAGCAGACATCACTACCCCTGTGGTCGATCACGAGTccgtaaaaaatgataaaaaagtTCTTTCCTCGGTGTCTTGCAAAGTTGTCAAAAAGTTTAATTGCTTCGCTTCCattaaaaaaaacataatCGAAGCCGACCGTGACCAGAAGATAAGCGAAGACGCGGTGGTGGTGGGTGAGATAATCAGGAAACATACTTCAAGTCGATATAAATGTGACATATGCAAGCTCAGCTTTAACGACCCATATGCTATGCTCAATCATGAATGGGATTATTGCAACGAAGGCACATTCGCATGTAACGTCTGTAATCGAAAGTTCATGACTTATTTTCTTCTGAAGAATCATAAGATTAAACATTTTCAAACGAACGTGATTCGTAATTATGAATGCTACATTTGCAAGGAGGATTTCTCTAGAGCGGATCATCTGAACGTACATGGATTACATCTACACGGCCCTCAGTTTGTGTTGGCGAAAGGTTCCGAAACTGACGATATTCTTGATAACAATATGTCAGAGTCTGAACTAAATTCTGACTGTGACAGTGTTTTGAAGGAATTTTCCGTCGATGATGGCTACGAACTCGTGGCAGGTTATCACAAAACATGTCAAGTCGGAAAGATTCTATTGTTTAggaaaattggaaataatatGTCATCTACGGAACTGTTGCAACGAAATTCTAACGAGGATGCTCATTGCTGTTGTTTCTGTCAAACAAGTTTTAGTTCCTCAATTTTATTGAGAAGCCACATTAAAAAACATGACTATCGTGCATACTACAATCATTCATTAAAATATCTTTGTCTGATTTGTAAAGATAAATTCCGGACTAACGATCTTTTGAGAGCTCATGTTGTATATTGCCATACATCTGATCCACAAGAACAAAATCTGAGTGGATCAAATAAGTCCCAAATACAAAGCAGTAACATACGATCAGATGTTAACAAAAATGATAACACAACACAGAAGGttgctgaaaattttccgacAAAACATGTGATTCAGAAGCCGACATCTAGTTCTGTGATAGTGGAATCTGACTGTCCCGAAATTGTTTTACATATCGGGCTTGATTCAACGCCAGAAGAAGTAAAGCTTTTCACCGTGAAAGTGGAGGATGTTGAGGGATTACAGAAGACCATGTGTACCGTTTGTATAGTGACATTCGACTCTGTTGCACGATTTATAGAACATTTTACCTTTACTCATGTAAAAAATGGCGCATATTTGTGTACTTTTTGTGGTGAACAATTCTCGCTCATGGTCGATCTGAAAGATCACACATTCAAGCATGAATACGAATCTAAGAAATACGTATGTtgcggtgaaaattttttgctaGTCACAGACTTCAATCATCACTTAACATCCCATGAGGGGCAgaccgaagaagaagaagatacgCCTAAGATGCAGCTGTCACCATTGGTTGAATCTGGAGGTGGATCTCTTGAGGAATTTGGTAATAAATCAAATGTTGACGAGGCAGATAATCCATGCAGATGCGAAATTTGTGGCAAAACATTGCTACACTTTCAAGCCATGCTAAAGCATTGGGACTCATGTATTGATACGAATGGTTTAGAATGTGATTTGTGCAAAGCTACGTTCAGGAGTCTGACTTCGTTCAGGGTCCATAAGACGACTTACCATAAAGGGAAGTCGGATGTTAATCCTGTACAGAATCGACGGAGCCCTGGAGTGACCAGtaatcaaataattgaagcgTCAATCATGCATAGAAATAGGCCcaaaacgataaataaatcaatgaacGTGAATGCTAGGAAGAAACTAGGAAGAGCTGTGACCTTGACTAGTCAATTACCTAAAAAGAATGAATTACTCAAATTTGGAAATATAACTGCGAAACCACTCGCCGAAGGAGTCAAAGATTTGAAGAATAATAACGAATGCTATGTCAACGAACATCAAGAGAATAACGCAACTGGACCACGACTGGAATTGACACCGAATCGAGACGTACGATTGCCAAAACTGGATAGCATGCTAAAGGCGTCTCCGAAAATGatatcaattgaaaattttgacaGCAAAATTCACTGGGAAAGGAAAGACAATTCAAGTGCTCCAGTTTCTACTTTTCCTCAACCAGTCAATTCAAGTACGCAGGATCGTCAAGCGGATAGAGATGTTCCGAATGATGTTCCTCGCAACGCAAATGAGAATCCTTCACTATACCATCTTCCAGTTCAAGGTGTTGACAATATTAGCAGAGTATGTGTTGGATCAACTGACTCCAGTCTGAAATTACAACAGAATGAGTATCAAGAACAAAAGCTAGCAGGTCCACAACCAATCCATCCGAGCACTGTTAATGATTTGAGCTTTATCCCGACCACGGCGCATGGATccattaatattaataacacGAGGGTCGCATCAAGTGAATCTGGTGAAAAGCGTCGTTCGAATGATTGCGAGGGTCAGaaatcattaaatttcatACCGGCATCTTTCAATGCTGTTGACAATGCAGCCTTTTACCTCTGTGTTCAACCTACAGCTAATTACTCCGATAATATGAACAATGCCATGGTTTCACCTAGTGATTCCGGTCAAACAGTCCAGCCAAATGACAGCAGTAGTAAGCTACTACCAAGCTTGCTACCATTTTCTCTGAATGTTGGGCCTAGTCCAGCCTATTTCCTATGCCTTGAACCTATCTCCGACAATTCCTCCGAGTGTATCTCTCGAGCAGCTCCACTGTATGATTCCAAGCTCGAGTCTCAGCTAAATAACCATACCATAAAGCTACTGCCAACGATACTGAAAACATCCCCAAGCCTTGTTTCTAATCCAATTCATGGTTCCGATGTGCCAATAAAAGCTGTTCATTCGAATATACAGAATCGACATAGCGTCGTATCATATGATTCTGCCTCACGAACACGTTCAACTTGTAATAAGGCCATGAAAGCACCGAAACTTCCCTCTGCTCCTAGTACCTCAACCAGCGATAATCTACctaaatcgaaaaaaaaagtaacaaatGGTAGATATAATGGTAGATATAATGGTAGAATACCTACAAACCAAACAACTTTTAACAAAGAACTTGTACCGGAAAAACAAATCGTCCGTTGTAGATACTGTAATCTACTATTCACAGAGAGAGCGAAATTAATCCAGCATGTAGAATCGCACAAGACGAATAATCAATGCCGTGTGTGTGGGTtaactttttcaaatgaaaaggCACTCCGACTACATTTACCCGAACACAAAAGCTCGACGTGTCCCAAATGCAACACGATCGTTTTCTTTAGCGACTCGCTTGCACGTCCTACAGGGGTAGAGAAGTACTGCTCTGGGTGTAACACCGTACTACCGTTACCTAAGCGAAGGCATAATCGTTTGGCAAATGATTCCCCGCATCAAGTTATGAAATGTGGTATATGCATGGACACATTTGATACGATGTCTCAAATGACTGTTCACTTTAAGAAGTTTCATTCGGCTTTCGTATGTGGTATTTGCAATTCTGGATTCTATAGAAAAATTAGCTTATATAATCATATGAAGACTCATGGCAGCGGAAATCCTGACTCATTTCAATGCAAAacttgtgaaaaatattttcctaaCGGAATTTATCTGGCAGAACATTTATTATCTCACTGA
Protein Sequence: MARSIVYKRSLDVKVLPSSGNSNHEFQSIKLVKIKKEVNNESLDMESGLPLGATVTNSSGLHDGHNSELRSVDTSIQLHESNDAAHPKLVIRFRDLWKKSEQSLDFPRKRQKSEGRESENQMLPVHKRIVNKTSELCISSEDCITPSSSSTPRPSNRNKEKQSTSNCLQQESASTEKERKDVQNFDRSKNNVNISCECCGLQFKTLRKLQAHKRYYTPGGEFHCPICDVEFSRSYQLARHIKVIHATIPAISDSYRFKCHYCIDRFEKRSSLIRHVVHLHNKHVVSNKKSTNADGEPVFSPNSSARRKKTKGSIRKSERISNSNSEKTTSDGDFGLIKDPSGSCRNLCDKNEHLINEDLRVEQNEPKASQLTGDNIVFETEKANTNSIQDPMNTDHLQERMILEKSNLEGTMTLQKIKYLINDSTAKSIKTRDIEKPIVDAALSSSEELSSMNTDAPILQESNEERSQTQRWSRTGIKIFPENVQSQQMRNLVDHLGNTVGTWSITQSYDQPDKQDHVSGSNSASTTVDLGIANILRYTRGSILKPTISNSCIPNIMDTVSCSGHKSTQDEDSSFPEKSMNATENNNSVDERLKVLTQHGESVKQVGSVQSHQALEDLETARWNVDAEDAAIGCDDSDIDSIQIDDFGGISVKIEDEEVNGDSCKPISLKMTASSSNISVTDSLSPKFDHVTTLKNCNTRNYPKMKDVRVLLVKLENTLNVSMKNSPPESSLLDNYSLVKTETPHCDSCEEQSTSNLASRQYSRSNHDSRVVHPEKDSGSTIRKYRDTTYNFRKVISKKNGLRELRKLGKGTAKATEKRCHLCDKVFRHNFTSASHYLSVHTEVGRLECCVCNRSCANLGKLRIHLLRHFSETPRKRLRKSCVVCKKTLSISSSYQRCPNCNENSNAKQGREKRSEQVPNVKDSIKHAHTQVSNKVDASGNRSLSEISSVSMSKRKADITTPVVDHESVKNDKKVLSSVSCKVVKKFNCFASIKKNIIEADRDQKISEDAVVVGEIIRKHTSSRYKCDICKLSFNDPYAMLNHEWDYCNEGTFACNVCNRKFMTYFLLKNHKIKHFQTNVIRNYECYICKEDFSRADHLNVHGLHLHGPQFVLAKGSETDDILDNNMSESELNSDCDSVLKEFSVDDGYELVAGYHKTCQVGKILLFRKIGNNMSSTELLQRNSNEDAHCCCFCQTSFSSSILLRSHIKKHDYRAYYNHSLKYLCLICKDKFRTNDLLRAHVVYCHTSDPQEQNLSGSNKSQIQSSNIRSDVNKNDNTTQKVAENFPTKHVIQKPTSSSVIVESDCPEIVLHIGLDSTPEEVKLFTVKVEDVEGLQKTMCTVCIVTFDSVARFIEHFTFTHVKNGAYLCTFCGEQFSLMVDLKDHTFKHEYESKKYVCCGENFLLVTDFNHHLTSHEGQTEEEEDTPKMQLSPLVESGGGSLEEFGNKSNVDEADNPCRCEICGKTLLHFQAMLKHWDSCIDTNGLECDLCKATFRSLTSFRVHKTTYHKGKSDVNPVQNRRSPGVTSNQIIEASIMHRNRPKTINKSMNVNARKKLGRAVTLTSQLPKKNELLKFGNITAKPLAEGVKDLKNNNECYVNEHQENNATGPRLELTPNRDVRLPKLDSMLKASPKMISIENFDSKIHWERKDNSSAPVSTFPQPVNSSTQDRQADRDVPNDVPRNANENPSLYHLPVQGVDNISRVCVGSTDSSLKLQQNEYQEQKLAGPQPIHPSTVNDLSFIPTTAHGSININNTRVASSESGEKRRSNDCEGQKSLNFIPASFNAVDNAAFYLCVQPTANYSDNMNNAMVSPSDSGQTVQPNDSSSKLLPSLLPFSLNVGPSPAYFLCLEPISDNSSECISRAAPLYDSKLESQLNNHTIKLLPTILKTSPSLVSNPIHGSDVPIKAVHSNIQNRHSVVSYDSASRTRSTCNKAMKAPKLPSAPSTSTSDNLPKSKKKVTNGRYNGRYNGRIPTNQTTFNKELVPEKQIVRCRYCNLLFTERAKLIQHVESHKTNNQCRVCGLTFSNEKALRLHLPEHKSSTCPKCNTIVFFSDSLARPTGVEKYCSGCNTVLPLPKRRHNRLANDSPHQVMKCGICMDTFDTMSQMTVHFKKFHSAFVCGICNSGFYRKISLYNHMKTHGSGNPDSFQCKTCEKYFPNGIYLAEHLLSH

Similar Transcription Factors

Sequence clustering based on sequence similarity using MMseqs2

100% Identity: -
90% Identity: -
80% Identity: -