Basic Information

Insect: Sesia bembeciformis
Gene Symbol: -
Assembly: GCA_943735985.1
Location: CALSEZ010000360.1:171492-187503[-]

Transcription Factor Domain

TF Family: zf-C2H2
Domain: zf-C2H2 domain
PFAM: PF00096
TF Group: Zinc-Coordinating Group
Description: The C2H2 zinc finger is the classical zinc finger domain. The two conserved cysteines and histidines co-ordinate a zinc ion. The following pattern describes the zinc finger. #-X-C-X(1-5)-C-X3-#-X5-#-X2-H-X(3-6)-[H/C] Where X can be any amino acid, and numbers in brackets indicate the number of residues. The positions marked # are those that are important for the stable fold of the zinc finger. The final position can be either his or cys. The C2H2 zinc finger is composed of two short beta strands followed by an alpha helix. The amino terminal part of the helix binds the major groove in DNA binding zinc fingers. The accepted consensus binding sequence for Sp1 is usually defined by the asymmetric hexanucleotide core GGGCGG but this sequence does not include, among others, the GAG (=CTC) repeat that constitutes a high-affinity site for Sp1 binding to the wt1 promoter [1].
Hmmscan Out: # of c-Evalue i-Evalue score bias hmm coord from hmm coord to ali coord from ali coord to env coord from env coord to acc

1 10 0.0093 0.64 11.0 0.8 2 23 666 688 665 688 0.96

2 10 0.096 6.6 7.8 0.5 3 23 697 717 696 717 0.97

3 10 0.37 25 6.0 0.7 2 23 753 775 752 775 0.92

4 10 0.00047 0.032 15.1 0.5 1 23 777 800 777 800 0.97

5 10 5.7e-05 0.0039 17.9 1.7 2 23 807 828 806 828 0.96

6 10 4.7 3.2e+02 2.5 0.4 3 22 839 858 838 862 0.90

7 10 0.0014 0.096 13.6 2.5 1 21 867 887 867 890 0.94

8 10 0.00044 0.03 15.1 3.9 2 23 897 918 897 919 0.94

9 10 2.5e-06 0.00017 22.2 0.8 1 23 927 949 927 949 0.98

10 10 0.00027 0.019 15.8 0.3 1 23 955 977 955 977 0.98

#	of	c-Evalue	i-Evalue	score	bias	hmm coord from	hmm coord to	ali coord from	ali coord to	env coord from	env coord to	acc
1	10	0.0093	0.64	11.0	0.8	2	23	666	688	665	688	0.96
2	10	0.096	6.6	7.8	0.5	3	23	697	717	696	717	0.97
3	10	0.37	25	6.0	0.7	2	23	753	775	752	775	0.92
4	10	0.00047	0.032	15.1	0.5	1	23	777	800	777	800	0.97
5	10	5.7e-05	0.0039	17.9	1.7	2	23	807	828	806	828	0.96
6	10	4.7	3.2e+02	2.5	0.4	3	22	839	858	838	862	0.90
7	10	0.0014	0.096	13.6	2.5	1	21	867	887	867	890	0.94
8	10	0.00044	0.03	15.1	3.9	2	23	897	918	897	919	0.94
9	10	2.5e-06	0.00017	22.2	0.8	1	23	927	949	927	949	0.98
10	10	0.00027	0.019	15.8	0.3	1	23	955	977	955	977	0.98

Sequence Information

Coding Sequence: ATGGATGGCCCTTTGAAAAAAAAGAGTACTTATTTGCAAAAATATCGGAAGGAATGGGAAACTCACGATGAGTTTAAAATGTGGTTACGGCCCGTAGCAAATAATTCTACGAAAGCATTTTGCACTTATTGTCACTGTGAAATCTTTGCAAGAATTAACGATATAAAAAAACACAATGAGACTAAAAAACATAAGGATAAATGTGACGCAATTTCAAAAAACAGAAGAATTGAATTTGTGCCAGCAGCAACCAAAAATAATACAGGCTCTTTAAAAATAGAAGGTACGTTATCATTATTTATTGTTGAACACACAGCTATTGCACAGATTGACCATTTGACTGAGGCACTAAAAAAATGTATAACAGACTCAAAGACTGTCATGGATGTAAAAATGCACAGAACGAAGTGCACTGAGGTAATAAAAAATGTCTTAGCCCCACATTTCATACAGAACCTAGTGGATGATATCGGGTCTCAACCGTACAGTGCTCTAATAGATGAATCGACTGATCTCAGTGTGTCAAAATTATTGGGCATAGTGATTAGGTACTTTAGCTGTACACATAATTATGTAGTATCTGCATTCCTTGCATTGGAACCGCTGAAGAGAGCAGACGCCCGTGGAATTGCCACTGCTTTGGTGAATTGCCTGCAAACCCATGGTTTATCACTAAAGAACCTAATAGGGATCGGTGTAGACAATGCCTCTGTCATGACTGGCATAAACAATGGATTACATAATATATTAAAAACCGAGTATGGTTTACCCAATTTAATTTTGGTGCGGTGCGTTTGCCACTCACTACAGTTGGCTGTTTCACATGCTTCTGAACAAACATTGCCTCGGAATATAGAGTTCCTTGTAAGAGAGACCTACAGTTGGTTTTCACACTCACCCAAACGGTGTGATGAATATAGAGACATATTTGAGACAATTAATTGTGGTGAGAAGCCATTAAAAATATTGCGGGCTTGTAACACTCGCTGGCTGTCTATTGAAGGAGCGGTTACCAGAATTTTGTCTCAATGGGATGAACTGAAATTGCATTTTTCATTGAACAGACAAAATTGTTACACGGCAGAGTTGCTTTATTCTATGTATGCTGATGAAGCTAATCGACTATATATGTGCTTTTTAAGGAGCATTTTGAATGACGTACAAATAGGAGTGAAGAGTTTCGAAGCTGAAGACACAAATCCAGTAGCACTACTGAATGTTCTTATGACGTTGTTTCGCTCTGTATGTAACAGGGTTTTGATGCCTTCAGTGGCGACTACTGATAAAGATTATTTGTCGATTAACGTAGAAGACCATTTGAATCCGGTACCGTATCTGGGGTTTCTTTTCGAATCCCAAGTTCAAAAGAGTTTACTGCCCAGCGTAGTCACTAATTCTGTCAGAAAACGATGCATTGAGTTCACGATTAAATTAGCAAAAGAAATTCAACAGAGACTTCCTTCCAATTACATAAAAGAATCCATTGGTGGTGTGTGCTGGGAGTGCAGAAGTCACATGTTAAAGTTTTTTAAGTTCAAGGCGAAGGTCAGAAAAGCTCAGGACACTATGTGGGATTGGAAATTTAACAAAAAGAACCTAAACCTAAATAGTGTCTCTACACTGTCAGTCTCATACAAACAGACATACGACTACGAATACACATGCAACGAAGAAATAGAAATCAAAACTGAACCCCCTTTCATGACACAAGAGACTGATATAACAGATTGCGAAATGGATGACGTGAAACCTCTCATAGAAATCGGAGATGTTTATATCGGATTTGTTAATGCGGAAGACAAAGAAACGATCCAAAGTGATAAAAAAGCTGTAATAGTTCCAAAAGAGGAAAAATTGGATGATGTTGAGATGGCATATTCCGATGAAGAAAATCATGAGCAAACAAAGTTTTGTAAAACAGTTTTCACGGAAGAAGAGATGCAAGCGAGTAGAGAATTGAAACGGAGTCATCCAAATTACATTAAAGTGCCACTGAAGTGCTATGATTGTGTGCTGGGTTTCGTAAGACAGAATAATTACGATCTGCATATGAAGAAGAAACATGGTGTGGAAGCCGGTCCATTACTCTGCGATATTTGTAAAGTGCGCTATCCATCGGACTTCGAGTTGACTAAGCACAGGAGTCAGCACTATAAGTGCTATCAGTGCAACCTGTGTCAGTACAAGAGTACAGCAATCAGAGCTATACGGAGCCACTGTTCTGGACAGCACATGATGCATACAGCCAACAAGATTCACTGCAAGCACTGCGATGTGATAGTTGAAACCGTCGAAAAGTTAAAGGAACACATTGAAGAAACGCACAAACACACTTGCGATACATGTGGAGAGACGTTCAAAGGAAAATGGGCATTGGGAAATCATGAAAGACGAATACACGGAGAAAAAAGAAAATTAATTTGCGATATTTGTACAAAAAGCTTCAGGAACAGGACTTGTCTGGAGTCCCATATAGTGACCCACGACGCCGGTGTCGCGAAGCGACTAGCGTACTGTGCCAAGTGCGACGTGCAGTACAAAAGTATATATGTGTATAAAGACCATCTGAAGAGAAGTGTTAATCATTCCACGGCATTGTTCCAATGTTCGGACTGCGACAAGAAATTTGCATCTGAAGCGTACTGGAAGCAACACCGCAATTGCGTGCACCTGCGCAAGTGGCAGAGAAAATGTAAGCTTTGCAACGAGGTGTTCAAAACGAAGTGGTCACTAAAGAAGCACAATGTGACTCACCACGGAGTCGAGAGGACAAGGAATTATTCGTGCGATGATTGTGGAAAGGAATTCTTTGAGAAAGGCACGTTGAAACAGCACATGAACTCTCACACGGGGAAACGACCTTATGTTTGTGGAACGTGTGGAGCGACCTTTAGCTACTCCGCAGCGTTATATACACACAAGAAGAATCACAAGAGGTGTAGAGCGATGTTGGAGCAGATGAAGGCGAAAGGAGAGACGAACTCCGAGAGTAATGGAGAACTGACCACCAATTAA
Protein Sequence: MDGPLKKKSTYLQKYRKEWETHDEFKMWLRPVANNSTKAFCTYCHCEIFARINDIKKHNETKKHKDKCDAISKNRRIEFVPAATKNNTGSLKIEGTLSLFIVEHTAIAQIDHLTEALKKCITDSKTVMDVKMHRTKCTEVIKNVLAPHFIQNLVDDIGSQPYSALIDESTDLSVSKLLGIVIRYFSCTHNYVVSAFLALEPLKRADARGIATALVNCLQTHGLSLKNLIGIGVDNASVMTGINNGLHNILKTEYGLPNLILVRCVCHSLQLAVSHASEQTLPRNIEFLVRETYSWFSHSPKRCDEYRDIFETINCGEKPLKILRACNTRWLSIEGAVTRILSQWDELKLHFSLNRQNCYTAELLYSMYADEANRLYMCFLRSILNDVQIGVKSFEAEDTNPVALLNVLMTLFRSVCNRVLMPSVATTDKDYLSINVEDHLNPVPYLGFLFESQVQKSLLPSVVTNSVRKRCIEFTIKLAKEIQQRLPSNYIKESIGGVCWECRSHMLKFFKFKAKVRKAQDTMWDWKFNKKNLNLNSVSTLSVSYKQTYDYEYTCNEEIEIKTEPPFMTQETDITDCEMDDVKPLIEIGDVYIGFVNAEDKETIQSDKKAVIVPKEEKLDDVEMAYSDEENHEQTKFCKTVFTEEEMQASRELKRSHPNYIKVPLKCYDCVLGFVRQNNYDLHMKKKHGVEAGPLLCDICKVRYPSDFELTKHRSQHYKCYQCNLCQYKSTAIRAIRSHCSGQHMMHTANKIHCKHCDVIVETVEKLKEHIEETHKHTCDTCGETFKGKWALGNHERRIHGEKRKLICDICTKSFRNRTCLESHIVTHDAGVAKRLAYCAKCDVQYKSIYVYKDHLKRSVNHSTALFQCSDCDKKFASEAYWKQHRNCVHLRKWQRKCKLCNEVFKTKWSLKKHNVTHHGVERTRNYSCDDCGKEFFEKGTLKQHMNSHTGKRPYVCGTCGATFSYSAALYTHKKNHKRCRAMLEQMKAKGETNSESNGELTTN

Similar Transcription Factors

Sequence clustering based on sequence similarity using MMseqs2

100% Identity: -
90% Identity: -
80% Identity: -