Basic Information

Insect: Sesamia inferens
Gene Symbol: -
Assembly: GCA_037179545.1
Location: CM073946.1:16392584-16406615[-]

Transcription Factor Domain

TF Family: zf-C2H2
Domain: zf-C2H2 domain
PFAM: PF00096
TF Group: Zinc-Coordinating Group
Description: The C2H2 zinc finger is the classical zinc finger domain. The two conserved cysteines and histidines co-ordinate a zinc ion. The following pattern describes the zinc finger. #-X-C-X(1-5)-C-X3-#-X5-#-X2-H-X(3-6)-[H/C] Where X can be any amino acid, and numbers in brackets indicate the number of residues. The positions marked # are those that are important for the stable fold of the zinc finger. The final position can be either his or cys. The C2H2 zinc finger is composed of two short beta strands followed by an alpha helix. The amino terminal part of the helix binds the major groove in DNA binding zinc fingers. The accepted consensus binding sequence for Sp1 is usually defined by the asymmetric hexanucleotide core GGGCGG but this sequence does not include, among others, the GAG (=CTC) repeat that constitutes a high-affinity site for Sp1 binding to the wt1 promoter [1].
Hmmscan Out: # of c-Evalue i-Evalue score bias hmm coord from hmm coord to ali coord from ali coord to env coord from env coord to acc

1 14 6.3 9.2e+02 2.3 2.4 1 23 199 222 199 222 0.92

2 14 0.0091 1.3 11.2 0.9 1 23 314 337 314 337 0.92

3 14 0.097 14 8.0 0.1 2 20 375 393 374 395 0.89

4 14 2 2.9e+02 3.8 1.6 1 19 688 705 688 708 0.79

5 14 8.2 1.2e+03 1.9 3.3 1 23 720 742 720 742 0.88

6 14 0.092 13 8.0 0.2 2 23 748 769 747 769 0.96

7 14 2.2 3.3e+02 3.7 1.3 1 21 792 811 792 813 0.74

8 14 1.1 1.6e+02 4.7 7.6 2 23 853 874 852 874 0.95

9 14 0.0024 0.34 13.0 0.3 1 23 889 911 889 911 0.98

10 14 5.9e-07 8.5e-05 24.4 2.7 1 23 917 939 917 939 0.99

11 14 7.8e-05 0.011 17.7 0.6 3 23 946 966 944 966 0.96

12 14 0.00098 0.14 14.2 1.2 2 23 973 995 972 995 0.96

13 14 0.2 28 7.0 0.1 1 19 1002 1020 1002 1021 0.83

14 14 0.00045 0.066 15.3 0.9 3 23 1034 1055 1033 1055 0.97

#	of	c-Evalue	i-Evalue	score	bias	hmm coord from	hmm coord to	ali coord from	ali coord to	env coord from	env coord to	acc
1	14	6.3	9.2e+02	2.3	2.4	1	23	199	222	199	222	0.92
2	14	0.0091	1.3	11.2	0.9	1	23	314	337	314	337	0.92
3	14	0.097	14	8.0	0.1	2	20	375	393	374	395	0.89
4	14	2	2.9e+02	3.8	1.6	1	19	688	705	688	708	0.79
5	14	8.2	1.2e+03	1.9	3.3	1	23	720	742	720	742	0.88
6	14	0.092	13	8.0	0.2	2	23	748	769	747	769	0.96
7	14	2.2	3.3e+02	3.7	1.3	1	21	792	811	792	813	0.74
8	14	1.1	1.6e+02	4.7	7.6	2	23	853	874	852	874	0.95
9	14	0.0024	0.34	13.0	0.3	1	23	889	911	889	911	0.98
10	14	5.9e-07	8.5e-05	24.4	2.7	1	23	917	939	917	939	0.99
11	14	7.8e-05	0.011	17.7	0.6	3	23	946	966	944	966	0.96
12	14	0.00098	0.14	14.2	1.2	2	23	973	995	972	995	0.96
13	14	0.2	28	7.0	0.1	1	19	1002	1020	1002	1021	0.83
14	14	0.00045	0.066	15.3	0.9	3	23	1034	1055	1033	1055	0.97

Sequence Information

Coding Sequence: ATGGCGGACACATCAAGAAAAAGATCTAGAAAGTCGAAATTAGTGCCTCGAGAATGTGCAGTTGGCGAAGATGATCTTGAATTGCAGGTTTCAGCGCCGAAAGTACCTAAAGCCGTAAAACAACCCACCAACAGAGAATCAATAAGTACTGCAACAATATGCGCACCAGAACCAACCTTCTCAAAACAAGAAGAGGTTGATACGAGCGTCCTAAGAAAAATCAATGCAGCAACTAAAGAAGATAAAGAGCCAAAAACTAAGACATCTCCCAGAAAATTCGAGATTAACATTGAAGTAGAATCAtgtgatgatgacaatgaatttGAAGAACTTGCTGAACCTAATGCTAATGAAACTACAAGGATCGAACCTATTGAGCTTTCTCGAGATATTATTCTGGACGCTGCCGATAATATACTCAAAGATTCACCAAACATTGCCGATAAAATCCTGAACATATACATTAGGAACACAATCGGCTTTGAGTTGAAAAGTGATCTGGTACTAGATTGCCATGAAAAGGGAATACAAAACGCGTTGGATCAATGGCGTTATTGGCAATCTCGTAGTTTTCACAGAGAAGATCCCCTTTTCTACAAATGCTATATCTGTACGAGGTCCTGGTGGCATTTAGAAGACTTTCGCCAACATTTGTCAACAAGACACCCTGGTGATCTTAGGATTACAATAGCCTTTGAGAAATATGAATTGCATGAAGCTAACTTGATAGCTTACCACGAAAGGCTTGTAGTCATTAAAGATATATATACAGAAGGTCTTTGCCGCCGATGCGGTAAGAATTATAGTGCTCATGAATTGGGATTGAGGTTTCAGGAAAAATATTACAGAGCTGAAGGATGCACAAAGCAGTTTTTCAGCTGTATGGGCCTAAGAGATCACGTTTCTAGCTGTTCTGTGTGTAATACTAAGGATAAGCGTTTCCAATGTGATATATGTAGGTCGAGATTCAGCACAGAACACGAGTTAAACGGTCATTTAGTGTTGTCTCATTCTGTTCGGACTGATATACCAATAATGTCACACTATACAAAATGCAAACTCTGCTCGGAGAGGTATACCTgtcattatttacataaatgcgGACAAAAGGGGCCTCATAGTGAGTGTCCTCATTGTCAACAGAGCTTCCCAAATGTCATGGCCTTGGATGTGCATGTGTTTAGTGCAAGTAAGCCATATAAATGTGAAATTTGCCAGGAGGTGATGGAATATAGCTGTAAGAAATGTGACCATATGTTGGAGCATACAGACAAGTTCATGGTGGTTAGGAGATGTTTAATGTGTGATGGtttgaacatatttttaaataatgaagatGCAGCGGCACATCGGTTTTTGAAACACGAGATGGAAGGACGAACACGAgtgaaacgaaagtactttttTCCTAAAATGCTAGTACCATCGTCTTGTGTATATAAACGTTTAGCAGAATTAGAGTGGAATCAACAAGAATCAGCTctggaagaagaagaatcagtactggaagaagaagaatcaGTACTGGAAGCAAAAAAATCCATGCCTAAAGATGAAGAATCAGTCCCAGAAGAAGAAACAGCATTAAACAGTGGAAAAGAATCTATTTTGGTACGTGAACAGAAGTTACAAGCAGAATTGGATTTAGCTACAAAATTCATGCTGGGATCTGTTTTTGTCAAACAAGAACCAGAAGACTCAGAAGATAGCTCAGGGCTTGTAATCAAAGAAGAGCCTTTTGAAGAATTTGAAAGCCAAACGCATGAAGATGTGAATTTTACTGAGAGTGATGGACATGAAATTACTGTCAAAGAAGAATACgtagaggaagaagaagaagaagaagaatatgaaGAAGATATTATCAAACTAAACTTTGATATAGAGGATTTTTTAGTAAAAGAAGAAGCAATTCAAGAAGATGATGATTTTGCTATAAAACAGACACAGACTCGAGAATCAGAAAATGATTCAGAAGAAATTTCACAACAATTAAAAGAAGATTCCATGCTAGAACCAGAAGTTATTATTCATGGAGACTGCAAGAAAAAGCAAAAACTATACAGATGTACTAAATGTGGATTCACAGCCAAgcatagaaattataaaaatcatgTTGACTCTGACTGTGGAACAAGCCAGATGAGACATAAAACCTATAAGTGCACAAAATGTCAAAATACCTATGGATCcatgaaaaaatatttgacaCACTTCACAGATCACGGCTACAGACCGCTCTCATGCCCTGATTGCCTGAAAGAATCCAGCACATACACCCTTTTGGGAACGCATTTACAGCAACACATCAAGCAGAACTTTGTCCGAGTAAAAATGATCACACACGCAGGCAAGACCACAACAAAACCCAAGTTTCAATGCAAAAGATGCGGGAAAATCACTGAACCTTTGCATTTCTTTGAGCACTGGGAACTGCATGTTAACGCTCAACCAACGCATCCTATAAAAGTAACCTCAAGGCCTATTTATAAACATGGAGAATTGCATGAAACAATTCTAAGGGAATGCATCGcCCTCTTATACAAACAGCCGAAGGAATGCAACCATTGTCACCGTAAGTTCAACCGGGTAAACGAGTGCAAACGTCACATCATTGAACATCTACTGCATGATGCTTACAACCACAAACATATCTACAATGAGTTCAGATGCCAGGTCTGTGAACAAGGGTTCCCCATACCAGAGAAATATAAACAGCATATGCGGGACCATGCATCCCTGCCCGTGTACAAGTGTGAACTGTGCGATCGTACCTTCAGTGACTCAAGCAACTTTACAAAGCATAAAAAAGTGCATAATTTGAAAGTGATAATCTGTGATTTATGCGGTAAAAAGTTTCAATCAAAAATGTCTTTGGAAAAACACCTTGAGAAACACGTGGCCTCTGAGAAAATTACATGCAAGATATGCAACAAAATATTCTATTTCGAAACCGCTTACCGACGCCATGTGAGGTATTTCCACGAGAAAACAGTCATAGGCTTCCGGTGCGTTATCTGCGGGGAACGCTTCGACAGCCTCAAACTGAAATGGGATCACTTGTGGGACGTCCATAAGGAAAGAAAGCAAAAAGCCGACTGTCCTATCTGCCACATGCCCTTCAGGAACTACTCCAAAGTCCGACGCCACGCAAGAATATACCATATGACGGATGTCTCAGTGGTGAATATCAAGAAACATTCTGCAAAAGCTCACATAGATCTCAATAAGTACTTGAGGGATCCTGGTAAGATAAAACCTCAAATAATGGAAACTTTGTATGTGTATGATTCTGATTGA
Protein Sequence: MADTSRKRSRKSKLVPRECAVGEDDLELQVSAPKVPKAVKQPTNRESISTATICAPEPTFSKQEEVDTSVLRKINAATKEDKEPKTKTSPRKFEINIEVESCDDDNEFEELAEPNANETTRIEPIELSRDIILDAADNILKDSPNIADKILNIYIRNTIGFELKSDLVLDCHEKGIQNALDQWRYWQSRSFHREDPLFYKCYICTRSWWHLEDFRQHLSTRHPGDLRITIAFEKYELHEANLIAYHERLVVIKDIYTEGLCRRCGKNYSAHELGLRFQEKYYRAEGCTKQFFSCMGLRDHVSSCSVCNTKDKRFQCDICRSRFSTEHELNGHLVLSHSVRTDIPIMSHYTKCKLCSERYTCHYLHKCGQKGPHSECPHCQQSFPNVMALDVHVFSASKPYKCEICQEVMEYSCKKCDHMLEHTDKFMVVRRCLMCDGLNIFLNNEDAAAHRFLKHEMEGRTRVKRKYFFPKMLVPSSCVYKRLAELEWNQQESALEEEESVLEEEESVLEAKKSMPKDEESVPEEETALNSGKESILVREQKLQAELDLATKFMLGSVFVKQEPEDSEDSSGLVIKEEPFEEFESQTHEDVNFTESDGHEITVKEEYVEEEEEEEEYEEDIIKLNFDIEDFLVKEEAIQEDDDFAIKQTQTRESENDSEEISQQLKEDSMLEPEVIIHGDCKKKQKLYRCTKCGFTAKHRNYKNHVDSDCGTSQMRHKTYKCTKCQNTYGSMKKYLTHFTDHGYRPLSCPDCLKESSTYTLLGTHLQQHIKQNFVRVKMITHAGKTTTKPKFQCKRCGKITEPLHFFEHWELHVNAQPTHPIKVTSRPIYKHGELHETILRECIALLYKQPKECNHCHRKFNRVNECKRHIIEHLLHDAYNHKHIYNEFRCQVCEQGFPIPEKYKQHMRDHASLPVYKCELCDRTFSDSSNFTKHKKVHNLKVIICDLCGKKFQSKMSLEKHLEKHVASEKITCKICNKIFYFETAYRRHVRYFHEKTVIGFRCVICGERFDSLKLKWDHLWDVHKERKQKADCPICHMPFRNYSKVRRHARIYHMTDVSVVNIKKHSAKAHIDLNKYLRDPGKIKPQIMETLYVYDSD

Similar Transcription Factors

Sequence clustering based on sequence similarity using MMseqs2

100% Identity: iTF_01340687;
90% Identity: -
80% Identity: -