Basic Information

Insect: Vespa crabro
Gene Symbol: -
Assembly: GCA_025728115.1
Location: JAITYU010015935.1:16472-20845[-]

Transcription Factor Domain

TF Family: zf-C2H2
Domain: zf-C2H2 domain
PFAM: PF00096
TF Group: Zinc-Coordinating Group
Description: The C2H2 zinc finger is the classical zinc finger domain. The two conserved cysteines and histidines co-ordinate a zinc ion. The following pattern describes the zinc finger. #-X-C-X(1-5)-C-X3-#-X5-#-X2-H-X(3-6)-[H/C] Where X can be any amino acid, and numbers in brackets indicate the number of residues. The positions marked # are those that are important for the stable fold of the zinc finger. The final position can be either his or cys. The C2H2 zinc finger is composed of two short beta strands followed by an alpha helix. The amino terminal part of the helix binds the major groove in DNA binding zinc fingers. The accepted consensus binding sequence for Sp1 is usually defined by the asymmetric hexanucleotide core GGGCGG but this sequence does not include, among others, the GAG (=CTC) repeat that constitutes a high-affinity site for Sp1 binding to the wt1 promoter [1].
Hmmscan Out: # of c-Evalue i-Evalue score bias hmm coord from hmm coord to ali coord from ali coord to env coord from env coord to acc

1 18 0.082 5.8 7.3 3.1 1 23 344 366 344 366 0.97

2 18 0.061 4.4 7.7 0.6 2 23 401 422 400 422 0.93

3 18 0.00018 0.013 15.6 2.2 1 23 496 518 496 518 0.97

4 18 0.0015 0.11 12.7 0.5 2 23 522 543 521 543 0.96

5 18 0.016 1.1 9.5 7.3 1 23 627 649 627 649 0.96

6 18 0.00037 0.026 14.7 0.7 1 21 655 675 655 679 0.92

7 18 0.0015 0.11 12.7 3.7 2 23 752 773 751 773 0.95

8 18 0.00028 0.02 15.0 3.9 1 23 830 852 830 852 0.96

9 18 0.00025 0.018 15.2 0.7 1 20 857 876 857 878 0.94

10 18 0.00044 0.031 14.4 0.6 2 23 889 910 889 910 0.97

11 18 3.4e-05 0.0025 17.9 1.7 2 23 949 970 948 970 0.97

12 18 2.3e-05 0.0016 18.5 1.6 1 23 975 997 975 997 0.95

13 18 0.00013 0.0091 16.1 2.9 1 23 1003 1025 1003 1025 0.98

14 18 4e-06 0.00029 20.8 0.4 1 23 1041 1063 1041 1063 0.95

15 18 3.3e-07 2.3e-05 24.3 0.6 1 23 1069 1091 1069 1091 0.99

16 18 3.6e-05 0.0025 17.9 0.2 1 23 1097 1119 1097 1119 0.97

17 18 0.00013 0.0094 16.1 4.1 1 23 1125 1147 1125 1147 0.96

18 18 0.0085 0.61 10.4 0.3 1 20 1153 1172 1153 1174 0.89

#	of	c-Evalue	i-Evalue	score	bias	hmm coord from	hmm coord to	ali coord from	ali coord to	env coord from	env coord to	acc
1	18	0.082	5.8	7.3	3.1	1	23	344	366	344	366	0.97
2	18	0.061	4.4	7.7	0.6	2	23	401	422	400	422	0.93
3	18	0.00018	0.013	15.6	2.2	1	23	496	518	496	518	0.97
4	18	0.0015	0.11	12.7	0.5	2	23	522	543	521	543	0.96
5	18	0.016	1.1	9.5	7.3	1	23	627	649	627	649	0.96
6	18	0.00037	0.026	14.7	0.7	1	21	655	675	655	679	0.92
7	18	0.0015	0.11	12.7	3.7	2	23	752	773	751	773	0.95
8	18	0.00028	0.02	15.0	3.9	1	23	830	852	830	852	0.96
9	18	0.00025	0.018	15.2	0.7	1	20	857	876	857	878	0.94
10	18	0.00044	0.031	14.4	0.6	2	23	889	910	889	910	0.97
11	18	3.4e-05	0.0025	17.9	1.7	2	23	949	970	948	970	0.97
12	18	2.3e-05	0.0016	18.5	1.6	1	23	975	997	975	997	0.95
13	18	0.00013	0.0091	16.1	2.9	1	23	1003	1025	1003	1025	0.98
14	18	4e-06	0.00029	20.8	0.4	1	23	1041	1063	1041	1063	0.95
15	18	3.3e-07	2.3e-05	24.3	0.6	1	23	1069	1091	1069	1091	0.99
16	18	3.6e-05	0.0025	17.9	0.2	1	23	1097	1119	1097	1119	0.97
17	18	0.00013	0.0094	16.1	4.1	1	23	1125	1147	1125	1147	0.96
18	18	0.0085	0.61	10.4	0.3	1	20	1153	1172	1153	1174	0.89

Sequence Information

Coding Sequence: ATGGACGCCGTAGAAATAAGTACGTCGGATCCACCGCAAAGTGAACAAGAAATTGTGTCTACCGTGGAGATATGTCGTATATGTCTTCTTGGTAATCTGGTGATGCGAGATCTTTTTCTGGGAAATGAGGTCGCCTCTTTATCGGCTAAAGCGATGAGTTTCGCGAACGTTAAGATGTTGCCAGGAGATGGCTTACCTCCTCGCGTTTGTAACGAATGTGCAGATAAACTTGAATCTGCATATGAATTTAAACTTCAAGTCGAACAAGCTGACAATGTATTAAGAGAAAGATTCGATGGTATTAAAGAAGAATTATTTTTTAACGAAGTTGAAGTACATTTGGAGGTAGATAGAAATGAAGCTATCAATGATATTCATTTAGAATCTCATTACCAACATGCCGCTGAAGTATTGACAGAGGGATCAGAAAATGAAAAATCTCTCTTGAAAGAGCAATTGGCATTGTTACAAGTTGAAAAATTGGTAGAAAGAGAACAATTAAGAGAAGAAGAAAATAATTCACAAATATTGGAGCAACAAGGTATAATGAACAACTCTCATAATCAAGAAAAATACACAAATCAAATAGATGAAGATGCTTGTACGTTGGTGAATAATGCAGAAAATCAAGAAGTATTAAAATCAGATGGTATTAATGAAAACTGTACAGATGCGATTCCTGCAGAAGAACATGATTATATTATGCAACAGGATTATGTTATGAATGAACAATTTTCTTCTGAAGAATCTAAACCATCTAAAGAGAATACAACGCAATGCAATGAACCGCTTACGGAATCAAATATACTTGAAGATTGTAAAATAGATACAGAACATATGCCGCTTACAAATATTGACACGCTTGTTGAAAAAGACCTATCTCTGACTGAAATTAGAAAAAGTAAACGAAAATCATCGCGACGAAATTTTACAAGTGACAGAGATTCCGACGAAGAAAATTATTTCGAAAATTTAAATCTTAGTTCTCGTCTTAAAAGAGCACAAGCCGATAGATCAGAAAAGATTTACTTTATGTGTTATCTTTGCGACAAACAATTTCTTTCTAAGAATGTATTGAAGGAACATATGCATTCACATGAGGAAATTAGGCGAGCTTTGTCTCTTAAAAAGGTGCCTGAAAAATCATCAAAGGTATCTAATACTTCCCCAAAAATGCCACCATCTGGGAAAAGGGCTAACAAGTGTCCATATTGTGGGAAAGAATATTTATACATAATTTCATTCAGCAAACATCTTAAACAACATGAAAAAGAAAAAGAAAATGCTAAAGAAGATTCCATGCCCCTTGAAATATCATTTCACGAAGACGAACATAGTTTAGGTTTTGATAACCATAGTAATTCACAATATTCGGATTATGCATGTAGAAAGACGGCGAGGCAAGAGGAAGCATATAATGAGAACGAGGAGGAGAAAGATGATCACGAAACAGAAAAACAAAGAAAGAAATCTCACTTGGAAACGTTTGAATGTGAAAAATGTTCTGAAAAATTTTATACAAGACGAAGTTTAAGAAAGCACGCACTTTCACACGTTAACTTAAAGTGTAATGTCTGCAATGAAAAGTTTGACGAGGTTGAGCAATTAAAAAATCATCGTGCAAAACATGTAGTAGAAGGTATGTTAATGGATCAAGATTTAGAAGAAGATATAGAACACCATATAATTAACAAAGACGATGAAGAACAAGATATTAAAGGCGATAATGAAGACGATTCAGAAATTGAGAATAATATTGACGATGTTCAAGATAAAGAAAAGTGGGCAGAGACAAAAGAATCCAAATGTCCGCACTGTCCGTCAACGTGTTCTCACAAGAAATCTTCGAGGCACATTGAAACACACACGTCTTCAAAATATAGTTGTAAAGTATGTTGTCAACAATTTACAAGAAAAGATCATTTACGAAGGCATACTGAACAGCATGGAAGAATAAAGACGTATAAATGTACGCAATGCAATAAAACATTTGGAAACGAATTGACTTTACGTAATCATCTGATAGCGACCAATCATAAGACTTTCGTTCATGGACAAGAATATGATCCTAATAAACGTATAAAACGAGTGGCAGCTAAAGCTGCACAAAAGATTATTGATAAAATAAAAACGGAAGACGGTTTAGAGGATTATGACGAAGATGATGATAATAATGATATAATCGATATGGACGTTCGTCATAATCGTAAGCAAGAAAATTCTTTTAAGAAAACTAATAATAGGAAGGAATTAGAATGCGCCACTTGCAATAAAAAATGTAATTCGAAACAAACTCTGACAAAGCATATGGAGCAACATGTAAAAGACGAAAAAGCAGAGAAAATGGATAGATTGGACAAGTTTAAAAAGCCAGCAGAAAAAAAGGAACAACAAAGGATAGGTGGTGGTATGGAATTAGGAAAGGACGAAGACGATGACGATGATAATTCAGATTTTGAAAGTGGTTTGGATTGGCCGATGGATAATCACGAATGTGCAACATGTAAAAAAAGATATAGTACGAAAAAGTCTCTGTTGCGACATCAATTACTTCACGAGGAACCAAATTTCGAATGTGATATATGTAATGTCAAGTTTTATCGTAAGGATAAATTAAAAGCTCATTATGATAAATGCTCAGAAAAAAATCCTGATCAAGTTAGGAAGTGCAATATTTGTGGTGATAGTTTTGAAAATAATGAAATGCTTCGACAACATAGAGCTAAACATGTAACTGAAGGAATATTAACAGAGGAAGATTTAAGAGATATTGAACCACGTCCTGAAGAAAGAAAGCAGGGAGAGAAAATTGTTAGAAAAAGAAGGACAGATATAGTAGGCCTTGAATGTACAGAATGTAACAAACATTATACATCTAGGAAAGGTCTATTACGTCATATACAAGTACACGAAGGTAAGAAATATTTATGTGACATATGTCCAAAGAAATTCTATAGAAGAGAACATTTAAAAATTCATGTAGCTAAGCATAATATGATTAAACCGTATAAATGTACAAGATGCACAAAACGATTTATTAAAGAAGAACAGCTTACGAATCACTTATCGAAACACGATAGGCCATTTAAGAAAAACAAAGAAACTGATAGTTCAAAAAGATTTTTatgtgaaatctgttctaagagtttcacccaatcgactactttaatagcacatttaagagcacacaatggtataaagccatatgtttgtgaagtatgttctagaccttttacaacaaatgcatatctaaaaatgcatatgaggacgcatacacaagaaagaccatatatatgtcagtattgttctagagcatttgcccgagctgatactcttgctaatcacttgacgtcacataccggtgaagctaagtatcattgcaaatattgcccaaaaaatttccgtcgattaaagtcattaaaagaacatgtttttattcatactggtcaaaggccatatgcatgtccaacgtgtGATCGGAGATTTAATAACAATGGTAGCCGTTATGCCCATAGCAAACGATGTAAACAAAACTTTTCGCAAAATCAGAATCGCACTCAAACCCTTACCGAAGTTCAAACGCAACAACCACCACAGAGAATACAACAGACTCTAACTCAAGCACAGGTGGTTAAAGCACCAAACATTAAGACCATTACTATTACTAGACAAGCTGAGCCAGTAACTACACAACAAATAATGCAACATCAAGAAATATTAATGCCACTTATCTTACCACTCACTGTAACTCTCGCAGATGTAGGTGATGAAGTGATATTACCCGAGGGTACAAAAATATTTACAACGTCGTAA
Protein Sequence: MDAVEISTSDPPQSEQEIVSTVEICRICLLGNLVMRDLFLGNEVASLSAKAMSFANVKMLPGDGLPPRVCNECADKLESAYEFKLQVEQADNVLRERFDGIKEELFFNEVEVHLEVDRNEAINDIHLESHYQHAAEVLTEGSENEKSLLKEQLALLQVEKLVEREQLREEENNSQILEQQGIMNNSHNQEKYTNQIDEDACTLVNNAENQEVLKSDGINENCTDAIPAEEHDYIMQQDYVMNEQFSSEESKPSKENTTQCNEPLTESNILEDCKIDTEHMPLTNIDTLVEKDLSLTEIRKSKRKSSRRNFTSDRDSDEENYFENLNLSSRLKRAQADRSEKIYFMCYLCDKQFLSKNVLKEHMHSHEEIRRALSLKKVPEKSSKVSNTSPKMPPSGKRANKCPYCGKEYLYIISFSKHLKQHEKEKENAKEDSMPLEISFHEDEHSLGFDNHSNSQYSDYACRKTARQEEAYNENEEEKDDHETEKQRKKSHLETFECEKCSEKFYTRRSLRKHALSHVNLKCNVCNEKFDEVEQLKNHRAKHVVEGMLMDQDLEEDIEHHIINKDDEEQDIKGDNEDDSEIENNIDDVQDKEKWAETKESKCPHCPSTCSHKKSSRHIETHTSSKYSCKVCCQQFTRKDHLRRHTEQHGRIKTYKCTQCNKTFGNELTLRNHLIATNHKTFVHGQEYDPNKRIKRVAAKAAQKIIDKIKTEDGLEDYDEDDDNNDIIDMDVRHNRKQENSFKKTNNRKELECATCNKKCNSKQTLTKHMEQHVKDEKAEKMDRLDKFKKPAEKKEQQRIGGGMELGKDEDDDDDNSDFESGLDWPMDNHECATCKKRYSTKKSLLRHQLLHEEPNFECDICNVKFYRKDKLKAHYDKCSEKNPDQVRKCNICGDSFENNEMLRQHRAKHVTEGILTEEDLRDIEPRPEERKQGEKIVRKRRTDIVGLECTECNKHYTSRKGLLRHIQVHEGKKYLCDICPKKFYRREHLKIHVAKHNMIKPYKCTRCTKRFIKEEQLTNHLSKHDRPFKKNKETDSSKRFLCEICSKSFTQSTTLIAHLRAHNGIKPYVCEVCSRPFTTNAYLKMHMRTHTQERPYICQYCSRAFARADTLANHLTSHTGEAKYHCKYCPKNFRRLKSLKEHVFIHTGQRPYACPTCDRRFNNNGSRYAHSKRCKQNFSQNQNRTQTLTEVQTQQPPQRIQQTLTQAQVVKAPNIKTITITRQAEPVTTQQIMQHQEILMPLILPLTVTLADVGDEVILPEGTKIFTTS

Similar Transcription Factors

Sequence clustering based on sequence similarity using MMseqs2

100% Identity: iTF_01090138;
90% Identity: iTF_01513621;
80% Identity: -