Basic Information

Insect: Lamprigera yunnana
Gene Symbol: gw_1
Assembly: GCA_013368075.1
Location: JABVZV010001223.1:8319880-8360297[-]

Transcription Factor Domain

TF Family: zf-C2H2
Domain: zf-C2H2 domain
PFAM: PF00096
TF Group: Zinc-Coordinating Group
Description: The C2H2 zinc finger is the classical zinc finger domain. The two conserved cysteines and histidines co-ordinate a zinc ion. The following pattern describes the zinc finger. #-X-C-X(1-5)-C-X3-#-X5-#-X2-H-X(3-6)-[H/C] Where X can be any amino acid, and numbers in brackets indicate the number of residues. The positions marked # are those that are important for the stable fold of the zinc finger. The final position can be either his or cys. The C2H2 zinc finger is composed of two short beta strands followed by an alpha helix. The amino terminal part of the helix binds the major groove in DNA binding zinc fingers. The accepted consensus binding sequence for Sp1 is usually defined by the asymmetric hexanucleotide core GGGCGG but this sequence does not include, among others, the GAG (=CTC) repeat that constitutes a high-affinity site for Sp1 binding to the wt1 promoter [1].
Hmmscan Out: # of c-Evalue i-Evalue score bias hmm coord from hmm coord to ali coord from ali coord to env coord from env coord to acc

1 19 0.02 0.28 11.9 1.0 1 20 1360 1379 1360 1380 0.98

2 19 0.075 1.1 10.0 1.5 1 23 1383 1405 1383 1405 0.98

3 19 0.27 3.8 8.3 1.8 2 23 1602 1623 1601 1623 0.97

4 19 0.0057 0.08 13.5 1.4 1 23 1628 1650 1628 1650 0.98

5 19 0.023 0.32 11.7 1.3 1 23 1655 1677 1655 1677 0.99

6 19 0.84 12 6.7 1.6 2 23 1683 1704 1682 1704 0.97

7 19 0.35 4.9 7.9 2.5 1 23 1709 1731 1709 1731 0.98

8 19 0.013 0.18 12.5 2.6 1 23 1763 1785 1763 1785 0.97

9 19 0.011 0.16 12.6 1.2 1 23 1790 1812 1790 1812 0.99

10 19 0.91 13 6.6 5.0 1 23 1817 1839 1817 1839 0.97

11 19 0.018 0.25 12.0 3.1 1 23 1871 1893 1871 1893 0.98

12 19 0.0072 0.1 13.2 1.5 1 23 1898 1920 1898 1920 0.99

13 19 0.19 2.8 8.7 3.8 1 23 1925 1947 1925 1947 0.98

14 19 0.5 7 7.4 4.5 1 23 1952 1974 1952 1974 0.98

15 19 0.085 1.2 9.8 3.8 1 23 1979 2001 1979 2001 0.97

16 19 0.062 0.88 10.3 2.2 1 23 2025 2047 2025 2047 0.97

17 19 0.02 0.29 11.8 1.3 1 23 2052 2074 2052 2074 0.99

18 19 0.44 6.2 7.6 1.8 2 23 2080 2101 2080 2101 0.98

19 19 0.00064 0.0091 16.5 2.3 1 23 2106 2128 2106 2128 0.99

#	of	c-Evalue	i-Evalue	score	bias	hmm coord from	hmm coord to	ali coord from	ali coord to	env coord from	env coord to	acc
1	19	0.02	0.28	11.9	1.0	1	20	1360	1379	1360	1380	0.98
2	19	0.075	1.1	10.0	1.5	1	23	1383	1405	1383	1405	0.98
3	19	0.27	3.8	8.3	1.8	2	23	1602	1623	1601	1623	0.97
4	19	0.0057	0.08	13.5	1.4	1	23	1628	1650	1628	1650	0.98
5	19	0.023	0.32	11.7	1.3	1	23	1655	1677	1655	1677	0.99
6	19	0.84	12	6.7	1.6	2	23	1683	1704	1682	1704	0.97
7	19	0.35	4.9	7.9	2.5	1	23	1709	1731	1709	1731	0.98
8	19	0.013	0.18	12.5	2.6	1	23	1763	1785	1763	1785	0.97
9	19	0.011	0.16	12.6	1.2	1	23	1790	1812	1790	1812	0.99
10	19	0.91	13	6.6	5.0	1	23	1817	1839	1817	1839	0.97
11	19	0.018	0.25	12.0	3.1	1	23	1871	1893	1871	1893	0.98
12	19	0.0072	0.1	13.2	1.5	1	23	1898	1920	1898	1920	0.99
13	19	0.19	2.8	8.7	3.8	1	23	1925	1947	1925	1947	0.98
14	19	0.5	7	7.4	4.5	1	23	1952	1974	1952	1974	0.98
15	19	0.085	1.2	9.8	3.8	1	23	1979	2001	1979	2001	0.97
16	19	0.062	0.88	10.3	2.2	1	23	2025	2047	2025	2047	0.97
17	19	0.02	0.29	11.8	1.3	1	23	2052	2074	2052	2074	0.99
18	19	0.44	6.2	7.6	1.8	2	23	2080	2101	2080	2101	0.98
19	19	0.00064	0.0091	16.5	2.3	1	23	2106	2128	2106	2128	0.99

Sequence Information

Coding Sequence: ATGCGCGACCCCACTCCCTCCGAGCCGAAATTTACATTTCCTACCTATCAAGTGCCTCAAGCGTCAGCCATGAGGGGCCGCGCACCCCCAGTACAAGTCGCTAGGGCAGCTGGGGAGGATAGAGCCTACCTCCCAAGCCAACCCTGCGCCTCACCAGGCGTTTATTCTGTGATAATTGGCTCAAGTTGTCCACTTGCTGGCAACTCTAATCTTAGGATGCAATCTGTGACCGAAAATTGTCTTCTGAACTCTGTTACCGTACCAAAAATACAACGTAACGACCACACGACGGTCGCACACAATAATAGCGATAAGTTAGAATGTAAGTTTGGTGCTCTACACTTATTTGGACAAGACATTCCCAACCAAAAGTCTGATAACCTCGAAGGTGACCTCATTAAACTGAACCTCACAAAAATTAAGTCTAGTTCTACTCATTGCAATTCGAACATTACGGATGACAACTATAGTCTTGACAGGCTCGTTAAATTAAGTCAGCGCACACGAGAGCTTGAAAGATTAGGTTTTTCACTGCCTTTACGTCTAAGAGGAGGGGGTGAGAGCTCTCTTAGCACCGGTACCTCTGGTTGGGGCAGTCCTCCTTCGCAACAGGCCAGTAATAATAATGCAAATAATACAACTGGATGGGGCTCCGCAAATACTACCAACTCAAATAGTACCGGCACTCTACAATGGGGCAATAGTAATCGCACCCCAACATCAGGACCTGGATCACAACCTTCAGATGTGTGTATTTTAGGAAGTAAGTCTATaccaaatatgcaacaaaacgGGCAACAACCACCGACGTCACAACCGAATAATGCTGGATGGGGACAACCTGGAAGCAAACCCTCTGGTACGGCAGTTAGCAATACAAATAATACTACAGGTACATCTCAATCAAGTGGTGCGAATTCTACTATAGCTACAAATTCAACCAAACAACAGCTTGAGCAGTTAAACAATATGAGGGAAGCTATTTTTAGTCATGATGGATGGGGCGGCcatATTAATCAAGACACAAACTGGGATATTCCTGGTAGTCCTGAACCACTGCTTAAGGTAGATGGAACTACAGCACCACCATGGAAACCAAATGTCAACAATGGAACTGAATTGTGGGAAGCCAATTTACGTAATGGTGGACAGCCACCCCCGCAGCCTCAACAAAAACCATGGGGGCATACTCCTGCTACAAACATCGGAGGCACTTGGGGTGAAGATGATGATGTTGCCGATAGTTCAAATGTATGGACTGGGGTACCTGCTACACAACAACAGTGGGGTAACAATGCCGGTACAGGAGCTGGTGCTGGAACTGGAGCTGGAGGAACAATGTGGGgagcTCCAAAAAAAGAAACCGAATGGGCTGCTGCTAGTGCAACTGGTTGGGGTGATCCACGTTCTGGAGATCCTCGTGCTGGAAGCATGGATCCAAGAGAAATGAGACCAGATTTAAGGGACATGCGAACTAACACTTCTGATCCAATGCGAATGTTGGATCCACGAGAACAAATGCGTTTGACTGGCGGTGACATGCGAGGTGATCCTAGAGGCATAACAGGACGTCTAAATGGTGTTGGGGCAGAAACATTTTGGGCTCAACCGACTCCTCCAACCTCATCTCATCATATGCATCATCAACCAAAAATTCCTATGGGACCTGGAGGCAATACTGCTGGGTGGGAAGAACCTTCACCTCCAACACAAAGACGCACAATGCCCAATTATGATGATGGAACATCTTTGTGGGGAAATCCCCAGCAAGgcTCACATTGGAAAGATCTTCCCACTGCTGCAAACATGGCAAGAAGTGGAGCAGGTGGACCACCAGGAATGCAACAGGCCCGTTTAAAACCAGATGGTGCTGTTTGGAGTCATGGACGCAATGGGTCTTGGGATGAAACCGGACCTGCATGGGATGATGGATCTGTACCATGGGGTAAACAGAAACCTATGGTTGCTCCATTAtgggaaaatgaaattgattggAATCATAAACCAGGACCAAAGCCTCCACTTACGAAAGAAATGGTTTGGAATTCTAAACAATTTCGTGTACTCGTTGACATGGgatataaaAAAGAAGATGTTGAAAATGCGTTAAGGTTGAGGGAGATGAACATGGAAGATGCGTTAGATATGCTAAGTGCTGTACGTGGTCCTAGTATTGATAGTTGGCGAACCCGCCATGAAGATCACTATGATCATCAAGGATCTGGTCAATTTCCTGGTCGTTTTCCTACAGGTCCATCTGGCCAGATGCCTTTTCCTCCTGGAAACAATGGaccaaatttgttaaataatatgGGTAGTGCCTCAACTggtacaaataattgcttaattAATAATATGCAAAAAATGTTAGCTCAAACTGGAGGATCTCAAGGTTTTGCTAGCACATCAGGTCGCCCTGTTGCACCTCAAACAACACCATCTTCTCAACAATTAAGAATGCTCGTTCAGCAAATACAAATGGCTGTACAGGCTGGTTACTTGAATCATCAGATATTAAATCAACCACTTGCTCCACAAACATTGGTTCTTCTTAACCAGCTAttgcaacaaattaaaaacttgcAGCAGCTACTAAATCAACAGTCAGTAGCTCAAACTCAAACTCTGGGcggaaaacaaaacaatatattaCTTCAGTGTTCAGTGCTCATTACCAAAACAAAGCAACAAATTACTAATTTACAGaATCAAATAGCAGCTCAACAGGCAATTTATGTAAAACAACAGCAGCATTTAGCAGCAAATTTGGCTGGTCAATCTGACATTTTTAAGACAAACGCTATGCACGATTCAATCAATGCTTTGCAAGGCAACTTTGTTGATTTGAGTATCAAGGATTCTTctcaaattAGCCAGCAACAGTCTAGGTTAAATCAATGGAAATTACCTGCTTTAGATAAAGAAGAAGTTGGAGATTTTAGCAGAGCACCTGGATCAATATCAAAACCTTTAGCACCTACAAATAATTCGCCAAATTTGAATCCTTTAGGTCTTACTCAACCAGATGGccCTTGGTCAAGTGGCCGTTCCACAGATACTGGAGGTTGGCCTGATACTGGCACAAATGACACTGGCGTTCCAGATAATAAAGATGGACAATGGTCAACTCCTACTCAACCATCACTTACTGATTTAGTACCTGAATTTGAACCGGGAAAACCTTGGAAAGGTAACCAAATGAAATCTATTGAAGATGATCCTAGTATTACTCCTGGTTCAGTAGTTCGTTCTCCTCTCTCTATTGCCACTATTAAAGATACTGAATTGTTTACAATGAATTCGAGCAAGAATTCCCCGCCTGGTGGAGATACTATACAGCCTCTTAGTCTTAGCTCATCAACTTGGAGTTTTAATCCACCAGCAACTACTCCCAGTGCGTTTACTAGTCCTCAGAATAAGATACCTAATAACAAAGGAACTTTAGGTGAtcttaacacatcaactgcagTTACTTCTGAATTGTGGGGTGCACCTAAATCACGTGGACCACCTCCAGGTCTCGCAACTAAGGGTACATCATCACTTAATGGATGGACTATCAATTTAGGCTCCTCATCATGGGGTGTGCCACGTGGTTCTGGAAATTGGGGATCTTCACCCTGGTTGCTACTTCGAAATTTGACAGCGCAGATTGATGGATCAACACTTCGCACATTGTGTATGCAACATGGTCCACTTCAGTGTTTCCATTTGTACTTGCATCAAGGATTTGCTCTTGCAAAATATTCAACACGTGAAGAAGCTACAAAGgcACAAACCGCTTTAAATAATTGCGTTTTGGGTAATACAACTATCTTAGCAGAAAATCCATCTGATTGGGATGCTCATACTTTGTTACAACAAGTTGCTTCCCAAGGTGGTTCCTCTGGAGGTTGGCGAAACAGTTCAAAGCAGCAAAGTACAGGCGCTGACACTTGGAGTACTGGTTGGCCAAATAACCCATCAACAGCCAGTTTGTGGGGTTCGGGTGCATTAGACACGTCTGATCAGTCAAGAGCAACACCGTCAAGTCTAAATTCATTCCTTCCAGGGGACCTGTTGGGTAGCGgtgatgaatataaatgtaaggaatgcgagtataaaacagtgcagaaaTATAAGCTAAAACTTCATATGggtgaagaatataaatgtaaggaatgcaattataaaacagtgtggaaatatGATTTACAAGGTCATATGAAAAATCATatgggtgatgaatataaatgtgagGAGATGAAAACGGGTAAAccaacaattgtaaaaataaattttaggttATTCATGGATGTGGATATGAAAGAAAGCTGCTCGATTAAATCAGAAGTTTTTGAGGAAACTTTTTCCTTTAGTGAAAAATATGAGGAGTATGACAATAAGGAATTGAAAACTGAGCCTGTAGGTACGGAAGAATCATTTAAATGTCGGGACGAAGATGCCCCTGCAGAGCATATCAATGTATCTCCTGTTGCCGTACCACAATATGCTGGTAATGAAAGTAATGTCCAGATGACGAAGAAAGACTTCTTGGtggaacatttaaaaagttctaaaaatattaaatgtttttataaggGATATAACTTTAAAACCTCACAATATTTGAAGATTCATAACAATCTAGGTGATAGATGTATTGGTACagattgtaatttaaatacatcGTGGATTTTACCGTCAGTATCACAGTTGAAAACTTCAGGAAGTAGTGATGAAAATCTTTATGATACGTGTAATAACATTGGGTGCGAACCTTATctaaagaaatctacaaaaattccTAAATATAATCACTCTAAGTGTAACgactgtgattataaaacacaatggaaaaagAATCTAAAAAGACACGCGAAAATTCATAttggtgaaaaatataaatgcagCGAATGCGGGTATAAAACATTACGAAAATACGATCTAAGAGCTCATACcaaaattcacacaggcgatgaatataaatgtaaggagtGTGAGTATAAAACACcgtggaaacagaatctaaaaaCTCATATGCAAATTCATATGGGtaatgaaatgaaatgtacggaatgtgagtataaaacagtgtggaggCATCTATTAAAAgttcatatgaaaattcatatgggggatgaatataaatgtaatgaatgcgaatataaaacagtgtggaaatgtGATCTAAAAGTTCATATGAAACTTCATATGcgtgaaaaatataaatgtaaggaagatTTGTATAAAACAGTGGGCAAACGTAATCTAAATGATCATATGAAAATTGATACTCAGGAAAAATATgattgtaaagaatgtgactataaaacattaCGAAAACATGATCTAAAAgctcatatgaaaattcatacaggcgatgaatataaatgtacggtatgtgagtataaaacagcgtggaaacaaaatctaaaaactcATATGCGAATTCATATGGGCGATGaacataaatgtaaacaatgtgaatataaaactttacaaaaacatGATTTAGAAGCTCACATGAAACTTCATACGGATAAAAAAGATGAATGTAAGGACGATTCGTATAAAACAGTGTGCACACATTATGTAAAGgctcatatgaaaattcatactcgAGAAAAATATGAATGTAAAGAATGTCAGTATAAAACATTAAGAAAACATGATCTAAAAgctcatatgaaaattcatacaggcgatgaatataaatgtaaggaatgtgaatataaaacagcatggaaacagaatttaaaaactCATATGCGAATTCATATGGGTGAAGAACATAAATGtacggaatgtgattataaaacagtgtggaagcATCTTTTAAAAGTTCATATGAAAGTTCATATGggagatgaatataaatgttatgaatgtgattataaaacagtttggaaatATCATCTAAAAACTCATTTGAAAAATCATatgggtgatgaatataaatgtaaagaatgtgagtataaaacaCTACAAAAACATGATCTAAAAGTTCATATGAAACttcatacaggtgaaaaatataaatttaaggaaGGTACGTATAAAACAGTGAGCAAACGTAATACCAGTGAAAAATatgaatgtaaagaatgtgcGTATAAAACATTACGAAAACATGATTTAAAAgctcatatgaaaattcatacaggcgatgaatataaatgtaaggaatgtgagtataaaacggcatggaaacagaatttaaaaactCATATGCAAATTCATATGGGTGAAGAACGTAAATGTACAGAATGCgagtataaaacagtgtggaagcATCTTTTAAAAGCTCATATGAAAGTTCATACAGgggatgaatataaatgtaatgaatgcgagtataaaacagtgcagaaaaGTCGTTTAAAAacgcatatgaaaattcataaaattgtgaTTAAAACGCTGAATATGGAAGAAAGTAATTCTAATGCATATtatagataa
Protein Sequence: MRDPTPSEPKFTFPTYQVPQASAMRGRAPPVQVARAAGEDRAYLPSQPCASPGVYSVIIGSSCPLAGNSNLRMQSVTENCLLNSVTVPKIQRNDHTTVAHNNSDKLECKFGALHLFGQDIPNQKSDNLEGDLIKLNLTKIKSSSTHCNSNITDDNYSLDRLVKLSQRTRELERLGFSLPLRLRGGGESSLSTGTSGWGSPPSQQASNNNANNTTGWGSANTTNSNSTGTLQWGNSNRTPTSGPGSQPSDVCILGSKSIPNMQQNGQQPPTSQPNNAGWGQPGSKPSGTAVSNTNNTTGTSQSSGANSTIATNSTKQQLEQLNNMREAIFSHDGWGGHINQDTNWDIPGSPEPLLKVDGTTAPPWKPNVNNGTELWEANLRNGGQPPPQPQQKPWGHTPATNIGGTWGEDDDVADSSNVWTGVPATQQQWGNNAGTGAGAGTGAGGTMWGAPKKETEWAAASATGWGDPRSGDPRAGSMDPREMRPDLRDMRTNTSDPMRMLDPREQMRLTGGDMRGDPRGITGRLNGVGAETFWAQPTPPTSSHHMHHQPKIPMGPGGNTAGWEEPSPPTQRRTMPNYDDGTSLWGNPQQGSHWKDLPTAANMARSGAGGPPGMQQARLKPDGAVWSHGRNGSWDETGPAWDDGSVPWGKQKPMVAPLWENEIDWNHKPGPKPPLTKEMVWNSKQFRVLVDMGYKKEDVENALRLREMNMEDALDMLSAVRGPSIDSWRTRHEDHYDHQGSGQFPGRFPTGPSGQMPFPPGNNGPNLLNNMGSASTGTNNCLINNMQKMLAQTGGSQGFASTSGRPVAPQTTPSSQQLRMLVQQIQMAVQAGYLNHQILNQPLAPQTLVLLNQLLQQIKNLQQLLNQQSVAQTQTLGGKQNNILLQCSVLITKTKQQITNLQNQIAAQQAIYVKQQQHLAANLAGQSDIFKTNAMHDSINALQGNFVDLSIKDSSQISQQQSRLNQWKLPALDKEEVGDFSRAPGSISKPLAPTNNSPNLNPLGLTQPDGPWSSGRSTDTGGWPDTGTNDTGVPDNKDGQWSTPTQPSLTDLVPEFEPGKPWKGNQMKSIEDDPSITPGSVVRSPLSIATIKDTELFTMNSSKNSPPGGDTIQPLSLSSSTWSFNPPATTPSAFTSPQNKIPNNKGTLGDLNTSTAVTSELWGAPKSRGPPPGLATKGTSSLNGWTINLGSSSWGVPRGSGNWGSSPWLLLRNLTAQIDGSTLRTLCMQHGPLQCFHLYLHQGFALAKYSTREEATKAQTALNNCVLGNTTILAENPSDWDAHTLLQQVASQGGSSGGWRNSSKQQSTGADTWSTGWPNNPSTASLWGSGALDTSDQSRATPSSLNSFLPGDLLGSGDEYKCKECEYKTVQKYKLKLHMGEEYKCKECNYKTVWKYDLQGHMKNHMGDEYKCEEMKTGKPTIVKINFRLFMDVDMKESCSIKSEVFEETFSFSEKYEEYDNKELKTEPVGTEESFKCRDEDAPAEHINVSPVAVPQYAGNESNVQMTKKDFLVEHLKSSKNIKCFYKGYNFKTSQYLKIHNNLGDRCIGTDCNLNTSWILPSVSQLKTSGSSDENLYDTCNNIGCEPYLKKSTKIPKYNHSKCNDCDYKTQWKKNLKRHAKIHIGEKYKCSECGYKTLRKYDLRAHTKIHTGDEYKCKECEYKTPWKQNLKTHMQIHMGNEMKCTECEYKTVWRHLLKVHMKIHMGDEYKCNECEYKTVWKCDLKVHMKLHMREKYKCKEDLYKTVGKRNLNDHMKIDTQEKYDCKECDYKTLRKHDLKAHMKIHTGDEYKCTVCEYKTAWKQNLKTHMRIHMGDEHKCKQCEYKTLQKHDLEAHMKLHTDKKDECKDDSYKTVCTHYVKAHMKIHTREKYECKECQYKTLRKHDLKAHMKIHTGDEYKCKECEYKTAWKQNLKTHMRIHMGEEHKCTECDYKTVWKHLLKVHMKVHMGDEYKCYECDYKTVWKYHLKTHLKNHMGDEYKCKECEYKTLQKHDLKVHMKLHTGEKYKFKEGTYKTVSKRNTSEKYECKECAYKTLRKHDLKAHMKIHTGDEYKCKECEYKTAWKQNLKTHMQIHMGEERKCTECEYKTVWKHLLKAHMKVHTGDEYKCNECEYKTVQKSRLKTHMKIHKIVIKTLNMEESNSNAYYR

Similar Transcription Factors

Sequence clustering based on sequence similarity using MMseqs2

100% Identity: -
90% Identity: -
80% Identity: -