Basic Information

Insect: Leptura quadrifasciata
Gene Symbol: -
Assembly: GCA_963675555.1
Location: OY776680.1:12278689-12283269[+]

Transcription Factor Domain

TF Family: zf-C2H2
Domain: zf-C2H2 domain
PFAM: PF00096
TF Group: Zinc-Coordinating Group
Description: The C2H2 zinc finger is the classical zinc finger domain. The two conserved cysteines and histidines co-ordinate a zinc ion. The following pattern describes the zinc finger. #-X-C-X(1-5)-C-X3-#-X5-#-X2-H-X(3-6)-[H/C] Where X can be any amino acid, and numbers in brackets indicate the number of residues. The positions marked # are those that are important for the stable fold of the zinc finger. The final position can be either his or cys. The C2H2 zinc finger is composed of two short beta strands followed by an alpha helix. The amino terminal part of the helix binds the major groove in DNA binding zinc fingers. The accepted consensus binding sequence for Sp1 is usually defined by the asymmetric hexanucleotide core GGGCGG but this sequence does not include, among others, the GAG (=CTC) repeat that constitutes a high-affinity site for Sp1 binding to the wt1 promoter [1].
Hmmscan Out: # of c-Evalue i-Evalue score bias hmm coord from hmm coord to ali coord from ali coord to env coord from env coord to acc

1 16 0.23 42 7.0 0.2 2 23 316 338 315 338 0.88

2 16 5.5e-05 0.01 18.4 0.1 1 23 397 420 397 420 0.97

3 16 7.1 1.3e+03 2.3 1.7 3 21 428 446 426 447 0.91

4 16 9.2 1.7e+03 1.9 0.6 2 23 519 542 518 542 0.89

5 16 0.00098 0.18 14.4 4.6 1 23 545 568 545 568 0.96

6 16 0.03 5.5 9.8 2.1 2 23 575 597 574 597 0.95

7 16 0.62 1.1e+02 5.6 6.1 1 21 712 732 712 733 0.95

8 16 0.011 2 11.2 1.0 2 23 745 767 744 767 0.92

9 16 0.27 51 6.7 0.9 1 23 770 793 770 793 0.95

10 16 0.031 5.8 9.7 0.3 3 23 800 820 798 820 0.96

11 16 0.11 21 7.9 0.2 1 23 824 847 824 847 0.97

12 16 5.4 1e+03 2.6 0.4 2 23 854 876 853 876 0.89

13 16 0.073 14 8.5 0.5 2 23 885 907 884 907 0.94

14 16 1.9 3.5e+02 4.1 0.4 3 19 914 930 913 931 0.97

15 16 4.6 8.6e+02 2.8 2.6 2 23 1111 1133 1110 1133 0.94

16 16 0.8 1.5e+02 5.2 0.9 1 23 1175 1197 1175 1197 0.95

#	of	c-Evalue	i-Evalue	score	bias	hmm coord from	hmm coord to	ali coord from	ali coord to	env coord from	env coord to	acc
1	16	0.23	42	7.0	0.2	2	23	316	338	315	338	0.88
2	16	5.5e-05	0.01	18.4	0.1	1	23	397	420	397	420	0.97
3	16	7.1	1.3e+03	2.3	1.7	3	21	428	446	426	447	0.91
4	16	9.2	1.7e+03	1.9	0.6	2	23	519	542	518	542	0.89
5	16	0.00098	0.18	14.4	4.6	1	23	545	568	545	568	0.96
6	16	0.03	5.5	9.8	2.1	2	23	575	597	574	597	0.95
7	16	0.62	1.1e+02	5.6	6.1	1	21	712	732	712	733	0.95
8	16	0.011	2	11.2	1.0	2	23	745	767	744	767	0.92
9	16	0.27	51	6.7	0.9	1	23	770	793	770	793	0.95
10	16	0.031	5.8	9.7	0.3	3	23	800	820	798	820	0.96
11	16	0.11	21	7.9	0.2	1	23	824	847	824	847	0.97
12	16	5.4	1e+03	2.6	0.4	2	23	854	876	853	876	0.89
13	16	0.073	14	8.5	0.5	2	23	885	907	884	907	0.94
14	16	1.9	3.5e+02	4.1	0.4	3	19	914	930	913	931	0.97
15	16	4.6	8.6e+02	2.8	2.6	2	23	1111	1133	1110	1133	0.94
16	16	0.8	1.5e+02	5.2	0.9	1	23	1175	1197	1175	1197	0.95

Sequence Information

Coding Sequence: ATGGAGACAAAGTTGTGTAGAATATGTGGGAAGTTGGGACAGAactttgtacatatttttaaaacggAGGGATTAAGAAATCGAATTGAAACATGTTTACCAATAATAGTATCTCCGCATTGTTTACTTCCCGACACAATATGCGGGGAATGCACGGGaaatgtagacaatttttatatttttataaaaaattgtctacAGAGTATTATAATATTGGAAGCACAATATGATATCCAAGAATCTTGCCTCAAATCGAAGCGGAAAAAAGATAAAGGCTGTTATGTCAAcctttcacataaaagtgatAATAAAGGAGTCCAAACTGATGACTATCTTGATGTTTTAACCGGAAAACAGTCAGATTTAGAAGAGTATAGGTTAAACTTCCCTCTAATAACCACATTTTTAAGTACAGCAGATGAATGTAAAAGAAAAACCACTGCTAGTTTAGTTGAGTATGATATTGATTCAGATTCTAATTCAGACGATCATAATGAGGGCAGCAGCAAAGTTATTTTGGGAGAAAAATTGGCTTCATTGAATAAAATCAACAGTTTTGTTGACTCGGTAATATCTGGTAAAAATAATTTCACATCAAGCAAATATTATTTTGACGATCCCGAAAATGATTTGATAACTGAGATAGCACAAAGGAAAAGTCTGAAACGGAAATGTGATTTCATTGAAAATTGTCAAcccaaaatattcaaaatggaTACATCCAGCAGGAGGAAGAGTAAGCAGCCGAAAAAATTAGATACACAGGTAGTAGAGAGGACTGAGGAGGTGACTTTTGACTTTGGCAATTTTGAAAGCATTTATCAAAACGATAATGCCAATAACTGTTCTGTGAATGGAATGGACAAAGCGGATATACCCAGTAATAATGTTGAAAGTCAAAATGTTTCAGCCCAGAGCGAAAAGTTGTTATCGTCTTTACCACAAAGCTGCCTGTTGTGCGACACACATTTCTCTGGACCGGCAGCACTAGCGACGCACGTTTTTGAAACGCACGGTATAGACATGGCTGAAGTTGTCTCGTCCGGATCTGGCGAATCGTTTCCTGAAAAGAGCAAAAAGAAGATACCTAATCTCGTGAAAATTTCAGACCTGAAGAGGAGCGATTCAATCGAGGACAATCAGTTACCCGATCAGCAGCCTGAGGAACCCCCCACACTTTTGCCCAGCTTCGTTTGCCCCAACTGCCCCGCTGTCTTCACCACCAAACCAGATTTGATGATGCACTTGCGTCTGAAGCATACCCAACAGGCGGCACACCTCTGTGGACTCTGCTTACAGCAGTGCAATACGTACATGAACTTAAAAAGCCACTTGCAAGTCTGCTCTCAACAACACCAAATCAGCACTAGATACATCTGCCAGGTATGCCAGTATGGCGATGACAGCTTTAAGTGGCTGGAAAACCACGTCCTAGTGCACGATTTCTTGCTCGAGGCTTGTAAGAAACAATCAAAGATGTTCGACCCTGCCGACTACATCGATACAAAtgagaattttgaaaatggacCCCTCTCGCCTGGTTCCAAAAATTTAAGTTGCGCCGAATGCGGTATGAACGAATTCGAGTCATTTAAAGACTTCAGCACTCACAGGAGGAGCCAACACTCTATTTTCCACTGCGACCTGTGCAACAAATTTTACGGACGCAATTCGCACCTCTGGAAACACGTCAACAGGCTTCACAAAGGCCACCCCAGTATCACTTGTCAGCTTTGTTATAAGACTTCCGCATCAAAGTACCATCTGGCCCAGCACTTCAACAAGATCCATTTAACTAAAACGCCGAAGCCCAAATTGGATTGCATTCCCACATCAAAAGAGGAGTTTATGGCTCAGAAGTTCCAGGCATTCGATTTCCAATCCGTCAAGCAGAGCTTCATGAGGCAGGAAATGGTGGAACAGGAGCGTAAAAACAGCATAAGTGAGGTGGAGGACAACTCGAACAATCGTTTGTCTGACCAAGAGGAAGAGATTATTCCGGAGAAGGATATAAAGGAGGAACCTCCGACCGTCAAAGAAGAAATAGTCGCTGCGCCAAAAGAAATTGATTCGTCACACAACCTCTACACTAACATCATAACAAATTACACGCCTCCCATCAACGAGGGCGAGTTCAAGTGCCCTAAATGTTGCAAAGCGTTCCACAAGAAGGTGCTGCTcaaaaaacacaagaaaaactGCAGGCCCAAGCTGCAGAAGGACCTGCTAACGCGGTGCAAAACCTGCGCAAGGATATTTAAGGACCGCCAGAGCCTCGCCAAGCACTTGGTGAACTACCATTCCGAGTACGTCTGCGAGATCTGCAACGAGAAGGTTCAAAGCAAGTGCGAGATCGTGTCTCACATCAGATTCCAGCATCCCGGCTGTCACCTGTTTTGCAAAGTCTGTAGCAATATACTGCGCAGTCAAGACGATCTCCAGGAACATTTACGCGACCATCTAGAGTCGTACGTTTGCCAGTTCTGTGGAGATTCTCTGCCGAGCAAAATTAAGCTGAAAATGCACATCCTCAGTCTGCACCGCAAGATTTTAAGCCTCTCCTGCGGGATATGCTTGAAGCTGTTCGAAACGCAACACATACTCAGAGACCACGTTACCTTAATTCACAAAGACCAGCTTGCCCCCCTCACGTCTTGCCCCGTCTGCGGCAAGAACTACGGGTCCAAGTGGAAAACCTACGACCACCTGAACAAGTCGCACGGTAGGATCTTCAAGGCTTGTAAGACCTGCCTTGAGGTTTTTGACAATGATGCCCAGTTGCAAGCCCATTGCGACGTGACCTCGCACGGCGGTCAAGGCGGCAACGTAACCGCAAACGCCATTAGGAACAGTATTATGGCACACATTACTTCGGCGATTAATAACGTTGCGACGAATAACGATATAGTGAACATGAATAATGATGACGAAAGCGACAGCGGCGAGGAAAACGACGACAACAGCGAGCAGAGTAACGACGAATACGAAAACGATATCGAGGAACAGAAGAGTTACTTGCCGCCAGCTCCTGTTCTACTACACGAGTCTAGAATTTCTCTGTTAGAAAAGAGATTGCTGGGAAAGAGAATGAGCGAGCAGGAAACGAACCTGACGAAAACCAGGACACATAGTGTGAGTAATAAGAGACCTAGCGCAAACGAGGCCAAATTTAGGCAGGCCGgcgaaattaaaaaagaaaaaattcctGTCGAAATACCCTCCACGGTGAATATTAAAAAAGAGGAGGAAATGGAACCGACAAATTCACCCTCCAACCCGCAGATGAACTCGTCAAAGCGTACGGTCTACGTGAACAGCAACGACCCGTCGTACTGTGAAATATGTTACAAGACATGGCCAGCCAAGAAGCACTTGTGGCAGCATTACATTCGTTGCCATAAGAGCGTGGCGGCGACGGTGTGCGGTATTTGTTTAAAAACCAATGATAGTTACGGCAGCTTGCAGATACATTTGCACGAGAACCACCCAACGCTGTTACACGGCCAGGGCTTCGGGTCCAATTTTATTTGCCGGATTTGCGGACGGTACCACAACGCTAGCTCCAAATTAAGACTGCATATGGTCATCCACGAGAACTTCGATTGGAGTTTAATCGAGAATGTCCCAGCAATGAAGCCTGCGAAGCAAGAAAACGACAAGAAACCTGGAGTAAACGGATTTCGAAATTTTAATATGGAGGAGAACAATGACAATTCGGAAGTCTACGACGAAAACGATATAAATTACGAGAGCCTGATAGAACAAGTCGAGTGCTCGTCGCAGTCTGAAAACGAGGAATCGGAAAACGAACAGTTGCAAACTGAGATTAAGCAGGAGCAGGGGTCCTCAACCGAGGAAGAAGAGGAGGAGGAGAGCGAAGAGTCTGAGAATTCGATGCAAGCGCAAATGTTGAAAAATATGATAAACGAGAAACAAAACTTGTCTGGGTCCAACGGGAATCAGGGAGGATACGTGTCATCGAGCGATGAATCCAGCTCCACTTTCACCGACGAGAATGACGGCAGGACGAAAAGTGAGAGTTCGGAGGAAGAATGTTCTCAGGATTCTAGGTCCTTGTCATCAAACAGCAAATTTCTGGTCCAATCGAACTCCAACTCGGAGGATTCCGTGATGAACGGCAACATTTTTAGTCGTAAACCAGATGAGCTAGATTCGGCGATAAAATCGATAAGCTACCAGAGCATGGAGCCAGTAGATCTCAAAATTGAAGACGATTACTGTGAGTTGCATAATAATTGTCTTAACGAGAATGAAATTGAGTCGGCAGTCGGTAGTATACTCTag
Protein Sequence: METKLCRICGKLGQNFVHIFKTEGLRNRIETCLPIIVSPHCLLPDTICGECTGNVDNFYIFIKNCLQSIIILEAQYDIQESCLKSKRKKDKGCYVNLSHKSDNKGVQTDDYLDVLTGKQSDLEEYRLNFPLITTFLSTADECKRKTTASLVEYDIDSDSNSDDHNEGSSKVILGEKLASLNKINSFVDSVISGKNNFTSSKYYFDDPENDLITEIAQRKSLKRKCDFIENCQPKIFKMDTSSRRKSKQPKKLDTQVVERTEEVTFDFGNFESIYQNDNANNCSVNGMDKADIPSNNVESQNVSAQSEKLLSSLPQSCLLCDTHFSGPAALATHVFETHGIDMAEVVSSGSGESFPEKSKKKIPNLVKISDLKRSDSIEDNQLPDQQPEEPPTLLPSFVCPNCPAVFTTKPDLMMHLRLKHTQQAAHLCGLCLQQCNTYMNLKSHLQVCSQQHQISTRYICQVCQYGDDSFKWLENHVLVHDFLLEACKKQSKMFDPADYIDTNENFENGPLSPGSKNLSCAECGMNEFESFKDFSTHRRSQHSIFHCDLCNKFYGRNSHLWKHVNRLHKGHPSITCQLCYKTSASKYHLAQHFNKIHLTKTPKPKLDCIPTSKEEFMAQKFQAFDFQSVKQSFMRQEMVEQERKNSISEVEDNSNNRLSDQEEEIIPEKDIKEEPPTVKEEIVAAPKEIDSSHNLYTNIITNYTPPINEGEFKCPKCCKAFHKKVLLKKHKKNCRPKLQKDLLTRCKTCARIFKDRQSLAKHLVNYHSEYVCEICNEKVQSKCEIVSHIRFQHPGCHLFCKVCSNILRSQDDLQEHLRDHLESYVCQFCGDSLPSKIKLKMHILSLHRKILSLSCGICLKLFETQHILRDHVTLIHKDQLAPLTSCPVCGKNYGSKWKTYDHLNKSHGRIFKACKTCLEVFDNDAQLQAHCDVTSHGGQGGNVTANAIRNSIMAHITSAINNVATNNDIVNMNNDDESDSGEENDDNSEQSNDEYENDIEEQKSYLPPAPVLLHESRISLLEKRLLGKRMSEQETNLTKTRTHSVSNKRPSANEAKFRQAGEIKKEKIPVEIPSTVNIKKEEEMEPTNSPSNPQMNSSKRTVYVNSNDPSYCEICYKTWPAKKHLWQHYIRCHKSVAATVCGICLKTNDSYGSLQIHLHENHPTLLHGQGFGSNFICRICGRYHNASSKLRLHMVIHENFDWSLIENVPAMKPAKQENDKKPGVNGFRNFNMEENNDNSEVYDENDINYESLIEQVECSSQSENEESENEQLQTEIKQEQGSSTEEEEEEESEESENSMQAQMLKNMINEKQNLSGSNGNQGGYVSSSDESSSTFTDENDGRTKSESSEEECSQDSRSLSSNSKFLVQSNSNSEDSVMNGNIFSRKPDELDSAIKSISYQSMEPVDLKIEDDYCELHNNCLNENEIESAVGSIL

Similar Transcription Factors

Sequence clustering based on sequence similarity using MMseqs2

100% Identity: iTF_01370418; iTF_01290924;
90% Identity: iTF_01370418;
80% Identity: -