Basic Information

Insect: Leucophenga maculata
Gene Symbol: -
Assembly: GCA_035044805.1
Location: JAWNNP010001183.1:1280784-1284826[+]

Transcription Factor Domain

TF Family: zf-C2H2
Domain: zf-C2H2 domain
PFAM: PF00096
TF Group: Zinc-Coordinating Group
Description: The C2H2 zinc finger is the classical zinc finger domain. The two conserved cysteines and histidines co-ordinate a zinc ion. The following pattern describes the zinc finger. #-X-C-X(1-5)-C-X3-#-X5-#-X2-H-X(3-6)-[H/C] Where X can be any amino acid, and numbers in brackets indicate the number of residues. The positions marked # are those that are important for the stable fold of the zinc finger. The final position can be either his or cys. The C2H2 zinc finger is composed of two short beta strands followed by an alpha helix. The amino terminal part of the helix binds the major groove in DNA binding zinc fingers. The accepted consensus binding sequence for Sp1 is usually defined by the asymmetric hexanucleotide core GGGCGG but this sequence does not include, among others, the GAG (=CTC) repeat that constitutes a high-affinity site for Sp1 binding to the wt1 promoter [1].
Hmmscan Out: # of c-Evalue i-Evalue score bias hmm coord from hmm coord to ali coord from ali coord to env coord from env coord to acc

1 18 0.062 3.8 8.5 1.8 2 23 340 362 339 362 0.95

2 18 0.014 0.86 10.5 0.0 1 23 369 394 369 394 0.92

3 18 2.5 1.5e+02 3.4 4.3 2 23 405 426 405 426 0.93

4 18 0.67 41 5.2 0.4 3 23 467 488 466 488 0.94

5 18 0.0007 0.043 14.6 0.6 1 20 494 513 494 515 0.93

6 18 0.035 2.2 9.2 2.8 1 23 520 543 520 543 0.96

7 18 0.00046 0.028 15.2 1.0 1 23 547 569 547 569 0.98

8 18 0.17 11 7.0 0.1 1 21 577 597 577 598 0.92

9 18 7.5e-05 0.0046 17.6 1.0 1 22 617 638 617 641 0.91

10 18 0.35 22 6.1 2.0 1 20 646 665 646 667 0.89

11 18 0.0054 0.33 11.8 1.8 1 23 681 706 681 706 0.96

12 18 0.004 0.25 12.2 2.4 1 23 732 755 732 755 0.96

13 18 0.011 0.67 10.9 0.6 2 23 761 783 760 783 0.95

14 18 8.3e-05 0.0051 17.5 0.1 2 23 787 809 786 809 0.96

15 18 0.004 0.25 12.2 4.1 1 23 815 837 815 837 0.96

16 18 0.0043 0.27 12.1 0.1 1 23 841 864 841 864 0.95

17 18 4.8e-06 0.0003 21.4 2.8 1 23 870 892 870 892 0.98

18 18 0.00047 0.029 15.1 0.3 2 23 899 927 898 927 0.85

#	of	c-Evalue	i-Evalue	score	bias	hmm coord from	hmm coord to	ali coord from	ali coord to	env coord from	env coord to	acc
1	18	0.062	3.8	8.5	1.8	2	23	340	362	339	362	0.95
2	18	0.014	0.86	10.5	0.0	1	23	369	394	369	394	0.92
3	18	2.5	1.5e+02	3.4	4.3	2	23	405	426	405	426	0.93
4	18	0.67	41	5.2	0.4	3	23	467	488	466	488	0.94
5	18	0.0007	0.043	14.6	0.6	1	20	494	513	494	515	0.93
6	18	0.035	2.2	9.2	2.8	1	23	520	543	520	543	0.96
7	18	0.00046	0.028	15.2	1.0	1	23	547	569	547	569	0.98
8	18	0.17	11	7.0	0.1	1	21	577	597	577	598	0.92
9	18	7.5e-05	0.0046	17.6	1.0	1	22	617	638	617	641	0.91
10	18	0.35	22	6.1	2.0	1	20	646	665	646	667	0.89
11	18	0.0054	0.33	11.8	1.8	1	23	681	706	681	706	0.96
12	18	0.004	0.25	12.2	2.4	1	23	732	755	732	755	0.96
13	18	0.011	0.67	10.9	0.6	2	23	761	783	760	783	0.95
14	18	8.3e-05	0.0051	17.5	0.1	2	23	787	809	786	809	0.96
15	18	0.004	0.25	12.2	4.1	1	23	815	837	815	837	0.96
16	18	0.0043	0.27	12.1	0.1	1	23	841	864	841	864	0.95
17	18	4.8e-06	0.0003	21.4	2.8	1	23	870	892	870	892	0.98
18	18	0.00047	0.029	15.1	0.3	2	23	899	927	898	927	0.85

Sequence Information

Coding Sequence: ATGTCGGAAACCAATGAACTGGCCGATCCTTTAGCCGAACAAGTCGTTTTACTTACGCTTAATTGTTTACATTGCAAAAATACAATCCAAAGCAATGTTTATCAAGCGATTTTCGATGAACTTGGTATCGAATTGGAATTGTCCAAATTGTTGGAAAAGTATTTTGATCTGaatgtaaaagaaaattcaGACGAGTTGCAGTTGCTCTGTGAAGATTGCCTCAATCGTCTGATAACAGCATATGATATCGATGAgcatgaaaaagaaaaagatgcTGCAGCGCCTGCCCCTTCGTCGGCGGCAAACTCTACACTGATTTTGAGTGCTAAGGACGTGCCTGCTAATGAATCGCTTGATAATGAATCATCTGAGAAATCGTTTGCTAATCAAGTCCTACAAATTGTTGTGCCTTCGCATACTGAAGAATTTGTACTAGACTCAGTTAACGAAGCAACTACACCGAAGTCAAGCATATCGAGTGCAAATTCCAGCGTTGTACTTGTTACTACAAAGTCTAGACGAAAAAGTATTTTAGTCGAACGTGATGACACCTGTACACAAGATGAAATTTCAACGctttttgaagaagaaatagtcGATATCGATGATGTTGTGGAAAGTGGCGCCGATGAGGATCCAAATATCATTGTAAGTGCAACAAGCAACAATGTGGGGGAGCACCAAGACATTACCATTGAAACGCAGATATTATTCGAGCATGAATTTGATTCCTGCAATGGTGCAAAAGATCCAATATACCCACAGCAACTAAGTGCCATTCCATGCAATGAGATAGTTACACCGaccaatgatgatgatgtatcTGATAACGCGGATAACTATTCTGACGAATACGATTCTTTTGAAGTGCAGGATGCCGACAAGGATGTGCCGGAAGAATTGCCATTTTACACACTGTTACCGCTGACGGATGATACGGTATCAACCAATATCGAGATGTTTCTTAATGAATCGATTTCTAGTGACTTTactaaattgaaattcaaatggACAACAGTTTGCAGTTTATGTTCAACGCAGTGCCGTACATTTGAGAATCTATTGGCACACATTTACAAAATGCATAATCTGCCGAACAATTTTTATCCTTGTCCTATAAACGATTGTGGTATAGAGCTGCCGAATGCAAATCAACTGACAAAACATTTGGTTTTGAAACATGCTCCATTGGATAAtttgcaGATATACGGTCGCTGTTTCGAatgcaaatttagtttttcgAATTTTGTAGTCTTTAATAAGCATTCCTGTGCACACAAGATGAAACGACAAAGAAACATGCGTTTGTACTGTAAATTGTGTGACCTCGATTTCGCCTCAATGCGTCGTTATGTGTTTCACACGCAATTTCATTTGGAAAAGCATCGACCGCGAATTTGCCTAATTTGTGGTTATACACATAAAGATATCGAAAATCTCTTCGAGCATGTCAACTACTATCACGAGTCACCGGACATATATGCTTGCAAAATatgCGACCGCAGATTTAAAGATGCGCAAAAGTTGAGCGAACATAGGCATATCGAAAAACCTCAGTTTAGCTGCAAGGCATGCAAAAAGAATTTCGCTACAAATTCTCGTCTAACTTGCCACATTAAAATTGCACATGATTCATTCTACACATGCGAATTATGCAACAAGGATTTTGTCGGCAAATCTGTTTTCCGTAATCATCAGAAATGGCACACGAATCAGGCATCTGAGCTACACTCGTGCAGTAATTGTGGACTTATTAGTGCGAATAGCGATTTGTTATTGgaGCACACTCTATCGGAAACTGGCGACTGCTTTGGCGCCGACATTAAAGAGGAGATTACCAGTTTTGCGTACACTTGTGAATTTTGTTCAAAGGATTTTAAGAGTAAAAGCGATTTGAAGTTACATCGTGCATCTGGTGTACATTCCGATGGACAATACATTTGTGTGCCATGCAATAAAACTTTCTCAACTATAAAACAATATCATAAACACAAAATCCACTTACAGTCGAATTCAAGAAAATCAAACATTTACTATCTTTATATGTGCAACATTGATAATTGTGATGAATGCTATGCCCAATGGAATTCGCTTTATACGCATAAAAAACGAAGTCATGATGCAATCCAGCGGAAAGAAACAGTTTTGAACGAACAGAAGCCGACTCAAACGAGCACTGTGGAAAAAACAGATTTCATATGTCAGTTTTGTAATAAGGAATGTCGAACACAAATGTCACTTTCAGTGCATATTGCACGTCGGCATAATAatgATAATGTTACATGTGAACATTGTAGTGCGAACTTCAAGGAGGACGCTGCGCTCAAGAAGCATATTAATTACATGCATATACCTATTGAATGCCCGATATGCTTTAAAGTAGTAAAAAATCAACGTAATTTTGCTGTGCATCAGCGTGTGGTACATATGTCAGAAAAGCGCTACTTCTGCAAGGTGTGTAAAAAAGGATTCTTTCATAAGAGCGACATGGAGACCCATGAAaagcTACACGAACAGTCCTATTCCTGTGACGATTGCGACTTTGTAACGAATTACGAAAATTCActtgaaatacatataaatgctGTGCACCGCCACGAATTTAAGTTTGAGTGCTCAATATGTCACCGAAAGTTCGCACGCAAATATGCTTTAAATGTACACCTTAAACGTCATTCAACTAAAGAGAAGTTTGTCTGTTCAGAAACACTGAAGGACGGCGGCTGCAACAAAACGTTTGTCAATGAAATGATGCTGAAAAGACACCTAAAGAAGGCACACAATGCATCATTTGAGTTAGAAACCGTTTTTGAATACGAAACAGTCAacgataatgatgatgacaTTGAAGTTAGTGTTCTGGCCCCGCCAGCCAAGCGGCCGCGCGAAAACGGCGACCAAGGACTTCAACTAAATTTATCGGAATCAAACGATAACGTTGAGGTATCTGAAATAATTGATTGCGAATTAGATGATTTGATAGAAATTGATCACCATAAAGTAAATTCAACAAACGTGAATGAGGATGAGATGGAAGATGACGATGAGGAAGagtacgaatttattttaattaacgaTTAG
Protein Sequence: MSETNELADPLAEQVVLLTLNCLHCKNTIQSNVYQAIFDELGIELELSKLLEKYFDLNVKENSDELQLLCEDCLNRLITAYDIDEHEKEKDAAAPAPSSAANSTLILSAKDVPANESLDNESSEKSFANQVLQIVVPSHTEEFVLDSVNEATTPKSSISSANSSVVLVTTKSRRKSILVERDDTCTQDEISTLFEEEIVDIDDVVESGADEDPNIIVSATSNNVGEHQDITIETQILFEHEFDSCNGAKDPIYPQQLSAIPCNEIVTPTNDDDVSDNADNYSDEYDSFEVQDADKDVPEELPFYTLLPLTDDTVSTNIEMFLNESISSDFTKLKFKWTTVCSLCSTQCRTFENLLAHIYKMHNLPNNFYPCPINDCGIELPNANQLTKHLVLKHAPLDNLQIYGRCFECKFSFSNFVVFNKHSCAHKMKRQRNMRLYCKLCDLDFASMRRYVFHTQFHLEKHRPRICLICGYTHKDIENLFEHVNYYHESPDIYACKICDRRFKDAQKLSEHRHIEKPQFSCKACKKNFATNSRLTCHIKIAHDSFYTCELCNKDFVGKSVFRNHQKWHTNQASELHSCSNCGLISANSDLLLEHTLSETGDCFGADIKEEITSFAYTCEFCSKDFKSKSDLKLHRASGVHSDGQYICVPCNKTFSTIKQYHKHKIHLQSNSRKSNIYYLYMCNIDNCDECYAQWNSLYTHKKRSHDAIQRKETVLNEQKPTQTSTVEKTDFICQFCNKECRTQMSLSVHIARRHNNDNVTCEHCSANFKEDAALKKHINYMHIPIECPICFKVVKNQRNFAVHQRVVHMSEKRYFCKVCKKGFFHKSDMETHEKLHEQSYSCDDCDFVTNYENSLEIHINAVHRHEFKFECSICHRKFARKYALNVHLKRHSTKEKFVCSETLKDGGCNKTFVNEMMLKRHLKKAHNASFELETVFEYETVNDNDDDIEVSVLAPPAKRPRENGDQGLQLNLSESNDNVEVSEIIDCELDDLIEIDHHKVNSTNVNEDEMEDDDEEEYEFILIND

Similar Transcription Factors

Sequence clustering based on sequence similarity using MMseqs2

100% Identity: -
90% Identity: -
80% Identity: -