Basic Information

Insect: Leptopterna dolabrata
Gene Symbol: -
Assembly: GCA_954871275.1
Location: OX940986.1:9876419-9902723[+]

Transcription Factor Domain

TF Family: zf-C2H2
Domain: zf-C2H2 domain
PFAM: PF00096
TF Group: Zinc-Coordinating Group
Description: The C2H2 zinc finger is the classical zinc finger domain. The two conserved cysteines and histidines co-ordinate a zinc ion. The following pattern describes the zinc finger. #-X-C-X(1-5)-C-X3-#-X5-#-X2-H-X(3-6)-[H/C] Where X can be any amino acid, and numbers in brackets indicate the number of residues. The positions marked # are those that are important for the stable fold of the zinc finger. The final position can be either his or cys. The C2H2 zinc finger is composed of two short beta strands followed by an alpha helix. The amino terminal part of the helix binds the major groove in DNA binding zinc fingers. The accepted consensus binding sequence for Sp1 is usually defined by the asymmetric hexanucleotide core GGGCGG but this sequence does not include, among others, the GAG (=CTC) repeat that constitutes a high-affinity site for Sp1 binding to the wt1 promoter [1].
Hmmscan Out: # of c-Evalue i-Evalue score bias hmm coord from hmm coord to ali coord from ali coord to env coord from env coord to acc

1 29 0.00012 0.04 16.5 1.2 1 23 249 271 249 271 0.96

2 29 2.8e-05 0.0088 18.5 1.2 1 23 284 306 284 306 0.98

3 29 0.00035 0.11 15.0 1.4 1 23 328 351 328 351 0.97

4 29 0.018 5.7 9.7 0.3 2 23 358 380 357 380 0.96

5 29 0.84 2.7e+02 4.4 0.1 1 23 455 478 455 478 0.93

6 29 0.00087 0.28 13.8 1.3 1 23 509 532 509 532 0.95

7 29 0.16 50 6.7 0.7 3 23 540 561 539 561 0.96

8 29 5.6 1.8e+03 1.8 1.5 1 23 571 593 571 593 0.96

9 29 0.00086 0.27 13.8 1.0 2 23 633 655 632 655 0.96

10 29 7.9 2.5e+03 1.3 0.5 3 23 702 724 700 725 0.87

11 29 0.0045 1.4 11.6 0.1 2 23 734 756 734 756 0.95

12 29 0.0074 2.3 10.9 0.4 1 23 762 785 762 785 0.95

13 29 0.0017 0.54 12.9 2.5 1 23 793 815 793 815 0.97

14 29 0.0015 0.47 13.1 0.6 2 23 881 903 880 903 0.95

15 29 0.00028 0.089 15.4 1.7 2 23 910 931 909 932 0.94

16 29 0.0091 2.9 10.6 3.2 1 21 950 970 950 971 0.95

17 29 1.6e-05 0.0051 19.3 0.5 1 23 990 1013 990 1013 0.97

18 29 0.0069 2.2 11.0 0.4 1 23 1016 1039 1016 1039 0.91

19 29 0.95 3e+02 4.2 0.6 2 23 1046 1069 1045 1069 0.91

20 29 0.3 96 5.8 1.0 1 23 1076 1099 1076 1099 0.94

21 29 0.0056 1.8 11.3 1.3 2 23 1137 1158 1137 1158 0.97

22 29 0.01 3.3 10.4 2.1 1 19 1163 1181 1163 1185 0.92

23 29 0.28 90 5.9 0.3 2 23 1313 1335 1312 1335 0.94

24 29 0.32 1e+02 5.7 4.0 3 23 1343 1363 1341 1364 0.92

25 29 4.5 1.4e+03 2.1 1.6 2 23 1376 1397 1375 1397 0.89

26 29 2 6.4e+02 3.2 0.6 1 23 1409 1432 1409 1432 0.95

27 29 0.00028 0.087 15.4 0.1 2 23 1465 1486 1464 1486 0.97

28 29 0.00062 0.2 14.3 0.4 1 23 1492 1515 1492 1515 0.95

29 29 0.0063 2 11.1 0.5 1 21 1520 1540 1520 1541 0.95

#	of	c-Evalue	i-Evalue	score	bias	hmm coord from	hmm coord to	ali coord from	ali coord to	env coord from	env coord to	acc
1	29	0.00012	0.04	16.5	1.2	1	23	249	271	249	271	0.96
2	29	2.8e-05	0.0088	18.5	1.2	1	23	284	306	284	306	0.98
3	29	0.00035	0.11	15.0	1.4	1	23	328	351	328	351	0.97
4	29	0.018	5.7	9.7	0.3	2	23	358	380	357	380	0.96
5	29	0.84	2.7e+02	4.4	0.1	1	23	455	478	455	478	0.93
6	29	0.00087	0.28	13.8	1.3	1	23	509	532	509	532	0.95
7	29	0.16	50	6.7	0.7	3	23	540	561	539	561	0.96
8	29	5.6	1.8e+03	1.8	1.5	1	23	571	593	571	593	0.96
9	29	0.00086	0.27	13.8	1.0	2	23	633	655	632	655	0.96
10	29	7.9	2.5e+03	1.3	0.5	3	23	702	724	700	725	0.87
11	29	0.0045	1.4	11.6	0.1	2	23	734	756	734	756	0.95
12	29	0.0074	2.3	10.9	0.4	1	23	762	785	762	785	0.95
13	29	0.0017	0.54	12.9	2.5	1	23	793	815	793	815	0.97
14	29	0.0015	0.47	13.1	0.6	2	23	881	903	880	903	0.95
15	29	0.00028	0.089	15.4	1.7	2	23	910	931	909	932	0.94
16	29	0.0091	2.9	10.6	3.2	1	21	950	970	950	971	0.95
17	29	1.6e-05	0.0051	19.3	0.5	1	23	990	1013	990	1013	0.97
18	29	0.0069	2.2	11.0	0.4	1	23	1016	1039	1016	1039	0.91
19	29	0.95	3e+02	4.2	0.6	2	23	1046	1069	1045	1069	0.91
20	29	0.3	96	5.8	1.0	1	23	1076	1099	1076	1099	0.94
21	29	0.0056	1.8	11.3	1.3	2	23	1137	1158	1137	1158	0.97
22	29	0.01	3.3	10.4	2.1	1	19	1163	1181	1163	1185	0.92
23	29	0.28	90	5.9	0.3	2	23	1313	1335	1312	1335	0.94
24	29	0.32	1e+02	5.7	4.0	3	23	1343	1363	1341	1364	0.92
25	29	4.5	1.4e+03	2.1	1.6	2	23	1376	1397	1375	1397	0.89
26	29	2	6.4e+02	3.2	0.6	1	23	1409	1432	1409	1432	0.95
27	29	0.00028	0.087	15.4	0.1	2	23	1465	1486	1464	1486	0.97
28	29	0.00062	0.2	14.3	0.4	1	23	1492	1515	1492	1515	0.95
29	29	0.0063	2	11.1	0.5	1	21	1520	1540	1520	1541	0.95

Sequence Information

Coding Sequence: ATGTTCTCGAACAACAGAACATCGGCCGCCTGGCGGGTTTCGTGTTCCAAGATGGCGATCCGCCTCGGGTTCCCGTCCTGTGTGTCCACCATGACGGGCCGCGGGCGTTCGGATTATCACGAGCTCTGCCGCCTCTGCGCTTCCTACGACGCCAAcaaattggacattttcagCGACGGCGGTCGTCAGAGGAAACTCATCGACAAAATCACTTCCTGCCTGTCCTTCGAGGTTTCCAAAGATGATTTATACCCGAAAAGCCTGTGTTTCCGGTGCATCTACAACTTGGAAAACTTCTACGACTTCCGCCGAGGGTGTATCGACGCCAGGGCGAAGCTGGAGAAGGCCATCAAGCAGTTCAAGCATCTCAAGGATAACCGTCTTCCTGACCTCCCAGAAATTACAATTGAGCACAGAACTGtgaagaagAAGCCAGAACCTAAAAAGCCAAATTATTTGAAGCATGAATTGGTGAAACCTGAACTGGTGAAGCCTGAACTGGTTAAGCGTGAACTGGTGAAGCCTGAACTGGTGAAGCGTGAACTGGTGAAGCCTGAACCGGTGAAGCCTGAACTGGTGAAGCCAGAATTGGTGAAGCAGGAGTTCGTGAAGGCTGAATATGATGATGAAGACTCAGAACCTCCAAACCCAGCTGATTTCCTTGAAGCCTGCTTGGGTGATTCTCCACACAATCCAGTTGGTAACCAGCCGGGGAAACCAGCgttggaagaagaagaaggtccTTTCCCTTGCAAAACATGCGGTCGCCTCTTCAACTCCAAGAGTTCTCTCACCATTCACGCAAAGTTTCACCAAGACAAAACACGAGATGCAGATGGCAGTGAACCCTACTCCTGCTATGTTTGTGAGAAAGTATTTTCCAGCAAAGGGCATTTGGCGCTTCACTCACGCGTGCACATTGGTGAAACAGGCTCTCCTGCACCGCCACCCGTTCGTCCAGTACCTGCTCAAATAAAGCTATACAAGTGCGATCTCTGCAATAAGTCATACTCAATGGCCAAACATCTCTGGGGGCACGTCAGCACGTCACACAAAGGCGACCCTCTAGTTACCTGTGGGCTTTGTCTACGCACGTTTTCCTCCATCGCTAATCTCGACGATCACAAAAGGATTAAGCATAAAAACGAATCAGAACCCCAGGAGGATTCCAATCAAGAGCAGTTGCAGAAACAGAACGAGGACGTCCCACTGGACTTGAGTCAAGACCCCCAGCGGAACGAAGAGGACAAAAAACAAGAATATAACCCCAGGAAGATCCAGAGAGACAGCAGTGGGAGTTTTCATTCTGAAGGGAATTTGGAAATGGACATCGATGAAACTAATCCAAACGAATCGTTAGTGTATTCGTGTCTTCTCTGTGGCCTAAAATGTGATTCACCTCCGGTTCTGAGCGATCATTTGATAAACGAGCACAATTATTATGACCCGATAGATTTTGAATCCCTTCATAGGCAGTACGGTGATAGAGACCACCCGGAAAACATGATGGAGGCCGAAACTGTGTTCTGCTGTGAAATCTGCTACAGGGAATTCAACGACCGGGCGTCCCTTTGGCTCCACATGCTCTACTCGCATAGAGACGAGGCATCCAAGGCTTGTGGCATCTGTCTGAAGGTTTGCGCAGACAATGAAAGCCTCGGACAACATGTTGAGACTTGTCATCCCCGTGAGAAAACCGAGCAGAGGAGGTAtagctgccaagtttgcgcccgCCAGCATGACTCTAGGAAGAAACTTGTGACACACGCCCGAATCCATAAACTCCAAGATCCTGATGGAAACCTAGTTGATCCGGAAACCATCGTAGTTCTGAATAGTGACGTTTACAATGACAACCCTCCAACACAGGTTCCAAATAATGACGGCTTCCTATCAAGTTGCGATATTTGTTTCAAAGTGTTTGAAAGTGAAGCTAAACTGAGTAAACATAAAAGAAGTACTCATAAAGATGGGATGAACAACTCTACATCAAACAACTACCATTTCTTCTTTGCCTGCGAGCTTTGTGGACTGTCACATCTCTCCAGGTCGGAACGTTGGAAGCATATGGTTACCTCCCACAATGGCGATCCAGCTGTGACTTGTGAGATCAAGTCGTGCGCCAAGGTCTTCCCTACTAGTGCGGTTAAGAAAGAGCATGAATTGACGCATCACGCAGCTCAAGGCGAGTACCCCAATACCTGCGAAATTTGCGGCAAAATGTGGAAAACGCGGGTTGAATATTGGAAACATATGATGGGAGTCCACTCCGAGAGCCTGCCTTTCATTTGTGGCGTTTGTTTGAAAGTGTTCTGCGATTTGCAAGGCCTTGTCACTCATGTAAGGGAAAGGCACTGGCCATTGGTGGGAGGCGATTTTTGCTGTGATATTTGTGGCAGGCCGTACTCCAAGGTCTCAAAAATGTCCAGGCATAGGAAGATCCATTTCGCTGTTGACACTCCCCCAGAGTTGCAGGAGTTGTTGAATAATTCTAAACACGATAGCAGTGAGAATCAGCATTTTTTGCAGAACCATACAACAGCTTTGACGTGCGATCTCTGTTTGGGGCCTGATAACAAAGAAGAATTCGAAAATTTAGATGCGCTGGGGAAGCATAGGCATGAAACACACAACGTCATGCCTTGTGATTTGTGCCCGAAGTATTACGGAAGGACTTCTCATCTGTGGAAGCACGTTAATAAAATTCACAAGGGTCATCCTGACATCACTTGTCCTGTATGTGAAAGAACATCTGCATCGCGGGCACATCTGACAACGCACATGGCCAAACACCATAGGACTGCCGTAGGCGAAGTGGCAGTTTCAAAAATAGACGAAAACGGAGTGCATACTTGTGAGAAATgttcgaaaattttcagaaaggaATCTCTCGTTCGAAAACATTTGAAGCACTGCAGAGGACCTCGTCCTGCCAAAATCAATCTGCCCCCTCCAGTGAACGGGGTGTACACGTGTGAACGTTGTCCAAAAACATTTGTTGCTCAGAATTTGCTCAATAAACACATGCGCGGTTCACACGTCACATTCAAATGCGAGATTTGTGAGATCAAGTCCAACACCAAGACTGAACTTTTCAATCACATTGTGGCCAAACACGTGGACCACCCTGATGTCAAATGTGCCGTTACAGGGTGCGACAAGATTCTAAGGTGCAAAGCTGATTTGGACAGGCATCAGCGAGACCACAGAAGCAGCACGCAGTTGCACATCTGTAAATTCTGCGCTGAAATAGTTACTAGTAAAGTTAAATTGAAGATGCATCTGAAAGCTCAACATGGGAAAGAAGCGAGGCATCTTTGTGCTCTGTGTTTGAAGGCCGAGAAAAGTTTTGAAGATCTCAGGAGTCACATTGTTGAGCAACACATTGTCATCATTAGTCGCCCCAATGTTTGTCAGGTTTGTGCAAAACCATGTTCGAGTAGGTCGAAACTTATGGACCATGTACGGAATCACGGTCCAGAATTCCACCCTTGCAAAATTTGCTTGAAGATATTCCCAACTAAAGACGAGCTTGAACAGCATTGTGATAATCATCCGGTTAGTGATGATGACGAGAATGAAGATGGCATGGAAGAAGTGGACGAAGTGGACGAAGTTGATGAGCTGGATGCTAATAGTATCATTGACATCATTGGTGCACCTCAAGGGAACGTCAAAGAAGTCGAGTCTTTAGATGCTAAAAGCATTAGAGATATTATTGGTGCAGGGCAAGACAATGTCAAGTTGAACAGGGTGAGTGAGTCTGACAAGGAAGACGATGGGCCTCCTCTGAAAAAGAGGAAAGTAGTCATCAAGACTCCCAAAAACAGAAATGAAGGTCCTGAGTTCTTGCAGCAGCTGGGACTGATGCCCGACTCGGAGAAGAAGAAACCTCGCGAGGTACGGAGAGTGTTCGACGACGACTACACAACCAGCCCTTGCGAGCTCTGCGACAAAGTATGGCCAGCAAAGAGGCACCTCTGGCAGCATCTGATCCGTTTCCATAAGAACGAAGCTGGCCGATGCTGCGGCGTATGCTTGAAAGTGTGCTCCAATTACACCAGTTTGAGCGTCCACCTTGCCGTCCACCACAGGAAGAACTTCGACGGCGACGGTTCTAATTTGTCTTGTAAAGTTTGCGGTAAATACCATAACGGCAGGACGAAACTGATGAATCACTCGTTGATCCATTTCGGTCACGAGGAGCGAGCTAACGACATGGTACACCGGTGCCTCATTTGCCAATCCGTCTTCCCGTTGTTCCCATCTTTTGTAGAACATTTGCAGAAAGAACACAACCTGGCGACTGACATGAAGGAAGACTTTGAACCTGTCGATGAATCTGCTGAAGAGGTGAGCAAGCCGGTTATGACCTCCAAACCGCCGTTTTTGAGCTGTGAAATTTGCTCGTTGGTTTTCGCCAGTGAAGTCGGCCTGACGAACCACAGGCGCACGCACGAACACTCTGATAGTTTCAAATGCGGTCAATGCGGCGAGCTGTTTGCATCAGCCGATACTTTGAAGAACCATAAACAAGAGAAACACAAAGGCGACGAGTTCGTTTGTGCCGAGTGCAAATCCAGTTTCACATCCTACGAAATGCTGACCACTCATTATAAGATGTGCCGAGCCAAACTGAGCAAAACTTCGGACTCTGAGAGCGACGTTGATGACGACGAGAGCGATGAAATCGAAACGACCGAGCTGGCCGAGGAGTCGGAAACCGACGATAAGTCCGAGGTGAACGATGATGATTCGTCGTCTGTGtccgacgacgacgacgacgacgacgacgacgacgatgaCGACGAGGACGAAGAAGCTGACGTTGAGGAGGTCGAAGACGAAGACATCGATGAAACCGAAGATGAGGACGACGACGAGGACGATGACAACGCCCAATCGGAAGAGCTCAAAATCCGCGCCATCGAGGCCTACGTCTGCGACAACATGGAGGACAACATGGTTGAAGTTGTCAAAATCGATCTCTCAGACGACATAGACGGAGCTGTCAAAGCATCCTAA
Protein Sequence: MFSNNRTSAAWRVSCSKMAIRLGFPSCVSTMTGRGRSDYHELCRLCASYDANKLDIFSDGGRQRKLIDKITSCLSFEVSKDDLYPKSLCFRCIYNLENFYDFRRGCIDARAKLEKAIKQFKHLKDNRLPDLPEITIEHRTVKKKPEPKKPNYLKHELVKPELVKPELVKRELVKPELVKRELVKPEPVKPELVKPELVKQEFVKAEYDDEDSEPPNPADFLEACLGDSPHNPVGNQPGKPALEEEEGPFPCKTCGRLFNSKSSLTIHAKFHQDKTRDADGSEPYSCYVCEKVFSSKGHLALHSRVHIGETGSPAPPPVRPVPAQIKLYKCDLCNKSYSMAKHLWGHVSTSHKGDPLVTCGLCLRTFSSIANLDDHKRIKHKNESEPQEDSNQEQLQKQNEDVPLDLSQDPQRNEEDKKQEYNPRKIQRDSSGSFHSEGNLEMDIDETNPNESLVYSCLLCGLKCDSPPVLSDHLINEHNYYDPIDFESLHRQYGDRDHPENMMEAETVFCCEICYREFNDRASLWLHMLYSHRDEASKACGICLKVCADNESLGQHVETCHPREKTEQRRYSCQVCARQHDSRKKLVTHARIHKLQDPDGNLVDPETIVVLNSDVYNDNPPTQVPNNDGFLSSCDICFKVFESEAKLSKHKRSTHKDGMNNSTSNNYHFFFACELCGLSHLSRSERWKHMVTSHNGDPAVTCEIKSCAKVFPTSAVKKEHELTHHAAQGEYPNTCEICGKMWKTRVEYWKHMMGVHSESLPFICGVCLKVFCDLQGLVTHVRERHWPLVGGDFCCDICGRPYSKVSKMSRHRKIHFAVDTPPELQELLNNSKHDSSENQHFLQNHTTALTCDLCLGPDNKEEFENLDALGKHRHETHNVMPCDLCPKYYGRTSHLWKHVNKIHKGHPDITCPVCERTSASRAHLTTHMAKHHRTAVGEVAVSKIDENGVHTCEKCSKIFRKESLVRKHLKHCRGPRPAKINLPPPVNGVYTCERCPKTFVAQNLLNKHMRGSHVTFKCEICEIKSNTKTELFNHIVAKHVDHPDVKCAVTGCDKILRCKADLDRHQRDHRSSTQLHICKFCAEIVTSKVKLKMHLKAQHGKEARHLCALCLKAEKSFEDLRSHIVEQHIVIISRPNVCQVCAKPCSSRSKLMDHVRNHGPEFHPCKICLKIFPTKDELEQHCDNHPVSDDDENEDGMEEVDEVDEVDELDANSIIDIIGAPQGNVKEVESLDAKSIRDIIGAGQDNVKLNRVSESDKEDDGPPLKKRKVVIKTPKNRNEGPEFLQQLGLMPDSEKKKPREVRRVFDDDYTTSPCELCDKVWPAKRHLWQHLIRFHKNEAGRCCGVCLKVCSNYTSLSVHLAVHHRKNFDGDGSNLSCKVCGKYHNGRTKLMNHSLIHFGHEERANDMVHRCLICQSVFPLFPSFVEHLQKEHNLATDMKEDFEPVDESAEEVSKPVMTSKPPFLSCEICSLVFASEVGLTNHRRTHEHSDSFKCGQCGELFASADTLKNHKQEKHKGDEFVCAECKSSFTSYEMLTTHYKMCRAKLSKTSDSESDVDDDESDEIETTELAEESETDDKSEVNDDDSSSVSDDDDDDDDDDDDDEDEEADVEEVEDEDIDETEDEDDDEDDDNAQSEELKIRAIEAYVCDNMEDNMVEVVKIDLSDDIDGAVKAS

Similar Transcription Factors

Sequence clustering based on sequence similarity using MMseqs2

100% Identity: iTF_00386615; iTF_00145849; iTF_01365785;
90% Identity: -
80% Identity: -