Basic Information

Insect: Melipona bicolor
Gene Symbol: LST_1
Assembly: GCA_030673865.1
Location: JAHYIQ010000003.1:5408955-5423229[-]

Transcription Factor Domain

TF Family: zf-C2H2
Domain: zf-C2H2 domain
PFAM: PF00096
TF Group: Zinc-Coordinating Group
Description: The C2H2 zinc finger is the classical zinc finger domain. The two conserved cysteines and histidines co-ordinate a zinc ion. The following pattern describes the zinc finger. #-X-C-X(1-5)-C-X3-#-X5-#-X2-H-X(3-6)-[H/C] Where X can be any amino acid, and numbers in brackets indicate the number of residues. The positions marked # are those that are important for the stable fold of the zinc finger. The final position can be either his or cys. The C2H2 zinc finger is composed of two short beta strands followed by an alpha helix. The amino terminal part of the helix binds the major groove in DNA binding zinc fingers. The accepted consensus binding sequence for Sp1 is usually defined by the asymmetric hexanucleotide core GGGCGG but this sequence does not include, among others, the GAG (=CTC) repeat that constitutes a high-affinity site for Sp1 binding to the wt1 promoter [1].
Hmmscan Out: # of c-Evalue i-Evalue score bias hmm coord from hmm coord to ali coord from ali coord to env coord from env coord to acc

1 17 0.00047 0.052 14.6 0.7 2 19 454 471 453 475 0.89

2 17 4.4e-05 0.0048 17.8 4.2 1 23 481 503 481 503 0.98

3 17 0.00042 0.046 14.7 0.1 3 23 511 532 509 532 0.94

4 17 0.53 58 5.0 1.8 1 23 539 562 539 562 0.98

5 17 6.5e-05 0.0071 17.3 0.7 1 23 566 588 566 588 0.97

6 17 0.0029 0.32 12.1 0.5 1 23 594 616 594 616 0.98

7 17 0.00023 0.025 15.6 2.3 1 23 622 644 622 644 0.96

8 17 0.0034 0.38 11.9 0.1 1 17 649 665 649 666 0.90

9 17 0.7 77 4.6 2.5 1 23 1195 1218 1195 1218 0.98

10 17 0.00027 0.03 15.3 0.3 1 23 1224 1246 1224 1246 0.97

11 17 0.1 12 7.2 0.5 1 23 1252 1274 1252 1274 0.97

12 17 1.3e-05 0.0014 19.5 0.3 2 23 1281 1302 1280 1302 0.97

13 17 2.7 3e+02 2.8 0.5 2 23 1309 1331 1308 1331 0.94

14 17 2.8e-05 0.0031 18.4 0.5 1 23 1335 1357 1335 1357 0.98

15 17 0.05 5.6 8.2 1.0 1 23 1362 1384 1362 1384 0.98

16 17 3.5e-07 3.8e-05 24.4 0.5 1 23 1390 1412 1390 1412 0.98

17 17 0.00057 0.063 14.3 1.1 1 21 1417 1437 1417 1438 0.94

#	of	c-Evalue	i-Evalue	score	bias	hmm coord from	hmm coord to	ali coord from	ali coord to	env coord from	env coord to	acc
1	17	0.00047	0.052	14.6	0.7	2	19	454	471	453	475	0.89
2	17	4.4e-05	0.0048	17.8	4.2	1	23	481	503	481	503	0.98
3	17	0.00042	0.046	14.7	0.1	3	23	511	532	509	532	0.94
4	17	0.53	58	5.0	1.8	1	23	539	562	539	562	0.98
5	17	6.5e-05	0.0071	17.3	0.7	1	23	566	588	566	588	0.97
6	17	0.0029	0.32	12.1	0.5	1	23	594	616	594	616	0.98
7	17	0.00023	0.025	15.6	2.3	1	23	622	644	622	644	0.96
8	17	0.0034	0.38	11.9	0.1	1	17	649	665	649	666	0.90
9	17	0.7	77	4.6	2.5	1	23	1195	1218	1195	1218	0.98
10	17	0.00027	0.03	15.3	0.3	1	23	1224	1246	1224	1246	0.97
11	17	0.1	12	7.2	0.5	1	23	1252	1274	1252	1274	0.97
12	17	1.3e-05	0.0014	19.5	0.3	2	23	1281	1302	1280	1302	0.97
13	17	2.7	3e+02	2.8	0.5	2	23	1309	1331	1308	1331	0.94
14	17	2.8e-05	0.0031	18.4	0.5	1	23	1335	1357	1335	1357	0.98
15	17	0.05	5.6	8.2	1.0	1	23	1362	1384	1362	1384	0.98
16	17	3.5e-07	3.8e-05	24.4	0.5	1	23	1390	1412	1390	1412	0.98
17	17	0.00057	0.063	14.3	1.1	1	21	1417	1437	1417	1438	0.94

Sequence Information

Coding Sequence: atggaGCTAGGGAAAGACGAGGCGCAGATCTGTCGCCTCTGCGGCCAGTACGAGAGCATATATATTGACGTGTTCGGCGAGGAAGGCACCAAGCGATTTTTAGGATTGAAGATTCATACTAAAATCAACATTCTGATAGATGAAAGGGATCCTCTGCCCAAGGCGATCTGTGTTCAATGTCTGGGCAAGCTCGAATTCGTTTGCGACTTCCAAGAGGAGTGTCTTCGCACCCAACAAGTGTTACGCGATCGATACAATCTACCACCCTTAACAGAGATTGCTGAAGTAAAGACTGAAGATACACCAAGTGCACCAAGTACATCTACAAACGATAGTAACAATGAAACCAACAATAATCTTAATTCTTCAACTGATGAAAGCATTAAAGAAGCAGAGCAACGTGTTCTAAGAACAGCTACAAAAGCtcaaagaaatttaagaagTCAACAACAAGTAAGAGGCAATGAAGAAGGTGCGAACGATCAAAATAGTGTTCAAAGTACAACCGAAGACAATATTGAGAATGtacaaattgttcaaaattctGAAACAACCCCTACGCGATGGCTTAGAAGTAGACAGAGTACAGaaacaattgtaataaatgatGCAACGATTGATATACCAATCGCAAATAGACTTAGAAGTCACGACAATACTGCCACAGAAATAACTGTTAGTCCGTGTAATAATTCCAATGAAAACGGTGATAAACCGATTGGAAAACAGCAAGATCCACATACTATTCAAATTCCAACCTCAGCATTGAATAAGCTTCTCAGTATCGTGTCGAACTCCCCAAACATCGAAGTTTCTGTCAAAGAATCCAGAAATCAAGCCAGCGACATCGAAGATATCAGTTTTACTGTAGAATTATGTAAGAAGGAAAGCGACGATGTAGCTACTGTCCGAGCGCGAGTATTTCCGGATCAAGGTTCTTGCTTAGTGGATAAGGCAATCGTTGGtcttttacaaaatcaaaGTTGTGTAGAagtaaatagtataataaataccaTTATTAACAGTAGCTTGAAGAACGGCAGTTCGACCAAATTGAGGGACTCTGCTGAATTCGAGCAAAAATGGCAAGCCTCTCAAAATCCAGAAGAACTCTTTAGGATTGACGGAGAAGAGATTCGTGTCGACGACAACGTCGAGCATATCGTCACGGATAATCAAAATGGATACTCTTGTAAATTATGTTGTAAATTCTATGAACGCAAGGACAAATGTATGGTTCACGTGAAGACCCATCTTGGTATTAAACAGTATACCTGTATCCTGTGCAACGCGAAATTCGTATGCAAATCTGATGTAATGAAGCATATTCGATGTTCACATACTAACCCTAGGCCGATACAATGCCCAAAATGTCCAAAGAGATTTAAgtcaaagttttatttaatggAGCACGACAATGTGCACAAGGGTGTAAGACCTTATTCTTGTACGGACTGTGGTCAGAGTTATCACCACAAAGTATCGCTACAAATCCACATGAAATCACACTTACCTCCGCAGAATTTAGCTTGCGAATATTGCGGCAAGGTGTTCCCGTACCGTACGAGATTATTAAGTCATATAGCTAgtgtacatttaaaaaatcgtcGTAACTTCAGGTGTCGATTTTGTTACAATCTATATTCGAGTCTTTCAGTTTTGAATGAGCACATTAAAACGCGACACGCGACTACATATACCTGTGAAATTTGTAGTAAAACGTTCAAAGTTGCGTCCAAGTATAAGGCTCACGTGTTGCAACATTCGAATCCTAAACCATTTGTATGTAATGTTTGTAACAATAGATATGCATCAAAAGCATTCCTGAATGAACATCTATTGAAGCACGAGGGGCTGAGGAAACACATTTGTCAAAAGTGTGGTGCAAGGTTTGCTCAAGCTAGTCATCTTGCTGCACACCGGCACGTGCATGGTGAAAAAAAGCATGCTTGTCCTGAGTGCGGACGAAAATTTAACAGGCGTGATAACATGAAGgtaaaagaaaatgatggACTACCTCAGATTGTTTGTATGCGATGTTTGGGTACACTGGAGTTCTTATGTGATTTTTATGAGCGCTGTCATCTTGTTCAAAAAGGATTTTCGAAAGCTAGTCAAAATACAAGAGATGAAAAGTTCCAGGAAGACAGTGATGTAGAATCAGATAAGGAGAACACTGTCCCATCAAGGAATGGGACCAAATGGAAAGTCAAGGTTTCATCATCTGACAATTTAAAGAGTACAAAAAATTGTCTTTCTGAAGATAATACATACAAGACtgaaagggaaaaggaaaacgtTAATCTCGTAGATAATAATTCCAgtactaataattattcagTTACGCAAACTACAGTACAATTAAGCAATGTAACTTCATATGAAAAATTCTCAGGAAATGATCAGCGTAACGTTAGTAGTTTAAAACataggaatttaaaaaataatattgtaaaaaagcCTGCAATTCGTAGAAAGTTAACAAATGGGTTGTCGCAAAAAGATGAGGAGGATATTGATATCAAATCAGGCCAGCCAGCACGACGTAAAAGAGGACGGAAAAGTAAATTCGAGAAGATGAGAGGAACAATCCGAAATGATTGTTTTTTTAAGGTCCGTTGCGAAACTGATTTCTCTCTGACAAACAGGAGTGATAATATTGATAACaatagaagaaacaaaaatttgaacaatgaACGCGAAAAAAGTAGCTTGCctgttatttgtaataatgataattccAATAGGGTGATCAATAATGTTATGACTTTGTCATCTCAAATCGACGTGGAACAGGTGATTGATACGCCCTTGATCTCTATAGATCTTACCAAAAGCAATGAAGCTGATATAGTGATTGATAAATCACcagaaataaaatctaatgATGAAAGCATGGAGAAAATTGGCAATTGTTTGAACAATACAAAAGACTGCTCTGTAAAAAGTAAAGCAATATTGgttccaaaaaaagaaaaaggagaagcaAAAAGTGCTTCTTTTCTTAAACagagtgaaaatttaataaggaATCAAAGTTTACTGGCAGAAGAATCTAAAAAAACTGAAGATAGTGAGACTAATTTAATAACAGTACCTGacaataattttgatatagaaattatttctgttaataataatcaacaGTCTGAAATATTCACAGAACAAAATCGTATGGCTGTTATAAAATCTTCTTCTAATAAAGTATCAAATCCAAAGACGATACAGCAAGATTGTACAGAAGTTTGTATTGGGATAGATATAATAGATGaaagtatcaaaaataaagaatgcaATGTTCTCAATGAACATTCATTATCTCGACACAATCAAGATAGTTTTAGTGGGACTCAAAGTAAAAATAGACCGTTTggtaaaatttccaaattaataaGTGATGAACAGAAACAAATCATTGAAACTTATTACGTGGTGAATATGTCAGCGATAAACTCGGAAGAAGTACAAAGAAACATAACAGTAgttgataaaaagaatatacgCTGCAATATTTGTGGTAGTCTCTATCCTAGAATGGATAAATGTCAaGTACATATTTGGGGACATTTACAAATGAAACCGTATCAATGCAAAGCTTGTGATTTTACTACAGTTACTGTTAGCAATGTTCGTTGCCATATCAGAAAGAGtcacttaaaaattaaaccaTTCGCGTGCCATCTTTGTGAAAAACGATATGTAACTGCTGTATTACTAGAAGAACACATTAATAGTCATACAGGTGCGCGTCCATACAAGTGCGAACTCTGTGACTTTGCAGGTTCCAGTAGGCAAACGCTAAGTTACCATAGTGCTACTCATAAACCATTAAAGGATGTGAGCTGCAAAATTTGTGGGAAGGAGTTTTATTCAAAAACTAGATTACGCGCGCACATGATTGTACATAACAAGGATAAAGCTGTTATGTGTAAACTATGTTCTGCTTATTTATCTAACACAGAAGCGTTAGAAATgcatcataaaaatattcacatgCAAGATTATGTGTGTAATGTATGTGGCAAACGTGTCAAATCAAGAAAAGCTTTATACAATCATCAAAATGTTCATGCTGCagcaaaatataaatgtactGTATGTTCAAATGTGTATAAGAGTAGCCAAATACTAAAAGAACATCTTTTGAAGCATGAAGGTATCAGAAAGTACAAATGTAATGTCTGTGAAAAATCGTTTGGTCAACAATCTCATTTAGCTGCTCATATGGCAGTACATAGTAAAATTAGattcCATTGCCCCGGATGTAGCAAACCTTTCAATCGTCTGGATAATATGAAAATGCATACTAAACGATGCAAACCATTTTTGGCAAATCCAGATTTGAAAAGACTTTTAAATAGGAGAGAAAGGACTATATCGTTCGATGACGTAACAGAATTAACTGCAAAACTAAAGACTGGAAATATCACAAATTCCGTGTCTTCAGTTTCTCTACAAAATCAGAATGGTGATATATCAGTAAAGACTGAGGAAGAGACTGTGTTAAATCTTTGCAAATTAGAAcagaatatttctttgattgACTCGACAGATAAAACATGTAATTCtgataagaaatataatgGAAAAGAAGTAACGAAATCTGCTAATATTAATGTagttaaaattgcaaatactAATGACAGATTAATTccagaaaacgaaaatttAGAAAAGTACGAAAATATGGCCCTTGAACCACCGgaatatgaatatttgaatGAGGAAGATAACAAAAaactaatgaaattatttacggGTCAAAGATCAGGTTTCGTTCTTGTGGGTCCTAAAAAATGGTTCCTCCCGCTTAAATATACGACAGATggtaaagaattttataattttaaggCAAGACCGGATGACACATGGGTGATATCTTATCCTCGATCAGGAACGACTTGGACTCAAGAATTAGTCTGGTTACTATCAAATGACTTAGATTTTAACAGAGCAAGGACAGAATCCTTATCAAAAAGATTCCCATTTCTGGAATTTAGTATGTTCAATCATCCAGAAGTAATagatgaaataacaaaaatgaatGAGAATGATAAAGCTAAGGCAGAAATCTTTAAAGTAATTGAGCCAGGATACGAAGTCCTGGCGAAAATGCCTTCCAAGAGGTTCATAAAAtcacattttccattttctttgtTACCTAATATTTTGGACAGTGGTTGCAagATAGTATATGTTGCAAGAAATCcaaaaaatgttgcaatttcttGGTATTACCTCAATGTGTCAATTAAAACACAGGGATTCGTAGGTGATTTTCCAACATTTTGGGATTGCTTTCAAAATAATCTTAcacACTGGAGTCCATATTGGGAACATTTGAAAGAAGCATGGGCAAACAGAAATAATCCGAACGTTTTATTCATGTTTTATGAAGAAATGTATCATGATTTTCTGAAAGCAATTAAAAAGGTTGCtaaatttcttggaaaaacATATACTgaagaacaaataaaagaattagcagagtatttaaatataaaaaattttcgtgaTAATCCAATGGTAAATTTATCAGAATTAAAAGACTGTGGTATGATAAAAGCAGGAATATTTGTTAGAAAGGGTGGAATTGGTGGATGGGAAGAGATGTTCACAGAAGAGCTTAATGCCAAAGCCAATAAATggatcgaagaaaatttaaaagatacagATCTCACTTTTccgtattttaatattaatggtaACTATAAATAA
Protein Sequence: MELGKDEAQICRLCGQYESIYIDVFGEEGTKRFLGLKIHTKINILIDERDPLPKAICVQCLGKLEFVCDFQEECLRTQQVLRDRYNLPPLTEIAEVKTEDTPSAPSTSTNDSNNETNNNLNSSTDESIKEAEQRVLRTATKAQRNLRSQQQVRGNEEGANDQNSVQSTTEDNIENVQIVQNSETTPTRWLRSRQSTETIVINDATIDIPIANRLRSHDNTATEITVSPCNNSNENGDKPIGKQQDPHTIQIPTSALNKLLSIVSNSPNIEVSVKESRNQASDIEDISFTVELCKKESDDVATVRARVFPDQGSCLVDKAIVGLLQNQSCVEVNSIINTIINSSLKNGSSTKLRDSAEFEQKWQASQNPEELFRIDGEEIRVDDNVEHIVTDNQNGYSCKLCCKFYERKDKCMVHVKTHLGIKQYTCILCNAKFVCKSDVMKHIRCSHTNPRPIQCPKCPKRFKSKFYLMEHDNVHKGVRPYSCTDCGQSYHHKVSLQIHMKSHLPPQNLACEYCGKVFPYRTRLLSHIASVHLKNRRNFRCRFCYNLYSSLSVLNEHIKTRHATTYTCEICSKTFKVASKYKAHVLQHSNPKPFVCNVCNNRYASKAFLNEHLLKHEGLRKHICQKCGARFAQASHLAAHRHVHGEKKHACPECGRKFNRRDNMKVKENDGLPQIVCMRCLGTLEFLCDFYERCHLVQKGFSKASQNTRDEKFQEDSDVESDKENTVPSRNGTKWKVKVSSSDNLKSTKNCLSEDNTYKTEREKENVNLVDNNSSTNNYSVTQTTVQLSNVTSYEKFSGNDQRNVSSLKHRNLKNNIVKKPAIRRKLTNGLSQKDEEDIDIKSGQPARRKRGRKSKFEKMRGTIRNDCFFKVRCETDFSLTNRSDNIDNNRRNKNLNNEREKSSLPVICNNDNSNRVINNVMTLSSQIDVEQVIDTPLISIDLTKSNEADIVIDKSPEIKSNDESMEKIGNCLNNTKDCSVKSKAILVPKKEKGEAKSASFLKQSENLIRNQSLLAEESKKTEDSETNLITVPDNNFDIEIISVNNNQQSEIFTEQNRMAVIKSSSNKVSNPKTIQQDCTEVCIGIDIIDESIKNKECNVLNEHSLSRHNQDSFSGTQSKNRPFGKISKLISDEQKQIIETYYVVNMSAINSEEVQRNITVVDKKNIRCNICGSLYPRMDKCQVHIWGHLQMKPYQCKACDFTTVTVSNVRCHIRKSHLKIKPFACHLCEKRYVTAVLLEEHINSHTGARPYKCELCDFAGSSRQTLSYHSATHKPLKDVSCKICGKEFYSKTRLRAHMIVHNKDKAVMCKLCSAYLSNTEALEMHHKNIHMQDYVCNVCGKRVKSRKALYNHQNVHAAAKYKCTVCSNVYKSSQILKEHLLKHEGIRKYKCNVCEKSFGQQSHLAAHMAVHSKIRFHCPGCSKPFNRLDNMKMHTKRCKPFLANPDLKRLLNRRERTISFDDVTELTAKLKTGNITNSVSSVSLQNQNGDISVKTEEETVLNLCKLEQNISLIDSTDKTCNSDKKYNGKEVTKSANINVVKIANTNDRLIPENENLEKYENMALEPPEYEYLNEEDNKKLMKLFTGQRSGFVLVGPKKWFLPLKYTTDGKEFYNFKARPDDTWVISYPRSGTTWTQELVWLLSNDLDFNRARTESLSKRFPFLEFSMFNHPEVIDEITKMNENDKAKAEIFKVIEPGYEVLAKMPSKRFIKSHFPFSLLPNILDSGCKIVYVARNPKNVAISWYYLNVSIKTQGFVGDFPTFWDCFQNNLTHWSPYWEHLKEAWANRNNPNVLFMFYEEMYHDFLKAIKKVAKFLGKTYTEEQIKELAEYLNIKNFRDNPMVNLSELKDCGMIKAGIFVRKGGIGGWEEMFTEELNAKANKWIEENLKDTDLTFPYFNINGNYK

Similar Transcription Factors

Sequence clustering based on sequence similarity using MMseqs2

100% Identity: iTF_00982443;
90% Identity: iTF_00983733;
80% Identity: -