Basic Information

Insect: Cantharis lateralis
Gene Symbol: SLC5A12_1
Assembly: GCA_963170105.1
Location: OY720628.1:2185056-2192681[-]

Transcription Factor Domain

TF Family: MYB
Domain: Myb_DNA-binding domain
PFAM: PF00249
TF Group: Helix-turn-helix
Description: This family contains the DNA binding domains from Myb proteins, as well as the SANT domain family [1].
Hmmscan Out: # of c-Evalue i-Evalue score bias hmm coord from hmm coord to ali coord from ali coord to env coord from env coord to acc

1 5 2.3 2.4e+03 -0.5 0.0 34 46 299 311 289 311 0.83

2 5 7.5e-10 7.8e-07 29.9 0.2 1 44 317 362 317 364 0.89

3 5 5.6e-09 5.8e-06 27.1 0.0 1 46 370 420 370 420 0.94

4 5 4.6e-11 4.8e-08 33.8 0.0 1 46 427 472 427 472 0.98

5 5 3e-09 3.1e-06 28.0 0.0 2 44 480 522 480 524 0.94

#	of	c-Evalue	i-Evalue	score	bias	hmm coord from	hmm coord to	ali coord from	ali coord to	env coord from	env coord to	acc
1	5	2.3	2.4e+03	-0.5	0.0	34	46	299	311	289	311	0.83
2	5	7.5e-10	7.8e-07	29.9	0.2	1	44	317	362	317	364	0.89
3	5	5.6e-09	5.8e-06	27.1	0.0	1	46	370	420	370	420	0.94
4	5	4.6e-11	4.8e-08	33.8	0.0	1	46	427	472	427	472	0.98
5	5	3e-09	3.1e-06	28.0	0.0	2	44	480	522	480	524	0.94

Sequence Information

Coding Sequence: atggaaaACGAATATGATTCTACGACGGACATTCAGACGGAActcgataattatttttacgaagATCCTACAACGAGCGACGTCGAAGAGGATATAGAAGATGATTTCGTTTCTGATGAAGATCTTGGCAACATAGATCTAAACGAAAGCGACGATGTGGACGAAGACTCAACCGAAGTGGTCAACAACGACCTCGAAACTTTGGAACAGTTTACGTTACAACTTGAAGGCGATTTAGCAAATTCTATTTTGAATGATTTGCCCACGACTCATCTGAATTTAAACCTCGAACAGCGCAAGGTATTGGAACTGTGTCAAAATCCAGCACTGAAGCGACTGCTTTTGCTAAATCGACTTAAAGCTATGCACTGCTTggagtttattaaaaaaatagaaaaatctaACATTGTTTGTAATGGAATTGTCAGAAATTTGAAGAGTAAACATGTGAAAGATAGCGTTCCTGGCCTGCAGAGGAAGGTGAGCGAGCAGCATGCCTTGAATGTTTGGAAACTCGGAACTCCATATTTTAAAACGGATAAGTGTGTTGGTCCACAGTACAACGCAGACTATTACAGGAAGCTTGCTAACAATGAGTTGGTGCACACATCTTTTACAGAAGGTAGACGGTGGATTTACGACGATCAAGTTGCACTCTACGATGCTATATGTGATGGTTATCTCGCTTATAGGAAACGGATGGTGCAGCAACAGTTAACTTATGTAAACAGCACATACAAAGTTTGTCCCAACGACAccattaaattacaaatagataatttggaaaatcagCTGAAAGTAATTAAAGCCGAAACGGAATATAAAGCGCCACCCATAGATGACGAATCGGGCATTGATTGGCTAAAAGCAATTAATGATTTACAAAaTATTCACTCTGCAGTGGAGTGTAAAGCATTTTGGCGGATTTACTTACATCCGGATATAAATAAATCGGATTGGtcaaaagaagaaaacgaTAAAATTCACGAGCTAGTGGAAAAGTACAAGTCACAAAATTGGGACGCGATTGCAAAAGAACTCAAAAGTAATAGAACCGGTTTTTTAGTGATAGTTCATTATTTTAGTAACCTATGTGATAAATTCAAGAGAGAAAGATTTACGGCTGAAGAAGACGAAAAGTTATTGAGTGCGGTTGAAGAACATCGTTTGGGGTATGTGATTCCGTGGACGGCCGTTGCGGGGGCTTTTTCTGGTGAGCGTTCCAAACATCAACTTTATCATAGGTACACGTATTACTTGGAGCCTGGAAACGTCAAAAAGGGAACCTTCACCGAAGCGGAGGACATTCTGCTAACTTATTTGGTGAACCTCTATGGAAAGACTTTCACCACGATAGCAAATATTATGAATCACCGCACGGCTATTCAATTGCGCAATCGATACtcgaattatttggaaaaactcaCGCACAATTTAGGAACTTTCACCGCAGAAGACGACGAAAGTATATTGAAATACGTCAAGGAAAACGGTGAATCCAATTGGAGTAATTTGGCGAATCAACTGAAGAGAGGACGTGCGCACGTACGACAACGCTACTCGACTATAAAGAAATACATGAAAAGGGATCCTAAAATCACCGTTGCAGATTTGCCTAGAAAGCAGAAATCGTATTTTATCCGTAACTACAACGAACGGGTCATCAcgttagaaattattttggacATTCTAAAAACAAACATCAAAGGCATTCCCACTTTGAAAACCGTGGAGCACCACTTGAGAAAGCACAAATTAGAGAAGCAAGAAAAAAACTTGCGGGTGTGTCGGATCTACAAGAAAAGGGAGGTCAGCTCCACCGACCAAGAGTTGATTACGTTTTTTAAGTCGATCTGCCGAGTGCAAAGACGTGACGTTAACAAACCGCAAGAAGCAGCTACCACTTCGGCTAATCGCATTATAAAATTGCTCTATTTGCTCGGTTCTAATAGAAAACTGTTTGACAACATTGACCTCATCAGTGATATACCGGCTCCGTGTGATTTTGATCTTTTGGTagagattaaaaatttgtaccaTCAAGACTACCTTTCAAAGGTTAACATTGCAGGGCCTTCTTCGGCATCCGTTTCGTTTCAATCCAGCATGATTAAGGAGATTTTGCCTCCGACTATTTGCACCTTGGTCGGCATAAGGGGTCTAGTAATCAAATTTGAcgaatttaaagaattatatGGGGACTTTTTAGCAGCTGTTAAAAGCAGCAGTGTGCAATCTTACACACTGCAATGTTTGCCTGCCGAAATTGATGAATACACCAAAGCGATGATTGTGAACGAAAGAAACCTATTCCTAGAGAGACTGGTGACGCTTTTTAAGTGGCCTACAATTTTGTCTCGTACCTATCCTGCCGAACAAGTTACAAAATCTCCCGAGGTAGAAGAAACCGTGGAAGAGGTTTTACCCAAAAATGAAGTCGTGGTAGCTACTAGAAAGAAAGGCAGACCAAAGAAACCGTCTACATACGACAAGATCAATAAGATGAACGAGGCTAAAAGAAAGAAACGCATTGTAGTAATTGACGACGACGATGATATTGAAGAAGGAACTTCAAAACGAGTGAAATCAGAGCAAACAGTTAAATATTATCCAAGTCGTTCGAAAACTGCCAGCAATTTAACAACGAGCACTCCAGATAGTCTTTTGTTTTCTTGGATAGATTATTCCATCTTTGCTTGCATGCTAACCGTGAGCATTTTAATTGGCATTTACTATGGATGTTTTGGATCTCAGCAATCTACCACCGACGAATACTTCTTTGGAGGAAAATCCATGAAAGTGTTTCCTATTGTTATGTCTTTAACAGCCAGTCATCTATCTGGTATCACCATATTAGGGATACCGGCGGAAATCTACTTGCACGGAACTCAGTACTGGATGTGCATTCTGTCAATAGTTTTCGTGgtgataataatttggatcgTCTATTTACCAGTGTTTTATAAACTCCAGCTGGTAAGTTCCTACGAGTACTTAAAGTTACGATTCGACCACCGAGTTAGATCTCTCGCTTCCCTTTTGTTTGTAATCGCTAGTCTACTCTACATACCAATAGTCATATACATTCCTTCTTTAGCGTTCAATCAAGTGACCGGTATCGAATTGTGGAAAATCTGCCCGGTGATTTGCTtggtttgcattttttataccACGATTGGCGGACTAAAAGCGGTGGTACTTTCAGATGCCTTACAGTTTTCTCTAACCATAGGAATCATGACCGCTATTATCTTTTTGGGAACTTACTCTTCAGGAGGTTTTGCTTCTGTTTGGGAGGTAGCCCATCGGGGGGGACGGATCGAATTTTTTGATATGAGCATGGATCCAACCGAACGAACAACATTTTGGGGCCTTACGGTTGGTTTGACGACGACATGGTTACCAAATATAGGATTGCATCCTGCCTCCATCCAACGGTTTCTGTCGCTTTCTTCGTGGAGTGCGGTCAAACGATGCATGGTGTTTTTTTGTCTGGGGTTTATAATAACCAAGTCTATAAGTTGTTTCACTGGATTGCTAATTTTTGCCAAATACTCCGATTGCGATCCATGGATGAATGGAAATGTTGAGCGTTCAGATCAACTGTTACCCTATTACGTTCTGGACGTAGCAGGCAACCTTCCTGGAGTGTCTGGACTTTTCATAGCTGGAGTTGTTTGTACAGCGCTAAGTTCTATGTCGTCGCAATTGAATACGTTAGCTGGAACAATCTATCAAGACTTTATCAAAACGCACATGCCGATGAATCCAACCGAGAGATCTGTCAACAATATCATGAAAACAATTGTTATCCTGGTGGGATTGCTATCGCTTGGTTTAGTATTTGTTGTTGAAAAACTGGGTGGAGTTGTGGAAGTCTCCCTAAGTCTTTATGGTATTACTGCAGGACCATTACTTGGGTTGATCACGTTGGGAATGTTATTTCCCTTCGCCAATGCACATGGAGCCTTATATGGCGGAATTGTATCTACACTATGTGTTTCAATTTTGGTTGCCGGGACTCAGTTATTATCCTTCAATGGAACCATAAAGCATGCCATTAAACCTCTTTCAGTCGAAggatgtttaaataataatagttttatttatacGACTACCCCGACCTCAAGCGACAACGGACCATTTGGCTTGTTTcttatttcgttttatttttattctttaattggAACTGTGCTGGTTTTACTAATTGGACTTCCTATTAGTTGGATTACAAGAAAACGGGATGTTATTTTGAATCCTGATTTAATTAGTCCTTGCATTCGTTGGTTATTACCCAAACAGATCAACCAAAAGCTGCCGTTAAACTACGATACGATTGACATTGCATTAGAAAAAGTATTAGATCTGCATGAAAATGAAGATAAAAGTTAA
Protein Sequence: MENEYDSTTDIQTELDNYFYEDPTTSDVEEDIEDDFVSDEDLGNIDLNESDDVDEDSTEVVNNDLETLEQFTLQLEGDLANSILNDLPTTHLNLNLEQRKVLELCQNPALKRLLLLNRLKAMHCLEFIKKIEKSNIVCNGIVRNLKSKHVKDSVPGLQRKVSEQHALNVWKLGTPYFKTDKCVGPQYNADYYRKLANNELVHTSFTEGRRWIYDDQVALYDAICDGYLAYRKRMVQQQLTYVNSTYKVCPNDTIKLQIDNLENQLKVIKAETEYKAPPIDDESGIDWLKAINDLQNIHSAVECKAFWRIYLHPDINKSDWSKEENDKIHELVEKYKSQNWDAIAKELKSNRTGFLVIVHYFSNLCDKFKRERFTAEEDEKLLSAVEEHRLGYVIPWTAVAGAFSGERSKHQLYHRYTYYLEPGNVKKGTFTEAEDILLTYLVNLYGKTFTTIANIMNHRTAIQLRNRYSNYLEKLTHNLGTFTAEDDESILKYVKENGESNWSNLANQLKRGRAHVRQRYSTIKKYMKRDPKITVADLPRKQKSYFIRNYNERVITLEIILDILKTNIKGIPTLKTVEHHLRKHKLEKQEKNLRVCRIYKKREVSSTDQELITFFKSICRVQRRDVNKPQEAATTSANRIIKLLYLLGSNRKLFDNIDLISDIPAPCDFDLLVEIKNLYHQDYLSKVNIAGPSSASVSFQSSMIKEILPPTICTLVGIRGLVIKFDEFKELYGDFLAAVKSSSVQSYTLQCLPAEIDEYTKAMIVNERNLFLERLVTLFKWPTILSRTYPAEQVTKSPEVEETVEEVLPKNEVVVATRKKGRPKKPSTYDKINKMNEAKRKKRIVVIDDDDDIEEGTSKRVKSEQTVKYYPSRSKTASNLTTSTPDSLLFSWIDYSIFACMLTVSILIGIYYGCFGSQQSTTDEYFFGGKSMKVFPIVMSLTASHLSGITILGIPAEIYLHGTQYWMCILSIVFVVIIIWIVYLPVFYKLQLVSSYEYLKLRFDHRVRSLASLLFVIASLLYIPIVIYIPSLAFNQVTGIELWKICPVICLVCIFYTTIGGLKAVVLSDALQFSLTIGIMTAIIFLGTYSSGGFASVWEVAHRGGRIEFFDMSMDPTERTTFWGLTVGLTTTWLPNIGLHPASIQRFLSLSSWSAVKRCMVFFCLGFIITKSISCFTGLLIFAKYSDCDPWMNGNVERSDQLLPYYVLDVAGNLPGVSGLFIAGVVCTALSSMSSQLNTLAGTIYQDFIKTHMPMNPTERSVNNIMKTIVILVGLLSLGLVFVVEKLGGVVEVSLSLYGITAGPLLGLITLGMLFPFANAHGALYGGIVSTLCVSILVAGTQLLSFNGTIKHAIKPLSVEGCLNNNSFIYTTTPTSSDNGPFGLFLISFYFYSLIGTVLVLLIGLPISWITRKRDVILNPDLISPCIRWLLPKQINQKLPLNYDTIDIALEKVLDLHENEDKS

Similar Transcription Factors

Sequence clustering based on sequence similarity using MMseqs2

100% Identity: -
90% Identity: -
80% Identity: -