Basic Information

Insect: Dendroctonus ponderosae
Gene Symbol: GON4L_1
Assembly: GCA_000355655.1
Location: NW:901714-908917[-]

Transcription Factor Domain

TF Family: MYB
Domain: Myb_DNA-binding domain
PFAM: PF00249
TF Group: Helix-turn-helix
Description: This family contains the DNA binding domains from Myb proteins, as well as the SANT domain family [1].
Hmmscan Out: # of c-Evalue i-Evalue score bias hmm coord from hmm coord to ali coord from ali coord to env coord from env coord to acc

1 4 7.1 4.3e+03 -2.8 0.0 34 45 475 486 473 487 0.82

2 4 3 1.8e+03 -1.6 0.0 13 27 489 503 481 505 0.74

3 4 3.8 2.3e+03 -2.0 0.0 1 12 539 550 539 551 0.88

4 4 1.3e-06 0.00079 18.7 0.0 3 42 1448 1490 1446 1494 0.92

#	of	c-Evalue	i-Evalue	score	hmm coord from	hmm coord to	ali coord from	ali coord to	env coord from	env coord to	acc
1	4	7.1	4.3e+03	-2.8	34	45	475	486	473	487	0.82
2	4	3	1.8e+03	-1.6	13	27	489	503	481	505	0.74
3	4	3.8	2.3e+03	-2.0	1	12	539	550	539	551	0.88
4	4	1.3e-06	0.00079	18.7	3	42	1448	1490	1446	1494	0.92

Sequence Information

Coding Sequence: ATGAAGCTTTTAGAGAAAACGGGAATCATTGACAACCCTCCAGATAATTTGGAGCAAAccgaaaatgctgaaaaagtCGACTTTACCAAGGTGCTGCAACCTGGCACCCCTTCGCAGGGCGAacaaaatgtgtttgaaaGGATTGAGGGTGAAATTGAGAGACAGCTAACGGATAAGGCTGAAAAGTGCAACCTCACAGTGTTGaatgtaaaaaacataattcgcCAAGTGCTGACCAATGACCATGTTAAGGCTCTGTTGGATAAGGGCACTGCGGAACAAGCCAAACAGGAACTGTCTGCTTTTGGACCGAAGTTGACCCGGGCGAAGACCAAAGAATTGCTGGCGGCAAGAGACATACCAATTCCCCAAGTGAAAATTCCTTGGATACCCGTACCACCTCCTTCTGAGGCTCTGGTTTTGATTGGAGAAGATTTGAAAGAAGATGACTCTGGCGATGAATATATTCCAAAGAAAGAGATTGCAAAGCGTGACTCAGTGGCCAGATCATCAGATGCTGCCACTTTACCTCCACCCACTCCTCCAACTCCCATGTGCACGGAAGATCATGCAACCCAAACCAGCAACTGCACTGGGGATGGTGTACTGAAAGTCCCCCTTGCCACACCAGCCCAAggCGCTTCAGTGGAAGTTACCAACATGGCTCTCAGAACTCGCTCGAAAATAAACCTAAGCTCCACGTCTTTGGAAGATATCGAGAAAGCGTTTATTCCTCCTGATATTACCACGGACATGTACGACATGGAGTGCGATGATGACGAGTGGAGGAACTTTCTCAAGGGCTTCACTGAACCTCTGGACGAAGTCACCAAGCATACAGAGGATGAAGAACTAGACCCCGAATACAACATAATGGCAGATGACCAAATCAACCAATTTGATAATGAGGACTTTCGCATGGACAAAGCTGttaaaataaccaaaaaagaAGTTAAAGAACTCTATGAAGAGCTCTTTGACTACCTCAACAGTTTATCTGAAGAATACGATGGAACTAATGGAACCAATGAAAACAACCAGTTGTcggaaataatcgaaaaatccTATCATGCAATGGAAAACCCCGACTTCATTCCAGATGCACAGCAGCAACAAGATACTCTTCAGAATCTAGGGACCAATCAGAATGCAACCGTGCTAATAGATATTAAAATCGAGCTACCCCAACTGCAGATCATTGAACAACAAATGAGGCAACATGTGCAGATGTTGACCCAAAACTTCTTCCTTACCTACGAACACCCGGAGTATCACAGTTACAGCAAAACACTCAAGGAATATCTGCTGAACTTGAAGTTTTTGGCTAATGGCAAGAACTATTCGATGTTTAGCCCAGTGAATCTGCTGCCTGCACTGGATTTGATAGAGAAATGGGAAGTCTTGTGCGCGTCGAACAGCGAGACTGTGCGACAATGTCGAGAGCATGTTCAGCAACAGCTTCTGAAATCAATCCAATACAGAATGGGTAGAAACTGGGAATTTATAGCAACGTTTCCAAAACTAATACTggaaacaatttcgaacagtGAAGTGTTCGTGTATCCTGGATTGCTGCCTAAAATCCCGTTCAAGTCTCAGGAATTTTCCAGCTATCGAAGCAGCTTTACCGAAGCTGAAGATCACTTGCTGGCATTCAGTTTGGACCAGTTCAGAAATTTCTTAGGGAATAATACTAGTACTAGAGAAGTAGTTTCTCATGTGAAGGAGCTCATAATGCCACATAGGGACGTGACTAAAATCATGCGGCACATAAGGAATAGGAAACACCCTCAAAGCCCGTCCAACCCTATTCAGCAATACCTATTGCACAACAAACTAAGGCCTGTTGTGCATTATTTTTATCCATTGAACGAAATCGTACCCCCCTGCAAACGGTGTCCGGAAGAGCTTCCCGAGCAGTGGAGAAATTTCATACATCCAGCTGGATTGACCCCAGTTAAAGCCCCGCTTTCCGTTAACAAGAGCCTCCATACCAAGCAGCAATGTTTAACGCCTCAAGTGATTCTAATCAATAATTCACTGGGTGGAAGCACTGTATTCAACAGCTCCGGTCTTTCGACGAACCCCAGTAAATTAGTTGTGTCCAATACGTCAATGTATGGAAGTCCTATAGAGGGCAATCAGACGGTTTGGGAATATTTAAGTGGACTACAACAGCATTCGATACAGTCTACTCCACCCTTGCAATTCTGGTTAAACGACGTAGCGGCATCATCAAGCTTTGCTGCTGTATCAAATAGTAGCTCCCCGAGCAAGCAAAGTTCAACAAGCAATCTAACTACGGTTGAACGCGTAGTGTCTATATTTCTTAGATCAATAGCTGTGCAGAAACTCGTTGGATTTCTGGTAAAAGCAGATCAAGGGAAAGTCAACCAGTCTGGGCGATTAACTACGCCAAATCGATCCTCCAGAATGGCCGATTTGGGAGCTACTCTCGATGCTAGTGGAAAACCTCAACAGGAAAATGAGGAGAAGAACCGTGCGATTTCTAATGAAACTGCCTCTCTAATAATTGCCTCATCAATAGAAGAACAGAGGAAGCCGGAAACGACAACAACCTCCACCGCTGAAGAACCCAAAAGATTGAAAGTGGCAAGAAATATAGAGTTTTCCACCATAATGAGCAGcagtttccaaaaatcaaataccaGTAGTGAGGTGGAGTTTTGCAGGAATGCTAGTGATATGCCCATTTGCCAGACCTCCCAAAGTGACGAAAATGATGGGCCTGTTGCTAGTGGGGATAATTCGCAAGCAATCGACTCTGAGAAGgacAATCCCGAAGATATCAATGAACTCTTAGTGGCCAGTACGACTCTAAAGCCTGATAGTAAATCTAATGCCAAGAGAAAGGTATCAACAGCGGAAAGGAAGAAAAACAAGCTGAGgaaggaatttttaacaaacttagCGATTGCCACTCCAGATAATCCCGACAACGAAAGACACAAAAACGAGATGTTTGCAGTGGCATACTACGATAAGCTTCGCGAGACTCTGGAATTCGAAGACTATCACAAAATAATGCgcattttgaatgattttggAGCGGGCGATGTAATCGATCTTTACAACGATGTACAGGCGATTCTGGTGCCCAAGTATCACGAACTTGCTGAAGATTTCCTATTCTTTCTTCGGCAAAAAGAAGCAGCTACAGTGGGGAAGTTAATTCCTTGGTTGCAAATGCAGACAAGAGTCAAGTTTCTGCGCAAACTGGAGGTTTGCTTCAAGGACCAACCAACACAGTTGAAGCGCGTCTATAACACTCTAATGGAGCTATCGAAGAACGAGAGTATCaacatggaaaaaataaaagccacGTTGATACCAATGTTAAAGggaagtaaaattttgatggaTTTGCTACTGCAGGGCTTTAAAGACGAACCGCCGCCGCCAAGtttattgGAGGGTCCTTACGAGACGATTGATATAAACAAAGAACTGGCGCGTCCAGATAATGAAGAAATGTATGAGACGTTTGTAGTGCCGAACACTGAAGACAAATACGGAGGCCAAAATTGCATCTGCCACTGCCACAGGATTGAAGACAATGAATACAAGAGTAGATTTAAACATTGCAACTCGTGTGGTCTAAAGtttgtcaATGGAAAACTTTACCTATCAGTAGGAAGATCATTCCAGCCGGCCACAATAGCATTTAAAACCAACCGGCATATTAATCATAATGCGCGATTAATGAGCAAATCCGCAACTGCTGGTTTTAGCCATAAAAAGAAACGACCTGATAACAGCCCTAATAAAATATCGGGCTTTACTGCCAAAGAAGCTCTAGAAGAAgaCACTGAAGATGAGGAATTgggaaaacggaaaaaatcgATATCCAGAACCCCAAGAAAGCGCGTCAAATTATCTTCGCCAAAAAAATCACCTGGACGATGTAGCGATTCAGCTGAAAACACAAAGCATAGAAAGCGCACATATTCGAGCAGAAAATCCAAGAAAGACGAGGGCAAAAGGCGAGACATGGAGACTGAAAATAGGCATGAACAAATGGAAGAACGAGAAGGCCAATCGGTGGAATTAAAAGCGGAAAAGTATCCGGTAGTTGCAGACGTCGATGAGAGCGAGCATGAGGCTAGTGAAGAACAACGAGAGAAATCGACAGAATACTGCATGGATTCATCTGGGGaatctttagaaaaatcaCTGACTCCCGAACAACACACGATGGAATCCGAAACAGAGTTAGACGTCGAGGAATCTTCACAAGACAACTACGAAAGTGATGAGTCCAGTTCTTCAACAGAAAGTACAAAAGGTTCCCAAAGCGATAGCAATACGAACGACGAACCTGCCTGGGGACGAGAGGAAGACACAATTATTCTGGAGACCATTCAAAAGGAGGACGATAAGGAATACGCCCTTCAAATTATATCAGATAAACTTCCAAATAGAACAGTCGCTCAAATCAGGAGTCGGCTCTCAAGGCTCGTTAATCTTTtgattgaaactttaaaaagcaaataa
Protein Sequence: MKLLEKTGIIDNPPDNLEQTENAEKVDFTKVLQPGTPSQGEQNVFERIEGEIERQLTDKAEKCNLTVLNVKNIIRQVLTNDHVKALLDKGTAEQAKQELSAFGPKLTRAKTKELLAARDIPIPQVKIPWIPVPPPSEALVLIGEDLKEDDSGDEYIPKKEIAKRDSVARSSDAATLPPPTPPTPMCTEDHATQTSNCTGDGVLKVPLATPAQGASVEVTNMALRTRSKINLSSTSLEDIEKAFIPPDITTDMYDMECDDDEWRNFLKGFTEPLDEVTKHTEDEELDPEYNIMADDQINQFDNEDFRMDKAVKITKKEVKELYEELFDYLNSLSEEYDGTNGTNENNQLSEIIEKSYHAMENPDFIPDAQQQQDTLQNLGTNQNATVLIDIKIELPQLQIIEQQMRQHVQMLTQNFFLTYEHPEYHSYSKTLKEYLLNLKFLANGKNYSMFSPVNLLPALDLIEKWEVLCASNSETVRQCREHVQQQLLKSIQYRMGRNWEFIATFPKLILETISNSEVFVYPGLLPKIPFKSQEFSSYRSSFTEAEDHLLAFSLDQFRNFLGNNTSTREVVSHVKELIMPHRDVTKIMRHIRNRKHPQSPSNPIQQYLLHNKLRPVVHYFYPLNEIVPPCKRCPEELPEQWRNFIHPAGLTPVKAPLSVNKSLHTKQQCLTPQVILINNSLGGSTVFNSSGLSTNPSKLVVSNTSMYGSPIEGNQTVWEYLSGLQQHSIQSTPPLQFWLNDVAASSSFAAVSNSSSPSKQSSTSNLTTVERVVSIFLRSIAVQKLVGFLVKADQGKVNQSGRLTTPNRSSRMADLGATLDASGKPQQENEEKNRAISNETASLIIASSIEEQRKPETTTTSTAEEPKRLKVARNIEFSTIMSSSFQKSNTSSEVEFCRNASDMPICQTSQSDENDGPVASGDNSQAIDSEKDNPEDINELLVASTTLKPDSKSNAKRKVSTAERKKNKLRKEFLTNLAIATPDNPDNERHKNEMFAVAYYDKLRETLEFEDYHKIMRILNDFGAGDVIDLYNDVQAILVPKYHELAEDFLFFLRQKEAATVGKLIPWLQMQTRVKFLRKLEVCFKDQPTQLKRVYNTLMELSKNESINMEKIKATLIPMLKGSKILMDLLLQGFKDEPPPPSLLEGPYETIDINKELARPDNEEMYETFVVPNTEDKYGGQNCICHCHRIEDNEYKSRFKHCNSCGLKFVNGKLYLSVGRSFQPATIAFKTNRHINHNARLMSKSATAGFSHKKKRPDNSPNKISGFTAKEALEEDTEDEELGKRKKSISRTPRKRVKLSSPKKSPGRCSDSAENTKHRKRTYSSRKSKKDEGKRRDMETENRHEQMEEREGQSVELKAEKYPVVADVDESEHEASEEQREKSTEYCMDSSGESLEKSLTPEQHTMESETELDVEESSQDNYESDESSSSTESTKGSQSDSNTNDEPAWGREEDTIILETIQKEDDKEYALQIISDKLPNRTVAQIRSRLSRLVNLLIETLKSK

Similar Transcription Factors

Sequence clustering based on sequence similarity using MMseqs2

100% Identity: -
90% Identity: -
80% Identity: -