Basic Information

Insect: Macrophya alboannulata
Gene Symbol: snpc-4_1
Assembly: GCA_949628255.1
Location: OX451210.1:14418728-14421487[-]

Transcription Factor Domain

TF Family: MYB
Domain: Myb_DNA-binding domain
PFAM: PF00249
TF Group: Helix-turn-helix
Description: This family contains the DNA binding domains from Myb proteins, as well as the SANT domain family [1].
Hmmscan Out: # of c-Evalue i-Evalue score bias hmm coord from hmm coord to ali coord from ali coord to env coord from env coord to acc

1 5 0.085 1.5e+02 3.5 0.0 16 43 254 286 248 289 0.75

2 5 2.5e-11 4.4e-08 34.0 0.1 1 45 295 341 295 342 0.97

3 5 1.1e-10 2e-07 31.9 0.1 3 44 352 397 350 399 0.96

4 5 4e-11 7.1e-08 33.3 0.0 1 45 405 450 405 451 0.94

5 5 1.8e-12 3.2e-09 37.6 0.2 1 41 455 495 455 496 0.97

#	of	c-Evalue	i-Evalue	score	bias	hmm coord from	hmm coord to	ali coord from	ali coord to	env coord from	env coord to	acc
1	5	0.085	1.5e+02	3.5	0.0	16	43	254	286	248	289	0.75
2	5	2.5e-11	4.4e-08	34.0	0.1	1	45	295	341	295	342	0.97
3	5	1.1e-10	2e-07	31.9	0.1	3	44	352	397	350	399	0.96
4	5	4e-11	7.1e-08	33.3	0.0	1	45	405	450	405	451	0.94
5	5	1.8e-12	3.2e-09	37.6	0.2	1	41	455	495	455	496	0.97

Sequence Information

Coding Sequence: atgagcGATTTAGAGGACGAAGATGTAATTCTCGACGACATAAAAGCGTTGCAGGCGGTTTTAACCCAGAAACAAACAGCTCGAGTTAAAGTAGAGATAAAATCGGAAGATAGAATTTCGTTAACACCTAACCTATGCGAACCATCGACAtcaaaatccatcgatatccACCCTTCAACGTCGAACACGATTGAAGATTTAGCGGAAGCAGAAGAGAGCGATAATGAATGTAACTCTGAATCCGAAGAAGATGACGACGATTTAGAGAATTTATCAGACCCGGAAGCTGcgttaaatttgaataaaaaaatcgtacatcTTTTAGCAACAGCTCAAAGTCGTCTCCATCTCCTTCTAAAAGAATGTAAAAGACGCCAATCATTAATAGACCAAAAAATACGTCAAAGAACTTCTGATCCACTAACTAGAACGCTTTTAACAGTAACTGGAATTCCTTATTTCAAAGACAAGCAGCATTTTCCAGCGCCACAGAATGAAGATGCAAAATTAAAGATGAGACGTGGAGAGTTGCAAATTATTGACTTGCCTTGTCCTCTGCGGTGGACATTGAAAGACAGGAATACATTATGGGAAGCAATTGCTTGGAATGCAAGAATCATTTATCACGAAGAACTGAGACAGCGGGAGCCCcgtgataatgaaaattcattgaataattCAGAAGATCCTCTGAGGCTGGACCATAATTATAGGGataaaaaattacttgaaGAAACGCTTAGGAACATTAAACCTTTGGTTGGTACATTGGGATGCAAAGAATTTGATTGGTTGAAAATAGCGGCGACTGATTTCAACGGAAGACATTCTGCCAACGAGTGCAGGGCGATGTGGAACGTATTTTTACACCCTGATATAAATAAAGGGAAATGGAAAAAGACTGAGGATTCTATTCTCAAGTCACTAGCCGAAGAATACAACTTTCAGAATTGGGACCTGGTGGCTAGTAGATTAGGAACAAACCGAAGCGGATATCAGTGCTTCATTAGatttaatacaaattttaaaaacaatatgTGCAGCAGAAATAGTTCGTGGTCAAAAGAAGAGGACCAGAAACTTACGGATGCTGTAAACGCCTTGAGAACTGGTAATTTTATTCCGTGGGGCGAAGTAGCCAAAGTAATGGGAGATAGAAGGAAACAGCAGATTTATATGCGATGGAATTACAGCTTAGCACCGAACTTAAAAAAGGGTAGATTCACTGAGGAAGAGGATAGGCTGCTTCTTCAAGGAGTTGCCAAATTTGGATCTAATTTTACTAAAATTTCTGTGGCCCTATTGCCACAGAGAAATACTGCGCAGTTAAACGATCACTACAGAACTCTtatgaatgagaaaaagaacaaTTGGAACTGCGAGGACGACATGAAATTGGTCAAGCTGTTCGACAAGTTTGGTAATAATTGGTCAGCTATTGCCAAAGAATTTGCAAACAAGTCTAGAGTACAAGTCAGACATCGGCATACTGCGATTATCCGATATCTTAGCAGAGGCCTTTCTATAAGGACTATACCTAGGTGGGGTCCCAAAATAGAAGTCAAAGATACTCAAGAAGATATATTGAACCGTGGAGAAAGGATGCTCGATGAGATGAGCGAGATGATGATGATTCAgcagagaaataaagaagaagcaAGGAGAGAGCAACTGTCTAAAATCGACCAGGAACTGAGAGATTATTTCAAAGCAATATATCGATCTCCTTCTAAACTCGGGAGACACAAGAAATTTTACTCTATTGAAGAGGTTGACGGAAAAACTCAGAAACTTAACATCATTTTGAATATGTTAAAAGCTGATCTTGATATTCCTGATGACTTAGAGGAGGAAGTATTCTTGACGGAGAAAGACAAGCAGCTACTAACTTCCTTGAAAGCATTTTCAAGAACTGAAACTTCGGAATCTGAGGCCCAACAAAAATACTTAGAACACATTAGGCGGAAGATGTTTGGATCATTAATTCCGTCAGCGAGTGCAGATCGTTTCATACCACCATTACCATTCAATGGAAAAGTCCAGAGAACTAAAGGAAAAAAGCTTGTAGGAATAAACTATTTTCCTAGTGGAGATAAATGTCTCGCCGAAATCAATCACGAACTTAATACACCAGAGACAATTATATCGTTAATCGGCGGCTGGGAAACCGAATTAGAATTTAATAATATGGAAAAGATATTTATTTCCGAGACTGAACAATCCAAAGAAGATTTATCTACGACAAATACTACTTTTGACCCTAATGCCCCAAGTACCTCTGGGATTGTTATCAATGAAAGTAGGAATGTTGGGCAGGAAATTTTATCGAACACAGAACAATCATCTCAAATAATCAGaagaaatttgtcaaaatattatCCAGAAGTTTTAATACCACCAAACTATACAACATTACTAGGTTTTCGCGGTTTATTGTTATCGAAACATATTCTTGAGGCAGAGGCTTCGGAAGAAGACGAATacgaagaagcagaagaatgTGTGATGACACCAGAGGGAGAAAAGGCTTTGGAATTATTTGAGGAGCGTCTGGTTAAACTCTTCAAATTTCCTATAGAATTGTCAGAAATAGCGCCGCCTGTATTACACGTATCACAAAATAGAGGATTCAATGATAGTGACAATGATGATGATTgcgggaaaaaaagaaaagcaaataAGACAAACTCCGGACCAGCAGCTAAGAGGAAAgcaaaagtcgaaaaaattgatgttgcAGAAAATTCCGAGGCTCAATAA
Protein Sequence: MSDLEDEDVILDDIKALQAVLTQKQTARVKVEIKSEDRISLTPNLCEPSTSKSIDIHPSTSNTIEDLAEAEESDNECNSESEEDDDDLENLSDPEAALNLNKKIVHLLATAQSRLHLLLKECKRRQSLIDQKIRQRTSDPLTRTLLTVTGIPYFKDKQHFPAPQNEDAKLKMRRGELQIIDLPCPLRWTLKDRNTLWEAIAWNARIIYHEELRQREPRDNENSLNNSEDPLRLDHNYRDKKLLEETLRNIKPLVGTLGCKEFDWLKIAATDFNGRHSANECRAMWNVFLHPDINKGKWKKTEDSILKSLAEEYNFQNWDLVASRLGTNRSGYQCFIRFNTNFKNNMCSRNSSWSKEEDQKLTDAVNALRTGNFIPWGEVAKVMGDRRKQQIYMRWNYSLAPNLKKGRFTEEEDRLLLQGVAKFGSNFTKISVALLPQRNTAQLNDHYRTLMNEKKNNWNCEDDMKLVKLFDKFGNNWSAIAKEFANKSRVQVRHRHTAIIRYLSRGLSIRTIPRWGPKIEVKDTQEDILNRGERMLDEMSEMMMIQQRNKEEARREQLSKIDQELRDYFKAIYRSPSKLGRHKKFYSIEEVDGKTQKLNIILNMLKADLDIPDDLEEEVFLTEKDKQLLTSLKAFSRTETSESEAQQKYLEHIRRKMFGSLIPSASADRFIPPLPFNGKVQRTKGKKLVGINYFPSGDKCLAEINHELNTPETIISLIGGWETELEFNNMEKIFISETEQSKEDLSTTNTTFDPNAPSTSGIVINESRNVGQEILSNTEQSSQIIRRNLSKYYPEVLIPPNYTTLLGFRGLLLSKHILEAEASEEDEYEEAEECVMTPEGEKALELFEERLVKLFKFPIELSEIAPPVLHVSQNRGFNDSDNDDDCGKKRKANKTNSGPAAKRKAKVEKIDVAENSEAQ

Similar Transcription Factors

Sequence clustering based on sequence similarity using MMseqs2

100% Identity: iTF_00939476;
90% Identity: iTF_00939476;
80% Identity: -