Basic Information

Insect: Philonthus spinipes
Gene Symbol: -
Assembly: GCA_963082785.1
Location: OY720316.1:19131226-19135230[-]

Transcription Factor Domain

TF Family: MYB
Domain: Myb_DNA-binding domain
PFAM: PF00249
TF Group: Helix-turn-helix
Description: This family contains the DNA binding domains from Myb proteins, as well as the SANT domain family [1].
Hmmscan Out: # of c-Evalue i-Evalue score bias hmm coord from hmm coord to ali coord from ali coord to env coord from env coord to acc

1 2 1.7e-07 0.00038 21.8 0.0 3 45 3 49 1 50 0.93

2 2 1.1 2.5e+03 -0.0 0.2 3 14 62 73 61 78 0.82

#	of	c-Evalue	i-Evalue	score	bias	hmm coord from	hmm coord to	ali coord from	ali coord to	env coord from	env coord to	acc
1	2	1.7e-07	0.00038	21.8	0.0	3	45	3	49	1	50	0.93
2	2	1.1	2.5e+03	-0.0	0.2	3	14	62	73	61	78	0.82

Sequence Information

Coding Sequence: ATGTCCTGTTGGACGGAAGAAGAAGTTGAGGCTATAAAGAAATACATCGCTGAAAATGGAGTATTAAAAAAGGATGGACTCAAAAAACTACAAGACACCATACCTGGTCGAACTTCCGCCGCTATCAAGAAGAAGTATTTACAAATCAAGAATGAAGGAGCACGAACAACGGAAAAATGCGCAACATGGACGGAGGAAGAAGCGCGCGCATTGCGTGAAAGGTATGCCGaactttttcatataaaaaccaaaaaatCCAGAATGGAAATTTTGCAACCGCTATTTCCAAATCGATCAATAAAGGCAATGCAAACAAAATTACGGCAGGACCATCCTGAGATTTATTATGAAAGAACAACGCAACCTTTCGCGCCATCACCATTACGCGAAGAATCATCATCCGACGCGTCATCCTGTGCGCCCGAAAACAGGTCACAGCTACCTGTTTCACCACCCCTGAGAGAGACGAACGATGCGGAAATATCTCCATCGCATTCCAATGCACTGGGCGCAGGTAACACCAATGCATCCCCAAGCGCGCTTGCCGGCGCGAGCCCGCACCGTTTTCAGCTACCTGCTTCGCCCCTATGCACCCTTTCCAGTTCAGGGGCGTACCTTCCTACTTCTCCCGTAGCAGTGCCGTGCGGAGAACCAAGTGACGTCAGAGAGATAGGCGCCTCCACCACAGAGGGAACAAACCGCAACAATGGATTAGAAGATGACCCCAGCGGCGCGCCCGACCCCTCCGATGAAACAGAGCGGGAAACACAAACCACAGCATCCCTCCCACAACAAATAACCAAAGATGATACTAATAATTCAACCCATGCctcagattttaatattaatatgaaccATGTGCAATATGTTACAGATGAAGCCACAACACACAACCTTACAGCATCAACCTACAACCCCTCACCCCAAATCCCCACAGCCGAGAAAGAATTTAGGAAGATGGTAAACATCTTACAGACGAAAACCGCTCCTAAGAAACTACTTAAATTCCATATCAATCCAAACAACAAGCACTTAGAAACTGTAAACAGCATACTAGCCGCAAGAATTAACGCTATAACAAAAGAAGTAAAACGGCCCGGAAGGAGgcaccaaataattaaaattaatattctggCAGCTGCCTTTCTTTTACGCAAGCTAGTTGTCGGAAGGATTGGAAAAGAAAACAGGAAACCAAAACACATACACacggaaacaaaaattaaaaaattgcagaAACGAGTGGAAATCACAAAATCGATCCAATCACATACAATTGGACCAATCACGAAAAAACAGCATGACGAAATAAACGCAATGAAGAAACTTAGAATGAGGCCATGCCAGTACATAAAAACCACCCAAGACAGAATTCAACACCTTACGAGAAACCTTGAAGAACAAAAGAACCGGTACGAAACACTGAAACAGAGATTCAAATTCAGGCAGCAACCTTCTATTAAATGCTTggcaaacacaaataaaaacgaaaccGAGTGTTTGGATATAGAACGAGCGGATGAATTTTATACTAACTTATACAAGGGTATTCCGGACAATGAATCTCCCCGATTCGATAAGTGGACTCGTACCATTAAGAACACACACGCAAATAGGCACATAGACGACCAACTTTCTCTAGATGAAGTGAAGCGCGAAGTAGAGGAGGCTCTCGCCACGATAGCATTGTGGAAAGCCCCGGGGGCAGATAAAATACCAgcctttatatacaaaaatttaccCGCAGCTAAAGAGTACCTCATTCTTCATGTATATGAAACGCTAAACCGCCAATACATCACAACAACAGAGGACGTCAGCGCCAGAATAATCCTAATACACAAGGGAGGAGACGCAACAGATCCCAGTAATTATAGGCCAATTGCTTTATTAAAcactgactataaagtcaccaCCAAGATTATTGCAAACCGTATTCTAACTCACCTTCACGAAACAATAATACCACGAGAACAACTTGCGAGAAAGGGCATATGGGGAACCGTTCATGGAATGCTACTCGACAAGGCGATCACACAAACTGCAAACATGAGGCGACAAGAACACCACTCGGCTTGGTATGACTTTAGGAAAGCCTTCGACTCTATTCATCATACAAAGTTAAAACAACTGATATCAGCCCTCCCAATACCAGGAAAAATAACATCGCTCCTCCATCAGGTAATAGGGCAATGGAACTTAAAAATAGTAGGAAAAAATGCTACAAGCAGACACATTCCCGTTAGAAGAGGTGTATATCAGGGCGACTCACTAAGCCCCCTCCTATTCATCATTATAACAGCTGGAATGATTCATGATGTAAGCACCAACCCAACCATCACAAAAAGTTCTAAGGGCAGGCATCGAGTGATTGGGTTTGTGGACGATATCAAGTGTCACGCACCTGATGTCAACACGATGAACCTAATAACGACTCGCATAAAAGCATTAGGGCAAGAAATAGGTCTCGAACTCAATGAGAACAAATGTGGAACGTACAGCAAAACAGGAAACATAAAACAAGCATTTCTTCCAGTGGTACGTAGAGGATACAAATACCTTGGCATAGATCAGCTCGACAGGGACACCCCAGAAAATACCAAGCGAGTCGAAGAAAACGTAACTGCCAAGGCCAAGCATATACTGTCCTCACGCCTCACTACGTACCAGAAAAGAACAATATTTAACACCACAATCATTCCTGCTGCAATATACGTTATGGGAAACAGCTGTCCGAACGAGACAATTAAATCCACATTATCTAAATGTCGGAAAATAGACGGACTAATCAGACAGGTGATGATGCATGAAAACATCAAAACCCGTCCAACCTCAAACCAGCGAGCATATTTACCACACACAGTGGGAGGGTTGGGATTTCGCACCATCGAGGCAGAAACAGAAATTCAGTTCCTGCGCAAATACGCCTATCTGACAAGACATAACGAAATGCAGGACGTTCTAGAAATGTACAGAAAGCTTCACAGCACAGGACACCGCACACCAATTGGTGAATTCGCTTATGTCATGGAAAAGTACGGCCTATCTGACCCTTTGAACGACAATGACACCAATTGGGACTTCAAAACGTACGCACGCTCACTCATAAAGCAGTACAAATCTGCAGAATTGATGAAACGCAAGAGTGAGTGGACCAAGTCGATGAGGTACCCAAAACaggtaattgaaaatgaaaaagaaataatgtttcCAGCCGCCAAATATTACAAGACGGATTCATCCAAACTGTCGCTCATAAATGCAGCTGCAGAAGAAcagctatttattttaaacgcaAATCCGACATCAGACAACGATAAATGTCGACTTGGTTGCAACAGCAGAGAAACCAGCTATCATGTCGTATCTAGCTGCCctaagaaaaattataacactAGACACGATCAAGTGGTATATTGGCTTTTAAAAACGATCTTAGAAGCTACAGGTGCACCAGAAGGCATTAAAAATGAGCTGCAGTTTGGAAAATCCGTCATGAATGTTGAATATACAGGAATGGGATCACGCTTTAAAATCAGAGCAGGACAAAGCATCCTCACAGACAAAAAATTACACCACAACAAACCTGATATATTATTACAGCGTATTTATCCAAACCCTAAAGTGTACCTATTCGAGATATCCATCCCACATCTACAGAACTACAAAATACAGGAGACAATAAAACGcgttaaatacacaaaaaactCCTGTAAGGATATTTCACACCTCAACGCAACAACGGTTGAGagagatttaaatttagtagatgAAATGCGACATAAGTTTAGATGTGAGATTGATTTGGCCCTAATGATAATTGGAACGTATGGAGAAGTACTCCAAACAGAAGAGCATAAGCATTTTCAAAAAACCCTCATAGAAATTGGATGTCCAAAATACAAAGTGCAAACACTTCTCAATAGAGCATGCTACAGCGTAATCACTTCCACAACTCAGTTACTTCTAAAACACTCTCGGCTATCCTCAACTTTCCTACCCTAA
Protein Sequence: MSCWTEEEVEAIKKYIAENGVLKKDGLKKLQDTIPGRTSAAIKKKYLQIKNEGARTTEKCATWTEEEARALRERYAELFHIKTKKSRMEILQPLFPNRSIKAMQTKLRQDHPEIYYERTTQPFAPSPLREESSSDASSCAPENRSQLPVSPPLRETNDAEISPSHSNALGAGNTNASPSALAGASPHRFQLPASPLCTLSSSGAYLPTSPVAVPCGEPSDVREIGASTTEGTNRNNGLEDDPSGAPDPSDETERETQTTASLPQQITKDDTNNSTHASDFNINMNHVQYVTDEATTHNLTASTYNPSPQIPTAEKEFRKMVNILQTKTAPKKLLKFHINPNNKHLETVNSILAARINAITKEVKRPGRRHQIIKINILAAAFLLRKLVVGRIGKENRKPKHIHTETKIKKLQKRVEITKSIQSHTIGPITKKQHDEINAMKKLRMRPCQYIKTTQDRIQHLTRNLEEQKNRYETLKQRFKFRQQPSIKCLANTNKNETECLDIERADEFYTNLYKGIPDNESPRFDKWTRTIKNTHANRHIDDQLSLDEVKREVEEALATIALWKAPGADKIPAFIYKNLPAAKEYLILHVYETLNRQYITTTEDVSARIILIHKGGDATDPSNYRPIALLNTDYKVTTKIIANRILTHLHETIIPREQLARKGIWGTVHGMLLDKAITQTANMRRQEHHSAWYDFRKAFDSIHHTKLKQLISALPIPGKITSLLHQVIGQWNLKIVGKNATSRHIPVRRGVYQGDSLSPLLFIIITAGMIHDVSTNPTITKSSKGRHRVIGFVDDIKCHAPDVNTMNLITTRIKALGQEIGLELNENKCGTYSKTGNIKQAFLPVVRRGYKYLGIDQLDRDTPENTKRVEENVTAKAKHILSSRLTTYQKRTIFNTTIIPAAIYVMGNSCPNETIKSTLSKCRKIDGLIRQVMMHENIKTRPTSNQRAYLPHTVGGLGFRTIEAETEIQFLRKYAYLTRHNEMQDVLEMYRKLHSTGHRTPIGEFAYVMEKYGLSDPLNDNDTNWDFKTYARSLIKQYKSAELMKRKSEWTKSMRYPKQVIENEKEIMFPAAKYYKTDSSKLSLINAAAEEQLFILNANPTSDNDKCRLGCNSRETSYHVVSSCPKKNYNTRHDQVVYWLLKTILEATGAPEGIKNELQFGKSVMNVEYTGMGSRFKIRAGQSILTDKKLHHNKPDILLQRIYPNPKVYLFEISIPHLQNYKIQETIKRVKYTKNSCKDISHLNATTVERDLNLVDEMRHKFRCEIDLALMIIGTYGEVLQTEEHKHFQKTLIEIGCPKYKVQTLLNRACYSVITSTTQLLLKHSRLSSTFLP

Similar Transcription Factors

Sequence clustering based on sequence similarity using MMseqs2

100% Identity: iTF_01186146; iTF_01186147; iTF_01186148;
90% Identity: iTF_01186146; iTF_01186147; iTF_01186148;
80% Identity: iTF_01186146;