Basic Information

Insect: Empoasca onukii
Gene Symbol: dsx_3
Assembly: GCA_018831715.1
Location: CM032058.1:35503439-35533528[+]

Transcription Factor Domain

TF Family: DM
Domain: DM domain
PFAM: PF00751
TF Group: Zinc-Coordinating Group
Description: The DM domain is named after dsx and mab-3 [2]. dsx contains a single amino-terminal DM domain, whereas mab-3 contains two amino-terminal domains. The DM domain has a pattern of conserved zinc chelating residues C2H2C4 [1]. The dsx DM domain has been shown to dimerise and bind palindromic DNA [3].
Hmmscan Out: # of c-Evalue i-Evalue score bias hmm coord from hmm coord to ali coord from ali coord to env coord from env coord to acc

1 1 1.1e-24 7.8e-21 74.9 9.1 2 47 336 381 335 381 0.97

#	of	c-Evalue	i-Evalue	score	bias	hmm coord from	hmm coord to	ali coord from	ali coord to	env coord from	env coord to	acc
1	1	1.1e-24	7.8e-21	74.9	9.1	2	47	336	381	335	381	0.97

Sequence Information

Coding Sequence: ATGTTTGTAGGACGAGTAGTACTTTGTCTCCACGTGGCGAACCTTGACCTTCCCCTGGAGATTATGCAACGCTCAAGGTCATGCCTGCATCAATCTCAAGTTGTTGAACTATCTCCATCTCACATCGCCTCTTCCGCTATCGCGAGCTCATATCACTTCACTTCTGTCCCACTATCACTAGTCACTTCCAAGACACAGGCTGGTGCCGTTGTAAACGGCGTACCAGCTGAGAAGCAACGGGTGGCTTCAGACAGTAGCCTAGCCAGCGTTACCAAGAGGGGAGTCCAGGACCGTGAAAAACTAAAGAGCTGCTGGTGTagAATTGTAGGCCTGCAGGCGAGAAGTAGAAGATGTACACATTACTCTGCGGAGAAGCAATGGTGCGATTTCCGGTTCCGGTTGCCAAGGCTTCGTGGCGtggactCAAATACTTGTGCGTCAGCAGAGTTGACCTACGGGGTACAACCGTCTGGGAGCGGACAGAGCGTCTCTTCACCATCCCTGACTGAGACCTTCGCCCCGCTCCAGGACCGACTTCAGGAGGACATCAGCTTCGAGTTTTCGTTGATCGCTTCTCCTAAGTTAGTGATTTCAAGAAGAGTGCATAACTTGCATACATGGGACTTGGCATTATGGAAGGGTGAATCTTCTGAGCTAAAGACCGCAAACTCCACTGGCCCAGAAAAGTGTTCCTGGGCTTATAGTGTTGAGTGTCACGTACACGTAGAGGAGTTATCACCCGGTGCAGCCTGCACTCGCAGTCTCGACAACGGCAGCGGGGGAAGTCGTAAACCGAGCTCGGCGCGCTCACCGCACCGCCAGCGCCAGTCGACAACTGAGTGTGGAGTGAGCCAGAGTGCATCTGCAGTCGGCCTCTGCCTCACGTGTGTGCGCGCGATGGAAGCGAGAGACGTGTCCGCAGAGTTAGACTTGAGTACCAGAGGTGCTGCCGGTGCCAGTGGCTACTCCAACTCTTCAGTAGGCCAAGGTCAGAACTCGCGCACACCACCGAACTGCGCCCGTTGTCGCAACCACGACATCATCCTCCCGCTCAAGGGACACAAGAGATATTGCAAGTTCATCAACTGCAACTGTGAAAAATGCAAGCTGACCGCCGAGCGCCAGAAGGTGATGGCTCGACAGACTGCTATACGGAGGGCGGAGGAACAGGACCGCCAGAGGCTAAGGGTGGGTCTGCCGGTGCCGGGGAGAGACAACAGGATAGTGACTGCGAGCATGTCCCCTACCTCGGAGGGTGAGACTTCCAACTCTTCACACATAGACATCACAACCTCCAGGAGCTCGCTGACCGCCCCCGGCCCGCCACCTCCGGCACCCCCGGATGACATCGTCACCACCGTCCCGTCCGAACCCATCATTAGGCTGGACTCCACCAGCTGTCTATCAACGTGCAAGACATCTGTACAGCGGCCATGGAGTATCATTAGAGGAGTAATTGTAGATGTTACCACTGGGGTCACCTGCTGGACTGCATTCCCGGCTCTACAGCGAGTTCCGTCTTTCAGGAACTGA
Protein Sequence: MFVGRVVLCLHVANLDLPLEIMQRSRSCLHQSQVVELSPSHIASSAIASSYHFTSVPLSLVTSKTQAGAVVNGVPAEKQRVASDSSLASVTKRGVQDREKLKSCWCRIVGLQARSRRCTHYSAEKQWCDFRFRLPRLRGVDSNTCASAELTYGVQPSGSGQSVSSPSLTETFAPLQDRLQEDISFEFSLIASPKLVISRRVHNLHTWDLALWKGESSELKTANSTGPEKCSWAYSVECHVHVEELSPGAACTRSLDNGSGGSRKPSSARSPHRQRQSTTECGVSQSASAVGLCLTCVRAMEARDVSAELDLSTRGAAGASGYSNSSVGQGQNSRTPPNCARCRNHDIILPLKGHKRYCKFINCNCEKCKLTAERQKVMARQTAIRRAEEQDRQRLRVGLPVPGRDNRIVTASMSPTSEGETSNSSHIDITTSRSSLTAPGPPPPAPPDDIVTTVPSEPIIRLDSTSCLSTCKTSVQRPWSIIRGVIVDVTTGVTCWTAFPALQRVPSFRN*

Similar Transcription Factors

Sequence clustering based on sequence similarity using MMseqs2

100% Identity: -
90% Identity: -
80% Identity: -