Basic Information

Insect: Scrobipalpa costella
Gene Symbol: Smad4_1
Assembly: GCA_949820665.1
Location: OX463295.1:7160884-7162511[+]

Transcription Factor Domain

TF Family: MH1
Domain: MH1 domain
PFAM: PF03165
TF Group: Unclassified Structure
Description: The MH1 (MAD homology 1) domain is found at the amino terminus of MAD related proteins such as Smads. This domain is separated from the MH2 domain by a non-conserved linker region. The crystal structure of the MH1 domain shows that a highly conserved 11 residue beta hairpin is used to bind the DNA consensus sequence GNCN in the major groove, shown to be vital for the transcriptional activation of target genes. Not all examples of MH1 can bind to DNA however. Smad2 cannot bind DNA and has a large insertion within the hairpin that presumably abolishes DNA binding. A basic helix (H2) in MH1 with the nuclear localisation signal KKLKK has been shown to be essential for Smad3 nuclear import. Smads also use the MH1 domain to interact with transcription factors such as Jun, TFE3, Sp1, and Runx [2, 1].
Hmmscan Out: # of c-Evalue i-Evalue score bias hmm coord from hmm coord to ali coord from ali coord to env coord from env coord to acc

1 5 3.9e-16 2.9e-12 47.9 0.2 2 61 33 91 32 100 0.88

2 5 0.11 7.9e+02 1.6 0.0 31 31 172 172 129 212 0.63

3 5 0.069 5e+02 2.2 0.0 36 61 263 287 205 293 0.74

4 5 0.041 3e+02 2.9 0.1 38 61 349 371 292 417 0.72

5 5 2.9e-06 0.021 16.3 0.0 20 46 425 451 411 451 0.87

#	of	c-Evalue	i-Evalue	score	bias	hmm coord from	hmm coord to	ali coord from	ali coord to	env coord from	env coord to	acc
1	5	3.9e-16	2.9e-12	47.9	0.2	2	61	33	91	32	100	0.88
2	5	0.11	7.9e+02	1.6	0.0	31	31	172	172	129	212	0.63
3	5	0.069	5e+02	2.2	0.0	36	61	263	287	205	293	0.74
4	5	0.041	3e+02	2.9	0.1	38	61	349	371	292	417	0.72
5	5	2.9e-06	0.021	16.3	0.0	20	46	425	451	411	451	0.87

Sequence Information

Coding Sequence: ATGAACGCCACGGCGCCAACTTCAGCTGACGCGTGCCTGAGTATCGTGCATTCGCTGATGTGCCACCGCCAGGGAGGAGAGTCCGAAGGCTTCTCCAAGCGTGCCATAGAATCACTCGTCAAGAAGCTGAAGGAGAAACGCGACGAGCTGGACTCCCTCATCACCGCGATCACCACCAACGGCGCGCACCCCAGCAAGTGTGTCACCATACAGCGCACTCTAGACGGCAGGCTGCAGCGCACTCTGGACCTCAGGCTGCAGGTAACATTCTGCTGGATAGCCGCTCGTCAACAAGCTGAAGGAGaagcgagacgagctggactcCCTCAGCACCGCGATCACCACCATACAGCGCACTCTGGACGGCAGGCTGCAGGTAACATTCTAGCCGCTCGTCAACAAGCTGAAGAAGgagcgagacgagctggactcCTCATCACCGCGATCACCACCATACAGCGCACTCTGGACGGCAGGCTGCAGGTAACATTCTGCTGGATAGCCGCTCGTCAACAAGCTGAAGAAGgagcgagacgagctggactcCTCATCACCGCGATCACCACCATACAGCGCACTCTGGACGGCAGGCTGCAGGTAACATTCTGCTGGATAGCCGCTCGTCAACAAGCTGAAGAAGgagcgagacgagctggactcCTCATCACCGCGATCACCACCATACGGCGCACTCTGGACGGCAGGCTGCAGGTAACATTCTGCTGGATAGCCGCTCGTCAACAAGCTGAAGAAGgagcgagacgagctggactcCTCATCACCGCGATCACCACCATACAGCGCACTCTGGACGGCAGGCTGCAGCGCACTCTGGACGGCAGGCTACAGGTAACATTCTGCTGGATAGCCGCTCGTCAACAAGCTGAAGAAGgagcgagacgagctggactcCTCATCACCGCGATCACCACCATACAGCGCACTCTGGACGGCAGGCTGCAGGTAACATTCTGCTGGATAGCCGCTCGTCAACAAGCTGAAGAAAgagcgagacgagctggactcCTCATCACCGCGATCACCACCATACAGCGCACTCTAGACGGCAGGCTGCAGCGCACTCTGGACGGCAGGCTGCAGGTAACATTCTGCTGGATAGCCGCTCGTCATCAAGCTGAAGAAGgagcgagacgagctggactcCTCATCACCGCGATCACCACCATACAGCGCACTCTGGACGGCAGGCTGCAGGTAACATTCTGCTGGATAGCCGCTCGTCAACAAGCTGAAGAAGgagcgagacgagctggactcCTCATCACCGCGATCACCACCAACGGCGCGCACCCCAGCAAGTGCGTCACCATACAGCGTGCTCTGGACGGCAGGTAA
Protein Sequence: MNATAPTSADACLSIVHSLMCHRQGGESEGFSKRAIESLVKKLKEKRDELDSLITAITTNGAHPSKCVTIQRTLDGRLQRTLDLRLQVTFCWIAARQQAEGEARRAGLPQHRDHHHTAHSGRQAAGNILAARQQAEEGARRAGLLITAITTIQRTLDGRLQVTFCWIAARQQAEEGARRAGLLITAITTIQRTLDGRLQVTFCWIAARQQAEEGARRAGLLITAITTIRRTLDGRLQVTFCWIAARQQAEEGARRAGLLITAITTIQRTLDGRLQRTLDGRLQVTFCWIAARQQAEEGARRAGLLITAITTIQRTLDGRLQVTFCWIAARQQAEERARRAGLLITAITTIQRTLDGRLQRTLDGRLQVTFCWIAARHQAEEGARRAGLLITAITTIQRTLDGRLQVTFCWIAARQQAEEGARRAGLLITAITTNGAHPSKCVTIQRALDGR

Similar Transcription Factors

Sequence clustering based on sequence similarity using MMseqs2

100% Identity: -
90% Identity: -
80% Identity: -