Basic Information

Gene Symbol
-
Assembly
GCA_029286605.1
Location
JAGSMR010000046.1:1173575-1184556[-]

Transcription Factor Domain

TF Family
MH1
Domain
MH1 domain
PFAM
PF03165
TF Group
Unclassified Structure
Description
The MH1 (MAD homology 1) domain is found at the amino terminus of MAD related proteins such as Smads. This domain is separated from the MH2 domain by a non-conserved linker region. The crystal structure of the MH1 domain shows that a highly conserved 11 residue beta hairpin is used to bind the DNA consensus sequence GNCN in the major groove, shown to be vital for the transcriptional activation of target genes. Not all examples of MH1 can bind to DNA however. Smad2 cannot bind DNA and has a large insertion within the hairpin that presumably abolishes DNA binding. A basic helix (H2) in MH1 with the nuclear localisation signal KKLKK has been shown to be essential for Smad3 nuclear import. Smads also use the MH1 domain to interact with transcription factors such as Jun, TFE3, Sp1, and Runx [2, 1].
Hmmscan Out
# of c-Evalue i-Evalue score bias hmm coord from hmm coord to ali coord from ali coord to env coord from env coord to acc
1 28 0.0015 8.2 7.3 0.0 55 80 288 313 258 322 0.77
2 28 0.0003 1.6 9.5 0.1 29 81 361 409 353 418 0.74
3 28 0.0077 42 5.0 0.2 57 78 421 442 408 444 0.78
4 28 0.0027 15 6.5 0.0 55 80 472 497 458 506 0.76
5 28 0.0024 13 6.6 0.6 31 76 522 563 515 589 0.61
6 28 0.0029 16 6.4 0.1 59 82 591 614 584 621 0.79
7 28 0.016 85 4.0 1.3 58 79 633 656 611 666 0.57
8 28 0.0026 14 6.5 0.1 58 82 667 691 659 698 0.78
9 28 0.0028 15 6.4 0.2 58 81 699 722 689 732 0.80
10 28 0.0021 12 6.8 0.1 58 82 735 759 723 767 0.78
11 28 0.0027 15 6.5 0.2 58 82 767 791 757 798 0.79
12 28 0.0027 15 6.4 0.1 58 82 799 823 792 830 0.79
13 28 0.0026 14 6.5 0.1 58 82 831 855 823 862 0.78
14 28 0.0035 19 6.1 0.1 59 80 864 885 857 894 0.80
15 28 0.00096 5.3 7.9 0.1 48 82 903 937 885 945 0.73
16 28 0.00095 5.2 7.9 0.1 50 80 973 1003 953 1011 0.70
17 28 0.0025 14 6.6 0.1 58 80 1115 1137 1101 1146 0.79
18 28 0.001 5.7 7.8 0.2 51 82 1148 1179 1135 1186 0.71
19 28 0.0029 16 6.4 0.1 59 82 1188 1211 1181 1218 0.79
20 28 0.068 3.7e+02 2.0 0.1 58 80 1219 1241 1212 1249 0.80
21 28 0.022 1.2e+02 3.5 0.1 58 80 1283 1305 1268 1313 0.80
22 28 0.0041 23 5.9 0.0 57 82 1474 1500 1464 1507 0.79
23 28 0.0023 13 6.7 0.1 58 81 1579 1602 1564 1611 0.79
24 28 0.0092 50 4.8 0.1 58 82 1711 1735 1694 1744 0.81
25 28 0.0035 19 6.1 0.1 59 82 1784 1807 1774 1815 0.81
26 28 0.16 8.7e+02 0.8 0.1 58 73 1816 1831 1809 1846 0.74
27 28 0.78 4.3e+03 -1.4 0.0 55 71 1847 1864 1828 1879 0.77
28 28 0.015 83 4.1 0.1 59 76 1887 1904 1874 1912 0.80

Sequence Information

Coding Sequence
ATGGTCGATCCAACCCCGAAAAACGTTAAATCAGTGAAAAGTAGATTAGAtacaataaatcaaaatgaAGAATCCAGTCACAAAAGATCATCCACTATGAACAAAGTACAGTCGCACTTTCTGGTTCCATCGGAGAAGTTGGACAAAGTTACAAGACGTGTCATCGCGCCATACGCTCAGATCGAGAGGAAAGGCCTGAAGGATGACGATGCCAAACCGGGAACGTACTTAGATATTAATAGGTTCAACGTATTCTTAGAAGATAGCGTGGATCTGGATTCACTGTTGTATGAGACCGCGATGGTTCTTAAAACTGTCACAAATAGTTCAGGTGTATTTGTTTATACCGTAGACAAGATTAGAAATGAAATAGTTCTGATGACGCAAAACACGAAGAACCCAGAGCGCCACGAGGTGAATATACCCATAGAAGAAGGCAAGATAGCAGCGGCCCACGCGGCAGCTACAAAGCAGTATCTCCTTCTAGAAGATGTGCAGAAGGATCGGCGGTTTTCAGAGGGCCTCAAATGGGTGGACGCCAAGGTTGCTCTGTGTATGCCTGTTGTTAAGCCGGATGGCGACTGCTATGCTATCCTGGAACTATACAGGACCTACAGTGAACCGTACGATGATAACGTCGTGTACACAGCCGTGAGCGTCTCGTGCTGGGCGGGCGCGGCGGTGCACCAGGCGCAGGCGCGAATCACTCTTCAGAGGAGCACGCACCTCAACATGGAGCTGAGAGCTTTGCTGCAGAAGTATTTCTGCGACCTCGCTTCCATAGACACCATGCTCACTGATATGCtgGCAACAGTTAAGGTGctcctctgtctctctctctctctctctctctctgcgcgcCTCGCCGCGCTGGTGGCCGAGCGCCAGTTCCGCTGGCCCGACCTCGCGCACCGCCGCCTGCTCAAGGTGctcctctgtctctctctctctctctctctctctctctctctctctctctctctctctctgcgcgcCTCGCCGCGCTGGTGGCCGAGCGCCAGTTCCGCTGGCCCGACCTCGCGCACCGCCGCCTGCTCAAGTTCCGCTGGCCCGACCTCGCGCACCGCCGCCTGCTCAAGGTGCTCCTctgtctctgtctctctctctctctctctctctgcgcgcCTCGCCGCGCTGGTGGCCGAGCGCCAGTTCCGCTGGCCCGACCTCGCGCACCGCCGCCTGCTCAAGGTGctcctctgtctctctctctctctctctctctctgcgcgcCTCGCCGCGCTGGTGGCCGAGCGCCAGTTCCGCTGGCCCGACCTCGCGCACCGCCGCCTGCTCAAGGTGctcctctTTCCGCTGGCCCGACCTCGCGCACCGCCGCCTGCTCAAGGTGctcctctgtctctctctctctctctctctctctctgcgcgcCTCGCCGCGCTGGTGGCCGAGCGCCAGTTCCGCTGGCCCGACCTCGCGCACCGCCGCCTGCTCAAGGtgctcctctctctctctctctctctgcgcgcCTCGCCGCGCTGGTGGCCGAGCGCCAGTTCCGCTGGCCCGACCTCGCGCACCGCCGCCTGCTCAAGGTGctcctctgtctctctctctctctctctctctctctctgcgcgcCTCGCCGCGCTGGTGGCCGAGCGCCAGTTCCGCTGGCCCGACCTCGCGCACCGCCGCCTGCTCAAGTTCCGCTGGCCTGACCTCGCGCACCGCCGCCTGCTCAAGGTGctcctctgtctctctctctctgcgcgcCTCGCCGCGCTGGTGGCCGAGCGCCAGTTCCGCTGGCCCGACCTCGCGCACCGCCGCCTGCTCAAGGTGctcctctgtctctctctctctgcgcgcCTCGCCGCGCTGGTGGCCGAGCGCCAGTTCCGCTGGCCTGACCTCGCGCACCGCCGCCTGCTCAAGTTCCGCTGGCCTGACCTCGCGCACCGCCGCCTGCTCAAGGTGctcctctgtctctctctctctgcgcgcCTCGCCGCGCTGGTGGCCGAGCGCCAGTTCCGCTGGCCCGACCTCGCGCACCGCCGCCTGCTCAAGGTGctcctctgtctctctctctctgcgcgcCTCGCCGCGCTGGTGGCCGAGCGCCAGTTCCGCTGGCCCGACCTCGCGCACCGCCGCCTGCTCAAGGTGctcctctGTGctcctctgtctctctctctctctgcgcgcCTCGCCGCGCTGGTGGCCGAGCGCCAGTTCCGCTGGCCCGACCTCGCGCACCGCCGCCTGCTCAAGGTGctcctctgtctctctctctctgcgcgcCTCGCCGCGCTGGTGGCCGAGCGCCAGTTCCGCTGGCCTGACCTCGCGCACCGCCGCCTGCTCAAGGTGctcctctgtctctctctctctgcgcgcCTCGCCGCGCTGGTGGCCGAGCGCCAGTTCCGCTGGCCCGACCTCGCGCACCGCCGCCTGCTCAAGGTGctcctctgtctctctctctctgcgcgcCTCGCCGCGCTGGTGGCCGAGCGCCAGTTCCGCTGGCCTGACCTCGCGCACCGCCGCCTGCTCAAGGTGctcctctgtctctctctctctgcgcgcCTCGCCGCGCTGGTGGCCGAGCGCCAGTTCCGCTGGCCCGACCTCGCGCACCGCCGCCTGCTCAAGGTGctcctctgtctctctctctctctctctctctctctctctctctctctctctctctctctctctctctctctctctgcgcgcCTCGCCGCGCTGGTGGCCGAGCGCCAGTTCCGCTGGCCTGACCTCGCGCACCGCCGCCTGCTCAAGGTGctcctctgtctctctctctctctgcgcgcCTCGCCGCGCTGGTGGCCGAGCGCCAGTTCCGCTGGCCCGACCTCGCGCACCGCCGCCTGCTCAAGGTGctcctctgtctctctctctctctctctctctgcgcgcCTCGCCGCGCTGGTGGCCGAGCGCCAGTTCCGCTGGCCTGACCTCGCGCACCGCCGCCTGCTCAAGGTGctcctctGTGctcctctgtctctctctctctgcgcgcCTCGCCGCGCTGGTGGCCGAGCGCCAGTTCCGCTGGCCCGACCTCGCGCACCGCCGCCTGCTCAAGGTGctcctctgtctctctctctctctctctgcgcgcCTCGCCGCGCTGGTGGCCGAGCGCCAGTTCCGCTGGCCCGACCTCGCGCACCGCCGCCTGCTCAAGGTGctcctctgtctctctctctctgcgcgcCTCGCCGCGCTGGTGGCCGAGCGCCAGTTCCGCTGGCCCGACCTCGCGCACCGCCGCCTGCTCACGGTGctcctctgtctctctctctctctgcgcgcCTCGCCGCGCTGGTGGCCGAGCGCCAGTTCCGCTGGCCCGACCTCGCGCACCGCCGCCTGCTCAAGGTGctcctctgtctctctctctctctctctctctctctctctctctctgcgcgcCTCGCCGCGCTGGTGGCCGAGCGCCAGTTCCGCTGGCCTGACCTCGCGCACCGCCGCCTGCTCAAGGTGctcctctgtctctctctctctgcgcgcCTCGCCGCGCTGGTGGCCGAGCGCCAGTTCCGCTGGCCCGACCTCGCGCACCGCCGCCTGCTCAAGGTGctcctctgtctctctctctctgcgcgcCTCGCCGCGCTGGTGGCTGAGCGCCAGTTCCGCTGGCTCGACCTCGCGCACCGCCGCCTGCTCAAGGTGctcctctgtctctctctctctgcgccTCGCCGCGCTGGTGGCCGAGCCAGTTCCGCTGGCCCGACCTCGCGCACCGCCGCCGCCTGCTCAAGGTGCTCCTCTGTCTCTCTCTTCTCTGCGCGCCTCGCTGCGCTGGTGGCCGAGCGCCAGTTCCGCTGGTCTGACCTCGCGCACCGCCGCCTGCTCAAGGTGCTCCTctgtctctgtctctctcttcTCTGCGCGCCTCGCTGCGCTGGTGGCCGAGCCAGTTCCGCTGGCTCGACCTCGCGCACCGCCGCCTGCTCAAGGTGCTCCTCTGTCTCTCTCTTCTCTGCGCGCCTGCCGCGCTGGTGGCCGAGCGCCAGTTCCGCTGGTCTGACCTCGCGCACCGCCGCCTGCTCAAGGTGctcctctgtctctctctcttctGCGCGCCTCGCCGCGCTGGTGGCCGAGCCAGTTCCGCTGGCTCGACCTCGCGCACCGCCGCCTGCCCAAGGTgccctctgtctctctctctctgcgcgcCTCGCTGCGCTGGTGGCCGAGCCAGTTCCGCTGGCTCGACCTCGCGCACCGCCGCCGCCTGCTCAAGGTgccctctgtctctctctctctgcgcgcCTCGCTGCGCTGGTGGCCGAGCCAGTTCCGCTGGCCCGACCTCGCGCACCGCCGCCGCCTGCTCAAGGTGctcctctgtctctctctctctgcgcgcCTCGCCGCGCTGGTGGCCGAGCGCTGTTCCGCTGGCCTGACCTCGCGCACCGCCGCCGCCTGCTCAAGGTGCTCCTCTGTCTCTCTCTTCTCTCTCTGCGCGCCTGCCGCGCTGGTGGCCGAGCGCCAGTTCCGCTGGCCCGACCTCGCGCACCGCCGCCTGCTCAAGGTGCCCTctgtctctgtctctctctctctctctgcgcgcCTCGCCGCGCTGGTGGCCGAGCGCCAGTTCCGCTGGCCCGACCTCGCGCACCGCCGCCTGCTCAAGGTgccctctgtctctctctctctctctctgcgcgcCTCGCCGCGCTGGTGGCCGAGCGCCAGTTCCGCTGGCCCGACCTCGCGCACCGCCGCCTGCTCAAGGTGctcctctgtctctctctctctctctgcgcgcCTCGCCGCGCTGGTGGCCGAGCGCCAGTTCCGCTGGCCCGACCTCGCGCACCGCCGCCTGCTCAAGGTGctcctctgtctctctctctctctctgcgcgcCTCGCCGCGCTGGTGGCCGAGCGCCAGTTCCGCTGGTCTGACCTCGCGCACCGCCGCCGCCTGCTCAAGGTgccctctgtctctctctctctgcgccTCGCCGCGCTGGTGGCCGAGCGCCAGTTCCGCTGGCCCGACCTCGCGCACCGCCGCCTGCTCAAGGTgccctctgtctctctctctcttctctGCGCGCCTCGCTGCGCTGGTGGCCGAGCGCCAGTTCCGCTGGCCTGACCTCGCGCACCGCCGCCGCCTGCTCAAGGTGCCCtccgtctctctctctctctctctctctctcttctgcGCGCCTCGCCGCGCTGATGGCCGAGCGCCAGTTCCGCTGGCCCGACCTCGCGCACCGCCGCCGCCTGCTCAAGGTgctcctctctctctcttctctCTCTGCGCGCCTGCCGCGCTGGTGGCCGAGCGCCAGTTCCGCTGGCCTGACCTCGCGCACCGCCGCCGCCTGCCCAAGGTGctcctctgtctctctctctctgcgcgcCTCGCCGCGCTGGTGGCCGAGCGCCAGTTCCGCTGGCCTGACCTCGCGCGCACCGCCGCCTGCTCAAGGTGctcctctgtctctctctctctctctctctgcgcgcCTCGCCGCGCTGGTGGCCGAGCGCCGTTCCGCTGGCCTGACCTCGCGCGCACCGCCGCCCGCTCAAGGTgccctctgtctctctctctcttctctCTCTGCGCGCCTGCCGCGCTGGTGGCCGAGCGCCAGTTCCGCTGGCCTGACCTCGCGCACCGCCGCCTGCTCAAGGTgccctctgtctctctctctctcttctgcGCGCCTCGCCGCGCTGGTGGCCGAGCGCCAGTTCCGCTGGCCTGA
Protein Sequence
MVDPTPKNVKSVKSRLDTINQNEESSHKRSSTMNKVQSHFLVPSEKLDKVTRRVIAPYAQIERKGLKDDDAKPGTYLDINRFNVFLEDSVDLDSLLYETAMVLKTVTNSSGVFVYTVDKIRNEIVLMTQNTKNPERHEVNIPIEEGKIAAAHAAATKQYLLLEDVQKDRRFSEGLKWVDAKVALCMPVVKPDGDCYAILELYRTYSEPYDDNVVYTAVSVSCWAGAAVHQAQARITLQRSTHLNMELRALLQKYFCDLASIDTMLTDMLATVKVLLCLSLSLSLSARLAALVAERQFRWPDLAHRRLLKVLLCLSLSLSLSLSLSLSLSLRASPRWWPSASSAGPTSRTAACSSSAGPTSRTAACSRCSSVSVSLSLSLSARLAALVAERQFRWPDLAHRRLLKVLLCLSLSLSLSARLAALVAERQFRWPDLAHRRLLKVLLFPLARPRAPPPAQGAPLSLSLSLSLSARLAALVAERQFRWPDLAHRRLLKVLLSLSLSLRASPRWWPSASSAGPTSRTAACSRCSSVSLSLSLSLSARLAALVAERQFRWPDLAHRRLLKFRWPDLAHRRLLKVLLCLSLSARLAALVAERQFRWPDLAHRRLLKVLLCLSLSARLAALVAERQFRWPDLAHRRLLKFRWPDLAHRRLLKVLLCLSLSARLAALVAERQFRWPDLAHRRLLKVLLCLSLSARLAALVAERQFRWPDLAHRRLLKVLLCAPLSLSLSARLAALVAERQFRWPDLAHRRLLKVLLCLSLSARLAALVAERQFRWPDLAHRRLLKVLLCLSLSARLAALVAERQFRWPDLAHRRLLKVLLCLSLSARLAALVAERQFRWPDLAHRRLLKVLLCLSLSARLAALVAERQFRWPDLAHRRLLKVLLCLSLSLSLSLSLSLSLSLSLSLSARLAALVAERQFRWPDLAHRRLLKVLLCLSLSLRASPRWWPSASSAGPTSRTAACSRCSSVSLSLSLSARLAALVAERQFRWPDLAHRRLLKVLLCAPLSLSLCAPRRAGGRAPVPLARPRAPPPAQGAPLSLSLSLCAPRRAGGRAPVPLARPRAPPPAQGAPLSLSLCAPRRAGGRAPVPLARPRAPPPAHGAPLSLSLSARLAALVAERQFRWPDLAHRRLLKVLLCLSLSLSLSLSLSARLAALVAERQFRWPDLAHRRLLKVLLCLSLSARLAALVAERQFRWPDLAHRRLLKVLLCLSLSARLAALVAERQFRWLDLAHRRLLKVLLCLSLSAPRRAGGRASSAGPTSRTAAACSRCSSVSLFSARLAALVAERQFRWSDLAHRRLLKVLLCLCLSLLCAPRCAGGRASSAGSTSRTAACSRCSSVSLFSARLPRWWPSASSAGLTSRTAACSRCSSVSLSSARLAALVAEPVPLARPRAPPPAQGALCLSLSARLAALVAEPVPLARPRAPPPPAQGALCLSLSARLAALVAEPVPLARPRAPPPPAQGAPLSLSLCAPRRAGGRALFRWPDLAHRRRLLKVLLCLSLLSLRACRAGGRAPVPLARPRAPPPAQGALCLCLSLSLCAPRRAGGRAPVPLARPRAPPPAQGALCLSLSLSARLAALVAERQFRWPDLAHRRLLKVLLCLSLSLCAPRRAGGRAPVPLARPRAPPPAQGAPLSLSLSLRASPRWWPSASSAGLTSRTAAACSRCPLSLSLCASPRWWPSASSAGPTSRTAACSRCPLSLSLFSARLAALVAERQFRWPDLAHRRRLLKVPSVSLSLSLSLFCAPRRADGRAPVPLARPRAPPPPAQGAPLSLFSLCAPAALVAERQFRWPDLAHRRRLPKVLLCLSLSARLAALVAERQFRWPDLARTAACSRCSSVSLSLSLCAPRRAGGRAPFRWPDLARTAARSRCPLSLSLFSLCAPAALVAERQFRWPDLAHRRLLKVPSVSLSLFCAPRRAGGRAPVPLA

Similar Transcription Factors

Sequence clustering based on sequence similarity using MMseqs2

100% Identity
-
90% Identity
-
80% Identity
-