Basic Information

Insect: Ochropleura leucogaster
Gene Symbol: bltp1_1
Assembly: GCA_958449745.1
Location: OY288208.1:18319067-18354502[+]

Transcription Factor Domain

TF Family: MH1
Domain: MH1 domain
PFAM: PF03165
TF Group: Unclassified Structure
Description: The MH1 (MAD homology 1) domain is found at the amino terminus of MAD related proteins such as Smads. This domain is separated from the MH2 domain by a non-conserved linker region. The crystal structure of the MH1 domain shows that a highly conserved 11 residue beta hairpin is used to bind the DNA consensus sequence GNCN in the major groove, shown to be vital for the transcriptional activation of target genes. Not all examples of MH1 can bind to DNA however. Smad2 cannot bind DNA and has a large insertion within the hairpin that presumably abolishes DNA binding. A basic helix (H2) in MH1 with the nuclear localisation signal KKLKK has been shown to be essential for Smad3 nuclear import. Smads also use the MH1 domain to interact with transcription factors such as Jun, TFE3, Sp1, and Runx [2, 1].
Hmmscan Out: # of c-Evalue i-Evalue score bias hmm coord from hmm coord to ali coord from ali coord to env coord from env coord to acc

1 10 8 3e+04 -4.2 0.0 53 82 996 1026 988 1030 0.69

2 10 0.089 3.3e+02 2.2 0.0 50 80 1800 1830 1794 1841 0.84

3 10 0.092 3.4e+02 2.2 0.0 50 80 1851 1881 1846 1892 0.84

4 10 0.092 3.4e+02 2.2 0.0 50 80 1902 1932 1897 1943 0.84

5 10 0.092 3.4e+02 2.2 0.0 50 80 1953 1983 1948 1994 0.84

6 10 0.092 3.4e+02 2.2 0.0 50 80 2004 2034 1999 2045 0.84

7 10 0.092 3.4e+02 2.2 0.0 50 80 2055 2085 2050 2096 0.84

8 10 0.092 3.4e+02 2.2 0.0 50 80 2106 2136 2101 2147 0.84

9 10 0.092 3.4e+02 2.2 0.0 50 80 2157 2187 2152 2198 0.84

10 10 0.048 1.8e+02 3.1 0.0 50 87 2208 2245 2203 2253 0.80

#	of	c-Evalue	i-Evalue	score	hmm coord from	hmm coord to	ali coord from	ali coord to	env coord from	env coord to	acc
1	10	8	3e+04	-4.2	53	82	996	1026	988	1030	0.69
2	10	0.089	3.3e+02	2.2	50	80	1800	1830	1794	1841	0.84
3	10	0.092	3.4e+02	2.2	50	80	1851	1881	1846	1892	0.84
4	10	0.092	3.4e+02	2.2	50	80	1902	1932	1897	1943	0.84
5	10	0.092	3.4e+02	2.2	50	80	1953	1983	1948	1994	0.84
6	10	0.092	3.4e+02	2.2	50	80	2004	2034	1999	2045	0.84
7	10	0.092	3.4e+02	2.2	50	80	2055	2085	2050	2096	0.84
8	10	0.092	3.4e+02	2.2	50	80	2106	2136	2101	2147	0.84
9	10	0.092	3.4e+02	2.2	50	80	2157	2187	2152	2198	0.84
10	10	0.048	1.8e+02	3.1	50	87	2208	2245	2203	2253	0.80

Sequence Information

Coding Sequence: ATGCCACAGATAAAATATACACATACTAATATAGGGTTGAAGCTGGAAGCAGAGATCACGTCGCTACAGGCGTCTTTCTCAGCGTCTCGCTCCCGCCAGTGGTCTCTTACCGGCAACCTTGGAAGAACCATGATTGTCCTGTTGGAAGGAGTGGCTCCCAACCATCAAACGGTAGTCCGTGTGAGCGTGGGTAAATCTCAAGCTCTATACGGATGGGAGGCAGGTCGGCAGGGAGCCACTGCTCTGCTCTCTGTGGGAGGAGTGAGGGTAGATCTACCGCAGCATCCTGTAGCGCTGCATGGAGTCATGACCCGGTCTAGTAGACAGCTGTCTTCGACATTACAGGAGCTGGGCGTGACCCGCACGTCGTCGCGGCTGTCGCGCGTGCCGGCGGGCGGCTCGGGCTCGTCGTCGGAGGGctcgcccgcgcccgcgccgcgcccgccccGCGCGCCGCGCCCAACGTCCGCGCATGTCTTGCTCAACCCGCTGCATTTGCACTTCTCCATATTGCTGCAGAGTCTCAGCATAACAGCCGCTCTCCTACCATCGCTACAAGCGCAGTACAAGATGGaacaagtacaaagtacagGCGTCACAGGCAACAAGGCACAATTCACTGTAGACCTACAACAGCACTCGCTTAGCTTCGTCACTAAGTTACAGGTGCCGGAGGCCAACATCCCTGCGTCGGCGGGCGTGTGGCTGCCCGGCGTGCACGTGGCCGGCCGCGTGCTGGAgcagcgcggcgcggcgcggcgcgaggGCGCGGTGCTGCGGGCGGGCCGCTACGTGGCCGCCAGCGCCGACATCGGACTGTTCGAGCACACGCTGTCCACCGACCTGCTCAACCACCTCGTGTTCGTGCAGAAGGTTTTCATGAAGGAAGTAAACGAGGTCGTACAGAAAGTTTATGGCGGTGAGAAGCCAGTGCCACTATGGAATGAAGAAGAAGCATCTACTTCTGCACTCAGCAGGATACTGTTCTCGCTTACTATTAGAATCAAGCGTATCCAACTAACAGCAACAACACCAAGCAACTCAGCCGTCCGTCTCGAGACGGGCGCGGTCGAGTTCGAGATATCGAACCGCGTACAGAACGTACAACAACCCACGGAGCCGCATGAAGTGCGACTGTTTGCTAGAGCACAGGTGGATGTGAACCTCAGCTTAGGACAGCTCATTCGCAACGCGATGTTTGAAGAAGCAGAGCCCGAGTTCCAACAATACGCCTTCTTCAATACAAGAATATCAATGCGCAACGCCTTCCAAGACGAGATGGTATGCGGTGACGACAAGGAGGTAGTCCTCATCACCCTGAAGAGACCTCTCATATACATACAGCCGGTGGCCGTGGACAAGGCCATCCTCGTGTGGCTCAACTATAAGAACGCGTACGAGTACTGGAACGAGAAGCGACTCAACTTGAACAAGGAGGTGCTCACGGCTACGCAGCAGGTCTTTGAAAAGGTGCAACTGACATCACAAATTACAACGCCGCATTTGAGCACATTGTTCTTACAACTGAATGTAGATGATATCGGAATATGTCTACCGCTCAACCAACCGCCTATGGCTCGTTGGGGCCTAGGCCGTGGCGCTTGGGGCGCGTGGTGCGGCGAGGGCGAAGCCCGGGGAGCTGTCGTGGTCACATTAGAATCCACCAACATCGGCGCATGTTCGTCGGGCGCGCTGGTGTCGAAGGGTCGCTTCGTAGGGCTGTGCCTGCGGTTCGCGGATGACTTCGAAGCGTCGCTGGATGACTGGAAGCCGCGCGCAGATGAACCCAGCTTGAATGTATGCTGCGTCTCTGAGGGGACGTATGAAGTATGTAGTAGAACTACTGCTGCTAAACATAACGAAAACGCCAAATGGTTCCTGAACGTGTCGTGGCAGATGGAAGGCGTGGACATCCACCTGGACGTGAACGTGGGCAAGCAGCTGTCCGCGCTCGGACACACGCTCACCATGCTCACTGGATACGAGGAGGAAGATCCTCTCAAGATGGACTACGAGAGTGATCTAGATGATGAGGCTGATAACAGCAAAGATTCTCAgGAAAGTATAATCCTCCGGCGAAAATACACGGACCACCTTCCAGCCTTCGTGTTCGACACCAGCATCGACGCCAAGAAGCGATCTAAGCTCATTGAGAAGGAGATGAACGAACAGGCCAAGATCATCAACGACCTTCGGACCCTGGGCGCCAGTCATACCACCATTGAGCATGAGATGAAGAGGCTGCATGATCTGGAGGCGCTTGTGTTCAAGGACTTTAGAAGGGACATGATCCAGAAGTTGCGTCGTCAAAGCGTGCGCGCTAGCTCCATCACTAAAGGCAAGCTGGGACTCGGCTCTAACAGAAGCAAGTCATTCGTCGTACCAACACCACCGCAGGAGAGGAAAGACTTTGAAGGTCTAGTGGAGCCGAACCTGGCGATGTCACCCGGTGTCGGGGATTCTGGTGAGACCTTACTCCTGGGTGACGAGGACAACAGGCTCGCAGACATCATTGAAGGTGGCAGCTGGAGTTCTATGGAGAGTGAGCCGCTTACTGGCCCGTCCCGCTCGGCGTCGCTGCGCGGTCCGCGCGCGCGGGCGGGCGGGCCGcacgcgccggcgccgcccgcCGTGCAGCGACAGAGCTCGCTGCCGGCGCAGCCCGACCACTGGCCTGACGACCTGGACGGAGTGGAGCTGAGGAGGAAACCTGATCATGGTGGCATCCCATCAGAAGGGCTGAGCTCAGAGAACAAGACGAGTAAGTCGAAGACCACGGAGCCGAACATCGACTTCGAGCTGGACGTGAAGGTGTACATCAACAGCGGCAAGTGTGTGCTGCACACCAAGGAGCCCAGTAAAGAGGATGATAGTATTAAGATCGGTCGTATGCGCGTGGGGCGGTCTGCATCGGGAGGGCTGGCGGAGGGCGCCACGGGAGGCAGCAGCTCCCCGACAGCCGCCAGGAGGAAGGCGCCGCATGCAAGGCACCAGCCCGTCTTAGACCTCACTGTGTTCAGAGTACCCGGCTTGGATCTCAAGGTCCACTACGAATCAAAAACCCTGCCCGAAGAAGCTACCTCCCCCCAAACCGTCCCCTCGCTGCCCACTCTGAACGTGGGCGCCCGTAAGGTGGGCACCAAGAAGGCCTCGCTGTTCGCGTGGATCACGCTGCAGAGCATACCGGAGGAGACTATCATCAGCCCGCATATACTGGAGTTCCTGGAACAGACGCTGGAGCCTATACCGACGAAAGCGTCGTTTTCCACACCAACACCGGAAGCGGAAAGCGGTTCCCGGTCCCGGTCCGTGGAGGGCGCGTCGTACGGTCAGTACGTGTACGCGTCGTTCCCGGTGGACGTGATCGTGCACTTCCACATGCAACCCAGCACGTTCCGCTTCAGCTGCCTGCCCGCGTCGCGCGTGGAGTGCCTGCTGCAGCTGCCTAGCCTGCAGATCGTGTTCAGCTCTAAGCGGGCCAGCGACGAGGAGATGGCCGAGCCGGCAGTAGCGATGGGCGGGCTGAGCGTGACGGGCTGCCTGGCCGACTTCTCCGTGAACATGTTCCACCCGTACGGCGGGAAGAAGTCCAGCCTCAAGGAGGCGCAGTGGTCCCCGCTCTCCGACACCGAGAGGAAAGACTCCTTGAGCATTAACGTGGAGTTCGTCAAGTTCCATCTGTCGAGGTCCAGGAAGTTGGACTTTCAGACGGAGCAAGATCAGTCCAAGGCCACTGTAAGGTTTTCAACAATTGTAGACGTGGGCTCAGCGTGGTTCAAATACGACATGCGTCGCTTGGGTGAGATCCTCGCGTTCCCTAAGGCGTGGTACAGACGAACGATCGTCAGACGCATGTTCTTAGGAGACCTCAGCTTACACGACACGCGCGATCATGGGCCATCAAGCAGCAACGCTCCAGTATCACCCGTATTACCACAGAGAGAGAAAACTAAGACTGTTCCAGAACATCAAAAATCAAAAGACAGTAGCAAGGCGTCAGCGCCCGCGATGGGCGCGGCGTGGGAGACGCTGGTGCTGTTCGCTGTCAACTTCACCAAGCTCAACGTCCACATGAACATGGGCAACGTTATGGGCAATGTCAGTTGGCAATCCCGCGACTTCAACTGCACCGGCCGTCTCAGCATCGGCAGCACGGGACACCGCAACATGCTGGTGGGCGTCGCGCTCGCCAGCTCCGAGCTGGACGCACGCGGCGGCATCGTTGGGGGAGCCATCTCACTGTCCTCCATCGATACTTACGTCCACATCGAAGAAGAAGCGGGCTGCAACCCAGGCCACGTGTGCGGCGTGCGGCTGGCGGCGCTGGAGCTGCGCCTGGAGTACATGGGCACGCCCGTGCTCATGGCGCGCGTGTCGCGCCTGCAGGCCGCGCTGCGGGACGAGTGGCTGGCCAGGAGCCGCCAGCCCGCGCACCATCCGCACAGGCCCACGTCTAGGCCAGCAATAATCCTTACACACGGAACCCTAAGCTGGCACCAGCTTCAGATCCTGATGTCTCGGAGTACCACGCCAGACCTGCTGAAGATGCAACTGAAGCTTGAAGAGTTCTTTACTCAGCAGTTCAAATCGAGTAAAAGGGTGTTCAGCTCTTTGCATCCAAACTATACTAATGCGAGACGAGATCGGAGAGAACCGCCAGCCCCATGCGCGGGCGCAGCGGAGGGCGGGGCCacaggcgcgggcgcggcggagCTGCGTCACCACCGTCACTGGCAGAAGGTGCTGCAGCTGGTGTCCGGCATGCAGCTGTCCACGCTGCCCACGCCGCTGCCCGCCAACGGCACCGTACTCGGCGGTACAATGGAACTCCACGGCACCAACATATCTCTCGCGTGCTTCCACGGCAACAGCTTTAAGTCTAAATCCTGGGCGCTGTTCAGTCTCAAGGATCCATGCATCAGCTTCGCCACTGAAGCACAGCAAGTCGCCAGCGAAGAGGGTTCTATGGAAGTCCACGTGGTCCAGAGCCTGACAGCCAGCCTGGGCGGGCTGGGCGCGGGCGGGTCGGGTGCGCGTGCGCACGTGTCCATGGCCACCGTGTGCCGCATGACCAGGGCTCTGCTGTTCCCGCCGCAGTTCAAGACATTGAAGGAGTGGTTCCATTATGCCTTCGCTAATAGTGAGATTGATGCAATCGAGCTCTTCCCATCTCTGGAGCGCGACCCGACCGGCACAACGTCATCCAACGCCAGCGGTTCCAGCACCAACACCAACAGCACGGAGAGGAACAAAGCAGCTGCAGACAAGCACGTGCGCGAGGTCATCTTCGCGCTGCCCTCGTTACAGCTGCACCTAAGGACCCACCACCTGCAGGCCCACACGCCGCCCACAGAGACCGCTGCACCTAAGGACCCACCACCTGCAGGCCCACACGCCGCCCACAGAGACCGGTCAGTACACTACACATACTGTAACATGTTCGCGCTGCCCTCGTTACAGCTGCACCTAAGGACCCACCACCTGCAGGCCCACACGCCGCCCACAGAGACCGCTGCACCTAAGGACCCACCACCTGCAGGCCCACACGCCGCCCACAGAGACCGGTCAGTACACTACACATACTGTAACATGTTCGCGCTGCCCTCGTTACAGCTGCACCTAAGGACCCACCACCTGCAGGCCCACACGCCGCCCACAGAGACCGCTGCACCTAAGGACCCACCACCTGCAGGCCCACACGCCGCCCACAGAGACCGGTCAGTACACTACACATACTGTAACATGTTCGCGCTGCCCTCGTTACAGCTGCACCTAAGGACCCACCACCTGCAGGCCCACACGCCGCCCACAGAGACCGCTGCACCTAAGGACCCACCACCTGCAGGCCCACACGCCGCCCACAGAGACCGGTCAGTACACTACACATACTGTAACATGTTCGCGCTGCCCTCGTTACAGCTGCACCTAAGGACCCACCACCTGCAGGCCCACACGCCGCCCACAGAGACCGCTGCACCTAAGGACCCACCACCTGCAGGCCCACACGCCGCCCACAGAGACCGGTCAGTACACTACACATACTGTAACATGTTCGCGCTGCCCTCGTTACAGCTGCACCTAAGGACCCACCACCTGCAGGCCCACACGCCGCCCACAGAGACCGCTGCACCTAAGGACCCACCACCTGCAGGCCCACACGCCGCCCACAGAGACCGGTCAGTACACTACACATACTGTAACATGTTCGCGCTGCCCTCGTTACAGCTGCACCTAAGGACCCACCACCTGCAGGCCCACACGCCGCCCACAGAGACCGCTGCACCTAAGGACCCACCACCTGCAGGCCCACACGCCGCCCACAGAGACCGGTCAGTACACTACACATACTGTAACATGTTCGCGCTGCCCTCGTTACAGCTGCACCTAAGGACCCACCACCTGCAGGCCCACACGCCGCCCACAGAGACCGCTGCACCTAAGGACCCACCACCTGCAGGCCCACACGCCGCCCACAGAGACCGGTCAGTACACTACACATACTGTAACATGTTCGCGCTGCCCTCGTTACAGCTGCACCTAAGGACCCACCACCTGCAGGCCCACACGCCGCCCACAGAGACCGCTGCACCTAAGGACCCACCACCTGCAGGCCCACACGCCGCCCACAGAGACCGGTCAGTACACTACACATACTGTAACATGTTCGCGCTGCCCTCGTTACAGCTGCACCTAAGGACCCACCACCTGCAGGCCCACACGCCGCCCACAGAGACCGATGAGAAGCCTGTAGTGGAGTGCAGTTTCATCACAGAGTTTGAAGATCACATATTCGTGTCGGTGGATGCTGAGGCGTTCCTGTTCCTGCACGACCTCATCTCTTCGTATATCAAGGAGAAGGATCGACTGATgccgggcggcgcgcgcgcagcgtGGGCGGAGGGCGCGGGCCCCCCGCAGGACTACCGCGACTACCGCTGTGTCACGTGGCATCTGGAACCTACTGTCAGACTCTTATCGTGGGCTGGCAAGTCGATCGAGCCGTACGGCGTGGACTACATCCTGCAGAAGCTTGGCTTCAGCCACGCGCGCACCACCATCCCCAAGTGGCTCCAGCGAGGCACCCTCGACCCGCTCGACAAGCTGCTGTCTCTCGTACTCCTCAGGCTGGTCGCCATCGTGCCACACAAGTGA
Protein Sequence: MPQIKYTHTNIGLKLEAEITSLQASFSASRSRQWSLTGNLGRTMIVLLEGVAPNHQTVVRVSVGKSQALYGWEAGRQGATALLSVGGVRVDLPQHPVALHGVMTRSSRQLSSTLQELGVTRTSSRLSRVPAGGSGSSSEGSPAPAPRPPRAPRPTSAHVLLNPLHLHFSILLQSLSITAALLPSLQAQYKMEQVQSTGVTGNKAQFTVDLQQHSLSFVTKLQVPEANIPASAGVWLPGVHVAGRVLEQRGAARREGAVLRAGRYVAASADIGLFEHTLSTDLLNHLVFVQKVFMKEVNEVVQKVYGGEKPVPLWNEEEASTSALSRILFSLTIRIKRIQLTATTPSNSAVRLETGAVEFEISNRVQNVQQPTEPHEVRLFARAQVDVNLSLGQLIRNAMFEEAEPEFQQYAFFNTRISMRNAFQDEMVCGDDKEVVLITLKRPLIYIQPVAVDKAILVWLNYKNAYEYWNEKRLNLNKEVLTATQQVFEKVQLTSQITTPHLSTLFLQLNVDDIGICLPLNQPPMARWGLGRGAWGAWCGEGEARGAVVVTLESTNIGACSSGALVSKGRFVGLCLRFADDFEASLDDWKPRADEPSLNVCCVSEGTYEVCSRTTAAKHNENAKWFLNVSWQMEGVDIHLDVNVGKQLSALGHTLTMLTGYEEEDPLKMDYESDLDDEADNSKDSQESIILRRKYTDHLPAFVFDTSIDAKKRSKLIEKEMNEQAKIINDLRTLGASHTTIEHEMKRLHDLEALVFKDFRRDMIQKLRRQSVRASSITKGKLGLGSNRSKSFVVPTPPQERKDFEGLVEPNLAMSPGVGDSGETLLLGDEDNRLADIIEGGSWSSMESEPLTGPSRSASLRGPRARAGGPHAPAPPAVQRQSSLPAQPDHWPDDLDGVELRRKPDHGGIPSEGLSSENKTSKSKTTEPNIDFELDVKVYINSGKCVLHTKEPSKEDDSIKIGRMRVGRSASGGLAEGATGGSSSPTAARRKAPHARHQPVLDLTVFRVPGLDLKVHYESKTLPEEATSPQTVPSLPTLNVGARKVGTKKASLFAWITLQSIPEETIISPHILEFLEQTLEPIPTKASFSTPTPEAESGSRSRSVEGASYGQYVYASFPVDVIVHFHMQPSTFRFSCLPASRVECLLQLPSLQIVFSSKRASDEEMAEPAVAMGGLSVTGCLADFSVNMFHPYGGKKSSLKEAQWSPLSDTERKDSLSINVEFVKFHLSRSRKLDFQTEQDQSKATVRFSTIVDVGSAWFKYDMRRLGEILAFPKAWYRRTIVRRMFLGDLSLHDTRDHGPSSSNAPVSPVLPQREKTKTVPEHQKSKDSSKASAPAMGAAWETLVLFAVNFTKLNVHMNMGNVMGNVSWQSRDFNCTGRLSIGSTGHRNMLVGVALASSELDARGGIVGGAISLSSIDTYVHIEEEAGCNPGHVCGVRLAALELRLEYMGTPVLMARVSRLQAALRDEWLARSRQPAHHPHRPTSRPAIILTHGTLSWHQLQILMSRSTTPDLLKMQLKLEEFFTQQFKSSKRVFSSLHPNYTNARRDRREPPAPCAGAAEGGATGAGAAELRHHRHWQKVLQLVSGMQLSTLPTPLPANGTVLGGTMELHGTNISLACFHGNSFKSKSWALFSLKDPCISFATEAQQVASEEGSMEVHVVQSLTASLGGLGAGGSGARAHVSMATVCRMTRALLFPPQFKTLKEWFHYAFANSEIDAIELFPSLERDPTGTTSSNASGSSTNTNSTERNKAAADKHVREVIFALPSLQLHLRTHHLQAHTPPTETAAPKDPPPAGPHAAHRDRSVHYTYCNMFALPSLQLHLRTHHLQAHTPPTETAAPKDPPPAGPHAAHRDRSVHYTYCNMFALPSLQLHLRTHHLQAHTPPTETAAPKDPPPAGPHAAHRDRSVHYTYCNMFALPSLQLHLRTHHLQAHTPPTETAAPKDPPPAGPHAAHRDRSVHYTYCNMFALPSLQLHLRTHHLQAHTPPTETAAPKDPPPAGPHAAHRDRSVHYTYCNMFALPSLQLHLRTHHLQAHTPPTETAAPKDPPPAGPHAAHRDRSVHYTYCNMFALPSLQLHLRTHHLQAHTPPTETAAPKDPPPAGPHAAHRDRSVHYTYCNMFALPSLQLHLRTHHLQAHTPPTETAAPKDPPPAGPHAAHRDRSVHYTYCNMFALPSLQLHLRTHHLQAHTPPTETAAPKDPPPAGPHAAHRDRSVHYTYCNMFALPSLQLHLRTHHLQAHTPPTETDEKPVVECSFITEFEDHIFVSVDAEAFLFLHDLISSYIKEKDRLMPGGARAAWAEGAGPPQDYRDYRCVTWHLEPTVRLLSWAGKSIEPYGVDYILQKLGFSHARTTIPKWLQRGTLDPLDKLLSLVLLRLVAIVPHK

Similar Transcription Factors

Sequence clustering based on sequence similarity using MMseqs2

100% Identity: -
90% Identity: -
80% Identity: -