Basic Information

Insect: Amiota minor
Gene Symbol: Hr39_1
Assembly: GCA_037043295.1
Location: JBAMAW010002525.1:1718986-1722626[+]

Transcription Factor Domain

TF Family: SF-like
Domain: zf-C4|SF-like
PFAM: AnimalTFDB
TF Group: Zinc-Coordinating Group
Description: The ligand binding domain of nuclear receptor steroidogenic factor 1 (SF-1): SF-1, a member of the nuclear hormone receptor superfamily, is an essential regulator of endocrine development and function and is considered a master regulator of reproduction. Most nuclear receptors function as homodimer or heterodimers, however SF-1 binds to its target genes as a monomer, recognizing the variations of the DNA sequence motif, T/CCA AGGTCA. SF-1 functions cooperatively with other transcription factors to modulate gene expression. Phospholipids have been determined as potential ligands of SF-1. Like other members of the nuclear receptor (NR) superfamily of ligand-activated transcription factors, SF-1 has a central well conserved DNA binding domain (DBD), a variable N-terminal domain, a flexible hinge and a C-terminal ligand binding domain (LBD). [1, 8, 3, 11, 6, 5, 12, 10, 9, 2, 4, 7]
Hmmscan Out: # of c-Evalue i-Evalue score bias hmm coord from hmm coord to ali coord from ali coord to env coord from env coord to acc

1 4 3 2.8e+04 -7.1 8.0 63 155 162 266 114 282 0.47

2 4 0.069 6.5e+02 0.1 5.8 52 175 333 474 307 484 0.72

3 4 2.8e-17 2.6e-13 50.8 6.4 1 134 557 707 557 718 0.69

4 4 1.6e-81 1.6e-77 262.4 0.2 188 408 729 940 719 940 0.93

#	of	c-Evalue	i-Evalue	score	bias	hmm coord from	hmm coord to	ali coord from	ali coord to	env coord from	env coord to	acc
1	4	3	2.8e+04	-7.1	8.0	63	155	162	266	114	282	0.47
2	4	0.069	6.5e+02	0.1	5.8	52	175	333	474	307	484	0.72
3	4	2.8e-17	2.6e-13	50.8	6.4	1	134	557	707	557	718	0.69
4	4	1.6e-81	1.6e-77	262.4	0.2	188	408	729	940	719	940	0.93

Sequence Information

Coding Sequence: atgtcCACCatcaaaactgaaaacttCACCACAACAACTACAACGGCAGCCACAAGTGTGACATCAAccagtggtggtggtggctttCAATTACCAGTGAATATGAGCAATCATACAAGTATCTTAGGATCCAGTGCGGCGGCAGGATCTCCATTGACGACGACATCTACGACGACAACAACTCGGAATAATGTGTCTGTAACAAATATCAAGTGTGAAGTAGATGAAATGGTGACCGCGTCGAATGGCAATATAGTGCCAGTAATAGCGAATACGGGTAGCTATAACGGTGGGCAATCCACATTGATGACAGCATCAGGTGGCATCCGAATACCACTGACAAATGCCACTGCTAATGCTACACCAGcattaccaacaacaaaagccgAAGATTCTGATTCCGAGGCAGAACTGACAAACATTGAGAATTTCAAAGTAACACGGCGTGCCACAAGTAGTGCAAGTAATGCTGCTTCATCAGCCGCTGATACCCATAATAAGAATGGACCACGTCCAATGTCCTGGGAAGGTGAACTGTCCGAAACGGAAACAAATGAAGCTGAACTCATGGAGACGGAGAATTCTTTGAGTAACGGTTTGGGTGGCATCGTTGGAGTGGCGGTGATCAAAAGTGAAGCAACTACTACGACCACCTCTAGTGGCAGTCAACATATGCAGCCTATTAAAACAGAACTAGAACACATTTCTGCTAATATGTTCACAACGACAACGGCGACACCAACGCCTACACATGCGgccaaattgaaattggcCCCAACACAAAGTGATCCTATCAATCTCAAATATGAGCCCAGTTTGATAAGTGATATTATTGCTTCGTCTGCAGCGGGTTCAACGACAGCAACAGTGGTGTCTGGCGGTGGTGGTCTAAATTCACCGTTGCTGACGGGGCGCAGTAAATGCAATCAGTTGCCGTTGCCCGCGAATCCTAGTCCCGATTCCGCCATACATTCCGTTTATACACATAGTTCGCCATCACAATCTCCGCTGACGTCACGTCATGCACCCTACACACCTTCACTGAGTCGCAATAATAGTGATGCATCGCATAGTTCATGCTACTCTTACAGCTCTGAGTTTAGTCCAACCCATTCGCCCATTCAAGCGCGTCATGCTCCGCCAGCCGGTGCGCTATATCCGggaaattttaatggaggtgGTGGCAATGCCACAGGTGGATCTCTACATCATGGTGTGCTCTATAGACCCCTTAATATTGACTCAACTGTTGCTGGTTCCACAGCAGCAGCGAGTTGTATCAGTCAAGAAGCTCAAAATCTTAGCATGgatacaacaacaagcagCGGTTCCAGTGTGacgcaacagcaacagccaACATCGTCTAGTGGCTTTGAAccaggtggtggtggtggcagtaCATCTAGCAGCTTGCCTGCTTCACCGGCAGGTATTTCACGGCAACAGCTCATTAACTCGCCATGCCCGATTTGTGGCGATAAAATCTCTGGCTTCCATTATGGCATCTTCTCATGTGAGTCATGTAAGGGTTTCTTCAAGCGCACCGTTCAAAATCGGAAGAACTATGTTTGTGTGCGTGGTGGTCCGTGCCAGGTGAGCATCTCTACACGAAAAAAGTGTCCTGCCTGTCGTTTTGAGAAGTGTCTACAAAAGGGCATGAAACTGGAGGCCATACGGGAGGATCGTACTCGTGGTGGACGTTCGACTTATCAATGCTCCTACACATTACCTAATTCGATGCTTAGTCCATTGTTGAGTCCAGAACAACAGCAAGgagttgctgctgttgcagcagcagcagctgcggCAGTGGCTGCcaatcagcaacaacaacagcagcagcaacaacaccaacaacaacgtTTACATGCCCTCAATGGTTACAGTCAGTCACCAGTGTCGGGACATGGAAACAGCATAACAACGCAGACAATCAAATCAGAACAACAGGATCTAGGGGCGTATAATGGTGGCGCTGGAACGGCATCACCAGCAGTAACGCCAAATAACATCGCTGTTCCAGCTCTGCTGCAGCAAATTATGGATGTCGAACATCTCTGGCAGTATAATGATGCCGAACTGGCGCGCTTGAATCAACCACAAACCGCAACAAGTACAAGTTCCTCTGGAGGATCTCATAATTCTTCTGGTGGTGGTTGTGGTAATGCCAATACACCAATGACCAACCCACTGCTGGCCAGTGCCGGTCTTGGTTCAAATGGTGAAAACGCAAATCCCGATTTAATAGCGCATCTCTGCAATGTTGCCGATCATCGCCTCTATAAGATTGTCAAGTGGTGCAAAAGTTTGCCACTCTTCAAGCATATTTCGATCGATGATCAAATCTGCCTGCTCATTAATTCTTGGTGTGAATTGCTGCTCTTCTCCTGCTGTTTTCGTTCTATCGATACGCCGGGTGAGATAAAAATGTCACAAGGCAAGAAAATCACACTGGCTCAGGCCAAGTCGCATGGTCTACAGACCTGCATTGAACGTATGCTGAATCTGACAGATCATTTGCGACGCTTGCGTGTCGATCGCTATGAATATGTTGCTATGAAAGTTATAGTACTCCTTCAATCGGaCACCACTGAACTGCAAGAACCTGTTAAAGTTCGTGAATGCCAAGAGAAGGCTTTACAGAGCCTGCAAGCCTATACCCATGTCCATTATCCGGATACGCCGTCCAAATTTGGTGAACTATTGTTACGTATTCCCGATCTGCAGCGTACTTGTCAAATGGGCAAAGAGATGTTAACTATAAAATCACGGGATGGCGGTGATTTCAACTTATTGATGGAACTTCTCCGCGGAGAACATTGA
Protein Sequence: MSTIKTENFTTTTTTAATSVTSTSGGGGFQLPVNMSNHTSILGSSAAAGSPLTTTSTTTTTRNNVSVTNIKCEVDEMVTASNGNIVPVIANTGSYNGGQSTLMTASGGIRIPLTNATANATPALPTTKAEDSDSEAELTNIENFKVTRRATSSASNAASSAADTHNKNGPRPMSWEGELSETETNEAELMETENSLSNGLGGIVGVAVIKSEATTTTTSSGSQHMQPIKTELEHISANMFTTTTATPTPTHAAKLKLAPTQSDPINLKYEPSLISDIIASSAAGSTTATVVSGGGGLNSPLLTGRSKCNQLPLPANPSPDSAIHSVYTHSSPSQSPLTSRHAPYTPSLSRNNSDASHSSCYSYSSEFSPTHSPIQARHAPPAGALYPGNFNGGGGNATGGSLHHGVLYRPLNIDSTVAGSTAAASCISQEAQNLSMDTTTSSGSSVTQQQQPTSSSGFEPGGGGGSTSSSLPASPAGISRQQLINSPCPICGDKISGFHYGIFSCESCKGFFKRTVQNRKNYVCVRGGPCQVSISTRKKCPACRFEKCLQKGMKLEAIREDRTRGGRSTYQCSYTLPNSMLSPLLSPEQQQGVAAVAAAAAAAVAANQQQQQQQQQHQQQRLHALNGYSQSPVSGHGNSITTQTIKSEQQDLGAYNGGAGTASPAVTPNNIAVPALLQQIMDVEHLWQYNDAELARLNQPQTATSTSSSGGSHNSSGGGCGNANTPMTNPLLASAGLGSNGENANPDLIAHLCNVADHRLYKIVKWCKSLPLFKHISIDDQICLLINSWCELLLFSCCFRSIDTPGEIKMSQGKKITLAQAKSHGLQTCIERMLNLTDHLRRLRVDRYEYVAMKVIVLLQSDTTELQEPVKVRECQEKALQSLQAYTHVHYPDTPSKFGELLLRIPDLQRTCQMGKEMLTIKSRDGGDFNLLMELLRGEH

Similar Transcription Factors

Sequence clustering based on sequence similarity using MMseqs2

100% Identity: iTF_00062850; iTF_00061979; iTF_00062001; iTF_00061183; iTF_00061159;
90% Identity: iTF_00061183;
80% Identity: iTF_00062850;