Basic Information

Insect: Hirtodrosophila alboralis
Gene Symbol: Hr39_1
Assembly: GCA_035043045.1
Location: JAWNNH010000181.1:234811-240461[-]

Transcription Factor Domain

TF Family: SF-like
Domain: zf-C4|SF-like
PFAM: AnimalTFDB
TF Group: Zinc-Coordinating Group
Description: The ligand binding domain of nuclear receptor steroidogenic factor 1 (SF-1): SF-1, a member of the nuclear hormone receptor superfamily, is an essential regulator of endocrine development and function and is considered a master regulator of reproduction. Most nuclear receptors function as homodimer or heterodimers, however SF-1 binds to its target genes as a monomer, recognizing the variations of the DNA sequence motif, T/CCA AGGTCA. SF-1 functions cooperatively with other transcription factors to modulate gene expression. Phospholipids have been determined as potential ligands of SF-1. Like other members of the nuclear receptor (NR) superfamily of ligand-activated transcription factors, SF-1 has a central well conserved DNA binding domain (DBD), a variable N-terminal domain, a flexible hinge and a C-terminal ligand binding domain (LBD). [1, 8, 3, 11, 6, 5, 12, 10, 9, 2, 4, 7]
Hmmscan Out: # of c-Evalue i-Evalue score bias hmm coord from hmm coord to ali coord from ali coord to env coord from env coord to acc

1 4 2 2e+04 -6.0 13.0 53 205 86 237 51 242 0.48

2 4 2 2e+04 -6.0 14.0 43 159 225 344 216 367 0.44

3 4 1.2e-21 1.2e-17 64.6 8.7 1 132 525 680 525 696 0.71

4 4 4.9e-83 4.8e-79 266.8 0.3 183 408 699 915 694 915 0.96

#	of	c-Evalue	i-Evalue	score	bias	hmm coord from	hmm coord to	ali coord from	ali coord to	env coord from	env coord to	acc
1	4	2	2e+04	-6.0	13.0	53	205	86	237	51	242	0.48
2	4	2	2e+04	-6.0	14.0	43	159	225	344	216	367	0.44
3	4	1.2e-21	1.2e-17	64.6	8.7	1	132	525	680	525	696	0.71
4	4	4.9e-83	4.8e-79	266.8	0.3	183	408	699	915	694	915	0.96

Sequence Information

Coding Sequence: ATGCCCAACATGTCCAGCATTAAGACGGAGCAGCAGAGTATCTCACCCGGTGCCAGTGGCAGCTATCAGTTGCCCATGAATATgtccacaacagcaacaacaacaacagcagcagcagcaacagttgcagcaacaacagcaacagttgctggtGGCACAATGCGTCACAATGTCTCTGTGACGAATATTAAATGTGAACTGGACGAACTTGCCACACCGAATGGCAACCTGGTGCCGGTGATAGCCAActatcatcaacatcatcatcatcatcataataatCACCATAATcttaatcataatcataatcacagcagcagcagcagtctgTGCATACCGTTGAGCGGCAAGACGCATCATCTGGAAGAGAATGAATCCGATTCGGAGGCAGAATTGGCAAATATTGAGAATCTTAAGGTGCGACGACGTGCGGCAGATAAGAATGGGCCGCGTCCCATGTCCTGGGAGGGTGAGCTAAGTGAGCCAGAGGCGCCGCCGGATGACCAGGAGCAGGAGGAGCTAATGGAAACGGAGACGGTGATTAAAAGTGAGgcaagcagcggcagcggcagcagcagtggcagtggcagcaataTGACTGccacaacggcaacaacaatgttgCAGCCAATCAAACGCGAATTGGAGCATATAGCGGGTGAattgcaacatcaacagcagcagcagcagcaacaacaacagcagcaacagcagcaacaattgctgctgcaacaacaacacttgcAGCCTTTAAAGCAAAACTTTGCGCCCaacaataaactaaaattggcGCCAACCCAAAGTGATCCcatcaatttgaaatatgaaCCAACTGGTGGCTCAACACTCTGCGATCGCCAGAAATCCAACAGCGGTGGCCATTTGCCCCTGCTGCCCGCCAATCCCAGCCCGGATTCAGCCATACATTCCGTCTATACGCACAGCAGTCCATCACAGTCGCCGCTGACGTCGCGGCATGCCCCATATACGCCCTCGCTGAGTCGCAACAATAGCGATGCCTCACACAGCAGctgctacagctacagctccGAGTTCAGTCCCACCCATTCGCCCATCCAGGCGCGTCATGCGCCGCCAGCGGGCGCTGCTCTATTTAGCGGGGCAGGGGGAGCAGGAGCTGCCACTGGCAGTGGCAATGCAAATGCCAATGGGGCACTGCATCATCATAGTGTCTTGTATAGACCATTGAATGTTGATGCAGCAGTTGCTGCCGCGGCTGCtgcggcagctgcagctgttgccgGTGCTCAGGAGGCGCAAAATCTAAGCATGGATGCTGATGCCACAGCCACATTGCCTGCCTCACCGGCGGGCATATCACGGCAACAGCTTATCAACTCACCTTGCCCCATTTGTGGCGATAAAATCAGTGGCTTTCATTATGGCATCTTCTCCTGCGAATCGTGCAAGGGCTTCTTCAAGCGCACCGTACAAAATCGCAAGAATTATGTTTGTGTACGGGGCGGACCCTGCCAGGTGAGCATCTCCACCCGGAAAAAGTGTCCGGCCTGTCGCTTTGAGAAGTGCCTGCAGAAGGGCATGAAATTGGAGGCCATACGCGAGGATCGCACACGTGGCGGTCGTTCCACCTATCAATGCTCCTATACGCTGCCCAATTCAATGCTCAGTCCGCTTTTAAGTCCGGATCAGGCGGCTGCcgcggcagcagctgccgctgttgtcaatcaacagcagcaacagcagcagcaacaacagcagcagcatcaacagcaacatcaacgactgcaacatcatcagcatcatcatcatcatcagcagcaacagcagcaacatggtCCACTTAATGGCTTTGGAGGTGGTGGCTCCAATTCCCTGCCCGCCAGTCCCAGTCTGGGCGCATCCATCAAAACGGAGCAAATGGAACCGCTCAATCATCACACGTCCCGAGCCTCAAGCATTCCAGCCCTATTACAGGAAATCATGGATGTTGAACATCTTTGGCAATATACCGATGCTGAATTGGCACGCATCAATCAACCGCTGTCTTCATTCGCATCTGGAGGCTCTTCAACGGGTGGCTCCGCGGGTGGCTCCGGTGGTACAGCTGGCAATGCACAACAGATGACCAATCCACTGCTGGCCAGTGCTGGTCTATCGTCCAATGGGGAGAATGCCAATCCTGATTTAATTGCACATCTATGCAATGTGGCCGATCATCGTCTCTATAAGATTGTCAAATGGTGCAAAAGTTTGCCGCTCTTTAAGAACATCTCGATTGACGATCAGATTTGCCTGCTCATTAATTCATGGTGTGAACTGTTGCTCTTCTCCTGCTGTTTTCGTTCCATTGATACGCCTGGCGAGATCAAAATGTCACAGGGCAGAAAGATTACGCTGGCACAGGCCAAAACCAATGGCTTACAGgCTTGCATTGAACGCATGTTGAATCTGACAGATCATTTGCGACGTTTACGCGTTGATCGCTATGAATATGTTGCCATGAAGGTAATTGTGCTGCTGCAGTCTGatACGACGGAGTTGCATGAGGCCGTCAAGGTGCGAGAATGTCAGGAGAAGGCGCTGCAGGGTTTGCAGGCCTATACGTTGGCACATTATCCCGATACACCGTCCAAATTTGGGGAGTTATTGTTGCGCATACCCGATCTGCAGCGCACATGTCAGcTGGGCAAAGAAATGCTGACTATTAAGACGCGAGATGGTGCcgattttaatttgcttatgGAATTGCTACGTGGAGAGCATTGA
Protein Sequence: MPNMSSIKTEQQSISPGASGSYQLPMNMSTTATTTTAAAATVAATTATVAGGTMRHNVSVTNIKCELDELATPNGNLVPVIANYHQHHHHHHNNHHNLNHNHNHSSSSSLCIPLSGKTHHLEENESDSEAELANIENLKVRRRAADKNGPRPMSWEGELSEPEAPPDDQEQEELMETETVIKSEASSGSGSSSGSGSNMTATTATTMLQPIKRELEHIAGELQHQQQQQQQQQQQQQQQQLLLQQQHLQPLKQNFAPNNKLKLAPTQSDPINLKYEPTGGSTLCDRQKSNSGGHLPLLPANPSPDSAIHSVYTHSSPSQSPLTSRHAPYTPSLSRNNSDASHSSCYSYSSEFSPTHSPIQARHAPPAGAALFSGAGGAGAATGSGNANANGALHHHSVLYRPLNVDAAVAAAAAAAAAAVAGAQEAQNLSMDADATATLPASPAGISRQQLINSPCPICGDKISGFHYGIFSCESCKGFFKRTVQNRKNYVCVRGGPCQVSISTRKKCPACRFEKCLQKGMKLEAIREDRTRGGRSTYQCSYTLPNSMLSPLLSPDQAAAAAAAAAVVNQQQQQQQQQQQQHQQQHQRLQHHQHHHHHQQQQQQHGPLNGFGGGGSNSLPASPSLGASIKTEQMEPLNHHTSRASSIPALLQEIMDVEHLWQYTDAELARINQPLSSFASGGSSTGGSAGGSGGTAGNAQQMTNPLLASAGLSSNGENANPDLIAHLCNVADHRLYKIVKWCKSLPLFKNISIDDQICLLINSWCELLLFSCCFRSIDTPGEIKMSQGRKITLAQAKTNGLQACIERMLNLTDHLRRLRVDRYEYVAMKVIVLLQSDTTELHEAVKVRECQEKALQGLQAYTLAHYPDTPSKFGELLLRIPDLQRTCQLGKEMLTIKTRDGADFNLLMELLRGEH

Similar Transcription Factors

Sequence clustering based on sequence similarity using MMseqs2

100% Identity: iTF_00575636;
90% Identity: iTF_00802896;
80% Identity: iTF_00802896;