Basic Information

Insect: Drosophila formosana
Gene Symbol: Hr39_1
Assembly: GCA_035045625.1
Location: JAWNOW010000311.1:4346198-4350104[-]

Transcription Factor Domain

TF Family: SF-like
Domain: zf-C4|SF-like
PFAM: AnimalTFDB
TF Group: Zinc-Coordinating Group
Description: The ligand binding domain of nuclear receptor steroidogenic factor 1 (SF-1): SF-1, a member of the nuclear hormone receptor superfamily, is an essential regulator of endocrine development and function and is considered a master regulator of reproduction. Most nuclear receptors function as homodimer or heterodimers, however SF-1 binds to its target genes as a monomer, recognizing the variations of the DNA sequence motif, T/CCA AGGTCA. SF-1 functions cooperatively with other transcription factors to modulate gene expression. Phospholipids have been determined as potential ligands of SF-1. Like other members of the nuclear receptor (NR) superfamily of ligand-activated transcription factors, SF-1 has a central well conserved DNA binding domain (DBD), a variable N-terminal domain, a flexible hinge and a C-terminal ligand binding domain (LBD). [1, 8, 3, 11, 6, 5, 12, 10, 9, 2, 4, 7]
Hmmscan Out: # of c-Evalue i-Evalue score bias hmm coord from hmm coord to ali coord from ali coord to env coord from env coord to acc

1 5 0.46 2.7e+03 -2.6 0.2 146 176 21 51 4 111 0.56

2 5 3 1.7e+04 -12.3 24.2 44 143 177 299 158 336 0.36

3 5 0.41 2.4e+03 -2.4 4.2 52 152 288 398 271 420 0.66

4 5 1.7e-22 9.6e-19 68.0 0.8 1 130 488 650 488 662 0.88

5 5 6.4e-83 3.7e-79 267.0 0.4 183 408 673 889 668 889 0.96

#	of	c-Evalue	i-Evalue	score	bias	hmm coord from	hmm coord to	ali coord from	ali coord to	env coord from	env coord to	acc
1	5	0.46	2.7e+03	-2.6	0.2	146	176	21	51	4	111	0.56
2	5	3	1.7e+04	-12.3	24.2	44	143	177	299	158	336	0.36
3	5	0.41	2.4e+03	-2.4	4.2	52	152	288	398	271	420	0.66
4	5	1.7e-22	9.6e-19	68.0	0.8	1	130	488	650	488	662	0.88
5	5	6.4e-83	3.7e-79	267.0	0.4	183	408	673	889	668	889	0.96

Sequence Information

Coding Sequence: ATGCCCAACATGTCGAGCATCAAGACGGAGCAAAGCGTGTCTCCAGGCGCCAGCGGCGCCAGCGGCGCCAGCTACCAGCTGCCCGTGAACATGTCCTCGACGCCCTCCTCCACCCGCCACAATGTCTCCGTGACGAACATCAAGTGCGAGCTGGACGAGCTGCCGACACCGAACGGCAACCTGGTGCCCGTTATAGCCAACTACAataatcacaatcacaatcataATCACAATCATGGCGGCAGCCTGCGCATTCCGCTCGGCATGCAGGCGGCCAAGGAGGATGAGTCCGACTCGGAGCCGGAGCTGGCCAGCATTGAGAATCTGCAGAAGGTGCGACGACGGGCGGCCGACAAGAATGGACCGCGACCCATGTCCTGGGAGGGGGAGCTCAGCGAGCCCGAGACGGCGGTCGACGAGGAGCTGATGGACACGGAGACGGTCATCAAGAGCGAAGAGCGAAGCGGCGGCCAAGTGTCGGGCATGATGCAGCCCATCAAAACCGAGCTGGAGCACATAGCTGgcgaactgcagcagcagcaacagctgcagcaagagcagcatcatcatcaccaccaccatcagcaacaccatcatcatcagcatctgcagcagcagcagcagcatcaacagcagccacagcatctGCAGCCCATCAAGCAGAACTTTGGCCAGCAGCCGAACAAGCTGAAGCTGGCGCCGACGCAAAGCGATCCCATCAACCTGAAGTACGAGCCGACGtcatcgacgacgacgctcTGCGATCGCAGCAAGTCCAGCAGCGGCGGCCACTTGCCTCTGCTGCCCGCCAATCCCAGTCCAGATTCTGCCATACATTCCGTCTACACGCACAGCAgtccgtcgcagtcgccgctgACGTCGCGCCACGCCCCCTACACGCCTTCGCTGagtcgcaacaacagcgacgccTCGCACAGCAGctgctacagctacagctccGAGTTCAGTCCCACCCACTCACCCATCCAGGCGCGTCATGCGCCCCCCGGTGGCGCCTCCCTGTTGCCCTCGGCCAGCAGTTATGCcaatggcggcggcggcccAGCTGCACTGCATCATCACAGTGTGCTGTATCGTCCGCTCAACGTGGAGCCACCGAACGCCGGCAGCTCGAGTGGTGGCCAGGAGGCGCAAAATCTCAGCATGGATGCCAGTGGCGCCGCGTTGGATGCAACGGCTGCGCTGCCTGCCTCGCCGGCGGGCATCTCGCGCCAGCAGCTGATCAACTCACCGTGTCCGATATGTGGCGATAAAATCAGCGGCTTCCACTACGGCATCTTCTCCTGCGAGTCATGCAAGGGCTTCTTCAAGCGCACCGTTCAGAACCGCAAgaactatgtgtgtgtgcgcggcGGTCCCTGCCAGGTGAGCATCTCGACGCGGAAGAAGTGTCCCGCCTGCCGCTTCGAGAAGTGCCTGCAAAAGGGCATGAAGCTGGAGGCCATACGCGAGGACCGCACCCGAGGCGGTCGCTCCACCTATCAATGCTCCTACACGTTGCCCAACTCGATGCTCAGTCCGCTGCTCAGTCCAGATCAGGCGGCTgccgcggcagcagcggccgccgttgtcaaccagcagcagcagcaacagcagcagcagcaacatcaccaGCGTTtgcaccagcaccagcaacagcatcagccaCCGCAgacagcacagcagcaacacggACCACTCAACGGGtttggcggtggcggtggcggcggcggcggctgcagcgGTGGCAGCAGCGTTGGATCCAACTCCCTGCCGGCCAGTCCCAGTCTGGGCACATCTATCAAGACGGAGCAAGCGGAGCCGCTGAATCATCATGCGACGCGCGCCTCAAGCATTCCAGCCCTCCTGCAGGAAATCATGGATGTTGAACATCTCTGGCAATACACCGATGCTGAGTTGGCTCGCATCAATCAGCCGCTGTCCTCATTCGCAACTGGCGGTTCCTCGTCAGGCTCTGGCGGAGGATCGGGCACAGGGGGACATCACACTGCCAATGCACAACAGATGACCAATCCACTGCTGGCCAGTGCTGGTCTCTCATCCAATGGCGAGAACGCCAACCCCGATCTGATCGCCCATCTCTGCAATGTCGCCGATCATCGCCTCtacaaaattgtcaaatgGTGCAAGAGTTTGCCGCTCTTCAAGAACATCTCGATTGACGATCAGATCTGCCTGCTAATCAACTCGTGGTGCGAGCTCTTGCTCTTCTCCTGCTGCTTTCGTTCCATTGATACGCCCGGCGAGATCAAGATGTCACAGGGCAGGAAGATTACCTTGGCTCAGGCGAAAACCAATGGCTTACAGGCTTGCATTGAGCGTATGTTGAATCTGACGGATCACTTGCGACGTCTACGCGTTGATCGCTACGAATATGTTGCCATGAAGGTAATCGTGCTGCTGCAGTCCGATACCACGGAGCTACATGAGGCGGTCAAGGTACGAGAGTGCCAGGAGAAGGCGCTGCAAGGTCTGCAGGCATATACGCTGGCACACTATCCCGACACGCCGTCCAAATTTGGGGAGCTATTGCTGCGCATTCCCGATCTGCAGCGCACATGTCAGTTGGGCAAGGAGATGCTGACAATCAAGACCCGCGATGGTGCCGATTTCAACTTGTTGATGGAACTGCTGCGGGGAGAGCATTGA
Protein Sequence: MPNMSSIKTEQSVSPGASGASGASYQLPVNMSSTPSSTRHNVSVTNIKCELDELPTPNGNLVPVIANYNNHNHNHNHNHGGSLRIPLGMQAAKEDESDSEPELASIENLQKVRRRAADKNGPRPMSWEGELSEPETAVDEELMDTETVIKSEERSGGQVSGMMQPIKTELEHIAGELQQQQQLQQEQHHHHHHHQQHHHHQHLQQQQQHQQQPQHLQPIKQNFGQQPNKLKLAPTQSDPINLKYEPTSSTTTLCDRSKSSSGGHLPLLPANPSPDSAIHSVYTHSSPSQSPLTSRHAPYTPSLSRNNSDASHSSCYSYSSEFSPTHSPIQARHAPPGGASLLPSASSYANGGGGPAALHHHSVLYRPLNVEPPNAGSSSGGQEAQNLSMDASGAALDATAALPASPAGISRQQLINSPCPICGDKISGFHYGIFSCESCKGFFKRTVQNRKNYVCVRGGPCQVSISTRKKCPACRFEKCLQKGMKLEAIREDRTRGGRSTYQCSYTLPNSMLSPLLSPDQAAAAAAAAAVVNQQQQQQQQQQHHQRLHQHQQQHQPPQTAQQQHGPLNGFGGGGGGGGGCSGGSSVGSNSLPASPSLGTSIKTEQAEPLNHHATRASSIPALLQEIMDVEHLWQYTDAELARINQPLSSFATGGSSSGSGGGSGTGGHHTANAQQMTNPLLASAGLSSNGENANPDLIAHLCNVADHRLYKIVKWCKSLPLFKNISIDDQICLLINSWCELLLFSCCFRSIDTPGEIKMSQGRKITLAQAKTNGLQACIERMLNLTDHLRRLRVDRYEYVAMKVIVLLQSDTTELHEAVKVRECQEKALQGLQAYTLAHYPDTPSKFGELLLRIPDLQRTCQLGKEMLTIKTRDGADFNLLMELLRGEH

Similar Transcription Factors

Sequence clustering based on sequence similarity using MMseqs2

100% Identity: iTF_00575636;
90% Identity: iTF_00614235;
80% Identity: iTF_00509146;