Basic Information

Insect: Perdita meconis
Gene Symbol: Hr39_1
Assembly: GCA_030770465.2
Location: JASKOS020000026.1:1035827-1044401[-]

Transcription Factor Domain

TF Family: SF-like
Domain: zf-C4|SF-like
PFAM: AnimalTFDB
TF Group: Zinc-Coordinating Group
Description: The ligand binding domain of nuclear receptor steroidogenic factor 1 (SF-1): SF-1, a member of the nuclear hormone receptor superfamily, is an essential regulator of endocrine development and function and is considered a master regulator of reproduction. Most nuclear receptors function as homodimer or heterodimers, however SF-1 binds to its target genes as a monomer, recognizing the variations of the DNA sequence motif, T/CCA AGGTCA. SF-1 functions cooperatively with other transcription factors to modulate gene expression. Phospholipids have been determined as potential ligands of SF-1. Like other members of the nuclear receptor (NR) superfamily of ligand-activated transcription factors, SF-1 has a central well conserved DNA binding domain (DBD), a variable N-terminal domain, a flexible hinge and a C-terminal ligand binding domain (LBD). [1, 8, 3, 11, 6, 5, 12, 10, 9, 2, 4, 7]
Hmmscan Out: # of c-Evalue i-Evalue score bias hmm coord from hmm coord to ali coord from ali coord to env coord from env coord to acc

1 5 2 4.1e+04 -6.9 7.1 127 158 46 78 24 106 0.47

2 5 1.2 2.4e+04 -4.5 7.9 76 163 283 392 226 412 0.57

3 5 2 4.1e+04 -14.5 18.0 69 98 411 448 312 532 0.45

4 5 2.7e-08 0.00056 20.6 0.0 1 23 600 622 600 628 0.92

5 5 6.9e-71 1.4e-66 226.8 0.1 183 408 749 970 645 970 0.90

#	of	c-Evalue	i-Evalue	score	bias	hmm coord from	hmm coord to	ali coord from	ali coord to	env coord from	env coord to	acc
1	5	2	4.1e+04	-6.9	7.1	127	158	46	78	24	106	0.47
2	5	1.2	2.4e+04	-4.5	7.9	76	163	283	392	226	412	0.57
3	5	2	4.1e+04	-14.5	18.0	69	98	411	448	312	532	0.45
4	5	2.7e-08	0.00056	20.6	0.0	1	23	600	622	600	628	0.92
5	5	6.9e-71	1.4e-66	226.8	0.1	183	408	749	970	645	970	0.90

Sequence Information

Coding Sequence: ATGTCGGAGCAAAACGGGCCCAGCGAGGGCCCCGGGCCTGGGCCAGGACCGGGCCCAGGCTGGTGGCCAACCTCCTCGCCGTCCTGGAAGACGAACGCAACCGCGTCCGCCTCCTCGTCCACCGGCCCCGCCGCTCCAGACAGCTCCGCCTCCGTCTCTGCGTCCTGCACCACCTCCACCTCCTCCCTGACGATCACCACCTCGGCCACGTCCTCGTCCACCTGCTGCTCCTCGACTCCTGGCGGACACTCGTGCACGATCACCGCCACCCGTTCCACGGAGACGGGGAAGAACGTCTCCGTTACGACGATCAACGTACCTCCTAATCAGGACATACACGATGGCAAGGGTATCTGCAAGTATCTCGCAGGCCAGAACGGCGTGACGGTGTCCGTGGTTTCGAATTGTGGTTCTGTGTTGGGTTGCGGGAACGCGAACGTTCCGTCCTCCACGGGTATTGGCAGTGGCAGCGGCTCGCACAGCATTGGGATCGGGGTCGGTGTACTCGGACAGAACGTGGACAACGACGCGGAGGACAGCGACGGCGAGATAAGCAAAATCGACTTTCGCGGGGTGAATTTGCGgacgaaaaagaaacgagacGTATTGGGAAGCGGAGAGAAGATCGGCGACGGAGATGTCGAGGACGGAAACGGTTGCTACGACGGGAACGATGTCTCTCAGCAGCAACCGGAGAGACCCATGTCGTGGGAGGGAGAGCTCTCTGACCAAGAAATGTCTTCCAATACGATCACTAACCAGGACACGCACGAAGAAACGTCGATGGAAGGTGTCCAGGTGTGTAGCGCGAGTCCCAGTCCTATGGAGCAAAAGTTCCCTATTAAGCCGGAGCCAGACTTCCGGTCCAGTCCGGGATTCGCGTTGAACTCCTTCCATGACGTGGGTCTGTCCTTAGCTCACGGCCAGCAGatgcaacagcaacagcaacgGAACATGGAGAACCTAGAGCAAACGCAGCAGAACGACCTGCCGCTTCTTGTGGGCAAGTTGCTTGGCGGCTATAACAGCTCCACGCCGAATCACAGTCCAGTATTGAACCCCAGACACCATTTAACCAAGCACAGTCACACAAGATCGCAGGTACCGTCGCCAGACTCTGCGATCCACTCAGCGTACAGCGTGTTCAGCTCGCCGACGCAGAGTCCTCACGCAGCACGACATTCCGCTCTGGGAGCAGGAAGTCCAGTCCCGTCTTCatcgctctctctctcgcgccaTAGTTTCAATAACTCCACTTCCTCGTTGTCATTGTCGTTGTCGCACTCGCTGTCAAGGAACAACTCGGACGCCTCGAGCAGCTGCTACAGTTACGGTTCACTCAGCCCGCCCACTCACTCACCCGTCCAACAGCCGAGACACTCGCAGCATCATCAGCACCAAGTAGCTCAAGGAAGTCCCCTTCATCTACCGGCGACCGCATCTTCGGCGGTGGTACATCATTATTCATCCTCGGCTCCGGGTTCCGAGCTCTCACCAGAGGGACACCCCATCGCCGACGACCAAGAAGACTGTCGAATACCATCCGCACCCTCGGGTATCTCGACCAGACAGCAACTGATCAACAGCCCTTGCCCGATTTGCGGGGACAAGATCAGCGGCTTTCATTACGGGATTTTCTCCTGCGAGTCGTGCAAAGGATTCTTCAAACGCACCGTCCAAAACCGAAAGAATTATGTGTGCCTTAGAGGCGCGGGATGCCCGGTCACCGTCGCCACCAGGAAAAAGTGTCCGGCCTGCCGCTTCGACAAGTGTCTCAATATGGGTATGAAGCTTGAAGCGATTAGAGAGGATCGCACCAGAGGCGGAAGAAGCACCTACCAGTGTACCTATACCCTTCCAGCGAGTTTGGTTGGTAGTCCTGCTGGGATGCCTGGCGACAAGCTGACAGGAGGAGGAAATTGTAGTCCTGCTCCTTCTGGTAGCGAGCATCACTACTCCGTCAGGCATCACTCGAACCACTCGCACAAAATGCAAGTGGTGCCTCAGCTTCTGCAGGATATCATGGATGTGGAGCATCTGTGGCATTACAACGACAACGATCGTATGTCTGGAATCCAGGCAGGAGGGACCAATACTGCCAGAGGCAACGACGCGACCCTGCTGGGAGTTGGGTCCGGCGCAGGGGCCGATTCTGTCGAGTGTTCCCCTAATGGGACCGCTGGGAATGGAAATCTCAATAACAGGGGAGAAGGCAGGTCGTCATCCACTGTTCCTGGTGTGAGCAACGAGCAGCACACCGCGTCTATCAACAGCAACTCCCAAATCGGGAGCAACACGAACGGCAATCCGAGTCAGCATCCTGATTTTCTGTCGAACCTATGCAACATAGCCGACCATCGGCTCTACAAAATAGTGAAGTGGTGCAAGAGCCTGCCGCTGTTCAAGAACATTTCGATCGACGATCAAATCTGTCTGTTGATCAACTCCTGGTGCGAGTTATTACTCTTCTCATGCTGTTTCCGTAGCATGAGCACCCCCGGTGAAATCAGAGTGTCTCTGGGCAAGTCGATCACCCTGGAGCAAGCTAGACAGCTTGGCCTAGCGACTTGCATCGAGAGGATGCTTGCGTTCACTAACAATCTGAGAAGACTCCGAGTGGATCAGTACGAATACGTAGCAATGAAGGTGATAGTTCTGTTGACCTCTGATACGAGCGAGCTGAAGGAACCAGAAAAGGTTCGAGCCTCTCAAGAGAAGGCCTTGCAGGCGTTGCAACAGTACACCATAGCAAGGTATCCGGAAATGCCAGCCAAGTTCGGCGAGCTGTTGTTGCGAATCCCAGATTTGCAAAGGACATGCCAGGCAGGAAAGGAATTATTGAGTGCGAAACGCGCTGAAGGAGAAGGCAGCTCGTTTAATCTGTTAATGGAATTGCTTAGAGGAGATCACTGA
Protein Sequence: MSEQNGPSEGPGPGPGPGPGWWPTSSPSWKTNATASASSSTGPAAPDSSASVSASCTTSTSSLTITTSATSSSTCCSSTPGGHSCTITATRSTETGKNVSVTTINVPPNQDIHDGKGICKYLAGQNGVTVSVVSNCGSVLGCGNANVPSSTGIGSGSGSHSIGIGVGVLGQNVDNDAEDSDGEISKIDFRGVNLRTKKKRDVLGSGEKIGDGDVEDGNGCYDGNDVSQQQPERPMSWEGELSDQEMSSNTITNQDTHEETSMEGVQVCSASPSPMEQKFPIKPEPDFRSSPGFALNSFHDVGLSLAHGQQMQQQQQRNMENLEQTQQNDLPLLVGKLLGGYNSSTPNHSPVLNPRHHLTKHSHTRSQVPSPDSAIHSAYSVFSSPTQSPHAARHSALGAGSPVPSSSLSLSRHSFNNSTSSLSLSLSHSLSRNNSDASSSCYSYGSLSPPTHSPVQQPRHSQHHQHQVAQGSPLHLPATASSAVVHHYSSSAPGSELSPEGHPIADDQEDCRIPSAPSGISTRQQLINSPCPICGDKISGFHYGIFSCESCKGFFKRTVQNRKNYVCLRGAGCPVTVATRKKCPACRFDKCLNMGMKLEAIREDRTRGGRSTYQCTYTLPASLVGSPAGMPGDKLTGGGNCSPAPSGSEHHYSVRHHSNHSHKMQVVPQLLQDIMDVEHLWHYNDNDRMSGIQAGGTNTARGNDATLLGVGSGAGADSVECSPNGTAGNGNLNNRGEGRSSSTVPGVSNEQHTASINSNSQIGSNTNGNPSQHPDFLSNLCNIADHRLYKIVKWCKSLPLFKNISIDDQICLLINSWCELLLFSCCFRSMSTPGEIRVSLGKSITLEQARQLGLATCIERMLAFTNNLRRLRVDQYEYVAMKVIVLLTSDTSELKEPEKVRASQEKALQALQQYTIARYPEMPAKFGELLLRIPDLQRTCQAGKELLSAKRAEGEGSSFNLLMELLRGDH

Similar Transcription Factors

Sequence clustering based on sequence similarity using MMseqs2

100% Identity: iTF_00733987;
90% Identity: iTF_01169235;
80% Identity: iTF_01169235;