Basic Information

Insect: Coenonympha arcania
Gene Symbol: USP_2
Assembly: GCA_036785405.1
Location: CM072056.1:12541688-12567052[+]

Transcription Factor Domain

TF Family: RXR-like
Domain: zf-C4|RXR-like
PFAM: AnimalTFDB
TF Group: Zinc-Coordinating Group
Description: DNA-binding domain of retinoid X receptor (RXR) is composed of two C4-type zinc fingers. Each zinc finger contains a group of four Cys residues which co-ordinates a single zinc atom. RXR functions as a DNA binding partner by forming heterodimers with other nuclear receptors including CAR, FXR, LXR, PPAR, PXR, RAR, TR, and VDR. All RXR heterodimers preferentially bind response elements composed of direct repeats of two AGGTCA sites with a 1-5 bp spacer. RXRs can play different roles in these heterodimers. RXR acts either as a structural component of the heterodimer complex, required for DNA binding but not acting as a receptor, or as both a structural and a functional component of the heterodimer, allowing 9-cis RA to signal through the corresponding heterodimer. In addition, RXR can also form homodimers, functioning as a receptor for 9-cis RA, independently of other nuclear receptors. Like other members of the nuclear receptor (NR) superfamily of ligand-activated transcription factors, RXR has a central well conserved DNA binding domain (DBD), a variable N-terminal domain, a flexible hinge and a C-terminal ligand binding domain (LBD). [cite:PUB00121610], [cite:PUB00121611], [cite:PUB00121612], [cite:PUB00025660], [cite:PUB00121613], [cite:PUB00092048], [cite:PUB00092725], [cite:PUB00092726], [cite:PUB00016724], [cite:PUB00059514PMID:18971932
Hmmscan Out: # of c-Evalue i-Evalue score bias hmm coord from hmm coord to ali coord from ali coord to env coord from env coord to acc

1 18 2.5e-32 5.4e-29 102.3 0.2 1 115 574 700 574 704 0.96

2 18 1e-11 2.2e-08 35.0 0.0 59 115 697 750 697 753 0.95

3 18 4.1e-12 8.9e-09 36.3 0.0 58 115 746 800 746 803 0.96

4 18 4.1e-12 8.9e-09 36.3 0.0 58 115 796 850 796 853 0.96

5 18 4.1e-12 8.9e-09 36.3 0.0 58 115 846 900 846 903 0.96

6 18 4.1e-12 8.9e-09 36.3 0.0 58 115 896 950 896 953 0.96

7 18 4.1e-12 8.9e-09 36.3 0.0 58 115 946 1000 946 1003 0.96

8 18 4.1e-12 8.9e-09 36.3 0.0 58 115 996 1050 996 1053 0.96

9 18 4.1e-12 8.9e-09 36.3 0.0 58 115 1046 1100 1046 1103 0.96

10 18 3.9e-12 8.5e-09 36.4 0.0 58 115 1096 1150 1096 1154 0.96

11 18 4.1e-12 8.9e-09 36.3 0.0 58 115 1146 1200 1146 1203 0.96

12 18 4.1e-12 8.9e-09 36.3 0.0 58 115 1196 1250 1196 1253 0.96

13 18 4.5e-12 9.9e-09 36.1 0.0 58 115 1246 1300 1246 1302 0.96

14 18 1e-11 2.2e-08 35.0 0.0 59 115 1297 1350 1297 1353 0.95

15 18 1e-11 2.2e-08 35.0 0.0 59 115 1347 1400 1347 1403 0.95

16 18 4.5e-12 9.9e-09 36.1 0.0 58 115 1396 1450 1396 1452 0.96

17 18 4.1e-12 8.9e-09 36.3 0.0 58 115 1446 1500 1446 1503 0.96

18 18 9.3e-12 2e-08 35.1 0.0 59 115 1497 1550 1497 1555 0.95

#	of	c-Evalue	i-Evalue	score	bias	hmm coord from	hmm coord to	ali coord from	ali coord to	env coord from	env coord to	acc
1	18	2.5e-32	5.4e-29	102.3	0.2	1	115	574	700	574	704	0.96
2	18	1e-11	2.2e-08	35.0	0.0	59	115	697	750	697	753	0.95
3	18	4.1e-12	8.9e-09	36.3	0.0	58	115	746	800	746	803	0.96
4	18	4.1e-12	8.9e-09	36.3	0.0	58	115	796	850	796	853	0.96
5	18	4.1e-12	8.9e-09	36.3	0.0	58	115	846	900	846	903	0.96
6	18	4.1e-12	8.9e-09	36.3	0.0	58	115	896	950	896	953	0.96
7	18	4.1e-12	8.9e-09	36.3	0.0	58	115	946	1000	946	1003	0.96
8	18	4.1e-12	8.9e-09	36.3	0.0	58	115	996	1050	996	1053	0.96
9	18	4.1e-12	8.9e-09	36.3	0.0	58	115	1046	1100	1046	1103	0.96
10	18	3.9e-12	8.5e-09	36.4	0.0	58	115	1096	1150	1096	1154	0.96
11	18	4.1e-12	8.9e-09	36.3	0.0	58	115	1146	1200	1146	1203	0.96
12	18	4.1e-12	8.9e-09	36.3	0.0	58	115	1196	1250	1196	1253	0.96
13	18	4.5e-12	9.9e-09	36.1	0.0	58	115	1246	1300	1246	1302	0.96
14	18	1e-11	2.2e-08	35.0	0.0	59	115	1297	1350	1297	1353	0.95
15	18	1e-11	2.2e-08	35.0	0.0	59	115	1347	1400	1347	1403	0.95
16	18	4.5e-12	9.9e-09	36.1	0.0	58	115	1396	1450	1396	1452	0.96
17	18	4.1e-12	8.9e-09	36.3	0.0	58	115	1446	1500	1446	1503	0.96
18	18	9.3e-12	2e-08	35.1	0.0	59	115	1497	1550	1497	1555	0.95

Sequence Information

Coding Sequence: ATGAAAATGCTTACTCTGAACTTAAGGAGATTAAAGCTGGAGTACCACAAGGAAGTGTCCTGGGGCCTGTCTTATACCTTCTCTATACATGTGATATTCCAGAACTCGAACATAACACTATCGCTACCTTTGCCGATGACACTGCCATCATCGCTGTGGGGAATACTCATGAAGAGGCAGTGGGAAAGAATGGATTCCAAGAAACAGGAAAAGGAAGAAAGGAAGACAAAGGAGAAGATGGAGAGATATCTTCAATCAAATTGTGGGACCAAACTGGATGACGGGCTGAACTTAGAGGCGGGCTTCATGTCGCCCATGTCGCCGCCGGAGATGAAGCCCGACACGGCCATGCTGGACGGCATGCGGGACGACGCCACGTCTCCGCCGGCGATGAGGAACTACCCGCCGAACCATCCCCTCAGCGGCTCCAAGCACCTCTGCTCCATATGCGGCGACAGGGCGTCGGGGAAGCATTACGGAGTTTATAGGTTAGTCAACATAGAGACGAGCTTCATGTCGCCCATGTCGCCGCCGGAGATGAAGCCCGACACGGCCATGCTGGACGGCATGCGGGACGACGCCACGTCTCCGCCGGCGATGAGGAACTACCCGCCGAACCATCCCCTCAGCGGCTCCAAGCACCTCTGCTCCATATGCGGCGACAGGGCGTCGGGGAAGCATTACGGAGTTTATAGGTTAGTCAACATAGAGACGAGCTTCATGTCGCCCATGTCGCCGCCGGAGATGAAGCCCGACACGGCCATGCTGGACGGCATGCGGGACGACGCCACGTCTCCGCCGGCGATGAGGAACTACCCGCCGAACCATCCCCTCAGCGGCTCCAAGCACCTCTGCTCCATATGCGGCGACAGGGCGTCGGGGAAGCATTACGGAGTTTATAGGTTAGTCAACATAGAGACGAGCTTCATGTCGCCCATGTCGCCGCCGGAGATGAAGCCCGACACGGCCATGCTGGACGGCATGCGGGACGACGCCACGTCTCCGCCGGCGATGAGGAACTACCCGCCGAACCATCCCCTCAGCGGCTCCAAGCACCTCTGCTCCATATGCGGCGACAGGGCGTCGGGGAAGCATTACGGAGTTTATAGTTGCGAAGGCTGCAAGGGTTTCTTCAAGCGGACCGTGAGGAAGGACCTCACGTACGCGTGTCGTGAGGAGAGGAATTGCATAATCGACAAGCGACAGCGGAACCGATGCCAGTACTGTCGATATCAGAAGTGCCTCGCGTGCGGCATGAAGCGCGAGGCCGTGCAGGAGGAgcggcagcgggcggcgcgcggcgcggaggATGCTCATCCCAGCAGTTCTGTTCAGGAGCTGTCGATCGAGCGGCTGCTGGAGATGGAGTCGCTGGTGGCGGACCCCAGCGAGGAGTTCCAGTTCCTGCGCGTGGGGCCCGACAGCAACGTgcccgcgcggtaccgcgcgccCGTCTCCAGCCTGTGCCAGATAGGTAACGTGCCGCGACCTGGAGCGCTTTATGTATCGAAGCAGAGCGAGGAGTTCCAGTTCCTGCGCGTGGGGCCCGACAGCAACATgcccgcgcggtaccgcgcgccCGTCTCCAGCCTGTGCCAGATAGGTAACGTGCCGCGACCTGGAGCGCTTAATGTATCGAAGCAGAGCGAGGAGTTCCAGTTCCTGCGCGTGGGGCCCGACAGCAACGTgcccgcgcggtaccgcgcgccCGTCTCCAGCCTGTGCCAGATAGGCAACAAGCAGATCGCGGCGCTGGTGGTGTGGGCGCGCGACATCCCCCACTTCAGCCAGCTGGAGCTCGACGACCAGGTGGTGCTCATCAAGGCGTCCTGGAACGAGCTGCTGCTCTTCGCCATCGCCTGGCGCTCCATGGAGTACCTGGAAGATGAGCGGGAGAACATGGACGGCACGcgaagcgccgcgccgccgcagctcATGTGTCTAATGCCTGGCATGACGCTGCACCGCAACTCGGCGCTGCAGGCGGGCGTGGGGCAGATCTTCGACCGCGTGCTGTCGGAGCTGTCGCTCAAGATGCGCGCGCTGCGCATGGACCAGGCCGAGTACGTCGCGCTCAAGGCCATCATCCTGCTCAACCCAGGCATGACGCTGCACCGCAACTCGGCGCTGCAGGCGGGCGTGGGGCAGATCTTCGACCGCGTGCTGTCGGAGCTGTCGCTCAAGATGCGCGCGCTGCGCATGGACCAGGCCGAGTACGTCGCGCTCAAGGCCATCATCCTGCTCAACCCAGGCATGACGCTGCACCGCAACTCGGCGCTGCAGGCGGGCGTGGGGCAGATCTTCGACCGCGTGCTGTCGGAGCTGTCGCTCAAGATGCGCGCGCTGCGCATGGACCAGGCCGAGTACGTCGCGCTCAAGGCCATCATCCTGCTCAACCCAGGCATGACGCTGCACCGCAACTCGGCGCTGCAGGCGGGCGTGGGGCAGATCTTCGACCGCGTGCTGTCGGAGCTGTCGCTCAAGATGCGCGCGCTGCGCATGGACCAGGCCGAGTACGTCGCGCTCAAGGCCATCATCCTGCTCAACCCAGGCATGACGCTGCACCGCAACTCGGCGCTGCAGGCGGGCGTGGGGCAGATCTTCGACCGCGTGCTGTCGGAGCTGTCGCTCAAGATGCGCGCGCTGCGCATGGACCAGGCCGAGTACGTCGCGCTCAAGGCCATCATCCTGCTCAACCCAGGCATGACGCTGCACCGCAACTCGGCGCTGCAGGCGGGCGTGGGGCAGATCTTCGACCGCGTGCTGTCGGAGCTGTCGCTCAAGATGCGCGCGCTGCGCATGGACCAGGCCGAGTACGTCGCGCTCAAGGCCATCATCCTGCTCAACCCAGGCATGACGCTGCACCGCAACTCGGCGCTGCAGGCGGGCGTGGGGCAGATCTTCGACCGCGTGCTGTCGGAGCTGTCGCTCAAGATGCGCGCGCTGCGCATGGACCAGGCCGAGTACGTCGCGCTCAAGGCCATCATCCTGCTCAACCCAGGCATGACGCTGCACCGCAACTCGGCGCTGCAGGCGGGCGTGGGGCAGATCTTCGACCGCGTGCTGTCGGAGCTGTCGCTCAAGATGCGCGCGCTGCGCATGGACCAGGCCGAGTACGTCGCGCTCAAGGCCATCATCCTGCTCAACCCAGGCATGACGCTGCACCGCAACTCGGCGCTGCAGGCGGGCGTGGGGCAGATCTTCGACCGCGTGCTGTCGGAGCTGTCGCTCAAGATGCGCGCGCTGCGCATGGACCAGGCCGAGTACGTCGCGCTCAAGGCCATCATCCTGCTCAACCCAGGCATGACGCTGCACCGCAACTCGGCGCTGCAGGCGGGCGTGGGGCAGATCTTCGACCGCGTGCTGTCGGAGCTGTCGCTCAAGATGCGCGCGCTGCGCATGGACCAGGCCGAGTACGTCGCGCTCAAGGCCATCATCCTGCTCAACCCAGGCATGACGCTGCACCGCAACTCGGCGCTGCAGGCGGGCGTGGGGCAGATCTTCGACCGCGTGCTGTCGGAGCTGTCGCTCAAGATGCGCGCGCTGCGCATGGACCAGGCCGAGTACGTCGCGCTCAAGGCCATCATCCTGCTCAACCCAGGCATGACGCTGCACCGCAACTCGGCGCTGCAGGCGGGCGTGGGGCAGATCTTCGACCGCGTGCTGTCGGAGCTGTCGCTCAAGATGCGCGCGCTGCGCATGGACCAGGCCGAGTACGTCGCGCTCAAGGCCATCATCCTGCTCAACCCAGGCATGACGCTGCACCGCAACTCGGCGCTGCAGGCGGGCGTGGGGCAGATCTTCGACCGCGTGCTGTCGGAGCTGTCGCTCAAGATGCGCGCGCTGCGCATGGACCAGGCCGAGTACGTCGCGCTCAAGGCCATCATCCTGCTCAACCCAGGCATGACGCTGCACCGCAACTCGGCGCTGCAGGCGGGCGTGGGGCAGATCTTCGACCGCGTGCTGTCGGAGCTGTCGCTCAAGATGCGCGCGCTGCGCATGGACCAGGCCGAGTACGTCGCGCTCAAGGCCATCATCCTGCTCAACCCAGGCATGACGCTGCACCGCAACTCGGCGCTGCAGGCGGGCGTGGGGCAGATCTTCGACCGCGTGCTGTCGGAGCTGTCGCTCAAGATGCGCGCGCTGCGCATGGACCAGGCCGAGTACGTCGCGCTCAAGGCCATCATCCTGCTCAACCCAGGCATGACGCTGCACCGCAACTCGGCGCTGCAGGCGGGCGTGGGGCAGATCTTCGACCGCGTGCTGTCGGAGCTGTCGCTCAAGATGCGCGCGCTGCGCATGGACCAGGCCGAGTACGTCGCGCTCAAGGCCATCATCCTGCTCAACCCAGGCATGACGCTGCACCGCAACTCGGCGCTGCAGGCGGGCGTGGGGCAGATCTTCGACCGCGTGCTGTCGGAGCTGTCGCTCAAGATGCGCGCGCTGCGCATGGACCAGGCCGAGTACGTCGCGCTCAAGGCCATCATCCTGCTCAACCCAGGCATGACGCTGCACCGCAACTCGGCGCTGCAGGCGGGCGTGGGGCAGATCTTCGACCGCGTGCTGTCGGAGCTGTCGCTCAAGATGCGCGCGCTGCGCATGGACCAGGCCGAGTACGTCGCGCTCAAGGCCATCATCCTGCTCAACCCAGGTAACACTCGGCAGGCATGA
Protein Sequence: MKMLTLNLRRLKLEYHKEVSWGLSYTFSIHVIFQNSNITLSLPLPMTLPSSLWGILMKRQWERMDSKKQEKEERKTKEKMERYLQSNCGTKLDDGLNLEAGFMSPMSPPEMKPDTAMLDGMRDDATSPPAMRNYPPNHPLSGSKHLCSICGDRASGKHYGVYRLVNIETSFMSPMSPPEMKPDTAMLDGMRDDATSPPAMRNYPPNHPLSGSKHLCSICGDRASGKHYGVYRLVNIETSFMSPMSPPEMKPDTAMLDGMRDDATSPPAMRNYPPNHPLSGSKHLCSICGDRASGKHYGVYRLVNIETSFMSPMSPPEMKPDTAMLDGMRDDATSPPAMRNYPPNHPLSGSKHLCSICGDRASGKHYGVYSCEGCKGFFKRTVRKDLTYACREERNCIIDKRQRNRCQYCRYQKCLACGMKREAVQEERQRAARGAEDAHPSSSVQELSIERLLEMESLVADPSEEFQFLRVGPDSNVPARYRAPVSSLCQIGNVPRPGALYVSKQSEEFQFLRVGPDSNMPARYRAPVSSLCQIGNVPRPGALNVSKQSEEFQFLRVGPDSNVPARYRAPVSSLCQIGNKQIAALVVWARDIPHFSQLELDDQVVLIKASWNELLLFAIAWRSMEYLEDERENMDGTRSAAPPQLMCLMPGMTLHRNSALQAGVGQIFDRVLSELSLKMRALRMDQAEYVALKAIILLNPGMTLHRNSALQAGVGQIFDRVLSELSLKMRALRMDQAEYVALKAIILLNPGMTLHRNSALQAGVGQIFDRVLSELSLKMRALRMDQAEYVALKAIILLNPGMTLHRNSALQAGVGQIFDRVLSELSLKMRALRMDQAEYVALKAIILLNPGMTLHRNSALQAGVGQIFDRVLSELSLKMRALRMDQAEYVALKAIILLNPGMTLHRNSALQAGVGQIFDRVLSELSLKMRALRMDQAEYVALKAIILLNPGMTLHRNSALQAGVGQIFDRVLSELSLKMRALRMDQAEYVALKAIILLNPGMTLHRNSALQAGVGQIFDRVLSELSLKMRALRMDQAEYVALKAIILLNPGMTLHRNSALQAGVGQIFDRVLSELSLKMRALRMDQAEYVALKAIILLNPGMTLHRNSALQAGVGQIFDRVLSELSLKMRALRMDQAEYVALKAIILLNPGMTLHRNSALQAGVGQIFDRVLSELSLKMRALRMDQAEYVALKAIILLNPGMTLHRNSALQAGVGQIFDRVLSELSLKMRALRMDQAEYVALKAIILLNPGMTLHRNSALQAGVGQIFDRVLSELSLKMRALRMDQAEYVALKAIILLNPGMTLHRNSALQAGVGQIFDRVLSELSLKMRALRMDQAEYVALKAIILLNPGMTLHRNSALQAGVGQIFDRVLSELSLKMRALRMDQAEYVALKAIILLNPGMTLHRNSALQAGVGQIFDRVLSELSLKMRALRMDQAEYVALKAIILLNPGMTLHRNSALQAGVGQIFDRVLSELSLKMRALRMDQAEYVALKAIILLNPGMTLHRNSALQAGVGQIFDRVLSELSLKMRALRMDQAEYVALKAIILLNPGNTRQA

Similar Transcription Factors

Sequence clustering based on sequence similarity using MMseqs2

100% Identity: iTF_00353122;
90% Identity: iTF_00353122;
80% Identity: iTF_00353122;