Basic Information

Insect: Agriphila straminella
Gene Symbol: Trm1_1
Assembly: GCA_950108535.1
Location: OX467320.1:2256681-2291118[+]

Transcription Factor Domain

TF Family: NCU-G1
Domain: NCU-G1 domain
PFAM: PF15065
TF Group: Unclassified Structure
Description: NCU-G1 is a set of highly conserved nuclear proteins rich in proline with a molecular weight of approximately 44 kDa. Especially high levels are detected in human prostate, liver and kidney. NCU-G1 is a dual-function family capable of functioning as a transcription factor as well as a nuclear receptor co-activator by stimulating the transcriptional activity of peroxisome proliferator-activated receptor-alpha (PPAR-alpha) [1].
Hmmscan Out: # of c-Evalue i-Evalue score bias hmm coord from hmm coord to ali coord from ali coord to env coord from env coord to acc

1 10 3.5e-76 1.3e-71 242.5 0.0 1 308 530 825 530 829 0.93

2 10 0.15 5.4e+03 -3.0 0.0 288 308 884 904 868 906 0.85

3 10 0.15 5.4e+03 -3.0 0.0 288 308 963 983 947 985 0.85

4 10 0.15 5.4e+03 -3.0 0.0 288 308 1042 1062 1026 1064 0.85

5 10 0.15 5.4e+03 -3.0 0.0 288 308 1121 1141 1105 1143 0.85

6 10 0.15 5.4e+03 -3.0 0.0 288 308 1200 1220 1184 1222 0.85

7 10 0.15 5.4e+03 -3.0 0.0 288 308 1279 1299 1263 1301 0.85

8 10 0.15 5.4e+03 -3.0 0.0 288 308 1358 1378 1342 1380 0.85

9 10 0.15 5.4e+03 -3.0 0.0 288 308 1437 1457 1421 1459 0.85

10 10 2.7e-18 9.7e-14 52.1 0.4 288 350 1597 1659 1570 1662 0.89

#	of	c-Evalue	i-Evalue	score	bias	hmm coord from	hmm coord to	ali coord from	ali coord to	env coord from	env coord to	acc
1	10	3.5e-76	1.3e-71	242.5	0.0	1	308	530	825	530	829	0.93
2	10	0.15	5.4e+03	-3.0	0.0	288	308	884	904	868	906	0.85
3	10	0.15	5.4e+03	-3.0	0.0	288	308	963	983	947	985	0.85
4	10	0.15	5.4e+03	-3.0	0.0	288	308	1042	1062	1026	1064	0.85
5	10	0.15	5.4e+03	-3.0	0.0	288	308	1121	1141	1105	1143	0.85
6	10	0.15	5.4e+03	-3.0	0.0	288	308	1200	1220	1184	1222	0.85
7	10	0.15	5.4e+03	-3.0	0.0	288	308	1279	1299	1263	1301	0.85
8	10	0.15	5.4e+03	-3.0	0.0	288	308	1358	1378	1342	1380	0.85
9	10	0.15	5.4e+03	-3.0	0.0	288	308	1437	1457	1421	1459	0.85
10	10	2.7e-18	9.7e-14	52.1	0.4	288	350	1597	1659	1570	1662	0.89

Sequence Information

Coding Sequence: ATGGAAGCCACAACAAATAAAACCATAAAGGAAGGTCCAGCCGTAATTAATTTGGTGTCTGAGAAAGTTTTCTACAATCCTGTGCAAGAATTCAACAGGGATCTTAGTATACTTGTACTAAATGTGTTCTCGGAGGACTATAAAGCTGAAAAAACTGCTCGGGCACAGAAAAAagctcaaaataaaattaatgatggCACAACCGATAGTTGTTCTGATAAACAAGAGATTGAATTGACCATTCTAGAAGCACTCTCAGCCACAGGACTAAGAAGCATCCGTTACGCAAAAGAAGTAGCGAATGTCACTAAAATTGTTGCCAACGACCTGTCCCAGCAGGCTGTGGAAACAATGAAGATTAACTTTGAGCAAAATAAAGTAGATCATGTGGTGATGGCTAACCATGATGATGCATGCATGCTTATGTACAAACACAAACATCCCTCTGAACGTTTCTCAGCCATAGACCTGGATCCGTACGGATGTCCGTCAATATTCCTGGACGCTGCCGTACAGAGTGTGCAGGATGGAGGCCTGCTGCTGGTCACTGCTACAGATATGGCGGTGCTTGCTGGAAACTCGCCAGAAACTTGCTATAGCAAATACGGTGCAGTCAGTTTGAAAACTAAATGCTGCCATGAAATGgcGTTAAGAATATTATTGCAGTGTATAGAGAAACATGCAAACAGATACAGCCGGTACATAGTCCCGCTGCTAAGTATTTCTGCTGACTTCTACATTCGTGTATTTGTGAAAGTGTATAGTGGTGCTATACATTGTAAGAAAACAACTAGCAAGTTATCCATGGTCTACCAATGTGTGGGCTGCGACAATATGACTTTGCAACCACTCGGTGGATTCAAACCGAATCCAACTGAAAAGTATCCGGATCAAaccaaagcatttttgcccactGGCCCACCAGTTAGTGAACACTGCATACACTGCAACCAGAGACACCATCTAGGTGGTCCAATTTGGTCAGCTCCTATCCACGACGAAGTGTTCGTGTCGCGAGTGCTGACGGAGCTGCAGTCGGGGCGGCACTGCCTCGGCACCAAAGACAGGATAGAGGGCGTGCTGTCTGTGGTGCGCGAGGAGTTGCACGAAGTGCCGCTGTACTACACGCTGGACAGGCTGTTCGGGAGGGTGCACTTGGAGACTATGCCCATGTTGCAGATGAGATCTGCAATCTTGAACGCCGGGTACAAGGTGTCATACTCGCACGCATCCAAAATGTCCATCAAAACAGCGGCGCCGGCGCAGCTGATATGGGATATCATCAGGACGTGGGAGAAGACTCACCCTGTCAAGCCTGCTAGGCTGGAAGCCGACCAAGTGGCTGCGTTCATCCTGTCCCAGCCGATCACGTGTCCCGTGGAGCTGAGCCCGCGGCCGGACGCCAACCCTGTGTCGCGGCGCGCCAAGGTGCTGCGGTTCCAGTTCAACCCGCAGCCGCACTGGGGGCCCGGCGCTAGGGCCGTAGTCAAAGGAAATCTCGTTCGCACCATGATCGAATGGAAGGATCTGACACCCCACATAAATGCAACACTTTACCCAGGATGTGAAGTGTGCTCAGACAATGATACACTCATTTATATAAGGGCAGAAGGTACCCATGACACCATCCATCAGGTATGGGACTTTACAGGGGGAATTCCAACGATGATGCTGGCTGTTGCTGGATTAAATTCTTCAATGAGAATAGATTGGGCAAAAACACATCCTATCAGGTTTAGATTTTCTGAGAAACCTCGGTATGGATTTGCAACTGCAATTGACAAGTTATATGAGTACAATGACGTTCACGACAACGGGTACATAGATAACGACAGCGCGCGTCGTGAGTTGCCGCTGTGGCGGGCGACGTGGTGGGCGCACAGCATGGCGCTCACCGACCAGGAGGTGATGCTGCAGCTGCGCGGCCGAGTCTCCGACCACAAGCGGACCGGGCTCGTCGACATCAAGCTGGACCTACTACCGTTCAAAGACTACGCAGTGGAGCTCCCGCACCTAATCCACACGGCCAACTCCACGTTACTGGACGTGGCGCTGGTGAACTTCACCACGTCGCCGGACTACAACTCGTCGCGGTACGCGCTCAGCCTGCTGCTCGTCAGCTTGGACCCGAGCGACGGGACCTTCACGTCTAATATGAGGAAGAGCTTGGATGATGAGCACACGCCTGGGGTCTTTGAGATAATGGAGGTGTCGTCGCCTTCGAGCGCGGGCGGCGACGGGGGGTTCCTGCAGTTCCGGCCGGTGTGCTACACGCAGCCGCGCCGCACCGTCGAATCCTCGACACGCGCCCACTTATCCGCGCTAGCCGGGACTCGCATTCCTCCGGGCAGCACCGTGGACGCTTTCTTCCACGGGTGGGATCCCTCGAGGCTGCTCGTGCAGGCGGCGCTAGTGTCGTTCGGGGAGCCCTCTGACGGGTTCTACCGGCACCACAACTATACTGCATGGTATGTTGTTGGTTCTATTATTGACAGGGCTCATGTCCCCGGGCAGTACTGTGGACGCCTTCCACCGGCACCACAACTATACTGCATGGGCTCATGTCCCCGGGCAGTACTGTGGACGCCTTCCACCGGCACCACAACTATACTGCATGGTATGTTGTTGGTTCTATTATTGACAGGGCTCATGTCCCCGGGCAGTACTGTGGACGCCTTCCACCGGCACCACAACTATACTGCATGGTATGTTGTTGGTTCTATTATTGACAGGGCTCATGTCCCCGGGCAGTACTGTGGACGCCTTCCACCGGCACCACAACTATACTGCATGGGCTCATGTCCCCGGGCAGTACTGTGGACGCCTTCCACCGGCACCACAACTATACTGCATGGTATGTTGTTGGTTCTATTATTGACAGGGCTCATGTCCCCGGGCAGTACTGTGGACGCCTTCCACCGGCACCACAACTATACTGCATGGTATGTTGTTGGTTCTATTATTGACAGGGCTCATGTCCCCGGGCAGTACTGTGGACGCCTTCCACCGGCACCACAACTATACTGCATGGGCTCATGTCCCCGGGCAGTACTGTGGACGCCTTCCACCGGCACCACAACTATACTGCATGGTATGTTGTTGGTTCTATTATTGACAGGGCTCATGTCCCCGGGCAGTACTGTGGACGCCTTCCACCGGCACCACAACTATACTGCATGGTATGTTGTTGGTTCTATTATTGACAGGGCTCATGTCCCCGGGCAGTACTGTGGACGCCTTCCACCGGCACCACAACTATACTGCATGGGCTCATGTCCCCGGGCAGTACTGTGGACGCCTTCCACCGGCACCACAACTATACTGCATGGTATGTTGTTGGTTCTATTATTGACAGGGCTCATGTCCCCGGGCAGTACTGTGGACGCCTTCCACCGGCACCACAACTATACTGCATGGTATGTTGTTGGTTCTATTATTGACAGGGCTCATGTCCCCGGGCAGTACTGTGGACGCCTTCCACCGGCACCACAACTATACTGCATGGGCTCATGTCCCCGGGCAGTACTGTGGACGCCTTCCACCGGCACCACAACTATACTGCATGGTATGTTGTTGGTTCTATTATTGACAGGGCTCATGTCCCCGGGCAGTACTGTGGACGCCTTCCACCGGCACCACAACTATACTGCATGGTATGTTGTTGGTTCTATTATTGACAGGGCTCATGTCCCCGGGCAGTACTGTGGACGCCTTCCACCGGCACCACAACTATACTGCATGGGCTCATGTCCCCGGGCAGTACTGTGGACGCCTTCCACCGGCACCACAACTATACTGCATGGTATGTTGTTGGTTCTATTATTGACAGGGCTCATGTCCCCGGGCAGTACTGTGGACGCCTTCCACCGGCACCACAACTATACTGCATGGTATGTTGTTGGTTCTATTATTGACAGGGCTCATGTCCCCGGGCAGTACTGTGGACGCCTTCCACCGGCACCACAACTATACTGCATGGGCTCATGTCCCCGGGCAGTACTGTGGACGCCTTCCACCGGCACCACAACTATACTGCATGGTATGTTGTTGGTTCTATTATTGACAGGGCTCATGTCCCCGGGCAGTACTGTGGACGCCTTCCACCGGCACCACAACTATACTGCATGGTATGTTGTTGGTTCTATTATTGACAGGGCTCATGTCCCCGGGCAGTACTGTGGACGCCTTCCACCGGCACCACAACTATACTGCATGGGCTCATGTCCCCGGGCAGTACTGTGGACGCCTTCCACCGGCACCACAACTATACTGCATGGTATGTTGTTGGTTCTATTATTGACAGGGCTCATGTCCCCGGGCAGTACTGTGGACGCCTTCCACCGGCACCACAACTATACTGCATGGTATGTTGTTGGTTCTATTATTGACAGGGCTCATGTCCCCGGGCAGTACTGTGGACGCCTTCCACCGGCACCACAACTATACTGCATGGGCTCATGTCCCCGGGCAGTACTGTGGACGCCTTCCACCGGCACCACAACTATACTGCATGGTATGTTGTTGGTTCTATTATTGACAGGGCTCATGTCCCCGGGCAGTACTGTGGACGCCTTCTTCCACCGGCACCACAACTATACTGCATGGTATGTTGTTGGTTCTATTATTGACAGGGCTCATGTCCCCGGGCAGTACTGTGGACGCCTTCCACCGGCACCACAACTATACTGCATGGGCTCATGTCCCCGGGCAGTACTGTGGACGCCTTCTTCCACCGGCACCACAACTATACTGCATGGTATGTTGTTGGTTCTATTATTGACAGGGCTCATGTCCCCGGGCAGTACTGTGGACGCCTTCCACCGGCACCACAACTATACTGCATGGTCAACAACGGTGGGGTACGGGTCACCGCCCGTGGAGGGTTTCTCGGCGTTCGTGATCGGCATGCTGGTGGGCGGGCTCGGGGCCCCCGCGCTGCTGGCGCTGGCCGGCGCGGGGTACGCGCTGCGCCGCCGCGGGGCCAACCGCCCGCAGCGACTCACCGACCAGCAGTGA
Protein Sequence: MEATTNKTIKEGPAVINLVSEKVFYNPVQEFNRDLSILVLNVFSEDYKAEKTARAQKKAQNKINDGTTDSCSDKQEIELTILEALSATGLRSIRYAKEVANVTKIVANDLSQQAVETMKINFEQNKVDHVVMANHDDACMLMYKHKHPSERFSAIDLDPYGCPSIFLDAAVQSVQDGGLLLVTATDMAVLAGNSPETCYSKYGAVSLKTKCCHEMALRILLQCIEKHANRYSRYIVPLLSISADFYIRVFVKVYSGAIHCKKTTSKLSMVYQCVGCDNMTLQPLGGFKPNPTEKYPDQTKAFLPTGPPVSEHCIHCNQRHHLGGPIWSAPIHDEVFVSRVLTELQSGRHCLGTKDRIEGVLSVVREELHEVPLYYTLDRLFGRVHLETMPMLQMRSAILNAGYKVSYSHASKMSIKTAAPAQLIWDIIRTWEKTHPVKPARLEADQVAAFILSQPITCPVELSPRPDANPVSRRAKVLRFQFNPQPHWGPGARAVVKGNLVRTMIEWKDLTPHINATLYPGCEVCSDNDTLIYIRAEGTHDTIHQVWDFTGGIPTMMLAVAGLNSSMRIDWAKTHPIRFRFSEKPRYGFATAIDKLYEYNDVHDNGYIDNDSARRELPLWRATWWAHSMALTDQEVMLQLRGRVSDHKRTGLVDIKLDLLPFKDYAVELPHLIHTANSTLLDVALVNFTTSPDYNSSRYALSLLLVSLDPSDGTFTSNMRKSLDDEHTPGVFEIMEVSSPSSAGGDGGFLQFRPVCYTQPRRTVESSTRAHLSALAGTRIPPGSTVDAFFHGWDPSRLLVQAALVSFGEPSDGFYRHHNYTAWYVVGSIIDRAHVPGQYCGRLPPAPQLYCMGSCPRAVLWTPSTGTTTILHGMLLVLLLTGLMSPGSTVDAFHRHHNYTAWYVVGSIIDRAHVPGQYCGRLPPAPQLYCMGSCPRAVLWTPSTGTTTILHGMLLVLLLTGLMSPGSTVDAFHRHHNYTAWYVVGSIIDRAHVPGQYCGRLPPAPQLYCMGSCPRAVLWTPSTGTTTILHGMLLVLLLTGLMSPGSTVDAFHRHHNYTAWYVVGSIIDRAHVPGQYCGRLPPAPQLYCMGSCPRAVLWTPSTGTTTILHGMLLVLLLTGLMSPGSTVDAFHRHHNYTAWYVVGSIIDRAHVPGQYCGRLPPAPQLYCMGSCPRAVLWTPSTGTTTILHGMLLVLLLTGLMSPGSTVDAFHRHHNYTAWYVVGSIIDRAHVPGQYCGRLPPAPQLYCMGSCPRAVLWTPSTGTTTILHGMLLVLLLTGLMSPGSTVDAFHRHHNYTAWYVVGSIIDRAHVPGQYCGRLPPAPQLYCMGSCPRAVLWTPSTGTTTILHGMLLVLLLTGLMSPGSTVDAFHRHHNYTAWYVVGSIIDRAHVPGQYCGRLPPAPQLYCMGSCPRAVLWTPSTGTTTILHGMLLVLLLTGLMSPGSTVDAFHRHHNYTAWYVVGSIIDRAHVPGQYCGRLPPAPQLYCMGSCPRAVLWTPSTGTTTILHGMLLVLLLTGLMSPGSTVDAFFHRHHNYTAWYVVGSIIDRAHVPGQYCGRLPPAPQLYCMGSCPRAVLWTPSSTGTTTILHGMLLVLLLTGLMSPGSTVDAFHRHHNYTAWSTTVGYGSPPVEGFSAFVIGMLVGGLGAPALLALAGAGYALRRRGANRPQRLTDQQ

Similar Transcription Factors

Sequence clustering based on sequence similarity using MMseqs2

100% Identity: -
90% Identity: -
80% Identity: -