Basic Information

Insect: Hesperia comma
Gene Symbol: Trm1_1
Assembly: GCA_905404135.1
Location: FR990028.1:1878360-1898774[+]

Transcription Factor Domain

TF Family: NCU-G1
Domain: NCU-G1 domain
PFAM: PF15065
TF Group: Unclassified Structure
Description: NCU-G1 is a set of highly conserved nuclear proteins rich in proline with a molecular weight of approximately 44 kDa. Especially high levels are detected in human prostate, liver and kidney. NCU-G1 is a dual-function family capable of functioning as a transcription factor as well as a nuclear receptor co-activator by stimulating the transcriptional activity of peroxisome proliferator-activated receptor-alpha (PPAR-alpha) [1].
Hmmscan Out: # of c-Evalue i-Evalue score bias hmm coord from hmm coord to ali coord from ali coord to env coord from env coord to acc

1 4 6.4e-32 2e-27 96.9 0.0 2 189 608 789 607 795 0.85

2 4 5.8e-13 1.8e-08 34.5 0.0 161 212 797 848 796 851 0.96

3 4 2.8e-12 8.7e-08 32.3 0.0 161 212 855 906 854 909 0.96

4 4 1.4e-36 4.4e-32 112.2 0.0 161 308 913 1053 912 1056 0.94

#	of	c-Evalue	i-Evalue	score	hmm coord from	hmm coord to	ali coord from	ali coord to	env coord from	env coord to	acc
1	4	6.4e-32	2e-27	96.9	2	189	608	789	607	795	0.85
2	4	5.8e-13	1.8e-08	34.5	161	212	797	848	796	851	0.96
3	4	2.8e-12	8.7e-08	32.3	161	212	855	906	854	909	0.96
4	4	1.4e-36	4.4e-32	112.2	161	308	913	1053	912	1056	0.94

Sequence Information

Coding Sequence: ATGAAAACTACTGAGATGGCTGAACCACCAGCCAGGGAGATTTTTAAATCGATAATAGAAGGGCGAGCGATTTTACGCATCTCGTCGGAGAAAGTATTTTACAATCCTGTTCAGGAATTTAATCGGGATCTTAGTATCGCTGTCCTATCAGTGTTTGTTGAAGATTATAAAAAGGAAAAAATTTTGGAGGCAAAAAAGCAGAAAAATAATGACAACTTTATGGATGAAGATGTGAAAGTGGACGTAACAATTCTGGAGGCTCTGTCAGCAACTGGTCTACGGAGCATCCGTTACGTAAAGGAAGTTCCAGGCATAACCAAGGTGATTGCAAATGACATATGTGAGAAAGCTGTGAAGACTATTCAGGAAAATATATTTTTCAACAATGTAGACCACATTGTTGAAACAAGCCATGATGATGCTTGCCTGCTGATGTACAAACACAAGCACCGCGCAAAGCGGTTCGCAGCGGTGGACCTGGACCCGTACGGCTCGCCAACAACCTTCCTGGACGCGGCAGTCCAGAGCGTGGCGGACGGTGGGTTGCTGCTGGTCACCGCTACTGACATGGCTGTGTTGGCTGGAAACTCCCCCGAGACGTGCTACTGCAAGTACGGGGCGGTTAGCCTCAAGACCAAGTGCTGTCATGAAATGGCTCTCAGGATACTGCTACAATGCATAGAGTCACACGCCAACAGATACAGCCGGTACATAGTGCCCCTACTGAGCATATCCGTCGACTTCTATATCCGCGTCTTTGTGAAGGTGTACTCGGGAGCTGGTCAATGCAAAAACACGACAAGCAAACTAGCAATGGTGTACCACTGCGCGGGCTGTGACTCGTCGACGCTGCAGCCGCTGGGCGCCTTCAAACCCAACCCCTCGCCCAAGCGGCCCGACCAGCTCAAGGGATACCTGCCGCCCGCGCCGCCCGTGAGCATGCTGTGTGACAACTGCGGGCATAAACATCAGATGGGCGGTCCGATCTGGTCGGCGGCGCTGCACGACCAGGCGTTCGTGCAGCGCGTGTTGTCGCTCGCGGGCGACGCGCGGTTCGGCACGGCGCGCCGGCTCAGCGGTGTACTAGCGGTCATCAGCGAGGAGCTAGCCGCCCCGCTGTACTACACGCTGGACCGCCTGTGCAGCACCGTACACGCTGACATGATGCCCATCATAATGTTCAGATCGGCGATCCTGAACGCGGGCTACGAGGTGTCGTTCTCGCACGCCAACAAGCTGTCGATCAAGACGAACGCGCCCAACAAGTTCGTGTGGGACGTCATGCGCGCCTGGGTCAAACGGCAGCCGGTGAAAGCCGCCAAGATGGAAGCGAACCCGCTAGCGAAGCACATCCTGTCGCAGCCGCTCACGCACGAGGTGGCGCTGAGCGAGCGCGCGGACGCCAACCCGACCAGCCGCCGCGACAGACAGACGCGCTTCCAGTTCAACCCCACGCCGCACTGGGGGCCCGGCTGCCGGTCTACTATCAATACGGCAGAAAACAAGAACCTCAAGTCCAAGAAAAATCAGAACAAAAGAAAATTCAAATTTAGGTATCACAAGCGGCGACTGTCTCCTCCAGAAGATAACAAGGTCAGGAAGAAAAAACCAATGGAGAAGCGATTCCTCATCAACACCACTTCAGACCCTGAGTCTGATGGTGGAGGGGAAGCTGTCGGTGAGGAATCCAATGTGGTCAGTGTTGCCACGGCTGAGCCGGATGCTAATATTGGCAATGGGGAAGGCGAAACTAATGTTGCCATTGCTGAACCGGATCCGAGTGTAGACAATGCGGAAGAATGCAAAGCAAAGGAACCAATACTTGTATATGTCAAAGCAAAGGACGACGGTGTTGATTACGTTGTGCACCAGCTCTGGGACTTCACGGGGCATGTCCCCACTTTATTCTACATCATAGGCACAGAAAACTCCACTGTGAAAGTAAATTGGGAGGGCAATAAGCCACAAGATATTGTTGCTGAAGACAGCTTTTACAGTTTCGCTTTGATTCTCAATAATCTTATCGAATACAACGATACGGACATCAACAAGGTCGCATTCAGCTACAATTATCCACATAGAGACATCTCCTTGCGTGACGTCACTTGGCGGCTGGACGAGAGCGTCCTCACACCATACAAGGCTAAAGTGAGGGTCCGCGGGGACCTCTCTTGGGAACGACACCACATGAATGGCACTATTGATATCAAGCTCCTCCTAGTCCCGTTCACCGGCCGCTCGCCCTCGCTGCCGCGTCTCTACCACTCAGTCAACACGACGCAAGTGGACATAGCGCTGGCAGGCCTGGCGACCCGCTACCCCGCGCCGCGCCTGGCCGTGCGCTACGTGCTCGTCAGCCACGACGCCGCCGCTGCCGGGCTGCGGGGGGATGTAGACATAGCGCTGGCAGGCCTGGCGACCCGCTACCCCGCGCCGCGGCTGGCCGTGCGCTACGTGCTCGTCAGCCACGACGCCGCCGCTGCCGGGCTGCGGTACTCCGAGCGGAAGAGCATCGACGACGAGTACACGCCGGGCGTGTTTGAGGGGGTAGGGGGTAGGGGGGATGTAGACATAGCGCTGGCAGGCCTGGCGACCCGCTACCCCGCGCCGCGGCTGGCCGTGCGCTACGTGCTCGCCAGCCACGACGCTGCCGCTGCCGGGCTGCGGTACTCCGAGCGGAAGAGCATCGACGACGAGTACACGCCGGGCGTGTTTGAGGGGGTAGGGGGTAGGGGGGATGTAGACATAGCGCTGGCAGGCCTGGCGACCCGCTACCCCGCGCCGCGGCTGGCCGTGCGCTACGTGCTCGTCAGCCACGACGCTGCCGCTGCCGGGCTGCGGTACTCCGAGCGGAAGAGCATCGACGACGAGTACACGCCGGGCGTGTTTGAGACGATAAACGTGATGACGCCGCGGTCGCTGGGCGGGTTCGTGCAGTTCCGGCCCGTGGCGTACACGGAGCGGTTACGCGACGTCGAGAACTCCGTCGACGCCTTCGTGCATCCTTACAACCGGACCAAAATACCGCGAGATTGTCTCGTGGAGAAGTACTACACTAAATTCGACGAGGAAGACGTTTTCATCAACGAACTGGTGGCCAGCTTCGGCCAGACTGGCGACGGGTTCTATAAGAAGACCAACTATACCGTGTGGCAGGTGTTCCACTGCGAGCGAGTCGGCGAGTGCACCTCGGCTATTTACTCGCTCAAGACACGTACAGATGATATGACATTCCGTGTAAACAAAAGAGACGCATATGTCAGCGAGTACTTCATGACTGTTCACACCGCGGGCGAGTACTCGCTCGCATATTATGTATCTTTTTTGTTCACGCAGAATATCATATTTAAGTCTCTTGGGAGAGTTAATAGCCCATAG
Protein Sequence: MKTTEMAEPPAREIFKSIIEGRAILRISSEKVFYNPVQEFNRDLSIAVLSVFVEDYKKEKILEAKKQKNNDNFMDEDVKVDVTILEALSATGLRSIRYVKEVPGITKVIANDICEKAVKTIQENIFFNNVDHIVETSHDDACLLMYKHKHRAKRFAAVDLDPYGSPTTFLDAAVQSVADGGLLLVTATDMAVLAGNSPETCYCKYGAVSLKTKCCHEMALRILLQCIESHANRYSRYIVPLLSISVDFYIRVFVKVYSGAGQCKNTTSKLAMVYHCAGCDSSTLQPLGAFKPNPSPKRPDQLKGYLPPAPPVSMLCDNCGHKHQMGGPIWSAALHDQAFVQRVLSLAGDARFGTARRLSGVLAVISEELAAPLYYTLDRLCSTVHADMMPIIMFRSAILNAGYEVSFSHANKLSIKTNAPNKFVWDVMRAWVKRQPVKAAKMEANPLAKHILSQPLTHEVALSERADANPTSRRDRQTRFQFNPTPHWGPGCRSTINTAENKNLKSKKNQNKRKFKFRYHKRRLSPPEDNKVRKKKPMEKRFLINTTSDPESDGGGEAVGEESNVVSVATAEPDANIGNGEGETNVAIAEPDPSVDNAEECKAKEPILVYVKAKDDGVDYVVHQLWDFTGHVPTLFYIIGTENSTVKVNWEGNKPQDIVAEDSFYSFALILNNLIEYNDTDINKVAFSYNYPHRDISLRDVTWRLDESVLTPYKAKVRVRGDLSWERHHMNGTIDIKLLLVPFTGRSPSLPRLYHSVNTTQVDIALAGLATRYPAPRLAVRYVLVSHDAAAAGLRGDVDIALAGLATRYPAPRLAVRYVLVSHDAAAAGLRYSERKSIDDEYTPGVFEGVGGRGDVDIALAGLATRYPAPRLAVRYVLASHDAAAAGLRYSERKSIDDEYTPGVFEGVGGRGDVDIALAGLATRYPAPRLAVRYVLVSHDAAAAGLRYSERKSIDDEYTPGVFETINVMTPRSLGGFVQFRPVAYTERLRDVENSVDAFVHPYNRTKIPRDCLVEKYYTKFDEEDVFINELVASFGQTGDGFYKKTNYTVWQVFHCERVGECTSAIYSLKTRTDDMTFRVNKRDAYVSEYFMTVHTAGEYSLAYYVSFLFTQNIIFKSLGRVNSP

Similar Transcription Factors

Sequence clustering based on sequence similarity using MMseqs2

100% Identity: -
90% Identity: -
80% Identity: -