Basic Information

Insect: Nymphula nitidulata
Gene Symbol: -
Assembly: GCA_947347705.1
Location: OX374630.1:1156815-1165430[-]

Transcription Factor Domain

TF Family: HTH
Domain: HTH_psq domain
PFAM: PF05225
TF Group: Helix-turn-helix
Description: This DNA-binding motif is found in four copies in the pipsqueak protein of Drosophila melanogaster [1]. In pipsqueak this domain binds to GAGA sequence [1].
Hmmscan Out: # of c-Evalue i-Evalue score bias hmm coord from hmm coord to ali coord from ali coord to env coord from env coord to acc

1 4 9.1e-12 1.1e-08 35.5 0.0 4 39 132 168 129 172 0.89

2 4 3.2e-11 4e-08 33.7 0.3 2 39 184 221 183 224 0.92

3 4 7.1e-14 9e-11 42.2 0.1 2 45 239 282 238 282 0.96

4 4 2.3e-18 2.9e-15 56.6 0.0 1 42 289 331 289 333 0.95

#	of	c-Evalue	i-Evalue	score	bias	hmm coord from	hmm coord to	ali coord from	ali coord to	env coord from	env coord to	acc
1	4	9.1e-12	1.1e-08	35.5	0.0	4	39	132	168	129	172	0.89
2	4	3.2e-11	4e-08	33.7	0.3	2	39	184	221	183	224	0.92
3	4	7.1e-14	9e-11	42.2	0.1	2	45	239	282	238	282	0.96
4	4	2.3e-18	2.9e-15	56.6	0.0	1	42	289	331	289	333	0.95

Sequence Information

Coding Sequence: ATGAAATCCCGGGATTCCAAGGAAAATTTGGTAGACCAGTCGCCCGAAACTGGGTTGGAGGAGTTGTCGTTACCGGCGCCGGCCGGACCGGCGGCCACACCCGTCTGTGTGAAGCAGGAAACGGCGGAGGCACCGCCGGCCCTCCTGCTGGAGAACCTTGAACCTGCTGCGCCTAACATTTCCACGGGCACAACGTTGCTGGATAGGCATCTAGCGATGCTCAGTTCCACCGAAGTGCCTGACTCGTCAGACTTTATGCCACTACTGGCTGTGAAAGACGAACCACTCTCAGAAGGAGAACAACTACAGATGAGTGGTGAAGACACGAGTGACTCATGCAGCCAGCCGGAGCCATTGCATAGCAGGGGCAGTCCCAAGAGCTGGACGCAGCAGGATATGGATAACGCCCTTGAAGCACTGAGGAAGCATAATATGAGTCTCACCAAGGCATCATCAACTTACGGTATACCGTCCACGACCTTATGGCAGCGTGCTCACAGACTCGGGATCGACACGCCGAAGAAGGAAGGCTCGTCCAAGTCTTGGAGCGAAGCGGACCTGAGAGGAGCTCTGCATGCTCTGAGGGCTGGTGCTATATCGGCAAATAAAGCCAGTAAGGCTTACGGTATCCCTAGCAGCACGCTGTACAAGATCGCGCGGCGCGAGGGCATCCGCCTGGCGGCGCCGTTCAACGCGGCGCCGACGGCCTGGCGCCGCGCGGACCTGGCGCGCGCGCTCGCCGCCATACGAGCCGGCGCCAGCGTGCAGCGCGCCGCCGCCGACCACGGGATACCCACCGGCACTCTATACGGGCGTTGTAAGAGAGAAGGCATAGAACTATCCCGATCTAATCCCACTCCGTGGTCAGAAGATGCTATGGGTGAAGCGCTGGAAGCTGTTAGAGTTGGTCAAATGTCAATAAATCAAGCTGCCATACATTATAATCTACCGTATTCTTCGCTGTACGGGCGATTCAAGAGATGCAAATATCAAATTCAGGGTCTCCAACAAGTACAGCCAGACATACCAAAGAACTTTGAATCGGAACACCAGAACCAACCTCAGAACATGCAGTACTACCACCAGATGCCTTTAGAAGCCCACCAATCCCACGATCTCAACTCGCACACTTACATGAACCACAGTCAGCTGAGTATGAGCGAACAGGATTTGGGTCTGATTGAGGAGCATTACGGAGGTCCGGCGATGTATTATAGCCATAACTGCAATAGCATCGTGACCAGTTGA
Protein Sequence: MKSRDSKENLVDQSPETGLEELSLPAPAGPAATPVCVKQETAEAPPALLLENLEPAAPNISTGTTLLDRHLAMLSSTEVPDSSDFMPLLAVKDEPLSEGEQLQMSGEDTSDSCSQPEPLHSRGSPKSWTQQDMDNALEALRKHNMSLTKASSTYGIPSTTLWQRAHRLGIDTPKKEGSSKSWSEADLRGALHALRAGAISANKASKAYGIPSSTLYKIARREGIRLAAPFNAAPTAWRRADLARALAAIRAGASVQRAAADHGIPTGTLYGRCKREGIELSRSNPTPWSEDAMGEALEAVRVGQMSINQAAIHYNLPYSSLYGRFKRCKYQIQGLQQVQPDIPKNFESEHQNQPQNMQYYHQMPLEAHQSHDLNSHTYMNHSQLSMSEQDLGLIEEHYGGPAMYYSHNCNSIVTS

Similar Transcription Factors

Sequence clustering based on sequence similarity using MMseqs2

100% Identity: iTF_01020145;
90% Identity: iTF_00006218;
80% Identity: -