Basic Information

Insect: Herminia tarsipennalis
Gene Symbol: gpkow_1
Assembly: GCA_945859575.2
Location: OX243845.1:15359930-15392850[-]

Transcription Factor Domain

TF Family: HTH
Domain: HTH_psq domain
PFAM: PF05225
TF Group: Helix-turn-helix
Description: This DNA-binding motif is found in four copies in the pipsqueak protein of Drosophila melanogaster [1]. In pipsqueak this domain binds to GAGA sequence [1].
Hmmscan Out: # of c-Evalue i-Evalue score bias hmm coord from hmm coord to ali coord from ali coord to env coord from env coord to acc

1 3 0.068 8.4 7.2 0.0 16 38 578 600 572 604 0.89

2 3 0.53 66 4.4 0.0 16 38 713 735 707 739 0.87

3 3 0.19 24 5.8 0.0 15 37 989 1011 985 1015 0.91

#	of	c-Evalue	i-Evalue	score	hmm coord from	hmm coord to	ali coord from	ali coord to	env coord from	env coord to	acc
1	3	0.068	8.4	7.2	16	38	578	600	572	604	0.89
2	3	0.53	66	4.4	16	38	713	735	707	739	0.87
3	3	0.19	24	5.8	15	37	989	1011	985	1015	0.91

Sequence Information

Coding Sequence: ATGGAAGGCAATAAGATCTCGTTTGGTTTTAAGAAAACTAAGAAAGCCGATAAACCTGTAGCTGTAAACAATGATGAAAGAAAAGAATACATAGAATGTGTAGAAGAACAATCTATCAAAGTTGTCGGTGGAGAAACAGAAGAAACTAATGAACCACTGGTCATACCTATGAAACCTAATTCACTTATAACTTCTGAAAGATTGATGGAAATTGCGCTGAAGGTTGAAAGTGCACTAGAAGAGCCAGAAATTAAAACTGAATCAGTAACTATTAAAATGGAAGACCCGTTAGGAGAAGAGAATGAAACATTGGATCAAATGGCAGAACGTGAACTGATGCAGGAGGCTCAAAAAGAAATTGTAACAGTCACACCTACAACAGAGATACCAACATCTACTAAGGGTGTTGCCGGAGGAGAAAAAGAGAAAGCAAAAGCCCTCATGAAGGACACCGTTGTCCTTCTATTAGATTTAATAAGTCAACAAAGAGTCATCACTACAAAAGGAACTGACGCTACAACTAACAGACTGAAGGAAGATGCTTGGAAAACGGTAGCCGAGGAATTCTGCACATTAACCGGTGAAATCCGGCGCCCTGATCAATTGCGCCTCAAATGGGAGAACTTAAAAAAGGCTGCCAGAAAGCGTTGTGCTTTAATTAAACAAAATAATGTTAAGGCAAAAGGACGAAAGTCATTTATTCCACCAAACGAGGTACTTGACAAAGTAGCAGCATTGCTAGGTGCTACTAGTGACTATGCAGCGGAGTTTAGTGAAGAAAGTAGAAATGAGGTTGATCTAGACCAAACAAGCTCTGAAGCTATGGTTGATGCCATAGAGCACCAGCCAATGCCAGGAAATCCTCCAATATCTCAATACCTTGGTGTGGAGTTGGATGTATCTAGTGATGTGGCAACTTTTACATCATCACCACCCAAATTTGTATTCAATGCGCCAAGAAATTCATATAATAAACGAAGGAAACTGTCGGAAGACCTCCTAAAGGCTAAAACAGATAAGGAGCTTGCCATAGCTGCTTACTTCCTAGCCCGAACAGAAAAAACTAAACTAGAAAATAAAAAATTGGAATTAGAAATAAAATCCACCTTAGATGATTATGAAGCTATTCCGGTGAAAGATTTTGGTGTTGCAATGTTACGAGGCATGGGATGGAAGCCGGGCCAAGAAGGATCTAAATACAAGCAACCAGAACTTCGTCCTAAAGGTCTTGGATTGGGGGCAGATAAAGTAGTGAAAGCGAAACAACAAGCATCGAAAGACTCCAAACCTGAAGAATTGGTCATTTTGAAGAACTCCTACGTGAAAATTGTTAGTGGGAAATATAGCGACTACTATGGCAAGGTAGTCAGCTTAGATGAAGATAATGGGCGAGTGGTCGTGGACATCCCCGTGAAGAAAGAAATGGTCAGTCTCAGCGAATTCATGATGAATGCTGTAACCAAGTCTGAATACGACAGAGAATCTAAAGTTATAAGGCCTCCTAAAGTGCGCGTGAGTGTTGATAAAAAACAAGAAATAATTAAAATGCACAAGAAAAAAATCCCCATAAGTGATATTGCAAGAGAACTGAAAATAGCGCGAAATACTGTGTACTTATGGATAAAACGTTGGGAAAAGGAAGGTGTTGTTAACGCCCATGGATCAACGGGTCGTCCATGCAAACTATCCGCTAATAAAAAAGCTCTTTTAATGAATGAAGTTAAAGAAACGGAGCTTAGTGTCTCAGACTTAGCGAGTAACCATGGTGTATCTACTGCAACCATTCGTCGATGTTTAAAAGACACTGGAGTCCGATGCAAAAGAAAAAAAAGGCCAATAACTGAACCTATAATTGAAATAGAAGTGCCAATAAAACAGGAATCAGATGGTATAAATATAGATTCTAAGAAGTTACGCTTAACTGAACATAAGAAGGAAAGAATTATTGCTTTGTATAAGCAAAAACATTCTACATCAGCTATTGCGAGGCACTTGAATGTCACGCGACAAACTGTGAACCTATGGATAAAACGTTGGAAAAAGGAAGGTGTTGTTAACGCTCATGTATCATCCGGCCGTCCATGCAAACTATCCGCTAATAAAAAAGCTCTTTTAATGAATGAAGTTAAAGAAACAGAGCTTAGTGTCTCAGACATAGCGAGTAACCATGGTGTATCTACTGCAACCATTCGTCGATGTTTAAAAGACACTGGTGTCCGATGCAAAAGAAAAAAAAGGCCAATAACTGAACCTATAATTGAAATGGAAGTGCCAATAAAACAGGAATCAGATGGTATAAATATAGATTCTAAGAAGTTACGCTTAACTGAACGTAAGAAGGAAAGAATTATTGCTTTGTATAAGCAAAAACATTCTATAACGGCTATTGCGAGGCACTTGAATGTGACGCGAAACACAGTCATGCTATGGGTGAAGCGTTGGAAAAATGAAGGCGTTATTAATCAACATTCGTCAGGTGGTCGTCCATCAAAACTATCTTCAAATGCTGGAGCTCTTTTAATAAAACAAGCCACCCAAGCAGACGATGTTAATTTATCAGAACTTGCAGCCACCCATGGTGTCTCAGTAAGCACAGTTCGAAGGCACTTAATACAAAACGGAATACCATACAAAAAAAAGGAAAGAAAAATCGGTGTTAGAACGAGAAAGGAAGTTCCTAAGTCAGCTGTTGATGATGATATAGGATATGAGGGCATTCATGAACCAAAAAAGGCTGCATACCATATTAATGTTGATAAGAGGCAACAGATTATACTTTTACATGAACAAAAGCATTCTGTGAGTGCTATTGCAAGATATTTAAATATATCGAGAAACACCGTCAATTTATGGATAAGACGATGGAAAGGCGAAGGCTCTATCAACCCACATTTACCAAGCGGTCGTCCACGCAAACTATCTTTAAATCAAGAAGAAATTTTGATAGAACACGCGAAGGAAGCTGAAAAACTTGGCACGTCAAATCTTGCGTCTTGTTTTGGCGTCTCAACAGCTACCATTCGACGACGTTTATGTGCTAATGGACTCAAGTCAAAGTCTAATAAAGAAGAAGAACAAATATAG
Protein Sequence: MEGNKISFGFKKTKKADKPVAVNNDERKEYIECVEEQSIKVVGGETEETNEPLVIPMKPNSLITSERLMEIALKVESALEEPEIKTESVTIKMEDPLGEENETLDQMAERELMQEAQKEIVTVTPTTEIPTSTKGVAGGEKEKAKALMKDTVVLLLDLISQQRVITTKGTDATTNRLKEDAWKTVAEEFCTLTGEIRRPDQLRLKWENLKKAARKRCALIKQNNVKAKGRKSFIPPNEVLDKVAALLGATSDYAAEFSEESRNEVDLDQTSSEAMVDAIEHQPMPGNPPISQYLGVELDVSSDVATFTSSPPKFVFNAPRNSYNKRRKLSEDLLKAKTDKELAIAAYFLARTEKTKLENKKLELEIKSTLDDYEAIPVKDFGVAMLRGMGWKPGQEGSKYKQPELRPKGLGLGADKVVKAKQQASKDSKPEELVILKNSYVKIVSGKYSDYYGKVVSLDEDNGRVVVDIPVKKEMVSLSEFMMNAVTKSEYDRESKVIRPPKVRVSVDKKQEIIKMHKKKIPISDIARELKIARNTVYLWIKRWEKEGVVNAHGSTGRPCKLSANKKALLMNEVKETELSVSDLASNHGVSTATIRRCLKDTGVRCKRKKRPITEPIIEIEVPIKQESDGINIDSKKLRLTEHKKERIIALYKQKHSTSAIARHLNVTRQTVNLWIKRWKKEGVVNAHVSSGRPCKLSANKKALLMNEVKETELSVSDIASNHGVSTATIRRCLKDTGVRCKRKKRPITEPIIEMEVPIKQESDGINIDSKKLRLTERKKERIIALYKQKHSITAIARHLNVTRNTVMLWVKRWKNEGVINQHSSGGRPSKLSSNAGALLIKQATQADDVNLSELAATHGVSVSTVRRHLIQNGIPYKKKERKIGVRTRKEVPKSAVDDDIGYEGIHEPKKAAYHINVDKRQQIILLHEQKHSVSAIARYLNISRNTVNLWIRRWKGEGSINPHLPSGRPRKLSLNQEEILIEHAKEAEKLGTSNLASCFGVSTATIRRRLCANGLKSKSNKEEEQI

Similar Transcription Factors

Sequence clustering based on sequence similarity using MMseqs2

100% Identity: iTF_00794576;
90% Identity: iTF_00794576;
80% Identity: iTF_00794576;