Basic Information

Insect: Abrostola tripartita
Gene Symbol: -
Assembly: GCA_905340225.1
Location: HG996504.1:2397449-2399026[-]

Transcription Factor Domain

TF Family: HTH
Domain: HTH_psq domain
PFAM: PF05225
TF Group: Helix-turn-helix
Description: This DNA-binding motif is found in four copies in the pipsqueak protein of Drosophila melanogaster [1]. In pipsqueak this domain binds to GAGA sequence [1].
Hmmscan Out: # of c-Evalue i-Evalue score bias hmm coord from hmm coord to ali coord from ali coord to env coord from env coord to acc

1 1 7.4e-11 3.4e-08 33.4 0.0 2 37 18 52 17 59 0.89

#	of	c-Evalue	i-Evalue	score	bias	hmm coord from	hmm coord to	ali coord from	ali coord to	env coord from	env coord to	acc
1	1	7.4e-11	3.4e-08	33.4	0.0	2	37	18	52	17	59	0.89

Sequence Information

Coding Sequence: ATGCCTTTAATATATAAGAGGAAAAGTGGAGTATGTAGAGGAGAATGGACAGAAAGAGCATTAATTGATGCTTTTCAAGCTGTTTCTAATGGAATGGGTATCAATGAAGCAGCAAAAACATTTGGGATACCTAAAACTACATTTAAACGAAGACTTGCAAAAAATTCCTTAACTAAAAGCGATGTTCTCGGTCCCAGTAGTATACTGCTGCCTGAAAATGAGAAGAAGATCGTCGTACACATTAAAAAATTACAGAAAGGTGGGTTTACGCCATCAAGAGAAACAGTGCGTAAAATGGCATATAATTTAGCGGAAAGACTTCATATTAAACATAACTTAAATCACGAAAAGAAAATGGCGGGAAATGGGTGGTTACAAAGCTTTCTTAGACGAAACATTGAACTTTCAATCCGGCAGTCAGAAGGTGTCTCTGTGGCCAGGGCTAAGGGGATGAATAAAGAATATGTTGATAAGTATTTCAACCTTTTAGAAGAAGTTTTGAAAGAAAATCAACTTTTTGACAAACCTGGTTCTATTTTTAATATGGACGAGACAGGCTTGCAGCTAAATAATAAGCCGGGGAAAGTAGTTGCCGTGAAGGGATCGAAAAATGTTCCTAACATAACTGCTGGGGAAAAAGGTGAAACCATTTCGGTCATCGCTTGCTGCAGTGGAGAAGGTGTTTTTCTTTCACCCTATTGCATATTCAAGGGCAAAAATAAAAAACCTGAGTTTGAGGATGGCATGCCACCCGGCTCTGTGGTAACAATGTCACAAAAATCAGCATATGTGAATTCAGAAATATTTTTTGATTGGCTGAAGCATCATTTTTTGCCAAGGAAACCACAAGGTAAGTGCGTGTTGATCCTTGATGGACATTCTTCACACTGCAGCAATGTGGAAATGTTGGAGTTTGCTGAAGAAAACGAAATCATTTTGATTTGCTTACCCAGTCACACAACCCATTTTCTTCAGCCGCTTGATAGAACGTTTTTCAAGTCCCTGAAATGCTTTTATTATGACGAATGCAATAAATTCATTACTGCTAACCCATCAAGAAAACTATCACGCTTGCAGTTTGGAAAAAATCTGGCTTCAGCTTGGAATAAATCAGCTTCAGTGAGCAATGCAATATCAGGTTTTTCAGCAACTGGGATCATACCGTTTAATGCAAACGCCATACCAGACTATGCTTTCTTAACTCCAAGTAACCAAAACCATGACAATAACCTACAAACTGCTATAATTCAACATGATCAACCTACTAAAGAATCAGTCCTTTCACAGCCAGCAACCGTTCAAAAACCATCAACTAGTGAAGCTGTTTCTCCAAAGGCAACGCCTGGAAAGATTTTGGATGTGGTTTCTCCAATACCTATCATAGAAAGAACTGCAAACGTCCGTCATAGGCCAAGAAAAATCGCAGAAATTTTGAACTCTACTGAAAATATTCAGAATTTAAAAGAAAATCAATCAAGGAAAATGAAAAAAGAAAATTCTATTGAAACTAAACAGATTTTAAAAGTAACACGGAAAAAGAAGGGAACTAAAAGACAAAATTCTGCTGTTAAGGCGTAA
Protein Sequence: MPLIYKRKSGVCRGEWTERALIDAFQAVSNGMGINEAAKTFGIPKTTFKRRLAKNSLTKSDVLGPSSILLPENEKKIVVHIKKLQKGGFTPSRETVRKMAYNLAERLHIKHNLNHEKKMAGNGWLQSFLRRNIELSIRQSEGVSVARAKGMNKEYVDKYFNLLEEVLKENQLFDKPGSIFNMDETGLQLNNKPGKVVAVKGSKNVPNITAGEKGETISVIACCSGEGVFLSPYCIFKGKNKKPEFEDGMPPGSVVTMSQKSAYVNSEIFFDWLKHHFLPRKPQGKCVLILDGHSSHCSNVEMLEFAEENEIILICLPSHTTHFLQPLDRTFFKSLKCFYYDECNKFITANPSRKLSRLQFGKNLASAWNKSASVSNAISGFSATGIIPFNANAIPDYAFLTPSNQNHDNNLQTAIIQHDQPTKESVLSQPATVQKPSTSEAVSPKATPGKILDVVSPIPIIERTANVRHRPRKIAEILNSTENIQNLKENQSRKMKKENSIETKQILKVTRKKKGTKRQNSAVKA

Similar Transcription Factors

Sequence clustering based on sequence similarity using MMseqs2

100% Identity: iTF_01029174;
90% Identity: iTF_00851706; iTF_01029172; iTF_00836469; iTF_01525879; iTF_00837420; iTF_00837421; iTF_00836471; iTF_00836472; iTF_00837424; iTF_01029174; iTF_00448998; iTF_00121355; iTF_00973707; iTF_00121356; iTF_00973708; iTF_00906065; iTF_00906066; iTF_00147350; iTF_00383577; iTF_00383578; iTF_00771834; iTF_00771835; iTF_00147327; iTF_00147354; iTF_00147324; iTF_00172670;
80% Identity: -