Basic Information

Insect: Ptychoptera albimana
Gene Symbol: -
Assembly: GCA_961205885.1
Location: OY540804.1:95241-101562[+]

Transcription Factor Domain

TF Family: HTH
Domain: HTH_psq domain
PFAM: PF05225
TF Group: Helix-turn-helix
Description: This DNA-binding motif is found in four copies in the pipsqueak protein of Drosophila melanogaster [1]. In pipsqueak this domain binds to GAGA sequence [1].
Hmmscan Out: # of c-Evalue i-Evalue score bias hmm coord from hmm coord to ali coord from ali coord to env coord from env coord to acc

1 4 1.6e-11 2.8e-08 33.0 0.0 1 39 587 626 587 630 0.90

2 4 1.3e-12 2.3e-09 36.5 0.1 1 39 641 679 641 682 0.94

3 4 2.3e-16 4.2e-13 48.5 0.0 1 45 696 741 696 741 0.97

4 4 4.8e-19 8.5e-16 57.1 0.0 1 43 748 791 748 793 0.96

#	of	c-Evalue	i-Evalue	score	bias	hmm coord from	hmm coord to	ali coord from	ali coord to	env coord from	env coord to	acc
1	4	1.6e-11	2.8e-08	33.0	0.0	1	39	587	626	587	630	0.90
2	4	1.3e-12	2.3e-09	36.5	0.1	1	39	641	679	641	682	0.94
3	4	2.3e-16	4.2e-13	48.5	0.0	1	45	696	741	696	741	0.97
4	4	4.8e-19	8.5e-16	57.1	0.0	1	43	748	791	748	793	0.96

Sequence Information

Coding Sequence: ATGCTATTGATAATGagTTTATTACGTACCGcggaacaattaaaaataaaaggtttGTGTGAAGTTAGTGATCGTAATGATATAACAACAGACCTACCACCTCCctcgaaaaaacaaaaatcatcagCACATCATCAAGGAAAATTGGGTGTTTTGTCtgtagataatttaataaatccatcaacaaataataataaaaatacggcAAAAGAAGCAGTACCTACTTATAATGCAATAGATACTCCTAGAGAACTAATAGAAAATTTGGATTGCGTTGGCGACTATAATCGTTATAGTAATAAACCGACACAACAACATTATCACCATTTGcatcataattataacaatattggtcaaaataataataagtcacAAACACCATTAATATCGCCATTAACATCACATTTATCCTCATCTCCAAGTATCCAACCATTATTTACTTCGGGATCATCATTTGCGTCTGCAGCGGCTGGACTTACTGCAATTGGAAGTGTGGCTGGCAgtacaaaaacattattttcatcagttaaattttctaaagaggaggatagagaaaaaaatgtacaaacatCTAATTCTTCTATAGTTGTACTAGAGCCTCGACCAGGTACACGTAAAACGCGTGACAGAACAATGACAAGTCTTGGTGTTGGAATGGGAAtgAATGGGAGTTTAATGGGCGTATCTTTGGGATTTCTTGATTTTGCTCCAGAACCACCAGCACCATCTGCTACACCAGTGACTGAAAATACAGATATTAATTGTACTCCTAGTAACGATACTCGAGATTTATCAAATCCATCAGAGACATTAGATATAGATAATCACATGTCACAACATTCCATGCAGCAAATTGAGcatcatcagcatcagcaACAGATGCAAATACGACATCAAGAgattcaacagcaacaacaattacaacagcagcaacaacaaccccaccttcaacaacagcaacagcaaacgcaacaacaacaacagcagcaccaACAgctacaacaacaaccactacaacaacaacaaccacaacaaccacaacaacaacaaccacaacaacaaaaacaatcacAAAGGCAAACATCAATATCAAGAACAGGGAAAGGTAGAGGAAATAAAAGTCATTCTTCAACAAGTAGTCGCGGTAAGAAAGCAGGTTGTTCTGAAAGAAGGTCACCATCTTCATCGTCTTCCTCTACATCATCGTCCGGTGGTCGAAGAAGGCATCAACAAGAACAACACCAGCATAATCATTTGCTACATGATCATAGCGAtcattcaaatttaaaaacttcaaataataataataataataataataataataataataataataataataataataataataataataataataataataataataataataataataataataataataataacaataataataataataataataataataataataataataataataataataataataataataataatagtaatcatTCTCATATTGAGTCAATAACGAACGCAATCGATATGGACCAATCAAGCGGAATGGAGCATGATCAAATTCATGGTATGATTGTTACACCGGAAATAGTTTCTATGATGACACCTGGTCATATGgaTTTGTATCAATCGGATACTAGTGAAGATTCGCGAATGATATCAAACAGTTCTCCGAGTAATAGCAATAATCCGAATAGAACACCCACCTACATAAATATGGATAATCCTAATGAGCCCCGGACACCAAGTGGGCCAAAAACATGGACACAAGATGATATGGAATCAGCCTTAGATGCCTTAAGAACTCATCATATGAGTTTAACTAAAGCTTCAGTCACATATGGCATACCGTCGACTACATTATGGCAGCGTGCCCATCGCTTAGGAATTGATACTCCAAAGAAAGAGGGAACACCAAAATCATGGAGTGaggattcattaaataatgcaTTGGAAGCATTACGTACAGGAACTATATCAGCTAATAAAGCTTCAAAAGCATTCGGTATACCATCTTCgacattatataaaattgcacGGCGGGAGGGAATTCGTTTGGCTGCCCCATTTAATGCTGCACCAACTGCATGGACTCAAGAAGATTTGGAACGTGCATTAGAAGCGATACGTGCAGGGCATGCATCTGTTCAAAAAGCTAGTTCAGAATTTGGAATACCGACTGGAACATTATATGGTCGATGTAAACGAGAGGGTATAGAACTGTCTAGAACAAACCCGACTCCGTGGTCGGAAGACGCAATGATGGAAGCATTGGAGTCTGTTAGGGTTGGGCAAATGTCTATAAATCAAGCTGCCATTCACTTTAACCTTCCATATAGTTCATTGTATGGGCGATTTAAGCGTGGAAAATATGAATCTGGTAGTAGTGGAAGCAGTGCAAATCATGGTAGTGGAAGTGCTGGTAGTGGCGGTGTAATAAATACCCCAAATCATGGACACAGCAGTAGCTTGCTGGGTTTGTCCGGTATTGCAAATGTCGGTGTTATGGGAATTGGCGGTAGCGTTGGTAGCATAGGAGTTAGTGGTCTCGGTAGTGGGATACATATTGGCGGTGATACATCCCATTCGGATCATAGTCCAGAACATACGCAACAGTATTCATCTGTCTTGTCACCAACATCAAATAACGTAAAAATTGTACATCCATTGGCAGCAGTTCCACAATCAGCATCATCAGCTTCACTTAACCAGGACCTGAATCAACAAACAGTGACTTCAccacatcatcatcaccaattTCATTTGCATCATCTGTACCAAGTGCTCTCTCCAAATACAGAGCGTAGTTGA
Protein Sequence: MLLIMSLLRTAEQLKIKGLCEVSDRNDITTDLPPPSKKQKSSAHHQGKLGVLSVDNLINPSTNNNKNTAKEAVPTYNAIDTPRELIENLDCVGDYNRYSNKPTQQHYHHLHHNYNNIGQNNNKSQTPLISPLTSHLSSSPSIQPLFTSGSSFASAAAGLTAIGSVAGSTKTLFSSVKFSKEEDREKNVQTSNSSIVVLEPRPGTRKTRDRTMTSLGVGMGMNGSLMGVSLGFLDFAPEPPAPSATPVTENTDINCTPSNDTRDLSNPSETLDIDNHMSQHSMQQIEHHQHQQQMQIRHQEIQQQQQLQQQQQQPHLQQQQQQTQQQQQQHQQLQQQPLQQQQPQQPQQQQPQQQKQSQRQTSISRTGKGRGNKSHSSTSSRGKKAGCSERRSPSSSSSSTSSSGGRRRHQQEQHQHNHLLHDHSDHSNLKTSNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNSNHSHIESITNAIDMDQSSGMEHDQIHGMIVTPEIVSMMTPGHMDLYQSDTSEDSRMISNSSPSNSNNPNRTPTYINMDNPNEPRTPSGPKTWTQDDMESALDALRTHHMSLTKASVTYGIPSTTLWQRAHRLGIDTPKKEGTPKSWSEDSLNNALEALRTGTISANKASKAFGIPSSTLYKIARREGIRLAAPFNAAPTAWTQEDLERALEAIRAGHASVQKASSEFGIPTGTLYGRCKREGIELSRTNPTPWSEDAMMEALESVRVGQMSINQAAIHFNLPYSSLYGRFKRGKYESGSSGSSANHGSGSAGSGGVINTPNHGHSSSLLGLSGIANVGVMGIGGSVGSIGVSGLGSGIHIGGDTSHSDHSPEHTQQYSSVLSPTSNNVKIVHPLAAVPQSASSASLNQDLNQQTVTSPHHHHQFHLHHLYQVLSPNTERS

Similar Transcription Factors

Sequence clustering based on sequence similarity using MMseqs2

100% Identity: -
90% Identity: -
80% Identity: -