Basic Information

Insect: Idaea dimidiata
Gene Symbol: -
Assembly: GCA_949358125.1
Location: OX442326.1:2344040-2353422[-]

Transcription Factor Domain

TF Family: HTH
Domain: HTH_psq domain
PFAM: PF05225
TF Group: Helix-turn-helix
Description: This DNA-binding motif is found in four copies in the pipsqueak protein of Drosophila melanogaster [1]. In pipsqueak this domain binds to GAGA sequence [1].
Hmmscan Out: # of c-Evalue i-Evalue score bias hmm coord from hmm coord to ali coord from ali coord to env coord from env coord to acc

1 8 2.3e-15 1e-12 48.2 0.1 1 43 32 74 32 75 0.93

2 8 2.4e-14 1.1e-11 45.0 0.1 1 44 113 156 113 156 0.95

3 8 1.9e-13 8.8e-11 42.1 0.1 1 39 195 233 195 238 0.93

4 8 1.9e-15 8.6e-13 48.5 0.2 1 43 290 332 290 333 0.93

5 8 2.8e-13 1.3e-10 41.6 0.1 1 39 372 411 372 415 0.89

6 8 2.9e-16 1.3e-13 51.1 0.2 1 43 507 549 507 550 0.93

7 8 2.4e-12 1.1e-09 38.6 0.1 1 43 590 633 590 634 0.90

8 8 2.4e-13 1.1e-10 41.8 0.1 1 43 727 769 727 770 0.92

#	of	c-Evalue	i-Evalue	score	bias	hmm coord from	hmm coord to	ali coord from	ali coord to	env coord from	env coord to	acc
1	8	2.3e-15	1e-12	48.2	0.1	1	43	32	74	32	75	0.93
2	8	2.4e-14	1.1e-11	45.0	0.1	1	44	113	156	113	156	0.95
3	8	1.9e-13	8.8e-11	42.1	0.1	1	39	195	233	195	238	0.93
4	8	1.9e-15	8.6e-13	48.5	0.2	1	43	290	332	290	333	0.93
5	8	2.8e-13	1.3e-10	41.6	0.1	1	39	372	411	372	415	0.89
6	8	2.9e-16	1.3e-13	51.1	0.2	1	43	507	549	507	550	0.93
7	8	2.4e-12	1.1e-09	38.6	0.1	1	43	590	633	590	634	0.90
8	8	2.4e-13	1.1e-10	41.8	0.1	1	43	727	769	727	770	0.92

Sequence Information

Coding Sequence: ATGAACAATGGGCTGTTTAACAGTAACAATGCATTAGGACCTGTTTTATTCTACACAGGATTGTTCGGACTTCGTCGGCGACGCGCCCTCTGGTCAGAAGAAACTCTCCAAGCCGCTCTTACAGCAATACAAACCAAAAAACTAACCCAATCAAAAGCAGCTACATTGTATGGTATACCGAGAACAACTCTTAGAAATCATTTAAGGTCTGGTAGTACATTGAAAGTATTGGGAAAGCGTCTGCTCAATGAAAAACAAGAAAAGGATTTTGTCAAGGAACTGATTAGTTTCAAAGACGCCGGACTGTATAAAATTCGTCGGGCACGAGCCCAGTGGACGGAAGAATCTCTCCAAGCTGCTCTTACAGCAATACAAACCAAAAAACTAACACAAAGAAATGCAGCTAAATATTATGGTATACCGAAAACTACTCTTAGCGATCGTCTAAGGTCTGGTATTACATTAAAAGTTTTGGGCAGGAAGCGACTTCTTAATGAGAAAGAAGAAAACGAGTTTGTCAAGGAATTGATTGGATTTAAAGACAACGGATTGTATACAATTCGTCGGACACGAGCCCAGTGGTCGGAGGAAAGTCTTTCCGCTGCTCTTACAGCAGTACAAACCAAACAACTATCACGGAATAAAGCTGCTTCGTATTATGGAATACCGATTTCAACTCTTAGAGATCATATAAGGTCGGGTAGTAATTCGAAAGCTTTGGGCAGAAAGAATCTTCTTAACAAGGAAGAAGAAAACGAATTTGTCCAAGAATTAGTTAGATTGAAAGACACCGGCCAAGCACTTACTACCATTTTTGTTAAGAGACAAGGATTGTTCGGACTTCGTCGGCGACGACGAGCCCTCTGGTCAGAAGAAACTCTCCAAGCTGCTCTTAcagcaatacaaacaaaaaaactatcaCAAAGAAATGCAGCTACATATTACGGTATACCGAGATCAACTCTTAGGAATCATGTAAGGTCTGGTAGTACATTAAAAGTATTGGGAAAGCAAAATCTGCTTAAAGAGAAAGAAGAAAACGAATTTGTCAAGGAATTGATTAGATTTAAAGACAACGAGGCGGAAAAACCTCGTCGGCTATACGCCCCCTGGTCGGAAGAAAATCTCCAAGCTGCTCTAAAAGCTGTACAAACCAAACAACTTACACAAAAAAGTGCAGCCATTCGTTATGGCATACCGACATCAACCCTAAACGATCGTCTAAAGTCTGGTAGTACATTGAAAATATTGGGCAGGAGGCGTCTTCTTaatgaaaaagaagaaaacgAATTTGTCAAGGATTTGATTGGATTTAAAGACAACGGGAAAACACTTACTACTGAATTCGTTCAGAGACAAGCGTTTCTTTTTTGCAAACGAAACGACATTAAACTCAATTTGCAATTCAAGAAGACTGGTTTAATTGGAAGAGATTGGCTGAAAGCTTTTTTGAAAAGACACCCAGAAATAAAAATACGGTATGACGCAGACAAACTGCGTCGCCGATACGCTTCGTGGTCAGAAGAAACCCTCCAAGCTGCCCTTACAGCAATACAAACCAAAAAACTAACACAAAGAAAGGCAGCCAAATATTATGGTATACCGAGGTCAACTCTTCACAATCGTCTAAGGTCTGGTAGTACATTGAAAGTTTTGGGCAGGAAGCGTCTGCTTAATGAGAAAGAAGAAAACGAATTTGTCAAGGAATTGATTGGATTTAAAGACAACGtctACAAACTTCGTCGAGGACCCGCGCGCCTTGCCTGGTCAGAAGAAACTCTCCAAGCGGCTCTTACAGccgtacaaacaaaaaaacgatCGATAAGAAATGCTGCCAAACATTATGGTATACCAATATCCACTCTGAGAGATTATGTAACATCTGGAGGTAGTACTTTGAAAGTTTTGGGTAGGAAGCGTCTTCTTAATGAGAAAGAAGAAAAGGAATTTGTCAAGGAACTATTTGAATTCAAAGAAAGTGGCCAAACACTTACTACTAAATTCATTCAGAGACAAGCTTTCCTTTTTTGCAatgaaaagaacaaaaaaattagtttccAATTTTACAAGAAGACTGGTCTAATTGGAAAGGATTGGCTCAGATCTTTTCTGAGAAGACACCcagaaattgaaattaaatatgGGGCGGACAAATCTCGTCGGATATACGCCCCCTGGTCAGAAGAAAATCTCCAAGCCGCTCTAAAAGCAGTACAAACCAAAGAACTTACACAAAAAAGTGCAGCCATAAAATATGGTATACCGAGAACAACTCTTAGCGATCGTCTAAGGTCTGGTAGTACATTGAAAGTTTTGGGCAGAAAGCGACTTCTTAATGAGAAACAAGAAAACGAATTTGTCAAGGAATTGATTGTATGCAAAGAGAGCGGCCAAACACTTACTACTAAATTTGTTCAGAGACAAGCGTTTGTTTTTTGCaaacgaaacaaaataaaactcaatttgcAATTTTACAAGAAAACTGGTCTGATTGGAAAGGATTGGCTACGAACTTTTCTGAGAAGACACCCAGAAATTGAAATAAAGTATGGTAAAAAATACTGCAATGAAGATGATTga
Protein Sequence: MNNGLFNSNNALGPVLFYTGLFGLRRRRALWSEETLQAALTAIQTKKLTQSKAATLYGIPRTTLRNHLRSGSTLKVLGKRLLNEKQEKDFVKELISFKDAGLYKIRRARAQWTEESLQAALTAIQTKKLTQRNAAKYYGIPKTTLSDRLRSGITLKVLGRKRLLNEKEENEFVKELIGFKDNGLYTIRRTRAQWSEESLSAALTAVQTKQLSRNKAASYYGIPISTLRDHIRSGSNSKALGRKNLLNKEEENEFVQELVRLKDTGQALTTIFVKRQGLFGLRRRRRALWSEETLQAALTAIQTKKLSQRNAATYYGIPRSTLRNHVRSGSTLKVLGKQNLLKEKEENEFVKELIRFKDNEAEKPRRLYAPWSEENLQAALKAVQTKQLTQKSAAIRYGIPTSTLNDRLKSGSTLKILGRRRLLNEKEENEFVKDLIGFKDNGKTLTTEFVQRQAFLFCKRNDIKLNLQFKKTGLIGRDWLKAFLKRHPEIKIRYDADKLRRRYASWSEETLQAALTAIQTKKLTQRKAAKYYGIPRSTLHNRLRSGSTLKVLGRKRLLNEKEENEFVKELIGFKDNVYKLRRGPARLAWSEETLQAALTAVQTKKRSIRNAAKHYGIPISTLRDYVTSGGSTLKVLGRKRLLNEKEEKEFVKELFEFKESGQTLTTKFIQRQAFLFCNEKNKKISFQFYKKTGLIGKDWLRSFLRRHPEIEIKYGADKSRRIYAPWSEENLQAALKAVQTKELTQKSAAIKYGIPRTTLSDRLRSGSTLKVLGRKRLLNEKQENEFVKELIVCKESGQTLTTKFVQRQAFVFCKRNKIKLNLQFYKKTGLIGKDWLRTFLRRHPEIEIKYGKKYCNEDD

Similar Transcription Factors

Sequence clustering based on sequence similarity using MMseqs2

100% Identity: -
90% Identity: -
80% Identity: -