Basic Information

Gene Symbol
-
Assembly
GCA_030765065.1
Location
CM060979.1:138143459-138146284[-]

Transcription Factor Domain

TF Family
HTH
Domain
HTH_psq domain
PFAM
PF05225
TF Group
Helix-turn-helix
Description
This DNA-binding motif is found in four copies in the pipsqueak protein of Drosophila melanogaster [1]. In pipsqueak this domain binds to GAGA sequence [1].
Hmmscan Out
# of c-Evalue i-Evalue score bias hmm coord from hmm coord to ali coord from ali coord to env coord from env coord to acc
1 17 2.8 3.7e+03 0.6 0.0 25 36 51 62 50 64 0.83
2 17 1.6 2e+03 1.4 0.0 25 36 67 78 66 80 0.84
3 17 1.6 2e+03 1.4 0.0 25 36 83 94 82 96 0.84
4 17 1.6 2e+03 1.4 0.0 25 36 99 110 98 112 0.84
5 17 1.6 2e+03 1.4 0.0 25 36 354 365 353 367 0.84
6 17 1.1 1.4e+03 1.9 0.0 25 36 546 557 545 559 0.86
7 17 2.4 3.2e+03 0.8 0.0 25 36 562 573 561 575 0.85
8 17 2.8 3.7e+03 0.6 0.0 25 36 626 637 625 640 0.85
9 17 1.1 1.4e+03 1.9 0.0 25 36 658 669 657 671 0.86
10 17 2.4 3.2e+03 0.8 0.0 25 36 674 685 673 687 0.85
11 17 2.7 3.5e+03 0.6 0.0 25 36 722 733 721 735 0.85
12 17 2.9 3.8e+03 0.5 0.0 25 36 754 765 753 766 0.84
13 17 1.8 2.3e+03 1.2 0.0 25 36 770 781 769 783 0.85
14 17 5.5 7.2e+03 -0.4 0.0 26 36 787 797 785 798 0.84
15 17 1.9 2.5e+03 1.1 0.0 25 36 818 829 817 831 0.85
16 17 2.9 3.8e+03 0.5 0.0 25 36 850 861 849 862 0.84
17 17 1.8 2.3e+03 1.2 0.0 25 36 866 877 865 879 0.85

Sequence Information

Coding Sequence
ATGACTAGAGTCAGAGGTGCTGAGTATCTGATCCTCCTATCACTAGAGTTTCCTATATCAGCCTATCATACAAACATCAAGTCTAAGGTGTGTCATATCACAGGCTATGATATTTCTACAAGTAGAAGGTCAGAGGTGGTAACTATCACAGCCTATGATATTTCTACAAGTACAATGTTAGAGGTGTTAACTATCTCAGCCTATGATATTTCTACAAGTACAATGTCAGAGGTGTTAACTATCTCAGCCTATGATATTTCTACAAGTACAATGTCAGAGGTGTTAACTATCTCAGCCTATGATATTTCTACAAGTACAATGTCAGAGGTGTTAACTATCTCAGCCTATGATACTTCTACAAGTACAATGTCAGAGGTGTTAACTATCGCAGCCAATACTTCTACAAGTACAATGTCAGAGGTGTTAACTATCGCAGCCAATGATACTTCTACAAGTACAATGTCAGAGGTGTTAACTATCTCAGCCTATGATACTTCTACAAGTACAATGTCAGAGGTGTTAACTATCGCAGCCAATGATACTTCTACAAGTACAATGTCAGAGGTGTTAACTATCGCAGCCAATGATACTTCTACAAGTACAATGTCAGAGGTGTTAACTATCTCAGCCTATGATACTTCTACAAGTACAATGTCAGAGGTGTTAACTATCTCAGCCTATGATACTTCTACAAGTACAATGTCAGAGGTGTTAACTATCACAGCCTATGATACTTCTACAAGTACAATGTCAGAGGTGTTAACTATCTCAGCCTATGATACTTCTACAAGTACAATGTCAGAGGTGTTAACTATCACAGCCTATGATACTTCTACAAGTACAATGTCAGAGGTGTTAACTATCTCAGCCTATGATACTTCTACAAGTACAATGTCAGAGGTGTTAACTATCTCAGCCTATGATACTTCTACAAGTACAATGTCAGAGGTGTTAACTATCTCAGCCTATGATACTTCTACAAGTACAATGTCAGAGGTGTTAACTATCTCAGCCTATGATACTTCTACAAGTACAATGTCAGAGGTGTTAACTATCTCAGCCTATGATATTTCTACAAGTACAATGTCAGAGGTGTTAACTATCTCAGCCTATGATACTTCTACAAGTACAATGTCAGAGGTGTTAACTATCTCAGCCTATGATACTTCTACAAGTACAATGTCAGAGGTGTTAACTATCTCAGCCTATGATACTTCTACAAGTACAATGTCAGAGGTGTTAACTATCACAGCCTATGATACTTCTACAAGTACAATGTCAGAGGTGTTAACTATCTCAGCCTATGATACTTCTACAAGTACAATGTCAGAGGTGTTAACTATCTCAGCCTATGATACTTCTACAAGTACAATGTCAGAGGTGTTAACTATCGCAGCCTATGATACTTCTGCAAGTACAATGTCAGAGGTGTTAACTATCTCAGCCTATGATACTTCTGCAAGTACAATGTCAGAGGTGTTAACTATCTCACCCTATGATACTTCTACAAGTACAATGTCAGAGGTGTTAACTATCTCACCCTATGATACTTCTACAAGTACAATGTCAGAGGTGTTAACTATCGCAGCCTATGATACTTCTACAAGTACAATGTCAGAGGTGTTAACTATCTCAGCCTATGATGTTTCTACAAGTACAATCTCAGAGGTGTTAACTATCGCAGCCTATGATATTTCTACAAGTACAATGTCAGAGGTTTTGCCTATCACAGCCTATGATACTTCTACAAGTACAATGTCAGAGGTTTTGCCTATCACAGCCTATGATACTTCTACAAGTACAATGTCAGAGGTGTTAACTATCTCAGCCTATGATACTTCTACAAGTACAATGTCAGAGGTGTTAACTATCACAGCCTATGATGTTTCTACAAGTACAATGTCAGAGGTGTTAACTATCACAGCCTATGATACTTCTACAAGTACAATGTCAGAGGTGTTAACTATCTCAGCCTATGATGTTTCTACAAGTACAATCTCAGAGGTGTTAACTATCGCAGCCTATGATATTTCTACAAGTACAATGTCAGAGGTTTTGCCTATCACAGCCTATGATACTTCTACAAGTACAATGTCAGAGGTTTTGCCTATCACAGCCTATGATACTTCTACAAGTACAATGTCAGAGGTGTTAACTATCTCAGCCTATGATGTTTCTACAAGTACAATGTCAGAGGTTTTGCCTATCACAGCCTATGATACTTCTACAAGTACAATGTCAGAGGTGTTAACTATCTCAGCCTATGATGTTTCTACAAGTACAATGTCAGAGGTTTTGCCTATCACAGCCTATGATATTTCTACAAGTACAATGTCAGAGGTGTTAACTATCTCAGACTATGATGTTTCTACAAGTACAATGTCAGAGGTTTTGCCTATCACAGCCTATGATATTTCTACAAGTGCAATGTCAGAGGTTTTGCCTATCACAGCCTATGATATTTCTACAAGTACAATGTCAGAGGTTTTGCCTATCACAGCCTATGATACTTCTACAAGTACAATGTCAGAGGTGTTAACTATCTCAGCCTATGATGTTTCTACAAGTACAATGTCAGAGGTTTTGCCTATCACAGCCTATGATATTTCTACAAGTACAATGTCAGAGGTGTTAACTATCTCAGCCTATGATACTTCTACAAGTACAATGTCAGAGGTGTTAACTATCGCAGCCTATGATACTTCTACAAGTACAATGTCAGAGGTTTTGCCTATCACAGCCTATGATATTTCTACAAGAAGAATTCTTGAGAATTCTCAGCCTATGATATTAATACAAATGGAATGTCAAGACGGTGGCCTATGA
Protein Sequence
MTRVRGAEYLILLSLEFPISAYHTNIKSKVCHITGYDISTSRRSEVVTITAYDISTSTMLEVLTISAYDISTSTMSEVLTISAYDISTSTMSEVLTISAYDISTSTMSEVLTISAYDTSTSTMSEVLTIAANTSTSTMSEVLTIAANDTSTSTMSEVLTISAYDTSTSTMSEVLTIAANDTSTSTMSEVLTIAANDTSTSTMSEVLTISAYDTSTSTMSEVLTISAYDTSTSTMSEVLTITAYDTSTSTMSEVLTISAYDTSTSTMSEVLTITAYDTSTSTMSEVLTISAYDTSTSTMSEVLTISAYDTSTSTMSEVLTISAYDTSTSTMSEVLTISAYDTSTSTMSEVLTISAYDISTSTMSEVLTISAYDTSTSTMSEVLTISAYDTSTSTMSEVLTISAYDTSTSTMSEVLTITAYDTSTSTMSEVLTISAYDTSTSTMSEVLTISAYDTSTSTMSEVLTIAAYDTSASTMSEVLTISAYDTSASTMSEVLTISPYDTSTSTMSEVLTISPYDTSTSTMSEVLTIAAYDTSTSTMSEVLTISAYDVSTSTISEVLTIAAYDISTSTMSEVLPITAYDTSTSTMSEVLPITAYDTSTSTMSEVLTISAYDTSTSTMSEVLTITAYDVSTSTMSEVLTITAYDTSTSTMSEVLTISAYDVSTSTISEVLTIAAYDISTSTMSEVLPITAYDTSTSTMSEVLPITAYDTSTSTMSEVLTISAYDVSTSTMSEVLPITAYDTSTSTMSEVLTISAYDVSTSTMSEVLPITAYDISTSTMSEVLTISDYDVSTSTMSEVLPITAYDISTSAMSEVLPITAYDISTSTMSEVLPITAYDTSTSTMSEVLTISAYDVSTSTMSEVLPITAYDISTSTMSEVLTISAYDTSTSTMSEVLTIAAYDTSTSTMSEVLPITAYDISTRRILENSQPMILIQMECQDGGL

Similar Transcription Factors

Sequence clustering based on sequence similarity using MMseqs2

100% Identity
-
90% Identity
-
80% Identity
-