Basic Information

Insect
Timema podura
Gene Symbol
-
Assembly
GCA_033556935.1
Location
JAVRXN010000007.1:53005512-53012248[-]

Transcription Factor Domain

TF Family
HTH
Domain
HTH_psq domain
PFAM
PF05225
TF Group
Helix-turn-helix
Description
This DNA-binding motif is found in four copies in the pipsqueak protein of Drosophila melanogaster [1]. In pipsqueak this domain binds to GAGA sequence [1].
Hmmscan Out
# of c-Evalue i-Evalue score bias hmm coord from hmm coord to ali coord from ali coord to env coord from env coord to acc
1 26 0.86 2.8e+02 3.1 0.0 23 42 68 88 64 91 0.83
2 26 0.97 3.1e+02 3.0 0.0 23 43 94 115 90 117 0.77
3 26 0.14 45 5.7 0.0 23 43 107 128 102 130 0.90
4 26 0.9 2.9e+02 3.1 0.0 23 42 133 153 131 156 0.82
5 26 1.2 3.9e+02 2.7 0.0 23 43 159 180 157 182 0.87
6 26 0.14 47 5.6 0.0 23 43 185 206 183 208 0.89
7 26 1.2 3.9e+02 2.7 0.0 23 43 198 219 196 221 0.87
8 26 1.1 3.6e+02 2.8 0.0 23 42 211 231 202 233 0.86
9 26 0.14 46 5.6 0.0 23 43 224 245 222 247 0.89
10 26 0.14 44 5.7 0.0 23 43 250 271 247 273 0.88
11 26 0.14 46 5.6 0.0 23 43 263 284 261 286 0.89
12 26 0.14 44 5.7 0.0 23 43 289 310 286 312 0.88
13 26 5.5 1.8e+03 0.6 0.0 23 42 315 335 313 337 0.85
14 26 0.13 43 5.7 0.0 23 43 341 362 333 364 0.90
15 26 0.14 46 5.6 0.0 23 43 367 388 365 390 0.89
16 26 0.86 2.8e+02 3.1 0.0 23 42 393 413 388 416 0.84
17 26 1.2 3.8e+02 2.7 0.0 23 43 419 440 416 442 0.87
18 26 0.13 43 5.7 0.0 23 43 445 466 437 468 0.90
19 26 1.1 3.6e+02 2.8 0.0 23 43 458 479 453 481 0.87
20 26 1 3.3e+02 2.9 0.0 23 43 471 492 469 494 0.76
21 26 0.12 41 5.8 0.0 23 43 484 505 475 507 0.89
22 26 1.2 3.9e+02 2.7 0.0 23 43 510 531 508 533 0.87
23 26 1.2 3.9e+02 2.7 0.0 23 43 523 544 521 546 0.87
24 26 1.9 6.2e+02 2.0 0.0 23 41 536 555 532 558 0.88
25 26 1.3 4.1e+02 2.6 0.0 23 40 632 650 615 653 0.69
26 26 1.3 4.1e+02 2.6 0.0 23 43 749 770 747 772 0.88

Sequence Information

Coding Sequence
ATGTTGCAAAACGTGATGGGTGCCCGCCATTTGACGCCACCCACAAGACACCGGGTGCATCGCAAGCACAACACAAGTCCTCGTTTCCTGGAAGTTCTACATTGTATTAACCAAACAACTTTAACTGTGTACCATGGCATTAACCAAACAACACCTGATCTTGCTGTGTACCATGGTACTAACCAAACAACACTTGCTCTTGCTGTGTACCATGGTATTAACCAAACAACACTTGCTCTTGCTGTGTGCCATGGTATTAACCAAGCAACACTTGCTCTTGCTGTGTACCATGGTATTAACCAAGCAACACTTGCTCTTGCTGTGTACCATGGTATTAACCAAACAACACTTGCTCTTGCTGTGTACCATGGTATTAACCAAGCAACACTTGCTCTTGCTGTGTACCATGGTATTAACCAAACAACACTTGCTCTTGCTGTGTGCCATGGTATTAACCAAGCAACACTTGCTCTTGCTGTGTACCATGGCATTAACCAAGCAACACTTGCTCTTGCTGTGTACCATGGTATTAACCAAGCAACACTTGCTCTTGCTGTGTACCATGGTATTAACCAAACAACACTTGCTCTTGCTGTGTACCATGGTATTAACCAAGCAACACTTGCTCTTGCTGTGTACCATGGTATTAACCAAGCAACACTTGCTCTTGCTGTGTACCATGGTATTAACCAAACAACACTTGCTCTTGCTGTGTACCATGGTATTAACCAAGCAACACTTGCTCTTGCTGTGTACCATGGTATTAACCAAACAACACTTGCTCTTGCTGTGTACCATGGTATTAACCAAACAACACTTGCTCTTGCTGTGTACCATGGTATTAACCAAGCAACACTTGCTCTTGCTGTGTACCATGGTATTAACCAAACAACACTTGCTCTTGCTGTGTACCATGGTATTAACCAAACAACACTTGCTCTTGCTGTGTGCCATGGTATTAACCAAGCAACACTTGCTCTTGCTGTGTACCATGGCATTAACCAAGCAACACTTGCTCTTGCTGTGTACCATGGTATTAACCAAACAACACTTGCTCTTGCTGTGTACCATGGTATTAACCAAGCAACACTTGCTCTTGCTGTGTACCATGGTATTAACCAAACAACACTTGCTCTTGCTGTGTACCATGGTATTAACCAAGCAACACTTGCTCTTGCTGTGTACCATGGTATTAACCAAACAACACTTGCTCTTGCTGTGTGCCATGGTATTAACCAAGCAACACTTGCTCTTGCTGTGTACCATGGCATTAACCAAGCAACACTTGCTCTTGCTGTGTACCATGGTATTAACCAAGCAACACTTGCTCTTGCTGTGTACCATGGTATTAACCAAACAACACTTGCTCTTGCTGTGTACCATGGTATTAACCAAGCAACACTTGCTCTTGCTGTGTACCATGGTATTAACCAAGCAACACTTGCTCTTGCTGTGTACCATGGTATTAACCAAACAACACTTGCTCTTGCTGTGTACCATGGTATTAACCAAGCAACACTTGCTCTTGCTGTGTACCATGGTATTAACCAAGCAACACTTGCTCTTGCTGTGTACCATGGTATTAACCAAGCAACACTTGCTCTTGCTGTGTACCATGGTATTAACCAAGCAACACTTGCTCTTGCTGTGTACCATGGTATTAACCAACAACACTTGCTCTTGCTGTGTACCATGGTATTAACCAAACAACACTTGCTCTTGCTGTGTACCATGGTATTAACCAAGCAACACTTGCTCTTGCTGTGTACCATGGTATTAACCAAGCAACACTTGCTCTTGCTGTGTACCATGGTATTAACCAACAACACTTGCTCTTGCTCAACACTTGCTCTTGCTGTGTGCCATGGTATTAACCAAGCAACACTTGCTCTTGCTGTGTACCATGGTATTAACCAAGCAACACTTGCTCTTGCTGTGTACCATGGTATTAACCAACAACACTTGCTCTTGCTGTGTACCATGGTATTAACCAAGCAACACTTGCTCTTGCTGTGTACCATGGTATTAACCAAGCAACACTTGCTCTTGCTGTGTACCATGGTATTAACCAAGCAACACTTGCTCTTGCTGTGTACCATGGTATTAACCAAGCAACACTTGCTCTTGCTGTGTACCATGGTATTAACCAAGCAACACTTGCTCTTGCTGTGTACCATGGTATTAACCAAGCAACACTTGCTCTTGCTGTGTACCATGGTATTAACCAAAGCAACACTTGCTCTTGCTGTGTACCATGGTATTAACCAAGCAACACTTGCTCTTGCTGTGTACCATGGTATTAACCAAAGCAACACTTGCTCTTGCTGTGTACCATGGATTAACCAAGCAAACTTGCTCTTGCTGTGTGCCATGGTATTAACCAAGCAACACTTGCTCTTGCTGTGCCATGGTATTAACCAAGCAACACTTGCTCTTGCTGTGTACCATGGTATTAACCAACAACACTTGCTCTTGCTGTGTACCATGGTATTAACCAAGCAAACATTGCTCTTGCTGTGTACCATGGCATTAACCAAGCAACACTTGCTCTTGCTGTGTACCATGATTAACCAAGCAATACTTGCTCTTGCTGTGTGCCATGCAATACTTGCTCTTGCTGTGTGCCATGGTATTAACCAAGCAACACTTGCTCTTGCTGTGTCCATGGTAATTAACCAAGCAAACTTGCTCTTGCTGTGTGCCATGGTATTAACCAAGCAACACTTGCTCTTGCTGTGTGACCTGGCATTAACCAAGCAACACTTGCTCTTGCTGTGTACCATGGCATTAACCAAGCAATACTTGCTCTTGCTGTGTGCCATGGCATTAACCAAGCAACACTTGCTCTTGCTGTGTGCCATGGCATTAACCAAGCAATACTTGCTCTTGCTGTGTGCCATGGTATTAACCAAGCAACACTTGCTCTTGCTTTGTGCCATGGTATTAACCAAACAACACTTGCTCTTGCTGTGTGCCATGGTATTAACCAACAACACCTGA
Protein Sequence
MLQNVMGARHLTPPTRHRVHRKHNTSPRFLEVLHCINQTTLTVYHGINQTTPDLAVYHGTNQTTLALAVYHGINQTTLALAVCHGINQATLALAVYHGINQATLALAVYHGINQTTLALAVYHGINQATLALAVYHGINQTTLALAVCHGINQATLALAVYHGINQATLALAVYHGINQATLALAVYHGINQTTLALAVYHGINQATLALAVYHGINQATLALAVYHGINQTTLALAVYHGINQATLALAVYHGINQTTLALAVYHGINQTTLALAVYHGINQATLALAVYHGINQTTLALAVYHGINQTTLALAVCHGINQATLALAVYHGINQATLALAVYHGINQTTLALAVYHGINQATLALAVYHGINQTTLALAVYHGINQATLALAVYHGINQTTLALAVCHGINQATLALAVYHGINQATLALAVYHGINQATLALAVYHGINQTTLALAVYHGINQATLALAVYHGINQATLALAVYHGINQTTLALAVYHGINQATLALAVYHGINQATLALAVYHGINQATLALAVYHGINQATLALAVYHGINQQHLLLLCTMVLTKQHLLLLCTMVLTKQHLLLLCTMVLTKQHLLLLCTMVLTNNTCSCSTLALAVCHGINQATLALAVYHGINQATLALAVYHGINQQHLLLLCTMVLTKQHLLLLCTMVLTKQHLLLLCTMVLTKQHLLLLCTMVLTKQHLLLLCTMVLTKQHLLLLCTMVLTKQHLLLLCTMVLTKATLALAVYHGINQATLALAVYHGINQSNTCSCCVPWINQANLLLLCAMVLTKQHLLLLCHGINQATLALAVYHGINQQHLLLLCTMVLTKQTLLLLCTMALTKQHLLLLCTMINQAILALAVCHAILALAVCHGINQATLALAVSMVINQANLLLLCAMVLTKQHLLLLCDLALTKQHLLLLCTMALTKQYLLLLCAMALTKQHLLLLCAMALTKQYLLLLCAMVLTKQHLLLLCAMVLTKQHLLLLCAMVLTNNT

Similar Transcription Factors

Sequence clustering based on sequence similarity using MMseqs2

100% Identity
-
90% Identity
-
80% Identity
-