Basic Information

Gene Symbol
-
Assembly
GCA_947425015.1
Location
OX380334.1:22706357-22711153[+]

Transcription Factor Domain

TF Family
ARID
Domain
ARID domain
PFAM
PF01388
TF Group
Helix-turn-helix
Description
This domain is know as ARID for AT-Rich Interaction Domain [2], and also known as the BRIGHT domain [1].
Hmmscan Out
# of c-Evalue i-Evalue score bias hmm coord from hmm coord to ali coord from ali coord to env coord from env coord to acc
1 7 10 5.3e+04 -3.9 0.0 31 46 321 336 320 343 0.80
2 7 0.25 1.3e+03 1.3 0.0 26 45 504 524 469 536 0.76
3 7 0.0071 38 6.3 0.0 26 55 786 816 743 826 0.81
4 7 0.014 74 5.4 0.0 21 55 946 1003 927 1007 0.67
5 7 0.14 7.3e+02 2.2 0.0 25 55 1150 1190 1115 1193 0.67
6 7 0.012 65 5.5 0.0 25 50 1341 1366 1302 1375 0.76
7 7 0.2 1e+03 1.7 0.0 27 49 1526 1548 1482 1595 0.79

Sequence Information

Coding Sequence
ATGCCAACTATTGATCACAACCTAATATTAAGGGTAATTTTGTGCATGAAGTCTAAAATAGCTCGTCAAGATAAAGTTAAACATTTTCTAGAAAAATTCGTTATTGATATAACAATAAATAATAAATTAAATAAAATACCTCCAAACTTCTTGCAATTAATTCTAAAATATCCGAATCTAGAGAATTATATTAATTATATTTTTCAACAGAATAACTTACCGATAACAAAAGTAAATCCACGCATAATAATTCTACTTCTTAAGTTAATTAACCAATGCAAACTAAATGAACTAATATCAAATATTCCTCAACGATTAATCGAATTAATTCTTAATTTAAAAGGAGCTCAAGCATTATCGCAAACTGTGCTCGTTTGGCTTCAAGGAAATGAAGAAGTTGACATGGTACAATTGTTTTTACAAATACTTTATGATAATGAAAATAACATCGTTCCTCGTAATCTTCGAATCTGGCTTTTAAAGTTTCCTAATGGCCAAAAGATTATAGATTATCTCGAGAAACCTGGTGAAATAAAGTGTACTGAAGTAAATAGTGGCAATATTCATTGCTTTAAAATTATATTAGAAGTTATAAAACCAAGAGTTACAATAAAATCTCCAGATATAAGAATTTCAGCAGACATAGTTGAAGAATTGTATAAAATAATAATAGGTATAACTAATAAACGCCTAATTAATGTGTCTCCGAAACTTTTCAATTATATTTTCAATAGTTCCGATTTACACAATCTTGTCTTAAAAATTTTCAAAAACTATCAAATTCCGTTTACAAAAATTAATCCGTCGATTATAACACAATTATTGAAATTAATAATATCATACAAAATACACACACCAATACGTGATATATCTCCAGAATTAACGAAGTTAGTTCTAAACTTAAAAGGAGCTCAAGACTTGACGAATTTTATTCTCGTTTGGTATAAAGACATCTTACATATTGATATGTTGCAATTGTTCCTGCATATAATTAAAAACAATGGAGGTAACATTATTCCTCGAAATCTTCGTTTCTGGCTTTTACATGTTCCTAACGGCCTGCCACTTCTACAATTTCTCGAGAAACCAGGTGAAATAAAATGTACCGAGGAAGGTATTAACAATGTTCATTGCATGAAGATTATAATCGAATCTACAGAATCAACAGTTACGCTAGTAAAACCGAAACCTGAAATTTCAACTGATATTAAACTAGAATTATATAAATTCATTTTAAGTATAACTAATCATCAACTAATTCATATGTCCCCTAACTTATATAAATTTATTTTAAATTATTCCAATCTACATGATATTGTCATTAAAATTTTCAACGACTATAAAATTTCAAATACAAAAATAAAACCCAAAATAATAGTACAACTCATAAAATTGTTAATAAAACACAAAACGCACAAACCAATTAGAAATATATCTCAAGAATTAATTAAAATATTAATCAATTTAAAGGGTGCCGAAGAGTTAATACGACCAGTGATTACTTATATTACACAGCACAAGAATATTGACATAATACAGTTGTTTCTTCAAATAGTTCAAGAAAATGGAGGTAAGATTATACCATCAAATCTACGTTTCTGGCTATTACAGTTTCCTAAAGGTCTGCAGATTTTGCAATATCTCGAGCAACCTGGTGAAATAAAATGTACCAATCAAGATAATGGCAATGTTAATTGCGTTAAAATATTTGTTATACTTAAACCTATAGTTCCGATAGAACAGCCATTAGCAATGCAACCTATAGTTCCGATAAGACCTATAGTTCCGATAAGATCTATAGTTCCAATAGATCAAACATTGATGATTCAACCTGCAGTTCCGATAGAACCTATAACTTTTATAGAACCTGTAGTTCCAATAGAACCTATAGGTCCGATTGAATATATAATTCCAACAGAACCTATAATGCCAATAAAATCTATAATTCCGATAGAAACCATAGCTCCAAAAGAACCTATAGTTTCAATAGTACCTGTAGTTCCGAAAGAACCTATACTTACGATAGAAGCACCAAAAACAGAAGTTTCGATAGATATAAAACAAGAACTATATAAATTAATTTTAGGCGTAACAAATTATCAACTGAATCATATCTCTCAAAATTTATTTCAATTTATTTTAAAATATACACATTTACAAGAACTTGTTATTAACATTTTTCATGAACACAAGATTCCATCTACAAAAATAAGTCCAACAATAATAGTGCAACTTATAAAATTACTAATTAAACACAAAACACACAAACCAATAGAAGAAATACCTCCAGAATTAATCAAAATATTGATAAACTTGAAAGGTGCTGAAGAGTTAATACAACCATTAGTTACTTACACGAACTACAGGCACATCGATATGATGCAGTTATTCCTTCAAGTAATTGAAGAGAATGGTGGTAAAATGATTTCATCAAATCTTCGTATGTGGCTTTTGCAATTTCCTAACGGCTTGCAAATTCTAGAATATTTAGAGAAACCTGGTGAAATAAAATGTACCAAGAATGAAAATAACGAGATTCATTGCTTTAAAACTGTGGTCGAAACTGAAAAATCTATTGTTACGCAAGAATCATCAAAAATAGAAGTTTCGAGAGATGTAAGACAAGAATTACATAAATTAATTGTTGGCATAACTAATCATGAACTAATTCACATGTCTCCTAACTTTTATCATTTTATTTTAAATCACTCTCATCTACAAGAATTTGTCGTTAAAGTTTTTAATGAATACAATATTCCAAGTACAAAAGTAAACCCGACGATTATAGTACAACTGATTAAATTGTTAATTAAACACAAAACTCAGAAGCCAATTGACGAAATACCTCAAGAATTAATCAAAATATTGATAAACTTGAAGGGTGCTGAAGAGTTTATACAACCATTAGTTACTTACATAGAGCACAAGCATATCGATATGATGCAATTTTTTCTGCAAGTAATTGAAGAGAATGGTGGTAAAATTATTCCATCAAATCTTCGAATGTGGCTTTTACAGTTTCCTAACGGCCTGCAGATTCTAGAATTCTTAGAGAAACCTGGTGAAATAAAATGTAGCAAACAAGATAATGGTAATGTTAATTGCGTTAAGATTGTAGTTGTAACTGAAAAACTTACTGTTACAAAAGAATCATTGCAAACAGAAGTTTCGATAGATATAAAACAAGAATTACATAATCTAATTGTCGGCATATCTAATCATGAACTAATTCATATGTCTCCTAACTTTTATCATTTTATTTTAAATCACAGCCATCTACAGGAATTTGTCATTAAAATTTTTAATGAATACAATATTCCAAACACAAAAGTAAATCCGACTATAATAGTTCAACTTATAAAATTGTTAATTAAACACAAAACTCAGAAGCCAATTGATGAAATACCTCAAGAATTAATTAAAATATTGATAAACTTGAAGGGCGCTGAAGAGTTTATACAACCATTAGTTACTTACACGGAGCACAAACAAATCGATATGATGCAGTTCTTCCTACAAATAATTAATGAGAATGGTGGTAAGATGATTCCATCAAACCTTCGAATGTGGATTTTAAAATTTCCTAACGGCCTGCAGATTTTAGAATTTTTAGAGAAACCTGGTGAAATAAAATGCAGCAAGCAAGATGATGGCAATATACATTGCGTTAAGATGGTAGTCGAAAGTGAAAAATCATCGAAAATAGAAGTTTCCGTAGATATAGAAAAAGAATTACATAATTTAATTGTCGGTGTAACTAATCATGAATTAATCCACATGTCTCCTAACTTTTTAAATTTTGTTTTAAATTACTCTAATCTACAAGAATTTGTCTTAAAAATATTTAATGAATATAATATTCCAAGTACAAAAATAAATCCAACTATAATCGTACAACTTATTAAATTGTTAATTCAGTACAAAACGCATAAACCAATAGAAGAAATACCTCCAGAATTAATAAAAATCTTGATAAATTTGAAGGGTACTGAAGAGTTAAACCAACAGTTGATTATTTATGTCACACAAAACAAAAAACTTGACATGATGCAATTATTTCTGCAAGTAATTAAAGACAATGGAGGTAAAATTATTCCTTCAAATCTTCGTCTTTGGATTTTACAGCTTCCTAATGGGCAGGATATACTACAATATCTCGAGAAACCTGGTGAAATAAAGTGTGATGAGCATGGTATTGATGGCATTCATTGCGTTAAAATTATAATTGGAGCTGAACAACCAACTCAATTAACAGGAATTTCTTCAGATATAAGTCAAGAATTATACAAAATTATTATAGGTGTAACCAATAATCAACTAATTGAAATGTCTCCAAAATTATTCCAGTTTATATTTAATTGCTCCGATCTACAGGAACAAATTATAAACATTTTCAATAAATACAAGATTCCACTTAAAAAAATTAATCCGAAAATTATAACGCAATTATTCCAATTAATAATAAAATACAAAACAAAGACAACAATCCGTGACGTACCCTCAGAATTAATTAAGTTAGTTGTAAACTTAACTGGAGCTAAAGAGTTAGCGCAAACTCTGCTCGGATGGGTGCAAGGAAACGAAAAACTGGATATGATGCAGCTCTTCCTGCAAATAATTAAAGAAAATGGAGGTAAGGTTATTCCTCTAAATCTTCGTATCTGGCTTATGAATTTTCCGAATGGCCAGGAGATACTAAAGTTTCTAGAGAAACCTGGAGAAATAAAATGTGTACAAGATAATGACACTGTCCAGTGTATTAAAACTTTATACACAAAGACTGTTGTCATGGGCTGA
Protein Sequence
MPTIDHNLILRVILCMKSKIARQDKVKHFLEKFVIDITINNKLNKIPPNFLQLILKYPNLENYINYIFQQNNLPITKVNPRIIILLLKLINQCKLNELISNIPQRLIELILNLKGAQALSQTVLVWLQGNEEVDMVQLFLQILYDNENNIVPRNLRIWLLKFPNGQKIIDYLEKPGEIKCTEVNSGNIHCFKIILEVIKPRVTIKSPDIRISADIVEELYKIIIGITNKRLINVSPKLFNYIFNSSDLHNLVLKIFKNYQIPFTKINPSIITQLLKLIISYKIHTPIRDISPELTKLVLNLKGAQDLTNFILVWYKDILHIDMLQLFLHIIKNNGGNIIPRNLRFWLLHVPNGLPLLQFLEKPGEIKCTEEGINNVHCMKIIIESTESTVTLVKPKPEISTDIKLELYKFILSITNHQLIHMSPNLYKFILNYSNLHDIVIKIFNDYKISNTKIKPKIIVQLIKLLIKHKTHKPIRNISQELIKILINLKGAEELIRPVITYITQHKNIDIIQLFLQIVQENGGKIIPSNLRFWLLQFPKGLQILQYLEQPGEIKCTNQDNGNVNCVKIFVILKPIVPIEQPLAMQPIVPIRPIVPIRSIVPIDQTLMIQPAVPIEPITFIEPVVPIEPIGPIEYIIPTEPIMPIKSIIPIETIAPKEPIVSIVPVVPKEPILTIEAPKTEVSIDIKQELYKLILGVTNYQLNHISQNLFQFILKYTHLQELVINIFHEHKIPSTKISPTIIVQLIKLLIKHKTHKPIEEIPPELIKILINLKGAEELIQPLVTYTNYRHIDMMQLFLQVIEENGGKMISSNLRMWLLQFPNGLQILEYLEKPGEIKCTKNENNEIHCFKTVVETEKSIVTQESSKIEVSRDVRQELHKLIVGITNHELIHMSPNFYHFILNHSHLQEFVVKVFNEYNIPSTKVNPTIIVQLIKLLIKHKTQKPIDEIPQELIKILINLKGAEEFIQPLVTYIEHKHIDMMQFFLQVIEENGGKIIPSNLRMWLLQFPNGLQILEFLEKPGEIKCSKQDNGNVNCVKIVVVTEKLTVTKESLQTEVSIDIKQELHNLIVGISNHELIHMSPNFYHFILNHSHLQEFVIKIFNEYNIPNTKVNPTIIVQLIKLLIKHKTQKPIDEIPQELIKILINLKGAEEFIQPLVTYTEHKQIDMMQFFLQIINENGGKMIPSNLRMWILKFPNGLQILEFLEKPGEIKCSKQDDGNIHCVKMVVESEKSSKIEVSVDIEKELHNLIVGVTNHELIHMSPNFLNFVLNYSNLQEFVLKIFNEYNIPSTKINPTIIVQLIKLLIQYKTHKPIEEIPPELIKILINLKGTEELNQQLIIYVTQNKKLDMMQLFLQVIKDNGGKIIPSNLRLWILQLPNGQDILQYLEKPGEIKCDEHGIDGIHCVKIIIGAEQPTQLTGISSDISQELYKIIIGVTNNQLIEMSPKLFQFIFNCSDLQEQIINIFNKYKIPLKKINPKIITQLFQLIIKYKTKTTIRDVPSELIKLVVNLTGAKELAQTLLGWVQGNEKLDMMQLFLQIIKENGGKVIPLNLRIWLMNFPNGQEILKFLEKPGEIKCVQDNDTVQCIKTLYTKTVVMG

Similar Transcription Factors

Sequence clustering based on sequence similarity using MMseqs2

100% Identity
-
90% Identity
-
80% Identity
-