Basic Information

Insect: Drosophila gunungcola
Gene Symbol: osa_1
Assembly: GCA_011057485.1
Location: WTSR01005050.1:2753633-2764168[+]

Transcription Factor Domain

TF Family: ARID
Domain: ARID domain
PFAM: PF01388
TF Group: Helix-turn-helix
Description: This domain is know as ARID for AT-Rich Interaction Domain [2], and also known as the BRIGHT domain [1].
Hmmscan Out: # of c-Evalue i-Evalue score bias hmm coord from hmm coord to ali coord from ali coord to env coord from env coord to acc

1 1 7.1e-25 2.3e-21 75.8 0.0 2 89 512 599 511 599 0.92

#	of	c-Evalue	i-Evalue	score	bias	hmm coord from	hmm coord to	ali coord from	ali coord to	env coord from	env coord to	acc
1	1	7.1e-25	2.3e-21	75.8	0.0	2	89	512	599	511	599	0.92

Sequence Information

Coding Sequence: ATGGGCTCTGGTCCACCAGGCACTCCCAATCCGCAGCAGGTGATGCGACCCACACCCTCGCCCACCGGCTCCTCCGGTTCGCGTTCCATGTCCCCGGCAGTCGCCCAAAACCATCCAATCTCGCGTCCGGCGAGCAATCAGTCAAGCAGCGGCGGACCAATGCAACAGCCGCCGGTTGGGGCGGGAGGTCCACCGCCGATGCCACCGCATCCGGGAATGCCAGGAGGCCCGCcccagccgcagcagcaatctcagcagcaacaggcatCGAATTCGGCCTCGTCGGCGAGCAACTCGCCGCAGCAGACGCCGCCACCGGCACCGCCGCCCAACCAGGGCATCAACAacatggccacgcccccaccgcCTCCACAGGGGGCGGGCGGAGGGTACCCGATGCCGCCGCACATGCACGGCGGCTACAAGATGGGCGGTCCAGGCCAGGCACCCGGTGCCCAGGGATATCCGccgcagcagccacagcaatATCCACCAGGCAATTACCCGCCACGTCCACAGTATCCGCCTGGCGCATACGCCACCggaccaccaccgccacccacAAGCCAAGCGGGAGCAGGCGGAGCCAACAGCATGCCCTCGGGAGCCCAGGCCGGCGGCTATCCGGGTCGGGCCATGCCCAACCACACTGGCCAATATCCGCCGTATCAGTGGGTGCCGCCGTCGCTACAGCAAGCCGGACCCGGTGGAGCWCCCGGTGGCGCGATGGTCGGCAATCATGTGCAGGGCNAGGGCACANCGCCANCGCCGATTGTGGGTGGACCACCGCCACCGCAGGGCAGTGGGTCACCGCGACCTCTGAACNATCTGAAGCAGCATTTACAGCACAAGGGCGGCTACGGAGGAAGTCCAACGCCGCCGCAGGGGCCACAGGGATACGGCAACGGACCGACCGGAATGCATCCGGGCATGCCGATGGGGCCACCCCACCACATGGGACCTCCGCACGGACCCACCAACATGGGTCCGCCCACCAGCACACCGCCGCAGTCGCAGATGCTGCAGGGCGGACAGCCGCAGGGGCAGGGACNGGGACCCGTTGCGGGACCGGAAAGTGGAGGCCCGGAGCATATATCGCAGGACAATGGGATCAGCTCTTCGGGGCCGACGGGAGCCGCGGGCATGCATGCAGTCACCGCGGTGGTAACCACCGGACCGGATGGCGCGCCCATGGACGACGTCAGCCAGCAGAGCACGCTCTCGAATGCATCAGCGGCATCCGGCGAAGATCCACAATGCACCACACCAAAGTCGCGCAAGAATGATCCCTATAGCCAAAGTCACCTAGCACCGCCGAGTACGTCGCCCCATCCGGTCGTAATGCATCCAGGCGGCGGTGGCCCAGGCGAGGAGTACGACATGAGCTCGCCACCCAATTGGCCACGTCCGACTGGAAGCCCGCAGGTGTTTAACCATGTTCCGGTGCCGCAGGAGCCCTTCCGCAGCACCATCACCACGACCAAGAAGTCGGACTCACTGTGCAAGCTGTACGAGATGGACGATAATCCGGAGCGGCGCGGCTGGCTGGACAAGCTGCGGTCGTTCATGGAGGAACGGCGTACTCCGATCACAGCCTGCCCCACCATCTCAAAACAGCCACTCGATTTATATAggttatatatttatgtaaaagaACGTGGCGGATTCGTCGAGGTATGCAAGGTGACCAAAAGCAAGACCTGGAAGGACATTGCCGGACTGCTAGGCATTGGGGCGAGTAGCAGTGCGGCGTACACACTGCGGAAGCACTACACCAAGAACCTGCTGACCTTCGAGTGCCACTTTGACCGGGGTGACATCGATCCCCTGCCCATTATCCAGCAGGTGGAGGCGGGCAGCAAGAAAAAGACAGCCAAGGCTGCTTCGGTTCCTTCGCCAGGCTCGTCGAACTCGCAGGATTCGTTCCCGGCCCCGCCAGGCTCCGCCCCGAACGCGGCGATCGACGGCTACCCCGGCTATCCGGGCGGCAGTCCGTATCCGGGAGCCAGCGGNCCGCAGCCGGACTANNCGGCTGCGGGCCAGNTGCAGCGGCCGCCCTCTCAGAACAACCCGCAGACTCCTCATCCCGgcgccgccgccgctgttGCCGCCGGCGATAATATAAGCGTGAGCAATCCCTTCGAGGATCCCATTGCTGCCGGTGGCCCGGGCTCGAGCTCGGGAGCTGGGccaggaccaggaccaggTGGTGCTGGTCCCGGTGGTGCTggagctgttgctgctgtgggcGGCGGTGGCCCACAACCACATCCACCGCCCCCACATTCACCGGCGGCCagtcaacagcagcagcagcatccacAGCACCCNNNNNNNNNCGGTCTGTCCGGGCCACCAccgccacagcagcaacagcagcagccgggGCAGCAGCCACCACTACCACTACCAGCCGTGGGCGGTgggccaccaccagcaccacagCAACATGGGCCTGGTCAGGTGCAGGTGCCGCCGTCGCCTCAGCAGCATGTGCGCCCAGCCGCCGGAGCACCTTATCCGCCGGGTGGCTCCGGCTACCCAACGCCTGTGTCTAGAACGCCAGGCTCACCCTATCCATCACAGCCCGGTGCTTACGGACAGTACGGCTCGAGCGATCAGTACAACGCCACAGGGCCGCCCGGCCAGCCATTCGGACAGGGTCCAGGACAATATCCGCCCCAGAACCGCAACATGTACCCTCCCTACGGGCCGGAGGGGGAAGCTCCTCCAACTGGTGCCAATCAGTACGGTCCCTATGGCAACCGACCATACAGTCAGCCACCGACGGGCGGACCTCAGCCGCCGGCGCAGACGGTTGCGGGTGGACCGCCGGCCAGCGGAGCTCCAGGAGCACCGCCCAGCAGCGCCTATCCGTCGGGCAGGCCCACCCAGCAGGACTATTACCAACCACCACCAGATCAAAGTCCACAGCCACGTCGGCATCCCGATTTCATCAAAGACTCACAGCCCTATCCAGGATACAATGCTAGGCCTCAAATTTATGGCGGTACCCAGCAGTATCGGCCACAATATCCAACCTCGCCTGCCCCGCAAAGCTGGGGAAGTGCTCCGCCTCGCGGTGCAGCACCTCCGCCAGGCGCACCACACGGCCCGCCACTGCAGCAGCCGCCCGGAGTGGGCCAGTGGGATCAGCACCGCTATCCGCCACAGCAGggtccgccgccgcctcctNNNNNNcagcagcagccacagcagcagcagcagcaaccgccGTACCAGCAGGTGGCCGGGCCCCCTGGACAACAGCCGCCTCAGGCGCCGCCACAGTGGGCACAGATGAACGCCGGCCAGGCGGCGCAGCCAGGAATAGCGCCACCAGGCTCGCCACTGCGTCCGCCGTCCGGACCAGGACAACAGCAGAGGATGCCCGGAatgccgccgcagcagcaacagtcaCAGCAACAGGGCGGAGTCCAGCAACCACCGCCGCAACAGGCTACTCATGGTGGCGTTCCCTCGCCGGGACCGGGTGGAATGGTAAAGCCACCGTACGCCATGCCCCCGCCACCATCTCAGGGTGTGGGTCAGCAAGTGGGCCAAGTGCCACCCAGCGGCATGATGGTTCAGAAACAGCCGCCGATGCCGGGCCAGGTAATGCAGCAACAgcccctgcagcagcagcctccgCCGCATCAACATCCGCATCCTCACCAGCATCCGCAGCACCCGCCGCACCCGCATCCGCATCAGATGCCGCCCAGTCAGACGGCACCGGGCGGTGGCTACGGCCCGCCAGGAATGCCTGGTGGCGGTGGCCAGCTGGTGAAGAAGGAGCTGATTTTTCCGCACGACAGCGTGGAGTCCACCACACCGGTGCTGTACCGAAGGAAGCGGCTCACCAAGGCCGATGTGTGCCCCGTGGATCCGTGGCGGATATTTATGGCCATGCGATCCGGTCTGCTGACCGAATGCACCTGGGCGCTGGATGTGCTAAACGTGCTATTGTTCGACGATTCTACGGTGCAGTTCTTTGGCATTTCGAATCTGCCTGGCCTGCTGACTCTTCTGCTAGAGCACTTCCAGAAGAATCTCGCCGAGATGTTTGACGAACGGGAGAACGAGGAGCAAACCTCGATGCTGGCGGAGGAAGGGGCAGATGACGACGCCGACAGCGGCACTGTGATGTGCGAGAAGTTGCGGACCAGCGGACGACAGTCGCGATGTGTGCGCAGCATCAGCAGCTACAACCGCAGGCGGCACTATGAGAACATGGACCGCAGCGGAAAGGGCGTCGCCAGCAACGGCAGCGATTCGGAAGATGCCGACGAGGGAATTGATCTGGGCCAGGTGCGTGTGCAACCCAATCCCGAGGAGCGCTCGCTACTGCTCTCCTTCACGCCCAATTACACGATGGTCACGAGAAAGGGAGTGCCAGTGCGCATCCAGGCCGCCGATCACGACATCTTTGTGGACGAGCGCCAGAAGGCGTGGGACATAGACACGAACCGCCTGTACGAACAGCTGGAGCCCGTGGGCAGCGATGCCTGGACGTACGGATTCACCGAGCCAGATCCCCTCGACGGCATCATAGACGTCTTCAAATCGGAGATTGTTAACATTCCATTTGCACGTTTCGTCCGCTCCGAAAAGAAGGGAAAAACGCGAACAGAAGTGGCGAGTACGGCCAGGAAGGCGGAGATAAAGCTGGAGGAGAACAGCTCGGAGGNNNCGGCTTTCAACAAGAAGAGGCGACTGgtcagcggcggcagcagcagcagtggagCCCCAGCCGANNGCAAGAAGTCGAAGCTGACGAGTGAGGAATTTGCCCAGCCAAACGTTGATGTGAAGAAGGAGCCAGGCTCGGCGGACAGCGATTGTCGCCCCGTCGACATGGATATCGAAGCACCCCAGCAAAGGTTGACCAATGGCGTTGCAGCCTGCCCAGCCTCAACTCCCGCCGTCTTCGATCCCCGGACAACGGCCAAAGATGTGGCGCAGGTGCTGCAGCGGAGGCGTGACTCAAGCTTTGAGGACGAGTGCTACACCAGGGACGAGGCGTCTCTGCACCTGGTCAACGAGAGCCAAGACTCGTTGGCGCGGCGCTGCATCGCCCTTTCCAACATCTTCCGCAACCTGACCTTCGTGCCCGGCAACGAGACGGTGCTGGCCAAATCCACCAGGTTCTTGGCGGTGCTGGGGCGACTGCTTCTGCTGAACCACGAGCACCTGAGGCGCACCCCGAAGACACGTAACTACGACCGTGAGGAGGACACGGACTTCAGTGACTCGTGCAGTTCGCTGCAAGGAGAGCGCGAGTGGTGGTGGGACTACCTAATCACCATTCGGGAGAACATGCTGGTCGCCATGGCCAACATAGCCGGGCACTTGGAGCTCTCGCGCTACGATGAGCTCATTGCCCGCCCCCTGATCGACGGACTGCTGCACTGGGCCGTGTGTCCCAGTGCCCATGGCCAGGATCCGTTCCCGTCGTGYGGACCCAATACGGCGCNCTCGCCGCAGCGCCTGGCACTTGAGGCGCTCTGYAAGCTGTGCGTGACGGATGCTAACGTCGACCTGGTCATTGCCACTCCACCGTTCTCGCGACTGGAAAAGCTCTGCGCCGTGCTCACCCGGCATTTGTGCCGCAACGAGGACCAGGTGCTTCGCGAGTTCTCCGTGAACCTRCTGCACTACTTGGCCGCCGCCGATAGCGCCATGGCTCGCACTGTGGCGCTGCAGTCCCCGTGCATCTCCTACCTGGTGGCCTTCATCGAACAGGCCGAACAGACGGCGCTGGGTGTGGCGAACCAGCATGGGATCAACTACCTGCGCGAGAATCCCGACTCGATGGGCACCAGCCTGGACATGCTGCGGCGAGCAGCCGGAACGCTGCTCCATCTCGCCAAGCACCCAGACAACCGGTCGCTGTTCATGCAACAGGAGCAGCGGCTGCTCGGCCTGGTCATGTCGCACATTCTGGACCAGCAGGTGGCTCTTATAATTTCGCGGGTGCTTTACCAAGTGTCGCGCGGAACGGGGCCCATACACTCGGTGGATGTGTCCGCCGGAGCGGCGGTGGCACAACCAGCGGCGGCACCGCCGCCAACCAATGCAGGAACAACGACAGCCGTTGCGTAG
Protein Sequence: MGSGPPGTPNPQQVMRPTPSPTGSSGSRSMSPAVAQNHPISRPASNQSSSGGPMQQPPVGAGGPPPMPPHPGMPGGPPQPQQQSQQQQASNSASSASNSPQQTPPPAPPPNQGINNMATPPPPPQGAGGGYPMPPHMHGGYKMGGPGQAPGAQGYPPQQPQQYPPGNYPPRPQYPPGAYATGPPPPPTSQAGAGGANSMPSGAQAGGYPGRAMPNHTGQYPPYQWVPPSLQQAGPGGAPGGAMVGNHVQGXGTXPXPIVGGPPPPQGSGSPRPLNXLKQHLQHKGGYGGSPTPPQGPQGYGNGPTGMHPGMPMGPPHHMGPPHGPTNMGPPTSTPPQSQMLQGGQPQGQGXGPVAGPESGGPEHISQDNGISSSGPTGAAGMHAVTAVVTTGPDGAPMDDVSQQSTLSNASAASGEDPQCTTPKSRKNDPYSQSHLAPPSTSPHPVVMHPGGGGPGEEYDMSSPPNWPRPTGSPQVFNHVPVPQEPFRSTITTTKKSDSLCKLYEMDDNPERRGWLDKLRSFMEERRTPITACPTISKQPLDLYRLYIYVKERGGFVEVCKVTKSKTWKDIAGLLGIGASSSAAYTLRKHYTKNLLTFECHFDRGDIDPLPIIQQVEAGSKKKTAKAASVPSPGSSNSQDSFPAPPGSAPNAAIDGYPGYPGGSPYPGASGPQPDXXAAGQXQRPPSQNNPQTPHPGAAAAVAAGDNISVSNPFEDPIAAGGPGSSSGAGPGPGPGGAGPGGAGAVAAVGGGGPQPHPPPPHSPAASQQQQQHPQHPXXXGLSGPPPPQQQQQQPGQQPPLPLPAVGGGPPPAPQQHGPGQVQVPPSPQQHVRPAAGAPYPPGGSGYPTPVSRTPGSPYPSQPGAYGQYGSSDQYNATGPPGQPFGQGPGQYPPQNRNMYPPYGPEGEAPPTGANQYGPYGNRPYSQPPTGGPQPPAQTVAGGPPASGAPGAPPSSAYPSGRPTQQDYYQPPPDQSPQPRRHPDFIKDSQPYPGYNARPQIYGGTQQYRPQYPTSPAPQSWGSAPPRGAAPPPGAPHGPPLQQPPGVGQWDQHRYPPQQGPPPPPXXQQQPQQQQQQPPYQQVAGPPGQQPPQAPPQWAQMNAGQAAQPGIAPPGSPLRPPSGPGQQQRMPGMPPQQQQSQQQGGVQQPPPQQATHGGVPSPGPGGMVKPPYAMPPPPSQGVGQQVGQVPPSGMMVQKQPPMPGQVMQQQPLQQQPPPHQHPHPHQHPQHPPHPHPHQMPPSQTAPGGGYGPPGMPGGGGQLVKKELIFPHDSVESTTPVLYRRKRLTKADVCPVDPWRIFMAMRSGLLTECTWALDVLNVLLFDDSTVQFFGISNLPGLLTLLLEHFQKNLAEMFDERENEEQTSMLAEEGADDDADSGTVMCEKLRTSGRQSRCVRSISSYNRRRHYENMDRSGKGVASNGSDSEDADEGIDLGQVRVQPNPEERSLLLSFTPNYTMVTRKGVPVRIQAADHDIFVDERQKAWDIDTNRLYEQLEPVGSDAWTYGFTEPDPLDGIIDVFKSEIVNIPFARFVRSEKKGKTRTEVASTARKAEIKLEENSSEXXAFNKKRRLVSGGSSSSGAPAXXKKSKLTSEEFAQPNVDVKKEPGSADSDCRPVDMDIEAPQQRLTNGVAACPASTPAVFDPRTTAKDVAQVLQRRRDSSFEDECYTRDEASLHLVNESQDSLARRCIALSNIFRNLTFVPGNETVLAKSTRFLAVLGRLLLLNHEHLRRTPKTRNYDREEDTDFSDSCSSLQGEREWWWDYLITIRENMLVAMANIAGHLELSRYDELIARPLIDGLLHWAVCPSAHGQDPFPSCGPNTAXSPQRLALEALCKLCVTDANVDLVIATPPFSRLEKLCAVLTRHLCRNEDQVLREFSVNLLHYLAAADSAMARTVALQSPCISYLVAFIEQAEQTALGVANQHGINYLRENPDSMGTSLDMLRRAAGTLLHLAKHPDNRSLFMQQEQRLLGLVMSHILDQQVALIISRVLYQVSRGTGPIHSVDVSAGAAVAQPAAAPPPTNAGTTTAVA

Similar Transcription Factors

Sequence clustering based on sequence similarity using MMseqs2

100% Identity: iTF_00578310; iTF_00914283; iTF_00607597; iTF_00605359; iTF_00482768; iTF_00916977; iTF_00486358; iTF_00481336; iTF_00594331;
90% Identity: iTF_00536549; iTF_00581316; iTF_00547848; iTF_00578310; iTF_00607597;
80% Identity: -