Basic Information

Insect: Xylota sylvarum
Gene Symbol: osa_1
Assembly: GCA_905220385.1
Location: LR999958.1:112508074-112530142[-]

Transcription Factor Domain

TF Family: ARID
Domain: ARID domain
PFAM: PF01388
TF Group: Helix-turn-helix
Description: This domain is know as ARID for AT-Rich Interaction Domain [2], and also known as the BRIGHT domain [1].
Hmmscan Out: # of c-Evalue i-Evalue score bias hmm coord from hmm coord to ali coord from ali coord to env coord from env coord to acc

1 1 1.7e-25 5.7e-22 78.5 0.0 3 89 504 587 502 587 0.94

#	of	c-Evalue	i-Evalue	score	bias	hmm coord from	hmm coord to	ali coord from	ali coord to	env coord from	env coord to	acc
1	1	1.7e-25	5.7e-22	78.5	0.0	3	89	504	587	502	587	0.94

Sequence Information

Coding Sequence: ATGACAACGCTAACTGGAAAGGAACTAATTGGTCAAAATAGCAACGATAGTTCAAGTGGTGGAGGCGTAAGTGGCATGGGCTCTGGTCCGCCTGGTACACCAAATCCTCAACAAGTGATGCGACCTACCCCATCGCCAACTGGTTCATCAGGCTCAAGATCAATGTCCCCTGCTGTGGcacaaaATCTCCCGATATCAAGACCATCGAGTAATCAATCTCAATCGGGCCAACAAATGCCACCAACAACAGCGAGTCACATGTCACATAGTAGTAGTGCTTCAATTGCCGCCGCACAACAGCAATCTCAGCCACCAGGGCAGCCTCCAATTTCGTCGGCTGGTAGTtcgcaacaacagcaacagcagcagcaatcaCCCGCGTCGCAACAGCAACAAACGCCGCCAAATCAATCTGTGAACAATATGCCAACACAAGGTAGCTATCAAACACAACCGCCACCAATTTCTCATATGCATGGTTACAAGATGGGACCCGGTGCGGGGCAAAGCCCTGGACCAGGTCCACAGAATATGCCTCCATATCCACCACCGCCACAGTCGCAACAATATTCCCAAgGAAACTACCCGCCTCGTCCACAATATCCAAGCAGCTATGCACCAACACCACCCACAAATCAACCGTCATCTGCCAACAGTATGCCACCTGGTCCAAATCAATATCCAGGCCGACCTTTGCCCAATCATAGTGGCACTCCGCACACGCAATTCCCGCCATATCAGCAGAATTGGGTACCACCATCCCCGCAGGGTCATGCCGGGATGATGGGCAATCATGTGCAAGGCAAAggtacaccaccaccacctccacagGCGAATGTTGTTGGCTCTCCGCGACCTCTCAACTACCTGAAGCAGCACTTACAGCACAAGAGCAGCTACGTGGGAGGTTCTAGTCCAACACCGCCACAAGGCTACGGCAATGGGCCGGCGGGTATGCATTTACCAATGGGTCCACCACATCATATGGGCCCGCCACACGGTCCAACGAATATGGGACCACCAACATCGGGACCCCAACAAGGTGGTCCACCATCGGCACAAGTTCCCGCAGATGTTGGCTCGACACCGGATCATGGTGTTATTTCACAAGACAATGGTATCACTTCGTCGGGCTCATCGGCGGCCAGTACTCATCCTGTGACTTCCGTTGTGACGACGGGACCCGACGGTGCACCTCTTGATGAAGCCAGTCAACAGAGTACTCTATCAAATGCTTCAGCAGCATCTGGTGAAGATCCACAATGTACAACGCCGAAATCACGGAAGAATGATCCATACAGCCAAAGTCATTTAGCGCCACCGAGCACATCGCCCGGTGGACATCCTCATAATGAGGATTTCGAAATGAACTCACCACCAAATTGGTCACGAACACCAGCTAGTCCGcagGTTTTCAATAGCCACGGTCCTCAAGAATCCTACCGGACCTCAACGAAGAAATCCGATAGTTTATGCAAACTCTACGACATGGATGACAATCCCGATCGTCGAGGTTGGCTAGACAAACTGCTCAGTTTCATGGAGGAACGACGAACACCAATTACCGCGTGTCCAACCATTTCAAAGCAGCCCTTAGATTTATATAggttatatatttatgtaaaagAACGAGGAGGATTCGTCGAGGTTACCAAAAGTAAAACATGGAAAGATATTGCTGGACTACTGGGAATCGGTGCGAGTAGTAGCGCAGCATATACCCTGCGAAAACACTACACCAAAAACCTCTTAGCCTTCGAGTGTCATTTCGATCGCGGTGATGTTGATCCATTGCCAATAATACAACAAGTGGAGGCTGGATCAAAGAAGAAATCAGCTAAAGCAGCATCGATACCATCACCAGCTGGCTCATCGAATTCCCAGGATTCGTTCCCGGCACCAGTGGCGGCGAACACATCTATCGATGGCTATCCGGGTTATCCGAGCGGTTATCCGGCTGGAGCGCAACCCGACTATAATGCAGGTGCTCAAATCCAAAGGCCACCGTCACAAACTAACGCACAAACCCCGCATGCAGGAAATACTCAAGCAACAGCTGGTGATAATATTAGTGTCAGCAATCCTTTTGATGACCCGGTAGGTGCACCGCCTCGTGCCCCTTATCAACAGGGTAGTACATATCCTCCGGTGTCTAGATCGCAAGGTTCCCCATATCCAGGCCAACCAGGCTATAACCAGTACGGGTCCAGTGATCAATATAATTCATCAGGACCGCCTGGTCAGTTTACTCAAAGTCAAGGCCAGTTTCCACCGCAAAATCGTACCATGTATCCTCCCTATGGACCGGAGGGAGAAGCtCCCCCGCCGGCAACGAATACTTACGGTCCATATGGTAGCCGGCCCTATACTCAACCGCCACCAGGAGCTACCCAAACGACGGCACCGCCTGGTGGTAGTGCGACAGTACCCACTGGTCCACCAACGGGAGCTGGAGCGACTCCAAGCACATATCCTCCTGCGGCTCCACAACAGCCTGACTATTATCGGCCACCGGAACAGAGTCCGCAGCCAAGGAGGCATCCAGATTTTGTCAAAGATTCTCAAGGTTATGCTGGTTACAATCAGAGACCGCAAATGTATGgtggATGGCAAGGTGGAGCCGGTCAATATCGTGGTCAATATCCATCTTCACCGACGCCGCAGGCATGGTGCAATCCTCCACGAACATCTGGACCACCACCGCCGCCCAATCAACAGGCAGCGGCGCAGTGGGATCAACATCGTTACCACCCTCCACAGTCACAGCCTCCGTATCCAGGTAATCAACAGCAACCGTGGACAAATATGAGTTCGCCACAGCAAAATCCAGGTTCACCATTACGTCCACCGCCACAACGAATGCCAAGTGGTGCAGTTGTTGGACCATCTGGCGTTGCCAGTAGTGGAGGCAAGCCACCATTCAGTATGCCACCACCACAGCCTAGCGCAAGTAGTGGAGTTCCACCACCTGGTCCACCCGGTTCGGTAGGCCCTCCACCAGGAGTAGCCGTCAGCGGTGGTCCATCGGTGTTACCAGGAGCGAATGTGATGCCAGGTGGCAGTAAAGCGacaccaccgccaccacaaCCGGGTCCATTCCCGCCCACAGCCCAAATGCAAAAGAAAGACATTGTGTTCCCTCCGGATAGCGTAGAGTCCACCACACCAGTACTATACCGACGAAAGCGTTTGGCTAAAAGTGATGTCTGTCCCATCGATCCATGGCGGATATTCATGTCGCTACGCTCTGGTTTACTTTCCGAGAGCACATGGGCACTGGACATACTCAACATTCTGCTGTATGATGATTCCACGGTCCAGTACTTTGGCCTAGCACATTTGCCCGGTCTGCTGAGCCTACTTTTGGagcatttccaaaagaacctCGCCGAAATGTTTGACAACGAGAATACCGCCTGCGTTACAAGCATTAGCAGTCACAGTAAGGCACGGCATTATGAGAATAACGCCGATGAAGATTGCAACTACACCGTTGACTTGGGTCAACTGATGGCGCCCACTAATCCCGAAGAAAAGGTGCTGTTACTTTCGAACACACCCAACTACACGATGGTGTCGCGCAAGAACATGCCAGTGCGAATACAAAACGCCGAAGATGATATTTTCGTGTCAGAGCAGCTCAAGCCGTGGGACTATGATTCGAACAGGAACTACCAGCTGACGGTGCCAATTGGTAGTGATGCCTGGACGTACGGTCACATCGAACGTGATCCGCATGACAGCGTTATTGATGTATTTAAGTCTGAGATCATTGACATTCCATTTGCTCGATACATTGGCGGCGGCAGTGGCGCACGAAGTGGCGGCAATAGTAGTAGAAAAGACAAAAGTGGCAGACTGGCGGATGATCGTCTTGAACCCGAAGATGATGACGGCGCAGACGATGACGAagagagcagcagcagcaaggtGTTGGCATTCAACAAGAAACGGAGACACATCAGTATGTCGAGTACAACAAGCAGCAATAATAACAAGAATGGATTGAGTAGCCTAGGTCGGGCTAAGAAATCGAAATTGAATTTCCTCGAAGGAGCAATAGGCAGTGGAGTAGGTGCTCTAGTGGCCACCAAGACCGAAATAAAGAAGGAAGAGCCCGACGAATTGATCTCTGAACAGAGCAGTGATAGTCTAACCAAACCAAAGGATAGCCTTCTGCTGGACAGCGATTGTCGTGAAGTGGACATGGATATTGAACATCCACGTGTGTTACCCAATGGTGGTGCGCCATCGAAACGATCGAATTTCGATCCTAAATCAAGCGTCCGTGATCCAGCACAGGTGCTGCAACGTCGCCGCATGAGTGGCTACGAAGACGAGTGCTATACACGCGATGAAGCCAGTCTTTATCTGGTGAATGAGAGTCAGGATTCGCTGGCTCGTCGTTGCATCTGCCTCTCGAACATATTCCGCAATTTGACCTTTGTTCCTGGCAATGAGACAATTCTTGCAAAATCTTCGAAATTCCTCGCTCTTCTCGGCAAGTTGCTACTGCTTAACCATGAACACCTATTGAGGACACCAAAAACCCGCAACTACGATCGAGAGGAGGATACCGATTTTTCGGATTCATGCAGTTCCCTGCATGGCGAGAAGGAGTGGTGGTGGGATTATCTGATTACAATCCGCGAGAATATGCTAGTAGCTGTCGCCAATATTGCTGGCCATTTGGAGTTGTCACGTTACGAAGAGATTATCACGAGGCCCGTACTCGATGGATTATTGCATTGGGCTGTTTGCCCCTCGGCACACGGTCAGGATCCGTTCCCATCGTGTGGTCCAAACTCGGCGCTATCGCCTCAGCGACTGGCATTGGAGGCTCTCTGCAAGCTGTGTGTGACTGATGCGAATGTTGATCTAGTGATTGCCACTCCCCCACATTCGCGGCTAGAAAAACTGTGCGCGGTACTCACACGTCATCTGTGCCGTAACGAGGATCAAGTTCTGCGTGAGTTCTCCGTAAATTTGCTGCATTACCTCGCCGCTGCCGATAGTGCTATGGCACGCACTGTTGCCCTGCAATCGCCATGCATTTCCTACCTGGTGGCATTTATCGAGCAGGCCGAACAAACCGCCCTGGGTGTAGCTAACCAACATGGCATCAATTACCTGCGCGAGAATCCCGATTCAATGGGAACCAGCCTAGATATGTTGCGACGGGCCGCTGGTACTTTGCTTCATCTCTCACGCCATCCCGACAATCGGTCGTTATTCATGCAACAGGAACAGCGTTTGCTGGGTCTCGTCATGAGCCATATACTGGATCAGCAGGTGGCTTTGATCATATCGCGGGTATTGTTCCAAGTCTCCCGTGGCCCTGGTCCCATGCCATCAATGGAATATCGTCTCCAGCAGCGCcaacagcatcaacagcaacaacaggaaAACCAAAAGACTGGCGAGGCTAGAAAGTTgatgcaacaacaacagcaacaacaacagcagcagcagcagcagccaccAGCGATAGTCGTAGACGAAGTTGGTGCCAGCAGCGGCAGCGGAATTGGTGATTCAAGTACAaatgcaacagcagcagcaaactTCTCATCATCCAATGTTCATAGTAGTAATagtaacagcagcagcagtagcagtagtaaTAGTAGCCTAACATGTAACAAATCCGAAGAAATACTAGTACCACCATCGGCAACACTAAACGATAttagcaacagcagcaacagcagttgTGGCAGCAGTAACAGTAGCAACATCACTGCCCCAATTGGTGTTGCTGTTGCCTCATCTATCGCGtcgccatcgtcatcatcaactGCCTCCTCATCGGCTGGAGCTACCGCAGCAACGACACCAGCCACAACAGCGCCCAACAGCATTGAGAATCTAACAACAACCGGTGCCGGTGCTGGTGCCGGCGGctccaataataataaaaatagtaatattagtacaacaacagcaacaataacaggaaatagtagtagtagtaataataataacagtaGCAACAATAGTAGTAATAGTAACAATAGTAATATAACAGCGACAACTACAACTACAGCAGCTGTTGCGTAG
Protein Sequence: MTTLTGKELIGQNSNDSSSGGGVSGMGSGPPGTPNPQQVMRPTPSPTGSSGSRSMSPAVAQNLPISRPSSNQSQSGQQMPPTTASHMSHSSSASIAAAQQQSQPPGQPPISSAGSSQQQQQQQQSPASQQQQTPPNQSVNNMPTQGSYQTQPPPISHMHGYKMGPGAGQSPGPGPQNMPPYPPPPQSQQYSQGNYPPRPQYPSSYAPTPPTNQPSSANSMPPGPNQYPGRPLPNHSGTPHTQFPPYQQNWVPPSPQGHAGMMGNHVQGKGTPPPPPQANVVGSPRPLNYLKQHLQHKSSYVGGSSPTPPQGYGNGPAGMHLPMGPPHHMGPPHGPTNMGPPTSGPQQGGPPSAQVPADVGSTPDHGVISQDNGITSSGSSAASTHPVTSVVTTGPDGAPLDEASQQSTLSNASAASGEDPQCTTPKSRKNDPYSQSHLAPPSTSPGGHPHNEDFEMNSPPNWSRTPASPQVFNSHGPQESYRTSTKKSDSLCKLYDMDDNPDRRGWLDKLLSFMEERRTPITACPTISKQPLDLYRLYIYVKERGGFVEVTKSKTWKDIAGLLGIGASSSAAYTLRKHYTKNLLAFECHFDRGDVDPLPIIQQVEAGSKKKSAKAASIPSPAGSSNSQDSFPAPVAANTSIDGYPGYPSGYPAGAQPDYNAGAQIQRPPSQTNAQTPHAGNTQATAGDNISVSNPFDDPVGAPPRAPYQQGSTYPPVSRSQGSPYPGQPGYNQYGSSDQYNSSGPPGQFTQSQGQFPPQNRTMYPPYGPEGEAPPPATNTYGPYGSRPYTQPPPGATQTTAPPGGSATVPTGPPTGAGATPSTYPPAAPQQPDYYRPPEQSPQPRRHPDFVKDSQGYAGYNQRPQMYGGWQGGAGQYRGQYPSSPTPQAWCNPPRTSGPPPPPNQQAAAQWDQHRYHPPQSQPPYPGNQQQPWTNMSSPQQNPGSPLRPPPQRMPSGAVVGPSGVASSGGKPPFSMPPPQPSASSGVPPPGPPGSVGPPPGVAVSGGPSVLPGANVMPGGSKATPPPPQPGPFPPTAQMQKKDIVFPPDSVESTTPVLYRRKRLAKSDVCPIDPWRIFMSLRSGLLSESTWALDILNILLYDDSTVQYFGLAHLPGLLSLLLEHFQKNLAEMFDNENTACVTSISSHSKARHYENNADEDCNYTVDLGQLMAPTNPEEKVLLLSNTPNYTMVSRKNMPVRIQNAEDDIFVSEQLKPWDYDSNRNYQLTVPIGSDAWTYGHIERDPHDSVIDVFKSEIIDIPFARYIGGGSGARSGGNSSRKDKSGRLADDRLEPEDDDGADDDEESSSSKVLAFNKKRRHISMSSTTSSNNNKNGLSSLGRAKKSKLNFLEGAIGSGVGALVATKTEIKKEEPDELISEQSSDSLTKPKDSLLLDSDCREVDMDIEHPRVLPNGGAPSKRSNFDPKSSVRDPAQVLQRRRMSGYEDECYTRDEASLYLVNESQDSLARRCICLSNIFRNLTFVPGNETILAKSSKFLALLGKLLLLNHEHLLRTPKTRNYDREEDTDFSDSCSSLHGEKEWWWDYLITIRENMLVAVANIAGHLELSRYEEIITRPVLDGLLHWAVCPSAHGQDPFPSCGPNSALSPQRLALEALCKLCVTDANVDLVIATPPHSRLEKLCAVLTRHLCRNEDQVLREFSVNLLHYLAAADSAMARTVALQSPCISYLVAFIEQAEQTALGVANQHGINYLRENPDSMGTSLDMLRRAAGTLLHLSRHPDNRSLFMQQEQRLLGLVMSHILDQQVALIISRVLFQVSRGPGPMPSMEYRLQQRQQHQQQQQENQKTGEARKLMQQQQQQQQQQQQQPPAIVVDEVGASSGSGIGDSSTNATAAANFSSSNVHSSNSNSSSSSSSNSSLTCNKSEEILVPPSATLNDISNSSNSSCGSSNSSNITAPIGVAVASSIASPSSSSTASSSAGATAATTPATTAPNSIENLTTTGAGAGAGGSNNNKNSNISTTTATITGNSSSSNNNNSSNNSSNSNNSNITATTTTTAAVA*

Similar Transcription Factors

Sequence clustering based on sequence similarity using MMseqs2

100% Identity: iTF_00314049; iTF_00672641; iTF_01116228; iTF_00724549; iTF_00315719; iTF_00310792; iTF_00984010; iTF_01253324; iTF_00240444; iTF_00313229; iTF_00314929; iTF_01520753; iTF_00312370; iTF_00310003; iTF_01300595; iTF_00991540; iTF_00688386; iTF_01002548; iTF_01318009; iTF_01541211; iTF_01395615; iTF_00311584;
90% Identity: iTF_00314049; iTF_01116228; iTF_00724549; iTF_01253324; iTF_00313229; iTF_00312370; iTF_00310792; iTF_00315719; iTF_00314929; iTF_01520753; iTF_00310003; iTF_00389402; iTF_01541211; iTF_00240444; iTF_00311584;
80% Identity: -