Basic Information

Insect: Iphiclides podalirius
Gene Symbol: osa_1
Assembly: GCA_933534255.1
Location: OW152833.1:4186160-4203843[-]

Transcription Factor Domain

TF Family: ARID
Domain: ARID domain
PFAM: PF01388
TF Group: Helix-turn-helix
Description: This domain is know as ARID for AT-Rich Interaction Domain [2], and also known as the BRIGHT domain [1].
Hmmscan Out: # of c-Evalue i-Evalue score bias hmm coord from hmm coord to ali coord from ali coord to env coord from env coord to acc

1 1 1e-25 2.7e-22 79.2 0.0 2 89 340 424 339 424 0.94

#	of	c-Evalue	i-Evalue	score	bias	hmm coord from	hmm coord to	ali coord from	ali coord to	env coord from	env coord to	acc
1	1	1e-25	2.7e-22	79.2	0.0	2	89	340	424	339	424	0.94

Sequence Information

Coding Sequence: ATGCGTCGCCCGCGTGCGTCGCGGGCGAACACACTTATACCTACCTACACGGATGCGGTAAAGTGCAGCGGGGATTCGCGAGTGCCGTACGGCGGCGGGGCGAAAGCGAAAGTGATCCGGGTGCCCTCTCCTCCACTCTCCCGCCCCCGGCTGATGCGATGCACGCGGCCCGGCTTAGGCGCTCCCTCGTTAACTGCGTTATTCAAATTGGTGCACGCCGCCTCTGTGTGTGCAAAATGTGATCGATCACACACACACGCACACAAACACACGTCCGTGCCACGTTCTGCCGTTTACACTCTGGAGCGCAGTTTAATTCAAGCTCGCTGCGCGCTTGTAACACGCACCCAGAACGTTCCGATGCCGCCGCGGCCGTCGTCCTCGCTGTCGGACGGCGGTGGGCCTGCGGTGAGGGGCGTCGGCCCCGCCGGGCCCGGAGCGCCCGGCGCGATGGTGGCGCAGCCCTACCACCACGCGTACAAGGCGGCCCACTACCCGCCGCAGCCCTACGGCTACCCGCCGAGGAACCACCACCCGTACCCGTACGCGGGCTACAGGCCCGCGCCCCCGCCCCATCCGCCCCAGCACTATCCACCGCTCAAGGGCGCGCGGCACATGGGCCCGCCGGGCGAGGCGATGCCGCCGCCGGTGGCGCCGGGCGAGCAAGACAACAACGGCCCCGCTGCGCCCgccaccgcgctcgtcaccaccggccccgacggggcgcccctcgacgagggcagccagcagagcacgctcagcaacgcctccgcagCATCGGGGGAGGAGCAGTGCGGCTCGAAGGGTCGCAAGGAGGTGGGCGCCGGCAGCGCTGCCCCTTCGCCGTCGCCCGGCGGCGGCTCCCACTCGTCGATGCACGACGACTACGACGCGCCGGCCGCCTGGCCAAGGCCCCCCTCCAGCCCCGTGTTTAACAGTCACATACCGCCGGAGTCCTACAGATCAAAGaagtcggactcgctgggcaagctgtacgagatggacgacgcgcccgagaggcggggctgggtggagaggctgctcgcgttcatggaggagaggcgcaccccgatcgccgcctgccccaccatctccaagcagccgctcgacctctaccgcctctacctgctggtgcgcgaccgcggcggcttcgtcgaggtgacgaagaacaagacgtggaaggacatagcgggcctgctgggcatcggcgcctcgtcctcggccgcgtacacgctgcgcaagcactacacgaagaacctgctcgcctacgagtgccacttcgaccgcggcggaatcgacccccagcccatcatcaaccaggtcgaggcgtccaccaagaagaagggcggcAAGTCCAACAACACCGCCAGCGCCGGGTCGTCCAACTCGCAGGAGTCGTTCCCGGGCGGCGGCACGCCGGCCGCCGGCGGCGCCATGGACGGCTACGGCGCGCAGTACGCCGGCTACCCGCCGCCCTCCAGCCAGCCGCAGGGCGGCGGGCCTGGCGGCGACAACCTCGCCGCCTCCAACCCCTTCGACGAGCCGCCGGGGCCGCGCAGACCCCCAGGTTACCAACAAGGTTACGGGTACGAATATGGATCTCCATACCCATCAAATAGGCCTGTTTATCCTCCGTATGGGCCCGAGGGTGACAGGGCGTACGGCACCGGCGAGTACCGGTACGGCGGCTACGCGGGCGGGTACCGCGCGGGCGCCCCGCCGCCGGCCGGCACCCCGCCGCCCGCGCAGCCCTACCCGGACTACTACCGGCCGCAGCCGGCGCCGCACGCGCTGCCGCAGCACCCGCCCCACCCGCAGCACCCGCCCCACCCGCAGCACCCGCAGCACCCGCCGCACGCGCAGCACCCGCCGCACGCGCAGCACTCGCCGCACGCGCAGCAGCAGCCGCCCATCGAGATGTCGGGCGGTGCGCAGCAGTCGGTCGGTAACCTAATGAGCTCGCAGCTCGCGCGGCAGCTGGTGGCGCCGCTGCCGCCCAGCGCGCGCCCCTACTACGGCGGCGGCAAGGGGGGGGGCGCGGGCGGCGCGGGGGCGGGCGCGGGCGCGGCGGCGGCGGCGGGCGGCGCGGCGGGCGGCGGGCCGGCGGGCGCGCCGCGGCGCCACCCCGACTTCGCCAAGGGCGAGCCGTTCGCCGCGGGCGGCGCCCGCTTCCCGGCCGCGTGGGGCGGCGGCTTCGCGCGCTCGCCGGCGCCGCAGCCCGCCTGGCGGCCGCCGATGCCCGCCGCGCAGCCGCCGCCCTGGCCGCACCAGCCCTACCAGCCGCAGACGCCGGGCGGGCCGGCGTGGGGCGCGCCGAGGCCACCGCTGGAGCTGCCACCCGCCGCGCCGTCGCCCGGTTCGGTTCCGGGCGTAGGTGCTGGGCAGATCAAACGAGAGTTAACTTTCCCTCCCGAATGTGTGGAGGCGACAGTGCCGACCGGTGAAAAACGGCGGCGGCTTACCAAAGCCGATGTCGCACCCGTGGACGCGTGGCGCATCATGATGGCTCTTAAGTCTGGATTACTCGCGGAAACGTGTTGGGCCCTCGACATCCTGAACATTTTGCTCTTCGACGACAACTGTATAGGTTACTTCGGACTGCAGCACATGCCCGGTCTCCTGGATCTGCTGCTGGAACACTTCCATAGGAGTTTAAGCGACGTATTCGACGCGCCGATACCCGAGAACGAGCCGTGGTACGCGACGCCCACCGCGCCCGAACCTCCCGCCAAGGTGCGCCGAAGAGTGGAGCCGCCCGACCCCGGCGACGGCGTGCGTCTGCTCTCCGGCGAGAACTACACCTTCCAGTCGAGGAGGCGGCACCCGGTCGTGTACAAGAGCGACGACGACCTCTTCGCGCCCGACGACTGCGAGTCGGACGGCGAGCGCGTGGAGGACGTGCTCGAGCCGTGGCAGTTCGGCGGCGACTCGGCGGGCGCCGCGCACGTGGTGCCCTGCTTCCGCGGCGAGTTCCTGCCGCTGCCCTTCGTGCGCCTGCTGCCCGGCGAGCGGCCGCCGTCGCCGGCGCGCGCCTCGCCGCGCCCGCGCCCCGCGCCCGACGCGGCCGCGCCGCGCTCGCCCGACGCCGCCTCGCCGCCGCCGCCCGGCGCCGCCGGCGACGCCGACAACCTGGAGGCCGAGCCCATGGAGCTGGAGCCCGAGCGGCGGCCCGCGCTGCTCGTGCGCGACCCCGCCGGCgtgctcaagcggcggcgcctcgaggactacgaggacgagtgctacacgcgggacgaacccagtttgaaccttgtgaacgaaacgcgggacgcgctcgcgaaacggtgcatcgcgctctcgaatatcctgcgcggcctcacgttcgtgcccggcaacgaggcggagttctcccggtcgagcgcgttcctggcgctggcgggcaagctgctgctgctgcaccacgagcacgcgccgcgggcggcgagggcgcgcgcctacgagcgggcggcgcgcgacgaggccgacgtggaggcgtgctgctccagcctgcgcggcgagggcgagtggtggtgggacacgctggcgcagctgcgcgaggacgcgctcgtgtgctgcgccaacatcgcgggcagcgtggagctggcggggcagccggaggcggtggcgcggccgctgctggacgggctgctgcaCTGGAGCGTGTGCCCGGCGGCGGTGGCGGGCGACGCGCCGCCGGCGGCCGCCGCGGGCTCGCCGCTGTCGCCGCGCCGGCTCGCGCTCGAGGCGCTGTGCAAGCTGTGCGTGACGGACGCCAACGTGGACCTGGTGTTGGCGACGCCGCCGCGCGGGCGCGTGGCGCAGCTGTGCGCGGGTCTGGCGCGCGACCTGTGCCGGCCCGAGCGGCCGGTGGTGCGCGAGTTCGCCGTCAACATCCTGCACTACCTGGCGGGCGCGGGCGGCGCGGCGGCGCGCGAGGTGGCGCTGCACGCGCCCGCCGTGGCGCAGCTGGTGGCCTTCATCGAGCGCGCCGAGCACGCGGCGCTGGGCGTGGCCAACCAGCACGGCGTGGCGGCGCTGCGCGACAACCCCGACGCCATGGGCACCTCGCTCGACATGCTGCGCCGCGCGGCCGCCACGCTGCTGCGGCTGGCCGAGCACCCGGAGAACCGGCCGCTCATCCGTCGCCACGAGCGGCGCCTGCTCTCGCTCGTCATGAGCCAGATCCTCGACCAGAAGGTGGCCCACGAGCTGGCCGACGTGCTGTACCACTGCAGCCAGCGCAGCGACCTCGAGCCGCACCACGAACACTAG
Protein Sequence: MRRPRASRANTLIPTYTDAVKCSGDSRVPYGGGAKAKVIRVPSPPLSRPRLMRCTRPGLGAPSLTALFKLVHAASVCAKCDRSHTHAHKHTSVPRSAVYTLERSLIQARCALVTRTQNVPMPPRPSSSLSDGGGPAVRGVGPAGPGAPGAMVAQPYHHAYKAAHYPPQPYGYPPRNHHPYPYAGYRPAPPPHPPQHYPPLKGARHMGPPGEAMPPPVAPGEQDNNGPAAPATALVTTGPDGAPLDEGSQQSTLSNASAASGEEQCGSKGRKEVGAGSAAPSPSPGGGSHSSMHDDYDAPAAWPRPPSSPVFNSHIPPESYRSKKSDSLGKLYEMDDAPERRGWVERLLAFMEERRTPIAACPTISKQPLDLYRLYLLVRDRGGFVEVTKNKTWKDIAGLLGIGASSSAAYTLRKHYTKNLLAYECHFDRGGIDPQPIINQVEASTKKKGGKSNNTASAGSSNSQESFPGGGTPAAGGAMDGYGAQYAGYPPPSSQPQGGGPGGDNLAASNPFDEPPGPRRPPGYQQGYGYEYGSPYPSNRPVYPPYGPEGDRAYGTGEYRYGGYAGGYRAGAPPPAGTPPPAQPYPDYYRPQPAPHALPQHPPHPQHPPHPQHPQHPPHAQHPPHAQHSPHAQQQPPIEMSGGAQQSVGNLMSSQLARQLVAPLPPSARPYYGGGKGGGAGGAGAGAGAAAAAGGAAGGGPAGAPRRHPDFAKGEPFAAGGARFPAAWGGGFARSPAPQPAWRPPMPAAQPPPWPHQPYQPQTPGGPAWGAPRPPLELPPAAPSPGSVPGVGAGQIKRELTFPPECVEATVPTGEKRRRLTKADVAPVDAWRIMMALKSGLLAETCWALDILNILLFDDNCIGYFGLQHMPGLLDLLLEHFHRSLSDVFDAPIPENEPWYATPTAPEPPAKVRRRVEPPDPGDGVRLLSGENYTFQSRRRHPVVYKSDDDLFAPDDCESDGERVEDVLEPWQFGGDSAGAAHVVPCFRGEFLPLPFVRLLPGERPPSPARASPRPRPAPDAAAPRSPDAASPPPPGAAGDADNLEAEPMELEPERRPALLVRDPAGVLKRRRLEDYEDECYTRDEPSLNLVNETRDALAKRCIALSNILRGLTFVPGNEAEFSRSSAFLALAGKLLLLHHEHAPRAARARAYERAARDEADVEACCSSLRGEGEWWWDTLAQLREDALVCCANIAGSVELAGQPEAVARPLLDGLLHWSVCPAAVAGDAPPAAAAGSPLSPRRLALEALCKLCVTDANVDLVLATPPRGRVAQLCAGLARDLCRPERPVVREFAVNILHYLAGAGGAAAREVALHAPAVAQLVAFIERAEHAALGVANQHGVAALRDNPDAMGTSLDMLRRAAATLLRLAEHPENRPLIRRHERRLLSLVMSQILDQKVAHELADVLYHCSQRSDLEPHHEH

Similar Transcription Factors

Sequence clustering based on sequence similarity using MMseqs2

100% Identity: iTF_01158497; iTF_00197155; iTF_01148614; iTF_01115495; iTF_01495564; iTF_01494842; iTF_00249496; iTF_01359496; iTF_00957742; iTF_00194961; iTF_01140722; iTF_01496342; iTF_01494100; iTF_01141433; iTF_01149356; iTF_00204154; iTF_00855676; iTF_01402526;
90% Identity: iTF_00204154;
80% Identity: -