Basic Information

Insect: Idaea aversata
Gene Symbol: -
Assembly: GCA_907269075.1
Location: OU026094.1:116646-134370[-]

Transcription Factor Domain

TF Family: TF_bZIP
Domain: bZIP domain
PFAM: AnimalTFDB
TF Group: Basic Domians group
Description: bZIP proteins are homo- or heterodimers that contain highly basic DNA binding regions adjacent to regions of α-helix that fold together as coiled coils
Hmmscan Out: # of c-Evalue i-Evalue score bias hmm coord from hmm coord to ali coord from ali coord to env coord from env coord to acc

1 5 0.00047 0.56 10.9 1.2 32 63 312 343 306 345 0.92

2 5 0.00047 0.56 10.9 1.2 32 63 539 570 533 572 0.92

3 5 0.00011 0.13 12.8 1.6 32 62 966 996 957 998 0.91

4 5 0.66 8e+02 0.8 0.6 18 31 1147 1160 1146 1165 0.90

5 5 0.0039 4.7 7.9 0.4 32 61 1622 1651 1616 1655 0.89

#	of	c-Evalue	i-Evalue	score	bias	hmm coord from	hmm coord to	ali coord from	ali coord to	env coord from	env coord to	acc
1	5	0.00047	0.56	10.9	1.2	32	63	312	343	306	345	0.92
2	5	0.00047	0.56	10.9	1.2	32	63	539	570	533	572	0.92
3	5	0.00011	0.13	12.8	1.6	32	62	966	996	957	998	0.91
4	5	0.66	8e+02	0.8	0.6	18	31	1147	1160	1146	1165	0.90
5	5	0.0039	4.7	7.9	0.4	32	61	1622	1651	1616	1655	0.89

Sequence Information

Coding Sequence: ATGGATGCGAATGCAATTGAAAGTATTCTCCGGGCGGGTCCCTCCTCAGGAGGGGAATCCCGTCACGCTTCGGCGTGCTGCCCCATTGTATACGGAGGGGGCAACAATTGCGGTAGTAGTCTGGGTGGTGAAGAAGAATGGGAGATGGCTCAGGAGGAGAGCGTAGGTCCCAGTGGACGAGAAAATGGGACATCAAACGTGGAGCAAGCACCTCCAAATTGTAGGGAAGGCCAGAAGGTAGAGGCAGTGCCAAAGGAGAGGCGGATGACGCGTAGTGCTACCATTCGGAATCGGTCCGTATCGGCTCGGCTCGATGGTGAGGTAGGTCTGGAAAGGACAGCAAATATAGAGGAAATGGAAAAGCCTAAGAAGGCAGTAGGGAAAGCAAAGAGATTGCCTCTTGAAAGAGAGAGAAGTAGTAGTCGATACAGGGAGCCGAGCCCCACGTCCGATTTGGACAGTAACACTGTGGCTACGGCACCATCAGAGTTGTCGGCAGAAAACAAAAAGGCGGAGAAGCGACCACGACCATCAAGTGACGGCGAAGAAAGTGGACAGACCCCTTCCAAGGCAAAACCTGTTGCCAAAGGAAAAGGTAATCCACCTACCACAGGTGACCGCACGGGCCTCGAAAAGGCTCAGAAGTGCTTGCAGGAGCTGCAACAGGTAGTTGCTGAGAGCCAACCATCAGGCTCATCACAGCGGTCGAAGCCAAAGTCCTTTAAGAAGGACAAAATTGTCGTGGACCCGATAGGGGACACCGAAATACAGACGGCGGAGATGCTCAATAAGAAGGCAAGTGAAAGTGTCCAGGCCATCCTGGAGGTGGCGAAAAGGAGTGGTCATCTAAAAGGTGACTTTATTCGCCACCTCAAGACGGCATCACAAAACCTGCAGAGCATCTCGGAGGAGCTGCATCGGCGGACCCAGTCAGAGGAGGTTGCCAAACTCCAGATAGTTAATGCCAAACTGGAGAGGCAGGTCACTGACCTCCGCAGGGAATTTCAGGCGATGAAGGAGGTGTTCGAGGAGACTCGTCGTGAGAGATCGGACGAGCCCTCACACCCTTCCATGCCACCTGCTGCGACGGAGCAAAGCAGAGAGATGCTGCGGCGGCTTGTACGGAACCAACGACGGCTGCTCCGTTGCAAAACGCACCGCCAAAGAAGAAAAGGCAGAGAACGAAAAACGCCAAAAAAGGCGATTCTGGACCTGCTGTTCCTGCTCCTTCCGCTTCAGACCCCTTCCAAGGCAAAACCTGTTGCCAAAGGAAAAGGTAATCCACCTACCACAGGTGACCGCACGGGCCTCGAAAAGGCTCAGAAGTGCTTGCAGGAGCTGCAACAGGTAGTTGCTGAGAGCCAACCATCAGGCTCATCACAGCGGTCGAAGCCAAAGTCCTTTAAGAAGGACAAAATTGTCGTGGACCCGATAGGGGACACCGAAATACAGACGGCGGAGATGCTCAATAAGAAGGCAAGTGAAAGTGTCCAGGCCATCCTGGAGGTGGCGAAAAGGAGTGGTCATCTAAAAGGTGACTTTATTCGCCACCTCAAGACGGCATCACAAAACCTGCAGAGCATCTCGGAGGAGCTGCATCGGCGGACCCAGTCAGAGGAGGTTGCCAAACTCCAGATAGTTAATGCCAAACTGGAGAGGCAGGTCACTGACCTCCGCAGGGAATTTCAGGCGATGAAGGAGGTGTTCGAGGAGACTCGTCGTGAGAGATCGGACGAGCCCTCACACCCTTCCATGCCACCTGCTGCGACGGAGCAAAGCAGAGGTGACTTTGAAGAGCTCAGGCGTTCCCTACTCATTGACNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNGGGCAAGAGATGCTGCGGCGGCTTGTACGGAACCAACGACGGCTGCTCCGTTGCAAAACGCACCGCCAAAGAAGAAAAGGCAGAGAACGAAAAACGCCAAAAAAGGCGATTCTGGACCTGCTGTTCCTGCTCCTTCCGCTCCTGCTCGTCCGGCTGCCAATACCAAAGCGCCGACGTCGACTCGTTCTGAGTGGACTGCTGTCGGCAGGAACGGTAGTGCGGAGGAGAATAGAGGACATGGATGGGAAGAAGGAGAAGGCAGTGAGAGACGCTCAGACAGAAGCGAAGACAGAGATGAGTCTCGAAAGCTGAGAAATGGAAAGTGTACAGAAAGGAGTCCTAAGGGAGTGAGGGACAGAAGTCCATTAATTGAGGACAGAATAGGGAGTAGGAGTGACGAGGAGTTCAGGGCGAATAAAGAAGTTGATAAACTTCTCCTCAGTTCTTCCACATGGACGCCATTGGTCGCTGGGGTTAAACGGCCACAGGCCGAAGAATCGGACTCTGAAGAGGAAGTGACCCCAACGGTAAAAGTACCTAACGCAAAAAGAGGCAGAAGTATTAAGCTCAGCTACACTAGGGCTGACTTTTTAAAGAAACCAGTGGAAGTGCTTCAGCCTCAGCCTCAGCGGATTAGGGGGAAAGGTCGTCTCAGGACTGATCAGCAAAATGAGAGTCCACCACAAAGTGAGAATGAGTGCGATGAGGGTTCTGCTGGTTCGAGTCGACCCAAACCAGTGGAGTCTTCTTCAGAGGTACAGTCTACGGTAGAGAAGTCAGCGGCTCCTTCTCTGGAGGTAGTACGCTCCGAGACGGGTCACAAATCAGCTGTGGTTCTGCGGAAGAGAGCTTTAATGGGAGTGAGGAAGGTGGTCTCGGTAGCCAAATACTCTGGGCGTCTACAGGGCAAGTTCCGCCAAGACCTTTACAATGCAGCGACATGGGTGCAAGAGGCTATGGAGAAGCTGGGCACCACTAGCGTTAGCACGGAGACAGTCAAGCTCCAAGAAGACAACGAGCGTCTCCGAAAAGAACTCGTTGATATTCGGAAAGAGATGACGCAAGTGAAGGCTCAGATGAAACTGATGGGTGAAATCAGAGCTAGTTGGCGAAAAGAGGGTCCACCTGTTGATGCTATTGCAAGTGTTGACGCTGAATTCCCGGCAGTGGACATCGTAGGAGCGTCTGCTTGTAAACCCCCTCAGCCTATGGATATGGAGGTTTGGATGCAGTCCTTACTTAGGCAGGTAGGCGGAATCATTGACGCTAGGTTTGAGGGCATCAAGGAGAGGCTGCTGCCTGAGGAGCGTGTGCGCCCTCCATTAGCTGCTGACCGGCGGAAGACCCAAACAGTGCCAGTTCCTCGGGTCCCTCAGACCCGCGCAGTGTCTCAAGCCTCGGCCGATGCTTCAGAGGTCGCTATGGAGACCTCTCAAGTGACTGCGGAGACTTCCAAGGCCGCTGAAGAGGTTCCACAAGTCCCTATGGAGACCTCTCAGGTGGCTATTACAGTGGAGCCCAAAACAGGCAGAAGTAGAAATAAGAAGAAGAAGAAGAAGCAGTCACTGGCAGCTTGGGAGGCTGAAGTGCACACCGGCTCAGTTTCTCATTCGAGGGACGGCGAAGCAATTCAGCCACTACCTGGCACTTCCACTGGGACGCAACAACAGTGGAGTACAGTGGCTGCCAGAGGTGGAAAATCAAAGGCTCCGCCACCGGCAGCACCGAGGCCCGCAAAGCAGAAGCAGCCTGTTAAGATTGCCCTGCAGGCTCCAAAAACGGCTGCAGTCATTTTAACTATTCCACCAGGGGAGGTTGAAAAAGGGCAGACGTATGAGGCGTTTAGGGGCCTCCTCGCGAAAGCGAGGGATGGGGTGGTATGGGCCTTGCCTTCATTAGCCGGGCCTGGTGGAGAGACCACCTTAAAAAACCTGAAAGGGGGGTACCTGCCGCCCCTCCCCTGGGTTATCAATCTCAAGGCTTACCTAGTGCCGACCGGCTCCGGCCTAGGTGGACGTTTAAAACCGTGTTCTCGTGGGAACTATATGGAGACTGAAAACAAAAAATCTGACGATGTAGGAGGAGTTGATGAGACGGAAGGGCTGAGAAAGCCGGAGGTTGAAGGGCTGGAGAAGCCGGAGACTGATGTCACAAGAGTTGCAAAAGAGCAGCGGCTGCGCAGCCCAATTGTAAGGCTAACGCGGCTTGAAGATATGGCTGCTGAGAAGTCGGGGCACGGTGCGCACAATATCCGCGACCGATCGCCAATTATTGCGCGAACACTTGCGCAAAGTATGGAGAGTCTGTTTGGCTCAGTTTCAGACTTGTCCGGGGCGGACGAAAGCGACGAGTCATCGCAGTCGTCCGTCTCGATGGTAAGCAGCCGGAAGGCAGGAAAGCGGCCTTTGCCGCCGGAAGCGAGGGAGAGCGCTGGGGTATCTCCAGCGCAGAGAGGAAGAGGTAGACCGCCCACCACGGGCCAATACGTTGACTTGCGTAAGGCCAGGCAGGACCTGGAAGAGGCGGACACAGCGTTCATACGCCGACAGGCTGAGGAAGACTTGGCGGCCGCAAGAGCGGCGAATAAGGGGCATCCTGAGAGAGACCGACAGCCCTCAGGTGAACACATCGGTCTCCACAAGGAAATCGAAGCCAAAGCGGCGGCGGAGCGTGACATCATCCGCCTCCAAGCAGAAAAGGGGCTGGTTCGTGATCGGTCGCCACGGCCTTCGACCAGCAAGGCGGTAAAAATCGCCGATTTGGTTGTTCCAATCGGCGATCCGAAGGCGCAGACGGCTACCACTATCGGAGACAAGGCTGCGTCTAATTTGTTGGCCGTAAGGGAGGTTGCCCAGCGCAGTGGACACCTCAAGGGGGAGTTCATTAAATTCCTTAACGTTGCCACCACCAATATCAAGGTGGCACTTGAGGAATTGACTACCCGGACACAGACGGAGGAGATGGCGCAGCTAAAGGCTGATAATGCCAGGCTAAATCAGTGCGTGGCTAATCTCCGTATGGAGATGGCCCAAATGATAAAGGAGATGCGGAACGTCCGCCGCGAGAACGCGCAGAGGAGAGAGAACGTTGCGGGCGAGCGAGCGCCCCAGGGTGCACAGGGATTCGACATTATTTTGCAGCGACTCGCTGCCATAGAGGAACGGCTGCCCCCAGCTGCACGCCTTCGTCCCCCGCTTGCGGCGGACAGGGCCAGAGAAATGACGAGGGCTCCATCTGTAGAGGCCGCGCCTATGCTGGCTGCGCCTTTGCAAGATGCACCTTCGCGGTCTGCACCTACGCAGGCTGCGTCGAAGAAGGAGACAAGGGTGAGTCGAGTTGCTAAGAAAGCTGCTCCTCCGAAGGAGGCACCGGCCCAGACGTCATCGACTTCGGCCGATAATGCCTGGACCACAGTGGGCAAGGGAGGAAAACCTTCCCCCCAGGCGAAGAAGAAGGGGAAGCGGGACCACCTGGCTATCGTCCTCCGGCCGCCCCGATTCCTCCCCAAACTTCGGAGGGGCCGGACATCGAGATGCCCTGTCTATAGGGGTTGTCTCGGGTTGACCGTGGTGGTGGCGGAGCGGAGTGGTCTTCTCCAATCTGCGCACGGCGTACAGTAG
Protein Sequence: MDANAIESILRAGPSSGGESRHASACCPIVYGGGNNCGSSLGGEEEWEMAQEESVGPSGRENGTSNVEQAPPNCREGQKVEAVPKERRMTRSATIRNRSVSARLDGEVGLERTANIEEMEKPKKAVGKAKRLPLERERSSSRYREPSPTSDLDSNTVATAPSELSAENKKAEKRPRPSSDGEESGQTPSKAKPVAKGKGNPPTTGDRTGLEKAQKCLQELQQVVAESQPSGSSQRSKPKSFKKDKIVVDPIGDTEIQTAEMLNKKASESVQAILEVAKRSGHLKGDFIRHLKTASQNLQSISEELHRRTQSEEVAKLQIVNAKLERQVTDLRREFQAMKEVFEETRRERSDEPSHPSMPPAATEQSREMLRRLVRNQRRLLRCKTHRQRRKGRERKTPKKAILDLLFLLLPLQTPSKAKPVAKGKGNPPTTGDRTGLEKAQKCLQELQQVVAESQPSGSSQRSKPKSFKKDKIVVDPIGDTEIQTAEMLNKKASESVQAILEVAKRSGHLKGDFIRHLKTASQNLQSISEELHRRTQSEEVAKLQIVNAKLERQVTDLRREFQAMKEVFEETRRERSDEPSHPSMPPAATEQSRGDFEELRRSLLIDXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXARDAAAACTEPTTAAPLQNAPPKKKRQRTKNAKKGDSGPAVPAPSAPARPAANTKAPTSTRSEWTAVGRNGSAEENRGHGWEEGEGSERRSDRSEDRDESRKLRNGKCTERSPKGVRDRSPLIEDRIGSRSDEEFRANKEVDKLLLSSSTWTPLVAGVKRPQAEESDSEEEVTPTVKVPNAKRGRSIKLSYTRADFLKKPVEVLQPQPQRIRGKGRLRTDQQNESPPQSENECDEGSAGSSRPKPVESSSEVQSTVEKSAAPSLEVVRSETGHKSAVVLRKRALMGVRKVVSVAKYSGRLQGKFRQDLYNAATWVQEAMEKLGTTSVSTETVKLQEDNERLRKELVDIRKEMTQVKAQMKLMGEIRASWRKEGPPVDAIASVDAEFPAVDIVGASACKPPQPMDMEVWMQSLLRQVGGIIDARFEGIKERLLPEERVRPPLAADRRKTQTVPVPRVPQTRAVSQASADASEVAMETSQVTAETSKAAEEVPQVPMETSQVAITVEPKTGRSRNKKKKKKQSLAAWEAEVHTGSVSHSRDGEAIQPLPGTSTGTQQQWSTVAARGGKSKAPPPAAPRPAKQKQPVKIALQAPKTAAVILTIPPGEVEKGQTYEAFRGLLAKARDGVVWALPSLAGPGGETTLKNLKGGYLPPLPWVINLKAYLVPTGSGLGGRLKPCSRGNYMETENKKSDDVGGVDETEGLRKPEVEGLEKPETDVTRVAKEQRLRSPIVRLTRLEDMAAEKSGHGAHNIRDRSPIIARTLAQSMESLFGSVSDLSGADESDESSQSSVSMVSSRKAGKRPLPPEARESAGVSPAQRGRGRPPTTGQYVDLRKARQDLEEADTAFIRRQAEEDLAAARAANKGHPERDRQPSGEHIGLHKEIEAKAAAERDIIRLQAEKGLVRDRSPRPSTSKAVKIADLVVPIGDPKAQTATTIGDKAASNLLAVREVAQRSGHLKGEFIKFLNVATTNIKVALEELTTRTQTEEMAQLKADNARLNQCVANLRMEMAQMIKEMRNVRRENAQRRENVAGERAPQGAQGFDIILQRLAAIEERLPPAARLRPPLAADRAREMTRAPSVEAAPMLAAPLQDAPSRSAPTQAASKKETRVSRVAKKAAPPKEAPAQTSSTSADNAWTTVGKGGKPSPQAKKKGKRDHLAIVLRPPRFLPKLRRGRTSRCPVYRGCLGLTVVVAERSGLLQSAHGVQ

Similar Transcription Factors

Sequence clustering based on sequence similarity using MMseqs2

100% Identity: -
90% Identity: -
80% Identity: -