Basic Information

Insect: Notodonta dromedarius
Gene Symbol: -
Assembly: GCA_905147325.1
Location: LR990160.1:14281667-14291946[+]

Transcription Factor Domain

TF Family: TF_bZIP
Domain: bZIP domain
PFAM: AnimalTFDB
TF Group: Basic Domians group
Description: bZIP proteins are homo- or heterodimers that contain highly basic DNA binding regions adjacent to regions of α-helix that fold together as coiled coils
Hmmscan Out: # of c-Evalue i-Evalue score bias hmm coord from hmm coord to ali coord from ali coord to env coord from env coord to acc

1 3 7.9e-05 0.038 14.2 0.2 30 63 270 303 264 304 0.88

2 3 9.7 4.6e+03 -2.1 0.8 22 42 607 627 606 633 0.83

3 3 3.4e-05 0.017 15.4 0.2 30 63 703 736 698 737 0.90

#	of	c-Evalue	i-Evalue	score	bias	hmm coord from	hmm coord to	ali coord from	ali coord to	env coord from	env coord to	acc
1	3	7.9e-05	0.038	14.2	0.2	30	63	270	303	264	304	0.88
2	3	9.7	4.6e+03	-2.1	0.8	22	42	607	627	606	633	0.83
3	3	3.4e-05	0.017	15.4	0.2	30	63	703	736	698	737	0.90

Sequence Information

Coding Sequence: ATGGATAAAGGACCTGATTCGCATTCGGATTCGGCAAAGTTGACTGGCGCAGTACGCGTTGACTCGGGGGAGTCCGCGTCTGCCTCTAAGGGAAGAGGGGAGCTTATGGCTGCCCTAAAGGAATTGACGAGGACAGGAAGTGTGGGGTCGATGTCGATGTCGTATGACAGCGACGACTCCACATACTCAAGACCAGGCAGTCGGGTGTCGCATAGCGGTTCGCACCGCAAGCGGTCCCGACGTCCAGACTCGGAAGATGACTCGGGCGGCTCCTCGGGTGACGAGGCCCGCCCCGCTCAAAAAGCCCCGAAGACAAAAGTGCAGAAGGGCACTTCACAGGCGAGGGATCAATCTGGCCGGTTCCTGAAGCGCTCTGACGCATCGGGGAGCCAGCCCCAAGGGAGAGATCGGTCGCGCTCGGGCGGCAGGAGCGACGGGAGCCCTGCCGCTCTGAAGAGCACCGACACCCCGAGAGGAAGANNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNGGCCGAGATGGTTGCTGCAGAACGTGCGGCCATGGAGCTCCAGGCCGAGAAGGAGGTGGCGGAGTCGGCGCGCAAGGAGTATGAACTCCGGCCCATCCGCGTGCCTGAGTACTTTGACGGGGCTTCCACGCCCGAATTAAAGGGACATGTTCTCAGGAACTNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNTCTGATGAGCCGGTCCACCATCGCGTCGGAGACGATGAAGCTCTCCGCTGACAACGACCGGCTCCAGACCGAAATAGAGGTGCTCCGTGGTGAGCTAGCTGCTTTGCGGGCTGAAATGCGGCAGCCGCAAAACATCCCGGTTGAGATAACCCCACCGCCTCCAAGTGCTCAGTTCGAGCCNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNCTCGACTTCCGGGGCCTCGTTGGGGTATGGCCCGCCGGCTGGAAGTAGCCCCGTAGCGGAGCTGGAGGATCCTCCGGCACCCATCGACCTTGGTCCCCCCCCTCCTACTTCACGTGAGGGAGGGACGACCAAATCTAAGGGCAAGGGGAAAAAGCGGGCTCCTACGGCCGACCCCGCTCCGCCAGCAGCGACAGCTGCAGAGAGGCCAGCGGAGAGCTGGAATGTTGTGACCCGGCGCAAGCCTAACGATTCGGTTAAGAGGACTGGCGCAGCACGCGTTGACTCGGGGGAGTCCGCGTCTGCCTCTAAAGGAAGAGGGGAGCTTATGGCTGCCCTAAAGGAGTTGACGAGAACAGGAAGCGTGGGGTCGATGTCGATGTCGTACGACAGCGACGACGACTCCATACTCTCGCGGCCGGATAGTCGGGTGTCGCATAGCGGTTCGCTCCGGAAGCGACCCCGACGATATGACTCGGAAGATGACTCGGGCGGCTCGGGTGACGAGGACCGCCCCGCTCAAAAAGCCCCGAAAAAGAAGGTGGAGAAGGGCACTTCACAGGCGAGGGACAAAGCTGGCCGGTTCCTAAAGCGCTCTGACGCATCAGGGAGCCAGCCCCAAGGGAGAGATCGGTCGCGCTCGGGCGGCAGGAGCGACGGGAGCCCTGCCGCTCTGAAGAGCACCGACACCCCGAGAGGAAGAGGCCGGCCTCCAACAACCGGCGAGTACGTTGGCCTGGCAAAGGCCAAGGCCGAGATGGTCGCCGCAGAGAGGGCGGCGATGGAGCTCCAGGCGGAAAAGGAGATGGCGGAGTCGGCGCGCGAGGTGTATGCGCTGCGTCCGATCCGCATGCCGGAGAAGTTTATCGGGGCCTCTACGCCCGAACTAAAGGGTCACGTTCTCCGTAACGTGGCCCTAATCGGTGATGNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNTGTCGACTTGATGAGCCGGTCCACCATCGCGTCGGAGACTATGAAGCTCTCCGCCGATAATGACCGGCTCCAGACGGAAATCGAGGTGCTCCGCGGTGAGCTTGCTGCTCTGCGGGCCGAATTACGGCGTCCACAAAACCCGGACGTGCCAATCCCCCCACCGCCTCCAAGTGCTCCGTTTGAGCCGGAGTCNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNGACTTCCGGGGCCTCGTTGGGGTATGGCCCGCCGGCTAGAAGTAGCCCCGTAGCGGCGCTGGAGGATCCTCCGGCACCCATCGACCTTGGTCCCCCCCCTCCTACTTCACGTGAGGGAGGGACGACCAAATCTAAGGGGAAGGGCAAGGGGAAAAAGCGGGCTCCTGCGGCCGACCCCGCTCCGCCAGCAGCGACAGCTGCAGAGAGGCCAGCGGAGAGCTGGAATGTTGTGACCCGGC
Protein Sequence: MDKGPDSHSDSAKLTGAVRVDSGESASASKGRGELMAALKELTRTGSVGSMSMSYDSDDSTYSRPGSRVSHSGSHRKRSRRPDSEDDSGGSSGDEARPAQKAPKTKVQKGTSQARDQSGRFLKRSDASGSQPQGRDRSRSGGRSDGSPAALKSTDTPRGRXXXXXXXXXXXXXXXXAEMVAAERAAMELQAEKEVAESARKEYELRPIRVPEYFDGASTPELKGHVLRNXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXLMSRSTIASETMKLSADNDRLQTEIEVLRGELAALRAEMRQPQNIPVEITPPPPSAQFEPXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXSTSGASLGYGPPAGSSPVAELEDPPAPIDLGPPPPTSREGGTTKSKGKGKKRAPTADPAPPAATAAERPAESWNVVTRRKPNDSVKRTGAARVDSGESASASKGRGELMAALKELTRTGSVGSMSMSYDSDDDSILSRPDSRVSHSGSLRKRPRRYDSEDDSGGSGDEDRPAQKAPKKKVEKGTSQARDKAGRFLKRSDASGSQPQGRDRSRSGGRSDGSPAALKSTDTPRGRGRPPTTGEYVGLAKAKAEMVAAERAAMELQAEKEMAESAREVYALRPIRMPEKFIGASTPELKGHVLRNVALIGDXXXXXXXXXXXXXXXXXXXXXXXXXXVDLMSRSTIASETMKLSADNDRLQTEIEVLRGELAALRAELRRPQNPDVPIPPPPPSAPFEPESXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXTSGASLGYGPPARSSPVAALEDPPAPIDLGPPPPTSREGGTTKSKGKGKGKKRAPAADPAPPAATAAERPAESWNVVTR

Similar Transcription Factors

Sequence clustering based on sequence similarity using MMseqs2

100% Identity: -
90% Identity: -
80% Identity: -