Basic Information

Insect: Zygaena filipendulae
Gene Symbol: -
Assembly: GCA_907165275.1
Location: OU015663.1:12069854-12082335[+]

Transcription Factor Domain

TF Family: TF_bZIP
Domain: bZIP domain
PFAM: AnimalTFDB
TF Group: Basic Domians group
Description: bZIP proteins are homo- or heterodimers that contain highly basic DNA binding regions adjacent to regions of α-helix that fold together as coiled coils
Hmmscan Out: # of c-Evalue i-Evalue score bias hmm coord from hmm coord to ali coord from ali coord to env coord from env coord to acc

1 4 1.9e-05 0.017 15.6 0.4 23 63 299 339 292 340 0.88

2 4 0.005 4.6 7.9 1.4 32 61 1064 1093 1060 1097 0.86

3 4 2.3 2.1e+03 -0.7 0.1 4 16 1223 1235 1220 1240 0.86

4 4 9.8e-06 0.009 16.5 0.7 27 61 1520 1554 1505 1556 0.83

#	of	c-Evalue	i-Evalue	score	bias	hmm coord from	hmm coord to	ali coord from	ali coord to	env coord from	env coord to	acc
1	4	1.9e-05	0.017	15.6	0.4	23	63	299	339	292	340	0.88
2	4	0.005	4.6	7.9	1.4	32	61	1064	1093	1060	1097	0.86
3	4	2.3	2.1e+03	-0.7	0.1	4	16	1223	1235	1220	1240	0.86
4	4	9.8e-06	0.009	16.5	0.7	27	61	1520	1554	1505	1556	0.83

Sequence Information

Coding Sequence: ATGGATAAGCGCGCTTGTGAAAAAAATCCCCACGTGGGTACCGGCCCCGAAAGGGCCGGCCAGTCCCACCCCGGACAAGCTCCGGGCCGCCCCTCGTATGTGGGGGGGGCAGCAACGCGTAGACGGGAAGGTGTAGTTTTAAGTGGGGGTGAGGGGTGGCCACCTCCAGATCCAAGGCCACCCAAATACCAACAATTCTTGGCATGGAAGGACATGATGCGTGTTAAGGAGTGGGAGGCGAATCTCGCTGTCATGAGCGAGTCGCAAATAAAAGAGAAGGTGCGTCAGGAGGGAGAGGTCTTCGTGAGGACCCTCACCAAGGAACTGGACGACATGGTGTTCGGGGTCATCGAGGTGGCGACCGCCACCCCCCGGCAAAAGGCATTGTATCATCATTCTACGGATGACGTCGAGAAGTACGTGCCCAAAGAAATGCGCTACCGGCTTGAGCTGCTGCTGGCTAGGCGCCAGGAGCTTAGAGCCGAGGCTTGCACCAGTAAGCAGAGGGTCGCGCAGTCTTCCACCGCGGCCCAAGAAAAGAAGGTAAAAGCCCACCCGGCATTGAACATTGAGGGCGGGGCTTCCTCGCCTCAAGATGGAGTGGATCCTGTGAACCCAAAGAAGGTTATACAGGCATCTGGATCATGCGCCATCCAATCTGTCGTTCCTTCCATAAAATCTCCAGTAGTTGTTTTGGAGAGGATGGACGTGCAGACGGCGTCTGGTTCGGACGACGTTACGTCATCAGCCTGCTCGTCCCGCGACAGCAGTGTATCACGGAAGCGACAGCGGTGTGAGTCTCAGCCTCACGCCCGGGCAGCCAAAAGAGGCCGCAAGTTGGAAACGGCAGGGCGCAGTATAGAGGAGAGAGTCGCCAGGGCCGAAGACAGAGCCAAAGTCCTAGCGGCACACTCCGTGTCCGAGGAAACGGCGAAACTGGCGGCTGAAAACGCCCGTCTTCGTGCGGAGGTCGACGTTCTTCGAAAGGACTTCGCCGCCCTCCGTGCGGAGATTGAGACGGAGCGGGCCAGGATGCGTGTCGCTCCGTCCCTACCGGAAGTGACTGCGGAGCGGCGGGAGCAACCTCTCTCAGAGGAGCTCTTGCGTACCATCGCCCATATGGTGGACGCAAGAGTAGATGGGAGGCTGATACCCGACCGCCCACGCCCGCCTCTCCAACACGAGAGGCGGATATCAGAAAGGACGCTACCGGCCACCTCGACTCACGAGGCAGCGCCGGTCACCGAATCAGGAAGGGAAAAGGTGCGCAGAAGGAGGAAGGCCACCAAGGCAACCACACATGCCCCCCGTCAACTGCCCCCGGCACCGGCGAACATGGACGCTGGTTACTCGGAGGTGGTTAAACGGGGGAAGGGGAAGAAAAAAGGCAAGGCTGCCCTGACCTCGGCGCCTGTTGCGCCGGCGAAGAAGTCTTCGCAGGGGCAGTCGGCGCCGCGAGCGGCGGCAGCCAAGTCAAAAAAAGGAGGAAAGCAGCCAGCCTCGGTGCGTCTTGTGCGCCGAAGCTGGCAAACCGGCGGGGCATCGATTGGGGTCGCAGAGTTGCGGCGCCCCCAAGCGAATCCCGAGAAGGACACCAAAAGCGGCCCAAGTGTCTCCGGCCGCCGCCGGTGCTGCCCAGCCCACAGTGGCCGGGCACGAGTCACCCACGACGGTGGCACAGGTGGGGTGTCCTCGCCCCAGTGGCCCTCCTTTAGAGGCCGCTATGGACGCGAGCTGACACCACTCCACCACCTTCGTTGCTTCTGGGGGCGTTCCGGGGGGACGGGCGTCCCTGCTATAGAAGCACGAGGAAGAAAGGCGCGTTTCGGACGCTCCGGCGCGCCTTTACCCGAGTCGGTCGCCTCCAGGGAGGCGACGGCCCCCAAAACAAGACAACGTATGGCTATGGAAACGGACACAAGCTTGGACACGAGTACGTGCCCAATAAACAGCAGGAAAGAGAGAGAGGAGAGCAGGGGTCTCGGATCGGATGATGCGGATAGGCTGGCTGCGACTAGAGGCATCATCACTACAACAAGCTACGACTCTTGTAGCAGCGAGATTGCTAGCCCATGTCGCCCGGTACAGCGCAAGGATGGACAAATGCTCCATTCTCTGGCCCGTCTCACCTTTGGGTATACCGAATCAGACACGTCTGCTGACCCACCTGAGCCCCTCCTTGATGACGACGTCTTTAGACCCAGGAAGAGCTTGGCGCGCTCGCCCCCGGAGAAGAGTCCAACTACATTCTACTCTCCGATGGCGAGCACGCCGGCCCAACAGAAGAGGAAGCGGCAGTCGCCTATTAAAACGCCCTCGGCTGACTTGGAGGCACTCGAACGCGAGGAGGAAGCGTGCTGGCTCTCCGTGGCTGAGAAGGTGGACGCGCTTAACGAGATGGTGTGTGCAAAGACTGGCCCTTACCGCAGTACGGCCAGTAACATTAAAATCGCGGTCAAAGACACTCAAAGTCTTTGCCTCCAAATCAAAGACACACGCATCAGGCTCCTCGTGGCTCGCCTAAAAAAAGAGGAGGAAAAGGAGCGCACTCCCAAAAGACCACGGAAGGCAGCGGAACAGGCTGAGAAGGCTACTTCCGTGTCACCCGGGCAGGCGGGCGTTGAGGCTGGCACCAACACATCCATGGTTAGCCAGCTCACGGGTCCGGAGTGGGACCATTACATGGGTTTCCCTCCTGATCTGCCAACCCCTAGACTTCCCTCTGTGGCGTCTATGGAGGACACAACGCGGAAAAGGAAAGGGCTCCTAGTCGAGTCCGCCTCGGAACTCTCCACGGATGGGATGGAAGACGGGACGGATGGGACCCCCTCACGCTCGGCTTCTTCTGCGGGGCCGAGCAAAAGAGGAAGAAAAGGACCCCGTGCTTCCAAACGCGGAGTCCCCAACAAGGAGGACTACCTTAAGGCGCCGGCCGAGACAACGGATGAGGCTGTCGCTGAGCAAATGGGCGGCGTAACGGCCTCTATGAGGGCAACCGTTGGCTCGACGGTCGAGGCCAGTGAGGAGACGGCCGCTCAGCTCAGGAACCTGGTGGCGGAACAGACCCGTAACATGTCTACCCTTATAGGAAAGTGCAGCAACATCAAGGGTACGGTCTGCCGCCAGATGAAGGAAGCAGTTGCGGCGATAAGGGACGTCAACGAGGTCCTTGCTTGCCGCACTGCCACGGACGAGACAAGGAGGTTGGCGAACCAAAACGCCTCCCTCCTCGCGGAGCTGGCCCAGCTCCGCAAGGACGTAGAATGCCTTCGGGCTGAAGCGGCGAAGGCGAGGACGGAGCGAGCCGGGCCAGCACCGGATGCCCCTCTCCCCTCGGACCTGTCGGCCTCGCTCATGCGTGAGCTGAGGCCGATGATTTTTGAGGTGGTGGAGGCAAGGCTTGCCCCTGAACGGCCTCGCCCGTCGCTTCAGCACGAGAGGCGAGCGGCAGCAGCCGCGACGCCGGCACCGACAACCTCAGCGCCGGCTGCCACTGCCTCCGCTCCGGCTTTCTCACCTGTGGCCAAAAAGAAAAAGGCCAAAGTGCCCTCAATGGCGGCCCAGGAGGCGGCTGCGGCTAGGGCCGGCGCTGCCAGTGCTTCTTCCCACCCCACTTCCGCTGCTACGCCGTCAGCGACGTACAGTGAAGTCGTGAAAAAGGGTGGGAAGACTAAGAAAAAGGAGGGGAAGAATAAAGGGGCAGCCCCTACGACCAAGCCCAAACCCGGGGGGAAAGTGCCGCCAACTAGGGTGCCCCCCAAAGATCCCCAACTCATTAAGAGCTGGAAGGGCTGGCCCGAGGACCTCACGACCCTCACAGAGCAGGAGATACACGACCAGGTCCGTCGGGAGTGTTCATCTCTTGTTAAGGAGTTCATTGAGGAACGGGCAGCCTTCCGCGATTCGGGTGATCCTTGCGACAGTCGTGGGCCAATCTGGGAACTCGTGTGGACCCTCTCAGAGGAAGAGCTCCAAGAAGAGGTCAGACGCGACATGTCGTATAGGATCACATATTTCATAGACAAGAGGAAGCAGCAGCTAATAACTGCCACCCCCGCGGCGACTGCCGCTCCGCCGTCTGGTTCGGGCGTGGGGAAAATTGCCGCCCCCTCTTTGAAATCACCTGTTGTGGTTTTAGAGAGGATGGAGGTATCTCCAGCGTCGGTCTCGGGCGGCCGTGCGTCAGTCGCCTGCTCGTCTCGTGACAGCAGCGGGACAAGGAAACGACTGCGAGAGGGTATGGAGGAGGACGATCCGCTCTCCGACAGCTCCGCCGGATCCCAGTCGGGAGGCGACGGACCTAAGAGGGGGCGCAAGAGCGCTAGGGCAAAGTCGCGCAACGTAGAGGAGCGCGTCGCCAGAGCCGGAAAAGGCTCGGGCTCGGGGGTTGGGGCTGCCTCGCTCAATGAGGCATCTTGCGACCTTAGAGACCGTATTTTTGAGGACACGGAGGTCATCTGCCGTGTCGCCGTGACGGCGGGACACCTGAAGGGCACAGATATCCGGGCCCTGAAGGAAGCGGCGGCACGGATAGATGACAGGGTCAAGGCCCTCGCTGAACGCTCCGTCACTGAGGAGACAGCAAGGCTGGCGTCGGAAAACGCTCGCCTTCGCGCGGAGGTTGACGGACTACGCAAGGAATTCGCCACCCTCCGCGCGGAGATGATCGGAGCTCGAAGTGCTCCCACGCCACCCTCAGGTAGGCAAGAACAGGAGGCTCGGGAGCAGCCTCTCTCTCAGGAGGTGCTGCTGGCCACGATCCGACACATGGTCGAGGCCGCAGTTGAGGGGAGACTGCTTCCGGAGCGACGACGCCCACCCCTCCAACATGAGGGACGGTCGTCGCAACAAGAGGCTGCAGCTTCAGCTGCCGGCAATACTGCGCCGGCACCTGTGAGCCAGCCTAACAAGGGACCAAAGAAGGGATCTAAGAAGAGGCGGCCGGAGCGACTCCGGCCGCCGCCGGTGAAGCCCAGCCCGCAGCGGCCGGGCAAGAATCCGCCATGGCGGTGA
Protein Sequence: MDKRACEKNPHVGTGPERAGQSHPGQAPGRPSYVGGAATRRREGVVLSGGEGWPPPDPRPPKYQQFLAWKDMMRVKEWEANLAVMSESQIKEKVRQEGEVFVRTLTKELDDMVFGVIEVATATPRQKALYHHSTDDVEKYVPKEMRYRLELLLARRQELRAEACTSKQRVAQSSTAAQEKKVKAHPALNIEGGASSPQDGVDPVNPKKVIQASGSCAIQSVVPSIKSPVVVLERMDVQTASGSDDVTSSACSSRDSSVSRKRQRCESQPHARAAKRGRKLETAGRSIEERVARAEDRAKVLAAHSVSEETAKLAAENARLRAEVDVLRKDFAALRAEIETERARMRVAPSLPEVTAERREQPLSEELLRTIAHMVDARVDGRLIPDRPRPPLQHERRISERTLPATSTHEAAPVTESGREKVRRRRKATKATTHAPRQLPPAPANMDAGYSEVVKRGKGKKKGKAALTSAPVAPAKKSSQGQSAPRAAAAKSKKGGKQPASVRLVRRSWQTGGASIGVAELRRPQANPEKDTKSGPSVSGRRRCCPAHSGRARVTHDGGTGGVSSPQWPSFRGRYGRELTPLHHLRCFWGRSGGTGVPAIEARGRKARFGRSGAPLPESVASREATAPKTRQRMAMETDTSLDTSTCPINSRKEREESRGLGSDDADRLAATRGIITTTSYDSCSSEIASPCRPVQRKDGQMLHSLARLTFGYTESDTSADPPEPLLDDDVFRPRKSLARSPPEKSPTTFYSPMASTPAQQKRKRQSPIKTPSADLEALEREEEACWLSVAEKVDALNEMVCAKTGPYRSTASNIKIAVKDTQSLCLQIKDTRIRLLVARLKKEEEKERTPKRPRKAAEQAEKATSVSPGQAGVEAGTNTSMVSQLTGPEWDHYMGFPPDLPTPRLPSVASMEDTTRKRKGLLVESASELSTDGMEDGTDGTPSRSASSAGPSKRGRKGPRASKRGVPNKEDYLKAPAETTDEAVAEQMGGVTASMRATVGSTVEASEETAAQLRNLVAEQTRNMSTLIGKCSNIKGTVCRQMKEAVAAIRDVNEVLACRTATDETRRLANQNASLLAELAQLRKDVECLRAEAAKARTERAGPAPDAPLPSDLSASLMRELRPMIFEVVEARLAPERPRPSLQHERRAAAAATPAPTTSAPAATASAPAFSPVAKKKKAKVPSMAAQEAAAARAGAASASSHPTSAATPSATYSEVVKKGGKTKKKEGKNKGAAPTTKPKPGGKVPPTRVPPKDPQLIKSWKGWPEDLTTLTEQEIHDQVRRECSSLVKEFIEERAAFRDSGDPCDSRGPIWELVWTLSEEELQEEVRRDMSYRITYFIDKRKQQLITATPAATAAPPSGSGVGKIAAPSLKSPVVVLERMEVSPASVSGGRASVACSSRDSSGTRKRLREGMEEDDPLSDSSAGSQSGGDGPKRGRKSARAKSRNVEERVARAGKGSGSGVGAASLNEASCDLRDRIFEDTEVICRVAVTAGHLKGTDIRALKEAAARIDDRVKALAERSVTEETARLASENARLRAEVDGLRKEFATLRAEMIGARSAPTPPSGRQEQEAREQPLSQEVLLATIRHMVEAAVEGRLLPERRRPPLQHEGRSSQQEAAASAAGNTAPAPVSQPNKGPKKGSKKRRPERLRPPPVKPSPQRPGKNPPWR

Similar Transcription Factors

Sequence clustering based on sequence similarity using MMseqs2

100% Identity: -
90% Identity: -
80% Identity: -