Basic Information

Insect: Nymphula nitidulata
Gene Symbol: -
Assembly: GCA_947347705.1
Location: OX374642.1:120132-135979[-]

Transcription Factor Domain

TF Family: TF_bZIP
Domain: bZIP domain
PFAM: AnimalTFDB
TF Group: Basic Domians group
Description: bZIP proteins are homo- or heterodimers that contain highly basic DNA binding regions adjacent to regions of α-helix that fold together as coiled coils
Hmmscan Out: # of c-Evalue i-Evalue score bias hmm coord from hmm coord to ali coord from ali coord to env coord from env coord to acc

1 4 6.2 3.1e+03 -0.8 0.3 33 52 45 64 41 71 0.76

2 4 0.00056 0.28 12.1 2.9 38 65 146 173 138 175 0.71

3 4 0.00019 0.093 13.6 0.9 32 61 801 830 788 832 0.90

4 4 3.7e-05 0.019 15.9 1.8 31 63 1546 1578 1527 1580 0.80

#	of	c-Evalue	i-Evalue	score	bias	hmm coord from	hmm coord to	ali coord from	ali coord to	env coord from	env coord to	acc
1	4	6.2	3.1e+03	-0.8	0.3	33	52	45	64	41	71	0.76
2	4	0.00056	0.28	12.1	2.9	38	65	146	173	138	175	0.71
3	4	0.00019	0.093	13.6	0.9	32	61	801	830	788	832	0.90
4	4	3.7e-05	0.019	15.9	1.8	31	63	1546	1578	1527	1580	0.80

Sequence Information

Coding Sequence: ATGAGTGAAGATGACGGGGAGCTCAGCGATGAGTCTGTGCAAACGCCTAAAGTAAAGGCATCGAGCTCAGGAAGAGGAAGAGGCCGCCCAAAAACAACGGGCGAGTTCGCAGGACTGGCGAAAGCCAAAGCGGAGTATATCCGACTCCAGCGAGAAGAAATGAAACTCCGGGCAGAACAGGAGTTCATGGATGAGATCACGGAGGCCCGCGTAACTAGGTCCAAGACAGGCTTGTCGGAAACCTCGGGTCAATCCGAAAGTGAAGAGGAAGCTGTCACAGCGGCGCGCATGACCGCAAGAGTGCTGGACAGTATTAAAATAATAGAAAAGGTGGCTACAACGTCCTCGCAACTCAAGGGGACATATGTAAAAGCCCTGAAGGACGCCGCAAAAGTAATCGCGGACAACACCAAGGACCTTGCTCGGCACAGTGTCACTGAGGAGAACAAGAGACTGCAGCAACAGAATGACCGTCTCCAGGCGGAGGTCAACGAATTGCGCAGCCGATTGACGGCCCTCGAATGCAGGTCGCCGCCGAAGACGACGCAGGCCACGCCCGGTGGGTCCAAGCTGATGCCGGCATTCGATATGGACGTGCTGACAAAAAAGCTGGAGGAGATGGAAATGCGAATTTCGGGCCGCATGTGCGACCGTATAAATGCCCGGATTGAGGGCTTGGAGTCCCGGCTCAATCCCGTCCCGAGACTTCGCCCTCCACTCGCTCACGAGGCCCAAGAAAGGGTAGAGAATGAGGCATCCACCCAAGACCAGGAGGCACCTGTGCCTAAAAAAGGCAAGGGTAAAGGGAAGGGTAAGAAATCCCAACCCGCCAAAACAGACGAAAAAGTGCGCGACGAAACAGAGGCCGGCTCCTCAGGATTCACCCTGGTCCCTTGCACCTCCCGCGCTAAGGCGATGTCCTATAAGGAGGCCCTAGGCAAGAGCCAGAAGGAAGGGGAGCCTCAAACGAGGCGCAATCCTGTTCGAGGCACTAGGGAAAATCAGGCGGCTTCGTCATCCAGGGATGCTCGCCCACCACCGCCGGTACCTGTTCCTGCAGAGGAGGAATGGAAGACTGTGTCGCGGAAGGGAAAGGGGAAAAAGAAAGCGAAGGACAGTGAGCAGCCACCTAGTCAAGCGCAGGGGAAACAGCAGGCGCGTGCTGCTTACAaacctcgcGTTGGGGTGCATGTTGGGGAGCCTCCTAGTGTGCTGGGCGCGTTGTCGGGATCGCTTGTTGCATTTGATGTTCTGTCATCCGGTGCAAACGGTGGTTCCACAACGTGTCCAGACGGCGCATCCTGGGCGACTGCGAATTCATTATCCGCTCGTAGGGTAATGGGTTCGCAGCCGGCCAATCTCCAACACAGTGCGGCTGCCTTCGGGCATTGCACGGCCGCACAAACCCGTAGCCCTGCATTTATGTGGGGTCGGGGGCTGGGCGTATggggcttgccctgtgcgtctggctgtgaggaagaaaacctctataaaaaatcaccctCGGGGGGCCCCCTTGGGGGGCCAGTGGAGCTTCGGCTCGTGGGATGGCGGCCTTCAAGGCCGCGGTCCGCTTCATGCGGACGGTGTCGGGAGCTTTTGCTCGTGGCGCAATCGCGCTTTTGTTGGCAAAGGTCCTTTTCAGGACcagtggacttcggtcggtgtatggcgggccttcaaggcccgcggAACTTTCGTTCGTTTTTCGGCGTGGGGCGCTTCAACGCTCCACTTGCGTCGGTCTTGGGGCCTGCCTTAACTGGCCGCTTAAGTTTCCCTGTGGAAACTTGCTCCGGCAGGAGCCTAAGATCAAAGGACAAAGCGCCCTGTCCGCAGGTGAGTGGCGCGGATAGTGACGTGTCGGACGACGATGTCGAGCGAGTCTCGACCTTTGGCTCGTGCCAGTCGCTCGAAACAGTGGGGTCCCAGTCGGGACGTAAGAGGTTAAGGTCCGTTGACTCAGGATCGGATAGTGCATCAAGCGCAGAGGTGGCGGCGGCGCCTAAAAAGCCCGCTTCGGGGGAAACGACCCGTGGACGAGGCCGCCCTATTAAGACGGGAGAATATGCAGGCCTGGCGAAAGCCAGGGACGAGTACAATGCCCAGCTGCGTGAGTCAATGCAGCTGGAGGCAGAAAAGAAGTTCGTGGAGGAGCTGGCGCAAAGACGAACGCGCTCAACCTCGGCCGTCTCCTCAGCAAATTCTGATAACATTATCCTAATGGAGGAAGAGCCCAGCGCGGCCCAAATTTTCAAGGCGGTACAAAGTGAGCTGCAAACTATTCTTAAagtggccaccacatccagccaccttaagggcacgtatcaaaaagcccttaaaaactcggcagcatcgatcaaagagtacacgcaatcgctccttagctgtaccgtgtcagacgaggtAGCTAAGTTGGAGCGCGAGAACAGGCGCCTTAGATCTGATATGGACGAGCTGCGTAAGCAACTTGAAGACATGCGCGCAGCAAGATCGGGCCCGCAAGAGCCAGGAGTGTCACAGCCCTTGGATGGTGACAAAATTCTCCAAGCGGTCTCCACGGTGGTGGATGAGAAGATCCGGGCGGCCATGACGTCGGCCACAAATATGTTTAACGCCCGCATCGAGGGCCTAAAAGTTGCGGACAGACCGCGGCCACCGTTGGCTGCGGACAAAGTTAGGGAAGGTACGCAGTCGCACACCCCTTCCGTTGAAGATTTCCCGCCCTTAGGGGCACCAAAAGAGAGGGTCCCCCCCGCGATCACCTCAAAGTGCGGGACAATGACCCTTATCCCCTGCACGTCGTCCCAGCGTAAGGGAAAAGGCAAGGGTAAGGGTAAGGGGAAAAAGTCCGCGCCCCCTCCAGCAGTAACCACTTCACCGGTCTCTGACGAGCCCTTAGCCTCAACATCCAAAGAGGCCCCCTGGACCACTGTTGGTAAAGGTGGAAAAGCAAAAAAGTCGAAACCAACTGAGCCGGCCCCTAAGCCTCAGGCTACGCCCAAGTCTAAAGCTAAGGGTAAAGCCCAAGCGAAGGCCAAGAAACCGCGTCGAGTCCGGGAgccccgcacggccgctgtcgtgatcacactcggttctgaggcggaaaaGGTAATGGGTTCGGAGCCGGCCAATCTCCAGCACGGTGTGGCTGCCTTCGGGCATTGCACGGCCACACAAGCCCGTAGCCCTGCTCTTTTGTGGGGTCGGGGGCTGGGCGTATggggcttgccctatgcgtctggctgtgaggaagaaaacctctataaaaaattaccctGTGGGGCCCCCTTGGGGGGCAGTGGAGCTTCGGCTCGGTGGATGGCGGCCTTCAAGGCCGCGGTCCGTTCTGGCGGACGGTGTCGGGAGCAGTTCTGCTCGTGGCGCATCTGCGCCTTTTCTTTGGGAAAGGCCTTCTTCAGGGAGGCCAGGGGACTTCGGTCGTGGGATGGCGGTCCTGCAAGGCCCGCGGAACGTTCAGCGTTCGTTCGGCGTGGGGCGCATCAACGCTCCAGTACAGTGCGGTTGCCTTCGGGCATtgcacggccgcacaaacccgtagccctgctcttttgtagggtcgggggcccggcgcaaaagcgtcgggctgcgaggaagaaaacctctataaaaaattaccctGTGGGGCCCCCTTGGGGGGCAGCGGAGCTTCGGCTCGGTGGATGGCGGCCTGCAAGGTCGCGGTCCCTTCTGGCGGACGGTGGTCGTCGCGCGTTTGCGCTTTTAATGGGGAAAGGCCTTCTTCAGGAGGGCCAGGGGACTTCGGTCGTGGGATGGCGGGCCTTCAAGGCCCGCGGAACGTTCAGCGTTCGCTCGGCGCTGGGGCGCTTCAACGCTCCTTTTTCGTCAGCTCTTGGGGCCGGCCTTAACTGGCCGGTCCCGACGGAGCTTGCCTTAGTTGGCTGGCTcagcggctgcctacgggcggcgtggcacggcggaccttcaaggagTAGCTCGCTAGTGAGCCTAAATAACACGGACAACGCACCCTGTCCCAAAATGAGTGGTGCCGTAGTAGTCTTGAAGGACATCCTAGTAGGGAAAGAAGTTGATGCGCGCCGTCCACAAACAAGTGGCGCGACCTCTGTTAAAAAAGTAGTGAAAGTCGACGGGACGGATAGAGAATCGGACTTTGGCTCATGCTGGTCTGTTGAATCGGTGGAATCCCGGTCCGGACGAAAAAGAGTGAGGACCCAACGACGTAGAGGGTCACACAGTGATGGGACAGGTTCTGGCACTGACAGCGCCTCTAGCTCAGGCTGTGCAGTTGCCAAGCCAAAGAAAATAGCCGCAGTCGGTGACATCGACGCTAGAAAGCAGTACAACAAAGAGCTTCGTGAATCTATAGAGCTCGAAGCCGAGAAAGAATTTGCCGAAGAAATTGCGCTAAAGCGACAGCGCTCTGGATCAGTGAACACAGGCTCATGTGGAATGTCGTTAGATGAAGAGCCACGTGCGGCCCTGATTTTTAAATCTGTAGAGGAAGAGCTGAAGACTATTCTAAAAGTGGCAACCACTTCCAGCCATCTCAAGGGTACCTACCAAAAGGCCCTCAAAGTCTCCGCAGCTACAATCAAGGACAAAACTCTCGCGCTCCTAAAATGCACGGTGACAGACGAAGTCGCCAAACTCGAAAGAGAGAATAGACGACTATCAGAAGACATCAATGATCTACGTAAGCAGCTAGACGAATTACGCGCTAAAAGAGACGTGCATGCTGATGTGCAGCAATCTTTCAAGCCTGAAGATATAATTCAAGCAGTGTCAAGTATTGTAGATGACAAGATCAGAGTGGCCACAACATCTGTCACTAACATGATCAATGCCCGCATCGAGGGTCTTAAGACGGCTGACAGACCCCGGCCATCGTTGGCTGCGGATAAAAAGAAGGTCTCTCCACTTACGGAATCCAATTTGCCTCCAGCAACAACGACTAAGATCCCTTCGGGAATAAAATCCAAGTGTGGCAAGTTAACGCTTATTCCCTGCACATCAGCCCAAAAGGGCAAAAGAAAGACTAAAGGGAAAAAGATCACGGCAGCATCGGCAACGAACCCGGCCTCTGCCAAACAGACGGAGCCCAGTACGTCTACCGCTCCAGCTGCCTCCACTTCGTCAGAGGAAGCCCCTTGGACTGAGGTAGTCAAACGTGGTGCACAGAAAAAGCAAGCAAAAGCTGCGGCTGCTCAGTCGAATTCTAAGGCCACAGTACAAACTGCCAAGGATGCACAGCCTAAGACTAAAAAACCACGCAAGGTCAGAGAgcctcgcacggctgcggttgtgctcactatcggcccagaggcagaaaaacgtggcatcacatatgctgaggtgattcggaaagcacgaaccagcatcaatatagaagagctcggtattccgccaatcaacaccaccaccgcggtcactggtgccaaaatactacaggtatctggtgaggaacaggttgcaaaagctgacgctctcgctgagcaactgagaagcctatttgaggatgaggacattcgtgtctcccgacctacgaaatgtatggagctctctatcattggcctagatgactctattctaaaagaggaaatagtcaccgctgttgcgataaaagggaattgcgctcaccatcaagttagagtgggtgaaatacgttctggtcctggtgatatgggcatcgcatgggtgtcatgccccattgctgcagctaaaaagatccttgaagcaggacgtctccttgtcgggtggagctcagcacgtgttcgggcagtggaaaagcttccaataagatgttaccgctgtcttgagagaggacatgcccggcagcaatgtatgggtgaagacagaagcgacttgtgcttccgctgtggaaagtccggtcataaggcggccaaatgttcagctgagccccactgcttaacttgtgcggcttcgaaaagaacagcaggacacgttatgggaggtaggagctgtaaggcccccatcattactctcaagaaggacaagaaagcggctaggacccaagccgccaagcaggctgcaacagaacagcccatggacacgactccaatcgccaatggatctacaaccaatgtctag
Protein Sequence: MSEDDGELSDESVQTPKVKASSSGRGRGRPKTTGEFAGLAKAKAEYIRLQREEMKLRAEQEFMDEITEARVTRSKTGLSETSGQSESEEEAVTAARMTARVLDSIKIIEKVATTSSQLKGTYVKALKDAAKVIADNTKDLARHSVTEENKRLQQQNDRLQAEVNELRSRLTALECRSPPKTTQATPGGSKLMPAFDMDVLTKKLEEMEMRISGRMCDRINARIEGLESRLNPVPRLRPPLAHEAQERVENEASTQDQEAPVPKKGKGKGKGKKSQPAKTDEKVRDETEAGSSGFTLVPCTSRAKAMSYKEALGKSQKEGEPQTRRNPVRGTRENQAASSSRDARPPPPVPVPAEEEWKTVSRKGKGKKKAKDSEQPPSQAQGKQQARAAYKPRVGVHVGEPPSVLGALSGSLVAFDVLSSGANGGSTTCPDGASWATANSLSARRVMGSQPANLQHSAAAFGHCTAAQTRSPAFMWGRGLGVWGLPCASGCEEENLYKKSPSGGPLGGPVELRLVGWRPSRPRSASCGRCRELLLVAQSRFCWQRSFSGPVDFGRCMAGLQGPRNFRSFFGVGRFNAPLASVLGPALTGRLSFPVETCSGRSLRSKDKAPCPQVSGADSDVSDDDVERVSTFGSCQSLETVGSQSGRKRLRSVDSGSDSASSAEVAAAPKKPASGETTRGRGRPIKTGEYAGLAKARDEYNAQLRESMQLEAEKKFVEELAQRRTRSTSAVSSANSDNIILMEEEPSAAQIFKAVQSELQTILKVATTSSHLKGTYQKALKNSAASIKEYTQSLLSCTVSDEVAKLERENRRLRSDMDELRKQLEDMRAARSGPQEPGVSQPLDGDKILQAVSTVVDEKIRAAMTSATNMFNARIEGLKVADRPRPPLAADKVREGTQSHTPSVEDFPPLGAPKERVPPAITSKCGTMTLIPCTSSQRKGKGKGKGKGKKSAPPPAVTTSPVSDEPLASTSKEAPWTTVGKGGKAKKSKPTEPAPKPQATPKSKAKGKAQAKAKKPRRVREPRTAAVVITLGSEAEKVMGSEPANLQHGVAAFGHCTATQARSPALLWGRGLGVWGLPYASGCEEENLYKKLPCGAPLGGSGASARWMAAFKAAVRSGGRCREQFCSWRICAFSLGKAFFREARGLRSWDGGPARPAERSAFVRRGAHQRSSTVRLPSGIARPHKPVALLFCRVGGPAQKRRAARKKTSIKNYPVGPPWGAAELRLGGWRPARSRSLLADGGRRAFALLMGKGLLQEGQGTSVVGWRAFKARGTFSVRSALGRFNAPFSSALGAGLNWPVPTELALVGWLSGCLRAAWHGGPSRSSSLVSLNNTDNAPCPKMSGAVVVLKDILVGKEVDARRPQTSGATSVKKVVKVDGTDRESDFGSCWSVESVESRSGRKRVRTQRRRGSHSDGTGSGTDSASSSGCAVAKPKKIAAVGDIDARKQYNKELRESIELEAEKEFAEEIALKRQRSGSVNTGSCGMSLDEEPRAALIFKSVEEELKTILKVATTSSHLKGTYQKALKVSAATIKDKTLALLKCTVTDEVAKLERENRRLSEDINDLRKQLDELRAKRDVHADVQQSFKPEDIIQAVSSIVDDKIRVATTSVTNMINARIEGLKTADRPRPSLAADKKKVSPLTESNLPPATTTKIPSGIKSKCGKLTLIPCTSAQKGKRKTKGKKITAASATNPASAKQTEPSTSTAPAASTSSEEAPWTEVVKRGAQKKQAKAAAAQSNSKATVQTAKDAQPKTKKPRKVREPRTAAVVLTIGPEAEKRGITYAEVIRKARTSINIEELGIPPINTTTAVTGAKILQVSGEEQVAKADALAEQLRSLFEDEDIRVSRPTKCMELSIIGLDDSILKEEIVTAVAIKGNCAHHQVRVGEIRSGPGDMGIAWVSCPIAAAKKILEAGRLLVGWSSARVRAVEKLPIRCYRCLERGHARQQCMGEDRSDLCFRCGKSGHKAAKCSAEPHCLTCAASKRTAGHVMGGRSCKAPIITLKKDKKAARTQAAKQAATEQPMDTTPIANGSTTNV

Similar Transcription Factors

Sequence clustering based on sequence similarity using MMseqs2

100% Identity: -
90% Identity: -
80% Identity: -