Basic Information

Insect: Nomada goodeniana
Gene Symbol: XBP1_1
Assembly: GCA_963969485.1
Location: OZ018301.1:3012327-3014075[-]

Transcription Factor Domain

TF Family: TF_bZIP
Domain: bZIP domain
PFAM: AnimalTFDB
TF Group: Basic Domians group
Description: bZIP proteins are homo- or heterodimers that contain highly basic DNA binding regions adjacent to regions of α-helix that fold together as coiled coils
Hmmscan Out: # of c-Evalue i-Evalue score bias hmm coord from hmm coord to ali coord from ali coord to env coord from env coord to acc

1 2 1.4e-13 8.6e-11 41.6 15.3 2 62 84 144 84 149 0.94

2 2 2.6 1.6e+03 -0.9 0.1 35 49 209 223 206 233 0.76

#	of	c-Evalue	i-Evalue	score	bias	hmm coord from	hmm coord to	ali coord from	ali coord to	env coord from	env coord to	acc
1	2	1.4e-13	8.6e-11	41.6	15.3	2	62	84	144	84	149	0.94
2	2	2.6	1.6e+03	-0.9	0.1	35	49	209	223	206	233	0.76

Sequence Information

Coding Sequence: ATGAGCGTATTGAAAAGTGTTATCATAACGCTGCCTAAGGGCCTTTCAAAGGCGCCGGGCGTTTTTTCGGCAACCGAGTTACCAAAAAACGGGCAGAAATTCAGTTTCGGTACCACTGTACTGATCAACAAGCCAAGAATGGACCCGAAAAGGATTGCCAAACACGAAGAACTCCATGACGAGAGTGAATTGTTCAAAACAGATGTTTGTGTACGCGGAAAAAAAAGGCGGCTGGACCACTTAACATGGGAGGAGAAACTCCAAAGGAAgaaattgaaaaatagagTCGCAGCCCAAACATCGCGGGATCGTAAAAAGGCAAAGCTCGACGAACTGGAGGACACTGTTAGGTCGTTGAGGGAGCGAAATGACTTACTGACTCAAGAATGTACGATGCTAAGGTCGCAAAATGAGGTGTTGGTCACAGAGACCAAAAGATTGAGGAAGGACAGGGAGACGAAGAACTCGGGAGAATTTGTTTGTTCCTTGTGCCAGACAGGGTGGAGCAGCACAGCTGGCACCGTCTCTGACGCTAACCCCAGGAGCGACAATACTCCTCAAGATACTGACCATTTACCTCCTCTTGAAGAATTGTTTGGTGACCTCCAAGGAGACGATTACATCGAACGACTCGAAGAACTCGCAGAGAGCCTTCTGCGAGAGGTTACCGCAGAAGTGGAAGCAAATCCTCATAGAACAAATGAACAAGAGTCAGCTGAGGAAGATATCACTGAGAAACATGGCCATCCGAAAGGAATGGTGGGGCAGACATCAAAAGATGTGGAAGCCGGTGGAACCTGTAAAAGCATGAGCACGCACCAATCATGGCATCCTGTTTCTGGCACAGCTAGCGCACGTTATACCGCAAACGCAACCGCACCAGTATCGATCAAGTCAGAGGTCCAAGTAAAACAAGAAGCCGAGACGCACGACTTCGACACAATTTATGGTACTTACGACGAGGCGACCAACTCGGTAACAATCATTTATCCTGGGGACGAAGCCAGCGTAGGCATTCAAGAGTGCGTTCAAGAAGTAGTTACGGACAGCGTTTGTACGAACGAGGATTCGTCGTATTTAACGCCGAGGCGTTATTCCAATCAGTTTTCACCATCTTACGCAAGCACGGCGTCCATGTCGCCGTCGAGTGTACAGTCCGACGATATGGAGGCCAGTTTTACGCAAACAAAAGCAGACTGCAACGCGTCCGATTACGGATACGAGTCGCACGACTCGCCGATGCCTGATACTCGTAAGGAAAAACATCATTTAGGCCTGACAGACATTTGGCACGAAAGTTTCTCCGAATTATTTCCAACATTGGCTTGA
Protein Sequence: MSVLKSVIITLPKGLSKAPGVFSATELPKNGQKFSFGTTVLINKPRMDPKRIAKHEELHDESELFKTDVCVRGKKRRLDHLTWEEKLQRKKLKNRVAAQTSRDRKKAKLDELEDTVRSLRERNDLLTQECTMLRSQNEVLVTETKRLRKDRETKNSGEFVCSLCQTGWSSTAGTVSDANPRSDNTPQDTDHLPPLEELFGDLQGDDYIERLEELAESLLREVTAEVEANPHRTNEQESAEEDITEKHGHPKGMVGQTSKDVEAGGTCKSMSTHQSWHPVSGTASARYTANATAPVSIKSEVQVKQEAETHDFDTIYGTYDEATNSVTIIYPGDEASVGIQECVQEVVTDSVCTNEDSSYLTPRRYSNQFSPSYASTASMSPSSVQSDDMEASFTQTKADCNASDYGYESHDSPMPDTRKEKHHLGLTDIWHESFSELFPTLA

Similar Transcription Factors

Sequence clustering based on sequence similarity using MMseqs2

100% Identity: iTF_01065315;
90% Identity: iTF_01065315; iTF_01068044; iTF_01066002; iTF_01066706; iTF_01070106; iTF_01068735; iTF_01069408;
80% Identity: -