Basic Information

Insect: Drosophila subpulchrella
Gene Symbol: gt_1
Assembly: GCA_014743375.2
Location: NC:20403288-20421401[+]

Transcription Factor Domain

TF Family: TF_bZIP
Domain: bZIP domain
PFAM: AnimalTFDB
TF Group: Basic Domians group
Description: bZIP proteins are homo- or heterodimers that contain highly basic DNA binding regions adjacent to regions of α-helix that fold together as coiled coils
Hmmscan Out: # of c-Evalue i-Evalue score bias hmm coord from hmm coord to ali coord from ali coord to env coord from env coord to acc

1 2 2.4 1.8e+03 -1.3 3.7 26 45 151 170 147 171 0.87

2 2 3.1e-12 2.4e-09 36.8 5.2 5 58 402 455 398 460 0.93

#	of	c-Evalue	i-Evalue	score	bias	hmm coord from	hmm coord to	ali coord from	ali coord to	env coord from	env coord to	acc
1	2	2.4	1.8e+03	-1.3	3.7	26	45	151	170	147	171	0.87
2	2	3.1e-12	2.4e-09	36.8	5.2	5	58	402	455	398	460	0.93

Sequence Information

Coding Sequence: ATGCTTATGCACGAGAAACTCATGGCCGGGCAGTTCTTCGATCTCAAGACCGATCGCAAGCCCCTGATGCATCACCACCAGTATCAGCACCACCAGacgcaccaccagcagcagtcGCTGCACCACTTGCCGCACAGCCAATTGCCGGTCCAGGGATCCCTGGGTCTGCCCAAAATGGATCTGTATGCGGCCTATGCCTACCAGCAGCAGTTGCTGGGCGCTGCCCTcagccagcagcaacagcagcagcagcagcagcagcaacaccagcaactgcagcaacagcagcagcagcagcaacatcagcaacaggCTTCCTCTGCGGAGGTCCTGGATCTTTCCCGTCGCTGCGACAGCGTGGAGACGCCCAGGAAGACTCCCTCGCCCTACCAGACCAGCTATAGCTATGGCAGCGGTTCCCCTTCGGCCTCGCCCACCAGCAATCTGCTGTATGCCGCCCaaatgcagcagcaacatcagcaacaacagcagcagcaacagcaactggCCTCTTTGTACCCCGCTTTCTACTACAGCAACATCAAGCAGGAGCAGGCCACGCCCACGGCTGCCCCGCCCAAGGTCACGCCCACCGCTAGCCTCCTCCAGACCTTTGCTGCCGCTTCTGCTgcagccgccgccgctgctgctgcctcctcctccacctcgTCGACCAACTCACCCAGACCAGCCAGCAATGCCAGCACCATGCAGATAGATGTCCTGGAGAATCCCCAATCGCCGGCTGTTGAGGCCACCACGCCCACCACCTCTGCCCCCAGCGGCAGTGGGGATGCGGGCAAGAATACTCGCCCCTTCAAGGCCTTTCCCCGTGATCCCCTGGTCATTGCTGCCAACTTCGCGGCCACCGATGTCCTGCTGGACAATCCGCGAGTGGAGCGCTACACCGAGTACCGCAAGAGGGTGCTCGAGCAGATTCGCAGCTCCAACGGAGGATCTCGCACTGTGACCAACCCCAAGATGCGCAGGACCAACTCGAGGAGCGGATCCGTGAACGAGGGCAGTTCTTCGAACAACAACAGCGAGAGCGAGGATCGCGCTGCGGCTGAGGAGTCCAGCGATTGCGATTCCCAGGCGGGCAACTTTGAGGGCAAGTCCTCGGCCAGCAACTCCAGCACTCTGGCCAACACCACCGGGGTGAACTCGGGCCTCAGCTCGGGCAGCCAGGTGAAGGATGCTGCCTACTATGAGCGGCGTCGCAAGAACAATGCCGCCGCCAAGAAGTCCCGCGATCGTCGCCGCATCAAGGAGGATGAGATCGCCATCAGGGCCGCCTATCTGGAGCGCCAGAACATCGAGCTGTTGTGCCAGATCGACGCCCTCAAGGCCCAGCTGGCCGCCTTCACGTCCGCCAAAGTGGCCACCGCCTAA
Protein Sequence: MLMHEKLMAGQFFDLKTDRKPLMHHHQYQHHQTHHQQQSLHHLPHSQLPVQGSLGLPKMDLYAAYAYQQQLLGAALSQQQQQQQQQQQHQQLQQQQQQQQHQQQASSAEVLDLSRRCDSVETPRKTPSPYQTSYSYGSGSPSASPTSNLLYAAQMQQQHQQQQQQQQQLASLYPAFYYSNIKQEQATPTAAPPKVTPTASLLQTFAAASAAAAAAAAASSSTSSTNSPRPASNASTMQIDVLENPQSPAVEATTPTTSAPSGSGDAGKNTRPFKAFPRDPLVIAANFAATDVLLDNPRVERYTEYRKRVLEQIRSSNGGSRTVTNPKMRRTNSRSGSVNEGSSSNNNSESEDRAAAEESSDCDSQAGNFEGKSSASNSSTLANTTGVNSGLSSGSQVKDAAYYERRRKNNAAAKKSRDRRRIKEDEIAIRAAYLERQNIELLCQIDALKAQLAAFTSAKVATA

Similar Transcription Factors

Sequence clustering based on sequence similarity using MMseqs2

100% Identity: iTF_00539416;
90% Identity: iTF_00591462;
80% Identity: -