Basic Information

Insect: Drosophila villosipedis
Gene Symbol: nfil3_1
Assembly: GCA_035043025.1
Location: JAWNNF010000013.1:1921609-1926059[-]

Transcription Factor Domain

TF Family: TF_bZIP
Domain: bZIP domain
PFAM: AnimalTFDB
TF Group: Basic Domians group
Description: bZIP proteins are homo- or heterodimers that contain highly basic DNA binding regions adjacent to regions of α-helix that fold together as coiled coils
Hmmscan Out: # of c-Evalue i-Evalue score bias hmm coord from hmm coord to ali coord from ali coord to env coord from env coord to acc

1 4 9.7 8.8e+03 -3.3 0.3 45 54 101 110 97 114 0.51

2 4 5.1e-13 4.6e-10 39.2 3.8 1 53 237 289 237 298 0.92

3 4 9.3 8.5e+03 -3.3 2.7 30 49 435 454 420 458 0.67

4 4 0.27 2.5e+02 1.7 0.0 42 58 809 825 805 830 0.47

#	of	c-Evalue	i-Evalue	score	bias	hmm coord from	hmm coord to	ali coord from	ali coord to	env coord from	env coord to	acc
1	4	9.7	8.8e+03	-3.3	0.3	45	54	101	110	97	114	0.51
2	4	5.1e-13	4.6e-10	39.2	3.8	1	53	237	289	237	298	0.92
3	4	9.3	8.5e+03	-3.3	2.7	30	49	435	454	420	458	0.67
4	4	0.27	2.5e+02	1.7	0.0	42	58	809	825	805	830	0.47

Sequence Information

Coding Sequence: ATGTCGATAGTGTGTCCGTTAGAGAAAAAGTTGAACATTTTCCAAGAGACTGCAACAggcacaaatttgtttataatcaatcacaacagcaacaacaacagctgcacgGATAAactttacaacaacaacaacagaagtcGTTATACGCAGtttacgacaacaacagcaacaaaacataaGGCACAATTTACGCACGGTTACGCGGAGCAACAGGAACACCAACATCATCAGTACAGTGAACACCCGCTGGTGAGGGACAGCAGCGAGTACTTATCGCATCAATTGTTGCtcaagcaggagcagcaggaagTGTCCGACTTGCGGCAGGAAATGCCCGAGGTGCTCGCCGCCCAAGGTCACGGCAAGGTGTCCGGCTCCATGATGAACAGCGTACGGATGGCGACCATATCGCCGACCCTCTCCATGAACGGCAGCTCCAACGAAGCAACCAATTTGCATCCGCTGTCCATGTATGGCGGCTCGATAAGTCCACAGTCGAATGACAGTGGCATGTCCGATGGACACAGTCACGGTCACGGTCACAGTCACGGCCTGGGCAAATTTGGGCCGGGCAATGCCGGCTATGCGTCACAGAGCAACGGTGGCGGTGGatctggtggtggtggtggctccCAATCGACACTGACAGCCGCACAAAAGGAGCTCTTCTCGCAGCGCAAACAGCGCGAATTCACACCGGACAACAAGAAGGACGAGAGCTACTGGGATCGGAGGAGACGCAACAATGAGGCAGCAAAGAGGAGTCGCGAGAAGCGACGATACAACGATATGGTCTTGGAGCAGCGTGTCATCGAGCTGACCAAAGAGAATCATGTGCTCAAGGCGCAACTGGATGCCATACGCGACAAGTTCAACATCTCCGGTGAGAATCTGGTCAGCGTCGAGAAGATACTCGCCTCGCTGCCCACTAGCGAACAGGTGCTCAGCAATACGAAGCGCGCCAAGATGAGCAGCAAttcctccgcctcctcctcatcatcatcatccgcatcctcaacgtcgtcgtcatcCTCACccacggcacacacacacagcagctaTGGTGGCGCTCTGGCACCACCCCTCTCGCCGATCATGTATGCGGCCAACAGCCGCTTGAATGAGTCAGCTGGCGTAGCTGgagcagctgtggcagccgCGTCCATCAAGAGTGCTCATCatgtgcagcagttgcagcatgcaacacaagcacccacagcagcagcagcagtagcaccactagcggcagcagcagctgcagcagcacaggcagtcacacacacacacccacacacacacgcatatcagcagcaggtgcaacagcaacagcaacagcagcagcagcagcaacagcagcagcaacagactACCATGCATCATCCGGATGCATCGCCCGCCATTGCCAATCTGCATGTGCTGCAGCAGGCGCTGCATCGCAATGTGCGACCCGAGGATTTGGACAGTCTGCGCAAAGTGGTCGCCGTCGGTGCACTCTACAATGCGGCTGGTGTTGGTGCCACGCCCTCCTCTGCCGGCAACAATGCCATCTATGCGCCGGGACCGGCTGCCTCggctgccgcagctgctgcctaTGTGGCGATTAGCAAGGAGCAACTGGAGGTGGCCAGCTATCTGCAGAGTCACAATGTGGTCGTCGAGAGCAGCAGCGTTAGCAGCAGTGGCGGTGCCGTCGATGCcgtcagcagcagttgctcctCGGTTGTCAGTTCGGCTGCTGCCAGCGTCTTGAATCTGTCCAGGAGAGGCGCCTGCTCCTCGCCCAGCTATGAGCATATGCTCTCCTCGACCACATCATCCACGTCGTCCGCCGCCTCGTCCGCTTCGTCGTCGGGCGCCGTTTCTGGTGATGATGAGCAGGAGCACGACATGACCGATGACAGCGCACACAATactcatcatcatccacatcagcatccacatcagcatcaacatcaacatccacaccatcatcatcatccacatGGCGTCCATTTGGCTGCAACGCTGCAACGCACAAGTCCACAGCACGGaggcagtaacagcaacagcaacaacaatggtgcCAGCGATGCCAACAATTGTCTGCCCCTCAAGCTGCGCCACAAGTCGCATCTGGGCGACAAGGATGCGGCGGCAACAGCGCTGCTCTCGCTGCAGCACATCAAACAGGAGCCCAGCTGCAATCTGCGCGCATCTCCGCCAGCGTGGAACGATGGCGGCGACAACTCCAGCGATGAACGCGACTCGGGCATCTCCATTGCCAGTGCCGAGTGGACGGCGCAATTTCAACGCAAGCTACTCGCGCCCAAGGATCCCgcctctgtctctgccaccacctcctcctcctcctcagcGGTTGCCTCCTCCGTTGCCGTCTCAGCCGTTGCTGGCTCCAATGTGGGTGGATCCAATGTGGATCGCGATCAAATGCTCAAAAGCCAGCTGGAGAGACTCGAATCGGAGGTGGCCAGCATCAAGAGCATGATAATTCTGGCAGAGTAA
Protein Sequence: MSIVCPLEKKLNIFQETATGTNLFIINHNSNNNSCTDKLYNNNNRSRYTQFTTTTATKHKAQFTHGYAEQQEHQHHQYSEHPLVRDSSEYLSHQLLLKQEQQEVSDLRQEMPEVLAAQGHGKVSGSMMNSVRMATISPTLSMNGSSNEATNLHPLSMYGGSISPQSNDSGMSDGHSHGHGHSHGLGKFGPGNAGYASQSNGGGGSGGGGGSQSTLTAAQKELFSQRKQREFTPDNKKDESYWDRRRRNNEAAKRSREKRRYNDMVLEQRVIELTKENHVLKAQLDAIRDKFNISGENLVSVEKILASLPTSEQVLSNTKRAKMSSNSSASSSSSSSASSTSSSSSPTAHTHSSYGGALAPPLSPIMYAANSRLNESAGVAGAAVAAASIKSAHHVQQLQHATQAPTAAAAVAPLAAAAAAAAQAVTHTHPHTHAYQQQVQQQQQQQQQQQQQQQQTTMHHPDASPAIANLHVLQQALHRNVRPEDLDSLRKVVAVGALYNAAGVGATPSSAGNNAIYAPGPAASAAAAAAYVAISKEQLEVASYLQSHNVVVESSSVSSSGGAVDAVSSSCSSVVSSAAASVLNLSRRGACSSPSYEHMLSSTTSSTSSAASSASSSGAVSGDDEQEHDMTDDSAHNTHHHPHQHPHQHQHQHPHHHHHPHGVHLAATLQRTSPQHGGSNSNSNNNGASDANNCLPLKLRHKSHLGDKDAAATALLSLQHIKQEPSCNLRASPPAWNDGGDNSSDERDSGISIASAEWTAQFQRKLLAPKDPASVSATTSSSSSAVASSVAVSAVAGSNVGGSNVDRDQMLKSQLERLESEVASIKSMIILAE

Similar Transcription Factors

Sequence clustering based on sequence similarity using MMseqs2

100% Identity: iTF_00498621;
90% Identity: iTF_00564405;
80% Identity: -