Basic Information

Insect: Euglossa dilemma
Gene Symbol: nfil3_1
Assembly: GCA_002201625.1
Location: NIJG01000123.1:2733024-2753938[+]

Transcription Factor Domain

TF Family: TF_bZIP
Domain: bZIP domain
PFAM: AnimalTFDB
TF Group: Basic Domians group
Description: bZIP proteins are homo- or heterodimers that contain highly basic DNA binding regions adjacent to regions of α-helix that fold together as coiled coils
Hmmscan Out: # of c-Evalue i-Evalue score bias hmm coord from hmm coord to ali coord from ali coord to env coord from env coord to acc

1 3 2.6e-11 1.8e-08 34.0 2.9 2 42 73 113 72 123 0.94

2 3 3.7e-14 2.6e-11 43.1 0.7 2 60 155 213 154 217 0.92

3 3 0.89 6.1e+02 0.3 0.1 40 52 417 429 408 433 0.59

#	of	c-Evalue	i-Evalue	score	bias	hmm coord from	hmm coord to	ali coord from	ali coord to	env coord from	env coord to	acc
1	3	2.6e-11	1.8e-08	34.0	2.9	2	42	73	113	72	123	0.94
2	3	3.7e-14	2.6e-11	43.1	0.7	2	60	155	213	154	217	0.92
3	3	0.89	6.1e+02	0.3	0.1	40	52	417	429	408	433	0.59

Sequence Information

Coding Sequence: ATGGTGGCAGAAATTGTCGCCCGTCAGAGTGGATCGCCCATCAATGGTGAGACCGCGTGCCTGAACAGCAATATGCCGGCCACCCACACAATGGCGCACGCCGGTCACGGTGCCCAACAGGTGACACACCCAGAAAATTTCCCCCCGAACTTCGACATCAGAAAAGAGCTATTTTCTCAGCGCAAGCAACGGGAGTTCATTCCGGACAACAAGAAGGACGACAGCTACTGGGACCGCAGGAGGCGCAACAACGAGGCTGCCAAACGGTCTCGAGAGAAGAGGCGCTTCAACGACATGGTGCTCGAGCAGCGAGTGATGGAGCTCAGCAAGGAGAACCACATNCACCTGCACCACGACGCCCAACAGGTGACACACCCAGAAAATTTCCCCCCGAACTTCGACATCAGAAAAGAGCTATTTTCTCAGCGCAAGCAACGGGAGTTCATTCCGGACAACAAGAAGGACGACAGCTACTGGGACCGCAGGAGGCGCAACAACGAGGCTGCCAAACGGTCTCGAGAGAAGAGGCGCTTCAACGACATGGTGCTCGAGCAGCGAGTGATGGAGCTCAGCAAGGAGAACCACATCCTCAAGGCGCAACTCGAGGCGATACGGGATAAGTTCGGGATATGCGGCGAGTCCGTGATCAGCACCGAGCACGTGCTCGCAGCGCTGCCCGCCGAGCCGCCCATCAGCGTCAAGAGGGCCAAGCTTCCGGCTTCCACCGCGCTCCTCTACGCCAGAACACCGAGCCCCGTGCACACCTCGGTCATCCATCAGCCCGTCAGCGGCGCCCGGTCCCCGAGGTCGCCTGCACAGCTTTACGTCCCGGAAACCACCACCTACCCCGAAGCCGAGAGCTTTCAATACCCCTATTCTCACCCGGCGATGCACCTCGACACGTCTAGCGCTCTGAACCTGTCGCGCGGACGACGCGCTCAATCGCCGTTCGAGCTCTCCTCTGGAAGCGGGGACGAGGGGCCACAGCTGGTGGTCAGCTCGCAGAACCCAGCGGCCAACAACAGCCTGCCTCACAAGCTCAGGCACAAGTCCCGCATCGGTGACAAAGACGCGGCAAGCGCGCTGCTCGCGCTGCAAGGCATCAAGCAAGAACCAGGACCAAGGGCGTCCCCGCCGTGGGACAACGAAGGTTCCAGCGACGAACGCGACTCTGGCATTTCCCTGGGGGCCGAATGGACCGGCCCGACCGTCTCCACCGTTCCCGAGAGCGAGAGGGAGGTGAAGTCCAGGCTGGACCGTCTCGCCTCCGAAGTAGCCTCCCTCCAGTCGATACTCCGCATCGGCAAACCAGCCGAGAGCAGTCTGGTCACGGGACACTCGTTGCCCGCCAACGCCGCCGTCAATGGTCCGTGA
Protein Sequence: MVAEIVARQSGSPINGETACLNSNMPATHTMAHAGHGAQQVTHPENFPPNFDIRKELFSQRKQREFIPDNKKDDSYWDRRRRNNEAAKRSREKRRFNDMVLEQRVMELSKENHXHLHHDAQQVTHPENFPPNFDIRKELFSQRKQREFIPDNKKDDSYWDRRRRNNEAAKRSREKRRFNDMVLEQRVMELSKENHILKAQLEAIRDKFGICGESVISTEHVLAALPAEPPISVKRAKLPASTALLYARTPSPVHTSVIHQPVSGARSPRSPAQLYVPETTTYPEAESFQYPYSHPAMHLDTSSALNLSRGRRAQSPFELSSGSGDEGPQLVVSSQNPAANNSLPHKLRHKSRIGDKDAASALLALQGIKQEPGPRASPPWDNEGSSDERDSGISLGAEWTGPTVSTVPESEREVKSRLDRLASEVASLQSILRIGKPAESSLVTGHSLPANAAVNGP

Similar Transcription Factors

Sequence clustering based on sequence similarity using MMseqs2

100% Identity: iTF_00227715;
90% Identity: -
80% Identity: -