Basic Information

Insect: Drosophila austrosaltans
Gene Symbol: cnc_1
Assembly: GCA_035045865.1
Location: JAWNOQ010000180.1:7787934-7821699[+]

Transcription Factor Domain

TF Family: TF_bZIP
Domain: bZIP domain
PFAM: AnimalTFDB
TF Group: Basic Domians group
Description: bZIP proteins are homo- or heterodimers that contain highly basic DNA binding regions adjacent to regions of α-helix that fold together as coiled coils
Hmmscan Out: # of c-Evalue i-Evalue score bias hmm coord from hmm coord to ali coord from ali coord to env coord from env coord to acc

1 3 0.046 72 4.2 2.5 28 59 800 831 794 836 0.78

2 3 0.57 8.9e+02 0.7 0.8 36 54 880 898 868 901 0.65

3 3 8.9e-16 1.4e-12 48.1 5.7 3 62 1745 1804 1743 1807 0.94

#	of	c-Evalue	i-Evalue	score	bias	hmm coord from	hmm coord to	ali coord from	ali coord to	env coord from	env coord to	acc
1	3	0.046	72	4.2	2.5	28	59	800	831	794	836	0.78
2	3	0.57	8.9e+02	0.7	0.8	36	54	880	898	868	901	0.65
3	3	8.9e-16	1.4e-12	48.1	5.7	3	62	1745	1804	1743	1807	0.94

Sequence Information

Coding Sequence: atgtttcatttgGCACTGGCCTTGAGCCTATTGCATGTCGATCCCGATTATTTGTTACGCCGTTGGGATAGGGACTCTCAATTGGAATTGTCCCATCATGGCGATGGCAATTGGGAACTGGAAATGTTGCGTACCGTTCCCATGATTGAGACGCAACATCCGTATGGTAATCGCAAAGATATCCATCCACGATTACGAATTGAGGACTTTTTACCCTTTTATGAAATCGGTGATACTGATGGCAGAGCTGGGGAAGGCAAATTACCAACCATTTTTAATGCCAGCGCCTTGGTGATGAATCTACATAATACAACGGGGAATAGTAGTATCCAGACAAGTGCTCTGCAGGATATGCAAAGTACTTCAGGCGGAGGAGCATCTGGTAATACAGTTGTCGGTGGATCAAGTGCATCTAGTGGCGGTGGCGTTGCTAATGGCGGTTCGTCAAGTGGCTCAACCTTGGGTGAATTACACATAGACACTACTTCTCGTTCCACTGGTCATAATCATAGTTACAATTTACTTGCTGGCGGCTCGACTTTTGGTGATCAGGCCAGTTTTCCGCCATCTGCGAATCAGGAAACACGCTCGATATGGGAACAAAACCTGGCCGATCTTTTGGACTTTAACGATTTGCCCCCACTGGCCAGTCCATATGCCAATTTGCCGCTCAAAGATGGTCAACAACAGTCACCGAATAACACTCAATTGGATCTCAGTTTAGCAGCTTTGCTCCATGGTTTTGCCGGTGGCCTTACAGCAGTAGAAGGTACTAATGCCTTGAATGATAGTACTCCTCATCCTAGTAATGTTGGCAGTTCGATTGTGGAACAATTTGGTCCCGATGGCTcagaggatgatgatgatctaCTACTCAATCGTCTGTTTCGTGAAGAAAATGATCaggatgataatgatgacaaTGAAGTGGATAGAGCCATAGGTTGTGGAATTGCCAATGCCTGTGCGGTTGAGGGACTAACCTCCAATGAACCCTTTATCAATGAGGTGGAAGTCGCCAACGAGTTGCACGAGGAGGAAAAGGAGAAAGAGAACGACGAGGAGGAGGAGGAGAGCGAAATCGCTGAGGTTCTCTACAAGCAAGATGTGGATTTGGGCTTTAGTCTCGATCAGGAGAAGATTATCAATGCCTCCTTTGCCAGTGGCAATAGTGCTGGTACCGATGCGGCCAAAGCCAATCTGGAGAATGGCAAACCCAATGCCGATCCTTCGATTGCATCCAATTcaaatgatgatgaaaataacaagaataaaatggataatgatgatgatattgaGAAGCTGAAAGCTTTGGAGGAGCTTCAACAAGAAGATATGgcaagtaaaaacaaaaagAACAAGATTAATGAAAAGGATTCCAATCCGTTGAGCGATATAACTAATGAGTGGAATGGCATACCCTTTACTATTGATAATGAAACTGGCCAATTGGATAGCTACAGTCGTAGAATTGTTACCATTGCTCATGTCCTGGAAAGGAAACGCATGAAAATTGCCTTCTTTGGGCGCACTTCGAATGGCAAATCAGCTGTAATCAATGCCATGTTGCATCAGAAGATATTGCCAAGTTCCATGGGGCATACAACAAGTTGTTTCTGTCAAGTGGCAGCCACAGAAGAATCTGAACCATATGTTTGCCTTGAAGGTGATAACGAAAGATTGGATATACATTGCTTGAACATATTGGCAAATGCCCATTCCAGTAAATCCCTGGATGCTCGAACATTGCTCCATGTTAATTTACCCAAAATGGGAAATTGCAGTTCCTTCTTGCAACATGATGTGGTCCTAATTGATACTCCAGGAGTGGATGTTACCGTCCAATTGGATGATTACATTGATCGTTATTGTCTTGATGCGGATGTCTTTGTGTTGGTTTTGAATGCCGAGTCCACGCTCTCTCGTGTGGAGCAAGAGTTCTTTATGGAAGTATCTCAGAAGCTATCGAAACCAAATCTTTTTATACTCAACAATCGCTGGGATGTGGCATCTAGTCAAGAGCCAGAAATAGAGGAACTAGTGCGAGAGCAACACATGAAACGTTGCCTTGAATTACTTAAAGTGGGAATAATAGAGGAGGATAAAGAGACCATGCAACGCATCTTCTATGTGTCCGCTTTGGAGGCATTGCAAATCCGCTTGGGCAATAAGAAGAATATGTCCCAAGCAACTGTGATTCGTTACGAGGAGTTTCTACAATTTGAAAAAGAGTTTGCCAATTGCATAACAGCAAAATCGGCCATGAGAACGAAATTTGCAAACCATTGCCAAAGTGCCCAAGAGATGCTAGAGGAActagataatattttaatgaacCTACAAACGGACATAACTGAATTAACTATGGAAAGTTTCCTAAGGAAAACCCTTTTAGCAGCCAGTTTTGAGTGCCGGGAAATGCAAAtcatgcaacagcagcaagaacTCAACACGAAAGTGGAACAGCTAAGTGAGGCGACGCAGCAACTCGGTATACAGGTGCTAAACGAACAGATCTCTCGGTTAACCACTTGGTTGGAAGACTTTCGTATGGCATTCCCAAACCGTAACCAAGACCAGTTAAGGCATTACCAGCGTTCACTTGGATTACATTTGGAGCAAAAGCTGATGAGTCAAGTGCTGGAGCAGCTTTCGGCTCGACTGCAACGGAAAGTGAGCCAGCTGGAAAGTGAAATGGTTATAACACCCGCTTCTCCTTCATTCCAGGTCTACTACATTGTGGATTGTCAAGGGTTGACAGCCGATTTTCAGGCTGATCTTGAATTTCGTTTCTCATGGGGCATTTCAGCCATTTGGCAGCATATTCAAGGCAAAATGTCTGCAACCAGACAACCGAATGACCTAATAATCAAATCCTTAATAATGTCGGAAATGGTTAATTCTAATAATACATCAATGGGAGCAACTTTTGTTATTGGCGGTTTACTCTATCGTTATCTCGATTGGCGTCTTATCCTTGGCCTAGGCACTATATTCTCCTCTGTATATCTCTATGAGTATCTAAGCTGGACAAGATTAGCTCAAGAAGGTGAATACATTCGTTTACCTTTGGATGACTTGCTCAACGACGTTTTGAAACTATCGGAATTTCCTCTCGAAGACGAGCTACCGGACGATTCGATTGCCTCAACTTCTCAGgccgctgctgcagcagcattGAATGGTAATCAGGGTCAGAAGTCGCAAAACAAGCGCATTGTCTCCGAGACCGGTGAAGATTTATTGGATGATAGTGGCAACGTTTTAGTGTCATCCGCTCAACGGGATATTAATAGAAATACTAACGGTCCAAGTCCATCTACTACTGATATTGGGGACGAGAATAGTTTCTCGGTCAGCGATTTTGAGGATTTGCAAAACTCTGTGGGCTCGCCCCTCTTCGATTTAGATGAGGACGCCAAAAAGGAATTAGACGAGATGTTGCAATCAACGGCATCGCCCTACCATCATCCCCATCCCCATAGCCATCATCATGCGGCTCATCCGCAtacgcatcatcatcatgcccatgcccatgcccatcatgcggcagcggcagcagcggcaCATCAACGTGCCGTCCAGGCCAACTATCCAAGTGTGAGTGTGGGCAGCGGCACAGCCAGCGCCTTTCAACGTCAACCAACTGCTGGCGGTTTCCATCATGGACACCATCAGAGCCGCATGCCGCGCCTGAATCGCAGCGTTTCAATGGAACGTCTACAGGATTTTGCGACCTATTTTAGTCCCATTCCCAACATGGATATGCCACCCTATCCGCATTATCCAAGCTATTCGTATCAGAGTCCCACAAGTGGTGCTCCTGCCGCCCAGCATCCATCTGCCCAATATGGACATGGTGCTGCATTGcaaccgccaccaccaccaccaccgcatCATCATGGTCATCATgcagccgctgctgctgccatgtTGCATCCAAATTCAACATTGGGTGATATTTGCTCCTCTGGTCAACCGCATTATGGCCACAATTTGGGCTCAGCTGTGACATCTAGCATGCATCTGACCAACTCCAGTCATGAGGCTGATGCTGGAGCTGCCGCCGTGGCCGCTGCCGGCAATGCCTATAAAATGGAGCACGACATTATGTACTACGGGaatacatctTCGGACATTAATCAAACTGATGGTTTTATGAATTCCATATTTACCGATGAAGATTTACATCTAATGGATATGAATGAGAgTTTCTGTCGCATGGTAGACAATAGTACCAGCAATAACTCTTCCGTTTTGGGATTGCCCAGTAGTGGTCATGGCAACACAGCTCTGGCCGCTGGTGGTAATCATCCCAATGCCGCTAATGCTGGAAATGTTGGTGGCGTTGCCTCTATGAGCACTGGTGGTTCAGCTGTTGGTGCTTCAGGTGGCATGACTACCGATCTATTGGCCAGTGGTGGTGGAGCTGGAGCTCAGGGCGGTAGTGCCGATCGTTTGGACTCTTCCAGTGACAGTGCCGTCAGTTCGATGGGCTCTGAGCGTGTTCCTTCGCTCTCTGATGGCGAATGGGGTGAGGGCAGTGACTCAGCCCAGGACTATCATCAGGGCAAATATGGTGGACCATATGACTTTAGTTACAACAATACACGCATTAGCACAGCTACTCGCCAGCCGCCGGTGGCACAGAAAAAACATCAATTGTATGGCAAACGTGATCCCCATAAGCAAACGCCAAGTGCTCTGCCGCCGACAGTGCCGCCAGTTGCGGCAACGGCCCAAAATATCAAGTATGAGTACGATGCCGGATATGCGGGCATGACCAATGGTGGAGCAGGTGCTGCTAGCTTGCAGCACAATAGCGGTGAAGCTGGCGCTATGGGACCAGCTTTGTCCAAGGAATTTCATCATCAGCCCTATGGCATGGGTGCCAGTAACAGTTTTCCCGGAGATTATACGCCCCGTCCGTCGCCACGCACTACTCAGGATATTGTGCAACTAAATCATACTTATTCGTTGCCCCAGGGCAGTGGATCGCTTCCCAGACCCCAGGCTCGTGACAAGAAGCCTCTGACAGCCACCAAAAATTCATCGAAGGGAGCAGCTGCTGGCAGCGCCAGCACCTTGGAGGACGAGCATCTGACGCGCGATGAGAAGCGTGCTAGATCCATTAATATACCCATACCAGTGACAGAAATCATTAACTTGCCAATGGATGAGTTCAATGAGCGTCTATCCAAATACGATTTGAACGAGAATCAGTTATCGCTTATCCGTGACATTCGTCGGCGCGGCAAGAACAAGGTGGCCGCCCAAAATTGCCGCAAACGCAAGCTTGACCAGATTCTTACCCTGGAGGATGAGGTTCATGCGGTGGTTAAGCGCAAGGCGCAACTAAACAATGATCGCGATCAATTGGATGCTGAACGTAAACGCATTTCCAATAAATTTGCCATGTTACATCGCCATGTGTTCCAGTATCTGCGCGATCCTGATGGCAATCCTTGCTCCCCAGCCGACTACAGTCTGCAGCAGGCTGCTGATGGTTCTGTATATTTATTGCCAAGGGATAAATCCGATAGCAACAGCACAACAACCACTTCATCGAGTTCTGTGTCAGCAACTGGTGGACCAACAACTGCCTCTAGTGGCAGTGGAATTAACGGACATGTGGCCTCACAAGCCCCATTGCATGGTCTACATGGCCAACATCATCAGGGGCAAGTGCAACATGGACCAAATGCACCCATGTCGCAGCAACAAACGCGACTCCCAACGCAtcttcaacagcaacagcagggagcgcatcatcatcatcaacatcaacaggGTCATCCACAGCAATctggccagcagcagcagcatcacaAGGAATGA
Protein Sequence: MFHLALALSLLHVDPDYLLRRWDRDSQLELSHHGDGNWELEMLRTVPMIETQHPYGNRKDIHPRLRIEDFLPFYEIGDTDGRAGEGKLPTIFNASALVMNLHNTTGNSSIQTSALQDMQSTSGGGASGNTVVGGSSASSGGGVANGGSSSGSTLGELHIDTTSRSTGHNHSYNLLAGGSTFGDQASFPPSANQETRSIWEQNLADLLDFNDLPPLASPYANLPLKDGQQQSPNNTQLDLSLAALLHGFAGGLTAVEGTNALNDSTPHPSNVGSSIVEQFGPDGSEDDDDLLLNRLFREENDQDDNDDNEVDRAIGCGIANACAVEGLTSNEPFINEVEVANELHEEEKEKENDEEEEESEIAEVLYKQDVDLGFSLDQEKIINASFASGNSAGTDAAKANLENGKPNADPSIASNSNDDENNKNKMDNDDDIEKLKALEELQQEDMASKNKKNKINEKDSNPLSDITNEWNGIPFTIDNETGQLDSYSRRIVTIAHVLERKRMKIAFFGRTSNGKSAVINAMLHQKILPSSMGHTTSCFCQVAATEESEPYVCLEGDNERLDIHCLNILANAHSSKSLDARTLLHVNLPKMGNCSSFLQHDVVLIDTPGVDVTVQLDDYIDRYCLDADVFVLVLNAESTLSRVEQEFFMEVSQKLSKPNLFILNNRWDVASSQEPEIEELVREQHMKRCLELLKVGIIEEDKETMQRIFYVSALEALQIRLGNKKNMSQATVIRYEEFLQFEKEFANCITAKSAMRTKFANHCQSAQEMLEELDNILMNLQTDITELTMESFLRKTLLAASFECREMQIMQQQQELNTKVEQLSEATQQLGIQVLNEQISRLTTWLEDFRMAFPNRNQDQLRHYQRSLGLHLEQKLMSQVLEQLSARLQRKVSQLESEMVITPASPSFQVYYIVDCQGLTADFQADLEFRFSWGISAIWQHIQGKMSATRQPNDLIIKSLIMSEMVNSNNTSMGATFVIGGLLYRYLDWRLILGLGTIFSSVYLYEYLSWTRLAQEGEYIRLPLDDLLNDVLKLSEFPLEDELPDDSIASTSQAAAAAALNGNQGQKSQNKRIVSETGEDLLDDSGNVLVSSAQRDINRNTNGPSPSTTDIGDENSFSVSDFEDLQNSVGSPLFDLDEDAKKELDEMLQSTASPYHHPHPHSHHHAAHPHTHHHHAHAHAHHAAAAAAAHQRAVQANYPSVSVGSGTASAFQRQPTAGGFHHGHHQSRMPRLNRSVSMERLQDFATYFSPIPNMDMPPYPHYPSYSYQSPTSGAPAAQHPSAQYGHGAALQPPPPPPPHHHGHHAAAAAAMLHPNSTLGDICSSGQPHYGHNLGSAVTSSMHLTNSSHEADAGAAAVAAAGNAYKMEHDIMYYGNTSSDINQTDGFMNSIFTDEDLHLMDMNESFCRMVDNSTSNNSSVLGLPSSGHGNTALAAGGNHPNAANAGNVGGVASMSTGGSAVGASGGMTTDLLASGGGAGAQGGSADRLDSSSDSAVSSMGSERVPSLSDGEWGEGSDSAQDYHQGKYGGPYDFSYNNTRISTATRQPPVAQKKHQLYGKRDPHKQTPSALPPTVPPVAATAQNIKYEYDAGYAGMTNGGAGAASLQHNSGEAGAMGPALSKEFHHQPYGMGASNSFPGDYTPRPSPRTTQDIVQLNHTYSLPQGSGSLPRPQARDKKPLTATKNSSKGAAAGSASTLEDEHLTRDEKRARSINIPIPVTEIINLPMDEFNERLSKYDLNENQLSLIRDIRRRGKNKVAAQNCRKRKLDQILTLEDEVHAVVKRKAQLNNDRDQLDAERKRISNKFAMLHRHVFQYLRDPDGNPCSPADYSLQQAADGSVYLLPRDKSDSNSTTTTSSSSVSATGGPTTASSGSGINGHVASQAPLHGLHGQHHQGQVQHGPNAPMSQQQTRLPTHLQQQQQGAHHHHQHQQGHPQQSGQQQQHHKE

Similar Transcription Factors

Sequence clustering based on sequence similarity using MMseqs2

100% Identity: iTF_00500786;
90% Identity: iTF_00577523;
80% Identity: -