Basic Information

Insect: Parnassius apollo
Gene Symbol: cnc_1
Assembly: GCA_907164705.1
Location: CAJQZP010000945.1:6924165-7128799[+]

Transcription Factor Domain

TF Family: TF_bZIP
Domain: bZIP domain
PFAM: AnimalTFDB
TF Group: Basic Domians group
Description: bZIP proteins are homo- or heterodimers that contain highly basic DNA binding regions adjacent to regions of α-helix that fold together as coiled coils
Hmmscan Out: # of c-Evalue i-Evalue score bias hmm coord from hmm coord to ali coord from ali coord to env coord from env coord to acc

1 2 3 4.5e+03 -1.6 1.6 21 37 421 437 408 443 0.73

2 2 1.2e-12 1.8e-09 38.1 7.1 3 58 932 994 930 998 0.81

#	of	c-Evalue	i-Evalue	score	bias	hmm coord from	hmm coord to	ali coord from	ali coord to	env coord from	env coord to	acc
1	2	3	4.5e+03	-1.6	1.6	21	37	421	437	408	443	0.73
2	2	1.2e-12	1.8e-09	38.1	7.1	3	58	932	994	930	998	0.81

Sequence Information

Coding Sequence: ATGATCGCCTTGAAGAAGTTGTATGGAGACGAGCTGTTGCGTCTCGCGTTAGTTCTCAGCCTCCTGAAGTCCAACCCGGACGAGTACCTGCAGGACGAAACACAACAGCTGATCGCCGGCTTGAACATATCCAACGGATCCGATTGGTCGTTAGAGCCGGAGGCGAGGACACTGATCCGACCGAGGTTCGTCCACCCGAAGTCCTTGGACAACATTCTGATCAACTACGAGCGTCAGCTGTTCGAGGAGTTGAACTCCCTCGGACGCTACGCCGATTCGTACATAGAAAACAATGTGCGGATACGAAGCAACAGTGTGCTTCATACATATTTACTAAACGATGTTTCGACGCACACAGTAGCGCCCGCGCTCGCGCCGACGCCGGAGCTCGAAACAGGGCAAGATGGCGTCTCCGCGGACGACAACGTAGCGCAAGAAGTGAAGGTAGACAACGAGGAAACGGAAGAGGGCGCCGCGACCAACCAACCGGACGCAGTGGTGACGCTATCGTCCGATTTCTTCTCGAACCGATCCGAGTCGGACATCTTCGGCGAGATCGCGTCTCGTTCTTTCGATGTCAACGAATTCCTAGTTCAGCCCGCCGAGATGCAGATCAAGAAGGAGTCCCAGGACTCGCAGGAGTCTGATCTGTTAGACGTTATAGTGAAGAAGGAGAGAGAGACTGATGATCTTTATAGCGACAATGCGATCGACGACTTTGTGCCTTACTTTAGTGCTAAAGCTGAAAAATTTGAGATAGGCGAGCCCCACTCCTTGTACCGTCAGAATCTGGCGGATCTACAAGACTATAACGAAATGTTCGAGGACCTTAAGGAGCTTCGGAGCGACCTAGATTTGGATATAAAACAACAGCAAGAGAATCTCGAGCAATATTTGCTGGAGAATACGCCTTTAGATCCCGAGGTTTATGAACTGGCTCCTATGTTTGACGAGGAGTTGGTTTTGGACGTGAAGAGGGAAAGAGCGAGCACCAGTTTCACTTCGGCGAGTTCGAGCGGTGTGAGCGAGATGGACACGTCTTCAACCGGCCTTGACGTAAAGTTGGAGCCGGATGAAGGGCACCATAGTGGCGACGAGCTGACGCAGGagGACATGGATCTCATCGAGGTGCTCTGGAAGCAGGATGTGGATATGGGCTTCTCTCTGGAGGACCCCGTACAGCTGGAGGGTCCtcatgcgacgaaggtggaacttGGCGATGAAATCGCAAAGGAGCTGAAACTAGCCGAGGAGAAGATGCAGAAGAAAAAGGAGGAAACGGAGAAAATCGAGAAGGTGAAGGCTTCGCTTCTGGACCCGGAATCTAACGAGGACGACTCATGGGCCGGCCTCTCCTATACTGTCGACACTGAAACAGGCGAATACGTTATACAAGGTGAGCTGCCGCGCGAGTTGTTCAACACCGAAGAGTCCAGGTTCGATCTTCTAGAAGAAGCGCTCCAACTGGTCGAACTAGGCGACGAGGCAGAGACCAAGGATGAACAGCCAGTGGCGGTAGAGGGCAGCAGTAGCGGCGGCGAGATGTTGCACCCGGCCATGCGGCACGTGCCGCACCACCCGCTAGCTCACTACCACAATCAGTCGCTGATGCGGACGGTCACCACCGAGCAGCGCTGGCAAGACCTCGCATCCTTGCTGACCATTCCGCCGCCGCCGGAGCAGTACCACCAGCATTACCACCAGCATCCACATAACATCAGTGCTCATGGAGCTGCCTCAGGCTACGCCCCCAACTATCATGCACCTATCGCGCCAGTCCCCGAAAAACACCCGGAGGTCTATGGCGCCGCCGCACCGCTAGAGGGCGCTTATAAAGTGGAATCCGCTCATCATCCCCAGCAGCACGATGGTCTCTACTATcagAATTCGAGTGCGGAGATGGCGCCACCGACGAATCAAGATGGCTTCTTGCAGTCCATCCTCAACGACGAAGACCTGCAGCTCATGGACATGGCAATGAATGAAGGCATGTACACGATGCGTATGTTGGACGGGGCGCCCCACATTCCGCCCCACAACCACTCCCATATGGCGATGACTGCCGaaCGCGACTCTGCCTCGGATAGTGCTGTATCCTCTATGGGATCGGAGAGAGTGCCTTCTCTCTCTGACGGTGAATGGTGCGACGGAAACGACTCTGCTCAGGAGTTCCACAGTTCCAAATTCCGGCCGTACGATGGCGCTTACGCTAGAGATAGAGCCCCGCATCCCCCACAGAAGAAACACCATATGTTCGGAAAGAGATGCTTCCAGGAACAACCAGCACCTACGATGGAACCCCTCCCTCGAGCCCCCGGCGTAGTGAAATACGAATGCCCAGAACAGACCTACCATCATGATGCCTTGCATATGCACAACGTGGACTATAACGCTCGTCACCAGATAGCTCCACCTCACGTACCGACTCTACAGCCCGCTTTGGACCTGAACACTGCGCACTCCAGTCAGACTTTGCTACAGACGGGCGTCTCTAGCCCGGTCGGTCGTTATGGCGTGGTGACCAGCGAGCGAGTGCGCCACAATCACACGTACAGCGCACCGCTACCACCCGCCGAGCCTAGACACGTCACGCGAGATAAACGAGTTCGACGGTTGACGGATGGTAGTACGTCCGACGCTGGGTCGGGAGGGTCGCAGCATCTTTCTCGAGATGAGAAGCGCGCTAAAGCACTAGGCATACCGTTGGAGGTGCACGATATAATCAACCTGCCGATGGACGAGTTCAACGAGCGTCTCTCTAAACACGACCTTAGCGAAGCTCAGCTTTCACTCATCAGGGATATTCGACGTCGGGGCAAGAATAAGGTGGCCGCGCAGAACTGCCGCAAGCGCAAGCTGGACCAGATCACGTCTCTAGCGGACGAGGTGCGGTCCGTGCGCGACCGCAAGCTGCGCACGCAGCGCGACCACAGCGCGCTGCTCGCCGAGCGCCAGCGCGTCAAGGAACGCTTCGCGGCCTTGTACAGGCACGTTTTCCAAAACCTCCGTGATCCCGAAGGAAGGCCGCTCTCCTCCAACCAGTACTCACTTCAGCAGGCCGCCGACGGCAACGTGGTACTCGTACCAAAGATGCAGCAGCATCCCGATCACCCGATGAATCGCACCTCAGACGACGAGATGGACCGAAGAGCAAAGCACTACGAGCAATGA
Protein Sequence: MIALKKLYGDELLRLALVLSLLKSNPDEYLQDETQQLIAGLNISNGSDWSLEPEARTLIRPRFVHPKSLDNILINYERQLFEELNSLGRYADSYIENNVRIRSNSVLHTYLLNDVSTHTVAPALAPTPELETGQDGVSADDNVAQEVKVDNEETEEGAATNQPDAVVTLSSDFFSNRSESDIFGEIASRSFDVNEFLVQPAEMQIKKESQDSQESDLLDVIVKKERETDDLYSDNAIDDFVPYFSAKAEKFEIGEPHSLYRQNLADLQDYNEMFEDLKELRSDLDLDIKQQQENLEQYLLENTPLDPEVYELAPMFDEELVLDVKRERASTSFTSASSSGVSEMDTSSTGLDVKLEPDEGHHSGDELTQEDMDLIEVLWKQDVDMGFSLEDPVQLEGPHATKVELGDEIAKELKLAEEKMQKKKEETEKIEKVKASLLDPESNEDDSWAGLSYTVDTETGEYVIQGELPRELFNTEESRFDLLEEALQLVELGDEAETKDEQPVAVEGSSSGGEMLHPAMRHVPHHPLAHYHNQSLMRTVTTEQRWQDLASLLTIPPPPEQYHQHYHQHPHNISAHGAASGYAPNYHAPIAPVPEKHPEVYGAAAPLEGAYKVESAHHPQQHDGLYYQNSSAEMAPPTNQDGFLQSILNDEDLQLMDMAMNEGMYTMRMLDGAPHIPPHNHSHMAMTAERDSASDSAVSSMGSERVPSLSDGEWCDGNDSAQEFHSSKFRPYDGAYARDRAPHPPQKKHHMFGKRCFQEQPAPTMEPLPRAPGVVKYECPEQTYHHDALHMHNVDYNARHQIAPPHVPTLQPALDLNTAHSSQTLLQTGVSSPVGRYGVVTSERVRHNHTYSAPLPPAEPRHVTRDKRVRRLTDGSTSDAGSGGSQHLSRDEKRAKALGIPLEVHDIINLPMDEFNERLSKHDLSEAQLSLIRDIRRRGKNKVAAQNCRKRKLDQITSLADEVRSVRDRKLRTQRDHSALLAERQRVKERFAALYRHVFQNLRDPEGRPLSSNQYSLQQAADGNVVLVPKMQQHPDHPMNRTSDDEMDRRAKHYEQ

Similar Transcription Factors

Sequence clustering based on sequence similarity using MMseqs2

100% Identity: iTF_01142880;
90% Identity: -
80% Identity: -