Basic Information

Insect: Zaprionus africanus
Gene Symbol: cnc_1
Assembly: GCA_018151435.1
Location: JAECXB010002309.1:1738233-1756839[-]

Transcription Factor Domain

TF Family: TF_bZIP
Domain: bZIP domain
PFAM: AnimalTFDB
TF Group: Basic Domians group
Description: bZIP proteins are homo- or heterodimers that contain highly basic DNA binding regions adjacent to regions of α-helix that fold together as coiled coils
Hmmscan Out: # of c-Evalue i-Evalue score bias hmm coord from hmm coord to ali coord from ali coord to env coord from env coord to acc

1 4 0.84 8e+02 -0.0 4.5 26 60 392 431 384 435 0.59

2 4 1.9 1.8e+03 -1.1 0.2 23 37 586 600 582 605 0.83

3 4 0.13 1.2e+02 2.6 6.6 27 60 624 657 615 660 0.89

4 4 1.3e-17 1.2e-14 53.8 4.6 3 62 1449 1508 1447 1511 0.94

#	of	c-Evalue	i-Evalue	score	bias	hmm coord from	hmm coord to	ali coord from	ali coord to	env coord from	env coord to	acc
1	4	0.84	8e+02	-0.0	4.5	26	60	392	431	384	435	0.59
2	4	1.9	1.8e+03	-1.1	0.2	23	37	586	600	582	605	0.83
3	4	0.13	1.2e+02	2.6	6.6	27	60	624	657	615	660	0.89
4	4	1.3e-17	1.2e-14	53.8	4.6	3	62	1449	1508	1447	1511	0.94

Sequence Information

Coding Sequence: ATGTGCGAAAATCTTGGTGACTTTGGTCAGGCAAAGTCGGAGCTATTGAATTTATACGACGATATGGGAACTCACCTAGGGGAGATTGTAGAGCAATTGCAGCAGCTGCCCGGTCTGGAGGATCAGCTAAAGGAGCGCATTGGGCGACAACTTTCGACATGCATAGAGAAAATCGCATCGATTGGTGAAATGCTGCAGCGAAAGCACATGAAGGTTGCGTTCTTTGGTCGCACATCGAATGGGAAGAGCGCTGTAATCAATGCCATGTTGCATCAACGCATCTTGCCCAGCGCCATGGGGCATACCACGAGTTGCTTCTGCCAGGTGGAGGCGTGTGCTCGGGCAGAGCCAGCACATGTGTTGATCGAAAGGGAGGGGTCGGAAGAGGAGGCAGAGTTGGAACAGCAGCTCAGCATAGATGCACTGCGTCACTTGGCCAGTGCCCACTCAGCTCAAGCGCTCAGTGCGCATCGCATGCTACGCGTGCGTTGGCCCAGCAGCAGTTGCCGCCTGCTGGCACACGATGTTGTCCTACTGGACACTCCCGGCGTGGATGTGACGGCGCAACTGGACGCGTGCATCGATCGTCATTGCCTCAATGCGGATGTGTTTGTGCTGGTGTTGAATGCAGAGTCAACCATGGCACGTGTGGAGCGACAATTCTTCGAGTCGGTGGCGCAGCAATTATCACGTCCTAATCTCTTTATCTTGAACAATCGTTGGGATGTGGCAGCCAGTATGGAACCACAACTGGAGCAGCTTGTGCGGCAGCAGCACACAGAACGTTGTCTACGCCTGTTGATCGAGGAGCTGGGCATCTACTCGAGCGTGGAGCTTGCCAGCAGACGCATCTTTCATGTCTCTGCTCTGGAAACACTGCGAAAGCGTCAGCAGAGATCTGGGCAGGAAGATTTATTCCTGCATGCACCTGGAGCACGCCAGCGTTACGAGGAATTCTTGAACTTCGAACGTGAATTCTCTGCATGCATCACACAGAGTGCAATGCGAACTAAATTCGAGCAACACTGTGCAGGTGCCCAGGACATGCTACGCCAACTAGGCGAACTGCTGCAGCAGCTCCTCGGAGGCCTGGACGAGTTTAGTGAGGAGCAAAGCACAGCGGAAGCAGCGCTGGTACAGCGTTTCGAGTGTTGGGAATTGCAAATCATGCAGAGGCAACGCCAGCTCGTGTTGGAAGTGGAACAACTCAGTGAGGAGACAACACGACTGAGTACGCAACTGTTGCAAGAACAAATCGCTCGTTTGCCTGCTGCAGTACAACAATACGAGGGGCAGTTACAGCTCCAAAATCTTCAACACTATCAGCGCTTGCTCGGCGTTCACTTGGAGCGTGTGTTCAGGGAACAATTGGAGGCGCAGCTGGGGCAGCAACTGCAGAGGAAAATAACGGAATTGGGGCACAATTTGATACCTTGGCAATTCTATTGCTGCGTGGACTGCAGAACTTTGATGTCTGATTTCGAGGTGGATCTGCAGTTTCGCTTCTCGTGGGGATTAGCGGCAATGCTGAAGCGCATACAGGCCAAGTTGCAAGCAGCGCCAGGTGTGCCGGACTTGCAGCCCCTCATGGATGCACCTCATGATGGCTCCTCCATGGGCGCAATGCTGTTGCTGAGTGGCCTCTTGGCGCGCTGCCTTGGCTGGCGTCTGCTGTTGGGCGTCACTGGTGTCATGGGTTCCTTCTATGTCTACGAATTGTGCAGCTGGACACAAGAGGCACAGGAGCGCAGCTATAAAGTGCAATACACGCAACATTTGCAGCAAAAACTTCGTGAACTGCTGCCACAAACTGCCGGCGCTTTTGGCCAGCAGGTGAGGCATCAATTGACGCAAACAATGCGCGAATTTAGCGCGGAAACGGAACAAAGTCGACGCGAGTTGAGCGCAGATCAAGCTAAACTCAAGTTGCAACTGGAGCAGCTGCAGCGAGCGCAGCACCGACTGAGGGACTTGCAAGTGGCAGGTGAAATGTTGCAGCAACGACTCGATGCATTTCGTGGGCGCTACTTGCCGGAGAGTGAATACGTTCGCTTGCCGCTGGATGAGTTGCTCAACGACGTGTTGCAGCTCTCTCAGTTTCCACTTGAAGACGACGAGCTACCCAACGACTCCATTGCATCGACTTCGCAGGCCGCAGCTGCTGCCGCATTGAACAAACCGGTGCCGCGTATTGTCTCTGAAACTGGTGAGGATCTTGTCTTTAGTGACCCGGATAGCGATTTACAGGACAAGCAGAACAACAGCAACAACAACGAGGCCAATTTCAGTGGCAGCGACTTTGAGGATCTACAGGATTCTGTGGGCTCGCCCTTGTTTGATTTAGATGAGGAGGCCAAAAAGGAATTAGACGAAATGTTGCAATCGACTGCGCCGCCCTATCATCATCATGGTCATCCCCATGGGCCACATCCCCATTCGCATCATCATGCTGCGGCTGCTGCTCACCATCATCATGCCGCCCACCATGCACACCACGCCCATGCGGCTGCAGCGGCAGCTCACCAGCGTGCCGTGCAGCAGGCAGCAAGCGCCAACTATGCCACCGTGGGCAGTGCCAGCGGCAGCGCCTTCCAGCGTCAGCCGCCAACTTCGGCTGGTTTCCATCATGGACATCATCAGGGCCGCATGCCGCGTCTGAATCGCAGCGTCTCCATGGAGCGTCTACAGGATTTGGCCACCTACTTTAGTCCCATACCCAGCATGGGCGTTGTCGGGGGAGTTTCGGATATGCCCCCATATCCGCCACCACCACCGCCGCCACACTACTCGGGCTACTCGTACCAGACGGCCTCAGCCTCGGCTGCCAGTGCCCAGCATGCTGCCCAATATGGTCAAGCGGCGGCAGTGGCTGTTGCTGGTGGTTCTCTGGCACCGCCACCACCACCACCACATCATGGACATGGACACGGACATGGACACCATGCCATGTTGCATGCCACCAACTCTGCACTGGGCGATCTCTGCTCGGCTGCCGCTGCTGGTGGACAACCGCACTATGGACACAATTTGGGCTCAGCTGTGTCGTCCAGCATGCACTTGACCAACTCCAGCCATGAGGCTGATGGAGCTGCTGCTGCTGCCGCTGCCGCCGCAGCTGCTGCGGCTCATGCCGGCAGCAATTACAAGATGGAGCATGAGATGATGTATTATGCGAACACCTCGTCGGACATGAATCACACCACGGATGGCTTTATCAACTCCATTTTCAACGATGAAGATCTTCACTTGATGGACATGACGGACAGTTTCTGTCGCATGGTGGACAACAGCACCAGCAACAACTCATCCGTACTGGGCCTGCCCAGCAGCGGACATGTGAGCAACGCGGGCAGCGCCTCCAATGTGAATGTGAATGCCGTTGGTGCCGGTGTTGGTGTTGGTATTGCAGGAGGACTTGGCGGAGTCGGTGGTGCCTCCTCTATGAGTGGTGCAACTGCTGTGGGCGGTGGTGCTGGTGCTGGTGGCATGACCAGCGATCTATTGGCAAACTCTGCTGGCGCTCAGGGTGGTGGTGCCACTGATCGTTTAGACGCATCCAGTGACAGCGCTGTGAGTTCGATGGGTTCCGAGCGAGTGCCATCACTCTCCGATGGGGAGTGGGGTGAGGGATCGGACTCTGCACAGGATTATCATCAGGTGAAATACGGAGGACCCTATGACTTTAGTTACAACAACACACGTCAGCCACCAGTGGCACAGAAGAAGCATCAACTGTATGGAAAGCGTGATCTGCACAAGCAAACGCCGCCAACAGCTCCAGCAGTTGCTACTGCCACAGCCCAGTCCCAACAGCAGCAACAGCCACAGCAGGCTCAGGTGCAGAGCATCAAGTACGAGTATGAGGCAGCCGGCGGTGCTGGTGCTGCCTCCTTTGCCGGTGGTGCATCGGCAGTTACGGCAGCAGCAATGGCACCAGCTCTGTCCAAGGATTATCATCAGAGCTATGGCATGAGCGCTAGCAGCGCCTTCACAGCTGATTACGGTGTGCCACGTGCCCCACTGACGCCACATGATTTGGTGCAGCTGAATCACACTTACTCGCTGCCACATGGCACCAATGGAGCATTGCCCCAAGGAAGTGGATCGTTGTCAAGACCGCAGGCACGCGATAAGAAACCAGTGGGAGGCACAAAATCGATGGGGAAATCAGGATCAGGCAGCAGCAATGGATCGATGACGGAGGAGGAGCATTTGTCGCGGGATGAGAAGCGTGCACGCGCCTTGAACATTCCCATTCCGGTCGGGGATATCATCAATTTGCCCATGGATGAGTTCAATGAGCGCTTGTCCAAGTACGATCTGAGCGAGAATCAATTGTCTTTGATTCGCGATATTCGGCGTCGTGGCAAGAACAAGGTTGCCGCACAGAATTGCCGCAAGCGCAAGCTGGATCAGATACTCACGCTGGAGGATGAGGTGCAGACGGTGGTGAAGCGCAAGGCGCAGCTGAACCAGGAGCACGATCATCTGGAGGGTGAACGCAAGCGTATTTCCAACAAGTTTTCCATGCTACATCGACATGTTTTCCAGTATCTGCGCGATCCCGAGGGCAATCCCTGCTCCCCGGCGGACTACAGTCTGCAGCAGGCCGCAGATGGTTCTGTCTACTTGCTGCCACGTGACAATTACTTGTACTACTGA
Protein Sequence: MCENLGDFGQAKSELLNLYDDMGTHLGEIVEQLQQLPGLEDQLKERIGRQLSTCIEKIASIGEMLQRKHMKVAFFGRTSNGKSAVINAMLHQRILPSAMGHTTSCFCQVEACARAEPAHVLIEREGSEEEAELEQQLSIDALRHLASAHSAQALSAHRMLRVRWPSSSCRLLAHDVVLLDTPGVDVTAQLDACIDRHCLNADVFVLVLNAESTMARVERQFFESVAQQLSRPNLFILNNRWDVAASMEPQLEQLVRQQHTERCLRLLIEELGIYSSVELASRRIFHVSALETLRKRQQRSGQEDLFLHAPGARQRYEEFLNFEREFSACITQSAMRTKFEQHCAGAQDMLRQLGELLQQLLGGLDEFSEEQSTAEAALVQRFECWELQIMQRQRQLVLEVEQLSEETTRLSTQLLQEQIARLPAAVQQYEGQLQLQNLQHYQRLLGVHLERVFREQLEAQLGQQLQRKITELGHNLIPWQFYCCVDCRTLMSDFEVDLQFRFSWGLAAMLKRIQAKLQAAPGVPDLQPLMDAPHDGSSMGAMLLLSGLLARCLGWRLLLGVTGVMGSFYVYELCSWTQEAQERSYKVQYTQHLQQKLRELLPQTAGAFGQQVRHQLTQTMREFSAETEQSRRELSADQAKLKLQLEQLQRAQHRLRDLQVAGEMLQQRLDAFRGRYLPESEYVRLPLDELLNDVLQLSQFPLEDDELPNDSIASTSQAAAAAALNKPVPRIVSETGEDLVFSDPDSDLQDKQNNSNNNEANFSGSDFEDLQDSVGSPLFDLDEEAKKELDEMLQSTAPPYHHHGHPHGPHPHSHHHAAAAAHHHHAAHHAHHAHAAAAAAHQRAVQQAASANYATVGSASGSAFQRQPPTSAGFHHGHHQGRMPRLNRSVSMERLQDLATYFSPIPSMGVVGGVSDMPPYPPPPPPPHYSGYSYQTASASAASAQHAAQYGQAAAVAVAGGSLAPPPPPPHHGHGHGHGHHAMLHATNSALGDLCSAAAAGGQPHYGHNLGSAVSSSMHLTNSSHEADGAAAAAAAAAAAAAHAGSNYKMEHEMMYYANTSSDMNHTTDGFINSIFNDEDLHLMDMTDSFCRMVDNSTSNNSSVLGLPSSGHVSNAGSASNVNVNAVGAGVGVGIAGGLGGVGGASSMSGATAVGGGAGAGGMTSDLLANSAGAQGGGATDRLDASSDSAVSSMGSERVPSLSDGEWGEGSDSAQDYHQVKYGGPYDFSYNNTRQPPVAQKKHQLYGKRDLHKQTPPTAPAVATATAQSQQQQQPQQAQVQSIKYEYEAAGGAGAASFAGGASAVTAAAMAPALSKDYHQSYGMSASSAFTADYGVPRAPLTPHDLVQLNHTYSLPHGTNGALPQGSGSLSRPQARDKKPVGGTKSMGKSGSGSSNGSMTEEEHLSRDEKRARALNIPIPVGDIINLPMDEFNERLSKYDLSENQLSLIRDIRRRGKNKVAAQNCRKRKLDQILTLEDEVQTVVKRKAQLNQEHDHLEGERKRISNKFSMLHRHVFQYLRDPEGNPCSPADYSLQQAADGSVYLLPRDNYLYY

Similar Transcription Factors

Sequence clustering based on sequence similarity using MMseqs2

100% Identity: -
90% Identity: -
80% Identity: -