Basic Information

Insect: Scaptomyza graminum
Gene Symbol: cnc_1
Assembly: GCA_018901835.1
Location: JAEIFL010000277.1:7360325-7378392[-]

Transcription Factor Domain

TF Family: TF_bZIP
Domain: bZIP domain
PFAM: AnimalTFDB
TF Group: Basic Domians group
Description: bZIP proteins are homo- or heterodimers that contain highly basic DNA binding regions adjacent to regions of α-helix that fold together as coiled coils
Hmmscan Out: # of c-Evalue i-Evalue score bias hmm coord from hmm coord to ali coord from ali coord to env coord from env coord to acc

1 3 5 4.2e+03 -2.4 0.2 50 64 339 353 327 356 0.67

2 3 6.8 5.8e+03 -2.8 9.7 27 59 615 647 581 650 0.79

3 3 4.5e-17 3.8e-14 52.2 3.0 3 62 1409 1468 1407 1471 0.93

#	of	c-Evalue	i-Evalue	score	bias	hmm coord from	hmm coord to	ali coord from	ali coord to	env coord from	env coord to	acc
1	3	5	4.2e+03	-2.4	0.2	50	64	339	353	327	356	0.67
2	3	6.8	5.8e+03	-2.8	9.7	27	59	615	647	581	650	0.79
3	3	4.5e-17	3.8e-14	52.2	3.0	3	62	1409	1468	1407	1471	0.93

Sequence Information

Coding Sequence: ATGAGTGCAACGCTAAGCGACTTTGGTCAGGCCAAACTGGAGATACTAAATATATACGAGGATATTACGTCGTTTATACAAGAAGTAATGAACGAACTTCAAACAATGCCCAAAAACATGCAACATGAACGGTTACACGAACAACTCTTGAGTAGCATCCACAGAATCAATGCCATTTGCCCCATGTTGCAACGCAAGCGCATGAAAGTTGCTTTCTTTGGACGCACGTCGAATGGAAAAAGTGCCGTAATCAATGCCATGTTGCACAAAAGGATATTGCCTAGTGCAATGGGACATACCACAAGCTGCTTTTGCCAAGTGGAGGCTGGTCAGGAAGATGAAGCTGCTCATGTTATGATTCAGGATGGAAATGGTGAAATGTTGAGCATTGATTGCCTTCGAGATTTGGCCAGCGCTCATTCAGCTCAATCCCTAAGTGCTCAGAGTTTACTTCATGTTCGCTTTCCCAGCAGCAGTTGTGGCTTGCTGGCACACGATGTGGTGCTGCTGGATACACCCGGAGTGGATGTGACCGCCCAGTTGGATGAATGCATCGATCGACATTGTTTGAATGCCGATGTATTTGTATTGGTTTTGAATGCCGAGTCAACAATGTCGCGAGTGGAGCAACAATTCTTTGAGCTTGTTGCGCGTCAACTCTCGAAACCAAATCTTTTTATACTAAACAATCGTTGGGATGTGGCTGCCACATTGGAGCCACATTTGGCAGAGTTGGTACGCGAACAGCATACAGAACGTTGCATGCAACTTCTCGTTGAAGAGCTGGGCATTTATGACAGCCTGGACTTGGCCAGCCGACGCATCTTTCATGTTTCCGCCTTGGAAACGCTGCGCCGCAGAGAGAAAAAGGGCGAAAATCTTAATGCTTTCGGTTCGCAACAACGTTACGAAGAGTTTCTTAACTTTGAACATGAATTTGCTGCTTGCATTACACAAAGCGCATTGAAAACCAAATTTGAGCAACATTGCGTGGGTGCAACCGAGATGTTGCACAAGTTGCACGAACAGCTACAGCAGCTTAGCTCAAACCTAACTCAGCTCTGCGTGAGACAAAATGCAGCTAAAGTTGAGCTTGGCAAAAAGAATGATAGCTGGCAAGTGGAAATCGTGCAACGCCAGCAGCAAGCGGAGTTGCAAGTGAAGCAGCTCGGTATGGAAACTTGCAAGCTTGCCGCTCAGTTGTTGCACGAACAGATCTTACGTCTGCCAACTGCCGTGCAACACTTTCAGCTGCCTCTTCATCCTCAGCGAAAACAATATCAGCGCTTGCTCGGCATTCATTTGAAACAGCATCTCTTGGAGCCTTTGGAGCTGCAACTGCAGCAAAGGTTGCTGCAACTAATCCAACCTCTAACTGATGTGCCTTTTGAGCTATACTCCCCGCTGGATTGTCAAGCATTAATGTCTGATTTTCAAGCTGATTTACAGTTTCGCTTCTCTTGGGGCATGGCAGCCATTTTGAAGCGCATTCAGGAAAAGCTGCCGCTGCCAATTTCAATGCCGCCTAAACAACTAAATGGCCTAAAGCAGGATCAGTTGCAACTTAAACCTTCAACAGATTGTTGTCTATTGGAACAGGAAGGTTCCTTGGGCGCCATGTTACTCTTAGGTGGCGTCTTGGCACGATCTCTTGGCTGGCGTTTGCTTTTGGGACTCGGTTTGCTTACTTCCTCCTTTTATGTCTACGAGCTGCTGAGTTGGACGCCGCAGGCTCAGGTTCGCAGCTATAAGGCTCAATATACGCGCCAATTGCAACGCCGGCTGCGCGAGTGTGTGCAACAAACGGCAACTGGTTTTGGCCAACAGGTGAAACAACATCTGACGCACTCAATGCAACAGCTCAGCGTTGAACTGGAGCAGAATCGCAATGAATTGAACGAGCAATTGAATCGACTCAAAAACCAATTGGACTCGCTTGAAAACTGGCAATTTAAGCTGAAGGAATGGCAAACAAGGGGCGAAACATTAAGGCAACGTTTGCTGGTCTTTAGAATGCGTGAATACATACGCTTGCCTTTGGATGAGCTGCTCAACGACGTGCTGCAACAATTTCCACTCGAAGACGACGAATTAGTTAACGATTCGGTTGCATCCACATCGCAGGCTGCTGCCGCTTTAAGTAGCCAACCGGCATCGCGTATTGCTTCCGAAACTGGTGAGGATTTGGCATTTATTTCCGATATCGATCTTGAGTGCAGCGACCAGGACAACGAGACCAGCTTTTCGGCCAGTGATTTTGAGGATCTGCAAGATTCGGTCGATTCGAATCTGTTCGATTTAGATGAGGAGGCCAAAAAGGAATTAGATGAAATGTTGCAGTCCACAGCACCACCATACCATCACGCTCCCCATCCCCATGCCCATCATTCGCACCACCATGCCGCCGCCCACCACCATGCCCATCATCAGGCGGTGGTTGCCCATCAGCGAGCGGTTCAAGCGAGCGCCAACTATGCCAGCATGGGCAGCTCTACGGGCAGCGCTTTCCAACGCCAGCCGCCAACTTCAGCCGGATTCCATCATGGCCATCATCAGGGCCGCATGCAGCGTTTGAATCGTGGCGTCTCCATGGATCTGGCCACCTATTTTAGCCCCATACCCAGCATGGGCGTCTCCGATATGCCCCCGTATCCACCCCACTATACCGGCTATTCGTACCAGGGACCGGGTGGTGCGGCTGGACCGGGCATGCCACCCAGTGCCCAACAATATGGACAGGCAACGGTTGCGCCACCAACATCATTGCCGCCACCACCGCCGCCGCCGCATCACAGTCACGGACACGGTCACAGTCACACTCACAGCCACAGCCACGGTCATCATGCGGCAATGTTGCATGCAAATTCGACATTGGGCGATCTATGCTCCACTCAACCTCACTATGGCCACAATCTGGGCTCAGCGGTCTCATCCAGCATGCATTTGACCAATTCCAGCCACGAGGCTGACGGAGCTGCTGCGGCTGCTGCTGCCGCCGCCGCGGCTGCTGCTGCTGCAAGTGGCAACTACAAAATGGAACACGAGATGATGTATTATGCGAACACCTCTTCGGACATGAATCACACGGATGGCCTAATGAATTCCTTTTTCAACGATGAGGATCTCCATTTGATGGATATGACGGAAAGTTTCTGTCGCATGGTGGACAACAGCACCAGCAACAACTCTTCGGTCTTGGGTCTGCCCAGCAGCGGGCATGTCAGTAATGCCGGCAGCTCGACTCTGAATGTTGGCAATCATGGAAATGGCAATGGTGTAGCTGCTGTATCGGGCGCTGTACCGGTTGGCATCACATCGATGAGTGGTGGAGCAGCAGCTGCTGTCACTGGAGCCACTGGTGGCATGACCAGCGATCTGCTGGCCAACAGCGGTGCTGGCGCTCAGGGTGCTGGTGCACAGGATCGCTTGGACGCGTCCAGTGACAGTGCGGTTAGTTCGATGGGTTCCGAACGTGTGCCATCGCTGTCCGATGGGGAGTGGGGTGAGGGTAGCGATTCGGCACAGGACTATCATCAGGCCAAGTATGTGGGCCCGTACGATTTTAGTTACAACAACAATAACACCAACAACAATAGTGTCAACCGGCAACCGCCCGTGGCACAAAAGAAACATCAGCTCTATGGCAAGCGGGATCTGCACAAACAGACGCCCAGCGGTGCAGCCCAACAAACACCAGTGGTGCAACAACAGCAACAACAACAGCAGCAGCAGCAGTCGGCTCAATTGCAGCAAAGCATTAAATATGAATACGAAGCGAATGCGGCAGCAGCGTTTATTGCTAACGAAGCAGCTGGCTTGGCACCTGCTTCGCAGGCCAAGGATTATCATCACGCGTATGGCATGAGTGCGGCAAGTGCATTCACCGCCGACTATGGCATGCCACGCCCTCCACTAACGCCGCAGGGCATTATAAACCTCAATCACACCTACTCGCTGCCCCAGGGGCCCGGCGGAGCTCAGCCCCAAGGCAGTGGATCACAAAGCCGACCGCATCCACGCGACAAGAAGCTGTCCACAGGCAGCAAACATGGCTCGAAATCCAGCGACGACAATCTAACCGAGGAGGAGCATCTGTCCAGGGACGAGAAGCGTGCACGCGCCCTCAATATACCCATTCCTGTTGGGGACATCATCAATCTGCCCATGGATGAGTTCAACGAGCGTTTGTCCAAGTACGATTTGAGCGAGAACCAATTGTCGCTGATCCGTGACATTCGGCGACGTGGCAAGAACAAGGTTGCTGCCCAAAATTGTCGCAAGCGCAAGCTGGATCAAATCCTAACACTGGAGGACGAGGTGAACACGGTGGTGAAGCGTAAGGCGCATCTCAATCACGAACGTGATCATCTCGAGAGCGAACACAAGCGCATCTCCAATAAGTTCTCCATGCTGCATCGTCATGTGTTCCAGTATCTTCGCGATCCTGAAGGCAATCCTTGCTCACCAGCTGATTTTAGCTTGCAGCAGGCAGCCGATGGTTCGGTCTATTTGCTGCCACGTGACAAAAACGATAATGGTANNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNCAGCAACAGCAAATGTACGATTATCGCTACGATTTGTACAACAACAGTTACTTGTATTACTGA
Protein Sequence: MSATLSDFGQAKLEILNIYEDITSFIQEVMNELQTMPKNMQHERLHEQLLSSIHRINAICPMLQRKRMKVAFFGRTSNGKSAVINAMLHKRILPSAMGHTTSCFCQVEAGQEDEAAHVMIQDGNGEMLSIDCLRDLASAHSAQSLSAQSLLHVRFPSSSCGLLAHDVVLLDTPGVDVTAQLDECIDRHCLNADVFVLVLNAESTMSRVEQQFFELVARQLSKPNLFILNNRWDVAATLEPHLAELVREQHTERCMQLLVEELGIYDSLDLASRRIFHVSALETLRRREKKGENLNAFGSQQRYEEFLNFEHEFAACITQSALKTKFEQHCVGATEMLHKLHEQLQQLSSNLTQLCVRQNAAKVELGKKNDSWQVEIVQRQQQAELQVKQLGMETCKLAAQLLHEQILRLPTAVQHFQLPLHPQRKQYQRLLGIHLKQHLLEPLELQLQQRLLQLIQPLTDVPFELYSPLDCQALMSDFQADLQFRFSWGMAAILKRIQEKLPLPISMPPKQLNGLKQDQLQLKPSTDCCLLEQEGSLGAMLLLGGVLARSLGWRLLLGLGLLTSSFYVYELLSWTPQAQVRSYKAQYTRQLQRRLRECVQQTATGFGQQVKQHLTHSMQQLSVELEQNRNELNEQLNRLKNQLDSLENWQFKLKEWQTRGETLRQRLLVFRMREYIRLPLDELLNDVLQQFPLEDDELVNDSVASTSQAAAALSSQPASRIASETGEDLAFISDIDLECSDQDNETSFSASDFEDLQDSVDSNLFDLDEEAKKELDEMLQSTAPPYHHAPHPHAHHSHHHAAAHHHAHHQAVVAHQRAVQASANYASMGSSTGSAFQRQPPTSAGFHHGHHQGRMQRLNRGVSMDLATYFSPIPSMGVSDMPPYPPHYTGYSYQGPGGAAGPGMPPSAQQYGQATVAPPTSLPPPPPPPHHSHGHGHSHTHSHSHGHHAAMLHANSTLGDLCSTQPHYGHNLGSAVSSSMHLTNSSHEADGAAAAAAAAAAAAAAASGNYKMEHEMMYYANTSSDMNHTDGLMNSFFNDEDLHLMDMTESFCRMVDNSTSNNSSVLGLPSSGHVSNAGSSTLNVGNHGNGNGVAAVSGAVPVGITSMSGGAAAAVTGATGGMTSDLLANSGAGAQGAGAQDRLDASSDSAVSSMGSERVPSLSDGEWGEGSDSAQDYHQAKYVGPYDFSYNNNNTNNNSVNRQPPVAQKKHQLYGKRDLHKQTPSGAAQQTPVVQQQQQQQQQQQSAQLQQSIKYEYEANAAAAFIANEAAGLAPASQAKDYHHAYGMSAASAFTADYGMPRPPLTPQGIINLNHTYSLPQGPGGAQPQGSGSQSRPHPRDKKLSTGSKHGSKSSDDNLTEEEHLSRDEKRARALNIPIPVGDIINLPMDEFNERLSKYDLSENQLSLIRDIRRRGKNKVAAQNCRKRKLDQILTLEDEVNTVVKRKAHLNHERDHLESEHKRISNKFSMLHRHVFQYLRDPEGNPCSPADFSLQQAADGSVYLLPRDKNDNGXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXQQQQMYDYRYDLYNNSYLYY

Similar Transcription Factors

Sequence clustering based on sequence similarity using MMseqs2

100% Identity: iTF_00524870;
90% Identity: -
80% Identity: -