Basic Information

Insect: Halictus quadricinctus
Gene Symbol: CAMTA2_1
Assembly: GCA_028454245.1
Location: CM052127.1:4684076-4695172[+]

Transcription Factor Domain

TF Family: CG-1
Domain: CG-1 domain
PFAM: PF03859
TF Group: Unclassified Structure
Description: CG-1 domains are highly conserved domains of about 130 amino-acid residues containing a predicted bipartite NLS and named after a partial cDNA clone isolated from parsley encoding a sequence-specific DNA-binding protein [2]. CG-1 domains are associated with CAMTA proteins (for CAlModulin -binding Transcription Activator) that are transcription factors containing a calmodulin -binding domain and ankyrins (ANK) motifs [1].
Hmmscan Out: # of c-Evalue i-Evalue score bias hmm coord from hmm coord to ali coord from ali coord to env coord from env coord to acc

1 2 1.1e-44 2.2e-40 137.1 1.6 1 116 24 135 24 135 0.97

2 2 1 1.9e+04 -6.6 6.1 26 80 288 342 276 357 0.42

#	of	c-Evalue	i-Evalue	score	bias	hmm coord from	hmm coord to	ali coord from	ali coord to	env coord from	env coord to	acc
1	2	1.1e-44	2.2e-40	137.1	1.6	1	116	24	135	24	135	0.97
2	2	1	1.9e+04	-6.6	6.1	26	80	288	342	276	357	0.42

Sequence Information

Coding Sequence: ATGTTTGAAATATTGAAGGGTACGTCGAAGATCGAGATTTCGTATCGTTTGCAATATCGCGGTATCTCTGAGGCCAAAAATGAATGGGTTACGGAAATTGCGGCCATCCTGATCAGTTTCCAAAGACACGCGGAATGGCAGAGTCGGGAGGTAAAGGTGCGACCTCGAAGTGGGTCGATGTTACTGTACTCGAGAAAGAAGGTCCGTTACCGGAGGGACGGTTACTGCTGGAAGAAGAGGAAGGACGGGAAGACGACACGGGAGGATCACATGAAACTGAAGGTCCAGGGGGTCGAGTGCATCTACGGCTGTTACGTGCACTCGGCGATCCTTCCGACGTTTCATCGGCGATGCTACTGGCTACTGCAGAACCCGGACGTCGTTCTCGTTCACTACTTAAACGTTCCTTACCCGGACGGCGATGCGAAGCTAGCTGCGCTGCCTCCCTGTCTCGCTCTACCGCCAGACAAGAAAGAGTGGACGCGAGACGAGCTGGCTTCTCAACTTAGACCCATGTTCCTCGGTGGGGATGACGATCCGAACAATCCTCATCTCACCCAACACTCGAATCATCCCGTCGACATGATCGTTTCGCAGCTGCTCGACAGGCAGCGCGCGAACTCCACTTCCTCCACCACCGGCACTCAGCTTGCACCTAGGAGACTAACACCGGACAATCAGGTAACTTCGACAACCGGAGGGCAGCAATCATCGACGACAGCGTCACCGGCGCCGCGCGTATACTCAAGACATTACCACACGGCCCAAAGCCAGCAGCCGGCTCCTTTAGTgttaagtttgcaacaaatccaaggcggtggcggtcttctgattctgaacagccaaccgtaccaccaccagcagcagcagcaacagcagcaacaacagcagcagcagcagcaacaacagcagcaacaacaacagcagcagcagcagcagcagcaacagcaacagcagcaacagcaacaacagcagcagcagcagagccaacaagtggagatgcaacaggtcacggaacagcagatcgtgcagcagacaaatgtcgaaagggagcaacagatcaaacaggagatcgacgcgcaggagagcatggatcgcaccgcggtgcagacgttgcctatcggtggcgccggcaccgaggtcacCGATTTCGCCGAGACCTTGGATCTGAATCAGGAGGACATCCAACGGACGTTGTCCGCGAACATGGTGCCGCCGTCGCCGTCCCCTTCCCCGGCGGACAACAGCATGATCAATCCGATGGACTTCATCGACTCGTCGGATGACCTGCTGGTCAATCTGGACGCGTTCGATCTGTTCGGCGACCTGCCGGAGCTCCATGACTTCGAGGCCGAGCAGACCAAGGCTGAGGAGAGGGGTGGCTCCGACAACGACGTGGGATGTCATCCGGGTACAACCGTCCATATCGCAGAGTATAGTCCGGAGTGGAGCTACACCGAGGGTGGTGTCAAGGTGTTGGTGGCAGGTCCCTGGACCGGTGGAAGTAATTCGCAGTCGTACTCGGTGTTGTTCGACACTGAGCCGGTCGAGGCATGTCTGGTGCAGCCAGGTGTGTTGCGCTGTCGTTGTCCTGCTCACGCTCCCGGCATAGCGTCTCTTCAAGTAGCCTGCTACGGTTACGTTGTCTCCGACAGCGTCGCCTTCGAGTACCGAAGAGCGCCAACGACCGAACCAAGTCCGGAGAGAGCTTTGCTGGATCGTCTGGCGGATGTCGAGTCTCGTTTGCAAGGACCTGGCCCACCATCCCCTGCAGCTCATCTGGAAGAGCGACTTGTCGCGTATTGTCAGGATGCTGTTGTCCGTCCGTGGCGAGCCGGAGCGGAACCGTTACAATCCGGTGGCACTACTCTGTTGCATTTGGCCGCCGGGTTGGGCTATTCCAGGTTAGCCTGCGCACTCCTTCACTGGAGAGCGGAAAATCCTAGTAGCGTATTAGATGCTGAAGTTGATGCTCTGAGGCAGGACAGCGCTGGTCTCACGCCGCTAGCTTGGGCATGTGCGGCTGGACACGCGGATACTGCCAGGATACTTTATAGATGGAACGCGATGGCGCTTCGTGTTCGCGATTGCCAGAACAGAATAGCGACGGAGCTGGCGGCGGAGAACGGGCACACGGCGATCGCGGAAGAATTGAATCGGCTCGAAGCGAGGCGGCAAGACGAGAGGCTATTCTTGCGGCCGGCCAGCCCTAGTCCTAGGAGGCCATCTCAAGACAGCGGTCTCGATCTGGCGTTGTGTGGCTCCCCGCTGCTGGACAACATGGAGTTGTTGCAAGAGGATGACTCGTCATTAGCCCTCAGCGAGCAGGGAATGGAGAGCGCTCCGACCCCTCAGGAGACTGTAGGGGAGGAAGACGCGAGGGTGCTGACATTGGCTGAGCAAATTATAGCTGCGCTGCCGGAAAGGATCAAGAGAGGGGAAGGTGATTCTCCGTCTTCTTCCTCGCCGCCTCCCCCGGCACCGCCCTTGTCGCCACTCGAGGATGCTCTGATGGAACAAATGCCGCTGGACTCTGGGGAGCTGTTCGACTCGTACCGCGAGTGCAGCGGTGGCGCTGCATCAGTGTCGGACGCTGATGCGGATGCAAGTCCGTCGAGTCCGTCGAGCAGCTGCTTAACACCAGACTCGCCGTCCCCGCCGCCCACCACCGCCGACTTTTGCGAGTTCCTGCAACTGCAATTGCAGCTGGACGGTAGCAACGGTCGCAACGGTCAGTACTACGGCGGGGACCGGAAGTTCGGTAACGTGATCGGGTCCGGTATCTGCGGGTCGATGACCGGTGGCGGTAACGGGTCCGGTGACGGTAGCGAGGCGGACCTGAGCAGGCTGACGTTGTCCGATTGCGAGCAAAGGGAGCTATACCACGCGGCACGCATGATCCAGAAAGCCTATAGAAATTACAAGGGACGACAGAGGCAGGAGGAAGCAGAGAGACACGCCGCCGTTCTCATCCAGCAATATTATCGTCGACATAAACAGTACGCTTATTATAGACAAGCCACGAAGGCAGCTCTGGTGATACAAAGCAACTACCGTAATTATCGGTCCCGGCCCTGCTCGGCGAGCTCCAGACAGCAGGCTGTACACCAACAAGCCGCTCATCAGGCAGCCAGGAAGATCCAGCAGTTCATGCGACAGTCGAAAATCAAGCTGCAGAACGCCAGGGCCGCCGCAAACGGGAACGGGAGGCAGCCAGCGGCCATTTTACGGGGGGTTGCTGTCCCCCAAAGCTCGCCCTCATCTAGCCCAGGGGCCAGCCTAGTAGCCGCCAACCCAGAGGTCACTTAA
Protein Sequence: MFEILKGTSKIEISYRLQYRGISEAKNEWVTEIAAILISFQRHAEWQSREVKVRPRSGSMLLYSRKKVRYRRDGYCWKKRKDGKTTREDHMKLKVQGVECIYGCYVHSAILPTFHRRCYWLLQNPDVVLVHYLNVPYPDGDAKLAALPPCLALPPDKKEWTRDELASQLRPMFLGGDDDPNNPHLTQHSNHPVDMIVSQLLDRQRANSTSSTTGTQLAPRRLTPDNQVTSTTGGQQSSTTASPAPRVYSRHYHTAQSQQPAPLVLSLQQIQGGGGLLILNSQPYHHQQQQQQQQQQQQQQQQQQQQQQQQQQQQQQQQQQQQQQQQQQSQQVEMQQVTEQQIVQQTNVEREQQIKQEIDAQESMDRTAVQTLPIGGAGTEVTDFAETLDLNQEDIQRTLSANMVPPSPSPSPADNSMINPMDFIDSSDDLLVNLDAFDLFGDLPELHDFEAEQTKAEERGGSDNDVGCHPGTTVHIAEYSPEWSYTEGGVKVLVAGPWTGGSNSQSYSVLFDTEPVEACLVQPGVLRCRCPAHAPGIASLQVACYGYVVSDSVAFEYRRAPTTEPSPERALLDRLADVESRLQGPGPPSPAAHLEERLVAYCQDAVVRPWRAGAEPLQSGGTTLLHLAAGLGYSRLACALLHWRAENPSSVLDAEVDALRQDSAGLTPLAWACAAGHADTARILYRWNAMALRVRDCQNRIATELAAENGHTAIAEELNRLEARRQDERLFLRPASPSPRRPSQDSGLDLALCGSPLLDNMELLQEDDSSLALSEQGMESAPTPQETVGEEDARVLTLAEQIIAALPERIKRGEGDSPSSSSPPPPAPPLSPLEDALMEQMPLDSGELFDSYRECSGGAASVSDADADASPSSPSSSCLTPDSPSPPPTTADFCEFLQLQLQLDGSNGRNGQYYGGDRKFGNVIGSGICGSMTGGGNGSGDGSEADLSRLTLSDCEQRELYHAARMIQKAYRNYKGRQRQEEAERHAAVLIQQYYRRHKQYAYYRQATKAALVIQSNYRNYRSRPCSASSRQQAVHQQAAHQAARKIQQFMRQSKIKLQNARAAANGNGRQPAAILRGVAVPQSSPSSSPGASLVAANPEVT

Similar Transcription Factors

Sequence clustering based on sequence similarity using MMseqs2

100% Identity: iTF_00393592;
90% Identity: iTF_00141220;
80% Identity: -