Basic Information

Insect: Culicoides brevitarsis
Gene Symbol: CAMTA2_1
Assembly: GCA_036172545.2
Location: CM070086.1:33013998-33042111[+]

Transcription Factor Domain

TF Family: CG-1
Domain: CG-1 domain
PFAM: PF03859
TF Group: Unclassified Structure
Description: CG-1 domains are highly conserved domains of about 130 amino-acid residues containing a predicted bipartite NLS and named after a partial cDNA clone isolated from parsley encoding a sequence-specific DNA-binding protein [2]. CG-1 domains are associated with CAMTA proteins (for CAlModulin -binding Transcription Activator) that are transcription factors containing a calmodulin -binding domain and ankyrins (ANK) motifs [1].
Hmmscan Out: # of c-Evalue i-Evalue score bias hmm coord from hmm coord to ali coord from ali coord to env coord from env coord to acc

1 3 1.2e-48 8.9e-45 150.9 2.4 2 116 144 256 143 256 0.98

2 3 0.081 6.2e+02 -0.1 0.6 57 108 394 446 391 447 0.74

3 3 1.1 8.5e+03 -3.7 0.8 40 73 1510 1543 1486 1556 0.53

#	of	c-Evalue	i-Evalue	score	bias	hmm coord from	hmm coord to	ali coord from	ali coord to	env coord from	env coord to	acc
1	3	1.2e-48	8.9e-45	150.9	2.4	2	116	144	256	143	256	0.98
2	3	0.081	6.2e+02	-0.1	0.6	57	108	394	446	391	447	0.74
3	3	1.1	8.5e+03	-3.7	0.8	40	73	1510	1543	1486	1556	0.53

Sequence Information

Coding Sequence: atggcaaattatCGCCATCAACTCACCGCAGCGCATCAACAAGCGCGAAGCTCGTATTACGCTCAAGGTGTTCCGCCTGCTTCGCAAACTCCGATGCCGCCGCATAACTTAATGTaccaacagcagcagcagcaacaacaacaagttcaGACGCAACAACAGCAAAATTCTTACATGAATGCCGGACATCATCATCTCCAGAACCCATATGCTCATATGACAATGGGACCGGGGCAAACGGCACATCACATGCTAACGCGTCATTACATGAGTCAACATCATCAACACGCCTCTGCCGCGAGTTTAATCAACAGACATCACCATGCAATTAACATGAGCACGGCAAATGTTCCGTTAAATGCAAatggcgAACCAATTAAGCTACCTGACAACTTGGAAAGTCTCCCGAGAGCCGATCATTTTCCAACGCAGCGACATCGATGGAACACAAACGAGgaaATTGCTGCAATTCTCATCAGCTTTGACAAACATTCCGAATGGCAATCAAAAGAAGTCAAAACTCGaCCAAAAAGCGGCTCAATGTTGTTGTATTCGCGCAAAAAGGTCCGTTATCGACGCGATGGCTACTGCTGGAAGAAACGCAAGGACGGCAAAACGACGCGCGAGGATCACATGAAGTTAAAAGTACAAGGAACGGAGtgCATCTACGGCTGTTACGTACATTCAGCTATCCTTCCAACCTTTCATCGAAGGTGCTATTGGCTGTTACAGAATCCAGACATCGTCTTAGTGCATTATCTTAATGTCCCGTATCCGGATGATAATAAAATGGCCGTTATAACGCCTAATCTCGCGCTGTGGGGCGACAAGAAGGAATGGACCAAGGAGGAATTGGTTAGTCAGCTGAAGCCAATGTTCTTTCCAGTCTTCAGCGAAGACGATGCCGACACCAGCAACGACATTGAAATTTCCACGGCAGAAACTGTCGAAGCGATTGTCAGTCAATTAATGGAGAAACAACGAATGGCACGTCAAGCGGCGCTCGTGAAGCAGCTGGAATGCGGATGTCCCGATTCGACGTGTGCCGATGGCAAGAGTTGTTCGCATCCGATGCGGAGAATTACGTCAAGGACGCCCGAAAATAAGAGACAGGAGAATAATAATCAAGTTTCAAGTACAACGCCAAATATTTTGGTTGGATCGAGGCTCTACCCAAAATGGATCGAACGTCGTCAACGGGAGCAAATGCTCGAAAACGCCCGTCTCCAAAAGTACGACACGAACTCTCTGCATTTCCAAATCGTTCCAACTACATCACAAAATCACCCTTCGATGATGCGTCAAACGTACCAACATTcccagcagcagcaacagcacaTCCCTCCCCCACTTTCGAtgcagcaacagcaacaaatTCACGCTACGACGAAATTATCACATcctcagcagcagcaacaacaaccgaCGAATAACACTCGGAACGGCCTGCAAATCGTTAATCGGTCAACAAATCAAAATGCcagcaataacaataacaacaacactgACGTTAATTTGAATGGAGGTGTTGAGGAAAACACTCATCATGTGACACATACGAACACGAGCAGCATGGAAGATGACACAAGTACAACGACGACAACCACGACAACTGCATTCAATAATCGAATTACCGTCGTACAGcatcaacagcagcagcagcagcaattaaatggaaataataattcatcaaATGGTCCGAGTAATAATGGGAATGCACCACCGCTCGTCTTGAATTTGTCTcagCTTCAGACATCGCCCGGTAGCTTGCTCATACTGAACAACCAACAATCGACTTATGTGTGCCAGCCAACATCTTCTCCCTCGAATCCATCCGAGACGACGTCACAAGACGACAAAAGCACAATTGTCGAGTTTACTGTTCCAAAAGAGGAAACAATGATGGATTCCAACGAAAAATATGCCGATCAGTATGAAACGAGCATGAGTTACAGCTCGACAGCTCACAATAGTCCCATGAAAAGTCATCCGACACTGAAAGAAGGACATGAAGTACCCTATTTCACTGAAACTTTGGATTTATCGCAAGAAGACATCCAAAAAACCCTTTCGGCGAACATGCCAACTAATGGCGCTGATGTCCACGAAGACACAAACGAGATAAATCCAATGGATTTCATTGAAAGTTGCGAAACTCAAGGTCACGAAGATGACGTTTTCGTGAATTTAGATGCTTTTGATATGTTAGTTGAGTTTCCTGAACTTCATGAATTCCATGGAAACGCAAATAACGCAAATAATGAGGTTATGCATGAGAACAAATATCATCACACTGCGGGAAATGTGCCTGGCGAACAAACCTCTACAATTACGGATTACAGCCCTGAATGGGCATACCCCGAAGGAGGTGTCAAAGTTCTCGTTACAGGTCCATGGGATGTTAATACAGCATATACGGTGCTTTTTGATAACTTTCCTGTACCAACAACTTTGGTTCAAAGCGGCGTCTTGCGTTGTTATTGCCCTGCCCATGAGGTTGGCGTCGCTACGATGCAAGTTAGTAGTCAAGGATTTGTGATCTCAAACTCGGTAAATTTCGAGTACAAGTCTCCGCCAAAGACAGAAGTGAAAGTTGAAGCTGGCTCAAGTGAGGTTATGTACAAATTTAGCTTGTTAAATCGCTTGGAAACGATCGATGAGAAGCTTCAAATCAAATTGGAGCCAAATGATGGATCTTCCGACGAAGCCACGTTATTTAAACAACCAAATTTCGAAGAACGACTTGTTTCGTATTGTCAAAAGCTTACGCAGCGCACGTGGCGATCAGCTACTCCGACGCCGTGGGGTGTTTCGCACAAAGGAATGACTTTGTTACATTTGGCAGCGGCATTGGGATATTCGCGTTTGGTTTGTACGATGCTTACATGGCGATCGGATAACTCTTCAATGATCCTCGAGGCAGAAACTGACGCCTTGAGTCAAGATGAAGACGGATACACACCCCTGATGTGGGCCTGTTCGAAAGGTCATCTCGAAGTTGCCACCATTTTGTATCGATACAATCACAATGcactaaatgtcaaaaataaccAAGGCATGAGTCCGATAGATGTCGCTAAAGCAAATAACCATCAAAATATCGTCAATGAATTGGAGAAACTTGAACAGGAAAGACTCAAACCTgcagaaataaaagaaaaggaCGCGGAACAACCGATCTTtaatccatcatcatcatatcaaGATCCAACGACGCGATTGTCGCCGCAATCGGAAAACGCGGGAAAAGATCTCAGCAAGTCACCGATTTCGGATAACAGAAGTCATGATGGCGTCTTTTTACGCCCGGGAGCTGTTCTTGCATCGCAAAGCCCGCCAGGAGCGAGATTGTCAAAGAGATCTTCAATTGACAGCGGAATTAACATGGATATTCGTACTCCATTGACACGAAGCGGAAAAGGCATCAAAGATAGTCATCGTCGATATTatcttatGGATCGCAGTATGTCACTTCCGATCTCATCAAATTCTCCGCAATCCATGTCAAGTTTCGACATTGGCGACAGCTATACTGAGTCGCCGTTGAATATGACAGCGTCAAATAGTGGTTCACTTCTGTCGCCATTGCGAAAAATGGATTTCGCATTATGCGAAACAGCCGCTGATTCAAGTCCAATTGCTGAACATGAAGATTCTcaagacgatgacgacgaaacAAACAGTCAACAAAATACTGAAATTGGGAATACTCGAGTTGggGAGTCGGATGCTAAAGTTCTCACGTTAGCAGAACAAATTATCGCAGCGATGCCAGAAAGGATCAAGaaCGAATCTGAGGAAGTAATGTCTCTCGGAAGTCCCTTACCCGACAGTTTATCAACAGATGCATCCACAATCGGCATGTTAGGTGATTCGTTCATTGAGCCTCTCTTAGACAGTCAGTTCGATCAGGAGTTTAACTTTGAATTCAGCGATCACAATTAtcgttACCATGACGTTGGCACCCCCTGCTCAAGTCTCAGTCCCGCAAGTTCGGGCCCCCTTCAAAGTCCCGCAAGTTATTCCGTGCCGCCAGATCCTCCAATGTGCTCGCCAAGTCCTCCGCCAACCACGCAGGACTTTACGGAATTCCTTCAAGCCTCAAATTCGACGCCAAAACCCTTCGAAGCTGATTTTTCGAATCTCACACTCACGGATAAGGAACAACGCGAATTGTATGAAGCTGCAAAATGCATCCAGAAGGCATATCGTTCGTACAAGGGACGAAAAAAGTTGGAAGAACAAGACAAGGAACGTTCCGCTGCGGTTGTGATCCAAAATTATTACCGGCGATACAAACAATACGCTTACTATCGACAAATGACACACGCCGCACTCGTCATTCAGAACGGATATCGAAGTTATTGCGAAAATAAGCGATTTAAAAAGTCCCTGCATCAGTCACATGCTTCAACTTCGGGACAGGAACAACCGCCATCGACTTTGGGGTATTATAGGAACTATCGAAGCGACTCGCAGCATTCCAGTAGCAACTCGAAGGAGCAAAGCCCATCAGGACCGTTGAAacgaACGTATTCTCAACGCACCCAAAATCAAGCAGctcgaaaaattcaacaatttatgcgacaaactaaaaataaactgcAGAGAGAACGAGCCGAAAAAGAGAGGCTTGTGCACCAACGTCGAGTGGAGTACCTCCAAAACTCGCAGTCAGTCGCTCAACCAGATCCAGCTCAGCTGCTGTCATCGGGGCAAACGCATCAACCTCAGCATTAA
Protein Sequence: MANYRHQLTAAHQQARSSYYAQGVPPASQTPMPPHNLMYQQQQQQQQQVQTQQQQNSYMNAGHHHLQNPYAHMTMGPGQTAHHMLTRHYMSQHHQHASAASLINRHHHAINMSTANVPLNANGEPIKLPDNLESLPRADHFPTQRHRWNTNEEIAAILISFDKHSEWQSKEVKTRPKSGSMLLYSRKKVRYRRDGYCWKKRKDGKTTREDHMKLKVQGTECIYGCYVHSAILPTFHRRCYWLLQNPDIVLVHYLNVPYPDDNKMAVITPNLALWGDKKEWTKEELVSQLKPMFFPVFSEDDADTSNDIEISTAETVEAIVSQLMEKQRMARQAALVKQLECGCPDSTCADGKSCSHPMRRITSRTPENKRQENNNQVSSTTPNILVGSRLYPKWIERRQREQMLENARLQKYDTNSLHFQIVPTTSQNHPSMMRQTYQHSQQQQQHIPPPLSMQQQQQIHATTKLSHPQQQQQQPTNNTRNGLQIVNRSTNQNASNNNNNNTDVNLNGGVEENTHHVTHTNTSSMEDDTSTTTTTTTTAFNNRITVVQHQQQQQQQLNGNNNSSNGPSNNGNAPPLVLNLSQLQTSPGSLLILNNQQSTYVCQPTSSPSNPSETTSQDDKSTIVEFTVPKEETMMDSNEKYADQYETSMSYSSTAHNSPMKSHPTLKEGHEVPYFTETLDLSQEDIQKTLSANMPTNGADVHEDTNEINPMDFIESCETQGHEDDVFVNLDAFDMLVEFPELHEFHGNANNANNEVMHENKYHHTAGNVPGEQTSTITDYSPEWAYPEGGVKVLVTGPWDVNTAYTVLFDNFPVPTTLVQSGVLRCYCPAHEVGVATMQVSSQGFVISNSVNFEYKSPPKTEVKVEAGSSEVMYKFSLLNRLETIDEKLQIKLEPNDGSSDEATLFKQPNFEERLVSYCQKLTQRTWRSATPTPWGVSHKGMTLLHLAAALGYSRLVCTMLTWRSDNSSMILEAETDALSQDEDGYTPLMWACSKGHLEVATILYRYNHNALNVKNNQGMSPIDVAKANNHQNIVNELEKLEQERLKPAEIKEKDAEQPIFNPSSSYQDPTTRLSPQSENAGKDLSKSPISDNRSHDGVFLRPGAVLASQSPPGARLSKRSSIDSGINMDIRTPLTRSGKGIKDSHRRYYLMDRSMSLPISSNSPQSMSSFDIGDSYTESPLNMTASNSGSLLSPLRKMDFALCETAADSSPIAEHEDSQDDDDETNSQQNTEIGNTRVGESDAKVLTLAEQIIAAMPERIKNESEEVMSLGSPLPDSLSTDASTIGMLGDSFIEPLLDSQFDQEFNFEFSDHNYRYHDVGTPCSSLSPASSGPLQSPASYSVPPDPPMCSPSPPPTTQDFTEFLQASNSTPKPFEADFSNLTLTDKEQRELYEAAKCIQKAYRSYKGRKKLEEQDKERSAAVVIQNYYRRYKQYAYYRQMTHAALVIQNGYRSYCENKRFKKSLHQSHASTSGQEQPPSTLGYYRNYRSDSQHSSSNSKEQSPSGPLKRTYSQRTQNQAARKIQQFMRQTKNKLQRERAEKERLVHQRRVEYLQNSQSVAQPDPAQLLSSGQTHQPQH

Similar Transcription Factors

Sequence clustering based on sequence similarity using MMseqs2

100% Identity: -
90% Identity: -
80% Identity: -