Basic Information

Insect: Chrysops caecutiens
Gene Symbol: Camta1_1
Assembly: GCA_963971475.1
Location: OZ020568.1:11768704-11779240[+]

Transcription Factor Domain

TF Family: CG-1
Domain: CG-1 domain
PFAM: PF03859
TF Group: Unclassified Structure
Description: CG-1 domains are highly conserved domains of about 130 amino-acid residues containing a predicted bipartite NLS and named after a partial cDNA clone isolated from parsley encoding a sequence-specific DNA-binding protein [2]. CG-1 domains are associated with CAMTA proteins (for CAlModulin -binding Transcription Activator) that are transcription factors containing a calmodulin -binding domain and ankyrins (ANK) motifs [1].
Hmmscan Out: # of c-Evalue i-Evalue score bias hmm coord from hmm coord to ali coord from ali coord to env coord from env coord to acc

1 3 2.3e-35 1.1e-30 107.1 1.5 40 116 2 76 1 76 0.97

2 3 1 4.8e+04 -6.0 4.3 29 65 425 461 401 491 0.45

3 3 0.31 1.5e+04 -2.9 2.7 70 102 1489 1521 1432 1530 0.68

#	of	c-Evalue	i-Evalue	score	bias	hmm coord from	hmm coord to	ali coord from	ali coord to	env coord from	env coord to	acc
1	3	2.3e-35	1.1e-30	107.1	1.5	40	116	2	76	1	76	0.97
2	3	1	4.8e+04	-6.0	4.3	29	65	425	461	401	491	0.45
3	3	0.31	1.5e+04	-2.9	2.7	70	102	1489	1521	1432	1530	0.68

Sequence Information

Coding Sequence: ATGCTATTGTACTCGCGGAAAAAAGTACGCTACCGACGAGACGGCTACTGTTGGAAGAAACGTAAGGATGGAAAGACCACAAGGGAAGACCATATGAAACTTAAGGTTCAAGGAACAGAGTGCATATATGGATGTTATGTACACTCAGCGATCCTGCCAACGTTTCATCGCAGGTGTTACTGGCTATTACAGAATCCCGACATCGTTCTTGTACATTACTTAAATGTTCCATACCCAGACGACAATAAAATGGCAGTTATTACACCTAGTCTTGCCCTATGGGGCGATAAAAAGGAATGGACTAAGGAGGAACTAGTCAGTCAATTAAAGCCAATGTTCTTCAGTGAAGATGAGCCGGATGCAAgcaatgaaattgaaatatcaACAGCTGAAACTGTAGAAGCAATTGTTAGTCAATTAATGGAGAAACAACGTCTAGCAAGACAAGCTGCACTTGTTAAACAATTAGAATGCGGATGCCCTGATTCAACGTGTGCCGATGGTAAATCATGTTCACATCCAATGAGACGTATTACAACAGCTAAAACATTAAATGATAAACGACAAGAAAGCAATAATCAAGTATCAAGTACAacaccaaatgttttaattgGTCCAAGGCTATACTCCCGTTGGGTTGATCGCCGTAACCGTGATACAATGACCGAATTTTCCCAAAAAGCCCTCGATGGATCCATTCATTTTCAAGTCATTCCAACACTTCAAAATCATTCTAATATATCGAATCATCACcatcaacagcaacagcaacagcaacaacagcagcaacaacagcagcaacatcaacaacagcaATCACAACATAATACTGGACGTCAACATAGTGCAAACCTCATCCATGCATCACAATCTGCTCAATTATTAGCTGCGGCAGCAACAACATCTGTAACAATATCGAACAATTCAACTAGTACATCAATATCTAATCAACTTTTTGCCAATGCGTCTAATCATGGCAATCAAATAAATCGCATGACAAGCAATAGTAATGTTAGccaaatgataataaatacaaCAAGTCATAATAATACCGGGACAAGTGGTGGAAGTGGTGTAAATGGAACtacaccaacaaacaacagcAACTGCCATAATGGTGGTAACCCAAATAATCAACTAACTTCGCATTCCAACCAACAAATTAGTCTGACAATTTCAAgtgataacaataatttaaataatttaacaaataacGATGTCCAACATcaccaccatcatcatcatcaccaacagcagcagcagcagcagcaacagcaacagcaacaacaacaacagcaacaacattCTTTGTCAATGGCTTCACTATCTACAGCGAATCATAGTTCTGGACACCATTCACAACAccaacatcatcatcaacagcaacagcagtCATCACAGCATGTGCACCACCAACAGCAGCATCAGCATGCACATCAACAGCATCACCATCAATCGATAATTGATAGTAATGTTGTCAATCAGAGACTATCCTCTAATCTAATTACCAGCTCTTCTAATGGCCGGTTGGATATTAGTTCGGGTAATGGAAATTCTGTTGGATCTAACAATAGCAATGGGGGAAATCCTGCGGTTTCATCAGCTCCACCGCTTGTATTAAATTTGACCCAACTTCAAGGTTCAACTAGTggattattaattttgaatggGCAACAGCAATCATTTGTTTGTCAATCACCCCAACAACAACGTAAATTATGTACAACGAAAGACGATAATGCGTCTCAATCGATGACACCAAATCTAGTTCCTAAGCAAGAAGCAATGgattcatcttcatcttcagtATCCGACAAACAAATGGATTCTGTATATGAATCATTGGGTTACAATTCAACAACAGATAGCACACCAATGGAAAGTTCTAACAATAAGGAAACAAATTCCCTTGTTAAGGAATTCAACGACTCACTTCCATTTTTCAATGAAACTTTGGATTTATCTCAAGAAGATATACAGAAAACCCTCAGCGCAAATATGCCTCTCGCTAATAATGGTGGTACACATACCCACGATGATGAAATTGATTCTGACATAAATCCTATGGATTTTATTGATAATGTCTGTGATGTTGCCGGTAATAGCATATCAAATGGTTGCTTTGATCAACATAATCATGATCCTGTTGATGTTTTTCTCAATACAGATGCCTTCGACATGTTGGTAGAATTTCCTGACTTAGACTTGGATTCGAAAAATGTATTCGCTCATGATTCAATTGATAATCTGAAACAGTCACAATTGCAACACAGTCAAGAATCTAATAATAGTGTTATACTACACGATGGCGAAAGCATTATACGAAACGAACCATTGAGTCATGAAACATTCAATATAACTGATTACAGTCCAGAGTGGGCATATCCAGAAGGTGGTGTTAAAGTACTAGTTACCGGACCCTGGAATCCTACATCATCCTATACAGTATTGTTTGATTCATTCCCTGTCCCGACTACCGTGGTACAAAGTGGCGTTTTAAGGTGCTATTGTCCAGCCCACGAAGTGGGTCTTGCCACACTTCAAGTCGCCTGTGATGGATATGTTATATCGAATTCAGTTATTTTCGAGTACAAATCTCCACCAAACTTGGAGACAATATGTGAAGGAACTTCAAATGATAGTTTATATAAATTCAGTCTACTTAATCGCTTGTCATCGATTGATGAACGAATGCAAATTAAAACGGAGCCTAAAGATATGCCTGAAGAAAGTCTCCTCATTTCACAAAAGAATTTTGAGGAGCGCTTAGTCAATTATTGTCAATTGCTTACTAATAAGACGTGGCGTTCAATAACTCCTGGTTCCTGGTCGTCTGGTCATCATGGTATGACTCTATTGCATTTAGCATCAGTACTTGGTTATTCCAAGCTGGTTTGTGCAATGCTAACATGGAGATCAGAGAATCCAAATGTAATTTTAGAAACAGAAATTGACGCTCTTAGTCAAGATGTTCAAGGATACACTCCATTGACCTGGGCTTGTTCACGCGGACACATGGACACTGCTATCATTTTATATAAGTGGAATCATAATTCTTTGAATATAAGAAATTGTTTGCAACAAACACCAATTGAAATAGCACGAACTAAAGGATTCAGCTACATCATTAAGGAACTCGAACGTCTGGAAAGAGAAAGAGTAAACGGTCAACAGCATCAACATTCTTCATTAGCTTTAAATACGTTTACGaatggAAACAGTGGTAATAGTGCAAATACCAAAATCAATGCAAGGAAAGACAACGAAAGCAACAAGAACAGTATTAACCTTAGCAACGAAACCCTACCCTCACAATGCTCATCTCCATTGTCCACTGGATCAATAACATCAATAGCTAGTAATCGCAGTCATGATGGAGTATTTTTACGTCCTGGAGCTGTGACAAGTGGACAAAGCCCTCCAGGAGTACGACTTTCGAAACGTTCCTCTGTAGATAGCGGCATCAATATGGATATAAGGACAACATACACCAGATCTGGGAAAATGTTCCGCGAACAACAAAAGTATCAAagCTTTGATGCAACAGAAAACAGTTTTTCATTGTCCATGGACTCGGCAATGGATGGTAATAGCGGCTCAAGTAGTACAACATCTGGATCACTGTTGTCACCATTGCGGAAAATGGATTTTGCTTTGTGCGAAGTCTCAGCGGGTGATTCTAGCCCAATTCAGGATAAACAACGAGGATCACCTTCAGATGATGAAGACATTACGGATCCCAATAATTTACCTGAGAACGGTGTTGTAgggGAATCTGATGCTAAAGTACTGACACTTGCTGAGCATATCATTGCTGCTATGCCTGAAAGAATAAAGAACGAATCGGAGGAAATCATGTCTCTGGGTAGTCCAATATCTGAGTCGTTGAATACAGACACTCCTGGAATGTCTAGTTTAAATGATACATTCATGGAACCATTATTGGACTCATTACCAAACTCTCAATTTGACaatgagtttaattttgagtTCAGCGATCATAACTATCGCTATCACGATGTTGGAACTCCATGTTCTAGTTTAAGTCCAGCTAGTTCCGGACCCTTGCAATCACCTGCGAGCTACTCAATTCATCCCGATCCAGCAATGAGTTCACCGAGTCCTCCTCCATCTGCACAAGAACTTACCGAATTTTTACAAGCATCTAGTATATCGCAGCGACCGTTTGAAGccgatttttcaaatttgacttTAACTGATCGCGAACAAAGGGAATTGTATGAAGCTGCTAAGTGTATACAGAAAGCTTATCGCTCCTACAAAGGGCGCAAAAAGCTTGAAGAGCAGGATAAGGAACGATCAGCTGCAATTGTGATACAAAACTATTATCGAAGATATAAACAGTTTGCGTATTACCGGCAGATGACCCATGCAGCTCTTGTAATTCAAAACGGATATCGATCATACTGTGAAAACAAACGTTTTAAAAAATCCCAGAATCAAGTAAATACCCAAGAAAGTCAAGACTCCCAATGTCTCCAAAATTACTATAAACACTATCAAAATGATCAGCATCAACAGCAACAATCACAGCAACAAcatcaacagcaacagcatCAACAACGACAAGGAAGTGGCTCTACTTCCAAGGAACCAAGTCCTTCTGGCCCATTAAAACGCACTTATTCCCAAAGAACACAAAATCAGGCTGCAAGAAAAATACAGCAATTTATGAGGCAATCCAAAATGAAGCTACAGAGAGAACGAGCCGAAAAAGAGAGGCAGGCGCACCAACGCAGGGGGGAATACCTCCAAAACTTGCAGTATCACGGTCAACTAGAAGCGGGGCACACACTCGATCAAAATGAAACACAAAGAAATCAGCATCAACTCCAGCAACAAACGCAATCTCATTCTTCTAGCGTTGAGCAAAGTAATAACTACTGGAGttga
Protein Sequence: MLLYSRKKVRYRRDGYCWKKRKDGKTTREDHMKLKVQGTECIYGCYVHSAILPTFHRRCYWLLQNPDIVLVHYLNVPYPDDNKMAVITPSLALWGDKKEWTKEELVSQLKPMFFSEDEPDASNEIEISTAETVEAIVSQLMEKQRLARQAALVKQLECGCPDSTCADGKSCSHPMRRITTAKTLNDKRQESNNQVSSTTPNVLIGPRLYSRWVDRRNRDTMTEFSQKALDGSIHFQVIPTLQNHSNISNHHHQQQQQQQQQQQQQQQHQQQQSQHNTGRQHSANLIHASQSAQLLAAAATTSVTISNNSTSTSISNQLFANASNHGNQINRMTSNSNVSQMIINTTSHNNTGTSGGSGVNGTTPTNNSNCHNGGNPNNQLTSHSNQQISLTISSDNNNLNNLTNNDVQHHHHHHHHQQQQQQQQQQQQQQQQQQHSLSMASLSTANHSSGHHSQHQHHHQQQQQSSQHVHHQQQHQHAHQQHHHQSIIDSNVVNQRLSSNLITSSSNGRLDISSGNGNSVGSNNSNGGNPAVSSAPPLVLNLTQLQGSTSGLLILNGQQQSFVCQSPQQQRKLCTTKDDNASQSMTPNLVPKQEAMDSSSSSVSDKQMDSVYESLGYNSTTDSTPMESSNNKETNSLVKEFNDSLPFFNETLDLSQEDIQKTLSANMPLANNGGTHTHDDEIDSDINPMDFIDNVCDVAGNSISNGCFDQHNHDPVDVFLNTDAFDMLVEFPDLDLDSKNVFAHDSIDNLKQSQLQHSQESNNSVILHDGESIIRNEPLSHETFNITDYSPEWAYPEGGVKVLVTGPWNPTSSYTVLFDSFPVPTTVVQSGVLRCYCPAHEVGLATLQVACDGYVISNSVIFEYKSPPNLETICEGTSNDSLYKFSLLNRLSSIDERMQIKTEPKDMPEESLLISQKNFEERLVNYCQLLTNKTWRSITPGSWSSGHHGMTLLHLASVLGYSKLVCAMLTWRSENPNVILETEIDALSQDVQGYTPLTWACSRGHMDTAIILYKWNHNSLNIRNCLQQTPIEIARTKGFSYIIKELERLERERVNGQQHQHSSLALNTFTNGNSGNSANTKINARKDNESNKNSINLSNETLPSQCSSPLSTGSITSIASNRSHDGVFLRPGAVTSGQSPPGVRLSKRSSVDSGINMDIRTTYTRSGKMFREQQKYQSFDATENSFSLSMDSAMDGNSGSSSTTSGSLLSPLRKMDFALCEVSAGDSSPIQDKQRGSPSDDEDITDPNNLPENGVVGESDAKVLTLAEHIIAAMPERIKNESEEIMSLGSPISESLNTDTPGMSSLNDTFMEPLLDSLPNSQFDNEFNFEFSDHNYRYHDVGTPCSSLSPASSGPLQSPASYSIHPDPAMSSPSPPPSAQELTEFLQASSISQRPFEADFSNLTLTDREQRELYEAAKCIQKAYRSYKGRKKLEEQDKERSAAIVIQNYYRRYKQFAYYRQMTHAALVIQNGYRSYCENKRFKKSQNQVNTQESQDSQCLQNYYKHYQNDQHQQQQSQQQHQQQQHQQRQGSGSTSKEPSPSGPLKRTYSQRTQNQAARKIQQFMRQSKMKLQRERAEKERQAHQRRGEYLQNLQYHGQLEAGHTLDQNETQRNQHQLQQQTQSHSSSVEQSNNYWS

Similar Transcription Factors

Sequence clustering based on sequence similarity using MMseqs2

100% Identity: -
90% Identity: -
80% Identity: -