Basic Information

Insect: Drosophila yakuba
Gene Symbol: ct_1
Assembly: GCA_016746365.1
Location: NC:14213291-14288210[-]

Transcription Factor Domain

TF Family: CUT
Domain: Homeobox|CUT
PFAM: PF02376
TF Group: Helix-turn-helix
Description: The CUT domain is a DNA-binding motif which can bind independently or in cooperation with the homeodomain, often found downstream of the CUT domain. Multiple copies of the CUT domain can exist in one protein (eg Swiss:P10180).
Hmmscan Out: # of c-Evalue i-Evalue score bias hmm coord from hmm coord to ali coord from ali coord to env coord from env coord to acc

1 3 2.9e-26 8.6e-23 80.6 0.0 3 72 1203 1273 1201 1278 0.95

2 3 2.8e-31 8.5e-28 96.6 0.0 3 77 1655 1730 1653 1732 0.96

3 3 1.7e-30 5.2e-27 94.1 0.0 3 76 1941 2015 1939 2018 0.96

#	of	c-Evalue	i-Evalue	score	hmm coord from	hmm coord to	ali coord from	ali coord to	env coord from	env coord to	acc
1	3	2.9e-26	8.6e-23	80.6	3	72	1203	1273	1201	1278	0.95
2	3	2.8e-31	8.5e-28	96.6	3	77	1655	1730	1653	1732	0.96
3	3	1.7e-30	5.2e-27	94.1	3	76	1941	2015	1939	2018	0.96

Sequence Information

Coding Sequence: ATGCAGCCAACATTGCCACAAGCCGCTGGGACAGCCGATATGGATCTGACGGCTGTTCAATCAATCAACGATTGGTTTTTCAAAAAGgagcaaatttatttattggcaCAGTTTTGGCAACAGCGCGCAACCCTTGCCGAAAAGGAAGTGAACACACTCAAGGAGCAGCTATCCACCGGCAATCCCGACAGCAATCTCAACAGCGAGAACAGCGatacagcagcagcggcagcagcagcagcagcaaacacaAACGACATCGAGGACATTgagctacagcagcagcagcagcaacagttgcaacAACAGTTGCAGCAAACGGACAGCGAGAAGCTGCTGAACAGCTCCATTGTTGCAGCGGCCATAacgctgcagcagcagaacgGCAGCAATCTGCTGGCAAACACAAATACGCCGTCGCCCTCGCCGCCGTTGCTCAGcgccgagcagcagcagcagttgcataGCACATTGCAACAGAGCGGCGGTGTTGGCGGCGCTATTGGCGGCGCTTGCCTCAATCCCAAACTCTTCTTCAATCACGCCCagcagatgatgatgatggaggCGGCAGccgcggcagcagcggcggccttgcaacagcagcagcaacagcaatcgCCCCTCCATTCGCCGGCGAATgaagttgccacgcccacagaaCAGCCAGCGGCAACAGttgcagtagcagcagcagcagcaacgctTGCCACTGGCAACATGAagagcggcaacaacagcagcaacgtcaatcacaacagcaacagcaacaacaacagtcaCCAGGACGAAGAGGAGCTGGACgacgaagaggaggaggaggaggacgaggaggaggcggaggcggaagCGGAACaagcggaggaggaggatgaggaggaggatgatgaggaggaggagaatgCCTCGATGCAATCGAATGCTGATGACATGGAGCTGGATGCACAGCAAGAAACCAGAACTGAGCcaagtgcaacaacaacacaacagcagcagcaggatgcaGAGGATGTTGCGGAGAAGAAGGAGGATGCGGGGGAGGCTAGTTTAAATGTTAGCAATAATCACAATACAACAACCGATAGCAATAATAGTTGTAGTCGAAAGAACAACAATGGCAGTGGCGCTGCAAGTGGCGGCAATGAAAGTGAGCAACATGTTGCAAGTTCAGCGGAGGACGATGATTGCGCCAACAACAATACGAATaccagcaataacaacaatgccagcaacacagccaccagcaacaccaacacgaacaacaacaacaataataataataacaacaacagcaccaacaacaataataacaacaacaacaatcacagcagcagcggcaacagcgagaagcgcaagaagaagaacaataacaacaacaatggacAGCCTGCTGTTCTACTAGCTGCCAAAGATAAAGAGATTAAAGCACTGCTGGACGAACTGCAACGCTTGAGGGCACAGGAGCAGACGCACCTGGTGCAGATCCAGCGACTGGAGGAGCACCTGGAGGTCAAGCGCCAGCACATCATCCGTTTGGAGGCGCGTCTGGATAAGCAGCAAATCAATGAGGCGCTGGCCGAGGCAACCGCTTTggcagctgccgccgccaccaacaacaacaacaatagccagagcagcgacaacaacaagaagCTGAATACCAGCGCCGAAAGAGCGATGGATGCCGATCTGCCGGAGTCCACAAAGGCGCCACTAGCAACGGCGaacgaggatgaggatgacgaGCAGGCCATGCTGGTGGACAGCGAGGAAGCGGAGGATAAGCCAGAGGAGTCGCATCAACACGatgaggacgacgaggaggacgaggcCGAGGATCGGGAGGCGGTCAATGccaacaacaccaacaccaacaccaactcCATCGATAGCAACGAGCtcaaaatcaaaaaggaaCAGCACAGTCCGCTGGATCTGAATGTGCTCAGTCCGAATTCGGCGATCGCCGCTGCAGCCgcggccgccgctgccgccgcctgCGCCAATGATCCCAACAAATTCCAGGCACTGCTCATCGAGCGGACCAAGGCCTTGGCCGCCGAGGCGCTCAAGAATGGAGCCAGCGATGCCCTCAGCGAAGAAACCAACCGAAATCGtgcagaagaagaagacgcAGTGTCgccaactgcaactgcaactgctaCACTTGCAACACTTGCAGCACTGGCAACACCTGCAACACTTGCCACAACTGCAGCActtgcaacaactgcagcactTGCCAAAACTGCAGCAcatgcaacaactgcagcactTGCAGCACCTGCAACACttgcaacaactgcaaaacTTGCAACATCTGCAACActtgcaacaactgcaacactGGCAACACGTGCAGCACCTGCAACAGTGGCAAGCCAGTGCGAGTCGCAGGCAAAAGCCAGCCATGAGATGGCGGCGCCCAAGCAGGAGATCGAAGAAGTGGATGACGATGAggtggaggagctggaggaggatgCCACCGATGAGCAGCCGGTGATCCTGCCGCAGCAACTGGTCAACGACTATTGGCGCCGTGGCTTTGTCGCTGAAACGGGGCACAGCAGCAATGGGAGCAAAACGCCAACAATTTATCAAAATTTTAAGgtcgagcagcagcagcagcaacagcagcaggcacagttgctgccgccaccgccgccgccgccaccacccgcagcaccaccaacagcagcaccacccctttcgcagcaacaacatctaCACTTttcacagcaacaacagcaacaacaacagcaacaacatttacaacagcaacatggACCATCGTCCACAGCGCTGCTTAGTCAACTGGTTAACTCAACATTTTCCAACTCTTCAAACTCTTCTCGCCTAGatgcccaccaccaccagcagcagcagcagcaccaccaccaacaccaccagcagcagcagcaccaccaccagcagcagcagcaccatcagcagcagcaacacctccaccagcaacatcatcatcacctgcaacagcagcagcaaccaaacagcggcagcagcagcaacaacagcaatgcGGCAAACAACGAGCATGGTCATCATGGTCATCACTTGCATGGCCATGGTCATGGCGGTTTGCTGCATCCATCGGCGGCGCACCATCTGCACCACCAGGCGGCGAACGAATCCAACTCGAATTCGAGCACACCCACAGCGCTGGGCAATGCAAGTGGTAGCAGCGGCAGTGGTgcgagcaacagcagcaatgcCAACAGCACCACCGCTCAATTGGCGGCCAGTTTGGCCAGCACACTGAATGGCGGCAAATCGCTGTTGCAGGATGATGCCACCAGCAATGGCTTGGCCACCGCTGCCGCCATGGCCGCACATGCCCAGCATGCGGCTGCTACCCTGGGACCGGGCTTTTTGCCCGGCCTGCCGCCTGCGTTTCAATTTGCCGCCGCCGCTCAAGTGGCCGCCGGTGGCGATGGGCGTGGCCATTATCGTTTCGCCGACTCCGAGTTGCAGCTGCCACCGGGCGCCTCGATGGCCGGTCGTTTGGGTGAATCACTAATACCCAAAGGTGATCCCATGGAGGCCAAGCTGCAGGAGATGTTGCGCTACAACATGGACAAGTATGCCAATCAAGCGCTGGATACCCTGCACATTTCGCGACGTGTACGCGAATTGCTCTCAGTGCACAACATTGGCCAACGGCTATTTGCCAAATATATATTGGGACTGTCGCAGGGCACCGTGTCCGAGTTGCTGAGCAAACCGAAGCCGTGGGACAAGCTGACGGAGAAGGGACGCGATAGCTATCGCAAGATGCACGCCTGGGCCTGTGACGATAATGCCGTCATGCTGCTCAAATCGCTGATACCCAAGAAAGATTCTGGACTGCCGCAGTATGCGGGTCGTGGTGCCGGCGGCGCTGGCGGCGATGATTCCATGTCCGAGGATCGGATTGCCCACATCCTCAGCGAAGCCTCATCGCTGATGAAACAGAGCAGCGTGGCCCAGCATCGCAGTCACGGCGGCGAGGATTCGCACAGCAATGAGGATAGCAAATCGCCACCACAGAGCTGCACATCGCCGTTCTTCAAGGTGGAACAGCAGCTgaagcagcatcagcatctcAATCCCGACCAGGCAGCCGCTGCCCAGCAGCGGGAAAGGGAACGCGAGCAACGGGAGAGGGaacgggagcagcagcagcgattgCGGCACGAGGATTTGGCCCAGGACAAGATGGCACGTCTCTATCAGGAGCTAATTGCACGCACACCACGTGAAACAGCCTTTCCCAGCTTTCTCTTCTCACCCTCGCTATTTGGAGGAGCCGCTGGCATGCCGGGCGCCGCCAGCAATGCCTTTCCCGCCATGGCCGATGAGAATATGCGTCACGTCTTCGAGCGCGAGATTGccaagctgcagcagcaccagcagcaacagcagcaggctgcccaggcacaggcacagtTCCCCAACTTCTCCAGCCTGAtggcgctgcagcagcaggtcCTCAATGGTGCACAGGATCTCTCGCtggctgccgccgctgccaaGGACATCAAGCTGAATGGTCAACGCAATTCGCTGGAACACAGCgccggcagcagcagttgctccAAGGATGGCGAACGCGATGATGCCTATGCCAGCTCACTGCACGGACGCAAATCCGAGGGTAGCGGCACACCCGCACCACCTGCCCCGCCATCGGGTGGTGCCAGTGTACCAACTGGAACAGCCGCACCACCAGCCGGCGGTGCGAGCAGCAATTCGGCAGCACCCAGTCCGCTGAGCAACTCCATACTGCCGCCGGCACTGAGCAGCCAGGGTGAGGAGTTTGCGGCGACAGCAAGTCCGCTGCAGCGCATGGCATCGATTACCAATTCGTTGATTACCCAACCGCCGGTGACGCCGCACCACAGTACACCACAGCGACCCACCAAGGCGGTGCTGCCGCCCATCACCCAGCAACAGTTCGATATGTTCAACAATCTGAACACCGAGGATATTGTGCGGCGTGTGAAGGAGGCACTATCGCAGTACTCCATTTCGCAGCGTTTGTTTGGCGAATCAGTGTTGGGTTTGTCGCAGGGATCCGTATCCGATCTACTGGCCAGACCCAAGCCATGGCACATGCTCACGCAGAAGGGGCGTGAACCCTTCATACGCATGAAGATGTTCCTCGAGGATGAGAATGCGGTGCACAAGCTGGTGGCCAGCCAGTATAAGATCGCGCCCGAGAAGCTAATGCGCACGGGCAGCTACAGTGGCAGTCCGCAGATGCCGCAGGGATTGGCCAGCAAAATGCAAGCGGCCTCGCTGCCCATGCAAAAGATGATGAGCGAACTGAAGCTGCAGGAGCCGGCACAGGCGCAGCATCTGATGCAGCAAATGCAGGCGGCGGCCATGTCGGCGgccatgcaacagcagcagcagcaagtggcACAGGCGCAACAGCAGgcacagcagcaggcgcaACAGCAGGCGCaacagcatctgcagcagcaggcgcaacagcatctgcaacagcagcagcaacatctcgtccagcagcagcatccacatcagcagcaccatcaagcggccgccgccgctgctgcgcTGCATCACCAGAGCATGTTGCTAACCTCGCCGGGATTGCCGCCCCAACATGCCATCAGTCTGCCACCATcggcggtgggtggtgcacAGCCAGGTGGTGGTGGTCCGGGTGGCAATCAGGGCGGTTCGAATCCATCGAACAGCGATAAGAAACCGATGCTGATGCCCGTGCATGGCACCAATGCCATGCGTAGTCTGCATCAGCATATGTCGCCCACCGTTTACGAGATGGCCGCATTGACCCAGGATCTGGACACGCACGACATCACCACCAAGATCAAGGAGGCGCTGTTGGCCAACAATATCGGTCAGAAGATATTTGGCGAAGCCGTTTTGGGACTTTCTCAGGGCTCCGTGTCCGAGCTGCTGAGCAAACCGAAGCCATGGCACATGCTCTCCATCAAGGGCCGGGAACCATTCATCCGGATGCAATTGTGGCTCAGCGATGCCAACAATGTGGAGCGATTGCAGTTGCTGAAGAACGAGCGACGGGAGGCCAGCAAACGGCGCAGGAGCACGGGCCCCAATCAACAGGACAATAGTAGCGATACCTCCAGCAATGATACCAATGATTTCTATACCAGCAGTCCGGGTCCCGGATCTGTGGGCTCTGGTGTTGGCGGTGCACCGCCAAGCAAAAAGCAACGTGTCCTCTTCTCCGAGGAGCAAAAGGAGGCACTGCGTCTGGCATTCGCCTTGGATCCGTATCCAAATGTGGGCACCATTGAGTTTCTGGCCAACGAGTTGGGTCTGGCAACGCGTACGATCACCAACTGGTTCCACAATCATCGCATGCGTTTGAAGCAACAGGTGCCCCATGGACCGGCCGGTCAGGATAATCCGATTCCGAGTCGCGAGAGTACCAGTGCCACGCCCTTCGATCCCGTCCAATTCCGCATCCTGCTGCAGCAGCGCCTGCTGGAGCTGCACAAGGAGCGCATGGGCATGAGCGGTGCCCCCATACCCTATCCGCCCTACTTTGCGGCCGCTGCCATTTTGGGACGCAGTCTGGCGGGGATTCCCGGTGCCGCTGCGGccgctggagcagctgcagcagctgccgctgtTGGCGCCACTGGCGGTGATGAGTTGCAGGCTTTGAATCAGGCATTCAAGGAACAGATGAGCGGCCTGGATCTATCGATGCCCACATTGAAGCGGGAACGCAGCGATGACTATCAGGATGATATGGAAATGGAGGGCGCTGGTCACAATCTGAGTGACAATGAATCGCTGGAGGGCCAGGAGCCCGAGGACAAGACCACCGACTACGAGAAGGTGCTGCACAAATCCGCattggccgccgccgccgcctacATGTCCAATGCGGTGCGCAGTTCGCGACGCAAGCCAGCTGCACCACAGTGGGTCAATCCCGCCGGTGCGGTGACCAATCCCAGTGCTGTTGTCGCCGCcgttgctgccgccgccgctgcagcagcggaCAATGAGCGCATCATCAATGGTGTGTGCGTGATGCAGGCATCCGAGTATGGACGCGATACGGATGCGGATAGCAATAAGCCAACGGATGGTGGCAACGATTCCGATCATGAGCATGCCCAGCTGGAGATCGATCAGCGTTTCATGGAGCCGGAGGTGCACATCAAACAGGAggaggatgacgatgatgagcCAACGGTTCAGCAAGCGATTCAACTGGACAGCGAGGAGACGGCGAGCAGTGAGCAGCAAAAACTGAAGGTGATCAACGAGGAGAAGCTGCGCATGGTGCGAGTTCGCCGACTGAGCAGCACTGGCGCTGCCTCCTCCGATGAGATGCCAGCTCCACTggcgccaccaccaccacctccagcAGTCACTGCCTCCTCCGTTGCCAGCGGAGAGagcaacaccaccagcagcaacagcagcagcagcaacagcagcaacagcaacagcagcagcagcagcacaccAGCGGTAAccactgcagctgcaactgcggCAGCCGCTTGGAATTACTAA
Protein Sequence: MQPTLPQAAGTADMDLTAVQSINDWFFKKEQIYLLAQFWQQRATLAEKEVNTLKEQLSTGNPDSNLNSENSDTAAAAAAAAANTNDIEDIELQQQQQQQLQQQLQQTDSEKLLNSSIVAAAITLQQQNGSNLLANTNTPSPSPPLLSAEQQQQLHSTLQQSGGVGGAIGGACLNPKLFFNHAQQMMMMEAAAAAAAAALQQQQQQQSPLHSPANEVATPTEQPAATVAVAAAAATLATGNMKSGNNSSNVNHNSNSNNNSHQDEEELDDEEEEEEDEEEAEAEAEQAEEEDEEEDDEEEENASMQSNADDMELDAQQETRTEPSATTTQQQQQDAEDVAEKKEDAGEASLNVSNNHNTTTDSNNSCSRKNNNGSGAASGGNESEQHVASSAEDDDCANNNTNTSNNNNASNTATSNTNTNNNNNNNNNNNSTNNNNNNNNNHSSSGNSEKRKKKNNNNNNGQPAVLLAAKDKEIKALLDELQRLRAQEQTHLVQIQRLEEHLEVKRQHIIRLEARLDKQQINEALAEATALAAAAATNNNNNSQSSDNNKKLNTSAERAMDADLPESTKAPLATANEDEDDEQAMLVDSEEAEDKPEESHQHDEDDEEDEAEDREAVNANNTNTNTNSIDSNELKIKKEQHSPLDLNVLSPNSAIAAAAAAAAAAACANDPNKFQALLIERTKALAAEALKNGASDALSEETNRNRAEEEDAVSPTATATATLATLAALATPATLATTAALATTAALAKTAAHATTAALAAPATLATTAKLATSATLATTATLATRAAPATVASQCESQAKASHEMAAPKQEIEEVDDDEVEELEEDATDEQPVILPQQLVNDYWRRGFVAETGHSSNGSKTPTIYQNFKVEQQQQQQQQAQLLPPPPPPPPPAAPPTAAPPLSQQQHLHFSQQQQQQQQQQHLQQQHGPSSTALLSQLVNSTFSNSSNSSRLDAHHHQQQQQHHHQHHQQQQHHHQQQQHHQQQQHLHQQHHHHLQQQQQPNSGSSSNNSNAANNEHGHHGHHLHGHGHGGLLHPSAAHHLHHQAANESNSNSSTPTALGNASGSSGSGASNSSNANSTTAQLAASLASTLNGGKSLLQDDATSNGLATAAAMAAHAQHAAATLGPGFLPGLPPAFQFAAAAQVAAGGDGRGHYRFADSELQLPPGASMAGRLGESLIPKGDPMEAKLQEMLRYNMDKYANQALDTLHISRRVRELLSVHNIGQRLFAKYILGLSQGTVSELLSKPKPWDKLTEKGRDSYRKMHAWACDDNAVMLLKSLIPKKDSGLPQYAGRGAGGAGGDDSMSEDRIAHILSEASSLMKQSSVAQHRSHGGEDSHSNEDSKSPPQSCTSPFFKVEQQLKQHQHLNPDQAAAAQQREREREQREREREQQQRLRHEDLAQDKMARLYQELIARTPRETAFPSFLFSPSLFGGAAGMPGAASNAFPAMADENMRHVFEREIAKLQQHQQQQQQAAQAQAQFPNFSSLMALQQQVLNGAQDLSLAAAAAKDIKLNGQRNSLEHSAGSSSCSKDGERDDAYASSLHGRKSEGSGTPAPPAPPSGGASVPTGTAAPPAGGASSNSAAPSPLSNSILPPALSSQGEEFAATASPLQRMASITNSLITQPPVTPHHSTPQRPTKAVLPPITQQQFDMFNNLNTEDIVRRVKEALSQYSISQRLFGESVLGLSQGSVSDLLARPKPWHMLTQKGREPFIRMKMFLEDENAVHKLVASQYKIAPEKLMRTGSYSGSPQMPQGLASKMQAASLPMQKMMSELKLQEPAQAQHLMQQMQAAAMSAAMQQQQQQVAQAQQQAQQQAQQQAQQHLQQQAQQHLQQQQQHLVQQQHPHQQHHQAAAAAAALHHQSMLLTSPGLPPQHAISLPPSAVGGAQPGGGGPGGNQGGSNPSNSDKKPMLMPVHGTNAMRSLHQHMSPTVYEMAALTQDLDTHDITTKIKEALLANNIGQKIFGEAVLGLSQGSVSELLSKPKPWHMLSIKGREPFIRMQLWLSDANNVERLQLLKNERREASKRRRSTGPNQQDNSSDTSSNDTNDFYTSSPGPGSVGSGVGGAPPSKKQRVLFSEEQKEALRLAFALDPYPNVGTIEFLANELGLATRTITNWFHNHRMRLKQQVPHGPAGQDNPIPSRESTSATPFDPVQFRILLQQRLLELHKERMGMSGAPIPYPPYFAAAAILGRSLAGIPGAAAAAGAAAAAAAVGATGGDELQALNQAFKEQMSGLDLSMPTLKRERSDDYQDDMEMEGAGHNLSDNESLEGQEPEDKTTDYEKVLHKSALAAAAAYMSNAVRSSRRKPAAPQWVNPAGAVTNPSAVVAAVAAAAAAAADNERIINGVCVMQASEYGRDTDADSNKPTDGGNDSDHEHAQLEIDQRFMEPEVHIKQEEDDDDEPTVQQAIQLDSEETASSEQQKLKVINEEKLRMVRVRRLSSTGAASSDEMPAPLAPPPPPPAVTASSVASGESNTTSSNSSSSNSSNSNSSSSSTPAVTTAAATAAAAWNY

Similar Transcription Factors

Sequence clustering based on sequence similarity using MMseqs2

100% Identity: iTF_00619052;
90% Identity: iTF_00619052;
80% Identity: iTF_00619052;