Basic Information

Insect: Drosophila cognata
Gene Symbol: ct_1
Assembly: GCA_035041535.1
Location: JAWNLC010000235.1:3160472-3197663[-]

Transcription Factor Domain

TF Family: CUT
Domain: Homeobox|CUT
PFAM: PF02376
TF Group: Helix-turn-helix
Description: The CUT domain is a DNA-binding motif which can bind independently or in cooperation with the homeodomain, often found downstream of the CUT domain. Multiple copies of the CUT domain can exist in one protein (eg Swiss:P10180).
Hmmscan Out: # of c-Evalue i-Evalue score bias hmm coord from hmm coord to ali coord from ali coord to env coord from env coord to acc

1 3 1e-26 9.3e-23 80.0 0.0 3 71 1129 1198 1127 1204 0.94

2 3 7.1e-32 6.3e-28 96.6 0.0 3 77 1611 1686 1609 1688 0.96

3 3 4.2e-31 3.8e-27 94.1 0.0 3 76 1903 1977 1901 1980 0.96

#	of	c-Evalue	i-Evalue	score	hmm coord from	hmm coord to	ali coord from	ali coord to	env coord from	env coord to	acc
1	3	1e-26	9.3e-23	80.0	3	71	1129	1198	1127	1204	0.94
2	3	7.1e-32	6.3e-28	96.6	3	77	1611	1686	1609	1688	0.96
3	3	4.2e-31	3.8e-27	94.1	3	76	1903	1977	1901	1980	0.96

Sequence Information

Coding Sequence: atgaaaacaattttcaagctTAAGCAGCTCAACGGCAGTAACAGCAACGTGCCACAGATATTGCCGCAAACACGCGCTACACAAGCCGAGAAGGAAGTGAACACACTCAAGGAACAACTATCCACAGGCACgccaggcagcaacagcgataacagcaacagcgacaacagcaatacagcaacaggagcagcggcagcggcattGGCCAGCGGCGAAGAGGAAGCCACTGGGAACAGCGAAAGTGAGAGCGACAAACTGCTGAATAGCTCGATTGTTGCAGCGGCCATAACGCTGCAACAGAACGGCGGCAATCTGCTAGCCAACACAAATACACCGTCGCCATCGCCGCCGTTGCTGAgtgccgagcagcagcaacagttgcagagCAGCCTGCAGAACGGCGTCGGTGGCGCTTGTTTAAATCCCAAGCTGTTCTTCAATCACGCACAGCAAATGATGATGGAagcggcagcggctgctgcggcggcagcagctgcagcggcagcacaacagcagcagcaacaatcgccCATGCACTCGCCCGTTGCTGCAACTAACAAtacgcaagcagcagcagttgcagcaactgcagcaacagcaggggTAACACAGCAGCAATCAGCACGGGATCTTGCTGaggcaacagcaagcagcaattgcaacgacgacgatgacgaggaCGATGACGAGGAGGATGCATCGATGCAATCAAATGTGGCGCATGCCGATGGTGATctagatgatgatgatatggAGTTGGAACCGGAGCATGTTGCTGATGGCGGCAGTGTTGCTGCCGCTAAGTCATTGGCAAGAACTGATAGCATTGGCGATGCGAATGCAACACATAATGTTGATGATGGTCATCAtcgtgatgatgatgatgaggatgttGCCGATGTGGCTACCGATGAGCATGAGGATGACGAGGAAGCTAGTTTAAATATTAGCaataatcacaacaacaataacaacagcaacaatactGATAGAAACAATAGCTGTAGTcgaaagagcaacaacagtgaAGCGCAACATGTTGCACTGCGTGATAATAATGTAAATGAGCAACATGTGGCACATAGCGCCGAGGACGACGATTGCACCAATAACAACACtaacaccaacaataataacaacaacaccaacaccaacagcaacagcaatgagaAGCGCAAAAAGCGCaatgcaagcaacaacaacaacaacaataacaacaacaacaatcagcccGCTGTTCTATTAGCTGCCAAAGACAAAGAGGTAAGCAATCCATATTCATCGCTCACAAGCATTAAAGCACTTTTGGATGAGTTGCAACGCCTGCGTGGTCTGGAACAAACTCACCTTGTACAAATCCAAAGGCTCGAAGAGCATTTGGAGGTGAAGCGACAGCACATAATGCGTTTGGAGGCACGTTTGGATAAGCAACAGATAAATGAGGCACTTGCCGAGGCAACTGCATTGGCTGCCGCTCTTAATGCGGCTGcgacaaacaataacaacaacaacaacaatagcagcagcaacaacaacaacaacaacaatcacagtAGCCAGGgcagcgaaaacaacaacgagtTGAGCGCGGTGTTTAAATCAACAGATCTAACATCTACCCATCAGCacaatgacgatgatgacgatgatgatgataatgacaATGATAACGATAACCATGCTGAACTGCGCgatgccgatgatgatgaggaggacACGGATATGGctaacgagcagcagcacGCTGCAATTGCCAACAATCGGCACAGCGACGACAACGAAAAGGATGACGACGAGGAGCAGGATGCCGATATATCCaatgccacagccacagcggACAGCAATGAGCTGAAAATCAAAAAGGAACAGCACAGTCCACTGGATCTGAATGTGCTCAGCCCACATTCGGCGATTGCCACAGCCGCCgcggccgcagcagccgctgcctgCGCTAACGATCCCAACAAATTCCAAGCTCTGCTCCTGGAACGCACCAAAGCACTGGCCGCCGAGGCGCTCAAGAATGGCGCCAGCGAGGCAGCGAATGCCAGCAGTGATGAAATgccgcaacaacaagcagcagacgcagcaacagccgctAATCAAGTAACAGTAGAAGATGATggagatgaagatgaagaagaacaagaagcaGTAAAAGCACCAGCTACATCCAAGCCAGAAACAATCACAAATGTATCGGAAAAGCCTGAAAATGATGCATTGACCGAGGCCAAATTGCAGCCCAAAATCGAAATCTTAGACACAGACGATGCTGATGAGGGCGGCACTGAGATGGCCGCTGGCCAAACACTGGAAGAGCAGCTGGTCAATAGCTATTGGCGGCGCGGCTTTGAAACATCAACcccagcagcaacgacaacagcagcagcagcagcagcagcagctgccacagcagcaacaacaactgggaGCAAAACGCCaacaatttatcaaaatgccaatgtggtgcagcagcaactgttgccaccaccgccgccgccgctgccgccgtcacaacagcagcagcagcagcacttttctgcacagcaacaacaacaatatcaccaacagcaacaacaacaacaacaacagcagcagcaacatggaCCCTCGTCCACAGTGCTACTCAGTCAATTGGTTAACTCAACTTTCTTACATGCCAATCACTCCTCTTGTTCCAATTCCAAATCCACACGCCTAGATGCCGCTtcccaccaccaacaccagcagcatcagccacagcagcagcagctgcttcaacagcagcaacatcaccacaacagcagcaatagcagcaacagcagttcaGCAGCCGGCAGCGATCCACTGaatccacatcatcatcatgcgCACCACCATGGCCATCCACATGGACAGCTGTTGCATGCGGCACATCATCTGCATCATGGCGCCGACTCGAACTCATCCAGCGCCAATAGCACACCCAACAGCACCGCCCAGCTGGCGGCCAGCATTGCTAGCACGCTGAATGGCAACAAGTCACTGTTGCAGGCCGCGGCCGCTGCCAATGTGGCAgccgttgctgccgttgccgaggataacaacaacagcctgaCGCCAAATGCGAATGCGGCTGTGGCCGCTGCAGCAATGGCTGCCCATGCACAGCATGCGGCCGCTTTGGGTGCACCCAGTTTTCTGCCCAATTTGCCCAGCCTGCCGGCGTTTCAATTTGCGGCCGCCGCTGCGGCTGGCCAGGATCCTCGAGCACAACATTTTCGCTTTGCGGATGCCGAACTGCAAATGCAGCCGGGCGTCTCGATGGCCGGCCGATTGGGTGAATCGCTAATACCCAAAGGTGATCCCATGGAGGCCAAATTGCAGGAGATGCTGCGCTACAACATGGACAAGTATGCGAACCAGGCCCTCGACACTCTGCACATCTCGCGGCGCGTACGTGAACTGCTCTCCGTGCACAATATCGGGCAGCGGCTGTttgccaaatatattttgggcCTGTCGCAGGGCACCGTCTCCGAGCTGCTGAGCAAGCCAAAGCCCTGGGATAAGCTAACCGAGAAGGGTCGTGACAGTTACCGCAAGATGCACGCCTGGGCCTGTGATGATAGTGCCGTCATGCTCCTCAAGTCCCTCATCCCCAAGAAAGATTCGGGATTGCCACAGTATGCTGGTCGCGGCGCTGGTGGCGATGATTCCATGTCCGAGGATCGCCTTGCACACATACTGAGCGAGGCCTCGTCCCTGATGAAGAGCAGCGCGGTCGCcgcacagcagcaggagcatcaGCGTCGCCATCTCGGCGACGATACCCACAGCAATGAGGATAGCAAATCGCCGCCGCAAAGCTGCAGCTCCCCCTTCTACAAGGACCAGCAGATTAAGCatctgcagccgcagcagcagcagcagctgcagcatgcCTCCGAGCATGCACAACGCGAACAGCGCGAAGCGGCCGCCGCCGTTGCTGCCgtacaccagcagcagcagcagcagcgggagcagcgCGAACAGCGCGAGGCCGCTCAGcgtgagcaacagcagcgcattCGTCACGACGATCTGGGACCGGACAAGATGGCGCGTCTCTATCAGGAGCTAATGACGCGCACTCCACGCGAAGCAGCCTTCCCAAGCTTTTTGTTGACGCCGTTCTTTGGCGGAGCCGCTGGCATGCCTGGAGCACCCGCCAATCCATTTCCCACGGCAATGGCCGCCGACGAGAATATGCGTCATGTACTCGAACGTGAAATAGccaagctgcaacagcagcaggcacagcagGCGCAGCAGGCTGCCAGTTTCCCCAACTTTTCCAGTTTGATGGCACTACAGCAGCAGGTGCTGAACGGTGCACAGGATCTATCGCTGGCCAGCAaggatattaaattaaatggacAGCGCTCATCGCTCGACCAGCAcagtggcggcagcagcagctgctccaagGATGGCGAGCGTGGCGACGATAACGACCGGAGCTATCCAACCCTGTCACATGCTGCTCGCAAATCGGAGGGCGGCAACACACCAGCACCTCCCGCACCACCACTAACACAGACATCAGCGGGCAGCGGCAGTAATTCAAATGCAGCGAACTCAACGATTGCCAGTGGTCATGGCAGCAACTCGGCGGCACCCAGTCCGCTTAGCAATTCAATACTGCCGCCAGCGCTGAGCAATCAGGGTGAGGAGTTTGCGGCGACGGCGAGTCCACTGCAGCGAATGGCATCGATTACCAATTCCCTGATTACACAGCCGCCCGTGACGCCGCATCATTCACAGCCGCAGCGGCCCACCAAGGCGGTGCTGCCACCCATCACTCAGCAACAGTTCGACATGTTCAACAATCTGAACACGGAGGATATTGTGAGGCGTGTGAAGGAGGCGCTCTCCCAGTACAGCATCTCGCAGCGTCTATTTGGCGAGTCCGTGTTGGGATTGTCGCAGGGCTCTGTTTCGGATTTGTTGGCTCGACCCAAGCCCTGGCACATGCTCACACAAAAAGGTCGCGAGCCGTTCATTCGCATGAAGATGTTCCTCGAGGATGACAATGCGGTGCACAAACTGGTCGCCAGTCAGTATAAAATTGCACCCGAGAAACTGATGCGCACGGGCAGTTACAGCGGCAGTCCCCAGATGCCCCAAGgattggccaacaaaatgcagGCGACGCTTCCCATGCAAAAGATGATGAACGAGCTGAAGCTGCAGGAGCCCGCGCAGGCGCAGCACATCATGCAACAGATGCAAGCAGCCGCCGCCATGTCGGcagcaatgcaacagcaacagcaggccgCTGCCGCTCAAGCTGCCGCCGTACAGCAGGCGCAGGCAcaggctcaggctcaggcgagccagcatcagcaggcgcagcatcagcagcaacagcatcagcaggtacatcagcatcagcaggcacaacagcaggcgcaggcgcaggcacaggcacaggcacaggcgcAGTTGCTGCATCATCAGAATATGCTGCTGACGTCGCCAGGGTTGCCGCCACAGCACGCAATCAGTCTGCCGGCAGCGGTCACGCCTAGTGGCATCCAATCGGCTGCAGGTAATCCGACAGCAGCCGGCAGCACGCCGGGCAGCAACGAGAAGAAGCCAATGATGATGCCGGTGCTGGGTGGTGCACATGCCCCAAATGCAATGCGCAGTCTGCATCAGCACATGTCACCCACGGTTTACGAGATGGCCGCACTCACCCAAGATCTGGACACGCACGATATAACAACGAAAATTAAGGAGGCCCTGCTTGCCAACAACATTGGCCAGAAGATCTTTGGCGAGGCAGTGCTCGGTCTATCACAGGGCTCCGTCTCGGAGCTGCTCAGCAAACCAAAGCCCTGGCACATGCTCTCGATCAAGGGTCGTGAACCGTTCATTCGCATGCAGCTGTGGCTGAGTGATGCCAACAATGTGGAGCGTCTGCAGTTGCTGAAGAACGAGCGGCGGGAGGCGAGCAAGCGACGACGCAGCACTGGTCCCAACCAGcaggacaacagcagcgataCGTCCAGCAATGATACGAATGATTTCTACACGAGCAGCCCGGGACCGGGTTCTGTGGGTTCGTCGGTGGGCGGTGCACCGCCCAGCAAGAAGCAGCGTGTCCTCTTCTCCGAGGAGCAAAAGGAGGCACTGCGTTTAGCATTTGCCCTGGATCCGTATCCGAATGTCGGCACCATTGAGTTTCTGGCCAACGAGCTAAGCTTAGCGACGCGTACCATCACTAACTGGTTCCACAATCATCGCATGCGGCTCAAGCAGCAGGTACCACATGGCCAGCCAGGCCAGGACAATCCCATACCCAGTCGTGAGAACACAAATGCAACGCCCTTCGATCCCGTCCAGTTTCGCatactgctgcagcagcgtctCGTCGAGTTGCACAAGGAACGCATGGGCTTGAGTGGTGCGCCCATTCCCTACCCACCGTATTTcgcggctgctgctctgctcggTCGCAGCCTGGCCGGCATACCGggtgcggcggctgctgctggtgcagcagcagctgcggccgCTGCAGTGGGTGCCGCCGGCGGCGATGAGCTGCAGGCACTAAATCAAGCATTCAAGGAACAGATGAGCGGCTTGGATTTATCTATGCCAACGCTGAAGCGCGAGCGCAGCGATGACTATCAGGATGAGCTCGAACTGGACGCAAGTGGACACAACATGAGCGACAACGAGTCCATTGAGGGTGGCAGCCACGAGCCGGAGCACACACCCATAACCGAATATGAGAAGGCGCTGCAGAAATCGGCGCTCGCCTCGGCTGCGGCCGCTGCTGCATATCTGAGCAATGCGGCGCGCAGTTCGCGTCGCAAGCCGGCGGCACCACAGTGGGTCAATCCGGCGGGTGCCAGCACACCGACAGCGGCTGGTGTCGCAGCGAACAACGCTGGCGtcgacatcagcagcagcagcgaacgcATCATCAATGGCGTCTGCGTCATGCAAGGCTCCGACTACAATCGCGACGAGAGTGACAGCATCAAAGGTGGCGGCGACTCCAATGCCACCGATGCCGAGCACGACGATCACGCTCAACTGGAGATTGAGCAGCGTTTCATGGAGCCCGAGGTACGCATCAAGCAGGAAGAGGACGACGAGGACGAAcagccccagcagcagcaaaagcagcaattaGAAGACACAACGCCTCTCGACAGCGATGCGGAGAAGCAGCTCAACGTGATCAATGAGGAGAAGTTGCGTTTGGTGCGCGTGCGGCGCCTCAGCAGTAATGGCGATGCCGACGAGCACTGCACTGCTGTACAGCAGGCGACGACAGCCGGAGCGGCAGCGGCGCCGGCAGCAACATCATGGAACTACTAA
Protein Sequence: MKTIFKLKQLNGSNSNVPQILPQTRATQAEKEVNTLKEQLSTGTPGSNSDNSNSDNSNTATGAAAAALASGEEEATGNSESESDKLLNSSIVAAAITLQQNGGNLLANTNTPSPSPPLLSAEQQQQLQSSLQNGVGGACLNPKLFFNHAQQMMMEAAAAAAAAAAAAAAQQQQQQSPMHSPVAATNNTQAAAVAATAATAGVTQQQSARDLAEATASSNCNDDDDEDDDEEDASMQSNVAHADGDLDDDDMELEPEHVADGGSVAAAKSLARTDSIGDANATHNVDDGHHRDDDDEDVADVATDEHEDDEEASLNISNNHNNNNNSNNTDRNNSCSRKSNNSEAQHVALRDNNVNEQHVAHSAEDDDCTNNNTNTNNNNNNTNTNSNSNEKRKKRNASNNNNNNNNNNNQPAVLLAAKDKEVSNPYSSLTSIKALLDELQRLRGLEQTHLVQIQRLEEHLEVKRQHIMRLEARLDKQQINEALAEATALAAALNAAATNNNNNNNNSSSNNNNNNNHSSQGSENNNELSAVFKSTDLTSTHQHNDDDDDDDDNDNDNDNHAELRDADDDEEDTDMANEQQHAAIANNRHSDDNEKDDDEEQDADISNATATADSNELKIKKEQHSPLDLNVLSPHSAIATAAAAAAAAACANDPNKFQALLLERTKALAAEALKNGASEAANASSDEMPQQQAADAATAANQVTVEDDGDEDEEEQEAVKAPATSKPETITNVSEKPENDALTEAKLQPKIEILDTDDADEGGTEMAAGQTLEEQLVNSYWRRGFETSTPAATTTAAAAAAAAATAATTTGSKTPTIYQNANVVQQQLLPPPPPPLPPSQQQQQQHFSAQQQQQYHQQQQQQQQQQQQHGPSSTVLLSQLVNSTFLHANHSSCSNSKSTRLDAASHHQHQQHQPQQQQLLQQQQHHHNSSNSSNSSSAAGSDPLNPHHHHAHHHGHPHGQLLHAAHHLHHGADSNSSSANSTPNSTAQLAASIASTLNGNKSLLQAAAAANVAAVAAVAEDNNNSLTPNANAAVAAAAMAAHAQHAAALGAPSFLPNLPSLPAFQFAAAAAAGQDPRAQHFRFADAELQMQPGVSMAGRLGESLIPKGDPMEAKLQEMLRYNMDKYANQALDTLHISRRVRELLSVHNIGQRLFAKYILGLSQGTVSELLSKPKPWDKLTEKGRDSYRKMHAWACDDSAVMLLKSLIPKKDSGLPQYAGRGAGGDDSMSEDRLAHILSEASSLMKSSAVAAQQQEHQRRHLGDDTHSNEDSKSPPQSCSSPFYKDQQIKHLQPQQQQQLQHASEHAQREQREAAAAVAAVHQQQQQQREQREQREAAQREQQQRIRHDDLGPDKMARLYQELMTRTPREAAFPSFLLTPFFGGAAGMPGAPANPFPTAMAADENMRHVLEREIAKLQQQQAQQAQQAASFPNFSSLMALQQQVLNGAQDLSLASKDIKLNGQRSSLDQHSGGSSSCSKDGERGDDNDRSYPTLSHAARKSEGGNTPAPPAPPLTQTSAGSGSNSNAANSTIASGHGSNSAAPSPLSNSILPPALSNQGEEFAATASPLQRMASITNSLITQPPVTPHHSQPQRPTKAVLPPITQQQFDMFNNLNTEDIVRRVKEALSQYSISQRLFGESVLGLSQGSVSDLLARPKPWHMLTQKGREPFIRMKMFLEDDNAVHKLVASQYKIAPEKLMRTGSYSGSPQMPQGLANKMQATLPMQKMMNELKLQEPAQAQHIMQQMQAAAAMSAAMQQQQQAAAAQAAAVQQAQAQAQAQASQHQQAQHQQQQHQQVHQHQQAQQQAQAQAQAQAQAQLLHHQNMLLTSPGLPPQHAISLPAAVTPSGIQSAAGNPTAAGSTPGSNEKKPMMMPVLGGAHAPNAMRSLHQHMSPTVYEMAALTQDLDTHDITTKIKEALLANNIGQKIFGEAVLGLSQGSVSELLSKPKPWHMLSIKGREPFIRMQLWLSDANNVERLQLLKNERREASKRRRSTGPNQQDNSSDTSSNDTNDFYTSSPGPGSVGSSVGGAPPSKKQRVLFSEEQKEALRLAFALDPYPNVGTIEFLANELSLATRTITNWFHNHRMRLKQQVPHGQPGQDNPIPSRENTNATPFDPVQFRILLQQRLVELHKERMGLSGAPIPYPPYFAAAALLGRSLAGIPGAAAAAGAAAAAAAAVGAAGGDELQALNQAFKEQMSGLDLSMPTLKRERSDDYQDELELDASGHNMSDNESIEGGSHEPEHTPITEYEKALQKSALASAAAAAAYLSNAARSSRRKPAAPQWVNPAGASTPTAAGVAANNAGVDISSSSERIINGVCVMQGSDYNRDESDSIKGGGDSNATDAEHDDHAQLEIEQRFMEPEVRIKQEEDDEDEQPQQQQKQQLEDTTPLDSDAEKQLNVINEEKLRLVRVRRLSSNGDADEHCTAVQQATTAGAAAAPAATSWNY

Similar Transcription Factors

Sequence clustering based on sequence similarity using MMseqs2

100% Identity: iTF_00606855;
90% Identity: iTF_00495007; iTF_00609667; iTF_00609776; iTF_00597256; iTF_00597146; iTF_00573834; iTF_00573945; iTF_00619628; iTF_00619737; iTF_00558446; iTF_00558556; iTF_00496381; iTF_00496493; iTF_00521245; iTF_00521137; iTF_00498049; iTF_00497939; iTF_00542338; iTF_00542228; iTF_00606855; iTF_00564552; iTF_00564441; iTF_00499376; iTF_00499485; iTF_00548592; iTF_00548702; iTF_00592880; iTF_00592992; iTF_00482129; iTF_00482019; iTF_00524913; iTF_00525024; iTF_00522066; iTF_00521955; iTF_00576242; iTF_00576133; iTF_00497171; iTF_00497281; iTF_00576852; iTF_00576962; iTF_00516887; iTF_00516781; iTF_00518231; iTF_00518342; iTF_00560023; iTF_00560153; iTF_00570296; iTF_00570186; iTF_00527833; iTF_00527945; iTF_00595738; iTF_00595850; iTF_00582748; iTF_00582861; iTF_00513247; iTF_00513356; iTF_00485760; iTF_00485648; iTF_00616096; iTF_00615987;
80% Identity: iTF_00495007;