Basic Information

Insect: Stomoxys calcitrans
Gene Symbol: ct_1
Assembly: GCA_001015335.1
Location: NW:374972-508399[-]

Transcription Factor Domain

TF Family: CUT
Domain: Homeobox|CUT
PFAM: PF02376
TF Group: Helix-turn-helix
Description: The CUT domain is a DNA-binding motif which can bind independently or in cooperation with the homeodomain, often found downstream of the CUT domain. Multiple copies of the CUT domain can exist in one protein (eg Swiss:P10180).
Hmmscan Out: # of c-Evalue i-Evalue score bias hmm coord from hmm coord to ali coord from ali coord to env coord from env coord to acc

1 4 0.42 2.9e+03 -2.0 0.3 30 48 790 808 777 810 0.80

2 4 6.4e-27 4.4e-23 80.7 0.0 3 72 1009 1079 1007 1084 0.94

3 4 6.2e-32 4.2e-28 96.8 0.0 3 77 1431 1506 1429 1508 0.96

4 4 1.1e-30 7.5e-27 92.8 0.0 3 75 1695 1768 1693 1772 0.95

#	of	c-Evalue	i-Evalue	score	bias	hmm coord from	hmm coord to	ali coord from	ali coord to	env coord from	env coord to	acc
1	4	0.42	2.9e+03	-2.0	0.3	30	48	790	808	777	810	0.80
2	4	6.4e-27	4.4e-23	80.7	0.0	3	72	1009	1079	1007	1084	0.94
3	4	6.2e-32	4.2e-28	96.8	0.0	3	77	1431	1506	1429	1508	0.96
4	4	1.1e-30	7.5e-27	92.8	0.0	3	75	1695	1768	1693	1772	0.95

Sequence Information

Coding Sequence: ATGCAGCCAACATTGCCCCAAACAGCCGGTACAGCCGATATGGATTTGACGGCTGTACAATCAATGGATTGGTTTTTCAAAAAGGAACAAATTTATCTAttggcacaattttggcaacagAGAGCTACCTTGGCTGAAAAGGAAGTCAACACTCTGAAAGAGCAACTGTCCACCAATACCCCCAATACCGATACCAACAGCGAAGGTGACAACAATCTGGATTTGTCAATTGCCACCTCCACAGCAGCTAACATCACTAATACCACGAATAGCGGTGAAGCGGCAGAAGCCAGCGACAACAATACAGCATCGGCCACCGATATCCCACCAAATAATCGCCTGACGCCCTCCTCATTCGATAGCCACAATACGAAATTACTAAACAGTGTGGCTGCAGCCATAACACTGCATCAGAACGGTGGTAATCTGTTGGCTACAACACCTTCACCATCGCCACCCCTCTCCGATAGCGGCAGCAGTCAGCAACAATTGAACGGCTGCTTAAATCCCAAATTGTTCTTCAATCACGCCCAACAAGTTATGATGATGGAAGCTGCTGCCGCAGCAGCGGCCGCCGCCGCTGCAGCAGTGCAACAGCAACAATCGCCCATGCATTCGCCACAACCTGCTGACGCTAACACAACACACAATGCACAGGACTCAAGTGCTGAGGAAATGCAACaacccaccaacaacaacaaaacaatggaACACAAAGATaatgcatcatcatcatcgtcattagATAAGGCCTCAAGTGATACTCAACAACTGCAGCAGCATTCACCGGAAAAAGACAACATTAATAACAGCCCCCGCCATCGATCTACTGGCTTGGTGGAGGAGGAGGACGATGACGAAGACGAGGAAGCTAATGCGGAGCAGGCCAGTGATTGTGCTTcgataaataataataacattaacaacaacaacaacaaaaatatcaatAGTTTTAATAGTGATAATAAACATAGTTTAAATGCCAGTTGTGCGGAAACGGAAATGCTAAAACACAAGACAAAGACAACCATCAGCACCACCGTCGCCGCCAGCACCCACGCCACAGAGGATGCAAACTCAGAAGATTTAGAGAGTAGAGGGCCTCTATTGGAACCCAAACACTCTGATTTTGTAGCTGCCAAAGAGAAAGAGATTAAAGCCTTATTTGAAGAAGTTAAACGTTTAAGAGCCCTTGAACAATCCCACTTGGTACAAATCCATAGGCTGGAGGAACATTTGGAAGCCAAACGCCAACATATTGTACGCTTggaagccaaattggaaaaagaaCAAATCAATGAAGCCCTACAACAATCCGCTGGCCCCCCAAAATCCGATCGTCAAGAAAACCCCGAATCGGAAGTGGTGGCAGAAAATTTGGAAACCCCTCAAATGGTCATCGATTATGATGACGATGAAGATGAGGAGGATAGACCTGCAGAACCAATTCAGCATAACCTAGACGATGATGAAGATGACGAGGAGGACAACTGTGATCTAGACAAagaaaataacaatgataacgaacaaaatcaaaattcaaatgCTAACCCAGAGCAAAATGCTGGCGAGGATGTGCAAAAGGAGGCATTGAAAATCAAAAAGGAAACACAGGCTCCTTTGTCTTTGGACTCCATTAGCCAACAAAATGTTGTtgcagctgctgctgcagcGGCAGCCGCCTGCAATAACGATCCCAATAAATTCCAGGAATTACTCATGGAACGCACCAAAGCCTTGGTAGCCGCTGAAGCTTTGAAGAACTCTGAAGAAAATTCTCTAGATAAAGCCAAGGAGCAAGCCATTGCTGATGAAGATGGTGGTGATAATGAAGTCTTAGAATCAAACCCCTCCGCTTCATTATCTTTGGAAAAGCCCATCGCCACTACCAACACCGCCACCACAACCACCAACACCAACTCGACAATCCCCCCTAATAATGAGGCTGATCTTGAAGAAGCCTCAAAAGTGCCAAAAATCGAAATactagatgatgatgatgctgaaaATAATGCTTCTCATAGCGCTAAAGATAATTCAGAGAAAGCTTCATTTTCGCTGtgcgataaaaataaaattatcaaTTTGGATAGTGACAAGTCTTGTGATGATGAGGCTACGGCCACTTTTAAGCAAAATGTTGAACGTTTCGGTTCTTTGTTGGGCGAAGAATTGGTCAATAGCTATTGGAGGCGAGGCTTTGATGCAACCAAAtcgcaacaacagcagcaccaTAGCCAACATCATCTGCACCATCATCAGCAGCATCAACAGCAACATCCTTTAATGATGCCTCAAACCGTCCAAtcgcaacaacatcaacaacaacagcattacCATCAACAtttgcaacaacagcagcaacaacaagccATTTCGTCGAACTCACCTTATACTACGTCTTCTTTGCTACAACATCCGTCTTCTTCGCAGGCCCCGCCTTGCGGTCCTTCGTCCACCACTTTGCTTAGTCAATTAGTTAATTCCACTTTTTCTACCCCCAACTCAACCACAACTCAAAATTCCTCTTTACGTTCAACAGATGCCCACTTCCCACATCATCATccacatcagcagcagcaacacctCCATCACCAATTGCCTCCCCACTTAGCCGATCATCATGATAAGTCCTCGGCTGCCCACAATCATCATGAATCGTCAGCCTCCAGTGCCAGTACGCCCAACTTGCCCGAACAGCGTTCGAGTGAGGACCAGCATCAGCAACATCATCACTCTCTCAATGGCTCGCTGAAGAATTtcgaagacaacaacaacagtttggGAGCCACACCCACCGGCCATGGTCTGGGTGGAGGTCATCCCCATTTACCTCATGGCTTCCTGCCCGGTTTACCATTCCAATTTCAAGATCGCGGCCATTTCCGCTTTGCCGATGATTTGCAATTGCCTCCGGGCACCTCAATGGCTGGCCGCTTGGGCGAGTCCCTGATACCCAAAGGTGATCCCATGGAGGCCAAATTGCAAGAGATGCTACGCTACAATATGGACAAATATGCCAATCAGGCCTTGGACACATTGCACATTTCGCGCCGTGTACGCGAGCTGCTATCGGTGCACAACATTGGCCAACGCATATTTGCCAAATATATTTTGGGCCTGTCACAAGGCACCGTCTCTGAGCTGCTGTCCAAGCCAAAGCCTTGGGATAAACTCACCGAGAAAGGACGTGACAGTTACCGCAAAATGCATGCCTGGTCCTGTGATGATAACGCTGTTATGCTGCTCAAATCGTTGATACCTAAGAAAGATTCTGGCTTGCCGCCTTATGGTGCTGGTCGTGACGATTCCATGTCTGATGATCGCATTGCTCACATTTTGAATGAAGCCTCATCACTGATGAAGGGTTCAGGGCCTTCAGttttgcaacagcaacaacgttCGGGCATTCCCGAAGATTCCCACAGCGCTGAGGATTCCAAATCACCTCATCAACCTTGTTCCTCACCCTTCTACAAGGATCACATGAAATCACAGATGGACAACTCAATGTCTGGCTCCGGTCATATGCGCCCCGATGAGGTTAATCCCGAAAAAATGGCTCGCCTTTACCAAGAGATAATGGCTAGAGCTCCACGAGAAGCATTCCCAGGTTTCTTGCTTTCTCCCTTTTTCAGCGGCGGCCTACCGGCCGGCATGGGTGCCAATGCCTTCCCTGGCCTAGCGGCCGATGAAAATATGCGCATGGCCTTTGAACGTGAGATGTCCAaattgcaacagcaacaacagcagcagcaacactcTCAGCCGCCCAACTTTGCCAATTTCTCTAGTCTCATGGCTCTGCAACAGCAAATGTTGAATGGGGCCCAGGACTTGACACTGGGCAAAGAGGAAGGCCTGAAAGACTCCAAACTCAATGGACAACGCCACTCCTTTGATGGATCCTCACAGAACTCACTCAGCAACGCTGCCGGCGGTCAGACTACCCCCAATGCCAAAGAAAATTCTGCCTCAGATGTTGATAGACTGTATCCCGGTATGGTTAAGAACGAACAGGGCAACAAGACTCCAGCTCCAGCACTTTCCAGCAATGCTtccaccaccaacaccaatTCGGCTGCTCCCAGTCCTCTCAGCAACTCAATACTCCCGCCTGCTATGACTCCCACCGATGAGTTCGGTGCCACCGCCAGCCCCTTGCAAAGAATGGCTTCCATCACCAATTCCCTGATTACCCAGCCTCCGGTACCACCACATCATACACCACAACAGCGCCCCACCAAAGCCGTCTTGCCACCCATCACCCAACAACAATTCGATATGTTTAACAATCTCAATACCGAAGACATTGTGCGCCGTGTCAAGGAGGCCTTATCTCAGTATTCCATTTCGCAGCGCCTGTTTGGAGAATCTGTTTTGGGCCTATCCCAGGGATCCGTATCGGACCTCTTGGCCCGTCCCAAGCCCTGGCACATGCTCACCCAGAAGGGTCGAGAACCATTCATACGCATGAAAATGTTTTTGGAAGACGACAATGCCGTACACAAATTGGTAGCTTCCCAATACAAAATAGCTCCTGAAAAGCTAATGAGAACAGGCAACTATGCAGGAGCCCCACAAATGCCTCCGGGCTTGGTGGGCAAAATGCCACCATCCCTGCCCATGCAAAAGATGATGAGTGAATTGAAATTGCAGGAACCAGCTCACATTATGCAACAGATGCAGGCAGCCGCTGTTATGTCCGCTGCCATGCAGCAgcatcaacaacagcagcaggctGCCGCAGTTCAACAGAGCCAGCAGGCCGCTGCTGCTCAGGCAGCAGTGCAGGCCGCACAAGCTGCAGCTGCCGCTCAAGCCGCCCAGGCCGCTCAAGCTGCCCAACAACATCATCAGAGCATGCTATTGACTTCGCCTGGCTTGCCTCCACAACATGCCATTCCTTTGCCTGCCGCCAACTCTAATCCCACTTCGGGCGCCAGCACACCTGCCGGTGGTCCCTCTTCCGAGAAGAAACAGCCAATGATGATGCCCATCCATTCGCCCCACCAAGGAAATGCCATGCGCAACATGCACCAGCACATGTCACCCACCGTTTATGAGATGGCAGCCCTCACTCAAGATTTGGACACTCAGGTTATCACCACCAAAATCAAGGAGGCTTTATTGACCAACAATATTGGTCAGAAGATTTTCGGCGAAGCTGTTTTGGGTTTGTCTCAGGGTTCCGTGTCGGAGTTGCTGAGCAAGCCCAAGCCCTGGCATATGTTGTCCATTAAGGGTCGAGAGCCTTTCATTCGCATGCAGTTGTGGCTTTCCGACGCCAACAATGTGGACCGTTTGCAGGCGTTAAAGAATGAGAGAAGAGAGGCCTCCAAACGCCGACGTTCCACAGGACCCAATCAACAGGACAACAGCTCAGATACTTCCAGCAATGATACCAATGATTTTTACACCAGCAGTCCTGGTCCTGGTTCGGTGGGAAGTGCCGGAGCTCCCCCGAATAAGAAGCAGAGGGTGCTGTTCTCAGAAGAGCAAAAAGAGGCTTTGCGATTGGCATTTGCTTTGGATCCCTATCCCAATGTGGGCACCATAGAATTCCTGGCCAATGAACTGAACTTGGCCACTCGCACCATCACCAACTGGTTCCACAATCATCGCATGCGTTTAAAACAACAAGTGCCTCATGGTCCTCCGGGCCAGGAAACGAATATACCCACACGTGAAAACACCAATTCCACTCCTTTCGATCCCGTCCAATTCCGCATCTTGTTGCAACAGAGATTACTAGAGCTGCAAAAGGAACGCATGGGTCTGGGAGGCAATAATCCCTTGCCATATCCACCCTATTTTGCGGCGGCTGCTCTATTGGGCCGCAGCCTGGCTGGCATGCCCAATGCCGGAGGTGCCGGTGTACCCAATGAAGCCGAATTGAGAGCCTTAAATCAAAAATTCCAAGAACAAATGGCCGGTTTGGACTTGTCAATGAGTTCGCTGAAGCGTGAGAGAACCGATGACTTTGACGATGATTTGGATGATGGCCATCTCAGTGAGAACGAAAATGACTCTTTGGATGGCGAAGACAAAGGGGGAGAGTTTAAGGCGCTGAGCAGTCTAAATGCCCAACACTTTTTGAATAGCATGCGCTTGAACAGACGCAAACCTGCCGCACCACAATGGGTTAACCCTGCCGTTCCCTCAGCCACCGAAAGCGAGCGCATTATCAATGGCGTTTGTGTTATGCAGGAGGGCAACGATGAGTCCTCAACCCACCACGAGGAGGAGAACCAGGCCAAGTCATCGTCGCACAACGACAGTGAGGATGCCGATGCGGATGCCCCACATCATCTGGTCATGGAGCCCGAGGTGTTGATCAAACAAGAAAAAGAAGACTGCGAAAGTGATAACGACAAACCAGCAAATGATGAAGCGTCGGCTATGATGAGTGCCGAGGACAAACTGAGAATGGTGAGGGTCAATCGTCTGAGCAACGAGGATGAGGGAGTGGCGCCAGCCATCATGCCAGCCACAGCGTGGAATTATTAA
Protein Sequence: MQPTLPQTAGTADMDLTAVQSMDWFFKKEQIYLLAQFWQQRATLAEKEVNTLKEQLSTNTPNTDTNSEGDNNLDLSIATSTAANITNTTNSGEAAEASDNNTASATDIPPNNRLTPSSFDSHNTKLLNSVAAAITLHQNGGNLLATTPSPSPPLSDSGSSQQQLNGCLNPKLFFNHAQQVMMMEAAAAAAAAAAAAVQQQQSPMHSPQPADANTTHNAQDSSAEEMQQPTNNNKTMEHKDNASSSSSLDKASSDTQQLQQHSPEKDNINNSPRHRSTGLVEEEDDDEDEEANAEQASDCASINNNNINNNNNKNINSFNSDNKHSLNASCAETEMLKHKTKTTISTTVAASTHATEDANSEDLESRGPLLEPKHSDFVAAKEKEIKALFEEVKRLRALEQSHLVQIHRLEEHLEAKRQHIVRLEAKLEKEQINEALQQSAGPPKSDRQENPESEVVAENLETPQMVIDYDDDEDEEDRPAEPIQHNLDDDEDDEEDNCDLDKENNNDNEQNQNSNANPEQNAGEDVQKEALKIKKETQAPLSLDSISQQNVVAAAAAAAAACNNDPNKFQELLMERTKALVAAEALKNSEENSLDKAKEQAIADEDGGDNEVLESNPSASLSLEKPIATTNTATTTTNTNSTIPPNNEADLEEASKVPKIEILDDDDAENNASHSAKDNSEKASFSLCDKNKIINLDSDKSCDDEATATFKQNVERFGSLLGEELVNSYWRRGFDATKSQQQQHHSQHHLHHHQQHQQQHPLMMPQTVQSQQHQQQQHYHQHLQQQQQQQAISSNSPYTTSSLLQHPSSSQAPPCGPSSTTLLSQLVNSTFSTPNSTTTQNSSLRSTDAHFPHHHPHQQQQHLHHQLPPHLADHHDKSSAAHNHHESSASSASTPNLPEQRSSEDQHQQHHHSLNGSLKNFEDNNNSLGATPTGHGLGGGHPHLPHGFLPGLPFQFQDRGHFRFADDLQLPPGTSMAGRLGESLIPKGDPMEAKLQEMLRYNMDKYANQALDTLHISRRVRELLSVHNIGQRIFAKYILGLSQGTVSELLSKPKPWDKLTEKGRDSYRKMHAWSCDDNAVMLLKSLIPKKDSGLPPYGAGRDDSMSDDRIAHILNEASSLMKGSGPSVLQQQQRSGIPEDSHSAEDSKSPHQPCSSPFYKDHMKSQMDNSMSGSGHMRPDEVNPEKMARLYQEIMARAPREAFPGFLLSPFFSGGLPAGMGANAFPGLAADENMRMAFEREMSKLQQQQQQQQHSQPPNFANFSSLMALQQQMLNGAQDLTLGKEEGLKDSKLNGQRHSFDGSSQNSLSNAAGGQTTPNAKENSASDVDRLYPGMVKNEQGNKTPAPALSSNASTTNTNSAAPSPLSNSILPPAMTPTDEFGATASPLQRMASITNSLITQPPVPPHHTPQQRPTKAVLPPITQQQFDMFNNLNTEDIVRRVKEALSQYSISQRLFGESVLGLSQGSVSDLLARPKPWHMLTQKGREPFIRMKMFLEDDNAVHKLVASQYKIAPEKLMRTGNYAGAPQMPPGLVGKMPPSLPMQKMMSELKLQEPAHIMQQMQAAAVMSAAMQQHQQQQQAAAVQQSQQAAAAQAAVQAAQAAAAAQAAQAAQAAQQHHQSMLLTSPGLPPQHAIPLPAANSNPTSGASTPAGGPSSEKKQPMMMPIHSPHQGNAMRNMHQHMSPTVYEMAALTQDLDTQVITTKIKEALLTNNIGQKIFGEAVLGLSQGSVSELLSKPKPWHMLSIKGREPFIRMQLWLSDANNVDRLQALKNERREASKRRRSTGPNQQDNSSDTSSNDTNDFYTSSPGPGSVGSAGAPPNKKQRVLFSEEQKEALRLAFALDPYPNVGTIEFLANELNLATRTITNWFHNHRMRLKQQVPHGPPGQETNIPTRENTNSTPFDPVQFRILLQQRLLELQKERMGLGGNNPLPYPPYFAAAALLGRSLAGMPNAGGAGVPNEAELRALNQKFQEQMAGLDLSMSSLKRERTDDFDDDLDDGHLSENENDSLDGEDKGGEFKALSSLNAQHFLNSMRLNRRKPAAPQWVNPAVPSATESERIINGVCVMQEGNDESSTHHEEENQAKSSSHNDSEDADADAPHHLVMEPEVLIKQEKEDCESDNDKPANDEASAMMSAEDKLRMVRVNRLSNEDEGVAPAIMPATAWNY

Similar Transcription Factors

Sequence clustering based on sequence similarity using MMseqs2

100% Identity: iTF_01374864; iTF_00679267; iTF_00679375;
90% Identity: iTF_01374864;
80% Identity: iTF_01374864;