Basic Information

Insect: Sphenella marginata
Gene Symbol: pros_1
Assembly: GCA_951509765.1
Location: OX608079.1:23580037-23602757[+]

Transcription Factor Domain

TF Family: HPD
Domain: HPD domain
PFAM: PF05044
TF Group: Helix-turn-helix
Description: Prospero is a large drosophila transcription factor protein that is expressed in all neural lineages of drosophila embryos. It is needed for correct expression of several neural proteins and in determining the cell fates of neural stem cells. Homologues of prospero are found in a wide range of animals including humans with the highest level of similarity being found in the C-terminal 160 amino acids. This region was identified as containing an atypical homeobox domain followed by a prospero domain. However, the structure shows that these two regions form a single stable structural domain as defined here [1]. This homeo-prospero domain binds to DNA.
Hmmscan Out: # of c-Evalue i-Evalue score bias hmm coord from hmm coord to ali coord from ali coord to env coord from env coord to acc

1 2 0.47 1.3e+04 -2.6 0.1 101 144 718 761 691 769 0.75

2 2 4.1e-86 1.1e-81 273.7 1.9 1 153 1972 2124 1972 2125 0.99

#	of	c-Evalue	i-Evalue	score	bias	hmm coord from	hmm coord to	ali coord from	ali coord to	env coord from	env coord to	acc
1	2	0.47	1.3e+04	-2.6	0.1	101	144	718	761	691	769	0.75
2	2	4.1e-86	1.1e-81	273.7	1.9	1	153	1972	2124	1972	2125	0.99

Sequence Information

Coding Sequence: ATGATGTCATCAGAGGAGGACACAGATTGTTTTGGTTTGTATAGCGATGATAAGTTATTAGTTAAAGCAGTCACCAGCACATTAACGGCATTGGCAACAAGCGTTACAACTACACCGCCACTATTAGATTTGGATACAACAGAAATTGTTATAAAACAAGAAacgccaacaacaacactaacacCACCTACAACTAACAGTGCAATAAAGTTAGCAACAGCTAAAATAGCAAATACAAAGCATAATAATATACAACAAaataccagcaacaacaacactaacacCAACGGCAATTGTAATAAAACTAATAGCAACAATATTGTTACGCTTGTGGAGGAGCACAGCGAAAACGCGCATAACGGCAAAATTGGAGGCAAAGAGAACAACGAGCAGCACAAGAACAAGCAACGCGACCAACACAAACACACCATTGACAATAATAAACTCGTCAAGCATAACGACAACGTTGACGTACAAAACCACGGCGACAATAACGccaacgacgacgacgacgacgacgacgttGTCATACTCGAAGGCAACGAagtcgttacaacaacaacaaatacaaataatttacgTCAAAATCGTCGCATTCGTAATCGTAATCGTAATCGTGGTAGTCGTAGTCGAAGTCGCAGTCGCGGTAGTCTTAGCAGTCTCAGTAGCAGCGGCAGTACAAGCAGTGGTGGCAGAAATCAACAACAGCACCAAGTCATCGCACAAGTTGTGCATGCCATTGAGCGTGCAAACGAAAGTAGTCCGTGTGGTGCCGTCAATAAGACAGCAACGTGCACCGCTAACTTACAAACGACAACATTAGCGCGTACAAAATCAAATAGTAAAGTTGTAATTTCCACAACAAATAAATCAAAGAACGCGTCCttaacacaacaacagcaaacgaGTGATTTACACAGTGTGCATAAAAACAATTgtttaacaaataataatttgaataatctaacaacaacaaatagtagTAATTGTGCCAATCTAAACACGCAGGTGAATGTGAATACAACAAATGGAAATAGTGTTGCAAGTTTAGACTCAAAATTATACGTTGTACCAAGTTTTAGTTCACCGCAATTGTGTAGCGGTATTACGTTAACGGGACAACAAGATAATACGCGACATAGTCCTAGTGGcgcgccaacaacaacaacaacaacaccgctAGTGCCGTCATCCTTAGCTACTACTAACTACATGAGTAGTGCTGGTGCGGCTGTTGCGGGTGCACAAGTTGGTGGTACATCCTTGTATGGTACATTATTGAATCACACAAATCCAACGACGTCGTCGTCGCCGCCATTGTCGTCCTCGTTGTCGCCAACATCATTGTCGCCCAATAACGCTATAATTATTAACGGTGTAAGTggtagcagcaacaacaacaccaataatAACACTGCCAACAACAATCTCAATCAAAATTCCATAACAACAAATATTGTTGTTGGATCGGCTTCATCATCGCCAACAGCATCATTGCTTTCGGGCAATTTTACAGCGGCGCTTGGTAGCCTCTTCTCAGCAAACGGTTTCGGTTCAGCAAAAATGTTGAATGAATTATTCGGTAGACAAATGAAGCAAGCACAAGATGCTACTAGTGGCCTACCAGCCACACTCGACAATGCAATGTTAGCCGCCGCTATGGAATCGGCCACAAGCGCCGAGCTCTTAAGTGCAGCCGGTCTTGTCAATAGTTTAGGCTTAAATGCTACAAACAAATTGCTCAATAATAATACAATAAATAGTTTGAATAGTTTAAGTGGTAATGCTAATAAtgcagctacaacaacaacaaacaataatgTTGGTAATACGAGCGCTGCTGATCGAACGTCATCCGGTGGTGCACAAACCCCACCCAAAAATCGACGTGTCAGCAATTGTAGTGATCGTTCCTTGGATGAGGTGGCATCGCGTAGCGGTGATATAAGCTCACCACCGCGTGCGCCATCCGTTAGCTCAACATCGGCTGTAAATGCGGCTGAAAGGATATCACCAagcgtacaacaacaacaacagcagcagaaTGAATTGGCGCATCATATGTTGCGAAATATTTTACAAGGCAAGAAGGAGCTCATGCAACTCGATCAGGAATTGCGCTCCGTAATGACacaacatcagcaacaacaacaacaacagctagcTGATAATCAAACTACGCTCAAacataataacaacaatttaaatgcagctaataataataataatgtgtCAGATAAAGAAACAATAAGCGTTATAAATTTGTTGGAGGACACCATTGATGTGAAAATCAAATGTGAGCCGAACACAATGCCAAATAATGCTGATGCCACAAACGCAGAGCGTAGAAAGTCCACAGATTCGGATGAAAATGCCGATTCGCAGCAAGATGACGATCAACAGTCGGAGGCTGATCAAATGGCCGAACAGCATATGGATGAAGGCGATGAACCGCAACACTCCTCACTAGCCGTAGGCATCACCAAGAAGGAAGCCGACGAAATACTCGAAGATGTAGAGCTAATGGGTCTCAACTCACGCTCCGATCTAGAGTCGTTAGCCTCACCAAGCCAATCGGAAATGATGATGTTAGAGAATAGCAAAGATGAATTGGATGACGAATTAGAAAAGGATGTAGTCGCTACGATGTCCTCAAAGAAAACTGGCATGGATATGAAGCGTGCGCGCGTAGAAAATATTGTAACCACAATGCGCTCCAGTCCACAATCGCATCAAACGCATTTGCAAGTGAATGGTTGTAAGAAGCGTAAACTCTATCAGCCACAACAGCATGCCATGGAGCGTTATGTAGCCGCAGCGGCTGGTTTGAATTTCGGTTTGAATCTACAAAGCATGATGCTGGATGAGGAGGCCTCCAACGATATGGAATCaccacaaatacaacaaaagcgcGTCGAAAAGAATGCGCTCAAATCACAATTACGTTCAATGCAAGAACAATTGGCtgaaatgcaacaaaaatatgtgcAATTATGCTCACGCATGGAGCAAGAGTCCGAGTGTCAGGACATTGATGATACTGCCAGCGATAGTATGGAGCAAGATGATAATGGTGGCGGTGTTGAGCTATCACCATCGCCCTCATTAACCGGTGAATCGCTTGTTAATGATAATAAACTACAAACAAGTGGCGATGGTGTTGAACGCCTTAGCTCTACATCGCCCACAGCGTCACTACAAATCAAATCACAAAAACATTTAACCTCGCAAAATACCTTGGCCGCACTGGATAATGCGCCCAATGTGCTCTCACAGATGATGAGTAAAATGATGTCATCGCGTACGCTTGTCGGTCATCCGCATATGCAGCAATCGTTCAATGGTGGTCCATTGCCGCTGCTGCCACACATGCCACAATTGCAAGGTGATGCCAATGCGGCTGCTGCTGCGGCGGCACATTTGTCCCATCCAGCGGCGATTAGTAATGCTGCCGCTATGTATTTGGGACAGCAATTCTTTTTTGAACAGGAAGCGCGTATGGCCAAAGAAGCGGCTGAACAGCAAGAGcgccaacagcagcagcaacagcaacagcaacaacagttgcagcagcagcaacaacaacaacaacaacagcagcagcatcaGCAGGAGCAAGAGCAGCAAAGACGTTTCGAGCAGGAGCAACAGCAGCGTCGCAAAgaagaaaagcaacaacaacaacagcaagcagCGCAACAACTAcaacgccaacaacaacagctacagcaaatgcaacaacagcaCTTGGAACatgcaacaacaccaacaagtGTGGCGCTCAATCAACCAACGCGCCCACAGCTACATCACAACCGTTTGCATCAGCGTCACGCCAGTCATTCCTCGCTCAAATCAGAACTTTCTGAAAAATTCAATATGCTACGCTCCAGCTCCAATTCCATAATGCGCATGTCCGGCTCCGATCTGGAGGGTCTCGCCGATGTGCTTAAATCGGAAATCACCACATCACTCTCAGCATTGGTGGATACGATCGTTACACGTTTTGTACATCAACGTCGCCTCTTTAGCAAACAATCCGATTCGGTGGCTGCAGCCGCTGAGCAACTCAACAAGGATTTGCTCATGGCCTCGCAAATACTCGATCGCAAATCACCGCGCACAAAAGTCGCCGAACGTATCCAAGGCAATGCGGGCAATGCAAATAATGCGAATTCAACGTCCGTACAGAGCGGTGGCAATGTTGCGGTGAATGCagccgcagcagcagcagcagtccAATCAGGTAATAATGGTTCTCTTCTtctagttaataataataatacctcCTCCACAACTAACCaattaaataatacaaatatgtCCACCACTAATCATCTGGGTCACTTGCAGTCAGCGGTGAGTAATGGTGGTCCCCAGCAAATGCATATTGTTGGCTCAAATGGCGCACTAAGTGTTGGCGGTGGTGTTAATGTGCCACAACATCCGCTtaataataatcaaacaaaaaatgctATGGGGACCTCTAATGCACAAACGAATGCTCAGCAAATGACCCAGCAAATGTCAGCATTGGCAGCACAAAATTGTCAAAGTTTAATAGCTGCACCACGTTTGAATGGTAATCAATTGTCATTTCCATCACCGGCTGCAGCTGCAGCTGCGGCAATGGGCCTGCAAATGCATCATGCAGCAGCCGCAGCTGCTATGTCCGCAGCCGCTGCTAATCAGCAGCAACAAAATCATAATCAACAATTAACGAACGACAATACGAACCAACATCAAATGAGTTCGGGTCTTACGTTGAATTCAAATACGAATTCAAATAATACTAACAATAATTTAAGTACAATTAATATACCACCTCCTCATATACGTCCTTCGCCCACAGCGGCAGCAATATTTCAGGCACCAAAGACACCGCAAGGCATGAATCCGGTCGCTGCTGCTGCACTCTACAACTCGATGGCCGCTGGCGGTCCAAATCAAATGAATCCATTTTGCATGCCAGATGCACGTGATgctcaacagcaacaacagcaacaacaacaacagcagcagcagcaacagcaccaacaacagcagcagcaacagcaacaacagcagcagcagcaacaacaaatcttAGAACAAAATGAAGCTCTCAGCTTGGTTGTAACACCAAAGAAGAAACGTCATAAGGTGACCGATACACGCATCACACCACGTACCGTTAGTCGTATACTTGCCCAAGATGGTGTTGTACCACCAAATCCAGCAATGGATAATAAATTTGGTATGCAACCGAATCAACAACAAACACAGCAACAAAATTCGAATCAAACGAATTGTCAAACATCAAACTCAGGCAATAATAGCGCCAACGTTACACCCATCAATGTGAATGGTAATGTTGGTGGTAATGTGAATACAACACCCGCACAAAGTCCATCACCACGTGCACAAGCGCCCACCTATCATccgccgccaccaccaccaccacccatGTTGCCCGTGTCGTTGCCCACTTCGGTGGCTATACCCAATCCATCGTTGCACGAGTCGCAAGTCTTCTCACCTTATAGTCCATTCTTTAATCCTCATCCGCCGCAtgcgccaccaccaccacccccGCATGGTCCACATGGTGGTCATAATACGCCAACAGCTGCCCAAATGCATCACATGAAAATGTCGACGAGTCCAAATGGTCTTGGTGGTTTGATGGATTCACGCGATTCACCACCGCTACCTCATCCACCCTCAATGTTGCATCCCGCTTTGTTGGCGGCCGCCCATCATGGTGGCTCTCCCGATTATGGTGCTCATCTGCGTGCAGCTATGGATGCACAGGATCGTAATTCGGATTGTAATTCAGCGGATATGCAATTCGATGGAATGCAACCAACGATATCATTCCTGAAACAGCAAATGATCAAAAATAGCGACTCCTTAAGTCCACTGCACTCATCGACATTAACACCAATGCACCTGCGCAAAGCCAAATTAATGTTCTTCTGGGTGCGTTATCCCAGTTCGGCGGTACTGAAAATGTATTTCCCAGATATCAAATTTAATAAGAACAATACAGCACAATTGGTGAAATGGTTCTCGAATTTCCGAGAATTTTACTATATTCAAATGGAGAAATATGCACGTCAGGCGGTAACTGAGGGCGTCAAATGTGCTGATGAGTTGCATGTTGGCGGTGACAGTGAGCTGTATCGTGTACTCAATCTGCATTACAATCGCAATAATCACATAGAGGTACCACAAAATTTCCGTTTTGTAGTCGAACAAACATTGCGCGAATTCCATCGTGCCATTCAAGGTGGCAAAGATACAGAACAATCGTGGAAGAAGGCAATCTATAAGGTTATATCACGTATGGATGATCCGGTGCCTGAATATTTCAAATCGCCTAACTTTTTGGAACAATTGGAATAA
Protein Sequence: MMSSEEDTDCFGLYSDDKLLVKAVTSTLTALATSVTTTPPLLDLDTTEIVIKQETPTTTLTPPTTNSAIKLATAKIANTKHNNIQQNTSNNNTNTNGNCNKTNSNNIVTLVEEHSENAHNGKIGGKENNEQHKNKQRDQHKHTIDNNKLVKHNDNVDVQNHGDNNANDDDDDDDVVILEGNEVVTTTTNTNNLRQNRRIRNRNRNRGSRSRSRSRGSLSSLSSSGSTSSGGRNQQQHQVIAQVVHAIERANESSPCGAVNKTATCTANLQTTTLARTKSNSKVVISTTNKSKNASLTQQQQTSDLHSVHKNNCLTNNNLNNLTTTNSSNCANLNTQVNVNTTNGNSVASLDSKLYVVPSFSSPQLCSGITLTGQQDNTRHSPSGAPTTTTTTPLVPSSLATTNYMSSAGAAVAGAQVGGTSLYGTLLNHTNPTTSSSPPLSSSLSPTSLSPNNAIIINGVSGSSNNNTNNNTANNNLNQNSITTNIVVGSASSSPTASLLSGNFTAALGSLFSANGFGSAKMLNELFGRQMKQAQDATSGLPATLDNAMLAAAMESATSAELLSAAGLVNSLGLNATNKLLNNNTINSLNSLSGNANNAATTTTNNNVGNTSAADRTSSGGAQTPPKNRRVSNCSDRSLDEVASRSGDISSPPRAPSVSSTSAVNAAERISPSVQQQQQQQNELAHHMLRNILQGKKELMQLDQELRSVMTQHQQQQQQQLADNQTTLKHNNNNLNAANNNNNVSDKETISVINLLEDTIDVKIKCEPNTMPNNADATNAERRKSTDSDENADSQQDDDQQSEADQMAEQHMDEGDEPQHSSLAVGITKKEADEILEDVELMGLNSRSDLESLASPSQSEMMMLENSKDELDDELEKDVVATMSSKKTGMDMKRARVENIVTTMRSSPQSHQTHLQVNGCKKRKLYQPQQHAMERYVAAAAGLNFGLNLQSMMLDEEASNDMESPQIQQKRVEKNALKSQLRSMQEQLAEMQQKYVQLCSRMEQESECQDIDDTASDSMEQDDNGGGVELSPSPSLTGESLVNDNKLQTSGDGVERLSSTSPTASLQIKSQKHLTSQNTLAALDNAPNVLSQMMSKMMSSRTLVGHPHMQQSFNGGPLPLLPHMPQLQGDANAAAAAAAHLSHPAAISNAAAMYLGQQFFFEQEARMAKEAAEQQERQQQQQQQQQQQLQQQQQQQQQQQQHQQEQEQQRRFEQEQQQRRKEEKQQQQQQAAQQLQRQQQQLQQMQQQHLEHATTPTSVALNQPTRPQLHHNRLHQRHASHSSLKSELSEKFNMLRSSSNSIMRMSGSDLEGLADVLKSEITTSLSALVDTIVTRFVHQRRLFSKQSDSVAAAAEQLNKDLLMASQILDRKSPRTKVAERIQGNAGNANNANSTSVQSGGNVAVNAAAAAAAVQSGNNGSLLLVNNNNTSSTTNQLNNTNMSTTNHLGHLQSAVSNGGPQQMHIVGSNGALSVGGGVNVPQHPLNNNQTKNAMGTSNAQTNAQQMTQQMSALAAQNCQSLIAAPRLNGNQLSFPSPAAAAAAAMGLQMHHAAAAAAMSAAAANQQQQNHNQQLTNDNTNQHQMSSGLTLNSNTNSNNTNNNLSTINIPPPHIRPSPTAAAIFQAPKTPQGMNPVAAAALYNSMAAGGPNQMNPFCMPDARDAQQQQQQQQQQQQQQQHQQQQQQQQQQQQQQQQILEQNEALSLVVTPKKKRHKVTDTRITPRTVSRILAQDGVVPPNPAMDNKFGMQPNQQQTQQQNSNQTNCQTSNSGNNSANVTPINVNGNVGGNVNTTPAQSPSPRAQAPTYHPPPPPPPPMLPVSLPTSVAIPNPSLHESQVFSPYSPFFNPHPPHAPPPPPPHGPHGGHNTPTAAQMHHMKMSTSPNGLGGLMDSRDSPPLPHPPSMLHPALLAAAHHGGSPDYGAHLRAAMDAQDRNSDCNSADMQFDGMQPTISFLKQQMIKNSDSLSPLHSSTLTPMHLRKAKLMFFWVRYPSSAVLKMYFPDIKFNKNNTAQLVKWFSNFREFYYIQMEKYARQAVTEGVKCADELHVGGDSELYRVLNLHYNRNNHIEVPQNFRFVVEQTLREFHRAIQGGKDTEQSWKKAIYKVISRMDDPVPEYFKSPNFLEQLE

Similar Transcription Factors

Sequence clustering based on sequence similarity using MMseqs2

100% Identity: iTF_00992462;
90% Identity: iTF_00992462;
80% Identity: -