11 research outputs found

    Enrichment of virtual screening results using induced-fit techniques

    Get PDF
    This thesis explains the design, development, test on the benchmarking dataset DUD-e and the application to an industrial virtual screening project of the PELE VS platform. The most common and quick tools used on virtual screening campaigns do not take into account the induced-fit effect, although there are some methodologies capable of reproducing this effect they are either time consuming or very limited on which transformations the protein may undergo. In this thesis with the development of the PELE VS platform we aim at using the simulation software PELE (Protein Energy Landscape Exploration) to account for the induced-fit effect. The PELE software uses a monte carlo algorithm coupled with an energy minimization step to explore the ligand conformations and model the protein. This approach allows the program to account for both big conformational changes and small local changes of the protein and to perform a good conformational search of the ligand, which coupled can account for the induced-fit effect with only a quick simulation. PELE has been traditionally, and successfully, used in the enzyme engineering field where only a few compounds per protein are usually tested and studied. In order to apply the program to the virtual screening field, where thousands of compounds are tested in silico, the first step was to automatize the whole procedure of preparing, launching and analyzing the simulations. Thus, during this thesis the PELE VS platform has been developed altogether with other auxiliary tools. Once the platform was developed, we wanted to test the behaviour of PELE on a well known benchmarking dataset, thus we tried our methodology on the DUD-e dataset. Since this dataset is formed by more than 100 proteins, we chose a few proteins for each of the families present in the dataset, reducing the number of proteins to 21 systems. Then, we tried to use a general protocol for all the chosen proteins in order to improve the results of currently used scoring functions in the field. After studying the simulations and trying several protocols on this subset we we observed that every protein (or at least family) that we want to study needs an specific simulation protocol in order to correctly reproduce the induced-fit effect and improve the results of the most used scoring function: glide from schrodinger. Finally we applied the platform and our previous hypothesis to an industrial virtual screening campaign, as part of the collaborative Retos project: Silicoderm. In this case we worked with only one protein and several compounds and we confirmed the need for a tailored simulation protocol for the receptor in order to improve results.Esta tesis explica el diseño, desarrollo, testeo en el dataset de referencia DUD-e y la aplicación en un proyecto industrial de cribado virtual de la plataforma PELE VS. Las herramientas más rápidas usadas en campañas de cribado virtual no tienen en cuenta el efecto de ajuste inducido, y aunque hay metodologías capaces de reproducir este efecto o bien requieren de mucho tiempo de computación o son muy limitadas en cuanto a qué transformaciones pueden realizar.sobre la proteina. El objetivo de esta tesis es que gracias al desarrollo de la plataforma PELE VS podamos aplicar el programa de simulación PELE (Protein Energy Landscape Exploration) para reproducir el efecto del ajuste inducido. El programa de simulación PELE utiliza una combinación de un algoritmo de monte y una minimización energética para modelar la proteína. Esta aproximación nos permite realizar tanto grandes cambios conformacionales como pequeños ajustes locales de la proteina, a la vez que nos proporciona un buen muestreo conformacional del ligando. Esta combinación nos permite reproducir el efecto del ajuste inducido con una rápida simulación. Tradicionalmente PELE ha sido usado con éxito en el campo de la ingeniería de enzimas donde solo unos pocos compuestos por proteina son estudiados y probados. Para poder aplicar el programa al campo del cribado virtual, donde miles de compuestos son testeados in silico, el primer paso ha realizar es la automatización de todo el proceso de preparación, lanzamiento y análisis de las simulaciones. Es por eso que durante el transcurso de esta tesis la plataforma PELE VS ha sido desarrollada, junto con otros programas auxiliares. Una vez desarrollada la plataforma, quisimos comprobar el compportamiento de PELE en un conocido datase the referencia, así que lo probamos en el dataset DUD-e. Dado que este dataset contiene más de 100 proteinas, seleccionamos solo unas pocas proteinas de cada una de las familias que forman el dataset, reduciendo el numero de proteínas a 21 receptors. A continuación, probamos un protocolo de simulación genérico sobre los receptores seleccionados con el objetivo de mejorar los resultados de funciones de puntuacións utilizadas actualmente en el campo. Después de estudiar las simulaciones y probar diferentes protocolos de simulaciones en el subset seleccionado, concluimos que cada proteina (o al menos familia de proteínas) que deseemos estudiar requiere de un protocolo de simulación específico para porder reproducir correctamente el efecto del ajuste inducido y así mejorar los resultados de la función de puntuación más usada:: glide de Schrodinger. Finalmente, aplicamos la plataformar y nuestra hipóstesis previa a una campaña industrial de cribado virtual, como parte del proyecto RETOS colaborativo: SilicoDerm. En este caso trabajamos solo son una proteína y diversos compuestos. Durante esta apliación pudimos confirmar la necesidad de un protocolo de simulación adaptado al receptor que se quiere estudiar, para así poder mejorar los resultados de las metodologías actuales.Postprint (published version

    Enrichment of virtual screening results using induced-fit techniques

    Get PDF
    This thesis explains the design, development, test on the benchmarking dataset DUD-e and the application to an industrial virtual screening project of the PELE VS platform. The most common and quick tools used on virtual screening campaigns do not take into account the induced-fit effect, although there are some methodologies capable of reproducing this effect they are either time consuming or very limited on which transformations the protein may undergo. In this thesis with the development of the PELE VS platform we aim at using the simulation software PELE (Protein Energy Landscape Exploration) to account for the induced-fit effect. The PELE software uses a monte carlo algorithm coupled with an energy minimization step to explore the ligand conformations and model the protein. This approach allows the program to account for both big conformational changes and small local changes of the protein and to perform a good conformational search of the ligand, which coupled can account for the induced-fit effect with only a quick simulation. PELE has been traditionally, and successfully, used in the enzyme engineering field where only a few compounds per protein are usually tested and studied. In order to apply the program to the virtual screening field, where thousands of compounds are tested in silico, the first step was to automatize the whole procedure of preparing, launching and analyzing the simulations. Thus, during this thesis the PELE VS platform has been developed altogether with other auxiliary tools. Once the platform was developed, we wanted to test the behaviour of PELE on a well known benchmarking dataset, thus we tried our methodology on the DUD-e dataset. Since this dataset is formed by more than 100 proteins, we chose a few proteins for each of the families present in the dataset, reducing the number of proteins to 21 systems. Then, we tried to use a general protocol for all the chosen proteins in order to improve the results of currently used scoring functions in the field. After studying the simulations and trying several protocols on this subset we we observed that every protein (or at least family) that we want to study needs an specific simulation protocol in order to correctly reproduce the induced-fit effect and improve the results of the most used scoring function: glide from schrodinger. Finally we applied the platform and our previous hypothesis to an industrial virtual screening campaign, as part of the collaborative Retos project: Silicoderm. In this case we worked with only one protein and several compounds and we confirmed the need for a tailored simulation protocol for the receptor in order to improve results.Esta tesis explica el diseño, desarrollo, testeo en el dataset de referencia DUD-e y la aplicación en un proyecto industrial de cribado virtual de la plataforma PELE VS. Las herramientas más rápidas usadas en campañas de cribado virtual no tienen en cuenta el efecto de ajuste inducido, y aunque hay metodologías capaces de reproducir este efecto o bien requieren de mucho tiempo de computación o son muy limitadas en cuanto a qué transformaciones pueden realizar.sobre la proteina. El objetivo de esta tesis es que gracias al desarrollo de la plataforma PELE VS podamos aplicar el programa de simulación PELE (Protein Energy Landscape Exploration) para reproducir el efecto del ajuste inducido. El programa de simulación PELE utiliza una combinación de un algoritmo de monte y una minimización energética para modelar la proteína. Esta aproximación nos permite realizar tanto grandes cambios conformacionales como pequeños ajustes locales de la proteina, a la vez que nos proporciona un buen muestreo conformacional del ligando. Esta combinación nos permite reproducir el efecto del ajuste inducido con una rápida simulación. Tradicionalmente PELE ha sido usado con éxito en el campo de la ingeniería de enzimas donde solo unos pocos compuestos por proteina son estudiados y probados. Para poder aplicar el programa al campo del cribado virtual, donde miles de compuestos son testeados in silico, el primer paso ha realizar es la automatización de todo el proceso de preparación, lanzamiento y análisis de las simulaciones. Es por eso que durante el transcurso de esta tesis la plataforma PELE VS ha sido desarrollada, junto con otros programas auxiliares. Una vez desarrollada la plataforma, quisimos comprobar el compportamiento de PELE en un conocido datase the referencia, así que lo probamos en el dataset DUD-e. Dado que este dataset contiene más de 100 proteinas, seleccionamos solo unas pocas proteinas de cada una de las familias que forman el dataset, reduciendo el numero de proteínas a 21 receptors. A continuación, probamos un protocolo de simulación genérico sobre los receptores seleccionados con el objetivo de mejorar los resultados de funciones de puntuacións utilizadas actualmente en el campo. Después de estudiar las simulaciones y probar diferentes protocolos de simulaciones en el subset seleccionado, concluimos que cada proteina (o al menos familia de proteínas) que deseemos estudiar requiere de un protocolo de simulación específico para porder reproducir correctamente el efecto del ajuste inducido y así mejorar los resultados de la función de puntuación más usada:: glide de Schrodinger. Finalmente, aplicamos la plataformar y nuestra hipóstesis previa a una campaña industrial de cribado virtual, como parte del proyecto RETOS colaborativo: SilicoDerm. En este caso trabajamos solo son una proteína y diversos compuestos. Durante esta apliación pudimos confirmar la necesidad de un protocolo de simulación adaptado al receptor que se quiere estudiar, para así poder mejorar los resultados de las metodologías actuales

    Enrichment of virtual screening results using induced-fit techniques

    Get PDF
    This project aims to improve the results of virtual screening and docking techniques used for drug design, using induced-fit techniques and a consensus scoring approach

    SS-map: Visualizing cooperative secondary structure elements in protein ensembles

    Get PDF
    We present SS-map, a tool to visualize the secondary structure content of ensembles of proteins. When generating ensembles of intrinsically disordered proteins, we lose the understanding a single native structure gives for folded proteins. It then becomes difficult to visualize the composition of the ensembles or to detect transient helices such as MoRFs. Conformational propensities for single residues also hide the nature of cooperative structures. Here we show how SS-map describes folded and unfolded ensembles of some peptides and gives a new view of the ensembles used to describe intrinsically disordered proteins with residual structure in computational and NMR experiments. This tool is implemented in an open-source python code located at code.google.com/p/ss-mapWe acknowledge financial support from the Ministerio de Innovación y Competitividad (CTQ2012-33324) and the Generalitat de Catalunya (2009SGR01472).Peer reviewe

    Enrichment of virtual screening results using induced-fit techniques

    No full text
    This thesis explains the design, development, test on the benchmarking dataset DUD-e and the application to an industrial virtual screening project of the PELE VS platform. The most common and quick tools used on virtual screening campaigns do not take into account the induced-fit effect, although there are some methodologies capable of reproducing this effect they are either time consuming or very limited on which transformations the protein may undergo. In this thesis with the development of the PELE VS platform we aim at using the simulation software PELE (Protein Energy Landscape Exploration) to account for the induced-fit effect. The PELE software uses a monte carlo algorithm coupled with an energy minimization step to explore the ligand conformations and model the protein. This approach allows the program to account for both big conformational changes and small local changes of the protein and to perform a good conformational search of the ligand, which coupled can account for the induced-fit effect with only a quick simulation. PELE has been traditionally, and successfully, used in the enzyme engineering field where only a few compounds per protein are usually tested and studied. In order to apply the program to the virtual screening field, where thousands of compounds are tested in silico, the first step was to automatize the whole procedure of preparing, launching and analyzing the simulations. Thus, during this thesis the PELE VS platform has been developed altogether with other auxiliary tools. Once the platform was developed, we wanted to test the behaviour of PELE on a well known benchmarking dataset, thus we tried our methodology on the DUD-e dataset. Since this dataset is formed by more than 100 proteins, we chose a few proteins for each of the families present in the dataset, reducing the number of proteins to 21 systems. Then, we tried to use a general protocol for all the chosen proteins in order to improve the results of currently used scoring functions in the field. After studying the simulations and trying several protocols on this subset we we observed that every protein (or at least family) that we want to study needs an specific simulation protocol in order to correctly reproduce the induced-fit effect and improve the results of the most used scoring function: glide from schrodinger. Finally we applied the platform and our previous hypothesis to an industrial virtual screening campaign, as part of the collaborative Retos project: Silicoderm. In this case we worked with only one protein and several compounds and we confirmed the need for a tailored simulation protocol for the receptor in order to improve results.Esta tesis explica el diseño, desarrollo, testeo en el dataset de referencia DUD-e y la aplicación en un proyecto industrial de cribado virtual de la plataforma PELE VS. Las herramientas más rápidas usadas en campañas de cribado virtual no tienen en cuenta el efecto de ajuste inducido, y aunque hay metodologías capaces de reproducir este efecto o bien requieren de mucho tiempo de computación o son muy limitadas en cuanto a qué transformaciones pueden realizar.sobre la proteina. El objetivo de esta tesis es que gracias al desarrollo de la plataforma PELE VS podamos aplicar el programa de simulación PELE (Protein Energy Landscape Exploration) para reproducir el efecto del ajuste inducido. El programa de simulación PELE utiliza una combinación de un algoritmo de monte y una minimización energética para modelar la proteína. Esta aproximación nos permite realizar tanto grandes cambios conformacionales como pequeños ajustes locales de la proteina, a la vez que nos proporciona un buen muestreo conformacional del ligando. Esta combinación nos permite reproducir el efecto del ajuste inducido con una rápida simulación. Tradicionalmente PELE ha sido usado con éxito en el campo de la ingeniería de enzimas donde solo unos pocos compuestos por proteina son estudiados y probados. Para poder aplicar el programa al campo del cribado virtual, donde miles de compuestos son testeados in silico, el primer paso ha realizar es la automatización de todo el proceso de preparación, lanzamiento y análisis de las simulaciones. Es por eso que durante el transcurso de esta tesis la plataforma PELE VS ha sido desarrollada, junto con otros programas auxiliares. Una vez desarrollada la plataforma, quisimos comprobar el compportamiento de PELE en un conocido datase the referencia, así que lo probamos en el dataset DUD-e. Dado que este dataset contiene más de 100 proteinas, seleccionamos solo unas pocas proteinas de cada una de las familias que forman el dataset, reduciendo el numero de proteínas a 21 receptors. A continuación, probamos un protocolo de simulación genérico sobre los receptores seleccionados con el objetivo de mejorar los resultados de funciones de puntuacións utilizadas actualmente en el campo. Después de estudiar las simulaciones y probar diferentes protocolos de simulaciones en el subset seleccionado, concluimos que cada proteina (o al menos familia de proteínas) que deseemos estudiar requiere de un protocolo de simulación específico para porder reproducir correctamente el efecto del ajuste inducido y así mejorar los resultados de la función de puntuación más usada:: glide de Schrodinger. Finalmente, aplicamos la plataformar y nuestra hipóstesis previa a una campaña industrial de cribado virtual, como parte del proyecto RETOS colaborativo: SilicoDerm. En este caso trabajamos solo son una proteína y diversos compuestos. Durante esta apliación pudimos confirmar la necesidad de un protocolo de simulación adaptado al receptor que se quiere estudiar, para así poder mejorar los resultados de las metodologías actuales

    Enrichment of virtual screening results using induced-fit techniques

    No full text
    This thesis explains the design, development, test on the benchmarking dataset DUD-e and the application to an industrial virtual screening project of the PELE VS platform. The most common and quick tools used on virtual screening campaigns do not take into account the induced-fit effect, although there are some methodologies capable of reproducing this effect they are either time consuming or very limited on which transformations the protein may undergo. In this thesis with the development of the PELE VS platform we aim at using the simulation software PELE (Protein Energy Landscape Exploration) to account for the induced-fit effect. The PELE software uses a monte carlo algorithm coupled with an energy minimization step to explore the ligand conformations and model the protein. This approach allows the program to account for both big conformational changes and small local changes of the protein and to perform a good conformational search of the ligand, which coupled can account for the induced-fit effect with only a quick simulation. PELE has been traditionally, and successfully, used in the enzyme engineering field where only a few compounds per protein are usually tested and studied. In order to apply the program to the virtual screening field, where thousands of compounds are tested in silico, the first step was to automatize the whole procedure of preparing, launching and analyzing the simulations. Thus, during this thesis the PELE VS platform has been developed altogether with other auxiliary tools. Once the platform was developed, we wanted to test the behaviour of PELE on a well known benchmarking dataset, thus we tried our methodology on the DUD-e dataset. Since this dataset is formed by more than 100 proteins, we chose a few proteins for each of the families present in the dataset, reducing the number of proteins to 21 systems. Then, we tried to use a general protocol for all the chosen proteins in order to improve the results of currently used scoring functions in the field. After studying the simulations and trying several protocols on this subset we we observed that every protein (or at least family) that we want to study needs an specific simulation protocol in order to correctly reproduce the induced-fit effect and improve the results of the most used scoring function: glide from schrodinger. Finally we applied the platform and our previous hypothesis to an industrial virtual screening campaign, as part of the collaborative Retos project: Silicoderm. In this case we worked with only one protein and several compounds and we confirmed the need for a tailored simulation protocol for the receptor in order to improve results.Esta tesis explica el diseño, desarrollo, testeo en el dataset de referencia DUD-e y la aplicación en un proyecto industrial de cribado virtual de la plataforma PELE VS. Las herramientas más rápidas usadas en campañas de cribado virtual no tienen en cuenta el efecto de ajuste inducido, y aunque hay metodologías capaces de reproducir este efecto o bien requieren de mucho tiempo de computación o son muy limitadas en cuanto a qué transformaciones pueden realizar.sobre la proteina. El objetivo de esta tesis es que gracias al desarrollo de la plataforma PELE VS podamos aplicar el programa de simulación PELE (Protein Energy Landscape Exploration) para reproducir el efecto del ajuste inducido. El programa de simulación PELE utiliza una combinación de un algoritmo de monte y una minimización energética para modelar la proteína. Esta aproximación nos permite realizar tanto grandes cambios conformacionales como pequeños ajustes locales de la proteina, a la vez que nos proporciona un buen muestreo conformacional del ligando. Esta combinación nos permite reproducir el efecto del ajuste inducido con una rápida simulación. Tradicionalmente PELE ha sido usado con éxito en el campo de la ingeniería de enzimas donde solo unos pocos compuestos por proteina son estudiados y probados. Para poder aplicar el programa al campo del cribado virtual, donde miles de compuestos son testeados in silico, el primer paso ha realizar es la automatización de todo el proceso de preparación, lanzamiento y análisis de las simulaciones. Es por eso que durante el transcurso de esta tesis la plataforma PELE VS ha sido desarrollada, junto con otros programas auxiliares. Una vez desarrollada la plataforma, quisimos comprobar el compportamiento de PELE en un conocido datase the referencia, así que lo probamos en el dataset DUD-e. Dado que este dataset contiene más de 100 proteinas, seleccionamos solo unas pocas proteinas de cada una de las familias que forman el dataset, reduciendo el numero de proteínas a 21 receptors. A continuación, probamos un protocolo de simulación genérico sobre los receptores seleccionados con el objetivo de mejorar los resultados de funciones de puntuacións utilizadas actualmente en el campo. Después de estudiar las simulaciones y probar diferentes protocolos de simulaciones en el subset seleccionado, concluimos que cada proteina (o al menos familia de proteínas) que deseemos estudiar requiere de un protocolo de simulación específico para porder reproducir correctamente el efecto del ajuste inducido y así mejorar los resultados de la función de puntuación más usada:: glide de Schrodinger. Finalmente, aplicamos la plataformar y nuestra hipóstesis previa a una campaña industrial de cribado virtual, como parte del proyecto RETOS colaborativo: SilicoDerm. En este caso trabajamos solo son una proteína y diversos compuestos. Durante esta apliación pudimos confirmar la necesidad de un protocolo de simulación adaptado al receptor que se quiere estudiar, para así poder mejorar los resultados de las metodologías actuales

    Improvement of protein-ligand binding affinity prediction using machine learning techniques

    Get PDF
    Predicting protein-ligand binding affinities constitutes a key computational method in the early stages of the drug discovery process. Molecular docking programs attempt to predict them by using mathematical approximations, namely, scoring functions. In the last years, several scoring functions have been developed, encompassing different terms, from electrostatic forces to protein-ligand interaction fingerprints and beyond. However, it has been noticed that usually each individual scoring function cannot be generalized and its predictive power is arguable. The aim of this study is to improve the binding affinity prediction by finding potential models to combine ten different scoring functions, exploiting machine learning techniques

    Computational structure‐based drug design: Predicting target flexibility

    No full text
    The role of molecular modeling in drug design has experienced a significant revamp in the last decade. The increase in computational resources and molecular models, along with software developments, is finally introducing a competitive advantage in early phases of drug discovery. Medium and small companies with strong focus on computational chemistry are being created, some of them having introduced important leads in drug design pipelines. An important source for this success is the extraordinary development of faster and more efficient techniques for describing flexibility in three‐dimensional structural molecular modeling. At different levels, from docking techniques to atomistic molecular dynamics, conformational sampling between receptor and drug results in improved predictions, such as screening enrichment, discovery of transient cavities, etc. In this review article we perform an extensive analysis of these modeling techniques, dividing them into high and low throughput, and emphasizing in their application to drug design studies. We finalize the review with a section describing our Monte Carlo method, PELE, recently highlighted as an outstanding advance in an international blind competition and industrial benchmarks.We acknowledge the BSC-CRG-IRB Joint Research Program in Computational Biology. This work was supported by a grant from the Spanish Government CTQ2016-79138-R.J.I. acknowledges support from SVP-2014-068797, awarded by the Spanish Government.Peer Reviewe
    corecore