5 research outputs found

    Field-based Proteochemometric Models Derived from 3D Protein Structures : A Novel Approach to Visualize Affinity and Selectivity Features

    Get PDF
    Designing drugs that are selective is crucial in pharmaceutical research to avoid unwanted side effects. To decipher selectivity of drug targets, computational approaches that utilize the sequence and structural information of the protein binding pockets are frequently exploited. In addition to methods that rely only on protein information, quantitative approaches such as proteochemometrics (PCM) use the combination of protein and ligand descriptions to derive quantitative relationships with binding affinity. PCM aims to explain cross-interactions between the different proteins and ligands, hence facilitating our understanding of selectivity. The main goal of this dissertation is to develop and apply field-based PCM to improve the understanding of relevant molecular interactions through visual illustrations. Field-based description that depends on the 3D structural information of proteins enhances visual interpretability of PCM models relative to the frequently used sequence-based descriptors for proteins. In these field-based PCM studies, knowledge-based fields that explain polarity and lipophilicity of the binding pockets and WaterMap-derived fields that elucidate the positions and energetics of water molecules are used together with the various 2D / 3D ligand descriptors to investigate the selectivity profiles of kinases and serine proteases. Field-based PCM is first applied to protein kinases, for which designing selective inhibitors has always been a challenge, owing to their highly similar ATP binding pockets. Our studies show that the method could be successfully applied to pinpoint the regions influencing the binding affinity and selectivity of kinases. As an extension of the initial studies conducted on a set of 50 kinases and 80 inhibitors, field-based PCM was used to build classification models on a large dataset (95 kinases and 1572 inhibitors) to distinguish active from inactive ligands. The prediction of the bioactivities of external test set compounds or kinases with accuracies over 80% (Matthews correlation coefficient, MCC: ~0.50) and area under the ROC curve (AUC) above 0.8 together with the visual inspection of the regions promoting activity demonstrates the ability of field-based PCM to generate both predictive and visually interpretable models. Further, the application of this method to serine proteases provides an overview of the sub-pocket specificities, which is crucial for inhibitor design. Additionally, alignment-independent Zernike descriptors derived from fields were used in PCM models to study the influence of protein superimpositions on field comparisons and subsequent PCM modelling.Lääketutkimuksessa selektiivisten lääkeaineiden suunnittelu on ratkaisevan tärkeää haittavaikutusten välttämiseksi. Kohdeselektiivisyyden selvittämiseen käytetään usein tietokoneavusteisia menetelmiä, jotka hyödyntävät proteiinien sitoutumiskohtien sekvenssi- ja rakennetietoja. Proteiinilähtöisten menetelmien lisäksi kvantitatiiviset menetelmät kuten proteokemometria (proteochemometrics, PCM) yhdistävät sekä proteiinin että ligandin tietoja muodostaessaan kvantitatiivisen suhteen sitoutumisaffiniteettiin. PCM pyrkii selittämään eri proteiinien ja ligandien vuorovaikutuksia ja näin auttaa ymmärtämään selektiivisyyttä. Väitöstutkimuksen tavoitteena oli kehittää ja hyödyntää kenttäpohjaista proteokemometriaa, joka auttaa ymmärtämään relevantteja molekyylitasoisia vuorovaikutuksia visuaalisen esitystavan kautta. Proteiinin kolmiulotteisesta rakenteesta riippuva kenttäpohjainen kuvaus helpottaa PCM-mallien tulkintaa, etenkin usein käytettyihin sekvenssipohjaisiin kuvauksiin verrattuna. Näissä kenttäpohjaisissa PCM-mallinnuksissa käytettiin tietoperustaisia sitoutumistaskun polaarisuutta ja lipofiilisyyttä kuvaavia kenttiä ja WaterMap-ohjelman tuottamia vesimolekyylien sijaintia ja energiaa havainnollistavia kenttiä yhdessä lukuisten ligandia kuvaavien 2D- ja 3D-deskriptorien kanssa. Malleja sovellettiin kinaasien ja seriiniproteaasien selektiivisyysprofiilien tutkimukseen. Tutkimuksen ensimmäisessä osassa kenttäpohjaista PCM-mallinnusta sovellettiin proteiinikinaaseihin, joille selektiivisten inhibiittorien suunnittelu on haastavaa samankaltaisten ATP sitoutumistaskujen takia. Tutkimuksemme osoitti menetelmän soveltuvan kinaasien sitoutumisaffiniteettia ja selektiivisyyttä ohjaavien alueiden osoittamiseen. Jatkona 50 kinaasia ja 80 inhibiittoria käsittäneelle alkuperäiselle tutkimukselle rakensimme kenttäpohjaisia PCM-luokittelumalleja suuremmalle joukolle kinaaseja (95) ja inhibiittoreita (1572) erotellaksemme aktiiviset ja inaktiiviset ligandit toisistaan. Ulkoisen testiyhdiste- tai testikinaasijoukon bioaktiivisuuksien ennustaminen yli 80 % tarkkuudella (Matthews korrelaatiokerroin, MCC noin 0,50) ja ROC-käyrän alle jäävä ala (AUC) yli 0,8 yhdessä aktiivisuutta tukevien alueiden visuaalisen tarkastelun kanssa osoittivat kenttäpohjaisen PCM:n pystyvän tuottamaan sekä ennustavia että visuaalisesti ymmärrettäviä malleja. Tutkimuksen toisessa osassa metodin soveltaminen seriiniproteaaseihin tuotti yleisnäkemyksen sitoutumistaskun eri osien spesifisyyksistä, mikä on ensiarvoisen tärkeää inhibiittorien suunnittelulle. Lisäksi kentistä johdettuja, proteiinien päällekkäinasettelusta riippumattomia Zernike-deskriptoreita hyödynnettiin PCM-malleissa arvioidaksemme proteiinien päällekkäinasettelun vaikutusta kenttien vertailuun ja sen jälkeiseen PCM-mallinnukseen

    Développement de nouvelles approches protéo-chimiométriques appliquées à l'étude des interactions et de la sélectivité des inhibiteurs de kinases

    Get PDF
    The human kinome contains 518 proteins. They share a common mechanism of protein phosphorylation known to play an important role in cellular signaling pathways. Impaired kinase function is recognized to be involved in severe diseases like cancer. Due to high structural similarity between protein kinases, development of potent and selective kinase inhibitors is a challenging task. The selectivity of kinase inhibitors may lead to side effects potentially harmful. In this thesis, we first developed new selectivity metrics to determine inhibitor selectivity directly from biological inhibition data. Compared to existing metrics, the new selectivity scores can be applied on diverse inhibition data types. Second, we developed a proteometric approach in order to understand why some protein kinases are never inhibited by Type II inhibitors. The statistical model built for this purpose allowed us to identify several discriminant residues of which few of them correspond to experimentally described residues of interest. Third, using a new 3D protein kinase descriptor, we developed and validated novel proteo-chemometrics approaches to study and discover new kinase inhibitors.Le kinome humain comprend 518 protéines. Elles participent au processus de phosphorylation des protéines qui joue un rôle important dans les voies de signalisation cellulaire. Leur dérégulation est connue comme étant une cause de nombreuses maladies graves telle que les cancers. Du fait de leur grande similarité structurale des protéines kinases, il est difficile de développer des inhibiteurs qui soient à la fois efficaces et sélectifs. L’absence de sélectivité conduit le plus souvent à des effets secondaires particulièrement néfastes pour l’organisme. Au cours de cette thèse, nous avons d’abord développé de nouvelles métriques dont le but est de déterminer la sélectivité d’inhibiteurs à partir de données d’inhibition. Elles présentent l’avantage, comparées à d’autres métriques, d’être applicables sur n’importe quel type de données. Dans un deuxième temps, nous avons développé une approche protéométrique dans le but de comprendre pourquoi certaines protéines kinases ne sont jamais inhibées par des inhibiteurs de Type II. Le modèle statistique mis en place nous a permis d’identifier plusieurs résidus discriminants dont certains déjà décrits expérimentalement dans la littérature. Dans un troisième temps, nous avons développé un nouveau descripteur 3D de protéines kinases avec lequel nous avons mis en place et validé des modèles protéo-chimiométriques visant à étudier et découvrir de nouveaux inhibiteurs

    Computational prediction of metabolism: sites, products, SAR, P450 enzyme dynamics, and mechanisms.

    Get PDF
    Metabolism of xenobiotics remains a central challenge for the discovery and development of drugs, cosmetics, nutritional supplements, and agrochemicals. Metabolic transformations are frequently related to the incidence of toxic effects that may result from the emergence of reactive species, the systemic accumulation of metabolites, or by induction of metabolic pathways. Experimental investigation of the metabolism of small organic molecules is particularly resource demanding; hence, computational methods are of considerable interest to complement experimental approaches. This review provides a broad overview of structure- and ligand-based computational methods for the prediction of xenobiotic metabolism. Current computational approaches to address xenobiotic metabolism are discussed from three major perspectives: (i) prediction of sites of metabolism (SOMs), (ii) elucidation of potential metabolites and their chemical structures, and (iii) prediction of direct and indirect effects of xenobiotics on metabolizing enzymes, where the focus is on the cytochrome P450 (CYP) superfamily of enzymes, the cardinal xenobiotics metabolizing enzymes. For each of these domains, a variety of approaches and their applications are systematically reviewed, including expert systems, data mining approaches, quantitative structure-activity relationships (QSARs), and machine learning-based methods, pharmacophore-based algorithms, shape-focused techniques, molecular interaction fields (MIFs), reactivity-focused techniques, protein-ligand docking, molecular dynamics (MD) simulations, and combinations of methods. Predictive metabolism is a developing area, and there is still enormous potential for improvement. However, it is clear that the combination of rapidly increasing amounts of available ligand- and structure-related experimental data (in particular, quantitative data) with novel and diverse simulation and modeling approaches is accelerating the development of effective tools for prediction of in vivo metabolism, which is reflected by the diverse and comprehensive data sources and methods for metabolism prediction reviewed here. This review attempts to survey the range and scope of computational methods applied to metabolism prediction and also to compare and contrast their applicability and performance.JK, MJW, JT, PJB, AB and RCG thank Unilever for funding

    Desarrollo de filtros <i>in silico</i> orientados a optimizar el desarrollo de nuevos fármacos destinados al sistema nervioso central

    Get PDF
    La incidencia y costo socioeconómico de los desórdenes del sistema nervioso central (SNC) se está incrementando de manera alarmante en las últimas décadas. Por otro lado, el descubrimiento y desarrollo de nuevos fármacos destinados al SNC es una de las áreas más riesgosas, con los mayores índices de fracaso. La barrera hematoencefálica (BHE) constituye uno de los principales obstáculos farmacocinéticos para el éxito de la terapia dirigida al SNC, ya que impone serias dificultades para la biodistribución de los fármacos a sus blancos moleculares en el cerebro. Por lo tanto, durante el desarrollo de nuevos fármacos para el tratamiento de trastornos del SNC resulta de suma importancia la evaluación de la capacidad de los mismos para atravesar eficazmente la BHE y así lograr niveles terapéuticos en el cerebro. En el presente trabajo de tesis nos hemos propuesto el desarrollo de modelos computacionales para predecir el parámetro farmacocinético Kp,uu, el cual está asociado al pasaje de fármacos a través de la BHE. El proceso para la generación de los modelos se estructuró en dos etapas bien diferenciadas. En una primera instancia, se compiló un conjunto de datos de compuestos con valores de Kp,uu obtenidos en estado estacionario por cualquiera de las tres metodologías experimentales disponibles para dicho fin: Microdialisis, Slice y Homogenato (conjunto de datos MSH). Dicha base de datos MSH se utilizó para generar modelos clasificatorios mediante el uso de distintos algoritmos, algunos de los cuales lograron discernir adecuadamente entre compuestos de baja y alta biodisponibilidad de fármaco libre en el SNC. Todos los modelos fueron validados computacionalmente y demostraron un buen poder predictivo. Se validó también experimental y prospectivamente el modelo individual seleccionado como el mejor. Para ello se determinó experimentalmente el parámetro Kp,uu mediante la técnica de homogenato de cinco compuestos que no habían formado parte del conjunto de datos original. La tasa de buenas clasificaciones fue de 80,0% (4/5) para la validación experimental prospectiva. Para la segunda etapa de desarrollo de modelos se consideraron únicamente aquellos valores de Kp,uu obtenidos por las técnicas de Microdialisis y/o Slice. Se conformó así un nuevo conjunto de datos (conjunto MS), con el objetivo de disminuir la variabilidad/ruido de la base de datos a utilizar en la obtención de los modelos. La misma metodología de modelado generó modelos con mejor poder predictivo que los obtenidos con el conjunto MSH. En esta oportunidad la validación prospectiva del mejor modelo individual se llevó a cabo desde un enfoque diferente al descripto para el conjunto de datos MSH. Se utilizaron compuestos que no formaron parte del conjunto de datos MS, y cuyos datos observados del parámetro modelado fueron obtenidos de diferentes maneras: datos publicados con posterioridad al armado del conjunto de datos MS y datos proporcionados por la Escuela de Medicina de la Universidad de Indiana (EE. UU.). De esta forma, el conjunto de datos para esta nueva validación prospectiva quedó conformado por 10 compuestos. De éstos, 9 fueron bien clasificados por el mejor modelo, lo que representó una de tasa de buenas clasificaciones del 90,0%. El uso de estos modelos computacionales como filtros in silico durante el desarrollo de nuevos medicamentos para el tratamiento de las enfermedades del SNC, podría optimizar la utilización de recursos y, por ende, disminuir el impacto de la baja en la inversión sufrida en los últimos tiempos en dicha área terapéutica.Facultad de Ciencias Exacta
    corecore