5 research outputs found

    Hybridizing Feature Selection and Feature Learning Approaches in QSAR Modeling for Drug Discovery

    Get PDF
    Quantitative structure–activity relationship modeling using machine learning techniques constitutes a complex computational problem, where the identification of the most informative molecular descriptors for predicting a specific target property plays a critical role. Two main general approaches can be used for this modeling procedure: feature selection and feature learning. In this paper, a performance comparative study of two state-of-art methods related to these two approaches is carried out. In particular, regression and classification models for three different issues are inferred using both methods under different experimental scenarios: two drug-like properties, such as blood-brain-barrier and human intestinal absorption, and enantiomeric excess, as a measurement of purity used for chiral substances. Beyond the contrastive analysis of feature selection and feature learning methods as competitive approaches, the hybridization of these strategies is also evaluated based on previous results obtained in material sciences. From the experimental results, it can be concluded that there is not a clear winner between both approaches because the performance depends on the characteristics of the compound databases used for modeling. Nevertheless, in several cases, it was observed that the accuracy of the models can be improved by combining both approaches when the molecular descriptor sets provided by feature selection and feature learning contain complementary information.Fil: Ponzoni, Ignacio. Consejo Nacional de Investigaciones Científicas y Técnicas. Centro Científico Tecnológico Conicet - Bahía Blanca. Instituto de Ciencias e Ingeniería de la Computación. Universidad Nacional del Sur. Departamento de Ciencias e Ingeniería de la Computación. Instituto de Ciencias e Ingeniería de la Computación; ArgentinaFil: Sebastián Pérez, Víctor. Consejo Superior de Investigaciones Científicas. Centro de Investigaciones Biológicas; EspañaFil: Requena Triguero, Carlos. Consejo Superior de Investigaciones Científicas. Centro de Investigaciones Biológicas; EspañaFil: Roca, Carlos. Consejo Superior de Investigaciones Científicas. Centro de Investigaciones Biológicas; EspañaFil: Martínez, María Jimena. Consejo Nacional de Investigaciones Científicas y Técnicas. Centro Científico Tecnológico Conicet - Bahía Blanca. Instituto de Ciencias e Ingeniería de la Computación. Universidad Nacional del Sur. Departamento de Ciencias e Ingeniería de la Computación. Instituto de Ciencias e Ingeniería de la Computación; ArgentinaFil: Cravero, Fiorella. Consejo Nacional de Investigaciones Científicas y Técnicas. Centro Científico Tecnológico Conicet - Bahía Blanca. Planta Piloto de Ingeniería Química. Universidad Nacional del Sur. Planta Piloto de Ingeniería Química; ArgentinaFil: Diaz, Monica Fatima. Consejo Nacional de Investigaciones Científicas y Técnicas. Centro Científico Tecnológico Conicet - Bahía Blanca. Planta Piloto de Ingeniería Química. Universidad Nacional del Sur. Planta Piloto de Ingeniería Química; ArgentinaFil: Páez, Juan A.. Consejo Superior de Investigaciones Científicas. Instituto de Química Médica; EspañaFil: Gómez Arrayás, Ramón. Universidad Autónoma de Madrid; EspañaFil: Adrio, Javier. Universidad Autónoma de Madrid; España. Institute for Advanced Research in Chemical Sciences; EspañaFil: Campillo, Nuria E.. Consejo Superior de Investigaciones Científicas. Centro de Investigaciones Biológicas; Españ

    Aplicaciones quimioinformáticas en el descubrimiento de fármacos

    Get PDF
    La quimioinformática ha sufrido un crecimiento exponencial en los últimos años y ha cambiado la forma en la que se conduce la investigación química, proporcionando un acceso a la información insostenible para los métodos tradicionales. Está basada en aproximaciones computacionales al ligando (métodos indirectos) o a la diana (métodos directos), que constituyen el centro de lo que se conoce como cribado virtual. Las aplicaciones que tienen estas técnicas en el descubrimiento de fármacos, son muchas y variadas, y han conseguido pasar de un proceso poco eficiente a un proceso conocido como desarrollo de fármacos de forma racional, en el que se ahorra mucho tiempo y dinero. Este trabajo pretende la búsqueda, mediante técnicas computacionales, de soluciones en diferentes etapas del desarrollo de un fármaco. El estudio se centra en la búsqueda de nuevos sitios de unión para el desarrollo de un fármaco frente a la diana GSK-3β de Leishmania y en la búsqueda del modo de unión de diferentes compuestos frente a la enzima PDE8, para poder desarrollar inhibidores más selectivo

    Multitask deep neural networks for ames mutagenicity prediction

    No full text
    29 p.2 fig.-3 tab.-1 graph.abst.+Sup. Inf. 4 p._4 tab.The Ames mutagenicity test constitutes the most frequently used assay to estimate the mutagenic potential of drug candidates. While this test employs experimental results using various strains of Salmonella typhimurium, the vast majority of the published in silico models for predicting mutagenicity do not take into account the test results of the individual experiments conducted for each strain. Instead, such QSAR models are generally trained employing overall labels (i.e., mutagenic and nonmutagenic). Recently, neural-based models combined with multitask learning strategies have yielded interesting results in different domains, given their capabilities to model multitarget functions. In this scenario, we propose a novel neural-based QSAR model to predict mutagenicity that leverages experimental results from different strains involved in the Ames test by means of a multitask learning approach. To the best of our knowledge, the modeling strategy hereby proposed has not been applied to model Ames mutagenicity previously. The results yielded by our model surpass those obtained by single-task modeling strategies, such as models that predict the overall Ames label or ensemble models built from individual strains. For reproducibility and accessibility purposes, all source code and datasets used in our experiments are publicly available.This work was partially supported by the Argentinean National Council of Scientific and Technological Research (CONICET for its acronym in Spanish) [Grant No.PIP 112-2017-0100829], by the National Agency for the Promotion of Research, Technological Development and Innovation of Argentina (AGENCIA I+D+i in Spanish),through the Fund for Scientific and Technological Research (FONCyT for its acronym in Spanish) [Grant No. PICT 2019-03350], by the Universidad Nacional del Sur (UNS), Bahía Blanca, Argentina [Grant No. PGI 24/N042], Ministerio de Economía, Industria y Competitividad, Gobierno de España, under Grant No. RTI2018-096100B-100, and by a Google Latin America Research Award 2021−2022.Peer reviewe

    Multi-Task Deep Neural Networks for Ames Mutagenicity Prediction

    No full text
    The Ames mutagenicity test constitutes the most frequently used assay to estimate the mutagenic potential of drug candidates. While this test employs experimental results using various strains of Salmonella typhimurium, the vast majority of the published in silico models for predicting mutagenicity do not take into account the test results of the individual experiments conducted for each strain. Instead, such QSAR models are generally trained employing overall labels (i.e. mutagenic and non-mutagenic). Recently, neural-based models combined with multi-task learning strategies have yielded interesting results in different domains, given their capabilities to model multi-target functions. In this scenario, we propose a novel neural-based QSAR model to predict mutagenicity that leverages experimental results from different strains involved in the Ames test by means of a multi-task learning approach. To the best of our knowledge, the modeling strategy hereby proposed has not been applied to model Ames mutagenicity previously. The results yielded by our model surpass those obtained by single-task modeling strategies, such as models that predict the overall Ames label or ensemble models built from individual strains. For reproducibility and accessibility purposes, all source code and datasets used in our experiments are publicly available

    Ames Mutagenicity Dataset

    No full text
    El dataset contiene 5536 compuestos moleculares representados por su código SMILES y 1360 descriptores moleculares calculados con Mordred. Además, contiene las respectivas etiquetas para cada compuesto (1: mutagénico / 0: no mutagénico) para cada una de las cinco cepas (TA98, TA100, TA102, TA1535, TA1537) y una etiqueta general (Overall) que corresponde a la etiqueta de consenso utilizada para evaluar la predicción final del test de Ames. Los compuestos fueron compilados originalmente por el Istituto Superiore di Sanita’ (https://www.iss.it/isstox) y son el resultado de una etapa de preprocesamiento exhaustiva, que consta de diferentes pasos de filtrado, limpieza y canonicalización. The dataset contains 5,536 molecular compounds represented by their SMILES code and 1,360 molecular descriptors calculated with Mordred. Moreover, it contains the respective labels for each compound (1: mutagenic / 0: non-mutagenic) for each of the five strains (TA98, TA100, TA102, TA1535, TA1537) and a general label (Overall) that corresponds to the ground-truth consensus label used for evaluating the final Ames mutagenicity prediction. The compounds listed were originally compiled by the Istituto Superiore di Sanita’ (https://www.iss.it/isstox) and result from an exhaustive pre-processing stage, consisting of different filtering, sanitization, and canonicalization steps.Fil: Martínez, María Jimena. Consejo Nacional de Investigaciones Científicas y Técnicas. Centro Científico Tecnológico Conicet - Tandil. Instituto Superior de Ingeniería del Software. Universidad Nacional del Centro de la Provincia de Buenos Aires. Instituto Superior de Ingeniería del Software; ArgentinaFil: Sabando, María Virginia. Consejo Nacional de Investigaciones Científicas y Técnicas. Centro Científico Tecnológico Conicet - Bahía Blanca. Instituto de Ciencias e Ingeniería de la Computación. Universidad Nacional del Sur. Departamento de Ciencias e Ingeniería de la Computación. Instituto de Ciencias e Ingeniería de la Computación; ArgentinaFil: Soto, Axel Juan. Consejo Nacional de Investigaciones Científicas y Técnicas. Centro Científico Tecnológico Conicet - Bahía Blanca. Instituto de Ciencias e Ingeniería de la Computación. Universidad Nacional del Sur. Departamento de Ciencias e Ingeniería de la Computación. Instituto de Ciencias e Ingeniería de la Computación; ArgentinaFil: Roca Magadán, Carlos. Consejo Superior de Investigaciones Científicas. Centro de Investigaciones Biológicas Margarita Salas; EspañaFil: Requena Triguero, Carlos. Consejo Superior de Investigaciones Científicas. Centro de Investigaciones Biológicas Margarita Salas; EspañaFil: Campillo Martín, Nuria Eugenia. Consejo Superior de Investigaciones Científicas. Centro de Investigaciones Biológicas Margarita Salas; EspañaFil: Páez, Juan A.. Consejo Superior de Investigaciones Científicas. Instituto de Química Médica; EspañaFil: Ponzoni, Ignacio. Consejo Nacional de Investigaciones Científicas y Técnicas. Centro Científico Tecnológico Conicet - Bahía Blanca. Instituto de Ciencias e Ingeniería de la Computación. Universidad Nacional del Sur. Departamento de Ciencias e Ingeniería de la Computación. Instituto de Ciencias e Ingeniería de la Computación; Argentin
    corecore