6 research outputs found

    PolyMaS: Nowe oprogramowanie do generowania makrocząsteczek polimerów o dużej masie cząsteczkowej z powtarzalnych jednostek strukturalnych

    Get PDF
    The Polymer Maker SMILES-based (PolyMaS) software was used to generate linear macromolecules from the repeating structural units (SRU) of polymers without limiting their length and molar mass. The SRU input is stored in the SMILES code available on the Internet. PolyMaS makes head-tail junctions to the desired length of the macromolecule.Oprogramowanie Polymer Maker SMILES-based (PolyMaS) zastosowano do generowania liniowych makrocząsteczek z powtarzalnych jednostek strukturalnych (SRU) polimerów, bez ograniczania ich długości i masy molowej. Dane wejściowe SRU są zapisane w dostępnym w Internecie kodzie SMILES. PolyMaS wykonuje połączenia głowa-ogon do żądanej długości makrocząsteczki.Fil: Schustik, Santiago. Provincia de Buenos Aires. Gobernación. Comisión de Investigaciones Científicas; Argentina. Consejo Nacional de Investigaciones Científicas y Técnicas. Centro Científico Tecnológico Conicet - Bahía Blanca. Planta Piloto de Ingeniería Química. Universidad Nacional del Sur. Planta Piloto de Ingeniería Química; ArgentinaFil: Cravero, Fiorella. Consejo Nacional de Investigaciones Científicas y Técnicas. Centro Científico Tecnológico Conicet - Bahía Blanca. Planta Piloto de Ingeniería Química. Universidad Nacional del Sur. Planta Piloto de Ingeniería Química; ArgentinaFil: Martínez, María Jimena. Universidad Nacional del Centro de la Provincia de Buenos Aires; Argentina. Consejo Nacional de Investigaciones Científicas y Técnicas. Centro Científico Tecnológico Conicet - Tandil. Instituto Superior de Ingeniería del Software. Universidad Nacional del Centro de la Provincia de Buenos Aires. Instituto Superior de Ingeniería del Software; ArgentinaFil: Ponzoni, Ignacio. Universidad Nacional del Sur. Departamento de Ciencias e Ingeniería de la Computación; Argentina. Consejo Nacional de Investigaciones Científicas y Técnicas. Centro Científico Tecnológico Conicet - Bahía Blanca. Instituto de Ciencias e Ingeniería de la Computación. Universidad Nacional del Sur. Departamento de Ciencias e Ingeniería de la Computación. Instituto de Ciencias e Ingeniería de la Computación; ArgentinaFil: Diaz, Monica Fatima. Universidad Nacional del Sur. Departamento de Ingeniería Química; Argentina. Consejo Nacional de Investigaciones Científicas y Técnicas. Centro Científico Tecnológico Conicet - Bahía Blanca. Planta Piloto de Ingeniería Química. Universidad Nacional del Sur. Planta Piloto de Ingeniería Química; Argentin

    Feature Selection for Polymer Informatics: Evaluating Scalability and Robustness of the FS4RVDD Algorithm using Synthetic Polydisperse Datasets

    Get PDF
    The feature selection (FS) process is a key step in the Quantitative Structure-Property Relationship (QSPR) modeling of physicochemical properties in Cheminformatics. In particular, the inference of QSPR models for polymeric material properties constitutes a complex problem because of the uncertainty introduced by the polydispersity of these materials. The main challenge is how to capture the polydispersity information from the molecular weight distribution (MWD) curve to achieve a more effective computational representation of polymeric materials. To date, most of the existing QSPR techniques use only a single molecule to represent each of these materials, but polydispersity is not considered. Consequently, QSPR models obtained by these approaches are being oversimplified. For this reason, we introduced in a previous work a new FS algorithm called Feature Selection for Random Variables with Discrete Distribution (FS4RVDD), which allows dealing with polydisperse data. In the present paper, we evaluate both the scalability and the robustness of the FS4RVDD algorithm. In this sense, we generated synthetic data by varying and combining different parameters: the size of the database, the cardinality of the selected feature subsets, the presence of noise in the data, and the type of correlation (linear and nonlinear). Moreover, the performances obtained by FS4RVDD were contrasted with traditional FS techniques applied to different simplified representations of polymeric materials. The obtained results show that the FS4RVDD algorithm outperformed the traditional FS methods in all proposed scenarios, which suggest the need of an algorithm such as FS4RVDD to deal with the uncertainty that polydispersity introduces in human-made polymers.Fil: Cravero, Fiorella. Consejo Nacional de Investigaciones Científicas y Técnicas. Centro Científico Tecnológico Conicet - Bahía Blanca. Planta Piloto de Ingeniería Química. Universidad Nacional del Sur. Planta Piloto de Ingeniería Química; ArgentinaFil: Schustik, Santiago. Consejo Nacional de Investigaciones Científicas y Técnicas. Centro Científico Tecnológico Conicet - Bahía Blanca. Planta Piloto de Ingeniería Química. Universidad Nacional del Sur. Planta Piloto de Ingeniería Química; Argentina. Provincia de Buenos Aires. Gobernación. Comisión de Investigaciones Científicas; ArgentinaFil: Martínez, María Jimena. Consejo Nacional de Investigaciones Científicas y Técnicas. Centro Científico Tecnológico Conicet - Bahía Blanca. Instituto de Ciencias e Ingeniería de la Computación. Universidad Nacional del Sur. Departamento de Ciencias e Ingeniería de la Computación. Instituto de Ciencias e Ingeniería de la Computación; ArgentinaFil: Vázquez, Gustavo. Universidad Católica del Uruguay; UruguayFil: Diaz, Monica Fatima. Consejo Nacional de Investigaciones Científicas y Técnicas. Centro Científico Tecnológico Conicet - Bahía Blanca. Planta Piloto de Ingeniería Química. Universidad Nacional del Sur. Planta Piloto de Ingeniería Química; Argentina. Universidad Nacional del Sur. Departamento de Ingeniería Química; ArgentinaFil: Ponzoni, Ignacio. Consejo Nacional de Investigaciones Científicas y Técnicas. Centro Científico Tecnológico Conicet - Bahía Blanca. Instituto de Ciencias e Ingeniería de la Computación. Universidad Nacional del Sur. Departamento de Ciencias e Ingeniería de la Computación. Instituto de Ciencias e Ingeniería de la Computación; Argentina. Universidad Nacional del Sur. Departamento de Ciencias e Ingeniería de la Computación; Argentin

    Computer-aided design of polymeric materials: Computational study for characterization of databases for prediction of mechanical properties under polydispersity

    Get PDF
    In Polymer Informatics, quantitative structure-property relationship (QSPR) modeling is an emerging approach for predicting relevant properties of polymers in the context of computer-aided design of industrial materials. Nevertheless, most QSPR models available in the literature use simplistic computational representations of polymers based on their structural repetitive unit. The aim of this work is to evaluate the effect of this simplification and to analyze new strategies to achieve alternative characterizations that capture the phenomenon of polydispersity. In particular, the experiments reported in this work are focused on three mechanical properties derived from the tensile test. The reported results revealed the disadvantages of using these simplified representations. Besides, we contributed with alternative representations for the databases of polymer molecular descriptors that achieved more realistic and accurate QSPR models.Fil: Cravero, Fiorella. Consejo Nacional de Investigaciones Científicas y Técnicas. Centro Científico Tecnológico Conicet - Bahía Blanca. Planta Piloto de Ingeniería Química. Universidad Nacional del Sur. Planta Piloto de Ingeniería Química; ArgentinaFil: Schustik, Santiago. Consejo Nacional de Investigaciones Científicas y Técnicas. Centro Científico Tecnológico Conicet - Bahía Blanca. Planta Piloto de Ingeniería Química. Universidad Nacional del Sur. Planta Piloto de Ingeniería Química; Argentina. Provincia de Buenos Aires. Gobernación. Comisión de Investigaciones Científicas; ArgentinaFil: Martínez, María Jimena. Consejo Nacional de Investigaciones Científicas y Técnicas. Centro Científico Tecnológico Conicet - Bahía Blanca. Instituto de Ciencias e Ingeniería de la Computación. Universidad Nacional del Sur. Departamento de Ciencias e Ingeniería de la Computación. Instituto de Ciencias e Ingeniería de la Computación; ArgentinaFil: Barranco, Carlos D.. Universidad Pablo de Olavide; EspañaFil: Diaz, Monica Fatima. Consejo Nacional de Investigaciones Científicas y Técnicas. Centro Científico Tecnológico Conicet - Bahía Blanca. Planta Piloto de Ingeniería Química. Universidad Nacional del Sur. Planta Piloto de Ingeniería Química; Argentina. Universidad Nacional del Sur. Departamento de Ingeniería Química; ArgentinaFil: Ponzoni, Ignacio. Consejo Nacional de Investigaciones Científicas y Técnicas. Centro Científico Tecnológico Conicet - Bahía Blanca. Instituto de Ciencias e Ingeniería de la Computación. Universidad Nacional del Sur. Departamento de Ciencias e Ingeniería de la Computación. Instituto de Ciencias e Ingeniería de la Computación; Argentin

    Polymer informatics: Expert-in-the-loop in QSPR modeling of refractive index

    No full text
    Refractive index (RI) is a highly relevant property for the design of new polymeric materials for very specific applications in the telecommunications industry, medicine, and analytical chemistry, among many others. A particular case is that of plastic optical fibers, in which the information is transmitted by photons and then RI takes center stage. Therefore, the modeling and prediction of this property play a key role when characterizing and designing materials for these important industries. Over the last decades, the use of Machine Learning (ML) algorithms in the modeling of properties for the design of new materials has been consolidated thanks to the gradual increase in the available databases. In particular, the development of Quantitative Structure-Property Relationship (QSPR) models has benefited from these emerging technologies, providing the possibility of generating in silico testing strategies applicable to the early stages of the design of new materials. However, in many cases, it has been observed that using ML algorithms in a fully automatic way, without human intervention in the QSPR model design process, tend to generate black-box models that have a difficult interpretation and can lose sight about relevant aspects that require both criteria and an expert's knowledge in the chemical domain. For this reason, interactive ML methodologies that combine computational outputs with experts’ knowledge, usually known as expert-in-the-loop strategies, are becoming more frequent. In this article, we present the design of QSPR models for RI modeling following two different approaches, a black-box ML methodology and an Interactive Machine Learning (IML) methodology with expert-in-the-loop, from a database whose curation is also described in the present work. In this regard, visual analytics strategies were used to capture the expert's knowledge, facilitating an effective and rapid interaction between the outputs provided by ML and the chemical analyst. In addition, we contrast the best models obtained by both approaches against two other predictive models for RI estimation reported in the literature, achieving promising performances in terms of cardinality and accuracy when the expert interacts during modeling. In summary, the obtained results allow us to claim that the expert-in-the-loop approach provides QSPR models with better generalizability properties and more interpretable from a physicochemical point of view, without losing accuracy. Finally, in addition to providing high quality QSPR models to predict the RI of polymeric materials, the present work lays the foundation for defining an effective methodology to incorporate experts’ knowledge in the design of other material properties.Fil: Schustik, Santiago. Consejo Nacional de Investigaciones Científicas y Técnicas. Centro Científico Tecnológico Conicet - Bahía Blanca. Planta Piloto de Ingeniería Química. Universidad Nacional del Sur. Planta Piloto de Ingeniería Química; Argentina. Provincia de Buenos Aires. Gobernación. Comisión de Investigaciones Científicas; ArgentinaFil: Cravero, Fiorella. Consejo Nacional de Investigaciones Científicas y Técnicas. Centro Científico Tecnológico Conicet - Bahía Blanca. Instituto de Ciencias e Ingeniería de la Computación. Universidad Nacional del Sur. Departamento de Ciencias e Ingeniería de la Computación. Instituto de Ciencias e Ingeniería de la Computación; Argentina. Universidad Nacional del Sur. Departamento de Ciencias e Ingeniería de la Computación. Instituto de Ciencias e Ingeniería de la Computación; ArgentinaFil: Ponzoni, Ignacio. Consejo Nacional de Investigaciones Científicas y Técnicas. Centro Científico Tecnológico Conicet - Bahía Blanca. Planta Piloto de Ingeniería Química. Universidad Nacional del Sur. Planta Piloto de Ingeniería Química; Argentina. Universidad Nacional del Sur. Departamento de Ciencias e Ingeniería de la Computación. Instituto de Ciencias e Ingeniería de la Computación; ArgentinaFil: Diaz, Monica Fatima. Consejo Nacional de Investigaciones Científicas y Técnicas. Centro Científico Tecnológico Conicet - Bahía Blanca. Planta Piloto de Ingeniería Química. Universidad Nacional del Sur. Planta Piloto de Ingeniería Química; Argentina. Universidad Nacional del Sur. Departamento de Ingeniería Química; Argentin

    PolyMaS : a new software to generate high molecular weight polymer macromolecules from repeating structural units

    No full text
    The Polymer Maker SMILES-based (PolyMaS) software was used to generate linear macromolecules from the repeating structural units (SRU) of polymers without limiting their length and molar mass. The SRU input is stored in the SMILES code available on the Internet. PolyMaS makes head-tail junctions to the desired length of the macromolecule.Oprogramowanie Polymer Maker SMILES-based (PolyMaS) zastosowano do generowania liniowych makrocząsteczek z powtarzalnych jednostek strukturalnych (SRU) polimerów, bez ograniczania ich długości i masy molowej. Dane wejściowe SRU są zapisane w dostępnym w Internecie kodzie SMILES. PolyMaS wykonuje połączenia głowa-ogon do żądanej długości makrocząsteczki

    How can polydispersity information be integrated in the QSPR modeling of mechanical properties?

    Get PDF
    Polymer informatics is an emerging discipline that has benefited from the strong development that data science has experienced over the last decade. In particular, machine learning methods are useful to infer QSPR (Quantitative Structure Property Relationships) models that allow predicting mechanical properties related to the industrial profile of polymeric materials based on their structural repeating units (SRUs). Nonetheless, the chemical structure of the SRU is only one of the many factors that affect the industrial usefulness of a polymer. Other equally relevant factors are polymer molecular weight, molecular weight distribution, and production method, which are related to the inherent polydispersity of this kind of material. For this reason, the computational characterization used for the building of QSPR models for predicting mechanical properties should consider these main factors. The aim of this paper is to highlight recent advances in data science to address the inclusion of polydispersity information of polymeric materials in QSPR modeling. We present two dimensions of discussion: data representation and algorithmic issues. In the first one, we examine how different strategies can be applied to include polydispersity data in the molecular descriptors that characterize the polymers. We explain two data representation approaches designed by our group, named as trivalued and multivalued molecular descriptors. In the second dimension, we discuss algorithms proposed to deal with these new molecular descriptor representations during the construction of the QSPR models. Thus, we present here a comprehensible and integral methodology to address the challenges that polydispersity generates in the QSPR modeling of mechanical properties of polymers.Fil: Cravero, Fiorella. Consejo Nacional de Investigaciones Científicas y Técnicas. Centro Científico Tecnológico Conicet - Bahía Blanca. Instituto de Ciencias e Ingeniería de la Computación. Universidad Nacional del Sur. Departamento de Ciencias e Ingeniería de la Computación. Instituto de Ciencias e Ingeniería de la Computación; ArgentinaFil: Schustik, Santiago. Consejo Nacional de Investigaciones Científicas y Técnicas. Centro Científico Tecnológico Conicet - Bahía Blanca. Planta Piloto de Ingeniería Química. Universidad Nacional del Sur. Planta Piloto de Ingeniería Química; ArgentinaFil: Martinez Amezaga, Nancy María Jimena. Consejo Nacional de Investigaciones Científicas y Técnicas. Centro Científico Tecnológico Conicet - Tandil. Instituto Superior de Ingeniería del Software. Universidad Nacional del Centro de la Provincia de Buenos Aires. Instituto Superior de Ingeniería del Software; ArgentinaFil: Diaz, Monica Fatima. Consejo Nacional de Investigaciones Científicas y Técnicas. Centro Científico Tecnológico Conicet - Bahía Blanca. Planta Piloto de Ingeniería Química. Universidad Nacional del Sur. Planta Piloto de Ingeniería Química; ArgentinaFil: Ponzoni, Ignacio. Consejo Nacional de Investigaciones Científicas y Técnicas. Centro Científico Tecnológico Conicet - Bahía Blanca. Instituto de Ciencias e Ingeniería de la Computación. Universidad Nacional del Sur. Departamento de Ciencias e Ingeniería de la Computación. Instituto de Ciencias e Ingeniería de la Computación; Argentin
    corecore