research

Quantitative Structure-Property Relationships for Predicting the Retention Indices of Fragrances on Stationary Phases of Different Polarity

Abstract

El objetivo de este trabajo fue el desarrollo de relaciones cuantitativas estructura–propiedad predictivas para el modelado de índices de retención (I) de fragancias, medidas en tres fases estacionarias de diferente polaridad: DB–225MS, HP5–MS y HP–1. Se ha prestado particular atención al curado de los datos experimentales. Posteriormente, se usó el método de subconjuntos balanceados (BSM) para dividir cada base de datos en grupos de calibración, validación y predicción. Los modelos se construyeron a partir de 1819 descriptores moleculares independientes de la conformación, los cuales fueron analizados mediante el método de reemplazo (RM) para la selección de los mismos, con la finalidad de obtener los mejores modelos. Para la fase estacionaria DB–225MS se obtuvo un modelo basado en cuatro descriptores, mientras que para las columnas HP5–MS y HP–1 se propusieron modelos con tres descriptores. Los modelos fueron validados mediante validación cruzada de dejar–uno–fuera y dejar–varios–fuera, así como otros criterios de validación. Adicionalmente, con la finalidad de cumplir los principios propuestos por la Organization for Economic Co–operation and Development (OECD), la capacidad predictiva de los modelos se evaluó mediante la predicción de los índices de retención del grupo externo de predicción, el dominio de aplicabilidad fue apropiadamente definido y se realizó una interpretación de cada descriptor molecular involucrado.The purpose of this work was to develop predictive quantitative structure–property relationships for modeling the retention indices (I) of fragrances measured in three stationary phases of different polarities: DB–225MS, HP5–MS and HP–1. Attention was paid to the curation of the experimental data. Subsequently, the Balanced Subsets method (BSM) was used to split each dataset into training, validation and test sets. Models were established by using 1819 conformation–independent molecular descriptors which were analyzed by the replacement method (RM) variable subset selection in order to obtain the optimal models. A four–descriptor model was obtained for the DB–225MS stationary phase while a three–parametric model was proposed for both the HP5–MS and HP–1 columns. Models were validated by means of the leave–one–out and leave–many–out cross–validation procedures, as well as other validation criteria. Moreover, in order to accomplish the principles proposed by the Organization for Economic Co–operation and Development (OECD), the model’s predictive ability was measured by predicting retention indices of the external test set. The applicability domain was properly defined and the interpretation of each of the molecular descriptors used in this study was provided.Fil: Rojas Villa, Cristian Xavier. Consejo Nacional de Investigaciones Científicas y Técnicas. Centro Científico Tecnológico Conicet - La Plata. Instituto de Investigaciones Fisicoquímicas Teóricas y Aplicadas. Universidad Nacional de La Plata. Facultad de Ciencias Exactas. Instituto de Investigaciones Fisicoquímicas Teóricas y Aplicadas; ArgentinaFil: Duchowicz, Pablo Román. Consejo Nacional de Investigaciones Científicas y Técnicas. Centro Científico Tecnológico Conicet - La Plata. Instituto de Investigaciones Fisicoquímicas Teóricas y Aplicadas. Universidad Nacional de La Plata. Facultad de Ciencias Exactas. Instituto de Investigaciones Fisicoquímicas Teóricas y Aplicadas; ArgentinaFil: Tripaldi, P.. Universidad de Azuay; EcuadorFil: Pis Diez, Reinaldo. Consejo Nacional de Investigaciones Científicas y Técnicas. Centro Científico Tecnológico Conicet - La Plata. Centro de Química Inorgánica "Dr. Pedro J. Aymonino". Universidad Nacional de La Plata. Facultad de Ciencias Exactas. Centro de Química Inorgánica "Dr. Pedro J. Aymonino"; Argentin

    Similar works