Predicción de la afinidad de ligandos antagonistas por receptores de adenosina A2A usando árboles de decisión

Abstract

Neurodegenerative diseases are being treated by modulating adenosine receptors with more effective, safe and selective antagonists. The objective of the study was to develop a methodology to obtain classification models based on decision tree algorithms and descriptors from 0D to 2D of non-congenital families of organic compounds to qualitatively predict ligand-RAA2A affinity. For this purpose, a non-congeneric database of 315 antagonists was constructed and cured with its inhibition constant in nano molar, labeled as potent and weak. The Dragon and ISIDA / QSPR programs were used to calculate molecular descriptors and five groups of descriptors were obtained. In each group 50 descriptors were selected using the mRMR criterion. The database was divided into Training, Test and External series through a random selection and a generalized k-means cluster analysis. Classifiers were developed and validated using the WEKA program. The results were analyzed using the statistical tests of Friedman and Wilcoxon. The significant influence of parameter m of algorithm J48 on the predictivity was verified for the models that used the descriptors of the aug.a-b and hyb.aug.a groups of ISIDA / QSPR. The best performance model was obtained from the selected descriptors of the ISIDA-all group with a value of m = 6 and reached 90.6% prediction on the External series. The methodology developed to obtain classification models based on decision tree algorithms and descriptors from 0D to 2D of non-congenital families of organic compounds is effective in qualitatively predicting ligand-RAA2A affinity with accuracy, specificity and selectivity greater than 90 %. Keywords: classification, machine learning, modeling, QSARLas enfermedades neurodegenerativas están siendo tratadas mediante la modulación de los receptores de adenosina con antagonistas más eficaces, seguros y selectivos. El objetivo del estudio consistió en desarrollar una metodología para obtener modelos de clasificación sobre la base de algoritmos de árboles de decisión y descriptores de 0D a 2D de familias no congenéricas de compuestos orgánicos para predecir cualitativamente la afinidad ligando-RAA2A. Para ello se construyó y curó una base de datos no congenérica de 315 antagonistas con su constante de inhibición en nano molar, etiquetados como potentes y débiles. Se utilizaron los programas Dragon e ISIDA/QSPR para calcular descriptores moleculares y se obtuvieron cinco grupos de descriptores. En cada grupo se seleccionaron 50 descriptores usando el criterio mRMR. La base de datos se dividió en series de Entrenamiento, Prueba y Externa mediante una selección aleatoria y un análisis de clúster k-means generalizado. Se desarrollaron y validaron clasificadores utilizando el programa WEKA. Los resultados fueron analizados mediante las pruebas estadísticas de Friedman y Wilcoxon. Se comprobó la influencia significativa del parámetro m del algoritmo J48 en la predictividad, para los modelos que usaron los descriptores de los grupos aug.a-b e hyb.aug.a del ISIDA/QSPR. El modelo de mejor desempeño se obtuvo de los descriptores seleccionados del grupo ISIDA-todos con un valor de m=6 y alcanzó 90.6% de predicción sobre la serie Externa. La metodología desarrollada para obtener modelos de clasificación sobre la base de algoritmos de árboles de decisión y descriptores de 0D a 2D de familias no congenéricas de compuestos orgánicos es efectiva para predecir cualitativamente la afinidad ligando-RAA2A con una exactitud, especificidad y selectividad superiores al 90%. Palabras clave: aprendizaje automatizado; clasificación; modelación; QSA

    Similar works