Location of Repository

Data mining con árboles de decisión en Bioinformática

By Jorge Martín Arevalillo

Abstract

La clasificación de observaciones multivariantes es un problema común a muchas disciplinas. Los procedimientos clásicos para abordarlo, que forman parte del contenido de cualquier curso introductorio de Estadística Multivariante, se remontan al Análisis Discriminante de Fisher y sus conclusiones son fiables siempre que sean ciertas las hipótesis estadísticas en que se apoyan. En la práctica, sobre todo al abordar un problema de minería de datos, el conjunto de variables predictoras es grande y variado, la validación de estas hipótesis es una tarea tediosa y su cumplimiento se antoja imposible. Como alternativa, gracias a la creciente capacidad de almacenamiento y cálculo de los ordenadores, se han desarrollado procedimientos de clasificación cuyos resultados y conclusiones no descansan en hipótesis estadísticas y modelos paramétricos preestablecidos; entre ellos se encuentran los árboles de decisión. El objeto de la charla es presentar la manera en que los algoritmos CHAID y CART resuelven el problema de clasificación mediante árboles de decisión, mostrando sus similitudes y diferencias. También se hará énfasis en las ventajas de las técnicas de clasificación con árboles frente a los métodos clásicos a la hora de abordar la modelización de los datos en un problema de Data Mining

Topics: Teoría de la decisión, Bioinformática
Year: 2013
OAI identifier: oai:www.ucm.es:22663
Provided by: EPrints Complutense
Download PDF:
Sorry, we are unable to provide the full text but you may find it at the following location(s):
  • http://complumedia.ucm.es/resu... (external link)
  • http://eprints.ucm.es/22663/ (external link)
  • Suggested articles


    To submit an update or takedown request for this paper, please submit an Update/Correction/Removal Request.