5 research outputs found

    Influencia del pre-procesamiento de datos dentro del desempeño de modelos de perfilamiento de clientes elaborados con herramientas de minería de datos

    Get PDF
    El perfilamiento de clientes es una de las estrategias de mercadeo directo más utilizadas por las empresas, investigaciones en el campo de la minería de datos presentan un crecimiento en los últimos años (Patil, Revankar and Joshi, 2009). Algunas de las investigaciones sobre mercadeo directo en las que se utilizan soluciones de perfilamiento de clientes usando minería de datos resaltan la necesidad de estudiar aspectos específicos acerca de la influencia del pre-procesamiento de datos (PPD) para la mejora de resultados (Romdhane, N. Fadhel, and B. Ayeb, 2010). El objetivo de esta investigación es identificar la influencia del pre-procesamiento de datos dentro del desempeño de modelos de perfilamiento de clientes basados en minería de datos. Este documento cuenta con tres capítulos, el primero describe la metodología de la investigación, el segundo capítulo corresponde presentación de datos experimentales, el tercer y último capítulo corresponde al análisis de resultados. Como resultado de la investigación se describen las mejores prácticas para el pre-procesamiento, producto de los experimentos efectuados.Maestrí

    An efficient preprocessing stage for the relationship-based clustering framework

    No full text
    The goal of this study was to develop an efficient clustering framework for processing high-dimensional datasets with reasonable memory and computing power requirements. Strehl and Ghosh proposed a novel clustering approach and developed a framework which is called relationship-based clustering framework [1]. In this study, a preprocessing system has been implemented on top of their approach and it has been integrated into the relationship-based clustering framework. Three different benchmark datasets were used to evaluate its efficiency. The results are presented in various tables and charts, and in addition CLUSION graphs are plotted to enable visual evaluation of cluster quality. It is demonstrated that CPU and memory usage has been substantially decreased compared with Strehl and Ghosh's framework 1, without any noticeable decrease in clustering quality. This fact enables the use of the relationship-based clustering framework for much larger datasets than was heretofore possible, and also increases its scalability with respect to number of dimensions
    corecore