Vers des solutions adaptatives et génériques pour l'extraction de motifs intéressants dans les données

Abstract

The discovery of frequent patterns is one of the problems in data mining. To better understand the influence of the data on the algorithms, we present an experimental study of data sets commonly used by the community. This study lead to a new classification of data based on edge: stable and consistent with the performance of algorithms. Despite the large number of studies and a theoretical framework for extracting interesting patterns problems, the use of these algorithms for solving problems "equivalent" is uncommon and remains difficult. Given these limitations, we propose a generic algorithm for discovering interesting patterns borders, called ABS (Adaptive Search borders), dynamically adapting its strategy to data. In addition, a generic component library C + + has been proposed to facilitate the development of software solutions for this family of problemsLa découverte de motifs fréquents est un des problèmes en fouille de données. Afin de mieux comprendre l'influence des données sur les algorithmes, nous présentons une étude expérimentale des jeux de données communément utilisés par la communauté. Cette étude permet d'aboutir à une nouvelle classification des données en fonction des bordures : stable et en accord avec les performances des algorithmes. Malgré le grand nombre de travaux et un cadre théorique des problèmes d'extraction de motifs intéressants, l'utilisation de ces algorithmes pour résoudre des problèmes "équivalents" est peu répandue et reste délicate. Face à ces limites, nous proposons un algorithme générique de découverte des bordures des motifs intéressants, appelé ABS (Adaptive borders Search), adaptant dynamiquement sa stratégie en fonction des données. De plus, une librairie générique de composants C++ a été proposée pour faciliter le développement de solutions logicielles pour cette famille de problèmes

Similar works

Full text

thumbnail-image
oai:HAL:tel-00844480v1Last time updated on 11/8/2016

This paper was published in Thèses en Ligne.

Having an issue?

Is data on this page outdated, violates copyrights or anything else? Report the problem now and we will take corresponding actions after reviewing your request.