126 research outputs found
A Constraint Programming Approach for Mining Sequential Patterns in a Sequence Database
Constraint-based pattern discovery is at the core of numerous data mining
tasks. Patterns are extracted with respect to a given set of constraints
(frequency, closedness, size, etc). In the context of sequential pattern
mining, a large number of devoted techniques have been developed for solving
particular classes of constraints. The aim of this paper is to investigate the
use of Constraint Programming (CP) to model and mine sequential patterns in a
sequence database. Our CP approach offers a natural way to simultaneously
combine in a same framework a large set of constraints coming from various
origins. Experiments show the feasibility and the interest of our approach
Discovering Knowledge using a Constraint-based Language
Discovering pattern sets or global patterns is an attractive issue from the
pattern mining community in order to provide useful information. By combining
local patterns satisfying a joint meaning, this approach produces patterns of
higher level and thus more useful for the data analyst than the usual local
patterns, while reducing the number of patterns. In parallel, recent works
investigating relationships between data mining and constraint programming (CP)
show that the CP paradigm is a nice framework to model and mine such patterns
in a declarative and generic way. We present a constraint-based language which
enables us to define queries addressing patterns sets and global patterns. The
usefulness of such a declarative approach is highlighted by several examples
coming from the clustering based on associations. This language has been
implemented in the CP framework.Comment: 12 page
Cost Function Networks to Solve Large Computational Protein Design Problems
International audienc
Closed-Pattern : Une contrainte globale pour l’extraction de motifs fréquents fermés
National audienceL’extraction de motifs fréquents fermés est un des défis majeurs en fouille de données. Les travaux entrepris récemment en extraction de motifs ont mis en avant l’intérêt d’utiliser les contraintes pour une fouille déclarative. Ces approches se sont montrées très attractives par leurs flexibilité, mais l’utilisation d’un nombre important de contraintes réifiées et de variables auxiliaires posent un sérieux problème quant au traitement des bases de grandes tailles. Dans ce papier, nous présentons une contrainte globale nommée ClosedPattern, qui capture la sémantique particulière des motifs fermés pour résoudre efficacement ce problème, sans faire appel aux contraintes réifiées. Nous proposons un algorithme de filtrage pour la contrainte ClosedPattern, qui maintient la consistance de domaine DC en un temps et espace polynomial
Crossing Boundaries: Tapestry Within the Context of the 21st Century
International audienceGraphical model processing is a central problem in artificial intelligence. The optimization of the combined cost of a network of local cost functions federates a variety of famous problems including CSP, SAT and Max-SAT but also optimization in stochastic variants such as Markov Random Fields and Bayesian networks. Exact solving methods for these problems typically include branch and bound and local inference-based bounds.In this paper we are interested in understanding when and how dynamic programming based optimization can be used to efficiently enforce soft local consistencies on Global Cost Functions, defined as parameterized families of cost functions of unbounded arity. Enforcing local consistencies in cost function networks is performed by applying so-called Equivalence Preserving Transformations (EPTs) to the cost functions. These EPTs may transform global cost functions and make them intractable to optimize.We identify as tractable projection-safe those global cost functions whose optimization is and remains tractable after applying the EPTs used for enforcing arc consistency. We also provide new classes of cost functions that are tractable projection-safe thanks to dynamic programming.We show that dynamic programming can either be directly used inside filtering algorithms, defining polynomially DAG-filterable cost functions, or emulated by arc consistency filtering on a Berge-acyclic network of bounded-arity cost functions, defining Berge-acyclic network-decomposable cost functions. We give examples of such cost functions and we provide a systematic way to define decompositions from existing decomposable global constraints.These two approaches to enforcing consistency in global cost functions are then embedded in a solver for extensive experiments that confirm the feasibility and efficiency of our proposal
Cost Function Networks to Solve Large Computational Protein Design Problems
International audienc
Intensification/Diversification de VNS : Application au Problème de Coloration de Graphes
National audienc
Contributions à la résolution des WCSP et approches déclaratives pour la fouille de données
Dans ce mémoire nous détaillons nos travaux de recherche menés depuis plus de treize ans autour de la résolution de problèmes d'optimisation sous contraintes et la modélisation de problèmes de fouille de données en Programmation par Contraintes.Une première partie sera consacrée à la conception et mise en œuvre de méthodes hybrides, faisant coopérer méthodes complètes procédant par "séparation et propagation" avec des approches incomplètes procédant par recherche locale. Le cadre retenu est celui des Weighted Constraint Satisfaction Problem (WCSP) (appelé aussi réseaux de fonctions de coût). Dans ce formalisme, un poids est associé à chaque combinaison de valeurs possible pour les variables de chaque contrainte, définissant ainsi le degré d'insatisfaction de la contrainte pour cette combinaison de valeurs. Une première série de contributions porte sur l'amélioration des performances des algorithmes de résolution, en introduisant de nouvelles heuristiques (de choix de variables, de valeurs ou de voisinages) ou en exploitant la structure du graphe associé au WCSP. Une deuxième série de contributions porte sur la relaxation de contraintes contraintes. Il s'agit d'autoriser la violation de la contrainte et de prendre en compte des préférences entre différentes combinaisons de valeurs violant la contrainte. Une validation de ce cadre sur les problèmes d'emplois de temps de personnel hospitalier (NRPs : Nurse Rostering Problems), archétype des problèmes sur-contraint complexes à modéliser, est également détaillée. Il s'agit de la toute première véritable application des contraintes globales relaxées. La seconde partie porte sur l'étude des apports de la Programmation par Contraintes pour la fouille de données. L'originalité d'une partie de nos travaux réside dans l'introduction de la souplesse pour des contraintes exprimées sous la forme de seuils à respecter. L'objectif est d'extraire des motifs avec un certain degré de violation qui est fonction de l'écart au seuil. Ce principe est ensuite généralisé aux motifs skypatterns (correspondant à un optimum Perate) en introduisant de la souplesse dans la relation de dominance. Nous détaillons également nos travaux sur l'utilisation de la Programmation par Contraintes pour l'extraction de motifs séquentiels, et notamment une contrainte globale qui exploite le principe de projection préfixée pour modéliser efficacement la contrainte de fréquence de sous-séquences. Enfin, nous terminons notre présentation par nos travaux très récents portant sur l'utilisation de la Programmation Linéaire en Nombres Entiers pour la classification conceptuelle et l'aide à la localisation de fautes dans un programme
- …