11 research outputs found
Paving the way for next generation data-stream clustering: towards a unique and statistically valid cluster structure at any time step
International audienceIn the domain of data-stream clustering, e.g., dynamic text mining as our application domain, our goal is two-fold and a long term one: 1 at each data input, the resulting cluster structure has to be unique, independent of the order the input vectors are presented 2 this structure has to be meaningful for an expert, e.g., not composed of a huge 'catch-all' cluster in a cloud of tiny specific ones, as is often the case with large sparse data tables. The first preliminary condition is satisfied by our Germen density-mode seeking algorithm, but the relevance of the clusters vis-Ă -vis expert judgment relies on the definition of a data density, relying itself on the type of graph chosen for embedding the similarities between text inputs. Having already demonstrated the dynamic behaviour of Germen algorithm, we focus here on appending a Monte-Carlo method for extracting statistically valid inter-text links, which looks promising applied both to an excerpt of the Pascal bibliographic database, and to the Reuters-RCV1 news test collection. Though not being a central issue here, the time complexity of our algorithms is eventually discussed
Un systÚme data mining en ligne pour la maintenance ontologique d'une mémoire corporative DM
L'intégration de la connaissance dans la mémoire corporative (RibiÚre et Matta, 1998), (Dieng et al., 1998) fait face à l'hétérogénéité des données (Visser, Jones et al., 1997). L'utilisation de l'ontologie est une approche possible pour surmonter ce problÚme. Cependant, l'ontologie est une structure de donnée comme n'importe quelle structure informatique, elle est donc dynamique et évolue dans le temps à cause des conditions dynamiques résultant des changements du domaine conceptuel, les changements de conceptualisation, les changements de spécification, les changements descendants, etc. (Yildiz, 2006). Ces derniÚres années, plusieurs approches ont été proposées pour résoudre le problÚme de la maintenance des ontologies. Cependant, la précision et le rappel ne permettent pas de satisfaire les besoins des utilisateurs. De plus, ces approches ne prennent pas en compte toute l'information disponible pour prendre une décision réaliste. Pour résoudre le problÚme de l'évolution de la connaissance dans les ontologies, nous proposons une approche hybride qui utilise l'apprentissage machine et un processus d'alignement qui contrÎle les relations syntaxiques entre les entrées dans l'ontologie. De plus, des rÚgles structurelles et des heuristiques sont appliquées pour améliorer le degré de similitude entre les entités ontologiques. Ce processus hybride crée des rÚgles de correspondance qui définissent comment transformer les entrées dans l'ontologie en définissant tous les types d'associations possibles entre les entités ontologiques. L'approche d'enrichissement de l'ontologie exploite les techniques de la fouille de données, les techniques du traitement automatique du langage naturel et la recherche d'information pour améliorer la performance d'apprentissage durant la tùche d'enrichissement du domaine conceptuel. L'évaluation des ontologies demeure un problÚme important et le choix d'une approche appropriée dépend des critÚres utilisés. Dans notre approche, nous adoptons la vérification de la cohérence décrite dans (Maziar Amirhosseini et al., 2011) et (Abderrazak et al., 2011).\ud
______________________________________________________________________________ \ud
MOTS-CLĂS DE LâAUTEUR : Data Mining, Traitement automatique du langage naturel, Apprentissage machine, Recherche d'information, IntĂ©gration, Ontologie, MĂ©moire corporative, Web sĂ©mantique
Méthodologie de développement de systÚmes multi-agents adaptatifs et conception de logiciels à fonctionnalité émergente
Environments within which applications are embedded are growing in complexity and dynamicity, considering the large number and the diversity of the takeholders. Functions of such systems become more and more difficult to define, and their specifications are often incomplete, even if their components are easily identifiable and specifiable. Without new design and modeling methods, managing such project will become too constraining, long and costly to cope with.We propose to use cooperative self-organising adaptive multi-agent systems (AMAS) to tackle these design problems. The functionality of such systems emerges from coopera- tive interactions between agents. Nevertheless, developing using AMAS is still an ad-hoc process and reduced to a small group of users. Several applications have been designed by using AMAS, but it has never been executed by novices and non AMAS experts. To answer to this lack of visibility and openess, the ADELFE project â for Atelier de DEveloppement de Logiciels Ă FonctionnalitĂ© Emergente or Toolkit for developing applications with emergent functionalities â proposes to develop a methodology based on these emergence oriented principles. This methodology is defined in three points : process, notations and tools. The ADELFE process is based on the Rational Unified Process and extends or adds some agent specific activities. Notations are extensions of UML and A-UML. Tools have been developed or extended in to support notations, with OpenTool, and following the process is eased by using AdelfeToolkit.The relevance of this approach has been confronted to the development of experimental applications. Some results from a dynamic timetable solver, ETTO, and from a multi-robot transportation task are presented and analysed.Les environnements des applications dâaujourdâhui sont de plus en plus complexes et dy- namiques, compte tenu du grand nombre et de la diversitĂ© des acteurs en jeu. Les fonctions de tels systĂšmes deviennent alors de plus en plus difficiles Ă dĂ©finir, et leur spĂ©cification est souvent incomplĂšte, mĂȘme si les composantes restent pleinement identifiables et spĂ©cifiables. Si de nouvelles mĂ©thodes de conception et de modĂ©lisation ne sont pas mises au point, la gestion des projets deviendra de plus en plus contraignante, longue et coĂ»teuse.Nous proposons dâutiliser les systĂšmes multi-agents adaptatifs par auto-organisation coopĂ©rative pour palier ces problĂšmes de conception. La fonctionnalitĂ© de ces systĂšmes est une rĂ©sultante Ă©mergeant des interactions coopĂ©ratives entre agents. Toutefois, le dĂ©veloppement de tels systĂšmes est restĂ© confidentiel et rĂ©duit Ă un groupe autour de ses crĂ©ateurs directs. Certes de nombreuses applications ont Ă©tĂ© conçues grĂące Ă ces systĂšmes, mais jamais par des novices, non experts du domaine. Pour rĂ©pondre Ă ce manque de visibilitĂ© et dâouverture, le projet ADELFE - pour Atelier de DEveloppement de Logiciels Ă FonctionnalitĂ© Emergente - propose de dĂ©velopper une mĂ©thode de dĂ©veloppement dâapplications repo- sant sur ces principes et dĂ©finie en trois points : un processus, des notations et des outils. Le processus dâADELFE est basĂ© sur le Rational Unified Process et y ajoute des activitĂ©s spĂ©cifiques Ă lâingĂ©nierie orientĂ©e agent. Les notations sont une extension des notations UML et A-UML. Des outils ont Ă©tĂ© dĂ©veloppĂ©s ou Ă©tendus afin de prendre en charge Ă la fois les notations, grĂące Ă OpenTool, et le processus, grĂące Ă un outil dâaide au suivi appelĂ© AdelfeToolkit.La pertinence de cette mĂ©thodologie a Ă©tĂ© mise Ă lâĂ©preuve au cours de dĂ©veloppements dâapplications diverses. Nous prĂ©sentons ici les rĂ©sultats obtenus pour un problĂšme de rĂ©solution dynamique dâemploi du temps, ETTO (pour Emergent Time Tabling Organisation), et pour un problĂšme de transport multi-robot de ressources
JFPC 2019 - Actes des 15es JourneÌes Francophones de Programmation par Contraintes
National audienceLes JFPC (JournĂ©es Francophones de Programmation par Contraintes) sont le principal congrĂšs de la communautĂ© francophone travaillant sur les problĂšmes de satisfaction de contraintes (CSP), le problĂšme de la satisfiabilitĂ© d'une formule logique propositionnelle (SAT) et/ou la programmation logique avec contraintes (CLP). La communautĂ© de programmation par contraintes entretient Ă©galement des liens avec la recherche opĂ©rationnelle (RO), l'analyse par intervalles et diffĂ©rents domaines de l'intelligence artificielle.L'efficacitĂ© des mĂ©thodes de rĂ©solution et l'extension des modĂšles permettent Ă la programmation par contraintes de s'attaquer Ă des applications nombreuses et variĂ©es comme la logistique, l'ordonnancement de tĂąches, la conception d'emplois du temps, la conception en robotique, l'Ă©tude du gĂ©nĂŽme en bio-informatique, l'optimisation de pratiques agricoles, etc.Les JFPC se veulent un lieu convivial de rencontres, de discussions et d'Ă©changes pour la communautĂ© francophone, en particulier entre doctorants, chercheurs confirmĂ©s et industriels. L'importance des JFPC est reflĂ©tĂ©e par la part considĂ©rable (environ un tiers) de la communautĂ© francophone dans la recherche mondiale dans ce domaine.PatronnĂ©es par l'AFPC (Association Française pour la Programmation par Contraintes), les JFPC 2019 ont lieu du 12 au 14 Juin 2019 Ă l'IMT Mines Albi et sont organisĂ©es par Xavier Lorca (prĂ©sident du comitĂ© scientifique) et par Ălise Vareilles (prĂ©sidente du comitĂ© d'organisation)
Ătude et rĂ©solution de problĂšmes d'ordonnancement d'opĂ©rations d'Ă©vacuation
The work presented in this thesis, which is a part of the Franco-German projectDSS_Evac_Logistic, aims at proposing methods to calculate macroscopic evacuation plansfor mid-size towns after a tremendous disaster. Two evacuation problems have been tackledin this thesis : the bus evacuation problem and bus-and-vehicle evacuation problem.The bus evacuation problem aims at calculating an evacuation plan to relocate evacueesoutside the endangered area. In this thesis, we consider three versions of the bus evacuationproblem. The first one is a monocriterion problem, where the objective is to minimize themaximum evacuation time. In order to guarantee the safety of evacuees, we have considereda bicriteria problem, which is a generalization of the monocriterion version, in which wetake into consideration the risk exposure of the evacuees. Consequently, the bicriteriaproblem is solved by minimizing the total evacuation time and the risk. The third versionis a bicriteria robust version because most of the planning data is subject to uncertainty.The goal is to minimize both the evacuation time and the vulnerability of the schedulethat is subject to different evacuation circumstances. To solve all the versions of the busevacuation problem, we have developed exact solutions based on mathematical formulationto address small instances and heuristic solutions to deal with larger instances.The second evacuation problem studied in this thesis is a multi-criteria problem, whichaims at defining the departure time, the route and the shelters for each group of people.Specifically, we would like to determine a set of appropriate shelters for hosting peoplewhile minimizing the total evacuation time and the risk exposure of the evacuees. For thispurpose, a mathematical formulation has been proposed to deal with small instances. Forlarger instances, evolutionary methods and methods based on multi-objectives shortestpath searches have been developed.For validation and experiments, all the proposed methods have been tested using randominstances and real instances of Kaiserslautern city in Germany and Nice city in France.The choice of these towns is imposed by the project in which this thesis takes placeLes travaux prĂ©sentĂ©s dans cette thĂšse, qui sâinscrivent dans le cadre du projet franco-allemandDSS_Evac_Logistic, visent Ă proposer des mĂ©thodes permettant de calculerdes plans dâĂ©vacuation macroscopiques dâune ville lors dâune catastrophe majeure. DeuxproblĂšmes dâĂ©vacuations sont considĂ©rĂ©s dans cette thĂšse : le problĂšme dâĂ©vacuation parbus et le problĂšme dâĂ©vacuation par bus et voitures.Le problĂšme dâĂ©vacuation par bus a pour objectif de dĂ©finir un plan dâĂ©vacuation afin demettre Ă lâabri les Ă©vacuĂ©s. Dans cette thĂšse, nous nous sommes intĂ©ressĂ©s Ă lâĂ©tude de troisversions du problĂšme dâĂ©vacuation par bus. La premiĂšre version est monocritĂšre oĂč nouscherchons Ă minimiser la date de fin dâĂ©vacuation. Puis, dans le second problĂšme et afindâassurer la sĂ©curitĂ© des Ă©vacuĂ©s, nous avons considĂ©rĂ© une version bicritĂšre qui gĂ©nĂ©ralisele cas monocritĂšre, en incluant le risque encouru lors de lâĂ©vacuation des personnes. Lesdeux critĂšres Ă minimiser sont la date de fin dâĂ©vacuation et le risque. La troisiĂšme versionest une version robuste bicritĂšre qui permet dâapprĂ©hender lâincertitude sur les donnĂ©es. Lebut est de minimiser Ă la fois la date de fin dâĂ©vacuation et les modifications apportĂ©es surune solution, de sorte quâelle soit rĂ©alisable pour nâimporte quel scĂ©nario de donnĂ©es. PourrĂ©soudre ces problĂšmes dâĂ©vacuation par bus, nous avons proposĂ© des mĂ©thodes exactes etdes mĂ©thodes heuristiques.Le second problĂšme dâĂ©vacuation considĂ©rĂ© par bus et voitures est multicritĂšre. Il apour but de dĂ©finir pour chaque groupe de personnes, sa date de dĂ©but dâĂ©vacuation,le centre de secours de rattachement, et le chemin menant Ă ce centre de secours. Nouscherchons Ă dĂ©terminer les centres de secours Ă ouvrir afin de minimiser la date de findâĂ©vacuation et lâexposition aux risques. Un modĂšle mathĂ©matique est proposĂ© pour larĂ©solution exacte des instances de petite taille de ce problĂšme. Pour rĂ©soudre des instancesde grande taille, des mĂ©thodes Ă©volutionnaires et des mĂ©thodes basĂ©es sur le calcul dechemins multiobjectifs sont dĂ©veloppĂ©es.Dans cette thĂšse, toutes les mĂ©thodes proposĂ©es sont testĂ©es et validĂ©es sur des instancesalĂ©atoires et des instances rĂ©elles de la ville de Kaiserslautern du cotĂ© allemand et de laville de Nice du cotĂ© français. Ce choix des villes a Ă©tĂ© imposĂ© par le projet sur lequelsâinscrit cette thĂšse
Recherche de nouveaux antipaludiques par bioinformatique structurale et chémoinformatique : application à deux cibles : PfAMA1 et PfCCT
Human malaria is caused by five parasitic species of the genus Plasmodium, P. falciparum being the most deadly. Drug resistance of some parasite strains has been reported for commercial drugs. Vector mosquitoes are resistant to perythroid insecticides and no successful vaccine is available. This disease is a public and economic health issue for developing countries. My PhD projects investigate new treatments for malaria, by targeting two new proteins. Apicomplexa parasites have developed a unique invasion mechanism involving a tight interaction formed between the host cell and the parasite surfaces called Moving Junction. The structural and functional characterization of the AMA1-RON2 complex pave the way for the design of low molecular weight compounds capable of disrupting the AMA1-RON2 assembly and thereby invasion. The parasite also needs phospholipids to build its membrane during the erythrocytic cycle. There are six times more phospholipids in infected erythrocytes compared to healthy ones. Our strategy is to inhibit the de novo Kennedy pathway and more precisely its rate-limiting step catalysed by the enzyme PfCCT. Filters were used for ligand-based (LBVS) and structure-based virtual screening (SBVS) of commercial chemical databases that I have prepared. For each project, molecules were selected in terms of their docking scores and their interactions with key active site residues. By combining structural bioinformatics and cheminformatics, we identified potential inhibitors of the two protein targets.Le paludisme est causĂ© par cinq espĂšces du genre Plasmodium, P. falciparum Ă©tant le plus mortel. Des rĂ©sistances de certaines souches du parasite ont Ă©tĂ© rapportĂ©es pour tous les mĂ©dicaments mis sur le marchĂ©. Les moustiques vecteurs du parasite sont rĂ©sistants aux insecticides et aucun vaccin n'est disponible. Cette maladie est un problĂšme Ă©conomique et de santĂ© publique pour les pays en voie de dĂ©veloppement. Mes travaux de thĂšses visent Ă identifier de nouveaux traitements contre le paludisme, en ciblant deux nouvelles protĂ©ines. Les Apicomplexes ont dĂ©veloppĂ© un mĂ©canisme unique d'invasion, impliquant une interaction forte entre la cellule hĂŽte et la surface du parasite, appelĂ©e jonction mobile. La caractĂ©risation structurale et fonctionnelle du complexe AMA1-RON2 a ouvert la voie Ă la dĂ©couverte de petites molĂ©cules capables d'empĂȘcher l'interaction AMA1-RON2 et de ce fait, l'invasion. Le parasite a aussi besoin de phospholipides pour construire sa membrane durant le cycle Ă©rythrocytaire. Il y a six fois plus de phospholipides dans les Ă©rythrocytes infectĂ©s que dans les Ă©rythrocytes sains. Notre stratĂ©gie est d'inhiber la voie de synthĂšse de novo Kennedy et plus prĂ©cisĂ©ment, son Ă©tape limitante catalysĂ©e par la PfCCT. Des filtres basĂ©s sur le ligand (LBVS) et sur la structure (SBVS) ont Ă©tĂ© utilisĂ©s pour tester virtuellement les chimiothĂšques commerciales que j'ai prĂ©parĂ©es. Pour chaque projet, des molĂ©cules ont Ă©tĂ© sĂ©lectionnĂ©es pour leurs scores de docking et les interactions qu'elles Ă©tablissent avec les rĂ©sidus clĂ©s de la protĂ©ine. En combinant la bioinformatique structurale et la chĂ©moinformatique, nous avons identifiĂ© des inhibiteurs potentiels des deux cibles protĂ©iques
Modélisation, simulation et optimisation pour l'éco-fabrication
This thesis focuses on the proposal and implementation of approaches for modeling sustainable manufacturing. These approaches are used to prepare and simulate a process of manufacturing products providing coupling between environmental and economic objectives.The approaches developed in this thesis are based on the concepts of decision support as well as multi-objective optimization. The decision support allows intervention in two different levels: the choice of indicator to quantify the environmental impacts and the choice of the final manufacturing scenario. For multi-objective optimization, it provides the coupling between the two main pillars of sustainable manufacturing: ecology and economy. In terms of multi criteria decision aid methods, Evamix and Promethee were applied, while particulate swarms were developed as part of the multi-objective optimization. These approaches have been applied initially to some machining operations: turning and milling. Finally, the production line of phosphoric acid and sulfuric acid were the subject of application of the two approaches developed.Cette thĂšse se focalise sur la proposition et lâapplication des approches pour la modĂ©lisation de lâĂ©co-fabrication. Ces approches permettent de prĂ©parer et simuler une dĂ©marche de fabrication des produits en assurant le couplage entre les objectifs Ă©cologiques et Ă©conomiques.Les approches dĂ©veloppĂ©es dans cette thĂšse sont basĂ©es sur les notions dâaide Ă la dĂ©cision ainsi que lâoptimisation multi objectifs. Lâaide Ă la dĂ©cision permet lâintervention en deux diffĂ©rents niveaux : le choix des impacts environnementaux Ă quantifier ainsi que le choix du scĂ©nario final de fabrication. Pour lâoptimisation multi objectifs, elle assure le couplage entre les deux piliers principaux de lâĂ©co-fabrication : lâĂ©cologie et lâĂ©conomie. Au niveau de lâaide Ă la dĂ©cision multi critĂšres, les mĂ©thodes Evamix et Promethee ont Ă©tĂ© appliquĂ©s, tandis que les essaims particulaires ont Ă©tĂ© dĂ©veloppĂ©s dans le cadre de lâoptimisation multi objectifs.Ces approches ont Ă©tĂ© appliquĂ©es tout dâabord aux quelques opĂ©rations dâusinage : tournage et fraisage. Finalement, la chaĂźne de fabrication de lâacide phosphorique ainsi que celle dâacide sulfurique ont Ă©tĂ© le sujet de lâapplication des deux approches dĂ©veloppĂ©es
Actes des 29es Journées Francophones d'Ingénierie des Connaissances, IC 2018
International audienc
Construction incrémentale et visualisation de graphes de voisinage par des fourmis artificielles
National audienceCet article dĂ©crit un nouvel algorithme incrĂ©mental nommĂ© AntGraph pour la construction de graphes de voisinage. Il s'inspire du comportement d'autoassemblage observĂ© chez des fourmis rĂ©elles oĂč ces derniĂšres se fixent progressivement Ă un support fixe puis successivement aux fourmis dĂ©jĂ fixĂ©es afin de crĂ©er une structure vivante. Nous utilisons ainsi une approche Ă base de fourmis artificielles oĂč chaque fourmi reprĂ©sente une donnĂ©e. Nous indiquons comment ce comportement peut ĂȘtre utilisĂ© pour construire de maniĂšre incrĂ©mentale un graphe Ă partir d'une mesure de similaritĂ© entre les donnĂ©es. Nous montrons finalement que notre algorithme obtient de meilleurs rĂ©sultats en comparaison avec le graphe de Voisins Relatifs, notamment en terme de temps de calcul
Tissu numérique cellulaire à routage et configuration dynamiques
In the design of new machines or in the development of new concepts, mankind has often observed nature, looking for useful ideas and sources of inspiration. The design of electronic circuits is no exception, and a considerable number of realizations have drawn inspiration from three aspects of natural systems : the evolution of species (Phylogenesis), the development of an organism starting from a single cell (Ontogenesis), and learning, as performed by our brain (Epigenesis). These three axes, grouped under the acronym POE, have for the most part been exploited separately : evolutionary principles allow to solve problems for which it is hard to find a solution with a deterministic method, while some electronic circuits draw inspiration from healing process in living beings to achieve self-repair, and artificial neural networks have the capability to efficiently execute a wide range of tasks. At this time, no electronic tissue capable of bringing them together seems to exist. The introduction of reconfigurable circuits called Field Programmable Gate Arrays (FPGAs), whose behavior can be redefined as often as desired, made prototyping such systems easier. FPGAs, by allowing a relatively simple implementation in hardware, can considerably increase the systems' performance and are thus extensively used by researchers. However, they lack plasticity, not being able to easily modify themselves without an external intervention. This PhD thesis, developed in the framework of the European POEtic project, proposes to define a new reconfigurable electronic circuit, with the goal of supplying a new substrate for bio-inspired applications that bring all three axes into play. This circuit is mainly composed of a microprocessor and an array of reconfigurable elements, the latter having been designed during this thesis. Evolutionary processes are executed by the microprocessor, while epigenetic and ontogenetic mechanisms are applied in the reconfigurable array, to entities seen as multicellular artificial organisms. Relatively similar to current commercial FPGAs, this subsystem offers however some unique features. First, the basic elements of the array have the capability to partially reconfigure other elements. Auto-replication and differentiation mechanisms can exploit this capability to let an organism grow or to modify its behavior. Second, a distributed routing layer allows to dynamically create connections between parts of the circuit at runtime. With this feature, cells (artificial neurons, for example) implemented in the reconfigurable array can initiate new connections in order to modify the global system behavior. This distributed routing mechanism, one of the major contributions of this thesis, induced the realization of several algorithms. Based on a parallel implementation of Lee's algorithm, these algorithms are totally distributed, no global control being necessary to create new data paths. Four algorithms have been defined implemented in hardware in the form of routing units connected to 3, 4, 6, or 8 neighbors. These units are all identical and are responsible for the routing processes. An analysis of their properties allows us to define the best algorithm, coupled with the most efficient neighborhood, in terms of congestion and of the number of transistors needed for a hardware realization. We finish the routing chapter by proposing a fifth algorithm that, unlike the previous ones, is constructed only through local interactions between routing units. It offers a better scalability, at the price of increased hardware overhead. Finally, the POEtic chip, in which one of our algorithms has been implemented, has been physically realized. We present different POE mechanisms that take advantage of its new features. Among these mechanisms, we can notably cite auto-replication, evolvable hardware, developmental systems, and self-repair. All of these mechanisms have been developed with the help of a circuit simulator, also designed in the framework of this thesis