11 research outputs found

    Paving the way for next generation data-stream clustering: towards a unique and statistically valid cluster structure at any time step

    Get PDF
    International audienceIn the domain of data-stream clustering, e.g., dynamic text mining as our application domain, our goal is two-fold and a long term one: 1 at each data input, the resulting cluster structure has to be unique, independent of the order the input vectors are presented 2 this structure has to be meaningful for an expert, e.g., not composed of a huge 'catch-all' cluster in a cloud of tiny specific ones, as is often the case with large sparse data tables. The first preliminary condition is satisfied by our Germen density-mode seeking algorithm, but the relevance of the clusters vis-Ă -vis expert judgment relies on the definition of a data density, relying itself on the type of graph chosen for embedding the similarities between text inputs. Having already demonstrated the dynamic behaviour of Germen algorithm, we focus here on appending a Monte-Carlo method for extracting statistically valid inter-text links, which looks promising applied both to an excerpt of the Pascal bibliographic database, and to the Reuters-RCV1 news test collection. Though not being a central issue here, the time complexity of our algorithms is eventually discussed

    Un systÚme data mining en ligne pour la maintenance ontologique d'une mémoire corporative DM

    Get PDF
    L'intĂ©gration de la connaissance dans la mĂ©moire corporative (RibiĂšre et Matta, 1998), (Dieng et al., 1998) fait face Ă  l'hĂ©tĂ©rogĂ©nĂ©itĂ© des donnĂ©es (Visser, Jones et al., 1997). L'utilisation de l'ontologie est une approche possible pour surmonter ce problĂšme. Cependant, l'ontologie est une structure de donnĂ©e comme n'importe quelle structure informatique, elle est donc dynamique et Ă©volue dans le temps Ă  cause des conditions dynamiques rĂ©sultant des changements du domaine conceptuel, les changements de conceptualisation, les changements de spĂ©cification, les changements descendants, etc. (Yildiz, 2006). Ces derniĂšres annĂ©es, plusieurs approches ont Ă©tĂ© proposĂ©es pour rĂ©soudre le problĂšme de la maintenance des ontologies. Cependant, la prĂ©cision et le rappel ne permettent pas de satisfaire les besoins des utilisateurs. De plus, ces approches ne prennent pas en compte toute l'information disponible pour prendre une dĂ©cision rĂ©aliste. Pour rĂ©soudre le problĂšme de l'Ă©volution de la connaissance dans les ontologies, nous proposons une approche hybride qui utilise l'apprentissage machine et un processus d'alignement qui contrĂŽle les relations syntaxiques entre les entrĂ©es dans l'ontologie. De plus, des rĂšgles structurelles et des heuristiques sont appliquĂ©es pour amĂ©liorer le degrĂ© de similitude entre les entitĂ©s ontologiques. Ce processus hybride crĂ©e des rĂšgles de correspondance qui dĂ©finissent comment transformer les entrĂ©es dans l'ontologie en dĂ©finissant tous les types d'associations possibles entre les entitĂ©s ontologiques. L'approche d'enrichissement de l'ontologie exploite les techniques de la fouille de donnĂ©es, les techniques du traitement automatique du langage naturel et la recherche d'information pour amĂ©liorer la performance d'apprentissage durant la tĂąche d'enrichissement du domaine conceptuel. L'Ă©valuation des ontologies demeure un problĂšme important et le choix d'une approche appropriĂ©e dĂ©pend des critĂšres utilisĂ©s. Dans notre approche, nous adoptons la vĂ©rification de la cohĂ©rence dĂ©crite dans (Maziar Amirhosseini et al., 2011) et (Abderrazak et al., 2011).\ud ______________________________________________________________________________ \ud MOTS-CLÉS DE L’AUTEUR : Data Mining, Traitement automatique du langage naturel, Apprentissage machine, Recherche d'information, IntĂ©gration, Ontologie, MĂ©moire corporative, Web sĂ©mantique

    Méthodologie de développement de systÚmes multi-agents adaptatifs et conception de logiciels à fonctionnalité émergente

    Get PDF
    Environments within which applications are embedded are growing in complexity and dynamicity, considering the large number and the diversity of the takeholders. Functions of such systems become more and more difficult to define, and their specifications are often incomplete, even if their components are easily identifiable and specifiable. Without new design and modeling methods, managing such project will become too constraining, long and costly to cope with.We propose to use cooperative self-organising adaptive multi-agent systems (AMAS) to tackle these design problems. The functionality of such systems emerges from coopera- tive interactions between agents. Nevertheless, developing using AMAS is still an ad-hoc process and reduced to a small group of users. Several applications have been designed by using AMAS, but it has never been executed by novices and non AMAS experts. To answer to this lack of visibility and openess, the ADELFE project – for Atelier de DEveloppement de Logiciels Ă  FonctionnalitĂ© Emergente or Toolkit for developing applications with emergent functionalities – proposes to develop a methodology based on these emergence oriented principles. This methodology is defined in three points : process, notations and tools. The ADELFE process is based on the Rational Unified Process and extends or adds some agent specific activities. Notations are extensions of UML and A-UML. Tools have been developed or extended in to support notations, with OpenTool, and following the process is eased by using AdelfeToolkit.The relevance of this approach has been confronted to the development of experimental applications. Some results from a dynamic timetable solver, ETTO, and from a multi-robot transportation task are presented and analysed.Les environnements des applications d’aujourd’hui sont de plus en plus complexes et dy- namiques, compte tenu du grand nombre et de la diversitĂ© des acteurs en jeu. Les fonctions de tels systĂšmes deviennent alors de plus en plus difficiles Ă  dĂ©finir, et leur spĂ©cification est souvent incomplĂšte, mĂȘme si les composantes restent pleinement identifiables et spĂ©cifiables. Si de nouvelles mĂ©thodes de conception et de modĂ©lisation ne sont pas mises au point, la gestion des projets deviendra de plus en plus contraignante, longue et coĂ»teuse.Nous proposons d’utiliser les systĂšmes multi-agents adaptatifs par auto-organisation coopĂ©rative pour palier ces problĂšmes de conception. La fonctionnalitĂ© de ces systĂšmes est une rĂ©sultante Ă©mergeant des interactions coopĂ©ratives entre agents. Toutefois, le dĂ©veloppement de tels systĂšmes est restĂ© confidentiel et rĂ©duit Ă  un groupe autour de ses crĂ©ateurs directs. Certes de nombreuses applications ont Ă©tĂ© conçues grĂące Ă  ces systĂšmes, mais jamais par des novices, non experts du domaine. Pour rĂ©pondre Ă  ce manque de visibilitĂ© et d’ouverture, le projet ADELFE - pour Atelier de DEveloppement de Logiciels Ă  FonctionnalitĂ© Emergente - propose de dĂ©velopper une mĂ©thode de dĂ©veloppement d’applications repo- sant sur ces principes et dĂ©finie en trois points : un processus, des notations et des outils. Le processus d’ADELFE est basĂ© sur le Rational Unified Process et y ajoute des activitĂ©s spĂ©cifiques Ă  l’ingĂ©nierie orientĂ©e agent. Les notations sont une extension des notations UML et A-UML. Des outils ont Ă©tĂ© dĂ©veloppĂ©s ou Ă©tendus afin de prendre en charge Ă  la fois les notations, grĂące Ă  OpenTool, et le processus, grĂące Ă  un outil d’aide au suivi appelĂ© AdelfeToolkit.La pertinence de cette mĂ©thodologie a Ă©tĂ© mise Ă  l’épreuve au cours de dĂ©veloppements d’applications diverses. Nous prĂ©sentons ici les rĂ©sultats obtenus pour un problĂšme de rĂ©solution dynamique d’emploi du temps, ETTO (pour Emergent Time Tabling Organisation), et pour un problĂšme de transport multi-robot de ressources

    JFPC 2019 - Actes des 15es Journées Francophones de Programmation par Contraintes

    Get PDF
    National audienceLes JFPC (JournĂ©es Francophones de Programmation par Contraintes) sont le principal congrĂšs de la communautĂ© francophone travaillant sur les problĂšmes de satisfaction de contraintes (CSP), le problĂšme de la satisfiabilitĂ© d'une formule logique propositionnelle (SAT) et/ou la programmation logique avec contraintes (CLP). La communautĂ© de programmation par contraintes entretient Ă©galement des liens avec la recherche opĂ©rationnelle (RO), l'analyse par intervalles et diffĂ©rents domaines de l'intelligence artificielle.L'efficacitĂ© des mĂ©thodes de rĂ©solution et l'extension des modĂšles permettent Ă  la programmation par contraintes de s'attaquer Ă  des applications nombreuses et variĂ©es comme la logistique, l'ordonnancement de tĂąches, la conception d'emplois du temps, la conception en robotique, l'Ă©tude du gĂ©nĂŽme en bio-informatique, l'optimisation de pratiques agricoles, etc.Les JFPC se veulent un lieu convivial de rencontres, de discussions et d'Ă©changes pour la communautĂ© francophone, en particulier entre doctorants, chercheurs confirmĂ©s et industriels. L'importance des JFPC est reflĂ©tĂ©e par la part considĂ©rable (environ un tiers) de la communautĂ© francophone dans la recherche mondiale dans ce domaine.PatronnĂ©es par l'AFPC (Association Française pour la Programmation par Contraintes), les JFPC 2019 ont lieu du 12 au 14 Juin 2019 Ă  l'IMT Mines Albi et sont organisĂ©es par Xavier Lorca (prĂ©sident du comitĂ© scientifique) et par Élise Vareilles (prĂ©sidente du comitĂ© d'organisation)

    Étude et rĂ©solution de problĂšmes d'ordonnancement d'opĂ©rations d'Ă©vacuation

    Get PDF
    The work presented in this thesis, which is a part of the Franco-German projectDSS_Evac_Logistic, aims at proposing methods to calculate macroscopic evacuation plansfor mid-size towns after a tremendous disaster. Two evacuation problems have been tackledin this thesis : the bus evacuation problem and bus-and-vehicle evacuation problem.The bus evacuation problem aims at calculating an evacuation plan to relocate evacueesoutside the endangered area. In this thesis, we consider three versions of the bus evacuationproblem. The first one is a monocriterion problem, where the objective is to minimize themaximum evacuation time. In order to guarantee the safety of evacuees, we have considereda bicriteria problem, which is a generalization of the monocriterion version, in which wetake into consideration the risk exposure of the evacuees. Consequently, the bicriteriaproblem is solved by minimizing the total evacuation time and the risk. The third versionis a bicriteria robust version because most of the planning data is subject to uncertainty.The goal is to minimize both the evacuation time and the vulnerability of the schedulethat is subject to different evacuation circumstances. To solve all the versions of the busevacuation problem, we have developed exact solutions based on mathematical formulationto address small instances and heuristic solutions to deal with larger instances.The second evacuation problem studied in this thesis is a multi-criteria problem, whichaims at defining the departure time, the route and the shelters for each group of people.Specifically, we would like to determine a set of appropriate shelters for hosting peoplewhile minimizing the total evacuation time and the risk exposure of the evacuees. For thispurpose, a mathematical formulation has been proposed to deal with small instances. Forlarger instances, evolutionary methods and methods based on multi-objectives shortestpath searches have been developed.For validation and experiments, all the proposed methods have been tested using randominstances and real instances of Kaiserslautern city in Germany and Nice city in France.The choice of these towns is imposed by the project in which this thesis takes placeLes travaux prĂ©sentĂ©s dans cette thĂšse, qui s’inscrivent dans le cadre du projet franco-allemandDSS_Evac_Logistic, visent Ă  proposer des mĂ©thodes permettant de calculerdes plans d’évacuation macroscopiques d’une ville lors d’une catastrophe majeure. DeuxproblĂšmes d’évacuations sont considĂ©rĂ©s dans cette thĂšse : le problĂšme d’évacuation parbus et le problĂšme d’évacuation par bus et voitures.Le problĂšme d’évacuation par bus a pour objectif de dĂ©finir un plan d’évacuation afin demettre Ă  l’abri les Ă©vacuĂ©s. Dans cette thĂšse, nous nous sommes intĂ©ressĂ©s Ă  l’étude de troisversions du problĂšme d’évacuation par bus. La premiĂšre version est monocritĂšre oĂč nouscherchons Ă  minimiser la date de fin d’évacuation. Puis, dans le second problĂšme et afind’assurer la sĂ©curitĂ© des Ă©vacuĂ©s, nous avons considĂ©rĂ© une version bicritĂšre qui gĂ©nĂ©ralisele cas monocritĂšre, en incluant le risque encouru lors de l’évacuation des personnes. Lesdeux critĂšres Ă  minimiser sont la date de fin d’évacuation et le risque. La troisiĂšme versionest une version robuste bicritĂšre qui permet d’apprĂ©hender l’incertitude sur les donnĂ©es. Lebut est de minimiser Ă  la fois la date de fin d’évacuation et les modifications apportĂ©es surune solution, de sorte qu’elle soit rĂ©alisable pour n’importe quel scĂ©nario de donnĂ©es. PourrĂ©soudre ces problĂšmes d’évacuation par bus, nous avons proposĂ© des mĂ©thodes exactes etdes mĂ©thodes heuristiques.Le second problĂšme d’évacuation considĂ©rĂ© par bus et voitures est multicritĂšre. Il apour but de dĂ©finir pour chaque groupe de personnes, sa date de dĂ©but d’évacuation,le centre de secours de rattachement, et le chemin menant Ă  ce centre de secours. Nouscherchons Ă  dĂ©terminer les centres de secours Ă  ouvrir afin de minimiser la date de find’évacuation et l’exposition aux risques. Un modĂšle mathĂ©matique est proposĂ© pour larĂ©solution exacte des instances de petite taille de ce problĂšme. Pour rĂ©soudre des instancesde grande taille, des mĂ©thodes Ă©volutionnaires et des mĂ©thodes basĂ©es sur le calcul dechemins multiobjectifs sont dĂ©veloppĂ©es.Dans cette thĂšse, toutes les mĂ©thodes proposĂ©es sont testĂ©es et validĂ©es sur des instancesalĂ©atoires et des instances rĂ©elles de la ville de Kaiserslautern du cotĂ© allemand et de laville de Nice du cotĂ© français. Ce choix des villes a Ă©tĂ© imposĂ© par le projet sur lequels’inscrit cette thĂšse

    Recherche de nouveaux antipaludiques par bioinformatique structurale et chémoinformatique : application à deux cibles : PfAMA1 et PfCCT

    Get PDF
    Human malaria is caused by five parasitic species of the genus Plasmodium, P. falciparum being the most deadly. Drug resistance of some parasite strains has been reported for commercial drugs. Vector mosquitoes are resistant to perythroid insecticides and no successful vaccine is available. This disease is a public and economic health issue for developing countries. My PhD projects investigate new treatments for malaria, by targeting two new proteins. Apicomplexa parasites have developed a unique invasion mechanism involving a tight interaction formed between the host cell and the parasite surfaces called Moving Junction. The structural and functional characterization of the AMA1-RON2 complex pave the way for the design of low molecular weight compounds capable of disrupting the AMA1-RON2 assembly and thereby invasion. The parasite also needs phospholipids to build its membrane during the erythrocytic cycle. There are six times more phospholipids in infected erythrocytes compared to healthy ones. Our strategy is to inhibit the de novo Kennedy pathway and more precisely its rate-limiting step catalysed by the enzyme PfCCT. Filters were used for ligand-based (LBVS) and structure-based virtual screening (SBVS) of commercial chemical databases that I have prepared. For each project, molecules were selected in terms of their docking scores and their interactions with key active site residues. By combining structural bioinformatics and cheminformatics, we identified potential inhibitors of the two protein targets.Le paludisme est causĂ© par cinq espĂšces du genre Plasmodium, P. falciparum Ă©tant le plus mortel. Des rĂ©sistances de certaines souches du parasite ont Ă©tĂ© rapportĂ©es pour tous les mĂ©dicaments mis sur le marchĂ©. Les moustiques vecteurs du parasite sont rĂ©sistants aux insecticides et aucun vaccin n'est disponible. Cette maladie est un problĂšme Ă©conomique et de santĂ© publique pour les pays en voie de dĂ©veloppement. Mes travaux de thĂšses visent Ă  identifier de nouveaux traitements contre le paludisme, en ciblant deux nouvelles protĂ©ines. Les Apicomplexes ont dĂ©veloppĂ© un mĂ©canisme unique d'invasion, impliquant une interaction forte entre la cellule hĂŽte et la surface du parasite, appelĂ©e jonction mobile. La caractĂ©risation structurale et fonctionnelle du complexe AMA1-RON2 a ouvert la voie Ă  la dĂ©couverte de petites molĂ©cules capables d'empĂȘcher l'interaction AMA1-RON2 et de ce fait, l'invasion. Le parasite a aussi besoin de phospholipides pour construire sa membrane durant le cycle Ă©rythrocytaire. Il y a six fois plus de phospholipides dans les Ă©rythrocytes infectĂ©s que dans les Ă©rythrocytes sains. Notre stratĂ©gie est d'inhiber la voie de synthĂšse de novo Kennedy et plus prĂ©cisĂ©ment, son Ă©tape limitante catalysĂ©e par la PfCCT. Des filtres basĂ©s sur le ligand (LBVS) et sur la structure (SBVS) ont Ă©tĂ© utilisĂ©s pour tester virtuellement les chimiothĂšques commerciales que j'ai prĂ©parĂ©es. Pour chaque projet, des molĂ©cules ont Ă©tĂ© sĂ©lectionnĂ©es pour leurs scores de docking et les interactions qu'elles Ă©tablissent avec les rĂ©sidus clĂ©s de la protĂ©ine. En combinant la bioinformatique structurale et la chĂ©moinformatique, nous avons identifiĂ© des inhibiteurs potentiels des deux cibles protĂ©iques

    Modélisation, simulation et optimisation pour l'éco-fabrication

    Get PDF
    This thesis focuses on the proposal and implementation of approaches for modeling sustainable manufacturing. These approaches are used to prepare and simulate a process of manufacturing products providing coupling between environmental and economic objectives.The approaches developed in this thesis are based on the concepts of decision support as well as multi-objective optimization. The decision support allows intervention in two different levels: the choice of indicator to quantify the environmental impacts and the choice of the final manufacturing scenario. For multi-objective optimization, it provides the coupling between the two main pillars of sustainable manufacturing: ecology and economy. In terms of multi criteria decision aid methods, Evamix and Promethee were applied, while particulate swarms were developed as part of the multi-objective optimization. These approaches have been applied initially to some machining operations: turning and milling. Finally, the production line of phosphoric acid and sulfuric acid were the subject of application of the two approaches developed.Cette thĂšse se focalise sur la proposition et l’application des approches pour la modĂ©lisation de l’éco-fabrication. Ces approches permettent de prĂ©parer et simuler une dĂ©marche de fabrication des produits en assurant le couplage entre les objectifs Ă©cologiques et Ă©conomiques.Les approches dĂ©veloppĂ©es dans cette thĂšse sont basĂ©es sur les notions d’aide Ă  la dĂ©cision ainsi que l’optimisation multi objectifs. L’aide Ă  la dĂ©cision permet l’intervention en deux diffĂ©rents niveaux : le choix des impacts environnementaux Ă  quantifier ainsi que le choix du scĂ©nario final de fabrication. Pour l’optimisation multi objectifs, elle assure le couplage entre les deux piliers principaux de l’éco-fabrication : l’écologie et l’économie. Au niveau de l’aide Ă  la dĂ©cision multi critĂšres, les mĂ©thodes Evamix et Promethee ont Ă©tĂ© appliquĂ©s, tandis que les essaims particulaires ont Ă©tĂ© dĂ©veloppĂ©s dans le cadre de l’optimisation multi objectifs.Ces approches ont Ă©tĂ© appliquĂ©es tout d’abord aux quelques opĂ©rations d’usinage : tournage et fraisage. Finalement, la chaĂźne de fabrication de l’acide phosphorique ainsi que celle d’acide sulfurique ont Ă©tĂ© le sujet de l’application des deux approches dĂ©veloppĂ©es

    Actes des 29es Journées Francophones d'Ingénierie des Connaissances, IC 2018

    Get PDF
    International audienc

    Construction incrémentale et visualisation de graphes de voisinage par des fourmis artificielles

    No full text
    National audienceCet article dĂ©crit un nouvel algorithme incrĂ©mental nommĂ© AntGraph pour la construction de graphes de voisinage. Il s'inspire du comportement d'autoassemblage observĂ© chez des fourmis rĂ©elles oĂč ces derniĂšres se fixent progressivement Ă  un support fixe puis successivement aux fourmis dĂ©jĂ  fixĂ©es afin de crĂ©er une structure vivante. Nous utilisons ainsi une approche Ă  base de fourmis artificielles oĂč chaque fourmi reprĂ©sente une donnĂ©e. Nous indiquons comment ce comportement peut ĂȘtre utilisĂ© pour construire de maniĂšre incrĂ©mentale un graphe Ă  partir d'une mesure de similaritĂ© entre les donnĂ©es. Nous montrons finalement que notre algorithme obtient de meilleurs rĂ©sultats en comparaison avec le graphe de Voisins Relatifs, notamment en terme de temps de calcul

    Tissu numérique cellulaire à routage et configuration dynamiques

    Get PDF
    In the design of new machines or in the development of new concepts, mankind has often observed nature, looking for useful ideas and sources of inspiration. The design of electronic circuits is no exception, and a considerable number of realizations have drawn inspiration from three aspects of natural systems : the evolution of species (Phylogenesis), the development of an organism starting from a single cell (Ontogenesis), and learning, as performed by our brain (Epigenesis). These three axes, grouped under the acronym POE, have for the most part been exploited separately : evolutionary principles allow to solve problems for which it is hard to find a solution with a deterministic method, while some electronic circuits draw inspiration from healing process in living beings to achieve self-repair, and artificial neural networks have the capability to efficiently execute a wide range of tasks. At this time, no electronic tissue capable of bringing them together seems to exist. The introduction of reconfigurable circuits called Field Programmable Gate Arrays (FPGAs), whose behavior can be redefined as often as desired, made prototyping such systems easier. FPGAs, by allowing a relatively simple implementation in hardware, can considerably increase the systems' performance and are thus extensively used by researchers. However, they lack plasticity, not being able to easily modify themselves without an external intervention. This PhD thesis, developed in the framework of the European POEtic project, proposes to define a new reconfigurable electronic circuit, with the goal of supplying a new substrate for bio-inspired applications that bring all three axes into play. This circuit is mainly composed of a microprocessor and an array of reconfigurable elements, the latter having been designed during this thesis. Evolutionary processes are executed by the microprocessor, while epigenetic and ontogenetic mechanisms are applied in the reconfigurable array, to entities seen as multicellular artificial organisms. Relatively similar to current commercial FPGAs, this subsystem offers however some unique features. First, the basic elements of the array have the capability to partially reconfigure other elements. Auto-replication and differentiation mechanisms can exploit this capability to let an organism grow or to modify its behavior. Second, a distributed routing layer allows to dynamically create connections between parts of the circuit at runtime. With this feature, cells (artificial neurons, for example) implemented in the reconfigurable array can initiate new connections in order to modify the global system behavior. This distributed routing mechanism, one of the major contributions of this thesis, induced the realization of several algorithms. Based on a parallel implementation of Lee's algorithm, these algorithms are totally distributed, no global control being necessary to create new data paths. Four algorithms have been defined implemented in hardware in the form of routing units connected to 3, 4, 6, or 8 neighbors. These units are all identical and are responsible for the routing processes. An analysis of their properties allows us to define the best algorithm, coupled with the most efficient neighborhood, in terms of congestion and of the number of transistors needed for a hardware realization. We finish the routing chapter by proposing a fifth algorithm that, unlike the previous ones, is constructed only through local interactions between routing units. It offers a better scalability, at the price of increased hardware overhead. Finally, the POEtic chip, in which one of our algorithms has been implemented, has been physically realized. We present different POE mechanisms that take advantage of its new features. Among these mechanisms, we can notably cite auto-replication, evolvable hardware, developmental systems, and self-repair. All of these mechanisms have been developed with the help of a circuit simulator, also designed in the framework of this thesis
    corecore