Search CORE

133 research outputs found

Anonymization Techniques for Privacy-preserving Process Mining

Author: Fahrenkrog-Petersen Stephan A.
Publication venue: Humboldt-Universität zu Berlin
Publication date: 30/08/2023
Field of study

Process Mining ermöglicht die Analyse von Event Logs. Jede Aktivität ist durch ein Event in einem Trace recorded, welcher jeweils einer Prozessinstanz entspricht. Traces können sensible Daten, z.B. über Patienten enthalten. Diese Dissertation adressiert Datenschutzrisiken für Trace Daten und Process Mining. Durch eine empirische Studie zum Re-Identifikations Risiko in öffentlichen Event Logs wird die hohe Gefahr aufgezeigt, aber auch weitere Risiken sind von Bedeutung. Anonymisierung ist entscheidend um Risiken zu adressieren, aber schwierig weil gleichzeitig die Verhaltensaspekte des Event Logs erhalten werden sollen. Dies führt zu einem Privacy-Utility-Trade-Off. Dieser wird durch neue Algorithmen wie SaCoFa und SaPa angegangen, die Differential Privacy garantieren und gleichzeitig Utility erhalten. PRIPEL ergänzt die anonymiserten Control-flows um Kontextinformationen und ermöglich so die Veröffentlichung von vollständigen, geschützten Logs. Mit PRETSA wird eine Algorithmenfamilie vorgestellt, die k-anonymity garantiert. Dafür werden privacy-verletztende Traces miteinander vereint, mit dem Ziel ein möglichst syntaktisch ähnliches Log zu erzeugen. Durch Experimente kann eine bessere Utility-Erhaltung gegenüber existierenden Lösungen aufgezeigt werden.Process mining analyzes business processes using event logs. Each activity execution is recorded as an event in a trace, representing a process instance's behavior. Traces often hold sensitive info like patient data. This thesis addresses privacy concerns arising from trace data and process mining. A re-identification risk study on public event logs reveals high risk, but other threats exist. Anonymization is vital to address these issues, yet challenging due to preserving behavioral aspects for analysis, leading to a privacy-utility trade-off. New algorithms, SaCoFa and SaPa, are introduced for trace anonymization using noise for differential privacy while maintaining utility. PRIPEL supplements anonymized control flows with trace contextual info for complete protected logs. For k-anonymity, the PRETSA algorithm family merges privacy-violating traces based on a prefix representation of the event log, maintaining syntactic similarity. Empirical evaluations demonstrate utility improvements over existing techniques

Local matching learning of large scale biomedical ontologies

Author: Laadhar Amir
Publication venue
Publication date: 27/09/2019
Field of study

Les larges ontologies biomédicales décrivent généralement le même domaine d'intérêt, mais en utilisant des modèles de modélisation et des vocabulaires différents. Aligner ces ontologies qui sont complexes et hétérogènes est une tâche fastidieuse. Les systèmes de matching doivent fournir des résultats de haute qualité en tenant compte de la grande taille de ces ressources. Les systèmes de matching d'ontologies doivent résoudre deux problèmes: (i) intégrer la grande taille d'ontologies, (ii) automatiser le processus d'alignement. Le matching d'ontologies est une tâche difficile en raison de la large taille des ontologies. Les systèmes de matching d'ontologies combinent différents types de matcher pour résoudre ces problèmes. Les principaux problèmes de l'alignement de larges ontologies biomédicales sont: l'hétérogénéité conceptuelle, l'espace de recherche élevé et la qualité réduite des alignements résultants. Les systèmes d'alignement d'ontologies combinent différents matchers afin de réduire l'hétérogénéité. Cette combinaison devrait définir le choix des matchers à combiner et le poids. Différents matchers traitent différents types d'hétérogénéité. Par conséquent, le paramétrage d'un matcher devrait être automatisé par les systèmes d'alignement d'ontologies afin d'obtenir une bonne qualité de correspondance. Nous avons proposé une approche appele "local matching learning" pour faire face à la fois à la grande taille des ontologies et au problème de l'automatisation. Nous divisons un gros problème d'alignement en un ensemble de problèmes d'alignement locaux plus petits. Chaque problème d'alignement local est indépendamment aligné par une approche d'apprentissage automatique. Nous réduisons l'énorme espace de recherche en un ensemble de taches de recherche de corresondances locales plus petites. Nous pouvons aligner efficacement chaque tache de recherche de corresondances locale pour obtenir une meilleure qualité de correspondance. Notre approche de partitionnement se base sur une nouvelle stratégie à découpes multiples générant des partitions non volumineuses et non isolées. Par conséquence, nous pouvons surmonter le problème de l'hétérogénéité conceptuelle. Le nouvel algorithme de partitionnement est basé sur le clustering hiérarchique par agglomération (CHA). Cette approche génère un ensemble de tâches de correspondance locale avec un taux de couverture suffisant avec aucune partition isolée. Chaque tâche d'alignement local est automatiquement alignée en se basant sur les techniques d'apprentissage automatique. Un classificateur local aligne une seule tâche d'alignement local. Les classificateurs locaux sont basés sur des features élémentaires et structurelles. L'attribut class de chaque set de donne d'apprentissage " training set" est automatiquement étiqueté à l'aide d'une base de connaissances externe. Nous avons appliqué une technique de sélection de features pour chaque classificateur local afin de sélectionner les matchers appropriés pour chaque tâche d'alignement local. Cette approche réduit la complexité d'alignement et augmente la précision globale par rapport aux méthodes d'apprentissage traditionnelles. Nous avons prouvé que l'approche de partitionnement est meilleure que les approches actuelles en terme de précision, de taux de couverture et d'absence de partitions isolées. Nous avons évalué l'approche d'apprentissage d'alignement local à l'aide de diverses expériences basées sur des jeux de données d'OAEI 2018. Nous avons déduit qu'il est avantageux de diviser une grande tâche d'alignement d'ontologies en un ensemble de tâches d'alignement locaux. L'espace de recherche est réduit, ce qui réduit le nombre de faux négatifs et de faux positifs. L'application de techniques de sélection de caractéristiques à chaque classificateur local augmente la valeur de rappel pour chaque tâche d'alignement local.Although a considerable body of research work has addressed the problem of ontology matching, few studies have tackled the large ontologies used in the biomedical domain. We introduce a fully automated local matching learning approach that breaks down a large ontology matching task into a set of independent local sub-matching tasks. This approach integrates a novel partitioning algorithm as well as a set of matching learning techniques. The partitioning method is based on hierarchical clustering and does not generate isolated partitions. The matching learning approach employs different techniques: (i) local matching tasks are independently and automatically aligned using their local classifiers, which are based on local training sets built from element level and structure level features, (ii) resampling techniques are used to balance each local training set, and (iii) feature selection techniques are used to automatically select the appropriate tuning parameters for each local matching context. Our local matching learning approach generates a set of combined alignments from each local matching task, and experiments show that a multiple local classifier approach outperforms conventional, state-of-the-art approaches: these use a single classifier for the whole ontology matching task. In addition, focusing on context-aware local training sets based on local feature selection and resampling techniques significantly enhances the obtained results

Thèses en ligne de l'Université Toulouse III - Paul Sabatier

Analysis of business opportunities for car-related shared mobility services

Author: Gilibert Mireia
Publication venue: Universitat Politècnica de Catalunya
Publication date: 01/01/2019
Field of study

The confluence of digital technology and connectivity has led, in several sectors, to the rise of application-based shared economy activities. In particular, in the mobility sector, there has been an increase in on-demand shared transport initiatives. These new business models are transforming the urban mobility sector from a limited choice of transport services to a scenario full of new players offering different types of demand responsive mobility services. This change in urban mobility also has an impact on the automotive industry, where manufacturers such as SEAT not only see the opportunity for their cars to be used by these new services, but begin as well to see themselves as potential providers of mobility services. Even so, for the time being, the most popular and widespread shared mobility services remain unprofitable. For this reason, the thesis analyses the business models of the new shared mobility services, with the aim of proposing improvements to increase their profitability. It also identifies the different uses that can be given to them and the factors to be taken into account in the design and implementation process. The methodology used for this research is the study of cases, which have been conducted through surveys and interviews. The research begins with the study of the current and future mobility ecosystem and the behaviour of the automobile industry in this context. Next, the following five case studies are developed. The first analyses the business models of shared mobility services provided by cars –i.e. carsharing, ridesharing, and ride-hailing services– to find out synergies between them for proposing a combined business model. The second aims to study the mobility patterns of citizens and their intention to use shared mobility services. The third and fourth case studies focus on the identification of design factors and use cases of on-demand shared ride-hailing services. This part of the research looks at these services given their potential when cars are autonomous, and the opportunities that the software they use represents for public transport, with buses that could become demand responsive transport services. Finally, the fifth case study analyses the mobility ecosystem from the perspective of local governments and providers of technology and insurance, studies the feasibility of the combination of uses in shared mobility services, and detects the barriers faced by these new business models.La confluència de la tecnologia digital i la connectivitat ha motivat, en diversos sectors, l'auge de les activitats d'economia compartida basades en aplicacions. Concretament, en el sector de la mobilitat s'ha experimentat un creixement de les iniciatives de transport compartit a demanda. Aquests nous models de negoci estan transformant el sector de la mobilitat urbana, que passa de tenir una oferta limitada de serveis de transport a un escenari ple de nous actors que ofereixen diferents serveis de mobilitat a la carta. Aquest canvi en la mobilitat urbana també impacta en la indústria de l'automòbil, on fabricants com SEAT no només veuen l'oportunitat que els seus cotxes siguin utilitzats per aquests nous serveis, sinó que a més a més es comencen a veure com a possibles proveïdors de serveis de mobilitat. Tot i això, de moment, els serveis de mobilitat compartida més populars i estesos continuen sense ser rendibles. Per aquesta raó, la tesi portada a terme analitza els models de negoci dels nous serveis de mobilitat compartida, amb l’objectiu de proposar millores que permetin augmentar la seva rendibilitat. També s'identifiquen els diferents usos que se'ls hi pot donar i els factors que cal tenir en compte a l’hora de dissenyar-los i implementar-los. La metodologia utilitzada per a aquesta investigació és l'estudi de casos, els quals s'han desenvolupat a través d'enquestes i entrevistes. La recerca comença amb l'estudi de l'ecosistema de mobilitat actual i futur, i el comportament de la indústria de l'automòbil en aquest context. Tot seguit es desenvolupen cinc casos d'estudi. En el primer s'analitzen els models de negoci dels serveis de mobilitat compartida que s’ofereixen amb cotxes, es a dir, els serveis de carsharing, ridesharing i ride-hailing, amb la finalitat de trobar sinergies entre ells per a proposar un model de negoci combinat. El segon té com a objectiu estudiar els patrons de mobilitat dels ciutadans i la seva intenció en utilitzar els serveis de mobilitat compartida. El tercer i el quart cas d'estudi se centren a identificar els factors de disseny i els casos d'ús dels serveis d'on- demand shared ride-hailing. Aquesta part de la investigació es fixa en aquests serveis pel potencial que poden tenir quan els cotxes siguin autònoms, i per les oportunitats que el software que utilitzen representen per al transport públic, amb busos que podrien convertir-se en serveis de transport a demanda. Per últim, en el cinquè cas d'estudi s'analitza l’ecosistema de mobilitat des de la perspectiva dels governs locals i dels proveïdors de tecnologia i d'assegurances, s'estudia la viabilitat de la combinació d'usos en els serveis de mobilitat compartida, i es detecten quines són les barreres amb què es troben aquests nous models de negoci.La confluencia de la tecnología digital y la conectividad ha motivado, en varios sectores, el auge de las actividades de economía compartida basadas en aplicaciones. Concretamente, en el sector de la movilidad se ha experimentado un crecimiento de las iniciativas de transporte compartido a la demanda. Estos nuevos modelos de negocio están transformando el sector de la movilidad urbana, que pasa de tener una oferta limitada de servicios de transporte a un escenario lleno de nuevos actores que ofrecen diferentes servicios de movilidad a la carta. Este cambio en la movilidad urbana también impacta en la industria del automóvil, donde fabricantes como SEAT no solo ven la oportunidad que sus coches sean utilizados por estos nuevos servicios, sino que además se empiezan a ver como posibles proveedores de servicios de movilidad. Aun así, por el momento, los servicios de movilidad compartida más populares y extendidos continúan sin ser rentables. Por esta razón, la tesis llevada a cabo analiza los modelos de negocio de los nuevos servicios de movilidad compartida, con el objetivo de proponer mejoras que permitan aumentar su rentabilidad. También se identifican los diferentes usos que se les puede dar y los factores a tener en cuenta en el proceso de diseño e implementación. La metodología utilizada para esta investigación es el estudio de casos, los cuales se han desarrollado por medio de encuestas y entrevistas. La investigación empieza con el estudio del ecosistema de movilidad actual y futuro, y el comportamiento de la industria del automóvil en este contexto. Posteriormente se desarrollan cinco casos de estudio. En el primero se analizan los modelos de negocio de los servicios de movilidad compartida que se ofrecen con coches, es decir, los servicios de carsharing, ridesharing y ride-hailing, con el fin de encontrar sinergias entre ellos para proponer un modelo de negocio combinado. El segundo tiene como objetivo estudiar los patrones de movilidad de los ciudadanos y su intención al utilizar los servicios de movilidad compartida. El tercer y el cuarto caso de estudio se centran en identificar los factores de diseño y los casos de uso de los servicios de on-demand shared ride-hailing. Esta parte de la investigación se centra en estos servicios por su potencial con la llegada del coche autónomo, y por las oportunidades que el software que utilizan representan para el transporte público, con autobuses que podrían convertirse en servicios de transporte a la demanda. Por último, en el quinto caso de estudio se analiza el ecosistema de movilidad desde la perspectiva de los gobiernos locales y de los proveedores de tecnología y seguros, se estudia la viabilidad de la combinación de usos en los servicios de movilidad compartida, y se detectan cuáles son las barreras para estos nuevos modelos de negocio

RIO Country Report Latvia 2014

Author: AVOTINS Valdis
RESELE Liene
Publication venue: Publications Office of the European Union
Publication date: 17/06/2015
Field of study

This analytical country report is the first of a series of annual RIO Country Reports. This Country Report builds on the series of ERAWATCH reports. The report offers an analysis of the R&I system in Latvia for 2014, including relevant policies and funding, with particular focus on topics critical for two EU policies: the European Research Area and the Innovation Union. The report was prepared according to a set of guidelines for collecting and analysing a range of materials, including policy documents, statistics, evaluation reports, websites etc. The report identifies the structural challenges of the Latvian research and innovation system and assesses the match between the national priorities and those challenges, highlighting the latest policy developments, their dynamics and impact in the overall national context.JRC.J.6-Innovation Systems Analysi

JRC Publications Repository