3 research outputs found

    Structural Feature Selection for Event Logs

    Get PDF
    We consider the problem of classifying business process instances based on structural features derived from event logs. The main motivation is to provide machine learning based techniques with quick response times for interactive computer assisted root cause analysis. In particular, we create structural features from process mining such as activity and transition occurrence counts, and ordering of activities to be evaluated as potential features for classification. We show that adding such structural features increases the amount of information thus potentially increasing classification accuracy. However, there is an inherent trade-off as using too many features leads to too long run-times for machine learning classification models. One way to improve the machine learning algorithms' run-time is to only select a small number of features by a feature selection algorithm. However, the run-time required by the feature selection algorithm must also be taken into account. Also, the classification accuracy should not suffer too much from the feature selection. The main contributions of this paper are as follows: First, we propose and compare six different feature selection algorithms by means of an experimental setup comparing their classification accuracy and achievable response times. Second, we discuss the potential use of feature selection results for computer assisted root cause analysis as well as the properties of different types of structural features in the context of feature selection.Peer reviewe

    Discovering Business Area Effects to Process Mining Analysis Using Clustering and Influence Analysis

    Full text link
    A common challenge for improving business processes in large organizations is that business people in charge of the operations are lacking a fact-based understanding of the execution details, process variants, and exceptions taking place in business operations. While existing process mining methodologies can discover these details based on event logs, it is challenging to communicate the process mining findings to business people. In this paper, we present a novel methodology for discovering business areas that have a significant effect on the process execution details. Our method uses clustering to group similar cases based on process flow characteristics and then influence analysis for detecting those business areas that correlate most with the discovered clusters. Our analysis serves as a bridge between BPM people and business, people facilitating the knowledge sharing between these groups. We also present an example analysis based on publicly available real-life purchase order process data.Comment: 12 pages. Paper accepted in 23rd International Conference on Business Information Systems (BIS 2020) to be published in a proceedings edition of the Lecture Notes in Business Information Processin

    Entwicklung eines Verfahrens fĂĽr Monitoring und Klassifikation von Business Process Event Streams im Kontext des Online Process Mining

    Get PDF
    Das stetige Wachstum von Datenmengen, besonders in Unternehmen, setzt die Neu- und Weiterentwicklung geeigneter datengetriebener Analysemethoden voraus, die die gesammelten Informationen in einen Kontext setzen und einen operativen Mehrwert für die Unternehmen erzeugen. Insbesondere die echtzeitnahe Analyse von Geschäftsprozessdaten, die in den Unternehmensinformationssystemen gespeichert werden, lassen sich mit Hilfe von Analysewerkzeugen, wie es das Process Mining zur Verfügung stellt, auswerten und generieren Einblicke in die Prozesse der Unternehmen. Für vertrauenswürdige Ergebnisse wird jedoch eine hohe Qualität der zu analysierenden Daten vorausgesetzt. Die vorliegende Arbeit befasst sich mit der Entwicklung eines Monitoring- und Klassifikationsverfahrens für Business Process Event-Streams zur Verwertung im Kontext des Online Process Mining. Zu den erarbeiteten Artefakten dieser Arbeit zählen ein auf den Bedarfen abzielender Anforderungskatalog, ein Konzept, das eine Streaming-Architektur, ein Klassifikationsmodell, eine rekonstruktionsbasierte Anomalieerkennung, einen Online Learning Workflow und Erklärungskomponenten umfasst sowie eine prototypische Umsetzung der Konzepte. Über technische Experimente auf Basis unterschiedlicher Datengrundlagen und optimierten Umgebungsparametern werden die Funktionsweise und Güte des erarbeiteten Monitoring- und Filterverfahrens überprüft. Durch die Einbettung des Event-Filters in eine Streaming-Architektur, die Kombination verschiedener Strukturen des maschinellen Lernens und der damit einhergehenden Generalisierungsfähigkeit des Modells sowie der Fähigkeit des Modells kontinuierlich zu Lernen gelingt es existierende Ansätze um Aspekte der echtzeitnahen Verarbeitung und dem Monitoring von Event-Streams zu erweitern und die Genauigkeit der Anomalieerkennung auf Event-Ebene zu verbessern. Durch Monitoring, Klassifikation und Filterung der eingehenden Event-Daten kann die Datenqualität für die Anwendung nachgelagerter Process Mining Aktivitäten erhöht werden
    corecore