3 research outputs found
Mining Rooted Ordered Trees under Subtree Homeomorphism
Mining frequent tree patterns has many applications in different areas such
as XML data, bioinformatics and World Wide Web. The crucial step in frequent
pattern mining is frequency counting, which involves a matching operator to
find occurrences (instances) of a tree pattern in a given collection of trees.
A widely used matching operator for tree-structured data is subtree
homeomorphism, where an edge in the tree pattern is mapped onto an
ancestor-descendant relationship in the given tree. Tree patterns that are
frequent under subtree homeomorphism are usually called embedded patterns. In
this paper, we present an efficient algorithm for subtree homeomorphism with
application to frequent pattern mining. We propose a compact data-structure,
called occ, which stores only information about the rightmost paths of
occurrences and hence can encode and represent several occurrences of a tree
pattern. We then define efficient join operations on the occ data-structure,
which help us count occurrences of tree patterns according to occurrences of
their proper subtrees. Based on the proposed subtree homeomorphism method, we
develop an effective pattern mining algorithm, called TPMiner. We evaluate the
efficiency of TPMiner on several real-world and synthetic datasets. Our
extensive experiments confirm that TPMiner always outperforms well-known
existing algorithms, and in several cases the improvement with respect to
existing algorithms is significant.Comment: This paper is accepted in the Data Mining and Knowledge Discovery
journal
(http://www.springer.com/computer/database+management+%26+information+retrieval/journal/10618
Agenda-driven case management
Im Gegensatz zu Routinetätigkeiten lassen sich wissensintensive Geschäftsprozesse – also Prozesse mit einem hohen Anteil an wissensintensiven Tätigkeiten, die von sogenannten Wissensarbeitern durchgeführt werden – nur schwer durch IT unterstützen. Das liegt vor allem daran, dass über den konkreten Lösungsweg und die dafür benötigten Daten nichts oder nur wenig im Vorfeld bekannt ist. Zwei wesentliche Ursachen hierfür sind, dass erstens der Ablauf von sehr vielen Parametern abhängig ist und dass zweitens diese Parameter sich auch über die Zeit verändern können. Solche Prozesse lassen sich unter anderem bei Trägern von Sozialleistungen oder in der privaten Versicherungswirtschaft beobachten. Dort steuern als Case Manager bezeichnete Wissensarbeiter komplizierte Leistungsfälle und koordinieren erforderliche Maßnahmen so, dass die Leistungen wirtschaftlich und bedarfsgerecht erbracht werden. Case Manager sind aufgrund ihrer Erfahrung, ihres breitgefächerten Fachwissens und der starken Vernetzung mit anderen Experten in der Lage, die wesentlichen Parameter der Prozesse zu erkennen, deren Veränderung stets nachzuverfolgen und den Ablauf entsprechend anzupassen.
Wie in der Dissertation gezeigt wird, können wissensintensive Prozesse nicht mit den herkömmlichen Methoden des Process Mining analysiert und mit Workflow-Managementsystemen unterstützt werden. Deshalb werden neue Konzepte und alternative Ansätze vorgestellt und erprobt, um solche Prozesse analysierbar zu machen und Case Manager bei deren Ausführung zu unterstützen. Die zentralen Beiträge der Dissertation sind ein Metamodell mit den adCM-Grundkonzepten, ein Konzept zur anwendungsübergreifenden Protokollierung der Aktivitäten eines Case Managers unter Berücksichtigung des Metamodells (Monitoring), eine Methode zur Messung von Ereignisprotokollkomplexität, eine Methode zur Erhebung von Wissen über den Prozess auf Grundlage der Ereignisprotokolle (Discovery) und eine Werkzeugarchitektur zur operativen Unterstützung von Wissensarbeitern, um das Wissen über den Prozess kontextbezogen bereitzustellen
Efficiently mining unordered trees
Frequent tree patterns have many applications in different domains such as XML document mining, user web log analysis, network routing and bioinformatics. In this paper, we first introduce three new tree encodings and accordingly present an efficient algorithm for finding frequent patterns from rooted unordered trees with the assumption that children of every node in database trees are identically labeled. Then, we generalize the method and propose the UITree algorithm to find frequent patterns from rooted unordered trees without any restriction.
Compared to other algorithms in the literature, UItree manages occurrences of a candidate tree in database trees more efficiently.
Our extensive experiments on both real and synthetic datasets show that UITree significantly outperforms the most efficient existing works on mining unordered trees.status: publishe