41 research outputs found

    Towards creative information exploration based on Koestler's concept of bisociation

    Get PDF
    Creative information exploration refers to a novel framework for exploring large volumes of heterogeneous information. In particular, creative information exploration seeks to discover new, surprising and valuable relationships in data that would not be revealed by conventional information retrieval, data mining and data analysis technologies. While our approach is inspired by work in the field of computational creativity, we are particularly interested in a model of creativity proposed by Arthur Koestler in the 1960s. Koestler’s model of creativity rests on the concept of bisociation. Bisociative thinking occurs when a problem, idea, event or situation is perceived simultaneously in two or more “matrices of thought” or domains. When two matrices of thought interact with each other, the result is either their fusion in a novel intellectual synthesis or their confrontation in a new aesthetic experience. This article discusses some of the foundational issues of computational creativity and bisociation in the context of creative information exploration

    Concept Detection in Information Networks

    No full text
    Konzepte spielen in unserem tĂ€glichen Leben eine wichtige Rolle, wenn auch nur unbewusst.So gruppieren Konzepte Objekte mit gemeinsamen Eigenschaften und ermöglichen uns das Abstrahieren und Kommunizieren von bestehendem Wissen sowie die Verarbeitung der pausenlos auf uns einströmenden Flut von Informationen.Dabei agiert ein Konzept als ReprĂ€sentant seiner Mitglieder und ihrer gemeinsamen Eigenschaften.Wenn wir an das Konzept der Transportmittel denken, fallen uns spontan einige Mitglieder und ihre Eigenschaften ein, die diese als Transportmittel auszeichnen.Eine weitere Besonderheit der Konzepte ist, dass ein Objekt Mitglied in scheinbar unabhĂ€ngigen Konzepten sein kann.So gilt ein Auto sowohl als Transportmittel als auch als Luxusgegenstand.Der in dieser Arbeit beschriebene Ansatz macht sich diese LeistungsfĂ€higkeit und FlexibilitĂ€t von Konzepten zunutze, um das kreative Denken zu fördern.So ermöglicht der Ansatz das Finden von existierenden sowie unbekannten Konzepten in heterogenen Daten, welche das VerstĂ€ndnis fĂŒr komplexe Systeme fördern sowie interessante und unerwartete ZusammenhĂ€nge aufdecken.Da bei der Suche nach unerwarteten ZusammenhĂ€ngen nicht von Anfang an feststeht, wonach man eigentlich sucht, sollte bei der Integration der zur VerfĂŒgung stehenden Daten möglichst keine Information verloren gehen.Daher basiert der beschriebene Ansatz auf Informationsnetzwerken, welche dank ihrer flexiblen Datenstruktur die Integration von Daten unterschiedlichster Beschaffenheit und QualitĂ€t unterstĂŒtzen.So speichern Informationsnetzwerke die Informationen in Form von Beziehungen zwischen Objekten in einer Graphstruktur, wobei Objekte als Knoten und ihre Beziehungen als Kanten im Graphen reprĂ€sentiert werden.Basierend auf dieser DatenreprĂ€sentation beruht der beschriebene Ansatz auf der Annahme, dass Objekte durch ihre direkten Nachbarn im Netzwerk beschrieben werden.Somit bilden Ă€hnliche Objekte und ihre gemeinsamen Nachbarn einen quasi bipartiten Graphen.Dieser aus den beiden Knotenpartitionen und ihren Verbindungen bestehende Teilgraph bildet die Basis des beschriebenen Ansatzes, den sogenannten Konzeptgraphen.Die GĂŒte der Verbindungen zwischen den beiden Knotenpartitionen wird mithilfe einer GĂŒtefunktion bestimmt, welche das Fehlen einzelner Verbindungen bestraft.Daher sollten sich die Ă€hnlichen Objekte möglichst viele Nachbarn teilen.Einen Spezialfall stellen dabei die vollstĂ€ndigen Konzeptgraphen dar, deren Knotenpartitionen vollstĂ€ndig verbunden sind.Zum Klassifizieren der Knoten eines Konzeptgraphen werden ferner Heuristiken basierend auf der Graphstruktur vorgestellt, welche die Identifizierung der Mitglieder und Eigenschaften eines Konzeptes sowie des KonzeptreprĂ€sentanten ermöglichen.Dabei ist der Typ eines Knotens kontextabhĂ€ngig und kann so in unterschiedlichen Konzeptgraphen variieren.Die Heuristik zur Bestimmung des KonzeptreprĂ€sentanten liefert darĂŒber hinaus ein Maß fĂŒr dessen GĂŒte, welches zum Auffinden eines fehlenden ReprĂ€sentanten verwendet werden kann.Ein fehlender KonzeptreprĂ€sentant kann dabei ein Anzeichen fĂŒr unvollstĂ€ndige und verrauschte Daten sein.Er kann aber auch ein Hinweis auf eine Gruppe von Objekten mit gemeinsamen Eigenschaften sein, die bisher noch nicht entdeckt wurden und daher noch keinen KonzeptreprĂ€sentanten besitzen.Neben der Formalisierung von Konzeptgraphen werden Verfahren zum Finden von vollstĂ€ndigen Konzeptgraphen sowie AnsĂ€tze zum Finden von allgemeinen Konzeptgraphen beschrieben.Die beschriebenen Verfahren und AnsĂ€tze basieren auf existierenden Verfahren zum Finden von Frequent Item Sets, welche sich durch die Konvertierung des Graphen in eine Transaktionsliste anwenden lassen.Fallstudien demonstrieren schließlich die Existenz sowie die FlexibilitĂ€t und VielfĂ€ltigkeit von Konzeptgraphen anhand von zwei unterschiedlichen DatensĂ€tzen aus der realen Welt.So basiert der erste Datensatz auf einer EnzyklopĂ€die mit Artikeln aus unterschiedlichen Wissensgebieten.Der zweite Datensatz basiert hingegen auf strukturierten sowie unstrukturierten Informationen ĂŒber Medikamente.In beiden DatensĂ€tzen werden sinnvolle Konzeptgraphen mithilfe des beschriebenen Verfahrens zum Finden von vollstĂ€ndigen Konzeptgraphen gefunden und ihre Knoten unter Verwendung der vorgestellten Heuristiken in die unterschiedlichen Typen eingeteilt.Basierend auf dem GĂŒtewert fĂŒr den KonzeptreprĂ€sentanten werden ferner Konzeptgraphen ohne sinnvollen ReprĂ€sentanten identifiziert, welche unbekannte ZusammenhĂ€nge aufdecken.Überlappende Konzeptgraphen demonstrieren schließlich die volle FlexibilitĂ€t und VielfĂ€ltigkeit von Konzeptgraphen.So können die Überlappungen sowohl zum Identifizieren von Hierarchien verwendet werden als auch zu einem besseren VerstĂ€ndnis komplexer ZusammenhĂ€nge fĂŒhren.DarĂŒber hinaus ermöglichen sie auch das Auffinden fehlender Verbindungen, die zu neuen Erkenntnissen fĂŒhren.Durch die Verwendung von Informationsnetzwerken als Eingabedaten und dem Auffinden von existierenden sowie unbekannten Konzepten unterstĂŒtzt das in dieser Arbeit vorgestellte Verfahren das kreative Denken, indem es sowohl das VerstĂ€ndnis komplexer Systeme fördert als auch interessante und unerwartete ZusammenhĂ€nge aufdeckt

    Mining fault-tolerant item sets using subset size occurrence distributions

    No full text
    Mining fault-tolerant (or approximate or fuzzy) item sets means to allow for errors in the underlying transaction data in the sense that actually present items may not be recorded due to noise or measurement errors. In order to cope with such missing items, transactions that do not contain all items of a given set are still allowed to support it. However, either the number of missing items must be limited, or the transaction's contribution to the item set's support is reduced in proportion to the number of missing items, or both. In this paper we present an algorithm that efficiently computes the subset size occurrence distribution of item sets, evaluates this distribution to find fault-tolerant item sets, and exploits intermediate data to remove pseudo (or spurious) item sets. We demonstrate the usefulness of our algorithm by applying it to a concept detection task on the 2008/2009 Wikipedia Selection for schools

    From Information Networks to Bisociative Information Networks

    No full text
    The integration of heterogeneous data from various domains without the need for prefiltering prepares the ground for bisociative knowledge discoveries where attempts are made to find unexpected relations across seemingly unrelated domains. Information networks, due to their flexible data structure, lend themselves perfectly to the integration of these heterogeneous data sources. This chapter provides an overview of different types of information networks and categorizes them by identifying several key properties of information units and relations which reflect the expressiveness and thus ability of an information network to model heterogeneous data from diverse domains. The chapter progresses by describing a new type of information network known as bisociative information networks. This kind of network combines the key properties of existing networks in order to provide the foundation for bisociative knowledge discoveries. Finally based on this data structure three different patterns are described that fulfill the requirements of a bisociation by connecting concepts from seemingly unrelated domains
    corecore