    Image-Based Visualization of Classifier Decision Boundaries

    Understanding how a classifier partitions a high-dimensional input space and assigns labels to the parts is an important task in machine learning. Current methods for this task mainly use color-coded sample scatterplots, which do not explicitly show the actual decision boundaries or confusion zones. We propose an image-based technique to improve such visualizations. The method samples the 2D space of a dimensionality-reduction projection and color-code relevant classifier outputs, such as the majority class label, the confusion, and the sample density, to render a dense depiction of the high-dimensional decision boundaries. Our technique is simple to implement, handles any classifier, and has only two simple-to-control free parameters. We demonstrate our proposal on several real-world high-dimensional datasets, classifiers, and two different dimensionality reduction methods

    Visual Analytics Applied to Image Analysis:From Segmentation to Classification

    Image analysis is the field of study concerned with extracting information from images. This field is immensely important for commercial and scientific applications, from identifying people in photographs to recognizing diseases in medical images.The goal behind the work presented in this thesis is providing mechanisms that allow humans to assist machines in image analysis tasks that are difficult to fully automate: image segmentation, feature selection, and image classification.Image segmentation is the task of partitioning an image into objects of interest (e.g., identifying which pixels correspond to a person in an image). In this context, we propose a new technique that enables faster interactive segmentation and potentially richer feature extraction, which may lead to increased efficacy. Image classification is the task of assigning a class label to an image based on generalization from examples (e.g., given images of a person, recognizing other images of this person). The traditional solution involves first representing each image by features (measurable characteristics) related to colors, textures, and shapes. In this context, we propose a new interactive visualization system that aims to provide insights that lead to the development of effective feature sets for image classification.We also show how this system can be adapted to explore intermediary computational results of artificial neural networks, with the goal of enabling insights about how these networks operate, which again may lead to improvements along the image classification pipeline. This task also leads to the development of a new time-dependent visualization technique

    Explanatory visualization of multidimensional projections

    Het verkrijgen van inzicht in grote gegevensverzalelingen (tegenwoording bekend als ‘big data’) kan gedaan worden door ze visueel af te beelden en deze visualisaties vervolgens interactief exploreren. Toch kunnen beide het aantal datapunten of metingen, en ook het aantal dimensies die elke meting beschrijven, zeer groot zijn – zoals een table met veel rijen en kolommen. Het visualiseren van dergelijke zogenaamde hoog-dimensionale datasets is zeer uitdagend. Een manier om dit te doen is door het maken van een laag (twee of drie) dimensionale afbeelding, waarin men dan zoekt naar interessante datapatronen in plaats van deze te zoeken in de oorspronkelijke hoog-dimensionale data. Technieken die dit scenario ondersteunen, de zogenaamde projecties, hebben verschillende voordelen – ze zijn visueel schaalbaar, ze werken robuust met ruizige data, en ze zijn snel. Toch is het gebruik van projecties ernstig beperkt door het feit dat ze moeilijk te interpreteren zijn. We benaderen dit problem door verschillende technieken te ontwikkelen die de interpretative vergemakkelijken, zoals het weergeven van projectiefouten en het uitleggen van projecties door middel van de oorpronkelijke hoge dimensies. Onze technieken zijn makkelijk te leren, snel te rekenen, en makkelijk toe te voegen aan elke dataexploratiescenario dat gebruik maakt van elke projectie. We demonstreren onze oplossingen met verschillende toepassingen en data van metingen, wetenschappelijke simulaties, software-engineering, en netwerken

    14th SC@RUG 2017 proceedings 2016-2017

