    Guidelines For Pursuing and Revealing Data Abstractions

    Many data abstraction types, such as networks or set relationships, remain unfamiliar to data workers beyond the visualization research community. We conduct a survey and series of interviews about how people describe their data, either directly or indirectly. We refer to the latter as latent data abstractions. We conduct a Grounded Theory analysis that (1) interprets the extent to which latent data abstractions exist, (2) reveals the far-reaching effects that the interventionist pursuit of such abstractions can have on data workers, (3) describes why and when data workers may resist such explorations, and (4) suggests how to take advantage of opportunities and mitigate risks through transparency about visualization research perspectives and agendas. We then use the themes and codes discovered in the Grounded Theory analysis to develop guidelines for data abstraction in visualization projects. To continue the discussion, we make our dataset open along with a visual interface for further exploration

    Provenance analysis for sensemaking. IEEE Computer Graphics and Applications, 39 (6) . pp. 27-29. ISSN 0272-1716

    The articles in this special section examine the concept of "sensemaking", which refers to how we structure the unknown so as to be able to act in it. In the context of data analysis it involves understanding the data, generating hypotheses, selecting analysis methods, creating novel solutions, and critical thinking and learning wherever needed. Due to its explorative and creative nature, sensemaking is arguably the most challenging part of any data analysis

    Research directions in data wrangling: Visualizations and transformations for usable and credible data

    In spite of advances in technologies for working with data, analysts still spend an inordinate amount of time diagnosing data quality issues and manipulating data into a usable form. This process of ‘data wrangling’ often constitutes the most tedious and time-consuming aspect of analysis. Though data cleaning and integration arelongstanding issues in the database community, relatively little research has explored how interactive visualization can advance the state of the art. In this article, we review the challenges and opportunities associated with addressing data quality issues. We argue that analysts might more effectively wrangle data through new interactive systems that integrate data verification, transformation, and visualization. We identify a number of outstanding research questions, including how appropriate visual encodings can facilitate apprehension of missing data, discrepant values, and uncertainty; how interactive visualizations might facilitate data transform specification; and how recorded provenance and social interaction might enable wider reuse, verification, and modification of data transformations

    How Do Data Science Workers Communicate Intermediate Results?

    Data science workers increasingly collaborate on large-scale projects before communicating insights to a broader audience in the form of visualization. While prior work has modeled how data science teams, oftentimes with distinct roles and work processes, communicate knowledge to outside stakeholders, we have little knowledge of how data science workers communicate intermediately before delivering the final products. In this work, we contribute a nuanced description of the intermediate communication process within data science teams. By analyzing interview data with 8 self-identified data science workers, we characterized the data science intermediate communication process with four factors, including the types of audience, communication goals, shared artifacts, and mode of communication. We also identified overarching challenges in the current communication process. We also discussed design implications that might inform better tools that facilitate intermediate communication within data science teams.Comment: This paper was accepted for presentation as part of the eighth Symposium on Visualization in Data Science (VDS) at ACM KDD 2022 as well as IEEE VIS 2022. http://www.visualdatascience.org/2022/index.htm

    Capturing the silences in digital archaeological knowledge

    The availability and accessibility of digital data are increasingly significant in the creation of archaeological knowledge with, for example, multiple datasets being brought together to perform extensive analyses that would not otherwise be possible. However, this makes capturing the silences in those data—what is absent as well as present, what is unknown as well as what is known—a critical challenge for archaeology in terms of the suitability and appropriateness of data for subsequent reuse. This paper reverses the usual focus on knowledge and considers the role of ignorance—the lack of knowledge, or nonknowledge—in archaeological data and knowledge creation. Examining aspects of archaeological practice in the light of different dimensions of ignorance, it proposes ways in which the silences, the range of unknowns, can be addressed within a digital environment and the benefits which may accrue

    Entity-Based Insight Discovery in Visual Data Exploration

    Visual data exploration (VDE) allows the human to get insight into the data via interaction with visual depictions of that data. Despite the state-of-the-art visualization design models and evaluation methods proposed to support VDE, the community still lacks an understanding of interaction design in visualization and how users extract insight through interacting with the data. This research aims to address these two challenges. For interaction design, a literature review reveals that a lack of actionability hinders the application of existing visualization design methods. To address this challenge, this research proposes an approach abstracting data to entities and designing entity-based interactions to achieve the higher-level interaction goals. Three case studies, i.e., interacting with information facets to support fluid exploratory search, interacting with drug-target relations for insight discovery and sharing, and supporting insight externalization through references to visualization components, demonstrate the applicability of this approach in practice. The three cases detail how the approach could address the design requirements derived from related work to fulfill the various task goals following the nested model of visualization design and the resulting designs’ transferability to other datasets. Reflecting on the case studies, we provide design guidelines to help improve the entity-based interaction design. To understand the insight generation process of VDE, we present two user studies asking users to explore a visualization tool and externalize insights by inputting notes. We logged user interactions and characterized collected insights for correlation and prediction analysis. Correlation analysis of the first study showed that exploration actions tended to relate to unexpected insights; the drill-down interaction pattern could lead to insights with higher domain values. Besides asking users to input notes as insights, the second study enabled users to refer to relevant entities (visualization components and prior notes) to assist their narration. Results showed evidence that entity references provided better predictions than interactions on insight characteristics (category, overview versus detail, and using prior knowledge). We discuss study limitations and results’ implications on knowledge-assisted visualization, such as supporting insight recommendations.Visuaalinen datan tutkiminen antaa ihmiselle mahdollisuuden löytää uutta tietämystä datasta vuorovaikutuksessa tästä datasta tehtyjen visuaalisten kuvausten kanssa. Vaikka visuaalista datan tutkimista tukemaan on ehdotettu erilaisia visualisoinnin suunnittelumalleja ja arviointimenetelmiä, alan yhteisöltä puuttuu silti ymmärrystä siitä, kuinka visualisointiin liittyvää vuorovaikutusta pitäisi suunnitella ja kuinka käyttäjät voivat suodattaa uutta tietämystä olemalla vuorovaikutuksessa datan kanssa. Tässä työssä pyritään vastaamaan näihin kahteen haasteeseen. Kirjallisuuden mukaan olemassa olevien visualisoinnin suunnittelumenetelmien soveltamista vuorovaikutuksen suunnitteluun estää niiden toimivuuden puute. Tähän haasteeseen vastaamiseksi tässä työssä ehdotetaan korkeamman tason vuorovaikutustavoitteiden saavuttamiseksi lähestymistapaa, jossa data abstrahoidaan kokonaisuuksiksi eli entiteeteiksi ja jossa vuorovaikutus suunnitellaan sitten näihin entiteetteihin pohjautuen. Tämän lähestymistavan soveltuvuutta käytäntöön esitellään kolmen eri tapaustutkimuksen kautta. Nämä kolme tapaustutkimusta liittyvät erilaisiin tietoluokkiin liittyvän vuorovaikutuksen hyödyntämiseen sujuvassa tutkivassa tiedonhaussa, lääkkeiden ja niiden vaikutuskohteiden välisiin suhteisiin kohdistuvan vuorovaikutuksen hyödyntämiseen tietämyksen etsimisessä ja jakamisessa sekä visuaalisiin komponentteihin liittyvien viitteiden hyödyntämiseen tietämyksen ulkoistamisen tukemisessa. Tapaustutkimukset osoittavat, kuinka lähestymistavassa voidaan hyödyntää aiemmasta tutkimuksesta johdettuja suunnitteluvaatimuksia ja täyttää erilaiset tehtävätavoitteet noudattamalla visualisoinnin suunnittelun sisäkkäismallia ja tuloksena syntyneiden suunnitelmien siirrettävyyttä muihin datajoukkoihin. Näiden tapaustutkimusten pohjalta esitämme suunnitteluohjeita, jotka auttavat parantamaan entiteettipohjaista vuorovaikutuksen suunnittelua. Jotta voisimme ymmärtää tietämyksen luontiprosessia visuaalisen datan tutkimisessa, esittelemme kaksi käyttäjätutkimusta, joissa käyttäjiä pyydettiin käyttämään annettua visualisointityökalua ja tekemään muistiinpanoja löytämästään tietämyksestä. Käyttäjien toiminnot talletettiin, ja heidän keräämäänsä tietämystä kuvailtiin korrelaatio- ja ennusteanalyysiä varten. Ensimmäisen tutkimuksen korrelaatioanalyysi osoitti, että käyttäjien tutkimistoiminnot liittyivät useimmiten odottamattoman tietämyksen löytämiseen; porautuva vuorovaikutustapa saattoi johtaa korkeamman tason tietämyksen löytämiseen. Sen lisäksi, että käyttäjiä pyydettiin tekemään muistiinpanoja löydetystä tietämyksestä, toisessa tutkimuksessa käyttäjät pystyivät myös viittaamaan asiaankuuluviin entiteetteihin (visualisointikomponentteihin ja aiempiin muistiinpanoihin) ja näin helpottamaan toiminnastaan kertomista. Tulokset osoittivat, että entiteettiviittaukset johtivat parempiin ennustuksiin kuin vuorovaikutus, joka liittyi pelkästään tietämyksen ominaisuuksiin (luokka, yleiskuva vs. yksityiskohdat sekä aiemman tietämyksen käyttö). Työssä pohditaan myös tutkimusten rajoituksia sekä tutkimustulosten vaikutusta tietämykseen pohjautuvaan visualisointiin, kuten esimerkiksi tietämyssuositusten tukemiseen

    Undoing seamlessness : exploring seams for critical visualization

    Get PDF
    While seamful design has been part of discourses and work within HCI contexts for some time, it has not yet been fully explored in data visualization design. At the same time, critics of visualization have been arguing that the representation of data as contextual, contingent, relational, partial, heterogeneous, and situated is currently lacking in visualization. Seamful visualization promises a fresh perspective on visualization design as we seek to find more expressive encodings and novel approaches to representing data that acknowledge their wider qualities and limitations. By consulting seams in other realms and exploring existing seams and seamfulness in visualization, this paper offers a foundation for conceptualizing seamful visualization, points towards the value of seams and seamfulness in critical visualization, and proposes principles for engaging with seamful visualization in practice and research