Comparing and evaluating Data-driven Journalism: Data visualization performance from perspective of web analytics

Abstract

Data journalism is one of the hottest trends in journalism. Although the practice of using numbers to tell stories is not particularly new to newsrooms, the interaction present in data visualizations allows the active participation of the user, rarely possible before. The production of data-driven and interactive pieces increases every year, as well as the number of studies in the field. However, there is still a lack of research on user behavior in interactive news pieces. This gap can be explained in part by researchers’ difficulty in accessing real quantitative data from media outlets since such data are considered sensitive and strategic. In this thesis, we compare the performance of interactive data journalism pieces with the most read news articles, and with news stories of the same topic published in the same period as the interactive ones. This analysis is based on 90 pieces of data journalism pieces and on the access to Google Analytics, an online web analytics tool, from three media outlets from three different countries: The Texas Tribune (United States), O Globo (Brazil) and Público (Portugal). The investigation begins by recalling important moments in the use of data in journalism in the three analyzed countries. Then, we present a brief history of media audience measurement and the relationship of journalists with the public. We present the individual results of each media outlet analyzed and all together to try to identify patterns and trends in the consumption of interactive news pieces. Among the key findings of this research are: data journalism pieces continue to be visited years after publication in a much higher proportion than other news on the same topic; users spend more time on interactive news than on the most read articles and related news stories; the recirculation rate in data journalism pieces is higher than the rate in the related news; the bounce rate is higher in the data visualization than in the most read news articles and the related news stories.O jornalismo de dados é definitivamente uma das principais tendências do jornalismo atualmente. Apesar de a prática de usar dados para contar histórias não ser algo particularmente novo nas redações, o recurso da interação nas visualizações de dados permite uma participação ativa do usuário, como poucas vezes foi possível anteriormente. A produção de peças orientadas por dados e interativas aumenta a cada ano, assim como o número de estudos na área. Todavia, ainda há uma ausência de investigações sobre o comportamento do usuário em notícias interativas de jornalismo de dados. Essa lacuna pode ser explicada em parte pela dificuldade dos investigadores em aceder a dados quantitativos reais dos meios de comunicação social, uma vez que esses dados são considerados sensíveis e estratégicos. Nesta tese, comparamos o desempenho de notícias interativas de jornalismo de dados com as notícias mais lidas e com notícias do mesmo tópico publicadas no mesmo período em que as matérias interativas. Essa análise é realizada com base em 90 peças de jornalismo de dados e no acesso ao Google Analytics, ferramenta online de análise de métricas, de três veículos de comunicação de três países diferentes: The Texas Tribune (Estados Unidos), O Globo (Brasil) e Público (Portugal). A investigação começa por recontar momentos importantes do uso de dados no jornalismo nos três países analisados. Em seguida é realizado um breve histórico da mensuração da audiência nos meios de comunicação social e da relação dos jornalistas com o público. Apresentamos os resultados individuais de cada veículo de comunicação e em conjunto para tentar identificar padrões e tendências no consumo de notícias interativas de jornalismo de dados. Entre as principais descobertas dessa investigação estão: visualizações de dados seguem sendo visitadas anos após a publicação em uma proporção muito superior do que outras notícias do mesmo tópico; os usuários passam mais tempo nas visualizações interativas do que nas notícias mais lidas e nas notícias relacionadas; a taxa de “recirculation” nas peças de jornalismo de dados é superior à taxa das notícias relacionadas; a taxa de rejeição é maior nas matérias com visualização de dados do que nas notícias mais lidas e nas notícias relacionadas

    Similar works