1 research outputs found

    A causal model to explain data reuse in science: a study in health disciplines

    Full text link
    [EN] Investments in data infrastructures, data management, data repositories, and Open Data sharing policies and recommendations are viewed as increasingly important for scientific knowledge production. One of the underlying assumptions justifying these investments is that the more available Open Data becomes, then the greater the possibilities for creating new knowledge that can advance both science and human wellbeing. Yet efforts and investments in Open Data and other ways of data sharing only have value if data are actually reused. Recent scholarly efforts have brought forth some of the challenges and facilitators related to the reuse of data, in order to inform current and future policies and investments. However, despite these efforts, we still do not know why and how some researchers are successful in reusing data, despite the challenges they face, and why some researchers abandon the process of reusing data when facing such challenges. This dissertation aims to fill this gap by focusing on a causal explanation of the data reuse process, which it understands as being nested in broader patterns of researchers' motivations, scientific goals and decision-making strategies. The dissertation is comprised of three main elements. First, it proposes a heuristic model of the scientific actor, the bounded individual horizon (BIH) model, which understands that, on the one hand, researchers' work and careers are structured by their motivation to produce scientific contributions and rewards systems that prioritizes certain types of contributions. On the other hand, researchers' struggles to achieve their objective of creating new findings that accrue recognition and rewards occur within a frame of limited information and resources, conditioned by multiple institutional, social, and other factors. Second, the study proposes a mechanistic causal theoretical explanation that enables us to understand the data reuse process and its effects (outcomes). The data-reuse mechanism as it is called, enables us to understand how the satisficing behavior that characterizes scientific decision-making applies to the specific conditions and processes of data reuse. Third, a set of ten empirical case studies of data reuse in health research were conducted and are reported in the dissertation. These cases are analyzed and interpreted using the complementary theoretical lenses of the bounded individual horizon and the data-reuse mechanism approaches. The main findings explain that there is an apparent association between the extent and types of efforts required to reuse data, researchers' contextualized motivations, and broader goal-setting and decision-making frames. Access to data is a necessary condition for the reuse of data, yet is not sufficient for the reuse to happen. Characteristics of available data, including the context of their production, the extent of the preparation and stewarding of these data and their potential value in relation to researchers' motivations to make new scientific claims or generate background knowledge are found to be essential elements for understanding why some data reuse processes persist and succeed, while others do not. The thesis concludes that efforts and investments designed to reap the benefits of data reuse should also be expanded to include training researchers in data reuse, including to efficiently recognize opportunities, navigate the challenges of the reuse process, and be aware of and acknowledge the limitations of the use of secondary data. Without such investments, the promises and expectations linked to emerging data infrastructures, data repositories, data management guidelines and open science practices are argued to be far less likely to reach their full potential.[ES] Las inversiones en infraestructuras de datos, gesti贸n de datos, repositorios de datos y pol铆ticas y recomendaciones de intercambio de Datos Abiertos (Open Data) se consideran cada vez m谩s importantes para la producci贸n del conocimiento cient铆fico. Una de las razones que justifica estas inversiones es que cuanto m谩s Datos Abiertos haya, mayores ser谩n las posibilidades de crear nuevo conocimiento que pueda hacer avanzar tanto la ciencia como el bienestar humano. Sin embargo, los esfuerzos y la inversi贸n en Datos Abiertos y otras formas de compartirlos s贸lo tienen valor si se reutilizan realmente. Recientes trabajos acad茅micos han puesto de manifiesto algunos de los retos y factores facilitadores relacionados con la reutilizaci贸n de los datos, a fin de asesorar las pol铆ticas e inversiones actuales y futuras. Sin embargo, a pesar de esos esfuerzos, todav铆a desconocemos por qu茅 y c贸mo algunos/as investigadores/as logran reutilizar los datos, a pesar de los retos a los que enfrentan, y por qu茅 otros/as investigadores/as abandonan el proceso de reutilizaci贸n de los datos. La presente tesis tiene por objeto llenar este vac铆o centr谩ndose en una explicaci贸n causal del proceso de reutilizaci贸n de los datos, que se entiende est谩 inmersa en pautas de conducta m谩s amplias que se relacionan con las motivaciones, los objetivos cient铆ficos y las estrategias de toma de decisiones de los/as investigadores/as. Este estudio consta de tres elementos principales. En primer lugar, propone un modelo heur铆stico del actor cient铆fico, el modelo del horizonte individual delimitado (BIH por su nombre en ingl茅s, bounded individual horizon). En 茅l se entiende que, por una parte, el trabajo y la carrera de los/as investigadores/as se estructuran en funci贸n de su motivaci贸n para producir contribuciones cient铆ficas y de los sistemas de recompensa que dan prioridad a determinados tipos de contribuciones. Por otra parte, los esfuerzos de los/as investigadores/as para lograr su objetivo de crear nuevos hallazgos que acumulen reconocimiento y recompensas se producen en un marco de informaci贸n y recursos limitados, condicionados por m煤ltiples factores institucionales, sociales y de otra 铆ndole. En segundo lugar, esta tesis propone una explicaci贸n te贸rica causal mecanicista que permite comprender el proceso de reutilizaci贸n de los datos y sus efectos (resultados). El mecanismo de reutilizaci贸n de datos (datareuse mechanism), como se denomina, nos permite comprender c贸mo la toma de decisiones cient铆ficas est谩 caracterizada por una conducta que tiende a satisfacer esos objetivos en unas condiciones y procesos espec铆ficos de reutilizaci贸n de datos. En tercer lugar, este estudio incluye los resultados del estudio emp铆rico de diez estudios de casos de reutilizaci贸n de datos en ciencias de la salud. Estos casos se han analizado e interpretado utilizando el modelo te贸rico del horizonte individual delimitado y los enfoques del mecanismo de reutilizaci贸n de datos. Los resultados principales explican que existe una aparente asociaci贸n entre el alcance el alcance y tipo de esfuerzo requerido para reutilizar datos, las motivaciones contextualizadas de los/as investigadores/as y marcos m谩s amplios de fijaci贸n de objetivos y toma de decisiones. El acceso a los datos es una condici贸n necesaria para su reutilizaci贸n, pero no es suficiente para que 茅sta se produzca. Para comprender por qu茅 algunos procesos de reutilizaci贸n de datos persisten y tienen 茅xito, mientras que otros no,son elementos esenciales: las caracter铆sticas de los datos disponibles, incluido el contexto de su producci贸n; el grado de preparaci贸n y administraci贸n de esos datos; y su potencial valor en relaci贸n con las motivaciones de los investigadores para hacer nuevas afirmaciones cient铆ficas o generar conocimientos de base. Este estudio concluye que los esfuerzos e inversiones destinados a aprovechar los beneficios de la reutilizaci贸n de los datos tambi茅n deber铆an ampliarse para incluir la capacitaci贸n de los/as investigadores/as en materia de reutilizaci贸n de datos. En particular, debe insistirse en la capacidad para reconocer eficientemente las oportunidades, sortear los problemas del proceso de reutilizaci贸n y ser conscientes y reconocer las limitaciones de la utilizaci贸n de datos secundarios. Sin estas inversiones, las promesas y expectativas vinculadas a las emergentes infraestructuras de datos, los repositorios de datos, las directrices de gesti贸n de datos y las pr谩cticas cient铆ficas abiertas tienen muchas menos probabilidades de alcanzar su pleno potencial.[CA] Les inversions en infraestructures de dades, gesti贸 de dades, repositoris de dades i pol铆tiques i recomanacions d'intercanvi de Dades Obertes (Open Data) es consideren cada vegada m茅s importants per a la producci贸 del coneixement cient铆fic. Un dels sup貌sits subjacents que justifiquen aquestes inversions 茅s que com m茅s disponibles siguen les Dades Obertes, majors seran les possibilitats de crear nou coneixement que pugui fer avan莽ar tant la ci猫ncia com el benestar hum脿. No obstant aix貌, els esfor莽os i les inversions en les Dades Obertes i altres maneres de compartir dades nom茅s tenen valor si les dades es reutilitzen realment. Recents investigacions acad猫mics han posat de manifest alguns dels reptes i dels factors facilitadors relacionats amb la reutilitzaci贸 de les dades, a fi d'informar les pol铆tiques i inversions actuals i futures. No obstant aix貌, encara desconeixem per qu猫 i com alguns/es investigador(e)s aconsegueixen reutilitzar les dades, malgrat els reptes als quals s鈥檈nfronten, i per qu猫 altres investigador(e)s abandonen el proc茅s de reutilitzaci贸 de les dades quan s'enfronten a aquests reptes. La present tesi t茅 com a objectiu omplir aquest buit centrant-se en una explicaci贸 causal del proc茅s de reutilitzaci贸 de dades, que s'ent茅n que est脿 associada amb pautes m茅s 脿mplies derivades de les motivacions, els objectius cient铆fics i les estrat猫gies de presa de decisions d鈥檈ls/les investigador(e)s. La tesi consta de tres elements principals. En primer lloc, proposa un model heur铆stic de l'actor cient铆fic, el model de l'horitz贸 individual delimitat (BIH pel nom angl猫s, bounded individual horizon), que ent茅n que, d'una banda, el treball i la carrera d鈥檈ls/les investigador(e)s s'estructuren en funci贸 de la seua motivaci贸 per a produir contribucions cient铆fiques i dels sistemes de recompensa que prioritzen determinats tipus de contribucions. D'altra banda, els esfor莽os d鈥檈ls/les investigador(e)s per aconseguir el seu objectiu d鈥檕btenir nous resultats que acumulin reconeixement i recompenses es produeixen en un marc d'informaci贸 i recursos limitats, condicionats per m煤ltiples factors institucionals, socials i d'altra 铆ndole. En segon lloc, aquesta tesi proposa una explicaci贸 te貌rica causal mecanicista que permet comprendre el proc茅s de reutilitzaci贸 de les dades i els seus efectes (resultats). El mecanisme de reutilitzaci贸 de dades (data-reuse mechanism), com es denomina, ens permet comprendre com el comportament satisfactori que caracteritza la presa de decisions cient铆fiques s'aplica a les condicions i processos espec铆fics de reutilitzaci贸 de dades. En tercer lloc, aquesta tesi inclou l'estudi emp铆ric d'un conjunt de deu estudis de casos de reutilitzaci贸 de dades en ci猫ncies de la salut, aix铆 com tamb茅 els resultats d鈥檃quest estudi.. Aquests casos s'han analitzat i interpretat utilitzant les lents te貌riques complement脿ries de l'horitz贸 individual delimitat i els enfocaments del mecanisme de reutilitzaci贸 de dades. Les principals conclusions expliquen que existeix una aparent associaci贸 entre l'abast i els tipus d'esfor莽os necessaris per a reutilitzar dades, les motivacions contextualitzades d鈥檈ls/les investigador(e)s i els marcs m茅s amplis de fixaci贸 d'objectius i presa de decisions. L'acc茅s a les dades 茅s una condici贸 necess脿ria per a la seua reutilitzaci贸, per貌 no 茅s suficient perqu猫 aquesta es produeixi. Es considera que les caracter铆stiques de les dades disponibles, incl貌s el context de la seua producci贸, el grau de preparaci贸 i administraci贸 d'aquestes dades i el seu potencial valor en relaci贸 amb les motivacions d鈥檈ls/les investigador(e)s per a fer noves afirmacions cient铆fiques o generar coneixements de base, s贸n elements essencials per a comprendre per qu猫 alguns processos de reutilitzaci贸 de dades persisteixen i tenen 猫xit, mentre que uns altres no. Aquest estudi conclou que els esfor莽os i inversions destinats a aprofitar els beneficis de la reutilitzaci贸 de dades tamb茅 haurien d'ampliar-se per a incloure la capacitaci贸 d鈥檈ls/les investigador(e)s en mat猫ria de reutilitzaci贸 de dades, en particular per a recon猫ixer eficientment les oportunitats, superar els problemes del proc茅s de reutilitzaci贸 i ser conscients i recon猫ixer les limitacions de la reutilitzaci贸 de dades secund脿ries. Sense aquests esfor莽os i inversions, les promeses i expectatives vinculades a les infraestructures, repositoris i directrius de gesti贸 de dades i les pr脿ctiques cient铆fiques obertes tenen moltes menys probabilitats d'aconseguir el seu ple potencial.Aleixos Borr谩s, MI. (2020). A causal model to explain data reuse in science: a study in health disciplines [Tesis doctoral no publicada]. Universitat Polit猫cnica de Val猫ncia. https://doi.org/10.4995/Thesis/10251/153164TESI
    corecore