57 research outputs found

    Today's Data are Part of Tomorrow's Research: Archival Issues in the Sciences

    No full text
    Scientific data are essential for training in science and informed decision-making regarding health, the environment, and the economy. Cumulative data sets assist with understanding trends, frequencies and patterns, and can form a baseline upon which we can develop predictions. This paper discusses the preservation of scientific data, providing an overview of the characteristics of scientific data and scientific-data portals from a variety of fields, with a focus on data quality, particularly accuracy, reliability and authenticity, and how these are captured in metadata. These concepts are broadly defined from both scientific and archival perspectives. Based on an extensive literature review of publications from national and international scientific organizations, government and research funding bodies, and empirical evidence from a selection of InterPARES 2 Case Studies and General Study 10, which investigated thirty-two scientificdata portals, the paper includes a brief examination of machine-base “knowledge representation” (KR) and the potential implications for the preservation of scientific data, with a particular focus on formal ontologies. The paper also discusses the concept of record in the context of Web 2.0 environments, the paucity of scientific data archives, and the lack of funding priorities in this area. It is argued that archivists will have to work closely with scientific-data creators to understand their practices, that data portals are mechanisms that archivists can use to extend their preservation practices, and that it is not technology that is impeding progress regarding the preservation of scientific data; it is a lack of funding, policy, prioritizing, and vision allowing our scientific national resources to be lost. RÉSUMÉ Les donnĂ©es scientifiques sont essentielles Ă  la formation en sciences et Ă  la prise de dĂ©cision Ă©clairĂ©e au sujet de la santĂ©, de l’environnement et de l’économie. Les ensembles de donnĂ©es cumulatives aident Ă  comprendre les tendances, les frĂ©quences et les courants, et ils peuvent servir de base pour dĂ©velopper des prĂ©visions. Cet article se penche sur la prĂ©servation des donnĂ©es scientifiques et des portails de donnĂ©es scientifiques d’un ensemble de domaines, en ciblant la qualitĂ© des donnĂ©es – surtout l’exactitude, la fiabilitĂ© et l’authenticitĂ© – et en examinant comment ces caractĂ©ristiques sont saisies par les mĂ©tadonnĂ©es. Les auteurs donnent des dĂ©finitions gĂ©nĂ©rales de ces concepts, dans des perspectives Ă  la fois scientifiques et archivistiques. À partir d’une recension approfondie de la littĂ©rature sur le sujet (publications provenant d’organisations scientifiques nationales et internationales, d’organismes gouvernementaux et d’organismes de financement, ainsi que des observations empiriques d’un Ă©chantillon d’études de cas d’InterPARES 2 et de « General Study 10 » qui Ă©tudiaient 32 portails de donnĂ©es scientifiques), cet article examine sommairement la « reprĂ©sentation des connaissances » Ă©lectronique (« machine-base “knowledge representation” [KR] ») et les rĂ©percussions possibles sur la prĂ©servation des donnĂ©es scientifiques, avec un accent particulier sur les ontologies formelles. Il prĂ©sente aussi le concept de document dans le contexte d’un environnement Web 2.0, la raretĂ© des archives sur les donnĂ©es scientifiques, et le fait que ce domaine ne figure pas souvent dans les prioritĂ©s de financement. Les auteurs avancent que les archivistes devront travailler de prĂšs avec les scientifiques crĂ©ateurs de donnĂ©es afin de comprendre leurs pratiques; que les portails de donnĂ©es sont des mĂ©canismes dont les archivistes peuvent se servir pour parfaire leurs pratiques de prĂ©servation; et que ce n’est pas la technologie qui empĂȘche le progrĂšs en ce qui concerne les donnĂ©es scientifiques. C’est plutĂŽt le manque de ressources, de politiques, de classement par ordre de prioritĂ©s, et de vision qui occasionne la perte de nos ressources scientifiques nationales

    Today's Data are Part of Tomorrow's Research: Archival Issues in the Sciences

    No full text
    Scientific data are essential for training in science and informed decision-making regarding health, the environment, and the economy. Cumulative data sets assist with understanding trends, frequencies and patterns, and can form a baseline upon which we can develop predictions. This paper discusses the preservation of scientific data, providing an overview of the characteristics of scientific data and scientific-data portals from a variety of fields, with a focus on data quality, particularly accuracy, reliability and authenticity, and how these are captured in metadata. These concepts are broadly defined from both scientific and archival perspectives. Based on an extensive literature review of publications from national and international scientific organizations, government and research funding bodies, and empirical evidence from a selection of InterPARES 2 Case Studies and General Study 10, which investigated thirty-two scientificdata portals, the paper includes a brief examination of machine-base “knowledge representation” (KR) and the potential implications for the preservation of scientific data, with a particular focus on formal ontologies. The paper also discusses the concept of record in the context of Web 2.0 environments, the paucity of scientific data archives, and the lack of funding priorities in this area. It is argued that archivists will have to work closely with scientific-data creators to understand their practices, that data portals are mechanisms that archivists can use to extend their preservation practices, and that it is not technology that is impeding progress regarding the preservation of scientific data; it is a lack of funding, policy, prioritizing, and vision allowing our scientific national resources to be lost. RÉSUMÉ Les donnĂ©es scientifiques sont essentielles Ă  la formation en sciences et Ă  la prise de dĂ©cision Ă©clairĂ©e au sujet de la santĂ©, de l’environnement et de l’économie. Les ensembles de donnĂ©es cumulatives aident Ă  comprendre les tendances, les frĂ©quences et les courants, et ils peuvent servir de base pour dĂ©velopper des prĂ©visions. Cet article se penche sur la prĂ©servation des donnĂ©es scientifiques et des portails de donnĂ©es scientifiques d’un ensemble de domaines, en ciblant la qualitĂ© des donnĂ©es – surtout l’exactitude, la fiabilitĂ© et l’authenticitĂ© – et en examinant comment ces caractĂ©ristiques sont saisies par les mĂ©tadonnĂ©es. Les auteurs donnent des dĂ©finitions gĂ©nĂ©rales de ces concepts, dans des perspectives Ă  la fois scientifiques et archivistiques. À partir d’une recension approfondie de la littĂ©rature sur le sujet (publications provenant d’organisations scientifiques nationales et internationales, d’organismes gouvernementaux et d’organismes de financement, ainsi que des observations empiriques d’un Ă©chantillon d’études de cas d’InterPARES 2 et de « General Study 10 » qui Ă©tudiaient 32 portails de donnĂ©es scientifiques), cet article examine sommairement la « reprĂ©sentation des connaissances » Ă©lectronique (« machine-base “knowledge representation” [KR] ») et les rĂ©percussions possibles sur la prĂ©servation des donnĂ©es scientifiques, avec un accent particulier sur les ontologies formelles. Il prĂ©sente aussi le concept de document dans le contexte d’un environnement Web 2.0, la raretĂ© des archives sur les donnĂ©es scientifiques, et le fait que ce domaine ne figure pas souvent dans les prioritĂ©s de financement. Les auteurs avancent que les archivistes devront travailler de prĂšs avec les scientifiques crĂ©ateurs de donnĂ©es afin de comprendre leurs pratiques; que les portails de donnĂ©es sont des mĂ©canismes dont les archivistes peuvent se servir pour parfaire leurs pratiques de prĂ©servation; et que ce n’est pas la technologie qui empĂȘche le progrĂšs en ce qui concerne les donnĂ©es scientifiques. C’est plutĂŽt le manque de ressources, de politiques, de classement par ordre de prioritĂ©s, et de vision qui occasionne la perte de nos ressources scientifiques nationales

    Reproducible research in linguistics: A position statement on data citation and attribution in our field

    Get PDF
    This article is a position statement on reproducible research in linguistics, including data citation and attribution, that represents the collective views of some 41 colleagues
    • 

    corecore