201 research outputs found
Data Science Tools zur Anaylse des globalen Repository-Netzwerks
Der Vortrag skizziert technischen Möglichkeiten, das globale Publikationsnetzwerk und seine Entwicklung zu analysieren und zu beschreiben. Seit 2004 fallen zahlreiche Metadaten im BASE-Umfeld an: insbesondere Publikationsmetadaten, Metadaten zu den Quellen, Indexdaten und damit verbunden Informationen, die zu den Quellen die Verteilung bei Publikationsstyp, Publikationsdatum, Sprache des Dokuments, OA Status und Lizenzinformationen liefern. Skizziert wird das Konzept eines Monitoring-Systems inklusive des Datenflusses und der zu implementierenden Schnittstelle. An einigen konkreten Beispielen wird prototypisch gezeigt, wie mit geeigneten Tools eine visuelle Umsetzung implementiert wurde und erweitert erden kann
Die Verwendung von Autorenidentifikatoren in wissenschaftlichen Repositorien : Ansätze, konkrete Umsetzungen und Herausforderungen
Summann F. Die Verwendung von Autorenidentifikatoren in wissenschaftlichen Repositorien : Ansätze, konkrete Umsetzungen und Herausforderungen. Presented at the 105. Deutscher Bibliothekartag in Leipzig 2016 = 6. Bibliothekskongress, Leipzig.Um eine Analyse der globalen Verwendung von Autoren-Identifikatoren in der Repository-Landschaft durchzuführen, wurde auf Basis der BASE-Infrastruktur der UB Bielefeld mit Hilfe von Email-Anfragen unter Vertretern der globalen Repository-Community und skript-basierter Metadaten-Analyse (auf OAI-PMH-Basis) eine breit angelegte Untersuchung durchgeführt. Mittlerweile ist die Integration von ORCID-Identifiern in den technischen Implementierungen vorbereitet und man kann sie auf verschiedenen Ebenen (Datenbankstruktur, Import, Benutzeroberfläche, Schnittstellen) in der Praxis zunehmend nachweisen. Auch wenn die Umsetzung noch nicht flächendeckend erfolgt, werden entsprechende Implementierungen zunehmend eingesetzt. Vergleichsweise große ORCID-Zahlen finden sich bei DataCite und Europe PMC, bei den Repository-Systemen fallen DIVA aus Schweden und OJS durch zahlreiche Installationen mit ORCID-Nachweisen auf. Auch einzelne DSpace-, Fedora-, Invenio-Repositorien und Lösungen wie Librecat (Univ. Bielefeld) und Brocade (Univ. Antwerpen) bedienen bereits durchgängig alle Ebenen und bei fast allen alternativen Plattformen (EPrints, Opus, Digital Commons) sind Teilbereiche realisiert
Digitale Sammlungen und DINI-Zertifikat
Summann F. Digitale Sammlungen und DINI-Zertifikat. Presented at the KIM WS 2014, Universität Mannheim
Aktuelle Entwicklungen im globalen Repository und Open-Access-Netzwerk: Relevante Themenbereiche aus der technischen Sicht eines Service Providers
Summann F. Aktuelle Entwicklungen im globalen Repository und Open-Access-Netzwerk: Relevante Themenbereiche aus der technischen Sicht eines Service Providers. Presented at the Open-Access-Tage 2017, Dresden.In jüngster Zeit zeichnen sich in der globalen Open Access Netzwerk-Diskussion einige zentrale Themen ab.
Mit ResourceSync existiert ein ernstzunehmender Versuch, das in die Jahre gekommene OAI-PMH perspektivisch abzulösen. OAI-PMH stößt insbesondere bei steigenden Metadatenmengen sowie bei komplexeren Anforderungen an Metadatenformate an seine Grenzen. Zunehmend rücken deshalb APIs der Verlage und von Crossref in den Fokus.
Des Weiteren wurden in jüngster Vergangenheit Vokabularien (z.B. zu Publikationstyp, Open-Access-Status, Lizenzinformation) veröffentlicht bzw. angekündigt. Zwar hat die Vergangenheit gezeigt, dass Standardisierungsbemühungen im Repository-Umfeld einige Zeit brauchen, dennoch sind die jetzt vorgelegten Definitionen von globaler Reichweite und von nicht zu überschätzendem Einfluss auf die zukünftige Metadatenqualität. Dazu gehört auch die wachsende Relevanz von Identifiern für Personen (ORCID), Publikationen (DOIs) und Institutionen, die von verschiedenen Systemen erfasst und weiter gegeben werden.
Bezogen auf den Content wird die zunehmende Bedeutung von Forschungsdaten-Repositories sichtbar, die mit teilweise ähnlichen Strukturen wie publikationsdatenbezogene Repositories Dokumente und Metadaten ausliefern. Ebenso gibt es erste Ansätze, den Nachweis von artikelbezogenen Zahlungen von Open-Access-Publikationsgebühren in ein Repository zu integrieren und diese Daten Harvestern aus dem Open-APC-Kontext zur Verfügung zu stellen.
Die Universitätsbibliothek Bielefeld arbeitet in verschiedenen nationalen und internationalen Projekten mit, bei denen die oben genannten Themen in vielfältiger Weise auftauchen. Gleichzeitig verfügt sie als Service Provider über zahlreiche Informationen zu den Strukturen und ihren Veränderungen. Der Vortrag stellt den aktuellen Diskussionsstand vor und ein Netzwerk-Analyse-Tool, das die oben skizzierten Entwicklungen empirisch nachvollziehbar und transparent darstellt
BASE und Forschungsdaten
BASE indexiert alle Arten von wissenschaftlichen Publikationen und Objekten und dazu gehörten von Anfang auch Forschungsdaten. In den letzten Jahren werden verstärkt technische Systeme oder Teilmodule eingeführt, die sich insbesondere der Bereitstellung von Forschungsdaten widmen. Der Vortrag beschreibt die Rolle von Forschungsdaten in der globalen Open Science Landschaft, wie sie aus BASE-Sicht nachgewiesen und analysiert werden kann
Aggregation verteilter Online-Server mit strukturierten Metadaten; am Beispiel von BASE und DRIVER
Das OAI-PMH-Protocol (Open Archives Initiative – Protocol for Metadata Harvesting) zeichnet sich durch Einfachheit, Robustheit und viele Freiheiten und Unschärfen aus. Die für BASE an der UB-Bielefeld geschaffene Harvesting-Umgebung ist Perl-basiert, läuft unter Shellskripten, die mit Konfigurationsdateien überwiegend durch cronjob gesteuertes periodisches Harvesten vornehmen. Die Aggregation (Filterung, Qualitätsverbesserung) der geholten Metadaten erfolgt bei BASE im Pre-Processing im FAST-Kontext. Für BASE sind inzwischen mehr als 2000 OAI-Repositories prozessiert worden; aktiviert davon sind knapp 1400 mit knapp 22 Mill. Dokumenten. Zur Ermittlung neuer Schnittstellen werden vor allem automatisch unterstützt die bekannten OAI-Registries analysiert. Dazu kommen die Beobachtung von anderen OAI-Service-Providern und Auflistungen (solche liegen bezogen auf Land, Communities, Disziplinen vor) und persönliche Kontakte. Die Aggregation der zusammengetragenen Daten erfolgt zur Korrektur von Fehlern, zur Normalisierung von Feldinhalten (insbes. language, type, date) und zur Extraktion von spezifischer Information (DDC-Klassifikation-Codes). Im DRIVER-Kontext sind auf Basis der BASE-Technologie und Erfahrungen das Modul Harvesting/Aggregating von der UB Bielefeld entwickelt worden, das mit den ebenfalls in Bielefeld entwickelten Modulen MDStore (zur Speicherung der originalen und aggregierten Metadaten) und Index das Rückgrat des Datenprocessing bildet. Bei DRIVER wurden bisher mit dieser Technik knapp 250 Repositories mit vergleichsweise hohem Qualitätslevel bearbeitet und integriert. Die aus der OAI-Praxis abgeleiteten OAI-PMH-Empfehlungen und -Anforderungen wurden unter Beteiligung der UB Bielefeld in den DRIVER Guidelines zusammengestellt
- …