Accelerating materials discovery through text mining and machine learning

Abstract

Diese Arbeit beschreibt einen datengesteuerten Ansatz zur Beschleunigung der Materialentdeckung durch Extraktion von Wissen aus wissenschaftlicher open-access Literatur. Gezeigt wird, dass Worteinbettungen, basierend auf Abstract-Korpora und ergänzt durch experimentelle Daten, eine solide Grundlage für die Vorhersage von Materialeigenschaften bieten. Im Fokus steht MatNexus, ein Werkzeug zur Sammlung, Verarbeitung und Vektorisierung von Abstracts. Diese Einbettungen ermöglichen Ähnlichkeitssuchen, Clusteranalysen und prädiktive Modellierung. Die Methode wird auf die Vorhersage neuer Elektrokatalysatoren angewendet. Modelle, die auf Worteinbettungen trainiert werden, übertreffen solche mit rein elementaren Zusammensetzungen. Ein zentrales Ergebnis ist die Pareto-Front-Analyse zur Identifikation vielversprechender Zusammensetzungen auf Basis von Textdaten. Eine strategische Korpusauswahl verbessert die Vorhersage weiter bei reduziertem Rechenaufwand

Similar works

Full text

thumbnail-image

Dokumentenrepositorium der RUB / RUB-Repository

redirect
Last time updated on 25/09/2025

Having an issue?

Is data on this page outdated, violates copyrights or anything else? Report the problem now and we will take corresponding actions after reviewing your request.

Licence: info:eu-repo/semantics/openAccess