thesis

Entwicklung einer Textminingmethode zur automatisierten Extraktion von kinetischen Informationen aus der Literatur

Abstract

Die Menge an verfügbaren biologischen Informationen ist über die letzten Jahre stetig angestiegen. Es ist daher essentiell, dass das enthaltene Wissen leicht zugänglich gemacht wird, wie z.B. in Datenbänken. Zum Erstellen solcher Datenbänke können Methoden zur automatischen Extraktion dieser Informationen verwendet werden. Eine pragmatische Methode zur Extraktion kinetischer Informationen aus ca. 17 Millionen Abstracts der PubMed unter Verwendung von Lexika wurde entwickelt. Es wurden Informationen zu KM, Ki, kcat, kcat/KM, Vmax, IC50, S0.5, Kd, Ka, t1/2, pI, Enzymnamen, EC Nummern, Liganden, Organismen, Lokalisationen, pH-Wert und Temperatur extrahiert. 509.153 kinetische Informationen konnten extrahiert werden, mit einer Precision von 55% bis zu 96% und einem Recall von 51% bis zu 84%. Die erhaltenen Informationen sind in der Datenbank "KID the KInetic Database" im Internet zugänglich

    Similar works