Informationsextraktion aus medizinischen Texten
Autoři
Více o knize
Während der Behandlung eines Patienten werden zahlreiche medizinische Dokumente erstellt (z. B. Entlassbriefe, Befundberichte). Diese müssen ausgewertet und verarbeitet werden. Eine manuelle Verarbeitung ist oftmals aufwändig, da die Dokumente überflüssige Informationen enthalten können und meist lang und zeitraubend zu lesen sind. Texttechnologische Verfahren werden dafür eingesetzt, automatisch relevante Daten aus freitextlichen Dokumenten zu extrahieren. Die vorliegende Arbeit beschäftigt sich mit der automatischen Verarbeitung natürlich-sprachiger medizinischer Dokumente. Es wird eine Methode vorgestellt, die medizinische Dokumente in semantische, maschinell auswertbare Strukturen überführt. Auf Basis dieser Strukturen können gezielt Informationen wie Angaben zu Diagnosen oder Medikationen extrahiert werden. Die Grundlage der Methoden bilden bereits existierende Technologien: eine bestehende medizinische Terminologie (ID Macs Nomenklatur) sowie ein Indexierungsalgorithmus zur Abbildung natürlicher Sprache auf Konzepte der Terminologie. Die entwickelten Methoden können die Basis für weitere Anwendungen bilden, z. B. für Anwendungen der Datenrecherche und des Information Retrievals, zur automatischen Kodierung aus medizinischen Freitexten oder für Anwendungen in der Qualitätssicherung.