Knihobot
Knihu momentálně nemáme skladem

Wortarten und Korpus

Více o knize

In dieser Arbeit wird ein Ansatz zur korpusbasierten Wortartenklassifikation dargestellt, der auf den quantitativen und distributionellen Eigenschaften von Sprache beruht. Die Ergebnisse verschiedener implementierter Klassifikationsverfahren werden anhand eines manuell annotierten deutschen Korpus evaluiert. Das Buch bietet somit neue Erkenntnisse für die Wortartenforschung und die Computerlinguistik. Das Problem der Wortartenklassifikation hat die Sprachwissenschaft über Jahrhunderte beschäftigt. Einen erneuten Impuls bekam die Wortartenklassifikation jedoch seit dem Beginn der Verarbeitung maschinenlesbarer Textkorpora: Sie ist ein wichtiges Verfahren, um Daten zu ordnen, aufzubereiten und bei statistischen Sprachmodellen dem Problem des geringen Datenumfangs Rechnung zu tragen. Der hier vorgestellte Ansatz basiert auf distributionellen Klassifikationsverfahren in der Tradition von Firth und Harris. Zunächst wird gezeigt, warum distributionelle Klassifikationsverfahren den semantischen, pragmatischen, morphologischen und auch den transformationellen Methoden überlegen sind. Neuere Arbeiten und computerlinguistische Ansätze zur Wortartenklassifikation werden dargestellt und ihre Ergebnisse anhand der zuvor postulierten Anforderungen an eine Wortartenklassifikation beurteilt. Es gibt in allen Sprachen Wortarten und diese unterliegen quantitativen Gesetzmäßigkeiten. Diese Gesetzmäßigkeiten werden in ihren Zusammenhängen dargestellt. Die Erkenntnisse münden in die Entwicklung von distributionellen Methoden zur automatischen Generierung von Wort(arten)klassen. Hierbei werden hauptsächlich Clusterverfah-ren verwendet, wobei die geclusterten Objekte keine Worttokens, sondern Kotexte, also sprachliche Umgebungen, sind. Die Worttokens werden also indirekt über ihre Zugehörigkeit zu den Kotexten klassifiziert. Dies ermöglicht es, unterschiedliche Gebrauchsweisen von Types entsprechend unterschiedlich zu klassifizieren, also z. B. Relativpronomina von Artikeln zu trennen. Die Ergebnisse der automatischen Klassifikation werden an der Meßlatte eines bereits wortartenannotierten deutschen Korpus evaluiert. Dabei wird anhand exemplarischer linguistischer Problemfälle gezeigt, inwiefern die automatischen Verfahren den Erwartungen an eine distributionelle Wortartenklassifikation gerecht werden.

Nákup knihy

Wortarten und Korpus, Petra Steiner

Jazyk
Rok vydání
2004
product-detail.submit-box.info.binding
(měkká)
Jakmile ji vyčmucháme, pošleme vám e-mail.

Doručení

  •  

Platební metody

Navrhnout úpravu