Realisierung der linguistisch-phonetischen Transkription für die Sprachsynthese durch neuronale Netze mit Multilayer-Perceptron-Struktur
Autoři
Více o knize
In der vorliegenden Arbeit wurde der Einsatz von neuronalen Netzen im Rahmen der Sprachsynthese untersucht. Einen Schwerpunkt bildete dabei die Realisierung der linguistisch-phonetischen Transkription durch einen neuronalen Ansatz. Zunächst erfolgt eine Gegenüberstellung vorhandener Tran-skriptionsverfahren. Da man neuronale Netze bereits für verschiedene Teilaufgaben der Sprachsynthese eingesetzt hat, wird anschließend ein Überblick über vorhandene Systeme gegeben. Im weiteren wird dann die Erstellung und Optimierung eines neuronalen Transkriptionssystems beschrieben. Der hierbei verwendete Netztyp ist das Multilayer-Perceptron. Für die Optimierung des Systems werden die Größe des neuronalen Netzes, die Breite des für die Transkription benötigten Kontextes sowie die Ein- und Ausgangskodierung variiert. Es ergibt sich ein neuronales Transkriptionssystems, das 61,5% der Wörter von laufendem Text richtig transkribiert. Eine Verbesserung des Systems läßt sich durch die Einführung einer einfachen Rückkopplung erreichen. Hiermit lassen sich bis zu 68,2% der Wörter richtig transkribieren. Ähnlich gut arbeitet ein neuronales Netz, das zusätzlich morphologische Informationen erhält (66,8% richtige Wörter). Die besten Ergebnisse liefert ein neuronales System, bei dem beide Verbesserungsansätze kombiniert werden. Dieses transkribiert 72,8% der Wörter richtig. Abschließend erfolgt eine genauere Auswertung der entstandenen Transkriptionsfehler.