************************************************************************ * * * Einladung * * * * Informatik-Oberseminar * * ************************************************************************ Zeit: Freitag, 10. Januar 2003, 16:00 Uhr Ort: Raum 5056, Ahornstr.55 Referent: Dipl.-Ing. Achim Sixtus Lehrstuhl für Informatik VI Thema: Across-Word Phoneme Models for Large Vocabulary Continuous Speech Recognition Abstract: In diesem Vortrag wird die Entwicklung eines Spracherkennungssystems dargestellt, welches die effiziente Verwendung von wortübergreifenden Phonemmodellen in der automatischen Erkennung kontinuierlicher Sprache bei großem Vokabular erlaubt. Im Gegensatz zu wortinternen Phonemmodellen, die die Kontextabhängigkeit der Phoneme (Koartikulation) nur innerhalb der Worte des Erkennervokabulars brücksichtigen und an Wortgrenzen lediglich einen reduzierten Phonemkontext verwenden, erfassen wortübergreifende Phonemmodelle die Koartikulation auch über Wortgrenzen hinweg. Gegenüber dem wortinternen Ansatz führt dies zu einer genaueren Aussprachemodellierung und damit zu einer verbesserten Erkennungsleistung, aber auch zu einem erheblichen Anstieg der Komplexität des Erkennungsprozesses. Eine effiziente Anwendung von wortübergreifenden Phonemmodellen erfordert somit einerseits einen sorgfältigen Entwurf des Suchnetzwerks und des Suchalgorithmus. Andererseits muß auch die Trainingsprozedur des Systems geeignet angepaßt werden, um ein akustisches Modell mit optimaler Erkennungsleistung zu erhalten. Ausgangspunkt des Vortrags ist ein Spracherkennungssystem mit wortinternen Phonemmodellen. Es wird detailliert aufgezeigt, welche Modifikationen der Übergang zu wortübergreifenden Phonemmodellen in Bezug auf das Training und die Erkennung erfordert. Der Effekt sowohl auf die Fehlerrate als auch auf die Laufzeit des Erkenners wird umfassend analysiert. Das resultierende System wird auf drei verschiedenen Sprachdatensammlungen evaluiert. Es wird gezeigt, daß gegenüber dem ursprünglichen rein wortinternen System die Fehlerrate des neuen wortübergreifenden Systems zwischen 7% und 10% relativ geringer ist. Weiterhin werden die erzielten Fehlerraten des neuen Systems mit Ergebnissen verglichen, die international führende Forschungsgruppen unter vergleichbaren Bedingungen auf denselben Datensammlungen produziert haben. Es laden ein: Die Dozenten der Informatik