Sprachverarbeitung
Grundlagen und Methoden der Sprachsynthese
und Spracherkennung
von Beat Pfister und Tobias Kaufmann
Hörbeispiele
Zum abgebildeten Buch gibt es für die folgenden Kapitel Hörbeispiele:
Kapitel 1
Kapitel 2
Kapitel 3
Kapitel 4
Kapitel 7
Kapitel 9
Kapitel 11
Kapitel 12
Kapitel 13
Kapitel 14
Diese Hörbeispiele können mit dem Adobe Reader mit Multimedia-Plug-in
abgespielt werden.
Übungen
Zu jeder Übung gibt es ein Zip-Archiv. Nach dem Entpacken eines
Archivs uebungXY.zip ist ein Directory UebungXY
vorhanden mit der Aufgabenstellung und den beiden
Subdirectories Gegebenes und Loesung. Im
Subdirectory Gegebenes sind alle Programme und Daten zu
finden, die zum Durchführen der Übung benötigt
werden. Im Subdirectory Loesung befinden sich die
Lösungen zu den einzelnen Aufgaben, beispielsweise
ist uebXY_2.m die Lösung (ein Matlab-Skript) zur Aufgabe
2 von Übung XY.
Zum Lösen der Übung XY starten Sie Matlab, wechseln Sie ins
Arbeits-Directory UebungXY und machen Sie die nötigen
Zusätze im Subdirectory Gegebenes verfügbar mit
dem Matlab-Befehl "addpath Gegebenes". Zum Testen der vorgegebenen
Lösungen (Matlab-Skripts und -Funktionen) im Subdirectory
Loesung, machen Sie diese mit dem Matlab-Befehl
"addpath Loesung" verfügbar.
Übung 01
Einführung in Matlab und Audiosignale
Übung 02
Quantisierung von Sprachsignalen
Übung 03
Diskrete Fouriertransformation
Übung 04
Lineare Prädiktion
Übung 05
LPC-Analyse und -Synthese von Sprachsignalen
Übung 06
Vektorquantisierung von Sprachsignalen
Übung 07
Sprachsignalproduktion mittels LPC-Analyse-Synthese
Übung 08
Prosodiesteuerung Teil 1: Dauersteuerung
Übung 09
Prosodiesteuerung Teil 2: Grundfrequenzsteuerung
Übung 11
Sprachmerkmale zur Lautunterscheidung
Übung 12
DTW-Algorithmus
Übung 13
Spracherkenner mit Mustervergleich
Übung 14
Formale Sprachen und Grammatiken
Übung 15
Syntaktische Analyse mathematischer Ausdrücke
Übung 16
Syntaktische Analyse deutscher Sätze
Übung 17
Kombinierte morphosyntaktische Analyse
Übung 18
Sprachsynthese: Akzentuierung und Phrasierung
Übung 19
Generieren und Erkennen diskreter Beobachtungssequenzen
Übung 20
Erkennen diskreter Beobachtungssequenzen mit dem Viterbi-Algorithmus
Übung 21
Trainieren diskreter Hidden-Markov-Modelle
Übung 22
Ziffernerkenner mit CDHMM-Wortmodellen
Übung 23
Statistische Sprachmodellierung
Anmerkung: Für die Übungen wird Matlab Version R2015b oder
höher benötigt.
Vorlesungsfolien
Die Folien der zweisemestrigen Vorlesung sind nicht selbsterklärend,
sondern als Ergänzung zum Buch zu verstehen.
Teil 1
(alle Folien von Teil 1 als zip-Archiv)
Lektion 1
Einführung; Beschreibung von Sprache
Lektion 2
Sprachsignale: Verarbeitung und Darstellung
Lektion 3
Kurzzeitanalyse: diskrete Fouriertransformation, Autokorrelation
Lektion 4
Lineare Prädiktion
Lektion 5
Homomorphe Analyse: Cepstrum
Lektion 6
Vektorquantisierung; Einführung in die Sprachsynthese
Lektion 7
Sprachsynthese: Signalproduktion
Lektion 8
Sprachsynthese: Prosodiesteuerung
Lektion 9
Sprachsynthese: Fourier-Analyse und -Synthese
Lektion 10
Einführung in die Spracherkennung
Lektion 11
Spracherkennung: Merkmalsextraktion; Äusserungsdetektion
Lektion 12
Spracherkennung mittels Mustervergleich
Lektion 13
Einführung in die statistische Spracherkennung
Teil 2
(alle Folien von Teil 2 als zip-Archiv)
Lektion 1
Einführung; Formale Sprachen; Chomsky-Grammatiken
Lektion 2
Wortanalyse: Automaten und Parsing
Lektion 3
Grammatik für natürliche Sprache: DCG-Formalismus
Lektion 4
Two-level-Regeln und Transduktoren
Lektion 5
Automatische Transkription; Morphosyntaktische Analyse
Lektion 6
Realisation einer Transkriptionsstufe
Lektion 7
Einführung in DDHMM; Trellis-Diagramm; Forward-Algorithmus
Lektion 8
Viterbi-Algorithmus und Baum-Welch-Algorithmus
Lektion 9
CDHMM: Algorithmen und Training; Akustische Modelle für Wörter
Lektion 10
Akustische Modelle für Wortteile; Spracherkennung mit Laut-HMM
Lektion 11
statistische Sprachmodellierung
Lektion 12
wissensbasierte Sprachmodellierung