Sprachverarbeitung
Grundlagen und Methoden der Sprachsynthese und Spracherkennung

von Beat Pfister und Tobias Kaufmann

 

Frontseite des Buches       Zur zweiten Auflage des Buches gibt es hier die folgenden Beilagen:

    Hörbeispiele

    Übungen

    Vorlesungsfolien

Weitere Informationen über dieses Buch sind beim Springer Verlag zu finden.


Hörbeispiele

Zum abgebildeten Buch gibt es für die folgenden Kapitel Hörbeispiele:

  • Kapitel 1
  • Kapitel 2
  • Kapitel 3
  • Kapitel 4
  • Kapitel 7
  • Kapitel 9
  • Kapitel 11
  • Kapitel 12
  • Kapitel 13
  • Kapitel 14
  • Diese Hörbeispiele können mit dem Adobe Reader mit Multimedia-Plug-in abgespielt werden.


    Übungen

    Zu jeder Übung gibt es ein Zip-Archiv. Nach dem Entpacken eines Archivs uebungXY.zip ist ein Directory UebungXY vorhanden mit der Aufgabenstellung und den beiden Subdirectories Gegebenes und Loesung. Im Subdirectory Gegebenes sind alle Programme und Daten zu finden, die zum Durchführen der Übung benötigt werden. Im Subdirectory Loesung befinden sich die Lösungen zu den einzelnen Aufgaben, beispielsweise ist uebXY_2.m die Lösung (ein Matlab-Skript) zur Aufgabe 2 von Übung XY.

    Zum Lösen der Übung XY starten Sie Matlab, wechseln Sie ins Arbeits-Directory UebungXY und machen Sie die nötigen Zusätze im Subdirectory Gegebenes verfügbar mit dem Matlab-Befehl "addpath Gegebenes". Zum Testen der vorgegebenen Lösungen (Matlab-Skripts und -Funktionen) im Subdirectory Loesung, machen Sie diese mit dem Matlab-Befehl "addpath Loesung" verfügbar.

  • Übung 01   Einführung in Matlab und Audiosignale
  • Übung 02   Quantisierung von Sprachsignalen
  • Übung 03   Diskrete Fouriertransformation
  • Übung 04   Lineare Prädiktion
  • Übung 05   LPC-Analyse und -Synthese von Sprachsignalen
  • Übung 06   Vektorquantisierung von Sprachsignalen
  • Übung 07   Sprachsignalproduktion mittels LPC-Analyse-Synthese
  • Übung 08   Prosodiesteuerung Teil 1: Dauersteuerung
  • Übung 09   Prosodiesteuerung Teil 2: Grundfrequenzsteuerung
  • Übung 11   Sprachmerkmale zur Lautunterscheidung
  • Übung 12   DTW-Algorithmus
  • Übung 13   Spracherkenner mit Mustervergleich
  • Übung 14   Formale Sprachen und Grammatiken
  • Übung 15   Syntaktische Analyse mathematischer Ausdrücke
  • Übung 16   Syntaktische Analyse deutscher Sätze
  • Übung 17   Kombinierte morphosyntaktische Analyse
  • Übung 18   Sprachsynthese: Akzentuierung und Phrasierung
  • Übung 19   Generieren und Erkennen diskreter Beobachtungssequenzen
  • Übung 20   Erkennen diskreter Beobachtungssequenzen mit dem Viterbi-Algorithmus
  • Übung 21   Trainieren diskreter Hidden-Markov-Modelle
  • Übung 22   Ziffernerkenner mit CDHMM-Wortmodellen
  • Übung 23   Statistische Sprachmodellierung
  • Anmerkung:  Für die Übungen wird Matlab Version R2015b oder höher benötigt.


    Vorlesungsfolien

    Die Folien der zweisemestrigen Vorlesung sind nicht selbsterklärend, sondern als Ergänzung zum Buch zu verstehen.

    Teil 1     (alle Folien von Teil 1 als zip-Archiv)

  • Lektion 1   Einführung; Beschreibung von Sprache
  • Lektion 2   Sprachsignale: Verarbeitung und Darstellung
  • Lektion 3   Kurzzeitanalyse: diskrete Fouriertransformation, Autokorrelation
  • Lektion 4   Lineare Prädiktion
  • Lektion 5   Homomorphe Analyse: Cepstrum
  • Lektion 6   Vektorquantisierung; Einführung in die Sprachsynthese
  • Lektion 7   Sprachsynthese: Signalproduktion
  • Lektion 8   Sprachsynthese: Prosodiesteuerung
  • Lektion 9   Sprachsynthese: Fourier-Analyse und -Synthese
  • Lektion 10   Einführung in die Spracherkennung
  • Lektion 11   Spracherkennung: Merkmalsextraktion; Äusserungsdetektion
  • Lektion 12   Spracherkennung mittels Mustervergleich
  • Lektion 13   Einführung in die statistische Spracherkennung
  • Teil 2     (alle Folien von Teil 2 als zip-Archiv)

  • Lektion 1   Einführung; Formale Sprachen; Chomsky-Grammatiken
  • Lektion 2   Wortanalyse: Automaten und Parsing
  • Lektion 3   Grammatik für natürliche Sprache: DCG-Formalismus
  • Lektion 4   Two-level-Regeln und Transduktoren
  • Lektion 5   Automatische Transkription; Morphosyntaktische Analyse
  • Lektion 6   Realisation einer Transkriptionsstufe
  • Lektion 7   Einführung in DDHMM; Trellis-Diagramm; Forward-Algorithmus
  • Lektion 8   Viterbi-Algorithmus und Baum-Welch-Algorithmus
  • Lektion 9   CDHMM: Algorithmen und Training; Akustische Modelle für Wörter
  • Lektion 10   Akustische Modelle für Wortteile; Spracherkennung mit Laut-HMM
  • Lektion 11   statistische Sprachmodellierung
  • Lektion 12   wissensbasierte Sprachmodellierung

  • Dr. Beat Pfister
    Institut für Technische Informatik
    und Kommunikationsnetze
    ETH Zürich
    8092 Zürich
    Tel:
    Email:
    044 632 51 37
    beat.pfister@ethz.ch