Allgemeines

Aufnahmen in DVD- oder CD-Qualität sind für manche Anforderungen bzw. Übertragungswege zu umfangreich in ihrer Datenmenge, z.B. Übertragung im Internet, Datenversand über Modem oder ISDN.
Mit Hilfe von Datenreduktion wird versucht, auf effiziente Weise diese Datenmengen soweit zu reduzieren, dass sie für die geplanten Anwendungen adäquat sind, ohne dabei aber die Qualität der Aufnahmen zu verschlechtern.
In diesem Zusammenhang unterscheidet man, wie in der Grafik- und Videobearbeitung, zwischen verlustfreier und verlustbehafteter Kompression.

Verlustfreie Kompression

Hier wird durch Zusammenfassen redundanter Informationen die Datenmenge verkleinert. Redundanz heißt, dass Teile einer Information schon aus bereits bekannten Teilen abgeleitet werden können und somit nicht mehr voll gespeichert werden müssen.

Der bekannteste Algorithmus ist der „Huffmann Code“. Damit werden häufige Signalwerte mit möglichst wenigen Bits abgebildet.

Verlustbehaftete Kompression

Ermöglicht eine starke Reduktion der Datenmenge, jedoch kommt es dabei zu Datenverlusten. Das Grundprinzip beruht darauf, jene Anteile des Datenstromes zu entfernen, die vom menschlichen Gehör nicht wahrgenommen werden.

Die direkte Anwendung von Verfahren zur verlustfreien Codierung (Lempel, Ziv, Huffman-Codierung, Arithmetik-Codierung) ist bei Audiodaten nicht besonders effizient, da Audiosignale in der Regel starke Abhängigkeiten zwischen den einzelnen Abtastwerten haben. Durch eine zusätzliche Vorbearbeitung lassen sich die Abhängigkeiten jedoch beseitigen und man erhält ein Signal, das sich wesentlich leichter codieren lässt.

Eine typische Methode zur Dekorrelation ist die sogenannte "lineare Prädiktion" (engl. Linear predictive coding, LPC), wobei für jeden Abtastwert des Signals ein Schätzwert auf Basis zurückliegender Abtastwerte berechnet wird. Dieses Prinzip wird beispielsweise beim neuen MPEG4-ALS Standard verwendet.

Neben dem predictive coding gibt es das sogenannte "Seiten-Bandcodierungs"Verfahren (engl. Sub-Band Coding), bei dem das Spektrum des Audiosignals in mehrere Frequenzbänder aufgeteilt wird. Für die lauteren Teile des Frequenzbandes wird mehr Platz bei der Übertragung verwendet, da diese für Wahrnehmung am Wichtigsten sind. Unwichtige (da sehr leise) Bänder können auch komplett weggelassen werden.

Die dritte Codierungsform ist die "Spektral- oder Transformationscodierung". Hier wird über die komplette Wellenform des Signals periodisch eine Fourier-Transformation gerechnet. Da sich die transformierte Darstellung eines Signals nur langsam ändert, muss sie viel seltener übertragen werden.

Ergänzende und vertiefende Module