Allgemeines

Das Fraunhofer-Institut für Integrierte Schaltungen begann Ende der 80er Jahre mit der Entwicklung eines Verfahrens zur Kompression von digitalen Audiodaten. Daraus entstand der standardisierte Algorithmus, der es möglich machte, die Datengröße von Audiomaterial zu reduzieren, ohne die Qualität erheblich leiden zu lassen und darüber hinaus auch in Echtzeit abspielen zu können.

In Anlehnung an die Entwicklungsgruppe MPEG wurde der Algorithmus MPEG-Audio bezeichnet.

Das digitale Eingangssignal wird in ein Frequenzband mit 32 Teilen zerlegt. Dieser Vorgang wird als Zeit-Frequenzbereichs-Umsetzung bezeichnet. Dieses Prinzip entspricht dem Vorgang im menschlichen Gehör (Psychoakustisches Modell), wobei jene Töne berechnet werden, die von den meisten Hörern nicht mehr wahrgenommen werden.

Die MPEG-Kodierung nutzt eine Eigenschaft des Gehörs aus:
Von einer Menge an Tönen ähnlicher Frequenzen nehmen wir nur die Lauteren wahr, leise Töne werden überdeckt. Im Fachjargon spricht man von Maskierung.

Sowohl Quantisierung als auch Codierung beim MPEG-Verfahren erfolgen unter Berücksichtigung der Maskierungsschwelle.




Abb.: Schema MPEG-Audio Komprimierung

MPEG-Audio Layer

MPEG-Audio wurde in Layern realisiert, wobei sich diese in der Komplexität des Kompressionsalgorithmus und im Grad der Kompression unterscheiden. MPEG-1 Layer 3, besser bekannt als MP3, ist der Effizienteste, da hier zusätzlich eine Entropiekodierung (Huffman) vorgenommen wird.

Die folgende Tabelle zeigt die drei Layer, ihre Eigenschaften und Verwendungsformen.

Kompressionsverfahren Datenrate (kBit/Sek.) Kompressionsverhältnis Verwendungsformen
MPEG-1 Layer 1 32 - 448 1 : 4 DCC (Digital Compact Cassette)
MPEG-1 Layer 2 32 - 384 1 : 6 bis 1 : 8 v.a. DVD
MPEG-1 Layer 3 32 - 320 1 : 10 bis 1 : 12 MP3 Audio

Abb.: Die MPEG-Audio Layer


Der nachfolgende Standard MPEG-2 erweiterte MPEG-1 u.a. um den Mehrkanalton und das AAC (Advanced Audio Coding). Mittlerweile wird mit dem MPEG-4 ALS Standard an einer verlustlosen Audiokompression gearbeitet.

AAC wurde im Rahmen der MPEG-Architektur unter maßgeblicher Beteiligung der Fraunhofer-Gesellschaft entwickelt und standardisiert. Dieses Verfahren erreicht selbst bei einem Reduktionsfaktor von 16 noch CD-ähnliche Qualität und unterstützt bis zu 48 Tonkanäle. Schon bei einer Bitrate von 64 KBit/s ist Advanced Audio Coding anderen Formaten deutlich überlegen. Bei 320 KBit/s wird eine exzellente Qualität erreicht. Mit dem Advanced Audio Coder ist von dem Konzept der Hybrid-Filterbank abgewichen worden. Der AAC setzt ausschließlich eine MDCT ("Modified Discrete Cosine Transformation") mit zwei verschiedenen Blocklängen ein. Bei "long blocks" werden 2048 Samples, bei "short blocks" 256 Samples verarbeitet, wodurch gegenüber MP3 sowohl eine höhere Frequenz- als auch Zeitauflösung erreicht wird. Der "Joint Stereo"-Mode ist gegenüber MP3 flexibler, da er unabhängig für Frequenzbereiche geschaltet werden kann und nicht, wie bei MP3, für den gesamten Frequenzbereich. Der AAC-Encoder besitzt außerdem einige Tools, wie z.B. LTP (long term prediction), PNS (perceptual noise substitution) und TNS (temporal noise shaping), die die Bitrate weiter absenken können. AAC ist auch ein Teil des neuen Standards MPEG-4 und wird vermutlich in vielfältigen Anwendungen wiederzufinden sein. In Japan hat man sich bereits entschieden, AAC als Tonverfahren für das digitale hochauflösende Fernsehen (HDTV, High Definition Television) zu verwenden.

Module, die für die Durchführung vorausgesetzt werden

Ergänzende und vertiefende Module