MPEG Kompression

MPEG ist die Abkürzung für "Motion Picture Experts Group", die verantwortlich ist für die Festlegung der Standards.
Wichtigste Grundlage für den MPEG-Standard ist im Unterschied zur M-JPEG-Kompression das Interframe-Verfahren. Dabei werden nicht nur die einzelnen Bilder eines Videos komprimiert: Zur effizienteren Datenreduktion werden hier auch die aufeinanderfolgenden Bilder analysiert und miteinander verglichen, um nur jene Bereiche zu speichern, die sich im Ablauf verändern. Auch bei bewegten Bildelementen, die in sich unverändert bleiben, werden in der Bildfolge nur die Bewegungsvektoren gespeichert. Diesen Vorgang nennt man Motion Compensation.

So wird jeweils ein Einzelbild komplett gespeichert, diese Bilder werden als I-Frames bezeichnet, sind wie beim M-Jpeg-Verfahren intrakodiert - also unabhängig vom vorangegangenen oder nachfolgenden Bild - und bilden die Referenzbilder.
Bilder, die aus einem vorhergehenden I-Frame mit Hilfe der oben beschriebenen Techniken sozusagen vorhergesagt werden, bezeichnet man als Predicted-Frames, also P-Frames. Diese Frames enthalten neben den Bildinformationen über veränderte und unveränderte Bildbereiche auch die Vektordaten aus der Motion Compensation, die angeben, wohin sich einzelne Elemente vorausichtlich bewegen werden. P-Frames benötigen etwas mehr als die Hälfte der Speichermenge eines I-Frames. Bei stärkeren Kompressionen können sich P-Frames auch auf vorhergehende P-Frames beziehen, was natürlich auf Kosten der Bildqualität geschieht.
Zwischen den I- und den P-Frames lassen sich zur weiteren Datenreduktion Frames berrechnen, die sich sowohl auf vorhergehende I- bzw. P-Frames als auch auf nachfolgende I- bzw. P-Frames beziehen - also bidirectional. Diese Frames werden als B-Frames bezeichnet. B-Frames enthalten hauptsächlich Vektorinformationen und benötigen ungefähr ein Viertel des Speicherbedarfs eines I-Frames. Aus diesem Grund treten B-Frames bei starker Kompression am häufigsten auf. Die Steuerung der Stärke der Kompression erfolgt hauptsächlich über die Anzahl der eingesetzten B- und P-Frames. Je mehr dieser Frames zwischen den Referenzbildern, also den I-Frames, eingesetzt werden, desto höher ist die Datenreduktion und desto schlechter wird die Bildqualität.
Eine zusammenhängende Gruppe von I-, B- und P-Frames bezeichnet man als GOP - Group of Pictures.


Beispiel für eine GOP mit dem Format: IBBPBB

GOPs sind Gruppen von komprimierten Einzelbildern einer MPEG-Sequenz. Sie bestehen aus I-Frames, die intraframekodiert sind und als Referenzbilder für vorhergehende und nachfolgende B- und P-Frames dienen. B-Frames beziehen sich sowohl auf nachfolgende als auch auf vorangehende P- bzw. I-Frames. P-Frames beziehen sich ausschließlich auf vorhergehende I- und P-Frames.

Die weiteren Schritte der MPEG-Kompression sind dem M-Jpeg-Verfahren sehr ähnlich:

  • Farbraumumwandlung nach YCrCb
  • DCT
  • adaptive Quantisierung - im Unterschied zur einfachen Quantisierung bei M-Jpeg wird hier die Quantisierungstabelle an jeden einzelnen 8x8-Block angepasst, was im Vergleich zum M-Jpeg-Verfahren eine erheblich höhere Datenreduktion einbringt.
  • Huffmann-Algorithmus mit fester Codeworttabelle

MPEG eignet sich grundsätzlich nicht für den Einsatz in Schnittsystemen, da durch das Interframe-Verfahren nicht auf jeden einzelnen Frame zugegriffen werden kann. Beim Interframe-Verfahren stehen die komprimierten Einzelbilder in Abhängigkeit zueinander. Um z.B. einen einzelnen B-Frame zu öffnen bzw. zu editieren, benötigt man die Bildinformationen der angrenzenden I- bzw. P-Frames!
Als Ausnahme gilt das so genannte I-Frame Only Verfahren, das in zahlreichen Schnittsystemen eingesetzt wird. Bei diesem Verfahren werden nur I-Frames erzeugt. Es handelt sich dabei also um ein Intraframe-Verfahren, bei dem jeder einzelne Frame unabhängig von den vorhergegehenden oder nachfolgenden Bildern editiert werden kann.

MPEG1

Dieses Format wurde seit 1988 entwickelt und 1993 standardisiert mit dem Ziel, Video- und Audiodaten auf CD-Roms zu speichern und auf handelsüblichen CD-Rom-Laufwerken möglichst ruckelfrei wiedergeben zu können. Vorerst musste dazu zusätzliche Hardware verwendet werden (Mpeg-Decoder-Karten), ab Mitte der 90er Jahre wurden die Rechner aber schnell genug und Mpeg1 wurde zu einem plattformübergreifenden Format, das nicht nur auf allen PCs und Macintosh-Computern wiedergegeben werden kann, sondern auch im VCD-Standard auf vielen DVD-Playern. Diese Video CDs fanden eine weite Verbreitung, vor allem im asiatischen Raum, wo auch entsprechende Standalone-Player zu günstigen Preisen angeboten werden. Die Wiedergabequalität ei57256ner VCD lässt sich mit der von VHS vergleichen, hat aber den eindeutigen Vorteil, dass sich die CDs bei der Wiedergabe nicht abnutzen und dass man sie wie alle digitalen Medien problemlos verlustfrei vervielfältigen, also kopieren kann.

Die Funktionsweise von MPEG1 beruht auf der technisch einfachsten Variante der MPEG-Kompression, kann keine Halbbilder verarbeiten und hat im VCD-Standard eine beschränkte Datenrate von maximal 1150kbps für Video und 224kbps für Audio.

Der VCD-PAL-Standard: MPEG1, 352x288 Pixel, 25fps, CBR* 1150kbps; Audio: Layer-2 44100Hz 224kbps
Nach diesem Standard komprimiert, finden auf einer gewöhnlichen 700MB-CD-Rom bis zu 80 Minuten Video und Audio Platz.

CBR = Constant Bit Rate

MPEG2

MPEG2 wurde 1995 eingeführt und baut grundsätzlich auf dem MPEG1 Standard auf, bietet aber durch verbesserte Signalverarbeitungsalgorithmen eine wesentlich höhere Bildqualität. Zusätzlich unterstützt MPEG2 auch die Verarbeitung von Video-Halbbildern.
Eine weite Verbreitung findet MPEG2 als Standard-Kompression für DVDs.
Im Vergleich zur VCD wurde hier neben der Bildauflösung auch die maximale Datenrate erheblich vergrößert:
DVD-PAL-Standard: MPEG-2, 720x576 Pixel, 25fps interlaced, maximal 9800kbps; Audio: maximal 448kbps (5.1 Dolby Digital), wobei die gesamte Datenrate von Video+Audio den Wert von 10,08 Mbit/s nicht überschreiten darf.

Eine wichtige Rolle spielt MPEG2 auch im professionellen Bereich. So wird MPEG2 als Broadcast-Standard für digitales Fernsehen, HDTV (80 Mbit/s) und als Codec für High-End-Schnittsysteme eingesetzt. Diese Formate unterscheiden sich natürlich wesentlich vom DVD-Standard, so wird im Broadcastbereich eine Datenrate von mindestens 15 Mbit/s eingesetzt (4:2:2 Profile at Main Level, GOP < 4) und bei Schnittsystemen arbeitet man bei Datenraten von 50 Mbit/s mit dem so genannten I-Frame-Only Format, das eigentlich dem M-JPEG-Verfahren sehr ähnlich ist, da hier auch keine Interframe-Kompression verwendet wird, um jedes Einzelbild editierfähig zu machen. Der Unterschied zu M-JPEG liegt in den fortschrittlicheren Kompressionsalgorithmen des MPEG-Verfahrens, die selbst bei einer reinen Einzelbildkompression niedrigere Datenraten bei vergleichbarer Bildqualität ermöglichen. Auch bei professionellen Kameras und MAZen findet MPEG2 Verwendung. So arbeiten die Sony-Systeme Betacam SX, Betacam IMX und XDCAM bereits mit MPEG2-Kompression und erreichen damit Qualitäten, die weit über dem Betacam-SP-Niveau liegen.

MPEG3

MPEG3 wurde ursprünglich für den HDTV-Bereich vorgesehen, wurde aber später in MPEG2 eingegliedert. Nicht zu verwechseln mit MP3, bei dem es sich um einen reinen Audio-Codec handelt.

MPEG4

MPEG4 wurde von Microsoft seit 1996 anfänglich für die Einbindung von Video im Internet, erweiterte Bildkommunikation und Multimedia-Anwendungen entwickelt. Durch noch kompliziertere Algorithmen werden hier wesentlich geringere Datenraten als bei MPEG2 realisiert, allerdings wird dabei nicht dieselbe Bildqualität erreicht. Die objektorientierte Gliederung der Bildinhalte soll die Möglichkeiten für interaktive Anwendungen erweitern. So können etwa einzelne Objekte anhand der Bilddstrukturen erkannt und in einer Anwendung direkt angesprochen und verändert werden. Der Hauptanwendungsbereich liegt jedoch vorwiegend dort, wo große Datenmengen, wie z.B. bei kompletten Spielfilmen, soweit reduziert werden sollen, dass sie auf handelsüblichen CD-Roms Platz finden und so zum Leidwesen der Filmindustrie und der Kinobetreiber bei entsprechend breitbandigen Internetverbindungen in erträglichen Downloadzeiten via Tauschbörsen ihre weltweite Verbreitung finden. Eingesetzt und ständig weiterentwickelt, wird der MPEG4-Codec bei Kompressionsprogrammen, wie DivX und Xvid.

MPEG7

MPEG7 stellt keine Weiterentwicklung der vorangegangenen MPEG-Codecs dar, sondern bietet die Möglichkeit, unterschiedliche Multimediadaten miteinander zu verknüpfen und zusätzliche Informationen, wie zum Beispiel Bild- oder Szenenbeschreibungen, einzubinden, um das Auffinden bestimmter Inhalte in komplexen Datenbanken einfacher zu gestalten.
Bisher war man bei der Suche nach bestimmten Bildern, Audiodaten oder Videoszenen darauf angewiesen, zumindest einen Teil des gesuchten Dateinamens zu kennen oder zu erraten. Mit Hilfe von MPEG7 soll auch die Suche mittels Stichwort, Angaben zum Autor, Themen- oder Zielgruppen möglich werden.
So soll MPEG7 auch via Internet die Möglichkeit bieten, mit Hilfe von Stichwörtern bestimmte Szenen oder Bilder innerhalb von entsprechend aufbereiteten Datenbanken einfach zu finden.

MPEG in der Praxis

Mpeg-Codecs eignen sich hervorragend für den plattformübergreifenden Austausch von Videodaten in einem frei skalierbaren Verhältnis zwischen Qualität und Datenrate.
Software zum Komprimieren gibt es auch gratis in hervorragender Qualität:
z.B.
TMPGEncoder
BBMpeg
Die meisten Programme bieten neben den Standardeinstellungen auch eine verwirrende Vielfalt an Einstellmöglichkeiten, die eher für den fortgeschrittenen Anwender gedacht sind. Mit Hilfe von Standard-Presets lassen sich meist schon akzeptable Ergebnisse erzielen. Möchte man aber die Kompression exakt an die individuellen Anforderungen und an das verwendete Videomaterial anpassen, so kann man den Kompressionsvorgang bishin zum gezielten Eingriff in den Aufbau der GOP-Strukturen optimieren.

Module, die für die Durchführung vorausgesetzt werden

Ergänzende und vertiefende Module