Einführung

Da die Videotechnik, wie sie auch heute noch verwendet wird, aus dem "vordigitalen" Zeitalter stammt, mussten bei der Entwicklung der digitalen Standards und Normen einige Anpassungen vorgenommen werden, um die Kompatibilität zur analogen Videotechnik sicherzustellen..
Ein etwas komplizierter Kunstgriff wurde dabei in Bezug auf das sogenannte "Pixel Seitenverhältnis" oder engl.: Pixel Aspect Ratio vorgenommen. Mit diesen Begriffen wird man bei der Bearbeitung von Video am Computer häufig konfrontiert - mitunter führt das zu Problemen, an denen nicht zuletzt auch die sehr unterschiedliche und nicht immer ganz korrekte Handhabung in den verschiedenen Programmen schuld ist.

Videomonitore die auf einer Röhrentechnologie basieren, wie alle handelsüblichen Fernsehgeräte mit Ausnahme von Plasma-Bildschirmen und TFT-Displays, verarbeiten und stellen ein analoges Videosignal dar.
Diese Darstellung funktioniert, wie im Grundlagenmodul Videosignal Analog genauer beschrieben wird, nicht durch die Wiedergabe einzelner Pixel wie auf einem PC-Monitor, sondern zeilenweise. Um digitale Videodaten auf einem analogen Monitor darstellen zu können, müssen diese Daten erst in ein analoges Signal umgewandelt werden - diese Aufgabe übernimmt die Video-Hardware, sofern sie über analoge Ausgänge (Composite, Y/C, analoge Komponenten) verfügt, mit Hilfe eines D/A-Wandlers (Digital/Analog-Wandler). Hierbei ist natürlich notwendig, dass das so generierte Analog-Signal der festgelegten Fernsehnorm entspricht, damit die Bilder auch tatsächlich auf einem Fernsehgerät dargestellt werden können.

Im Zuge der folgenden Erläuterungen werden die beiden Bezeichnungen Bildseitenverhältnis und Pixelseitenverhältnis verwendet, dazu vorab eine kurze Begriffsbestimmung:

Das Bildseitenverhältnis steht für das Verhältnis von Breite und Höhe
eines gesamten Videobildes und wird immer als Verhältnis angegeben. (z.B. 4:3 oder 16:9).
Das Pixelseitenverhältnis steht für das Verhältnis von Breite und Höhe eines einzelnen Pixels und wird als Faktor angegeben.
(z.B. 1,067 oder 1,094)

Die Vorgeschichte

Erster digitaler PAL-Standard (768x576)

Die PAL- Fernsehnorm legt fest, dass ein komplettes Fernsehbild (zwei Halbbilder) aus 575 aktiven Zeilen besteht (siehe Videosignal Analog). Für jede Zeile stehen jeweils 52µs für den Bildaufbau zur Verfügung.
Ein Problem bei der Entwicklung eines digitalen PAL-Standards war die Verwaltung der ungeraden Zeilenanzahl: 575 Zeilen ergeben jeweils 287,5 Zeilen pro Halbbild.
Die Lösung: Man fügte jeweils eine halbe Leerzeile ein und erhielt so 576 Zeilen und damit 288 Zeilen für jedes Halbbild. Für die Abtastung bei der Digitalisierung lag es nahe, für jede Zeile eine Reihe von Bildpunkten zu erzeugen.
Für die horizontale Abtastung legte man im Rahmen der ersten digitalen PAL-Norm fest, dass die Höhe und die Breite der einzelnen Bildpunkte gleich sein soll. Diese Bildpunkte sind also quadratisch (Pixel-Seitenverhältnis: 1).
Zwischen Breite und Höhe eines kompletten digitalen Bildes legte man ein Verhältnis von 4:3 fest. Daraus ergibt sich eine horizontale Auflösung von 768 Bildpunkten, bei einer Höhe von 576 Bildpunkten.
Die erste digitale PAL-Fernsehnorm sah also folgendermassen aus: 768x576 Pixel bei 50 Halbbildern pro Sekunde. Hierbei spricht man von quadratischen Bildpunkten (Square Pixel) und diese Pixel haben dementsprechend ein Seitenverhältnis von 1:1.
( Einige ältere Videokarten mit analogen Eingängen, aus der Zeit vor der Einführung des DV-Standards, haben auch noch Anfang der 1990er Jahre diese Auflösung verwendet, z.B. die AV-Master von FAST. )

1981 - digitale Norm nach CCIR (720x576)

Nun gab es Bestrebungen, bei der endgültigen Festlegung einer neuen digitalen Norm, eine gewisse Annäherung zwischen NTSC und PAL zu erreichen. Diese Angleichung sollte natürlich auch weiterhin eine Kompatibilität zu den herkömmlichen Fernsehsystemen und den Geräten garantieren. Aus diesem Grund war eine Anpassung der Bildwiederholfrequenz unmöglich. Die einzige realistische Möglichkeit sah man in der Angleichung der Bildbreite:
NTSC nutzte im analogen System 480 aktive Zeilen - daraus ergibt sich bei einer Digitalisierung mit einem Bildseitenverhältnis von 4:3 eine horizontale Auflösung von 640 quadratischen Bildpunkten - also Vollbilder mit 640x480 Pixel. Das MIttelmass zwischen den 640 horizontalen Pixel des NTSC-Systems und den 768 Pixel des PAL-Systems ergibt 704 Pixel (640+768=1408, 1408:2=704). Bei der Normierung der maximalen Abtastfrequenz einigte man sich auf 13,5 MHz.(siehe Videosignal Digital). Das bedeutet, dass innerhalb der 52µs, die beim analogen Signal für den Aufbau einer Zeile benötigt werden, bei einer Abtastfrequenz von 13,5 MHz genau 702 Werte erfasst werden können:

13,5 MHz bedeutet 13500 Abtastungen pro Sekunde.
52µs also 52/1000stel Sekunden (0,052 s) stehen pro Zeile zur Verfügung.

Diese 702 Pixel liegen also schon beinahe im Mittelwert der horizontalen Auflösung von NTSC und PAL, nun galt es aber noch ein weiteres Problem zu beheben:
Eine häufig auftretende minimale horizontale Verschiebung der Bildlage, die beim Digitalisierungsvorgang durch die nicht immer hundertprozentige Genauigkeit von analogen Zuspieler hervorgerufen wird. Ein Sicherheitsbereich von jeweils 9 Pixel links und rechts schien hier angemessen. Zählt man diese Pixel zusammen, 9+9=18, und addiert diese zu den 702 Bildpunkten, so erhält man 720 Pixel. Durch die Verbreiterung um 18 Pixel steigt die Dauer des Zeilendurchlaufes bei der Wiedergabe und der Abtastung von 52µs auf ~53,34µs
Wir haben also folgende Parameter, die 1981 von der CCIR ("Comité Consultatif International des Radiocommunications", heute ITU) unter der Bezeichnung 601 als neue Norm empfohlen wurden:
PAL: ITU-R BT.601: 720x576 Bildpunkte, bei einer Abtastfrequenz von maximal 13,5 MHz (das ergibt einen Zeilendurchlauf von ~53,34µs für die gesamte Breite von 720 Pixel).

Die Problematik

Sieht man sich nun das Bildseitenverhältnis der neuen Norm genauer an, so stellt man fest, dass es von der analogen Norm abweicht, da die Breite verändert wurde, während die Bildhöhe gleich geblieben ist.
Unverändert bleibt aber die Technik der analogen Fernsehgeräte - und um die nun schmäleren digitalen Bilder auf einem Fernseher korrekt darstellen zu können, müssen diese bei der Umwandlung in ein analoges Signal um einen bestimmten Faktor (Aspect Ratio) horizontal angepasst werden, um wieder ein korrektes Bild-Seitenverhältnis von 4:3 herzustellen. Bei dieser Anpassung werden die einzelnen Pixel verformt und erscheinen dann nicht mehr quadratisch, also non-square. Aufgrund der Anpassung werden natürlich auch die Bildinhalte in ihrer Geometrie verändert: Ein Kreis der mit Hilfe eines Grafikprogramms erstellt wurde und auf dem PC-Monitor rund dargestellt wird, wird auf einem Videomonitor zur Ellipse:

Beispiel: Bildquelle Grafikprogramm
PC-Monitor Darstellung Fernsehmonitor-Darstellung (Simulation)


Umgekehrt werden analoge Videobilder bei der Digitalisierung schmäler. Das heisst, dass die Videobilder sobald sie auf einem digitalen Medium gespeichert werden eigentlich schmäler sind, als sie auf einem Videomonitor oder Fernsehgerät dargestellt werden.
Solange man bei der Produktion nur mit Videomaterial in entsprechenden Videoprogrammen arbeitet, ist dieser Umstand nicht von Bedeutung, da die digitalen Bildinhalte zwar schmäler erscheinen, aber auf einem externen Videomonitor korrekt dargestellt werden. Nimmt man ein Standbild des Videos, speichert es in einem gewöhnlichen Bildformat und öffnet dieses in einem Bildbearbeitungsprogramm (z.B. Photoshop), so wird das Bild auf dem PC-Monitor entsprechend schmäler dargestellt:

Beispiel: Bildquelle digitales Video
Fernsehmonitor-Darstellung (Simulation) PC-Monitor Darstellung Bildbearbeitungsprogramm


Arbeitet man also ausschliesslich mit Videomaterial, und verwendet dabei die korrekten Einstellungen in den Videoprogrammen, die dafür sorgen, dass das Material korrekt interpretiert wird, so ist auch der Vorgang der Ausgabe auf einen analogen Video- oder Fernsehmonitor völlig unproblematisch, da hierbei die ursprüngliche Geometrie des Videomaterials unverändert bleibt.
Komplizierter wird es, wenn Material eingefügt werden soll, das nicht aus einer Videoumgebung stammt und z.B. in einem 3D-Programm oder einer Bildbearbeitungssoftware erzeugt wird oder wenn einzelne Bilder mit einer nicht-videospezifischen Software bearbeitet werden sollen.
Für diese Fälle gibt es die Möglichkeit der Interpretation von Materialien die in einem Videoprogramm verarbeitet werden sollen:

In den meisten Videoprogrammen wird unter dem Begriff DV oder D1-PAL die Pixel-Seitenverhältnis-Interpretation für digitales PAL-Video angeboten oder als Grundeinstellung für die DV-Bearbeitung vorgegeben.
Der verwendete Faktor beträgt in den meisten Fällen ungefähr 1,067.
Leider ist hier aber einigen Software-Herstellern ein Berechnungsfehler unterlaufen und die Korrektur mit diesem Faktor ist nicht wirklich korrekt:
Der Faktor 1,067 resultiert aus der Annahme, dass 720 Pixel auf einer Breite von ursprünglich 768 Bildpunkten dargestellt werden.
Das Verhältnis von 768:720 entspricht 1,067:1.

Tatsächlich ist es so, dass die 768 Bildpunkte des alten Standards innerhalb von 52µs aufgebaut werden. Für die 720 Pixel ist aber, wie oben beschrieben ein Zeitfenster von ~53,34µs notwendig. Somit ist die Korrektur um den Faktor 1,067 unkorrekt, da man für die Errechnung des Faktors nur zwei Bildbreiten-Werte heranziehen kann, die innerhalb des selben Zeitfensters abgetastet oder aufgebaut werden.
Geht man von einem Zeitfenster von 52µs aus, so muss man sich auf 702 Pixel beziehen und das Verhältnis lautet korrekt: 768:702. Aus dieser Berechnung ergibt sich ein Faktor von 1,094.

Die Praxis

Möchte man in ein Video-Projekt Material einfügen, so ist es notwendig dem Programm die Eigenschaften des Materials in Bezug auf das Pixel-Seitenverhältnis bekannt zu geben. Diese Einstellung wird in Programmen wie Premiere oder After Effects mit der Footage-Interpretation durchgeführt.
Bilder die in einer Bildbearbeitungssoftware (z.B. Photoshop) erstellt wurden, haben immer ein quadratisches Pixel-Seitenverhältnis, dieses wird meist mit "Square Pixel" bezeichnet. Diese Bilder würden, wie oben gezeigt, wenn man sie direkt auf einem Video-Monitor wiedergibt, etwas breiter dargestellt. Aus diesem Grund wirken Videoprogramme der Verzerrung entgegen und rechnen Square-Pixel Bilder auf ein schmäleres Format um.
Nun könnte man davon ausgehen, dass die Erstellung eines Bildes im Format 768x576 Pixel und der Interpretation als Square Pixel in einem Videoprogramm wie Premiere oder After Effects zu einem korrekten Ergebnis führt. Diese Programme verwenden natürlich korrekterweise die DV/D1-Pal Auflösung laut ITU-R BT.601mit 720x576 Pixel. Als Korrekturfaktor für den Import von Bildern wird aber speziell bei Adobe immer der Wert 1,067 verwendet. Dieser Faktor führt, wie oben beschrieben zu einer falschen Korrektur. Im konkreten Fall würden die 768 Pixel der Bildbreite durch 1,067 dividiert was einen Wert von rund 720 Pixel ergibt - das Bild passt dann zwar exakt in das Vorschaufenster - auf einem Videomonitor wird es aber aufgrund des beschriebenen Rechenfehlers immer noch etwas zu breit dargestellt.
Da es meist keine manuelle Einstellmöglichkeit für den Pixel-Seitenverhältnis-Faktor gibt, um den korrekten Wert von 1,094 anzuwenden, muss man die Bilder schon bei der Erstellung entsprechend dimensionieren und korrigieren:
Ausgehend von 720 Pixel Bildbreite kann der entsprechende Square-Pixel-Wert errechnet werden:

Der Square-Pixel Wert für das Ausgangsbild beträgt also 787x576. Auf dieser Fläche werden die gewünschten Bildinhalte (Grafiken, Texte, etc.) erstellt. Vor dem Speichern ändert man dann, mit Hilfe des Eingabefensters "Bildgröße" im Menü "Bild" nur die Breite von 787 auf 720 Pixel, indem man die Option "Proportionen erhalten" deaktiviert:


Durch diese Formatänderung erscheint die Grafik auf dem PC-Monitor nun wesentlich schmäler, auch in Compositing-Programmen wie After Effects wirkt die Geometrie des Bildes zu schmal - auf einem Videomonitor wird die Grafik aber nun korrekt dargestellt. Das bedeutet z.B. ein Kreis wird auch tatsächlich als Kreis wiedergegeben. Wichtig ist hierbei auch auf die Interpretation als D1-DV-Pal zu achten !
Mit der Umrechnung des Formates bereits in Photoshop umgeht man die falsche Korrektur der Adobe-Video-Programme, da Bilder die dem Format der Projekteinstellung des Videoprogrammes entsprechen nicht mehr korrigiert werden. (Im konkreten Beispiel ist das das Standardformat für D1-DV-PAL, also 720x576).

Nur wenige PC oder Mac-Programme arbeiten mit dem richtigen Korrekturfaktor von ca. 1,09.
Z.Zt. wird dieses Pixel Seiten Verhältnis nur in Sony Vegas angeboten.
Professionelle High-End Video-Workstations von Discreet oder Quantel arbeiten natürlich auch korrekt...

Praxisbeispiele

Zur Vereinfachung 4 Szenarien von üblichen Produktionsabläufen und die jeweilige Problemstellung bzgl. dem Pixelseitenverhältnis:

Beispiel 1

  • DV-Videomaterial wird über Firewire auf den Computer überspielt
  • das Ausgangsmaterial wird mit Premiere / FCP geschnitten und vertont
  • das fertige Video wird über Firewire wieder auf ein DV-Band ausgespielt und auf einem Video-Monitor bzw. Fernsehgerät präsentiert

Bei der Bearbeitung von DV-Videomaterial mit den gängigen Programmen treten für gewöhnlich keine Probleme in Bezug auf das Pixelseitenverhältnis auf, da die Programme bei der Verwendung der DV-Pal Voreinstellungen mit fest eingestellten Werten arbeiten und das Ausgangsmaterial während der Verarbeitung in seiner Geometrie nicht verändert wird.

Beispiel 2

  • DV-Videomaterial wird über Firewire auf den Computer überspielt
  • das Ausgangsmaterial wird mit Premiere / FCP geschnitten und vertont
  • Grafikelemente die im Photoshop erstellt werden, werden als Logo und Abspann eingefügt
  • das fertige Video wird über Firewire wieder auf ein DV-Band ausgespielt und auf einem Video-Monitor bzw. Fernsehgerät präsentiert

Werden Grafiken bzw. Textelemente in nicht video-spezifischen Programmen (wie etwa Photoshop) generiert, so werden diese Grafiken üblicherweise im Format 768x576 erstellt und beim Import in ein Videoprogramm als Square-Pixel interpretiert . Der oben beschriebene Korrekturfehler wird so in Kauf genommen und führt zu einer geringfügig breiteren Darstellung der Grafiken bei der Ausgabe auf einem Videomonitor.
Meist fällt dieser Fehler nicht auf und kann häufig auch vernachlässigt werden.
Legt man aber großen Wert auf Genauigkeit so sollte man die Grafiken, wie im letzten Abschnitt beschrieben schon im Photoshop ausgehend vom Format 787x576 Pixel vor dem Speichern auf eine Breite von 720 Pixel, nicht proportional, skalieren. Im Schnittprogramm verwendet man dann die Interpretation DV/D1-Pal und die Grafik wird korrekt auf Video ausgegeben.

Beispiel 3

  • DV-Videomaterial wird in After Effects nachbearbeitet
  • Text-Elemente werden in After Effects eingefügt
  • Grafikelemente werden mit Hilfe von Masken und Pfadwerkzeugen in After Effects erstellt
  • Das Ergebnis wird mit den DV/D1-Pal Einstellungen als DV-Video gerendert
  • Das fertige Video wird in Premiere geöffnet, auf DV-Band ausgegeben und auf einem Video-Monitor bzw. Fernsehgerät präsentiert

Das DV-Videomaterial muss beim Importieren in After Effects als DV/D1-Pal interpretiert werden. Das Videomaterial bleibt so in seiner Geometrie unverändert und wird auch nach der Bearbeitung korrekt auf einem Videomonitor dargestellt.
Texte und Grafiken die in After Effects erstellt werden, werden auch hier mit dem nicht korrekten Faktor 1,067 an den DV-Standard angepasst und die Schriften werden bei der Ausgabe auf einem Video-Monitor etwas breiter, also leicht verzerrt dargestellt.
Legt man großen Wert auf Genauigkeit, sollte man die Grafik- und Textelemente wie oben beschrieben im Photoshop vorbereiten. Dadurch geht allerdings die Funktionalität für Textanimationen in After Effects verloren. Als Ausweg kann man hier alle Grafik- und Textebenen in After Effects mit dem Skalierungswerkzeug auf eine Breite von 97,5% einstellen und erhält so ein annähernd korrektes Ergebnis - Voraussetzung dafür ist wiederum eine Ebenengröße von 720x576 Interpretation: D1/DV-Pal oder 768x576 Interpretation: Square Pixel. Der Skalierungs-Wert von 97,5% in der Breite umgeht dabei den Korrekturfehler des Programms.

Beispiel 4

  • Eine 3D-Animation wird in einem 3D-Programm erstellt und soll für die Präsentation auf einem Video-Monitor bzw. Fernsehgerät auf Videoband ausgegeben werden

Üblicherweise werden Animationen als Einzelbildsequenzen oder Video-Dateien mit einer Einzelbildgröße von 768x576 Pixel gerendert und mit Hilfe eines Videoprogramms weiterbearbeitet und dann auf Videoband ausgespielt. Auch hier wird beim Import in ein Video-Programm die Geometrie der Bilder in der Breite verändert und so bei Verwendung eines Programmes das einen anderen Korrekturfaktor als 1,09 anwendet, unkorrekt auf einem Videomonitor dargestellt.
Hier gibt es 2 Möglichkeiten: Entweder man benutzt ein Video-Programm das korrekt arbeitet - wie z.B. Sony Vegas. Oder man rendert die gesamte Animation als Einzelbildsequenz mit einer Größe von 787x576 Pixel und benutzt die Stapelverarbeitungs-Funktion von Photoshop um jedes einzelne Bild auf eine Breite von 720 Pixel umzurechnen. Die so korrigierte Einzelbildsequenz kann dann in Premiere importiert und auf Band ausgespielt werden.

Fazit

In den meisten Fällen der Videobearbeitung reicht die Berücksichtigung der entsprechenden Interpretation von Video- und Bildmaterial für ein zufriedenstellendes Ergebnis aus.
Sind die Ansprüche an das Ergebnis aber sehr hoch, so sollte man die oben angeführten Tatsachen berücksichtigen. Wirklich notwendig ist dies z.B. beim Einsatz von Firmenlogos, die auf keinen Fall verzerrt dargestellt werden sollen.




Mit freundlicher Unterstützung von Holger Scheel