Überblick

PDF - Portable Document Format - wurde dazu entwickelt, ein plattformübergreifendes Format für Bild und Text zu schaffen. Anfangs war es nur auf Bild und Text optimiert, da man allerdings viele Optionen zur Verfügung hat, entwickelte sich PDF auch in andere Richtungen:

  • PDF/X PDF Format für die Druckvorstufe, ISO 15930-1, 15930-3
  • PDF/A PDF Archive, Format für die Langzeitspeicherung, ISO (CD) 19005
  • PDF/E PDF Engineering, Format für technische Zeichnungen, Draft (AIIM International/ANSI)

Entwicklungsgeschichte

PDF wurde von der Firma Adobe 1993 an die Öffentlichkeit gebracht, jedoch stand man dem Format von Anfang an skeptisch gegenüber. Mittlerweile sind PDF Dokumente im WWW jedoch schon stark verbreitet.

PDF kann man mit dem Programm Acrobat Reader (heute: Adobe Reader) anzeigen, jedoch war das Programm anfangs kostenpflichtig. Erst als eine kostenfreie Version verfügbar war, verbreitete sich PDF in großem Ausmaß.

Adobe stellt das Programm Acrobat Writer, mit dem sich PDF Dateien erstellen lassen, kostenpflichtig bereit. Mittlerweile gibt es jedoch schon viele Tools, die eine Erstellung mittels des Druckbefehls ermöglichen. Man installiert praktisch einen PDF-Drucker, welcher in jedem Programm das Drucken kann, verfügbar ist und "druckt" sich die Datei aus. Dieser Drucker erzeugt die PDF-Datei und legt sie auf der Festplatte ab.

Diverse Tools konnten sich entwickeln, da das PDF Format zwar proprietär, also hauseigen (Adobe), jedoch trotzdem offen ist und auf PostScript basiert, welches ebenfalls offen ist.

Datenstruktur

Ein Document wird mit PostScript beschrieben und sieht dann so aus:

%PDF−1.4
1 0 obj
<< /Type /Catalog
/Outlines 2 0 R
/Pages 3 0 R
>>
endobj
2 0 obj
<< /Type Outlines
/Count 0
>>
endobj
3 0 obj
<< /Type /Pages
/Kids [4 0 R]
/Count 1
>>
endobj
4 0 obj
<< /Type /Page
/Parent 3 0 R
/MediaBox [0 0 612 792]
/Contents 5 0 R
/Resources << /ProcSet 6 0 R >>
>>
endobj
5 0 obj
<< /Length 35 >>
stream
…Page-marking operators…
endstream
endobj
6 0 obj
[/PDF]
endobj
xref
0 7
0000000000 65535 f
0000000009 00000 n
0000000074 00000 n
0000000120 00000 n
0000000179 00000 n
0000000300 00000 n
0000000384 00000 n
trailer
<< /Size 7
/Root 1 0 R
>> startxref
408
%%EOF

Da PDF sehr mächtig ist, wird eine gewisse Struktur benötigt:

Objekte (Objects) sind

  • Boolsche Werte
  • Integer und reale Zahlen
  • Strings
  • Namen
  • Listen
  • Wörterbücher
  • Streams

Objekte können einen Bezeichner zugewiesen bekommen und werden dann "Indirekte Objekte" genannt.

Die Dateistruktur (File Structure)

Enthält 4 Sektionen:

  • Einen Header, der Auskunft über die PDF Version gibt.
  • Eine Sektion Body, die die einzelnen Objekte enthält.
  • Eine Objektzuordnungstabelle, die Informationen über die indirekten Objekte enthält
  • Den Trailer, der die Adresse der Zuordnungstabelle und spezieller Objekte enthält

Die Dokumentstruktur (Document Structure)

verwaltet lediglich die einzelnen Seiten und die hierachische Struktur.

Content Streams

Ein PDF ist so aufgebaut, dass es gestreamt werden kann. Jede Seite kann als ein oder mehr Content Streams representiert werden. Nötig ist so ein Content Stream, da die Daten in einem PDF nach dem random-access Verfahren abgelegt sind und daher kein sequentieller Abruf möglich ist. Durch die Content Streams ist ein sequentieller Abruf möglich.

Kompression

In PDF werden Text und Bilddaten komprimiert.

  • JPEG (und seit PDF 1.5 JPEG2000) für Bilder
  • CCITT (Group 3 und 4) und seit PDF 1.4 JBIG2 für Monochrom Bilder
  • LZW für Text, Bild und Grafiken.

Speicheroptionen

Seit Acrobat 5 ist es möglich, PDF Dateien als RTF (Rich Text Format) abzuspeichern, um den Text auch in anderen Anwendungen nutzen zu können. Weiters ist es möglich, die Datei als JPEG, TIFF oder PNG abzuspeichern.

Erstellt man eine PDF Datei in Adobe Photoshop, bekommt man beim speichern einen Dialog mit verschiedenen Einstellungsmöglichkeiten. Die Kodierung bezieht sich auf Halbtonbilder. Diese PDFs werden "Photoshop PDF" genannt. Alle anderen werden als "generisches PDF" bezeichnet. Der Unterschied besteht darin, dass generische PDFs mehrere Seiten beinhalten können, Photoshop PDF jedoch nicht. Öffnet man ein generisches PDF in Photoshop, wird das PDF beim Öffnen gerastert, also alle Ebenen auf eine reduziert.

Die Textebenen bleiben beim Speichern von Photoshop PDFs erhalten, ebenso wie Ebenen mit Vektorelementen (wenn man die Option "Mit Vektordaten" wählt), welche beim Speichern von EPS verloren gehen würden. Ebenen mit Transparenzinformationen werden mitgespeichert, also nicht mit einer Hintergrundfarbe gefüllt.

Bildinterpolation dient dazu, dass Bilder mit niedriger Auflösung beim Druck geglättet werden um so eine bessere Qualität zu liefern.

Wenn man Schriftarten verwendet, die nicht standardmäßig am PC installiert sind, kann man diese auch in die PDF Datei einbetten. Die Datei wird dadurch zwar größer, allerdings wird somit garantiert, dass die PDF Datei auf jedem PC korrekt angezeigt wird.

Vergleiche

Vergleiche mit anderen Grafikdateiformaten fallen schwer, da PDF eigentlich kein Grafikformat in dem Sinne ist. Am ehesten kann man PDF mit SVG vergleichen, da SVG gewissermaßen ein Dokument beschreibt, jedoch mit XML, anstatt von PostScript.

Vorteile/Nachteile

Vorteile

Der Hauptvorteil von PDF ist die Präzision, die durch PostScript zustande kommt. Dokumente werden exakt so wiedergegeben, wie sie im Erstellungsprogramm erscheinen. Vektorgrafiken und Schriften können beispielsweise bis zu 6400% vergrößert werden und man kann mehrere tausend Seiten speichern. Eine Seite darf eine maximale Größe von 4 mal 4 Metern haben.

PDF kann mit 40 bis 128 Bit verschlüsselt werden, somit kann der Ersteller sein Dokument schützen. Ein weiterer Vorteil ist die Dateigröße, die in den meisten Fällen kleiner ist, als die Ursprungsdatei.

Nachteile

  • Keine Editierbarkeit
  • die Verarbeitung erfordert immer einen PostScript-Interpreter

Anwendungsgebiete

PDF wird im WWW zur Bereitstellung von plattformunabhängigen Informationen in Schrift und Bild verwendet. Da immer mehr Anwender ihre Dokument kopierschützen wollen, bietet PDF eine entsprechende Option an mit der dies möglich ist.

Module, die für die Durchführung vorausgesetzt werden

Ergänzende und vertiefende Module