XMP-Metadaten

Der Ausdruck »Metadaten« bedeutet wörtlich »Daten über Daten«. Metadaten stellen eine Art Visitenkarte mit einem Satz von Eigenschaften (Properties) für ein digitales Dokument dar. Jede dieser Properties verfügt über eine spezielle Bedeutung in der Extensible Metadata Platform (XMP).


Extensible Metadata Platform (XMP)

Das Format Extensible Metadata Platform (XMP) basiert auf XML und wurde von Adobe nach dem vom W3C entwickelten RDF (Resource Description Framework) entworfen, das die Grundlage der Semantic Web Initiative bildet. Adobe stellt die XMP-Spezifikation nicht nur kostenlos zur Verfügung, sondern bietet zudem ein Open-Source XMP-Toolkit für Software-Entwickler.

XMP-Metadaten wandern mit der Datei mit und lassen sich in viele gängige Dateiformate inklusive PDF, TIFF und JPEG einbetten. Die in den Metadaten enthaltenen Eigenschaften (Properties) werden zu Schemas zusammengefasst. Jedes Schema enthält eine beliebige Anzahl von Properties und wird durch einen eindeutigen URI des zugehörigen Namensraums identifiziert. URIs des Namensraums ähneln (oder entsprechen oft sogar) den üblichen Web-Adressen, beziehen sich im Gegensatz dazu aber nicht auf eine bestimmte Web-Seite. Sie verweisen nicht auf eine bestimmte Ressource – sondern stellen lediglich eine eindeutige Identifikation für eine in XMP verwendete Einheit dar.

Die XMP-Spezifikation umfasst mehr als ein Dutzend vordefinierte Schemas mit Hunderten von Properties für übliche Dokument- und Bildmerkmale. Das am häufigsten verwendete XMP-Schema heißt Dublin Core oder dc und enthält allgemeine Properties wie Title, Creator, Subject und Description. Außerdem können benutzerdefinierte Schemas erstellt werden, wenn firmen- oder branchenspezifische Metadaten erforderlich sind.

Weitere Informationen über XMP in PDF finden Sie in unserem XMP Whitepaper.


PDF und XMP

XMP für PDF-Dokumente wurde mit Acrobat 5 und PDF 1.4 im Jahre 2001 eingeführt. Der Vorgänger von XMP in PDF bestand aus einfachen Schlüssel/Wert-Paaren, so genannten Dokumentinfo-Einträgen, die vor der Einführung von XMP dazu dienten, Metadaten zu transportieren. Dokumentinfo-Einträge werden in Acrobat und PDF zwar nach wie vor unterstützt, XMP-Metadaten sind aber ein weit leistungsfähigeres Konzept und gewährleisten zudem, dass Metadaten auch bei Formatkonvertierungen, z.B. von eingescanntem TIFF nach PDF erhalten bleiben.

XMP ist in allen Publishing-Produkten von Adobe implementiert und wird von zahlreichen unabhängigen Software-Anbietern und Anwendervereinigungen unterstützt. Adobe Bridge, das mit der Cre­ative Suite ausgeliefert wird, verarbeitet XMP-Metadaten in verschiedenen Dateiformaten.


XMP in ISO-Standards

Es gibt mehrere veröffentlichte oder geplante ISO-Standards, die eine Teilmenge von PDF für bestimmte Anwendungsgebiete wie grafische Industrie, Archivierung oder Konstruktionswesen spezifizieren. Mit Ausnahme der Prepress-Standards PDF/X-1 und X-3, die in den Jahren 2001 und 2002 eingeführt wurden, enthalten alle ISO-Standards für PDF die Verwendung von XMP-Metadaten (meist obligatorisch außer bei ISO 32000):

PDF/A-1 in ISO 19005-1 (veröffentlicht 2005): »Electronic document file format for long-term preservation – Use of PDF 1.4«. PDF/A-1 benötigt XMP zur Erkennung konformer Dateien und unterstützt benutzerdefinierte Metadaten mittels XMP-Extension-Sche­mas. Die XMP-Unterstützung in PDF/A-1 basiert auf der Spezifikation XMP 2004.

PDF/E-1 in ISO 24517-1 (veröffentlicht 2008): »Engineering document format using PDF – Use of PDF 1.6«. Die XMP-Unterstützung in PDF/E entspricht im wesentlichen derjenigen in PDF/A-1, basiert aber auf der neueren Spezifikation XMP 2005.

PDF/X-4 in ISO 15930-7 (veröffentlicht 2008): »Complete exchange of printing data (PDF/X-4) and partial exchange of printing data with external profile reference (PDF/X-4p) using PDF 1.6«. Ähnlich wie bei PDF/A-1 wird XMP benötigt, um die Konformität zu Standards in PDF/X-4 auszudrücken. Die XMP-Unterstützung in PDF/X-4 basiert auf der XMP-2005-Spezifikation.

PDF/X-2 in ISO 15930-5 (veröffentlicht 2003) und PDF/X-5 in ISO 15930-8 (Veröffentlichung 2008): »Partial exchange of printing data using PDF 1.6 (PDF/X-5)«. PDF/X-2- und X-5-Dokumente verweisen auf andere PDF/X-Dokumente, wobei das Verweisziel durch verschiedene XMP-Einträge festgelegt ist. XMP wird damit zu einem wesentlichen Bestandteil von PDF/X-2 und X-5.

ISO 32000 (veröffentlicht 2008): »Document management – Porta­ble document format – PDF 1.7«. ISO 32000 ist die standardisierte Fassung von PDF 1.7. Der technikbezogene Inhalt entspricht PDF 1.7 (dem Dateiformat von Acrobat 8), das vollständige Unterstützung von XMP-Metadaten bietet.

Dublin Core, eines der am häufigsten verwendeten vordefinierten Schemas für XMP-Metadaten, wurde als ISO 15836 standardisiert (veröffentlicht 2003): »Information and documen­tation — The Dublin Core metadata element set«.


XMP-Unterstützung in PDFlib-Produkten

PDFlib-Produkte enthalten folgende Art von Unterstützung für XMP in PDF und PDF/A-1 (Einzelheiten finden Sie in unserem XMP Whitepaper und auf den produktspezifischen Seiten):

PDFlib: generiert PDF-Dokumente mit XMP-Metadaten auf Dokument- oder Bildebene. Beispielcode zum Importieren und Einbetten von XMP mit PDFlib finden Sie im PDFlib Cookbook. Eine Demonstration der Verwendung von XMP für PDF/A inklusive XMP-Extension-Schemas erhalten Sie hier.

PDFlib+PDI, PDFlib Personalization Server (PPS): kombiniert PDF-Dokumente bei Kontrolle der XMP-Metadaten

PLOP: fügt XMP in vorhandene PDF-Dokumente ein

pCOS: extrahiert XMP aus PDF-Dokumenten auf Dokument- und Bildebene

TET PDF IFilter: ermöglicht Windows-Suchmaschinen, XMP-Metadaten zu durchsuchen


Ressourcen

Zentrale XMP-Seite von Adobe:
www.adobe.com/products/xmp/

XMP-Entwickler-Seite von Adobe:
partners.adobe.com/public/developer/xmp/topic.html

Spezifikation XMP 2004 (relevant für PDF/A-1):
www.aiim.org/documents/standards/xmpspecification.pdf

Spezifikation XMP 2005 (relevant für PDF/E):
www.adobe.com/devnet/xmp/pdfs/xmp_specification.pdf

XMP Open Initiative der Industrie:
www.xmpopen.org

RDF-Informationen beim W3C:
www.w3.org/RDF/