Überblick über XMP

XMP-Metadaten

Der Ausdruck »Metadaten« bedeutet wörtlich »Daten über Daten«. Metadaten stellen eine Art Visitenkarte mit einem Satz von Eigenschaften (Properties) für ein digitales Dokument dar. Jede dieser Properties verfügt über eine spezielle Bedeutung in der Extensible Metadata Platform (XMP).

Extensible Metadata Platform (XMP)

Das Format Extensible Metadata Platform (XMP) basiert auf XML und wurde nach dem vom W3C entwickelten RDF (Resource Description Framework) entworfen, das die Grundlage der Semantic Web Initiative bildet. 2012 wurde XMP als ISO 16684-1:2012 (überarbeitet 2019) standardisiert.

XMP-Metadaten wandern mit der Datei mit und lassen sich in viele gängige Dateiformate inklusive PDF, TIFF und JPEG einbetten. Die in den Metadaten enthaltenen Eigenschaften (Properties) werden zu Schemas zusammengefasst. Jedes Schema enthält eine beliebige Anzahl von Properties und wird durch einen eindeutigen URI des zugehörigen Namensraums identifiziert. URIs des Namensraums ähneln (oder entsprechen oft sogar) den üblichen Web-Adressen, beziehen sich im Gegensatz dazu aber nicht auf eine bestimmte Web-Seite. Sie verweisen nicht auf eine bestimmte Ressource - sondern stellen lediglich eine eindeutige Identifikation für eine in XMP verwendete Einheit dar.

Die XMP-Spezifikation umfasst mehr als ein Dutzend vordefinierte Schemas mit Hunderten von Properties für übliche Dokument- und Bildmerkmale. Das am häufigsten verwendete XMP-Schema heißt Dublin Core oder dc und enthält allgemeine Properties wie Title, Creator, Subject und Description. Außerdem können benutzerdefinierte Schemas erstellt werden, wenn firmen- oder branchenspezifische Metadaten erforderlich sind.

Dublin Core wurde als ISO 15836 standardisiert (veröffentlicht 2003, überarbeitet 2009): »Information and documentation - The Dublin Core metadata element set«.

XMP ist in allen Publishing-Produkten von Adobe implementiert und wird von zahlreichen unabhängigen Software-Anbietern und Anwendervereinigungen unterstützt. Adobe Bridge, das mit der Cre­ative Suite ausgeliefert wird, verarbeitet XMP-Metadaten in verschiedenen Dateiformaten.

PDF und XMP

XMP für PDF-Dokumente wurde mit Acrobat 5 und PDF 1.4 im Jahre 2001 eingeführt. Der Vorgänger von XMP in PDF bestand aus einfachen Schlüssel/Wert-Paaren, so genannten Dokument-Infofeldern, die vor der Einführung von XMP dazu dienten, Metadaten zu transportieren. Dokument-Infofelder werden in Acrobat und PDF zwar nach wie vor unterstützt, XMP-Metadaten sind aber ein weit leistungsfähigeres Konzept und gewährleisten zudem, dass Metadaten auch bei Formatkonvertierungen, z.B. von eingescanntem TIFF nach PDF erhalten bleiben.

XMP in ISO-Standards für PDF

Es gibt verschiedene ISO-Standards, die eine Teilmenge von PDF für bestimmte Anwendungsgebiete wie grafische Industrie, Archivierung oder Ingenieurwesen spezifizieren. Mit Ausnahme der älteren Prepress-Standards PDF/X-1 und PDF/X-3, die bereits 2001 bzw. 2002 eingeführt wurden, enthalten alle ISO-Standards für PDF die Verwendung von XMP-Metadaten (meist obligatorisch außer bei ISO 32000). Dazu gehören PDF/A, PDF/UA, PDF/E, PDF/X-4/5 und ISO 32000-1 (PDF 1.7). ISO 32000-2:2017 »Document management - Portable Document Format - PDF 2.0« erklärt die herkömmlichen Dokument-Infofelder für hinfällig und löst sie durch XMP-Metadaten ab (außer den Feldern CreationDate und ModDate).

XMP-Unterstützung in PDFlib-Produkten

PDFlib-Produkte enthalten folgende Art von Unterstützung für XMP in PDF (Einzelheiten finden Sie auf den produktspezifischen Seiten):

  • PDFlib: generiert PDF-Dokumente mit XMP-Metadaten auf Dokument-, Seiten- oder Bildebene. Beispielcode zum Importieren und Einbetten von XMP mit PDFlib finden Sie im PDFlib Cookbook. Eine Demonstration der Verwendung von XMP für PDF/A inklusive XMP-Extension-Schemas erhalten Sie hier.
  • PDFlib+PDI, PDFlib Personalization Server (PPS): kombiniert PDF-Dokumente bei Kontrolle der XMP-Metadaten
  • PLOP und PLOP DS: fügt XMP in vorhandene PDF-Dokumente ein oder löscht XMP
  • pCOS: extrahiert XMP aus PDF-Dokumenten auf Dokument-, Seiten- und Bildebene
  • PDFlib Text and Image Extraction Toolkit (TET): bindet XMP in XML ein, aus PDF-Dokumenten erstellt
  • TET PDF IFilter: ermöglicht Windows-Suchmaschinen, XMP-Metadaten zu durchsuchen

XMP-Ressourcen

Zentrale XMP-Seite von Adobe:
http://www.adobe.com/products/xmp.html

XMP 2012 Spezifikation und XMP-Entwickler-Seite von Adobe mit XMP Toolkit:
http://www.adobe.com/devnet/xmp.html

XMP Standard ISO 16684-1 (zuerst 2012 veröffentlicht, 2019 überarbeitet): »Extensible metadata platform (XMP) specification - Part 1: Data model, serialization and core properties«