
Der Ausdruck »Metadaten« bedeutet wörtlich »Daten über Daten«. Metadaten stellen eine Art Visitenkarte mit einem Satz von Eigenschaften (Properties) für ein digitales Dokument dar. Jede dieser Properties verfügt über eine spezielle Bedeutung in der Extensible Metadata Platform (XMP).
Das Format Extensible Metadata Platform (XMP) basiert auf XML und wurde nach dem vom W3C entwickelten RDF (Resource Description Framework) entworfen, das die Grundlage der Semantic Web Initiative bildet. 2012 wurde XMP als ISO 16684-1:2012 standardisiert.
XMP-Metadaten wandern mit der Datei mit und lassen sich in viele gängige Dateiformate inklusive PDF, TIFF und JPEG einbetten. Die in den Metadaten enthaltenen Eigenschaften (Properties) werden zu Schemas zusammengefasst. Jedes Schema enthält eine beliebige Anzahl von Properties und wird durch einen eindeutigen URI des zugehörigen Namensraums identifiziert. URIs des Namensraums ähneln (oder entsprechen oft sogar) den üblichen Web-Adressen, beziehen sich im Gegensatz dazu aber nicht auf eine bestimmte Web-Seite. Sie verweisen nicht auf eine bestimmte Ressource – sondern stellen lediglich eine eindeutige Identifikation für eine in XMP verwendete Einheit dar.
Die XMP-Spezifikation umfasst mehr als ein Dutzend vordefinierte Schemas mit Hunderten von Properties für übliche Dokument- und Bildmerkmale. Das am häufigsten verwendete XMP-Schema heißt Dublin Core oder dc und enthält allgemeine Properties wie Title, Creator, Subject und Description. Außerdem können benutzerdefinierte Schemas erstellt werden, wenn firmen- oder branchenspezifische Metadaten erforderlich sind.
Dublin Core wurde als ISO 15836 standardisiert (veröffentlicht 2003, überarbeitet 2009): »Information and documentation — The Dublin Core metadata element set«.
XMP ist in allen Publishing-Produkten von Adobe implementiert und wird von zahlreichen unabhängigen Software-Anbietern und Anwendervereinigungen unterstützt. Adobe Bridge, das mit der Creative Suite ausgeliefert wird, verarbeitet XMP-Metadaten in verschiedenen Dateiformat
XMP für PDF-Dokumente wurde mit Acrobat 5 und PDF 1.4 im Jahre 2001 eingeführt. Der Vorgänger von XMP in PDF bestand aus einfachen Schlüssel/Wert-Paaren, so genannten Dokumentinfo-Einträgen, die vor der Einführung von XMP dazu dienten, Metadaten zu transportieren. Dokumentinfo-Einträge werden in Acrobat und PDF zwar nach wie vor unterstützt, XMP-Metadaten sind aber ein weit leistungsfähigeres Konzept und gewährleisten zudem, dass Metadaten auch bei Formatkonvertierungen, z.B. von eingescanntem TIFF nach PDF erhalten bleiben.
Weitere Informationen über XMP in PDF finden Sie in unserem XMP Whitepaper.
Es gibt mehrere ISO-Standards, die eine Teilmenge von PDF für bestimmte Anwendungsgebiete wie grafische Industrie, Archivierung oder Konstruktionswesen spezifizieren. Mit Ausnahme der Prepress-Standards PDF/X-1 und X-3, die in den Jahren 2001 und 2002 eingeführt wurden, enthalten alle ISO-Standards für PDF die Verwendung von XMP-Metadaten (meist obligatorisch außer bei ISO 32000). Sofern nicht anders beschrieben, basieren alle Standards auf XMP 2005:
PDF/A-1 in ISO 19005-1 (veröffentlicht 2005): »Electronic document file format for long-term preservation – Use of PDF 1.4«. PDF/A-1 benötigt XMP zur Erkennung konformer Dateien und unterstützt benutzerdefinierte Metadaten mittels XMP-Extension-Schemas. Die XMP-Unterstützung in PDF/A-1 basiert auf der Spezifikation XMP 2004.
PDF/A-2 in ISO 19005-2 (veröffentlicht 2011): »Electronic document file format for long-term preservation – Part 2: Use of ISO 32000-1 (PDF/A-2)«
PDF/A-3 in ISO 19005-3 (veröffentlicht 2012): »Electronic document file format for long-term preservation – Part 3: Use of ISO 32000-1 with support for embedded files (PDF/A-3)«
PDF/E-1 in ISO 24517-1 (veröffentlicht 2008): »Engineering document format using PDF – Use of PDF 1.6«. Die XMP-Unterstützung in PDF/E entspricht im wesentlichen derjenigen in PDF/A-1, basiert aber auf der neueren Spezifikation XMP 2005.
PDF/X-4 in ISO 15930-7 (veröffentlicht 2008, überarbeitet 2010): »Complete exchange of printing data (PDF/X-4) and partial exchange of printing data with external profile reference (PDF/X-4p) using PDF 1.6«. Ähnlich wie bei PDF/A-1 wird XMP benötigt, um die Konformität zu Standards in PDF/X-4 auszudrücken.
PDF/X-5 in ISO 15930-8 (Veröffentlichung 2008, Überarbeitung 2010): »Partial exchange of printing data using PDF 1.6 (PDF/X-5)«. PDF/X-2- und PDF/X-5-Dokumente verweisen auf andere PDF/X-Dokumente, wobei das Verweisziel durch verschiedene XMP-Einträge festgelegt ist. XMP wird damit zu einem wesentlichen Bestandteil von PDF/X-2 und PDF/X-5.
ISO 32000 (veröffentlicht 2008, inoffizielle Version hier): »Document management – Portable document format – PDF 1.7«. ISO 32000 ist die standardisierte Fassung von PDF 1.7. Der technikbezogene Inhalt entspricht PDF 1.7, das vollständige Unterstützung von XMP-Metadaten bietet.
PDF/VT in ISO 16612 (veröffentlicht 2010): »Variable data exchange – Part 2: Using PDF/X-4 and PDF/X-5 (PDF/VT-1 and PDF/VT-2)«. Falls Sie mehr über PDF/VT wissen möchten, lesen Sie auch unserePDF/VT Seite.
PDF/UA in ISO 14289-1 (veröffentlicht 2012): »Document management applications – Electronic document file format enhancement for accessibility - Part 1: Use of ISO 32000-1 (PDF/UA-1)«
PDFlib-Produkte enthalten folgende Art von Unterstützung für XMP in PDF (Einzelheiten finden Sie in unserem XMP Whitepaper und auf den produktspezifischen Seiten):
PDFlib: generiert PDF-Dokumente mit XMP-Metadaten auf Dokument-, Seiten- oder Bildebene. Beispielcode zum Importieren und Einbetten von XMP mit PDFlib finden Sie im PDFlib Cookbook. Eine Demonstration der Verwendung von XMP für PDF/A inklusive XMP-Extension-Schemas erhalten Sie hier.
PDFlib+PDI, PDFlib Personalization Server (PPS): kombiniert PDF-Dokumente bei Kontrolle der XMP-Metadaten
PLOP: fügt XMP in vorhandene PDF-Dokumente ein
pCOS: extrahiert XMP aus PDF-Dokumenten auf Dokument-, Seiten- und Bildebene
PDFlib Text Extraction Toolkit (TET): bindet XMP in XML ein, aus PDF Dokumenten erstellt
TET PDF IFilter: ermöglicht Windows-Suchmaschinen, XMP-Metadaten zu durchsuchen
Zentrale XMP-Seite von Adobe:
www.adobe.com/products/xmp/
XMP 2012 Spezifikation und XMP-Entwickler-Seite von Adobe mit XMP Toolkit:
http://www.adobe.com/devnet/xmp.html
Spezifikation XMP 2004 (nur relevant für PDF/A-1):
www.aiim.org/documents/standards/xmpspecification.pdf
Spezifikation XMP 2005:
http://partners.adobe.com/public/developer/en/xmp/sdk/XMPspecification.pdf
XMP Standard ISO 16684-1 (veröffentlicht 2012): »Extensible metadata platform (XMP) specification — Part 1: Data model, serialization and core properties«