XMP in PDF/A

XMP in PDF/A

PDF/A verlangt den Einsatz von XMP zur Identifikation von PDF-Dokumenten als konform zum PDF/A-Standard. XMP-Unterstützung in PDF/A-1 basiert auf der Spezifikation XMP 2004: alle Properties aus den in XMP 2004 spezifizierten vordefinierten Schemas können direkt in konformen Dokumenten verwendet werden. XMP-Unterstützung in PDF/A-2 und PDF/A-3 basiert auf der Spezifikation XMP 2005.

Die folgende Tabelle zeigt die Namen, URIs des Namensraums und bevorzugten Namensraum-Präfixe für die in XMP 2004 spezifizierten vordefinierten XMP-Schemas. Die Namen und Beschreibungen aller in vordefinierten Schemas enthaltenen Properties finden Sie in der Spezifikation XMP 2004 (leider ist die offizielle Version dieses Dokuments nicht mehr online verfügbar).

Schemaname und -beschreibungURI des Namensraumsbevorzugtes Namensraum-Präfix
Adobe PDF Schema"http://ns.adobe.com/pdf/1.3/"pdf
Dublin Core Schema"http://purl.org/dc/elements/1.1/"dc
EXIF Schema für EXIF-spezifische Properties"http://ns.adobe.com/exif/1.0/"exif
EXIF Schema für TIFF-Properties"http://ns.adobe.com/tiff/1.0/"tiff
Photoshop Schema"http://ns.adobe.com/photoshop/1.0/"photoshop
XMP Basic Job Ticket Schema"http://ns.adobe.com/xap/1.0/bj"xmpBJ
XMP Basic Schema"http://ns.adobe.com/xap/1.0/"xmp
XMP Media Management Schema"http://ns.adobe.com/xap/1.0/mm/"xmpMM
XMP Paged-Text Schema"http://ns.adobe.com/xap/1.0/t/pg/"xmpTPg
XMP Rights Management Schema"http://ns.adobe.com/xap/1.0/rights/"xmpRights

XMP-Extension-Schemas für PDF/A

Die oben angeführten vordefinierten XMP-Schemas erfüllen viele der generell an Metadaten gestellten Anforderungen, firmen- oder branchen-spezifische Anforderungen lassen sich aber nur über benutzerdefinierte XMP-Schemas abdecken. Zu diesem Zweck unterstützt PDF/A den Einsatz so genannter Extension-Schemas (Erweiterungsschemas). Ein Extension-Schema ist eine Sammlung von Metadaten-Eigenschaften für ein bestimmtes Anwendungsszenario. Um sicherzustellen, dass Extension-Schemas auch später noch korrekt interpretiert werden können, verlangt PDF/A, dass eine Beschreibung aller verwendeten Extension-Schemas im XMP eingebettet ist. Dieses so genannte Container-Schema für Extension-Schemas enthält den Namen und die Beschreibung aller Properties sowie deren XMP-Datentyp. Die Beschreibung muss formalisiert anhand der XMP-Schemas und -Properties erfolgen, die für PDF/A ausführlich erläutert werden. Die folgende Tabelle zeigt die Namensräume für diese Extension-Schema-Beschreibung.

Schemaname und -beschreibungURI des Namensraumserforderliches Namensraum-Präfix
PDF/A Container-Schema für Extension-Schema "http://www.aiim.org/pdfa/ns/extension/"pdfaExtension
PDF/A Feldtypschema"http://www.aiim.org/pdfa/ns/field#"pdfaField
PDF/A property value type"http://www.aiim.org/pdfa/ns/property#"pdfaProperty
PDF/A schema value type"http://www.aiim.org/pdfa/ns/schema#"pdfaSchema
PDF/A ValueType value type"http://www.aiim.org/pdfa/ns/type#"pdfaType

Beispiel-Extension-Schemas für PDF/A

Wir stellen Ihnen verschiedene Extension-Schemas als Beispiele zur Verfügung, auf deren Basis Sie eigene PDF/A-konforme Extension-Schemas erstellen können. Sie enthalten eine Klartextbeschreibung der benutzerdefinierten XMP-Schemas und -Properties sowie eine entsprechende maschinenlesbare Fassung gemäß der in PDF/A festgeschriebenen Regeln. Die XMP-Dateien enthalten die für PDF/A erforderliche Schemabeschreibung sowie einen Beispieldatensatz, d.h. die tatsächlichen Metadaten, die das Extension-Schema nutzen:

  • Machine extension schema 1: ein einfaches Schema mit einigen Properties, die eine hypothetische Maschine beschreiben.
  • Machine extension schema 2: ähnlich dem obigen Schema, enthält aber zusätzlich einen benutzerdefinierten Datentyp für die XMP-Property »ArticleNumber«. Die diesen strukturierten Typ umfassenden Felder müssen auch in der Schemabeschreibung für PDF/A enthalten sein.
  • Engineering archive: dieses Schema beschreibt technische Dokumente, die aus eingescannten Papierdokumenten als PDF/A erstellt und archiviert wurden. Die Metadaten enthalten genauere Angaben zum Dokument (Sprache und Referenznumber) sowie zum Scan-Vorgang (Scan-Datum und Operatorname).

Einige XMP-Extension-Schemas für PDF/A sind auch im <link pdflib-cookbook pdfa pdfa-extension-schema>PDFlib Cookbook enthalten, außerdem finden Sie dort PDFlib-Code zur Erstellung von PDF/A-konformer Ausgabe inklusive eines XMP-Extension-Schemas.

Weiterführende technische Informationen

Die folgenden TechNotes, die vom PDF/A Competence Center der PDF Association veröffentlicht wurden, behandeln die Verwendung von XMP-Metadaten in PDF/A-1:

  • Technical Note TN0008: Predefined XMP Properties in PDF/A-1
    Diese TechNote beschreibt die XMP-Properties, die ohne Extension-Schema in PDF/A-1 genutzt werden können.
  • Technical Note TN0009: XMP Extension Schemas in PDF/A-1
    Diese Technote erläutert die Konstruktion von XMP-Extension-Schemas und enthält außerdem Erläuterungen zu Syntaxanforderungen von XMP. Das Dokument enthält außerdem ein vollständiges Beispiel für ein Extension-Schema.

Die Lektüre dieser TechNotes wird allen empfohlen, die sich mit Design oder Implementierung von PDF/A-Lösungen befassen. Die PDF/A-Unterstützung in allen Produkten der PDFlib GmbH folgt dem Standard ISO 19005 sowie den Empfehlungen in den TechNotes 0008 und 0009.

Validierung von XMP-Extension-Schemas für PDF/A

Wir empfehlen den RDF Validator von der W3C-Webseite. Da XMP eine Teilmenge von RDF darstellt, muss es den RDF-Syntaxregeln genügen, die vom W3C-Validator überprüft werden.

PDFlib war das weltweit erste Produkt, das XMP-Extension-Schemas für PDF/A unterstützt. PDFlib GmbH bietet einen <link knowledge-base xmp-metadata free-xmp-validator>kostenlosen Validierungsservice, der XMP-Metdadaten auf Konformität zu den Standards PDF/A-1/2/3 überprüft. Das XMP kann als einfacher Text oder eingebettet in ein PDF- oder PDF/A-Dokument (unabhängig vom Konformitätsstatus des Dokuments) übergeben werden.