XMP in PDF/A
PDF/A verlangt den Einsatz von XMP zur Identifikation von PDF-Dokumenten als konform zum PDF/A-Standard. XMP-Unterstützung in PDF/A-1 basiert auf der Spezifikation XMP 2004: alle Properties aus den in XMP 2004 spezifizierten vordefinierten Schemas können direkt in konformen Dokumenten verwendet werden. XMP-Unterstützung in PDF/A-2 und PDF/A-3 basiert auf der Spezifikation XMP 2005.
Die folgende Tabelle zeigt die Namen, URIs des Namensraums und bevorzugten Namensraum-Präfixe für die in XMP 2004 spezifizierten vordefinierten XMP-Schemas. Die Namen und Beschreibungen aller in vordefinierten Schemas enthaltenen Properties finden Sie in der Spezifikation XMP 2004 (leider ist die offizielle Version dieses Dokuments nicht mehr online verfügbar).
Schemaname und -beschreibung | URI des Namensraums | bevorzugtes Namensraum-Präfix |
Adobe PDF Schema | "http://ns.adobe.com/pdf/1.3/" | |
Dublin Core Schema | "http://purl.org/dc/elements/1.1/" | dc |
EXIF Schema für EXIF-spezifische Properties | "http://ns.adobe.com/exif/1.0/" | exif |
EXIF Schema für TIFF-Properties | "http://ns.adobe.com/tiff/1.0/" | tiff |
Photoshop Schema | "http://ns.adobe.com/photoshop/1.0/" | photoshop |
XMP Basic Job Ticket Schema | "http://ns.adobe.com/xap/1.0/bj" | xmpBJ |
XMP Basic Schema | "http://ns.adobe.com/xap/1.0/" | xmp |
XMP Media Management Schema | "http://ns.adobe.com/xap/1.0/mm/" | xmpMM |
XMP Paged-Text Schema | "http://ns.adobe.com/xap/1.0/t/pg/" | xmpTPg |
XMP Rights Management Schema | "http://ns.adobe.com/xap/1.0/rights/" | xmpRights |
XMP-Extension-Schemas für PDF/A
Die oben angeführten vordefinierten XMP-Schemas erfüllen viele der generell an Metadaten gestellten Anforderungen, firmen- oder branchen-spezifische Anforderungen lassen sich aber nur über benutzerdefinierte XMP-Schemas abdecken. Zu diesem Zweck unterstützt PDF/A den Einsatz so genannter Extension-Schemas (Erweiterungsschemas). Ein Extension-Schema ist eine Sammlung von Metadaten-Eigenschaften für ein bestimmtes Anwendungsszenario. Um sicherzustellen, dass Extension-Schemas auch später noch korrekt interpretiert werden können, verlangt PDF/A, dass eine Beschreibung aller verwendeten Extension-Schemas im XMP eingebettet ist. Dieses so genannte Container-Schema für Extension-Schemas enthält den Namen und die Beschreibung aller Properties sowie deren XMP-Datentyp. Die Beschreibung muss formalisiert anhand der XMP-Schemas und -Properties erfolgen, die für PDF/A ausführlich erläutert werden. Die folgende Tabelle zeigt die Namensräume für diese Extension-Schema-Beschreibung.
Schemaname und -beschreibung | URI des Namensraums | erforderliches Namensraum-Präfix |
PDF/A Container-Schema für Extension-Schema | "http://www.aiim.org/pdfa/ns/extension/" | pdfaExtension |
PDF/A Feldtypschema | "http://www.aiim.org/pdfa/ns/field#" | pdfaField |
PDF/A property value type | "http://www.aiim.org/pdfa/ns/property#" | pdfaProperty |
PDF/A schema value type | "http://www.aiim.org/pdfa/ns/schema#" | pdfaSchema |
PDF/A ValueType value type | "http://www.aiim.org/pdfa/ns/type#" | pdfaType |
Beispiel-Extension-Schemas für PDF/A
Wir stellen Ihnen verschiedene Extension-Schemas als Beispiele zur Verfügung, auf deren Basis Sie eigene PDF/A-konforme Extension-Schemas erstellen können. Sie enthalten eine Klartextbeschreibung der benutzerdefinierten XMP-Schemas und -Properties sowie eine entsprechende maschinenlesbare Fassung gemäß der in PDF/A festgeschriebenen Regeln. Die XMP-Dateien enthalten die für PDF/A erforderliche Schemabeschreibung sowie einen Beispieldatensatz, d.h. die tatsächlichen Metadaten, die das Extension-Schema nutzen:
- Machine extension schema 1: ein einfaches Schema mit einigen Properties, die eine hypothetische Maschine beschreiben.
- Machine extension schema 2: ähnlich dem obigen Schema, enthält aber zusätzlich einen benutzerdefinierten Datentyp für die XMP-Property »ArticleNumber«. Die diesen strukturierten Typ umfassenden Felder müssen auch in der Schemabeschreibung für PDF/A enthalten sein.
- Engineering archive: dieses Schema beschreibt technische Dokumente, die aus eingescannten Papierdokumenten als PDF/A erstellt und archiviert wurden. Die Metadaten enthalten genauere Angaben zum Dokument (Sprache und Referenznumber) sowie zum Scan-Vorgang (Scan-Datum und Operatorname).
Einige XMP-Extension-Schemas für PDF/A sind auch im <link pdflib-cookbook pdfa pdfa-extension-schema>PDFlib Cookbook enthalten, außerdem finden Sie dort PDFlib-Code zur Erstellung von PDF/A-konformer Ausgabe inklusive eines XMP-Extension-Schemas.
Weiterführende technische Informationen
Die folgenden TechNotes, die vom PDF/A Competence Center der PDF Association veröffentlicht wurden, behandeln die Verwendung von XMP-Metadaten in PDF/A-1:
- Technical Note TN0008: Predefined XMP Properties in PDF/A-1
Diese TechNote beschreibt die XMP-Properties, die ohne Extension-Schema in PDF/A-1 genutzt werden können. - Technical Note TN0009: XMP Extension Schemas in PDF/A-1
Diese Technote erläutert die Konstruktion von XMP-Extension-Schemas und enthält außerdem Erläuterungen zu Syntaxanforderungen von XMP. Das Dokument enthält außerdem ein vollständiges Beispiel für ein Extension-Schema.
Die Lektüre dieser TechNotes wird allen empfohlen, die sich mit Design oder Implementierung von PDF/A-Lösungen befassen. Die PDF/A-Unterstützung in allen Produkten der PDFlib GmbH folgt dem Standard ISO 19005 sowie den Empfehlungen in den TechNotes 0008 und 0009.
Validierung von XMP-Extension-Schemas für PDF/A
Wir empfehlen den RDF Validator von der W3C-Webseite. Da XMP eine Teilmenge von RDF darstellt, muss es den RDF-Syntaxregeln genügen, die vom W3C-Validator überprüft werden.
PDFlib war das weltweit erste Produkt, das XMP-Extension-Schemas für PDF/A unterstützt. PDFlib GmbH bietet einen <link knowledge-base xmp-metadata free-xmp-validator>kostenlosen Validierungsservice, der XMP-Metdadaten auf Konformität zu den Standards PDF/A-1/2/3 überprüft. Das XMP kann als einfacher Text oder eingebettet in ein PDF- oder PDF/A-Dokument (unabhängig vom Konformitätsstatus des Dokuments) übergeben werden.