Standardisierte Langzeitarchivierung mit PDF/A

Archivstruktur

Warum ein ISO-Standard aus dem Jahr 2005 immer noch zukunftssicher ist

Analoge Archivierungsmedien wie Mikrofilm und Papier gehören längst der Vergangenheit an. Auch das Bildformat TIFF als erstes digitales Format wurde bereits in den 1990er Jahren von einem leistungsfähigeren Standard abgelöst: dem von Adobe Systems veröffentlichten Portable Document Format (PDF). Auf dessen Grundlage entwickelte sich der Archivformatstandard PDF/A, der bis heute eine entscheidende Rolle für die gesetzlich vorgeschriebene Langzeitarchivierung spielt.

Was 2005 zum Standard wurde

Im Jahr 2002 nahm bei der International Organization for Standardization (ISO) eine Arbeitsgruppe für digitale Langzeitarchivierung ihre Arbeit auf. Drei Jahre später veröffentlichte die ISO mit „ISO 19005-1:2005" das Format PDF/A als ersten weltweiten Dateiformatstandard für die elektronische Langzeitarchivierung.

Warum überhaupt Langzeitarchivierung?

Geschäftliche Dokumente wie Rechnungen oder Verträge müssen bis zu zehn Jahre archiviert werden. Das ist gesetzlich geregelt, unter anderem in der Abgabenordnung (AO), im Handelsgesetzbuch (HGB) und im Umsatzsteuergesetz (UStG). Zusätzlich gibt es branchenspezifische Aufbewahrungspflichten, etwa in der öffentlichen Verwaltung, im Gesundheitswesen oder im Bauwesen.

Für die digitale Langzeitarchivierung sollte ein Dateiformat unter anderem folgende Kriterien erfüllen:

  • offen standardisiert (oder offen spezifiziert), nicht proprietär
  • weit verbreitet
  • geringe Komplexität
  • keine Zugriffsschutzmechanismen wie Kopierschutz oder Verschlüsselung
  • selbstdokumentierend
  • robust
  • keine Abhängigkeiten zu anderen Dateiformaten
  • lizenzfrei
  • validierbar

Unternehmen müssen also sicherstellen, dass Dokumente langfristig verfügbar, korrekt darstellbar und gesetzeskonform archiviert werden können.

Was steckt hinter PDF/A?

PDF-Dokumente sind sicher, weit verbreitet und plattformunabhängig darstellbar. Ein großer Vorteil: In PDF lassen sich unterschiedliche Inhalte wie Schriften, Grafiken oder 3D-Objekte integrieren.

Für die Langzeitarchivierung reichen „normale" PDF-Dateien jedoch nicht aus, da sie nachträglich verändert werden können oder Funktionen enthalten, die nicht dauerhaft reproduzierbar sind. PDF/A stellt sicher, dass Archivierungsanforderungen eingehalten werden. So sind z. B. Passwortverschlüsselung, Audio/Video-Inhalte oder JavaScript in PDF/A-Dokumenten für die Archivierung nicht zulässig.

Nach der Einführung von PDF/A im Jahr 2005 entstanden weitere Teilstandards:

  • PDF/A-1 (2005), basierend auf PDF 1.4
  • PDF/A-2 (2011), basierend auf PDF 1.7 (ISO 32000-1)
  • PDF/A-3 (2012)
  • PDF/A-4 (seit 2020)
PDF/A-1 (2005)PDF/A-2 (2011)PDF/A-3 (2012)
basiert auf PDF 1.4basiert auf PDF 1.7 (ISO 32000-1)basiert auf PDF 1.7 (ISO 32000-1)
ISO 19005-1ISO 19005-2ISO 19005-3
Eindeutige visuelle Reproduzierbarkeit + BarrierefreiheitEindeutige visuelle Reproduzierbarkeit + Barrierefreiheit + Erweiterungen (z. B. JPEG 2000, große Seitenformate)Eindeutige visuelle Reproduzierbarkeit + Barrierefreiheit + Erweiterungen (z. B. Einbettung von Originaldateien wie Excel oder XML)

Die Konformitätsstufen a, b und u spiegeln die Qualität der archivierten Dokumente wider und richten sich nach Eingangsmaterial und Anwendungszweck.

Bei PDF/A-1 unterscheidet man zwischen PDF/A-1a (Level a) und PDF/A-1b (Level b). PDF/A-1b steht für eindeutige visuelle Langzeitreproduzierbarkeit. PDF/A-1a geht darüber hinaus und enthält zusätzliche Anforderungen für Struktur und Barrierefreiheit.

Archivierung mit PDF/A

Für die Langzeitarchivierung ist PDF/A grundsätzlich sehr gut geeignet. Sowohl PDF/A-1a als auch PDF/A-1b erfüllen wichtige Anforderungen für sichere Übermittlung und Archivierung. Dadurch bleibt gewährleistet, dass archivierte Dokumente langfristig lesbar und rechtssicher gespeichert sind.

Neben PDF/A-1 existieren mit PDF/A-2 und PDF/A-3 neuere Varianten mit erweitertem Funktionsumfang. PDF/A-2 ermöglicht unter anderem JPEG-2000-Unterstützung, große Seitenformate und Container-PDFs.

Wo PDF/A in der Praxis eingesetzt wird

Das papierlose Büro ist noch nicht überall Realität. Für vollständig digitale Archivierung müssen Papierunterlagen gescannt und digitalisiert werden.

Eingehende Dokumente per E-Mail, Briefpost sowie Office-Dateien (Texte, Tabellen, Präsentationen) müssen oft langfristig aufbewahrt werden. Auch Broschüren oder Magazine aus Layout- und Redaktionssystemen werden für die Archivierung in PDF/A überführt.

Seit PDF/A-3 können zudem Originaldateien wie Bild- oder CAD-Dateien eingebettet werden. Dadurch ist in vielen Fällen keine hybride Archivierung (PDF plus separate Ursprungsdatei) mehr erforderlich.

Konvertierung ins PDF/A-Format

PDF/A hat sich als Standardformat für Langzeitarchivierung etabliert. Viele Unternehmen stehen vor der Herausforderung, unterschiedliche Ausgangsformate effizient nach PDF/A zu konvertieren.

Hier unterstützt webPDF: Dokumente lassen sich serverseitig automatisiert in PDF/A konvertieren, ohne Zugriff auf die Ursprungssoftware.

Die wichtigsten Vorteile von webPDF für die PDF/A-Konvertierung:

  • Konvertierung aus über 100 Dateiformaten inklusive notwendiger Korrekturen
  • Unterstützung aller Konformitätsstufen (A Accessible, B Basic, U Unicode)
  • Prüfung der Standards PDF/A-1 (ISO 19005-1:2005), PDF/A-2 (ISO 19005-2:2011) und PDF/A-3 (ISO 19005-3:2012)
  • Ausgabe detaillierter Berichte im XML-Format

Mehr über webPDF erfahren

Darum bleibt PDF/A noch lange up to date

Unternehmen profitieren vom ISO-Standard, weil er hilft, digitale Unterlagen rechtssicher zu archivieren. PDF/A ist aus gutem Grund das bevorzugte Format für die Langzeitarchivierung. Über Jahre wurde der Standard inklusive Konformitätsstufen weiterentwickelt. Fachleute gehen daher davon aus, dass PDF/A auch künftig ein verlässliches und zukunftssicheres Format für Unternehmen und Behörden bleibt.