Standardisierte Langzeitarchivierung mit PDF/A
Warum ein ISO-Standard aus dem Jahr 2005 immer noch zukunftssicher ist
Analoge Archivierungsmedien wie Mikrofilm und Papier gehören längst der Vergangenheit an. Auch das Bildformat TIFF als erstes digitales Format ist schon in den 1990er Jahren durch ein leistungsfähigeres abgelöst worden, nämlich das von Adobe Systems veröffentlichte Portable Document Format (PDF). Auf dessen Grundlage entwickelte sich der Archivformatstandard PDF/A, der noch heute eine entscheidende Rolle spielt für die gesetzlich vorgeschriebene Langzeitarchivierung.
Was 2005 zum Standard wurde
Im Jahr 2002 nahm bei der International Organization for Standardization (ISO) eine Arbeitsgruppe für die digitale Langzeitarchivierung ihre Tätigkeit auf. Drei Jahre später veröffentlichte die ISO das Format PDF/A unter der Bezeichnung „ISO 19005-1:2005“ als ersten Dateiformatstandard für die elektronische Langzeitarchivierung, und das weltweit.
Warum überhaupt Langzeitarchivierung?
Geschäftliche Dokumente, etwa Rechnungen oder Verträge, müssen bis zu zehn Jahre lang archiviert werden – das schreibt unsere Gesetzgebung vor. Die wichtigsten Aufbewahrungsfristen für Unternehmen sind in der Abgabenordnung (AO), im Handelsgesetzbuch (HGB) und im Umsatzsteuergesetz (UStG) festgelegt. Daneben gibt es auch noch branchenspezifische Aufbewahrungspflichten für Dokumente in der öffentlichen Verwaltung, in Krankenhäusern, im Bauwesen etc.
Für die digitale Langzeitarchivierung gelten für Dateiformate folgende Kriterien:
- offen standardisiert (notfalls offen spezifiziert); kein proprietäres Format
- weit verbreitet
- geringe Komplexität
- ohne Zugriffsschutzmechanismen wie Kopierschutz oder Verschlüsselung
- selbstdokumentierend
- robust
- keine Abhängigkeiten zu anderen Dateiformaten
- lizenzfrei
- validierbar
Unternehmen müssen sich also darüber Gedanken machen, wie sie Ihre geschäftlichen Dokumente langfristig aufbewahren. Außerdem gelten für die Datenarchivierung höchste Ansprüche, denn die Inhalte müssen jederzeit exakt gleich dargestellt werden und die Archivierungskriterien erfüllen.
Was steckt hinter PDF/A?
Ein PDF-Dokument hat wohl jeder schon einmal geöffnet oder damit gearbeitet. Das gängige Format ist sicher, einfach zu benutzen, und es benötigt zudem wenig Speicherplatz. PDFs sehen überall gleich aus, unabhängig davon, welches Gerät oder Betriebssystem zur Verfügung steht. Ein weiterer großer Vorteil einer PDF-Datei: Es lassen sich unterschiedliche Dateitypen, wie z. B. Schriften, Grafiken, 3D-Objekte und auch Audio und Video einbetten.
Für die Langzeitarchivierung reichen „normale“ PDF-Dateien jedoch nicht aus, da diese nachträglich bearbeitet werden können. Ein PDF/A dagegen stellt sicher, dass die Vorgaben eingehalten werden. Beispielsweise dürfen Dokumente für die langfristige Aufbewahrung nicht mit einem Passwort verschlüsselt werden, damit die Inhalte jederzeit zugänglich sind. Außerdem dürfen keine Video- und Audiodateien eingebettet sein, denn es muss bewusst auf alles verzichtet werden, was ggf. externe Software zum Darstellen oder Abspielen benötigt. Auch JavaScript ist bei Dokumenten für die Archivierung nicht erlaubt.
Nachdem 2005 das PDF/A-Format zum globalen Archivierungsstandard ausgerufen wurde, haben sich nachträglich bestimmte Unterformen entwickelt. Es handelt sich hierbei um Weiterentwicklungen.
Das Format PDF/A-1 mit den Konformitätsstufen a und b basiert auf der PDF-Version 1.4 und wurde 2011 durch den ISO 19005-2 Standard ergänzt, der erweiterte Möglichkeiten für die Archivierung von PDF-Dokumenten bietet. Das PDF/A-2-Format lässt sich in drei Konformitätsstufen unterteilen: PDF/A-2a, PDF/A-2b und PDF/A-2u. Seit 2012 ist PDF/A-3, und seit Herbst 2020 ist PDF/A-4 verfügbar.
PDF/A-1 (2005) | PDF/A-2 (2011) | PDF/A-3 (2012) |
---|---|---|
basiert auf PDF 1.4 | basiert auf PDF 1.7 (ISO 32000-1) | |
ISO 19005-1 Standard | ISO 19005-2 Standard | ISO 19005-3 Standard |
Eindeutige visuelle Reproduzierbarkeit + Barrierefreiheit | Eindeutige visuelle Reproduzierbarkeit + Barrierefreiheit + Erweiterungen (Unterstützung von JPEG 2000, sehr große Seitenformate können verarbeitet werden usw.) | Eindeutige visuelle Reproduzierbarkeit + Barrierefreiheit + Erweiterungen (auch Original Excel-Dateien oder XML-Datensatz können eingebettet werden + Möglichkeit der E-Rechnung, ISO konform usw.) |
Die verschiedenen Konformitätsstufen a, b und u spiegeln die Qualität der archivierten Dokumente wider und richten sich nach dem Eingangsmaterial und dem Verwendungszweck.
Bei PDF/A-1 unterscheidet man zwischen PDF/A-1a (Level a) und PDF/A-1b (Level b). Letzteres steht für eindeutige visuelle Langzeit-Reproduzierbarkeit. Bei PDF/A-1b müssen alle eingefügten Bilder fest im Dokument eingebunden sein, so dass es völlig autark funktioniert. Zusätzlich müssen die Textbausteine Unicode-Darstellung aufweisen, um für immer reproduzierbar zu sein. PDF/A-1a – Level a bietet mehr. Hier ist eine eindeutige visuelle Reproduzierbarkeit samt Abbildbarkeit von Text nach Unicode und inhaltliche Strukturierung des Dokuments im Sinne der Barrierefreiheit geboten.
Während PDF/A-1b alle Mindestanforderungen des ISO-Standards erfüllt, geht Level a einen Schritt weiter und sollte zum Beispiel dann eingesetzt werden, wenn die Dokumentenstruktur auch für die Anzeige auf mobilen Geräten gedacht ist und die Vorgaben der Barrierefreiheit zu 100 % erfüllt sein müssen.
Archivierung mit PDF/A
Ideal für die Langezeitarchivierung eignet sich das Format PDF/A-1. Sowohl PDF/A-1a als auch PDF/A-1b bieten alle Anforderungen für eine sichere Übermittlung von Daten sowie deren Archivierung. Es ist gewährleistet, dass die archivierten Dokumente samt ihrer Anhänge jederzeit (auch nach vielen Jahren und unabhängig von der verwendeten Software) lesbar sind. Und es ist sichergestellt, dass alle Dokumente rechtssicher, also gemäß der vorgeschriebenen Aufbewahrungsfristen, gespeichert werden. Die Dokumente bleiben jederzeit lesbar und ihr Erscheinungsbild bleibt dauerhaft erhalten.
Neben dem ursprünglichen PDF/A-1-Format gibt es inzwischen die neueren Versionen PDF/A-2 und PDF/A-3, die mehr Features beinhalten. Das PDF/A-2 Format bietet im Vergleich zur Format PDF/A-1 zusätzlich die Möglichkeit, JPEG 2000 sowie große Seitenformate zu verarbeiten, was vor allem für Bibliotheken oder große Archive interessant ist. Auch lassen sich mit PDF/A-2 mehrere Dateien zu einem Container-PDF zusammenfügen.
Wo PDF/A für die Langzeitarchivierung zum Einsatz kommt
Das papierlose Büro ist noch längst nicht in allen Unternehmen Alltag. Für eine rein digitale Archivierung müssen Akten und Unterlagen auf Papier gescannt werden, um sie zu digitalisieren.
Posteingang per E-Mail samt Dokumentenanhängen und andere Eingangspost per Brief müssen genauso wie andere Office-Dokumente (Textdokumente, Tabellen, Präsentationen etc.) zehn Jahre aufbewahrt werden. Auch Broschüren oder Magazine, die aus Layoutprogrammen oder Redaktionssystemen stammen, müssen zur Aufbewahrung ins PDF/A konvertiert werden.
Bilddateien und aufwändige CAD-Zeichnungen lassen sich seit PDF/A-3 im Originalformat in eine PDF/A-Datei einbetten. Eine hybride Archivierung von PDF-Dokument plus Ursprungsdatei ist somit nicht mehr nötig.
Konvertierung ins PDF/A-Format
PDF/A hat sich als weit verbreiteter Standard für die Langzeitarchivierung etabliert. Viele Unternehmen stehen vor der Herausforderung, den Weg ihrer Dokumente zum PDF/A-Format möglichst effizient zu gestalten. Denn unterschiedliche Ausgangsformate sollen ohne viel Aufwand direkt für die Archivierung ins PDF/A konvertiert werden.
Und da kommt webPDF ins Spiel. Dokumente im PDF-Format lassen sich damit schnell und einfach durch eine PDF/A-Konvertierung an ein Archiv-System übergeben. Die automatisierbare Konvertierung geschieht serverseitig und ohne Zugriff auf die Ursprungs-Software. Präzise konfigurierbar und absolut effizient.
Die wichtigsten Vorteile von webPDF für die PDF/A-Konvertierung auf einen Blick:
- webPDF konvertiert Dokumente aus über 100 Dateiformaten direkt in eine PDF/A-Datei und führt alle notwendigen Korrekturen und Ergänzungen durch.
- Alle Konformitätsebenen (A Accessible, B Basic und U Unicode) werden unterstützt.
- Die PDF-Engine prüft auf Wunsch die Einhaltung der gängigen Standards PDF/A-1 (ISO 19005-1:2005), PDF/A-2 (ISO 19005-2:2011) und PDF/A-3 (ISO 19005-2:2012).
- webPDF bietet die Möglichkeit zur Ausgabe von detaillierten Berichten im XML-Format
Darum bleibt PDF/A noch lange up-to-date
Unternehmen profitieren vom ISO-Standard, denn der hilft dabei, digitale Unterlagen nach den rechtlichen Vorgaben einzuhalten. PDF/A wird bevorzugt als Langzeitarchivierungsformat eingesetzt – und das aus guten Gründen. Über ein ganzes Jahrzehnt haben Fachleute PDF/A samt seiner Konformitätsstufen weiterentwickelt. Was einmal zum Quasi-Standard geworden ist, verschwindet erfahrungsgemäß so schnell nicht vom Markt. Expertinnen und Experten sind sich einig, dass PDF/A ein zukunftssicheres Format bleiben wird, auf das Unternehmen und Behörden getrost setzen können. Und auch die Tatsache, dass Microsoft das direkte Erstellen eines PDF/A-Dokuments aus der Office Palette ermöglicht, ist ein Indiz dafür, dass PDF/A mehr ist als nur eine Eintagsfliege.