Die Zukunft möglicherweise

Betrachtungen zum Verhältnis von Archiv und Rechenzentren

In der Diskussion um das audiovisuelle Erbe ist die Frage der digitalen Langzeitarchivierung ein immer wiederkehrender Punkt. Damit verbunden ist die grundsätzliche Sorge um die Beständigkeit digitaler Information. Diese wird befördert von dem
neuen Phänomen, dass – anders als im analogen Bereich – der Verfall diskontinuierlich zu sein scheint: Von heute auf morgen kann ein Digitalisat massiv beschädigt und daher unlesbar sein. Hinzu kommt das Unbehagen, dass die digitale Langzeitarchivierung, ihre Konzepte und Technologien eher unbekannt und zudem in einer explizit technischen Sprache verfasst sind. Auch sind die digitalen Archive nur schwer zugänglich: Ein Betreten ist weder vorgesehen noch erwünscht. Und schließlich künden die digitalen Archive von einem grundlegenden Wandel in der Archivlandschaft, dessen Konsequenzen noch nicht absehbar sind. Grund genug also, einige Türen zu den digitalen Archiven zu öffnen und diesen Entwicklungen, den impliziten Konzepten und Strategien einmal nachzugehen.

Strukturwandel der Archive?

Während die analoge Archivierung analoger Dokumente traditionell von den jeweiligen Archiven selbst durchgeführt wurde und Teil ihrer Aufgaben und Expertise war, ist die digitale Archivierung zunächst an keinen bestimmten Ort gebunden. Die Langzeitarchivierung der Digitalisierungsdaten aus dem niederländischen Projekt Images for the future findet auf amerikanischem Boden statt, die luxemburgische bce fungiert als kommerzieller Dienstleister für AV-Produktionen, die Bayrische Staatsbibliothek kooperiert mit dem Leibniz-Rechenzentrum und für die Deutsche Digitale Bibliothek ist das FIZ in Karlsruhe zuständig. Die Liste ließe sich fortsetzen, bemerkenswert ist aber nicht nur die räumliche Trennung zwischen Institution und eigentlichem Archiv – diese existiert auch heute schon im analogen Bereich – sondern die neue Allianz zwischen hochspezialisierten Dienstleistern für Kernaufgaben des Archivs und den traditionellen Archivinstitutionen. Damit vollzieht sich eine Arbeitsteilung, die charakteristisch für die digitale Ära ist, denn auch Digitalisierungen von analogen Materialien werden immer häufiger an Dienstleister vergeben. Über die Motivation dieses im betriebswirtschaftlichem Jargon “Business Process Outsourcing” (BPO) genannten Verfahrens lässt sich nur spekulieren. Normalerweise wird es immer dann angewendet, wenn die internen “Ressourcen” entweder nicht vorhanden oder ein Aufbau derselben zu teuer wäre. Im Businessbereich legt man allerdings großen Wert darauf, dass dieses Outsourcing nicht die Kernkompetenzen eines Unternehmens berührt.

Typisch für dieses Outsourcing ist, dass die Dienstleister nicht mehr entlang von Sammlungsschwerpunkten der Archive ausgewählt werden. In den Rechenzentren liegen Daten von Filmen neben Forschungsdaten der Physik und Statistiken aus Behörden. Kriterien für die Auswahl sind stattdessen verstärkt organisatorische Zugehörigkeiten: Die Bundeseinrichtungen kooperieren mit Bundesrechenzentren, die Landeseinrichtungen mit den Landesrechenzentren und so weiter. Zumindest heute ist dieses Modell, nennen wir es föderalistische Archivierung, noch gültig, wenn auch in Auflösung begriffen, doch dazu später mehr.

An dieser Stelle lassen sich nun einige Fragen an die Archive formulieren: Sind Digitalisierung und digitale Archivierung nicht doch zentrale Bereiche im Selbstverständnis einer Gedächtnisorganisation? Inwiefern besitzen die Gedächtnisorganisationen Einblick oder gar Befugnisse bei der Umsetzung dieser Aufgaben? Und was sind die Konsequenzen dieser Entwicklung für die Archive und die Organisation des kulturellen Gedächtnisses?

Zumindest eine Veränderung lässt sich konstatieren. Die Archive sind ihrer Genese folgend bis heute sehr staatsnah angelegt. Nur so ließ sich die Neutralität und Unabhängigkeit der Archive, sprachlich gebündelt in dem Archivbegriff “Authentizität”, gegenüber Dritten glaubhaft vermitteln. Unvorstellbar, dass etwa die Archive der BStU (Behörde des Bundesbeauftragten für die Stasi-Unterlagen) privat geführt würden. Doch zunehmend entschließen sich einige Gedächtnisorganisationen zu Kooperationen im Bereich der Digitalisierung und der Archivierung. Ihre Erwartungen sind Partizipation an Technologie, Kostenersparnis und Beschleunigung ihrer Projekte. Spätestens bei einer Ausschreibung zur Langzeitarchivierung, wenn sich private und öffentlich finanzierte Rechenzentren bewerben, stehen jedoch prekäre und sehr grundsätzliche Fragen im Raum.

Doch die Privatisierung archivarischer Aufgaben bei Digitalisierung und Archivierung ist nur eine Perspektive einer arbeitsteiligen Ausdifferenzierung. Mindestens genauso bedeutsam sind – gewissermaßen als gegenläufige Bewegung – die Interessen großer Gedächtnisorganisationen an der zentralisierten Übernahme von digitaler Langzeitarchivierung in ihre Aufgabenfelder. Stellvertretend für diese Politik steht in Deutschland die DNB, für den audiovisuellen Bereich verkörpert sie der an die Library of Congress angebundene Packard Campus for Audio-Visual Conservation. Das Packard Center übernimmt sogar alle archivarischen Aufgaben, angefangen von der Bestandssicherung und Restaurierung bis hin zur digitalen Archivierung.

Man kann also zwei grundlegende Entwicklungen für die Verfasstheit der Archive beobachten. Einerseits eine stärkere Kooperation mit Institutionen und Dienstleistern aus dem privatwirtschaftlichen Bereich, aber auch mit NGOs wie Wikimedia (Wikipedian in Residence); andererseits eine stärkere Zentralisierung und Delegation von Aufgaben an die großen Gedächtnisorganisationen.

Ob wir es daher mit einem tiefgreifendem Strukturwandel der Archive zu tun haben – inklusive offener Fragen zu deren Selbstverständnis – oder lediglich um Modernisierungseffekte, die mit großer Selbstverständlichkeit den kulturellen Bereich erobern, ist noch nicht entschieden. Vieles wird sicher davon abhängen, wie diese Prozesse im Einzelnen gestaltet werden und ob sich die abzeichnende Zentralisierung auch quer zu föderalen Prinzipien durchsetzt. Vieles spricht aber dafür, dass zumindest die mittleren und großen Archive einen grundlegenden Strukturwandel erfahren. Dies gilt insbesondere für die audiovisuellen Archive, da diese durch ihre ungleich höheren Anforderungen an Speicherplatz und Technologien eine Sonderrolle spielen werden.

Zum Stand der Dinge

Zu den Charakteristika von Rechenzentren, die in Zukunft eine so bedeutende Rolle spielen werden, gehört auch, dass man zwar weiss, dass es sie gibt, doch kaum eine Vorstellung davon hat, wie sie wirklich funktionieren. Dies ist zunächst der extremen Komplexität geschuldet, die in krassem Missverhältnis zu ihrer Sichtbarkeit steht und mittlerweile kaum noch sinnvoll zu vermitteln ist. Dies soll deshalb hier auch nicht versucht werden. Interessanter ist es, die zentralen Prinzipien zu verstehen, nach denen zumindest der Bereich der Archivierung funktioniert. Für mich besonders bemerkenswert sind zwei Prinzipien: Die zentrale Bedeutung von Redundanz und der hohe Grad an Selbstorganisation.

Redundanz

Redundanz findet man allerorten: Fast alle wichtigen Systeme sind redundant ausgelegt: Bandlaufwerke für das Lesen und Schreiben von Bändern, die Stromversorgung und natürlich die digitalen Informationen selbst. Auch diese werden mehrfach auf unterschiedliche Bänder geschrieben und an unterschiedlichen Orten gelagert. Im Bereich der Archivierung von audiovisuellem Material ist sogar geplant, künftige audiovisuelle Fileformate wie AXF mit interner Redundanz auszustatten. Im Falle einer Beschädigung eines Bits wäre nicht der Film beschädigt, sondern dieser könnte aus weiteren, redundant gespeicherten Informationen “rekonstruiert” werden. Ein Backup wäre dann nur noch bei größeren Verlusten notwendig. Redundanz ist also der Schlüsselbegriff für Sicherheit im digitalen Archiv. Interessant an dem Konzept der Redundanz ist, dass es den Verlust schon einkalkuliert und die Frage der Sicherheit fast völlig auf eine Kostenebene verschiebt. Eine dritte oder vierte Sicherheitskopie der Daten an einem weiteren Ort minimiert das Verlustrisiko drastisch, kostet aber auch deutlich mehr.
Noch gibt es keine Archivierungskonzepte, welche die Langzeitverfügbarkeit an den Grad der Redundanz knüpfen, doch sind dies mögliche Szenarien, um von den harten Entscheidungen, ob etwas archivierungswürdig ist oder nicht und ihren impliziten, zumindest fragwürdigen Prämissen, wegzukommen.

Selbstorganisation

Der hohe Grad an Selbstorganisation ist typisch für moderne Rechenzentren. Gemeint ist damit, dass sie “selbstständig” ihre Probleme erkennen und lösen können. Dies beinhaltet etwa die Überwachung zentraler Systeme und das automatische Umschalten auf redundant vorhandene Systeme wie etwa die Stromversorgung. Auch in Rechenzentren verwendete Dateisysteme wie ZFS besitzen raffinierte interne Kontroll- und Reparaturmechanismen, um Bitfehler zu verhindern. Diese Selbstorganisation reicht bis zu den Lesegeräten für die Magnetbänder, die kontinuierlich überwacht und zwischen denen bei Bedarf auch automatisiert gewechselt werden kann.

Fazit

Letztlich sind solche Rechenzentren – und damit auch die Langzeitarchivierung – einer großen Technikphantasie entsprungen, die von heute aus betrachtet aber erstaunlich reibungslos funktioniert. Dies ist – im Unterschied zu anderen Technikphantasien – zuvorderst dem alles überragenden Prinzip der Redundanz zu verdanken: Irgendwo findet sich dann immer noch eine Kopie der Daten. Gravierender erscheinen mir die Probleme in Bezug auf die neue Arbeitsteilung. Dies betrifft sowohl die Kernkompetenzen der Archive wie etwa die Langzeitarchivierung als auch Fragen der föderalen, nationalen und internationalen Verfasstheit und Zuständigkeit. Und schließlich forciert die digitale Langzeitarchivierung aufgrund der hohen, kontinuierlichen Kosten den Druck zur Auswahl langzeitarchivierungswürdiger Objekte. Da diese Auswahl konzeptionell immer fragwürdig bleiben wird, scheinen mir hier differenziertere Verfahren – mit unterschiedlichen Levels an Sicherheit – die bessere Alternative.

Antworten

XHTML: Diese Tags sind erlaubt: <a href="" title=""> <abbr title=""> <acronym title=""> <b> <blockquote cite=""> <cite> <code> <del datetime=""> <em> <i> <q cite=""> <s> <strike> <strong>