Wenn Forschung zu digitalem Schutt zerfällt

17.06.2015

Historische Objekte zu digitalisieren bewahrt sie nicht vor dem Verfall. Ein Schweizer Projekt will die Datenbanken der Forscher retten. Von Daniel Saraga

(Aus "Horizonte" Nr. 105, Juni 2015)

"​Das Internet vergisst nie", warnen Experten mit besorgtem Blick auf die Freizügigkeit, mit der wir im Internet unsere Privatleben ausbreiten. Aber sicher ist das keineswegs: Der stürmische Wandel bei Speichermedien und Formaten hinterlässt einen Berg von Daten, die früher oder später unleserlich werden. Sich selbst überlassen, sind sie zum Vergessen verurteilt.

Mit voller Wucht trifft das Problem auch wissenschaftliche Ergebnisse, die immer häufiger in Datenbanken gesammelt werden. Denn diese Datenbanken veralten schnell: Die Programmiersprache wird abgelöst, das Betriebssystem ist nicht mehr mit dem neuen Server kompatibel.
  
"Das ist ein ernsthaftes Problem", erklärt Lukas Rosenthaler, Verantwortlicher des Daten- und Dienstleistungszentrums (DDZ), ein Projekt, das den langfristigen Bestand wissenschaftlicher Ergebnisse in den Geistes- und Sozialwissenschaften sicherstellen soll (siehe "Den Retter retten"). "Nur in sehr seltenen Fällen betreuen Forschende die Informatikstrukturen weiter, wenn ein Projekt – und seine Finanzierung – beendet ist. Eine unzugängliche Datenbank ist jedoch eine unbrauchbare Datenbank. Diese nicht weiter zu unterhalten kommt der Zerstörung wissenschaftlicher Ergebnisse gleich. Paradoxerweise ist die digitale Form wissenschaftlicher Ergebnisse viel empfindlicher als eine gedruckte Veröffentlichung."

Kopisten des 3. Jahrtausends

Der Forscher konnte bereits eine der wichtigsten internationalen Datenbanken zur griechischen Mythologie retten, das "Lexicon Iconographicum Mythologiae Classicae", das nach 30 Jahren Entwicklung 2009 beendet wurde. "Die Datenbank war bereits vollständig ausser Betrieb, und das für die Programmierung zuständige Unternehmen hatte Konkurs angemeldet", sagt Lukas Rosenthaler. "Wir mussten die Site hacken, da die Passwörter unauffindbar waren. Unsere Arbeit gleicht manchmal einer archäologischen Suche in digitalem Schutt …" Aber manchmal lassen sich so wissenschaftliche Ergebnisse zu einem zweiten Leben erwecken. Die Harvard-Universität hat zum Beispiel Interesse daran bekundet, das Lexikon in ihren Kommentar zu Homer über Linked Open Data aufzunehmen, ein Element des Web 3.0, mit dem Online-Daten direkt und dynamisch verknüpft werden können.

Mit seinem kleinen Team stützt sich der frühere Physiker und Leiter des Digital Humanities Lab der Universität Basel auf semantische Technologie, um eine generische Plattform zu entwickeln, mit der Daten aus sehr unterschiedlichen Plattformen strukturiert werden können. "Wir werden schätzungsweise 99 Prozent der in den Geistes- und Sozialwissenschaften erstellten Datenbanken und sogar bestimmte Projekte der Biologie einbinden können. In drei Jahren werden wir rund dreissig Projekte – von der griechischen Mythologie bis zu einer Sammlung historischer Bergfotografien – übersetzt haben."

Das DDZ hält sich an das Konzept des Open Archival Information System: Daten regelmässig kopieren und in ein aktuelleres Format umschreiben. Das ist ein aufwändiger und kostspieliger Prozess, der ständig wiederholt werden muss – die digitale Entsprechung des Kopierens der Mönche im Mittelalter. "Die meisten For-schungsgruppen verfügen nicht über die Mittel, um stabile Werkzeuge zu schaffen", bemerkt Lukas Rosenthaler. "Idealerweise arbeiten wir bereits zu Beginn der Projekte mit den Gruppen zusammen, um dauerhafte Datenbanken zu erstellen, die später leicht aktualisiert und migriert werden können."

Die Bewegung Open Research Data ermutigt Forschende, Ergebnisse für alle zugänglich und in interaktiver Weise bereitzustellen. Aber wie jede Maschine muss auch dieses Werkzeug regelmässig gewartet werden. Eine Arbeit ausserhalb des Scheinwerferlichts, aber unverzichtbar, wenn verhindert werden soll, dass Wissen für immer im Schatten des Vergessens verschwindet.

Daniel Saraga ist leitender Wissenschaftsredaktor des SNF.

Den Retter retten

Das Daten- und Dienstleistungszentrum für die Geisteswissenschaften (DDZ) soll digitale Archive retten und ist selbst ebenfalls in Gefahr. "Wir setzen uns seit 2008 entschlossen dafür ein, eine stabile Plattform zu schaffen", erklärt Markus Zürcher, Generalsekretär der Schweizerischen Akademie der Geistes- und Sozialwissenschaften, der das Projekt lanciert hat. "Alle betroffenen Personen unterstützen diese Plattform. Nur die Finanzierung ist ungewiss."

Das DDZ bleibt ein Pilotprojekt, das sich seinem Ende zuneigt. "Wir haben im März 2015 beim Staatssekretariat für Bildung, Forschung und Innovation ein Gesuch um Unterstützung mit zwei Millionen Franken für den Zeitraum 2017–2020 eingereicht. Wir möchten die Finanzierung bis 2017 sicherstellen, weil ein Unterbruch des Projekts äusserst ungünstig wäre." Zum Vergleich: Für Datenbanken in den Geistes- und Sozialwissenschaften werden jährlich rund 30 Millionen aufgewendet.