Data Management Plan (DMP) - Leitlinien für Forschende

1. Vorwort

Zu den Grundsätzen guter wissenschaftlicher Praxis gehört es, Forschungsresultate möglichst offen zu verwalten und öffentlich zugänglich zu machen. Der SNF unterstützt diesen Grundsatz in seinem Beitragsreglement: "[…] Die Beitragsempfängerinnen und Beitragsempfänger sind verpflichtet, [...] die mit Mitteln des SNF erzielten Forschungsresultate der Öffentlichkeit in geeigneter Weise zugänglich zu machen […]" (Artikel 47). In seinen forschungspolitischen Positionen zu Open Research Data legt der SNF dar, welche Erwartungen er diesbezüglich an seine Beitragsempfängerinnen und Beitragsempfänger stellt. Zur Umsetzung dieser Grundsätze bevorzugt der SNF einen Bottom-Up-Ansatz. Dies fördert die Etablierung von Leitlinien für eine empfehlenswerte Praxis und erlaubt es jeder wissenschaftliche Gemeinschaft, ihre eigenen Standards zu definieren und mit ausreichender Flexibilität anzuwenden. Wie Daten am besten verwaltet und veröffentlicht werden, hängt besonders von dem jeweiligen Forschungsgebiet ab.

Der Data Management Plan (DMP) dient der Planung des Lebenszyklus von Forschungsdaten. Er ist langfristig angelegt und legt dar, wie die Daten produziert, erhoben, dokumentiert, veröffentlicht und archiviert werden sollten. Der SNF stellt ein Template für die Erstellung des DMP zur Verfügung. Der DMP für ein Forschungsprojekt kann sich auf fachspezifische Praktiken und Standards beziehen und kann sich deshalb in seinem Inhalt unterscheiden.

Mindestens die einer Veröffentlichung zugrunde liegenden Daten sollten laut SNF offen zugänglich sein, jedoch nur in dem Ausmass, dass die Reproduzierbarkeit der publizierten Resultate gewährleistet ist. Diese Daten sollen schnellstmöglich, jedoch spätestens zusammen mit der entsprechenden wissenschaftlichen Publikation, veröffentlicht werden. Je nach Fachgebiet und Art der Studie können die Daten in ihrer ursprünglichen oder in einer verarbeiteten Form publiziert werden. Die Datensätze sind dabei stets mit den dazugehörigen Metadaten zu dokumentieren, damit andere Forschende erkennen können, wie die Daten erhoben wurden und unter welchen Bedingungen bzw. in welcher Form sie weiterverwendet werden können. Wenn die Weiterverwendung der Daten spezifische Tools voraussetzt, ist dies ebenfalls zu dokumentierten; die benötigten Tools müssen nach Möglichkeit zur Verfügung gestellt werden. In jedem Fall müssen die bereitgestellten Daten und Metadaten die Wiederverwendung der Daten sicherstellen. Können diese Anforderungen nicht erfüllt werden, sind die Forscherinnen und Forscher gebeten die Gründe im DMP zu erläutern.

Datenaustausch – Best Practice

Damit Datensätze leichter auffindbar sowie besser zugänglich, weiterverwendbar und zitierbar sind, muss die Veröffentlichung der Forschungsdaten einer klar definierten und umfassend anwendbaren besten Praxis folgen. Die FAIR Daten Prinzipien1  definieren einige Merkmale, die publizierte Datensätze aufweisen sollten, um auffindbar ("findable"), zugänglich ("accessible"), kompatibel ("interoperable") und wiederverwendbar ("reusable") zu sein (siehe Explanation of the FAIR Data Principles, Dokument auf Englisch). Der SNF erwartet von den Forschenden, dass sie ihre Daten im Sinne der FAIR Daten Prinzipien in öffentlich zugänglichen, digitalen und nicht kommerziellen Datenbanken veröffentlichen. Hierbei ist hervorzuheben, dass die FAIR Daten Prinzipien die Forschenden nicht verpflichten, alle ihre Daten ohne jede Beschränkung zu veröffentlichen. Vielmehr sollen einheitliche Verfahren dafür sorgen, dass die Forschungsdaten von Menschen und Computersystemen leichter gefunden, ausgewertet und unter klar definierten Bedingungen genutzt werden können. Die FAIR Daten Prinzipien werden von einer wachsenden Anzahl von Forschungsförderungsorganisationen übernommen (bspw. Horizon 2020, NIH).

1Wilkinson, M. D. et al. The FAIR Guiding Principles for scientific data management and stewardship. Sci. Data 3:160018 doi: 10.1038/sdata.2016.18 (2016)

2. Der Data Management Plan des SNF

Zur Umsetzung seiner Grundsatzerklärung zu Open Research Data verlangt der SNF, dass zum Zeitpunkt der Gesuchstellung Angaben zum Lebenszyklus der Daten gemacht werden. Um den Datenmanagementstandards der jeweiligen Forschungsdisziplinen Rechnung zu tragen, hat der SNF nur Mindestanforderungen bezüglich Strukturierung und Inhalt der verlangten Informationen formuliert.

2.1. So reichen Sie einen DMP ein

Wenn Forschende ihr Gesuch auf mySNF einreichen, werden sie aufgefordert, auch Angaben zum Datenmanagement zu machen. Der Inhalt eines DMP erstreckt sich auf vier Bereiche: (1) Datenerhebung und -dokumentation, (2) ethische, rechtliche und Sicherheitsfragen, (3) Datenspeicherung und -erhalt sowie (4) Austausch und Weiterverwendung der Daten. Beim Ausfüllen des Formulars werden die Forschenden durch Unterfragen und Online-Hilfetexte geleitet (siehe Details).

Der DMP ist ein integraler Teil des Forschungsgesuchs. Das Gesuch kann erst dann eingereicht werden, wenn auch der DMP ausgefüllt wurde.

Bei einigen Forschungsprojekten werden keine Daten produziert oder weiterverwendet. Gesuchstellende müssen in diesem Fall nicht das gesamte DMP-Formular ausfüllen. Sie müssen jedoch erklären, warum sie davon ausgehen, dass im Rahmen ihres Forschungsprojekts keine Daten produziert oder weiterverwendet werden.

Manche Daten können nicht öffentlich zugänglich gemacht werden, weil dem rechtliche, ethische oder urheberrechtliche Gründe, Vertraulichkeitsklauseln o. ä. entgegenstehen. In diesem Fall müssen die Gesuchstellenden die jeweiligen Einschränkungen erläutern.

2.2. So wird der DMP beurteilt

Der eingereichte DMP gilt als Absichtserklärung. Sein Inhalt wird von der Geschäftsstelle des SNF auf Plausibilität und die Einhaltung der Grundsatzerklärung zu Open Research Data geprüft. Er ist nicht Teil der wissenschaftlichen Evaluation. Die Mitglieder des Forschungsrates oder der Evaluierungsgruppe haben Zugang zu den DMP, sie beurteilen diese Dokumente jedoch nicht. DMP werden nicht durch externe Experten beurteilt.

Ein plausibler DMP ist eine der Voraussetzungen für die Freigabe der Forschungsförderung. Falls die eingereichten Informationen Mängel aufweisen, wird den Gesuchstellenden zum Zeitpunkt des Förderentscheids in mySNF als "Auftrag" signalisiert, die betroffenen Teile des DMP zu ergänzen.

2.3. Verwaltung während des Lebenszyklus

Der DMP kann während der gesamten Projektlaufdauer bearbeitet und sein Inhalt der Entwicklung des Projekts angepasst werden.

In jedem Fall sind die Forschenden aufgefordert, den DMP bei Abschluss ihrer Forschungsarbeit zu aktualisieren. Diese aktualisierte Version wird zusammen mit dem wissenschaftlichen Schlussbericht geprüft. Die Geschäftsstelle des SNF behält sich vor, zusätzliche Informationen und/oder Ergänzungen zum Inhalt des endgültigen DMP zu verlangen.

Die endgültige DMP-Version wird in der P3-Datenbank des SNF veröffentlicht. Dies dient der besseren Sichtbarkeit und Wirkung der Forschungsergebnisse, da die Datensätze so für andere Forschende leichter zugänglich und weiterzuverwenden sind.

3. Beispiele für Data Management Pläne

DMPs sind sehr individuell. Sie unterscheiden sich hinsichtlich Art und Aufbau. Diese Diversität verdeutlichen die Beispiele des Digital Curation Centre (UK).

4. Anrechenbare Kosten

Kosten für die Zugänglichmachung von Forschungsdaten, die mit Beiträgen des SNF erhoben, beobachtet oder generiert wurden, können unter folgenden Voraussetzungen angerechnet werden: Die Forschungsdaten werden in digitalen, wissenschaftlich anerkannten Datenarchiven (data repositories) abgelegt, die die FAIR Prinzipien erfüllen und nicht kommerziell ausgerichtet sind (AR 2.13). Daten können in kommerziellen Datenarchiven abgelegt werden, jedoch sind dann nur Kosten für die Aufbereitung der Daten dem Beitrag anrechenbar.

5. Beispiele für nicht kommerzielle Datenarchive, die den FAIR Daten Prinzipien entsprechen

Dass die FAIR Daten Prinzipien in jeder Hinsicht anzuwenden sind, ist eine ehrgeizige Anforderung. Auch ist es nicht leicht, das "perfekte" Datenarchiv mit allen für FAIR Daten notwendigen Merkmalen zu finden. Um den Wechsel zu "FAIRen Forschungsdaten" zu erleichtern, hat der SNF bestimmte Mindestanforderungen definiert, die Datenbanken erfüllen müssen, damit sie den FAIR Daten Prinzipien entsprechen (Checklisten siehe unten).

Vier Datenarchive, die Datensätze aus unterschiedlichen Forschungsdisziplinen aufnehmen und die Anforderungen des SNF erfüllen sind hier (Dokument auf Englisch) aufgelistet. Natürlich können Daten auch in anderen (fachspezifischen) Datenarchiven abgelegt werden. Falls Forschende dies wünschen, können sie wie nachfolgend beschrieben vorgehen. So ist gewährleistet, dass das gewählte Datenarchiv die Anforderungen des SNF (nicht kommerziell, FAIR Daten Prinzipien) erfüllt.

5.1. Checkliste, um nicht kommerzielle Datenbanken zu finden

Die meisten Datenbanken sind auf www.re3data.org (englischsprachige Website) gelistet.

  • Prüfen Sie auf der Registerkarte "Institutions", ob eine kommerzielle Organisation allgemein ("general") oder technisch ("technical") verantwortlich ist. (Kategorien: "Type of institution" und "Type(s) of responsibility").
  • Trifft das nicht zu, erachtet der SNF die Datenbank als nicht kommerziell (Tritt eine kommerzielle Organisation als Geldgeber "funding" oder Sponsor "sponsoring" auf, ist das in Ordnung.)
  • Trifft Punkt 1 zu, betrachtet der SNF die Datenbank als kommerziell (siehe Details)

Ist das Datenarchiv nicht auf www.re3data.org verzeichnet, klären Sie diesen Punkt durch direkte Kontaktaufnahme mit den zuständigen Personen. Ausserdem sollten Sie die Datenbank zur Aufnahme in das Verzeichnis www.re3data.org vorschlagen.

5.2. Checkliste, um Datenbanken zu finden, welche die FAIR Daten Prinzipien erfüllen

Prüfen Sie, ob die Datenbank mit den FAIR Daten Prinzipien vereinbar ist. Das ist der Fall, wenn Sie jede der nachfolgenden Fragen mit "ja" beantworten können (siehe Beispiele, Dokument auf Englisch).

  • Sind die Datensätze (oder idealerweise die einzelnen Dateien eines Datensatzes) mit eindeutigen und dauerhaften Identifikatoren (bspw. DOI) versehen?
  • Erlaubt die Datenbank das Heraufladen intrinsischer Metadaten (bspw. Name des Autors, Inhalt des Datensatzes, dazugehörige Publikation) und von Metadaten, die der Registrierende definiert (bspw. Bezeichnungen von Variablen)?
  • Ist es ersichtlich, mit welcher Lizenz (bspw. CC0, CC BY) die Daten auf dem Datenarchiv verfügbar sein werden? Oder kann der Benutzer eine Lizenz heraufladen oder auswählen?
  • Sind Quelleninformationen und Metadaten immer öffentlich verfügbar (selbst bei eingeschränkt zugänglichen Datensätzen)?
  • Liefert das Datenarchiv eine Eingabemaske, die ein bestimmtes Format für die intrinsischen Metadaten vorschreibt (um die maschinelle Lesbarkeit/Kompatibilität zu gewährleisten)?
  • Verfügt die Datenbank über einen Plan für die langfristige Erhaltung der archivierten Daten?