Data Management Plan (DMP) - Directives pour les chercheuses et chercheurs

1. Introduction

Gérer et partager les données de la recherche d'une manière aussi ouverte que possible relève des principes de la bonne pratique scientifique. Le FNS adhère à ces principes dans le règlement des subsides qui stipule que "[…] les bénéficiaires de subsides s'engagent à ce que les résultats de recherche soutenus par des ressources du FNS soient rendus accessibles au public de manière appropriée, […]" (article 47). Le FNS précise également ses attentes vis-à-vis des scientifiques encouragés dans sa déclaration de principe sur le libre accès aux données de la recherche. Pour mettre en œuvre ces principes, le FNS privilégie une approche "bottom-up". Il fournit des directives relatives aux bonnes pratiques et permet à chaque communauté scientifique de définir et d'appliquer ses propres standards avec une grande flexibilité. La façon la plus pertinente de gérer et de partager des données dépend en effet étroitement du domaine de recherche concerné.

Le but d'un plan de gestion des données (DMP) est de planifier le cycle de vie des données. Il offre une perspective à long terme en définissant de quelle manière les données seront générées, collectées, documentées, partagées et préservées. Le FNS met à la disposition des chercheuses et chercheurs un formulaire type afin de compléter leur plan de gestion des données. Le DMP de chaque projet dépend de standards et pratiques spécifiques à la discipline et peut dès lors différer dans son contenu.

Le FNS s'attend à ce que les données sur lesquelles se basent les publications soient partagées. Il s'agit au minimum des données nécessaires pour reproduire les résultats publiés. Ces données doivent être rendues accessibles aussi rapidement que possible, mais au plus tard au moment de la publication scientifique correspondante. Les données peuvent être brutes ou traitées selon l'étude réalisée et la discipline concernée. Les sets de données doivent toujours être soigneusement documentés au moyen des métadonnées associées, de manière à ce que d'autres chercheuses et chercheurs comprennent comment et dans quelles conditions les données ont été collectées et comment elles peuvent être réutilisées. Lorsque la réutilisation des données exige des outils spécifiques, il doit en être fait état et ces outils doivent si possible être mis à disposition. Les données et la documentation (métadonnées) fournies doivent dans tous les cas être suffisamment précises pour permettre leur réutilisation. Dans le cas où ces exigences ne peuvent pas être remplies, les chercheuses et les chercheurs sont prié-e-s d'en donner les raisons dans leur DMP.

Partage des données – meilleures pratiques

Afin de faciliter la découverte, l'accès, la réutilisation et la citation des données de la recherche, il est important que leur publication réponde à un ensemble de bonnes pratiques clairement définies et largement applicables. Les principes FAIR1  définissent différentes qualités dont devrait être doté un set de données pour que celui-ci puisse être trouvé et qu'il soit accessible, interopérable et réutilisable (voir Explanation of the FAIR Data Principles, document en anglais). Conformément aux principes FAIR, le FNS attend des chercheuses et chercheurs que les données produites au cours de leurs travaux de recherche soient archivées dans des banques de données numériques en libre accès. Il est important de souligner que les principes FAIR n'exigent pas que les scientifiques partagent toutes leurs données sans exception. Ils recommandent que les données de la recherche soient partagées à des fins de réutilisation dans le cadre d'une procédure standard de sorte qu'humains et systèmes informatiques puissent facilement les trouver, les interpréter et les utiliser dans des conditions clairement définies. Les principes FAIR sont adoptés par un nombre croissant d'organisations d'encouragement de la recherche (p. ex. Horizon 2020, NIH).

1Wilkinson, M. D. et al. The FAIR Guiding Principles for scientific data management and stewardship. Sci. Data 3:160018 doi: 10.1038/sdata.2016.18 (2016)

2. Le plan de gestion des données du FNS

Afin de mettre en œuvre sa politique en matière de libre accès aux données de la recherche (Open Research Data ou ORD), le FNS requiert que des informations sur le cycle de vie des données soient fournies lors de la soumission des requêtes. Afin de tenir compte des pratiques de gestion des données propres à chaque discipline, le FNS a uniquement défini des standards minimaux relatifs à la structure et au contenu de ces informations.

2.1. Comment soumettre un DMP

Lorsqu'ils complètent leur requête sur la plateforme mySNF, les chercheuses et chercheurs doivent fournir des informations relatives à la gestion de leurs données de recherche. Le contenu du DMP est divisé en quatre rubriques: (1) collecte et documentation des données, (2) aspects éthiques, juridiques et sécuritaires, (3) archivage et préservation des données, et (4) partage et réutilisation des données. Des sous-questions et des textes explicatifs consultables en ligne aideront les chercheuses et les chercheurs à compléter ce formulaire (voir détails). Les "questions à prendre en considération" peuvent vous servir d’aide pour compléter le formulaire. Selon votre projet et domaine de recherche, il n’est pas nécessaire de répondre à chacune de ces questions. Les requérant-e-s soumettent un DMP dont la pertinence est vérifiable et qui correspond aux besoins de leur projet et à ceux de leur communauté de recherche. A ce stade, le DMP est considéré comme une ébauche et n'est pas pris en compte dans l'évaluation de la requête. Un DMP définitif doit être fourni au plus tard lors de l'achèvement du projet de recherche.

Le DMP fait partie intégrante de la soumission d'une requête. Une requête ne pourra pas être soumise tant que le DMP n'aura pas été complété.

Certains projets de recherche ne produisent pas de données ou n'exigent pas leur réutilisation. Dans ce cas, les requérant-e-s n'auront pas à remplir entièrement le formulaire du DMP. Il leur sera néanmoins demandé d'indiquer pour quelles raisons ils n'envisagent pas de produire ou de réutiliser des données dans le cadre des recherches proposées.

Certaines données ne peuvent pas être partagées parce que les requérant-e-s sont liés par des clauses juridiques, éthiques, de confidentialité ou concernant les droits d'auteur. Il leur sera néanmoins demandé de justifier ces contraintes spécifiques.

Si un plan de gestion des données (DMP) a été soumis auprès d’une agence partenaire qui officie en tant que Lead Agency, nous vous prions d’en télécharger une version pdf dans la rubrique "Autres annexes". Dans le cas où un DMP n’a pas été soumis auprès de cette agence partenaire, la rubrique DMP doit être remplie sur mySNF. Le DMP doit porter sur l’ensemble des données produites ou réutilisées au cours du projet.

2.2. Évaluation du DMP

Le DMP est considéré comme une déclaration d'intention. Son contenu est examiné par le Secrétariat du FNS quant à sa plausibilité et au respect de la politique du FNS en matière de libre accès aux données de la recherche. Il ne fait pas partie du processus d'évaluation scientifique. Les membres du Conseil de la recherche ou du panel d'évaluation auront accès aux DMP mais ne procèderont pas à l'évaluation de ces documents. Les DMP ne seront pas soumis à une expertise externe.

Le déblocage des fonds est subordonné à la soumission d'un DMP plausible. Si les informations fournies présentent des lacunes, les requérant-e-s se verront assigner une "tâche" sur la plateforme mySNF afin que des rubriques spécifiques du DMP soient complétées ou modifiées au moment où interviendra la décision d'octroi.

2.3. Gestion du cycle de vie

Le DMP demeure modifiable durant toute la durée de vie du subside. Son contenu peut être adapté au fur et à mesure de l'évolution du projet.

Les chercheuses et chercheurs seront dans tous les cas invités à mettre à jour leur DMP à la fin du subside. Cette version mise à jour sera examinée en même temps que le rapport scientifique final. Le Secrétariat du FNS se réserve le droit de demander des informations additionnelles et/ou des modifications relativement au contenu du DMP final.

La version finale du DMP sera mise à disposition dans la base de données P3 du FNS. Ceci permettra d'accroître la visibilité et l'impact des résultats de recherche en facilitant l'accès et la réutilisation des sets de données par les autres chercheuses et chercheurs.

3. Exemples de plans de gestion des données

Les DMP revêtent un caractère très individuel. Ils peuvent prendre différentes formes et être structurés de différentes façons. Les exemples fournis par le Digital Curation Centre (Royaume-Uni) reflètent cette diversité.

4. Coûts éligibles

Les frais de mise à disposition des données de recherche collectées, observées ou générées grâce à des subsides du FNS, sont éligibles aux conditions indiquées ci-après: les données de recherche sont archivées dans des bases de données (data repositories) scientifiques reconnues, qui satisfont aux principes FAIR et qui n'ont pas de vocation commerciale (RE, 2.13). Le dépôt sur des bases de données à vocation commerciale est possible, mais seuls les coûts de préparation des données sont dès lors considérés éligibles par le FNS.

5. Exemples de banques de données non commerciales satisfaisant aux principes FAIR

Exiger que les principes FAIR soient appliqués dans les moindres détails apparaît ambitieux. Trouver la banque de données "parfaite" disposant de toutes les caractéristiques nécessaires pour accueillir des données FAIR constitue également un défi en soi. Afin de faciliter la transition vers des données FAIR, le FNS a décidé de définir un ensemble de critères minimaux que les banques de données doivent remplir afin de se conformer aux principes FAIR (voir checklists ci-dessous).

Quatre banques de données qui acceptent les sets de données issus de différents domaines de recherche et satisfont aux exigences du FNS sont présentées ici (document en anglais). Il est naturellement possible d'archiver des données de recherche dans d'autres banques (spécifiques à certaines disciplines). Si les chercheuses et chercheurs le souhaitent, ils peuvent procéder comme indiqué ci-dessous afin de s'assurer que la banque de données choisie est conforme aux exigences du FNS.

5.1. Checklist pour identifier des banques de données satisfaisant aux principes FAIR

Vérifiez si la banque de données est compatible avec les principes FAIR. La réponse à chacune des questions suivantes doit être affirmative (voir exemples, document en anglais).

  • Des identifiants uniques et durables (DOI p. ex.) sont-ils globalement attribués aux sets de données (ou idéalement aux fichiers composant ce set)?
  • La banque de données permet-elle de charger les métadonnées intrinsèques (p. ex. nom de l'auteur, contenu du set de données, publications associées, etc.) et celles définies par la personne soumettant les données (p. ex. définition des variables, etc.)?
  • La licence (CC0, CC BY, etc.) sous laquelle les données seront accessibles est-elle clairement mentionnée ou l'utilisateur peut-il télécharger/choisir une licence?
  • Les citations et les métadonnées sont-elles toujours accessibles publiquement (même dans le cas de sets de données à accès restreint)?
  • La banque de données fournit-elle un formulaire de soumission demandant que les métadonnées intrinsèques respectent un format spécifique (afin d'assurer leur utilisation automatique/interopérabilité)?
  • La banque de données dispose-t-elle d'un plan de préservation à long terme des données archivées?

5.2. Checklist pour identifier des banques de données non commerciales

Le site re3data.org (en anglais) recense la plupart des banques de données.

  • Sous l'onglet "Institutions", vérifiez si une entité commerciale est impliquée au titre de la responsabilité "general" ou "technical" (catégories "Type of institution" et "Type(s) of responsibility").
  • Si la réponse est négative, le FNS considère que la banque de donnée est non commerciale [il est accepté qu'une entité commerciale assure un financement (funding) ou un parrainage (sponsoring)].
  • Dans l'affirmative, le FNS considère que la solution envisagée constitue une banque de données commerciale (voir détails, document en anglais).

Si la banque de données n'apparaît pas sur le site www.re3data.org, contactez la banque de données afin de clarifier ce point. Merci de suggérer également que la banque de donnée soit intégrée au site www.re3data.org.