Les dompteurs du flux d'informations

Un Flux d'informations. © Fotolia

La numérisation de la communication et de la science rapproche les bibliothèques académiques du milieu scientifique, et confère aux premières un rôle plus actif. Un pas nécessaire pour faire fructifier les énormes quantités de publications et de donnés brutes. Par Stéphane Praz

(De "Horizons" no 104, mars 2015)

"Une bibliothèque est un organisme en développement", dit le cinquième commandement des sciences de l’information et des bibliothèques, formulé par le mathématicien Shiyali Ranganathan. Cette loi vaut encore aujourd’hui. Même si l’offre explose.

Par le biais d’Internet, les bibliothèques académiques peuvent assimiler en une nuit des stocks gigantesques, pour autant qu’elles disposent de moyens financiers suffisants pour accéder aux grandes maisons d’édition. Elles n’ont pas besoin de nouveaux locaux d’archives, les produits sont stockés sous forme de bits dans des fermes de serveurs. Quant à la production scientifique en ligne, elle se multiplie plus vite que jamais. Selon une étude de l’EPFZ, elle double tous les neuf ans.

La révolution numérique a transformé les bibliothèques académiques. La mise en réseau internationale et les nouvelles possibilités d’interaction avec le client – on parle de bibliothèque 2.0 – en sont des manifestations. Mais la transformation est bien plus profonde. "La numérisation nous relie, nous autres bibliothèques, plus étroitement que jamais à l’ensemble du milieu scientifique, explique Wolfram Neubauer, directeur de la Bibliothèque de l’EPFZ. La numérisation place la science face à de nouveaux défis que nous sommes prédestinés à relever."

Les scientifiques le réalisent probablement de manière particulièrement nette lorsqu’ils sont amenés à publier. Alors que le mouvement Open Access leur permet d’accéder à de nombreuses publications en ligne, gratuitement et sans avoir à se rendre à la bibliothèque, c’est en même temps par elle qu’ils passent pour diffuser leur travail. Sur mandat des hautes écoles et des universités, les bibliothèques publient en effet nombre de leurs contenus en Open Access (thèses de doctorat et d’habilitation, interventions en colloques, articles) sur leurs serveurs. Par ailleurs, elles conseillent les scientifiques dans leurs contacts avec les grandes maisons d’édition Open Access, comme PLOS et BioMed Central. Publier son travail en Open Access est attrayant, voire obligatoire si les connaissances sont issues de travaux financés par des fonds publics. Mais le rapport aux revues amène aussi son lot de questions. «Beaucoup de scientifiques se soucient surtout de la renommée de telle revue ou de telle forme de publication, relève Nicolas Sartori, spécialiste du libre accès électronique à l’Université de Bâle. Et avec les premières publications en Open Access, la question du financement se pose aussi, bien entendu.» En effet, avec ces revues, certains coûts doivent être supportés par l’auteur, mais ce dernier y gagne à la longue. Les aspects juridiques sont clarifiés, les publications se distribuent plus vite et sont plus souvent citées.

Standards uniformes nécessaires

Le travail prêt à être publié n’est que le sommet de l’iceberg. Au-dessous se trouvent d’énormes quantités de données brutes. Aujourd’hui, chaque laboratoire, chaque simulation informatique génère quotidiennement plus de données que ne le faisaient récemment des universités entières en un an. Ces données demandent à être archivées. Cela stimule la bonne pratique scientifique qui dit que les expériences et les réflexions doivent pouvoir être vérifiées et reconstruites. Ce sont de plus en plus souvent les bibliothèques qui assument cette tâche, car les instituts n’arrivent plus à en venir bout. Les chercheurs qui réfléchissent en périodes d’archivage de plus de dix ans sont rares, et les directives uniformes de stockage structuré des données sont également peu fréquentes. C’est ce qu’a montré un sondage de la Bibliothèque de l’EPFZ auprès de 450 professeurs et groupes de recherche.

"Si nous voulons faire davantage que léguer aux générations futures une quantité incommensurable, mais inutilisable, de données, nous devons nous organiser en fonction de standards uniformes", argue Wolfram Neubauer. Les bibliothèques apportent avec elle un savoir-faire en gestion des données. Mais sans contact étroit avec le milieu scientifique, rien n’est possible, comme l’a montré le projet pilote de l’EPFZ "Data Curation". Suivant les disciplines, les formats des données sont aussi divers que les besoins de structuration. "Les bonnes solutions doivent être conçues pour certains projets avec les scientifiques, idéalement avant même que les données ne soient générées", détaille Wolfram Neubauer. Dans l’espace anglo-saxon, le concept d’"embedded librarian" s’est déjà établi. Un spécialiste est intégré dans l’équipe de chercheurs et s’occupe de la structuration et de l’archivage des données.

Méthodes de recherche plus fines

Mais avant qu’ils ne publient, avant qu’ils ne génèrent des données, les scientifiques doivent être au fait des connaissances qui existent déjà. Les bibliothèques mettent ce savoir à disposition, en ligne et en accès libre, ou dans leurs murs. Au-delà, elles se voient toujours plus comme des passeuses de compétences en information, indispensables pour la recherche scientifique. Pour Thomas Henkel, spécialiste en technique de recherche à la Bibliothèque cantonale et universitaire de Fribourg, la compétence en information n’équivaut pas à la formation à l’utilisation. La différence est importante. "Nous formons les scientifiques pour qu’ils soient capables de rechercher, d’évaluer et d’utiliser l’information dans la jungle mondiale des données", précise-t-il. Or, d’après ce spécialiste, de nombreux étudiants du cours d’introduction ne connaissent guère plus que la recherche Google, et il arrive que même des scientifiques diplômés n’aient que des connaissances sommaires de Google Scholar, Web of Science ou Scopus. "Nombre d’entre eux ignorent des méthodes de recherche plus fines, par exemple à l’aide d’opérateurs booléens", souligne encore Thomas Henkel. Sans parler d’instruments de recherche spécifiques, comme la recherche d’images de structures chimiques dans Scopus, les banques de données spécialisées et les programmes de gestion de la littérature. Ces auxiliaires sont aujourd’hui pratiquement incontournables pour une recherche et une gestion efficace de la littérature scientifique. Wolfram Neubauer considère, lui aussi, que la compétence en information spécialisée est une condition de base du travail scientifique. «Elle doit devenir partie intégrante de l’enseignement, affirme-t-il. Comme c’est déjà le cas dans de nombreuses universités américaines." Mais pour que ce soit possible, il faut une collaboration étroite entre facultés et bibliothèques.

Stéphane Praz est journaliste scientifique indépendant.