Science, ouvre-toi!
C’est la vision de la science ouverte: les scientifiques divulguent systématiquement leurs plans d’études; jour après jour, ils documentent de manière transparente leurs progrès en laboratoire sur des blogs; leurs publications paraissent dans des revues scientifiques en libre accès après avoir été évaluées par leurs pairs de manière ouverte et leurs résultats, déposés dans des bases de données en ligne, sont accessibles à tous. Vision ou utopie?
Ce nouveau paradigme se heurte à des défis – voire des résistances – de taille. Soit c’est l’argent qui manque, soit c’est une personne disposant des compétences techniques nécessaires qui fait défaut. De manière générale, de nombreux scientifiques hésitent à divulguer leurs données par crainte de voir leurs concurrents leur voler leurs idées et publier avant eux.
La Big Science – comme le CERN ou le Human Genome Project – est connue pour partager ses données de recherche, mais ces exemples sont trompeurs. Il existe encore d’importantes entraves dans de nombreux domaines. Il est facile d’exiger ouverture et transparence, mais un tel appel peut décourager le chercheur individuel qui ne dispose ni des moyens ni de l’expertise nécessaires. Et ces données restent difficilement utilisables par d’autres scientifiques. «Le temps et les compétences manquent à de nombreuses personnes pour documenter suffisamment leurs données et les diffuser», indique Benedikt Fecher, un doctorant à l’institut allemand pour la recherche économique (DIW) et à l’institut Alexander von Humboldt pour l’Internet et la société (HIIG) à Berlin qui a étudié l’attitude des chercheurs par rapport à l’open science.
La peur du vol
Aux Etats-Unis et en Europe, les organisations d’encouragement de la recherche ont affirmé haut et fort leur volonté de faire avancer le partage des données, mais l’intention ne suffit pas pour imposer les standards de l’open science. Les chercheurs ont besoin d’être soutenus en termes d’organisation, de finances et de personnel. C’est ce que fait par exemple le Centre de compétences suisse en sciences sociales (FORS). Cette institution prête main forte au niveau de l’organisation, de la documentation et du stockage des données de recherches en sciences sociales, et met à disposition l’infrastructure nécessaire. Les scientifiques peuvent se former dans le cadre d’ateliers et accéder à des outils en ligne de gestion des données.
Le concept de l’open science est relativement bien établi dans les sciences naturelles, mais génère parfois davantage de méfiance dans les sciences sociales, notamment parce qu’on y travaille le plus souvent avec des informations personnelles et soumises à la protection des données. Et les chercheurs en sciences humaines ont généralement moins l’habitude de documenter leurs travaux de manière standardisée, note Alexandra Stam, responsable du groupe Data Promotion du FORS: «De nombreux chercheurs ne réalisent pas que leurs données peuvent continuer à vivre une fois leur travail terminé.» Des détails importants se perdent ainsi inutilement. Les raisons sont aussi à chercher dans la formation: la gestion des données n’est pas formellement enseignée pendant les études. Souvent, les chercheurs oublient de documenter leurs résultats en cours de projet. Ils ne s’y mettent que lorsque ce dernier touche à sa fin.
Dans certains pays, par exemple aux Etats-Unis et au Royaume-Uni, la demande de fonds de recherche doit souvent s’accompagner d’un plan de gestion des données. En Suisse, ce n’est pas encore le cas. Alexandra Stam espère que ce sera pour bientôt. Il est d’ailleurs essentiel que les bases de données soient conçues dans le long terme – sans quoi leur entretien reste en suspens une fois le projet terminé.
Malgré des initiatives telles que le FORS, l’optimisme est mesuré. Même s’ils bénéficient d’un soutien, nombreux sont les chercheurs qui hésitent à divulguer leurs données. Lors de ses sondages menés auprès des chercheurs, Benedikt Fecher a constaté un fossé entre une attitude positive par rapport à la science ouverte au niveau général et la retenue individuelle à partager ses propres données.
Souvent, c’est la peur du vol d’idées qui inhibe les chercheurs. Même si ce risque est largement surestimé, on ne peut nier que des cas existent. Titus Brown, chercheur en génétique à l’Université de Californie à Davis, a rapporté comment des concurrents avaient utilisé des méthodes qu’il avait inventées pour rédiger des articles scientifiques dont il aurait pu être l’auteur. Il est néanmoins resté favorable à la divulgation, car il est convaincu de son utilité pour la recherche.
Bien entendu, il y a encore d’autres raisons à cette retenue. Une espèce de droit coutumier peut par exemple faire obstacle à la transparence. Dans la recherche médicale empirique, une vieille attitude reste répandue: l’auteur des données doit être aussi co-auteur d’une étude s’appuyant sur celles-ci, explique Benedikt Fecher.
L’aide-mémoire en ligne
De manière générale, le système manque d’éléments encourageant à diffuser davantage de détails sur ses travaux. Aujourd’hui, les chercheurs sont évalués à l’aune de la qualité et de la quantité de leurs publications. Mais il n’existe encore aucune reconnaissance académique pour les jeux de données, «ce que les chercheurs apprécieraient», selon Benedikt Fecher. «Il est important que les gens reconnaissent l’utilité d’une bonne gestion des données pour leur propre recherche, au-delà du partage», renchérit Alexandra Stam.
Ces dernières années ont vu apparaître des revues spécialisées qui mettent les données au cœur des publications – à l’instar de Scientific Data du Nature Publishing Group. L’archéologie, les sciences de la Terre et d’autres branches scientifiques possèdent aujourd’hui de tels «data journals» spécifiques. Ces médias spécialisés combleront une lacune jusqu’à ce que les données de recherche soient formellement reconnues.
Les choses sont un peu différentes dans la divulgation des processus de recherche, par exemple avec les «open lab books», des carnets de notes de laboratoire ouverts. Carl Boettiger, biologiste à l’Université de Californie à Berkeley, avait déjà commencé à mettre en ligne ses notes de recherche lorsqu’il était doctorant. Il admet avoir eu de la chance: aucun supérieur ne s’en était offusqué. Mais ce n’est pas la règle. Certains jeunes chercheurs suscitent l’irritation de leurs collègues avec leur ouverture débridée. Dans certaines situations, ils portent même préjudice à leur carrière.
Carl Boettiger utilise surtout son cahier de laboratoire comme aide-mémoire et pour l’échange avec ses collègues. Il lui est arrivé que des co-auteurs d’articles scientifiques lui demandent de ne pas partager certaines informations sensibles. Mais sinon, il note tout, tout de suite, sans avoir jamais vu ses idées volées par d’autres. Outre les craintes parfois vagues liées à l’open science, les carnets de notes de laboratoire ouverts peuvent représenter un problème concret: ils sont chronophages et nécessitent de s’initier à certains programmes informatiques. Carl Boettiger a cofondé il y a quelques années le projet rOpenSci, une plateforme qui facilite l’organisation et le partage d’informations liées à une recherche.
La science ouverte ne se limite pas aux données et à la communication, mais inclut également le matériel et les logiciels. Dans les projets en open source, schémas de câblage et plans de construction sont mis à disposition, explique Lorenz Meier de l’Institute for Visual Computing de l’ETH Zurich. Il a développé le logiciel autopilote «PX4» qui permet de contrôler des drones et des avions miniatures. Le programme et les instructions sont téléchargeables gratuitement. «Dans le cas des drones, les solutions open source sont même supérieures aux logiciels militaires, dit-il. Plus aucune société privée n’est en mesure de développer toute seule un nouveau logiciel.»
Le doctorant a collaboré avec des entreprises dans le cadre de plusieurs projets. La plupart du temps, il a pu les convaincre de travailler avec des matériels et des logiciels ouverts. Dans le cas des logiciels, elles étaient souvent prêtes à communiquer les améliorations mises au point pendant le projet.
Pour Lorenz Meier, ces collaborations fonctionnent bien, même si ce n’est pas toujours du premier coup. Selon son expérience, elles se ferment au partage notamment lorsqu’elles imaginent des problèmes, comme une menace pour leur modèle d’affaire. Pour désamorcer ces résistances, il faut clarifier ce qui est véritablement lucratif dans un projet. Or, souvent, ce n’est ni le plan de construction ni le logiciel, mais plutôt l’offre d’expertise et de services.
Des modèles tels Linux, où le code source est accessible à tous sans aucune protection, ont fait leurs preuves sur le marché. Les entreprises ont identifié semblables avantages et font même cadeau de certains brevets au mouvement open source, indique Oliver Gassmann de l’institut de gestion de la technologie de l’Université de Saint-Gall: «Les nouveaux standards s’imposent ainsi beaucoup plus vite qu’avec des solutions protégées.» La tâche d’une société est alors de chercher la création de valeur ailleurs.
Oliver Gassmann juge positive la collaboration entre instituts de recherche et entreprises privées: ces dernières accèdent à des connaissances fondamentales et les premiers à un financement supplémentaire. La science ouverte peut susciter des conflits lorsque les chercheurs publient tellement vite qu’ils entrent en collision avec l’état de la technologie au moment des demandes de brevets. Mais ce problème de fond, souligne-t-il, existe aussi dans les projets classiques de coopération entre hautes écoles et partenaires privés. Avec la science ouverte, il est seulement accentué.
Transparence et vie privée
L’exigence de transparence atteint ses limites lorsque les informations divulguées sont utilisées pour ternir des réputations. Certains climatologues – notamment dans les pays anglo-saxons – en savent quelque chose. Ils ont dû honorer d’agaçantes demandes de divulgation de données qui s’appuyaient sur le Freedom of Information Act, une loi de 1967. Souvent, les informations obtenues ont ensuite été exploitées pour présenter comme douteux le consensus sur le climat. Michael Mann de la Pennsylvania State University est l’une des victimes les plus célèbres de ce genre d’activisme.
La question de savoir jusqu’où les chercheurs doivent aller dans la divulgation de leur travail n’est pas facile à trancher. Une trop grande pression à la transparence peut avoir un effet indésirable si l’autocensure conduit à un comportement conformiste qui grèverait les perspectives de succès de la science ouverte.
La vie privée devient un problème particulièrement sérieux lorsqu’il est question de droits de tiers, comme autoriser d’autres médecins à accéder aux données de patients ayant participé à des études cliniques ou génétiques. Mais les conséquences d’un blocage sont sérieuses: jusqu’à présent, les médecins confrontés à des patients atteints de maladies rares peinent à trouver des cas comparables pour orienter leur traitement. La protection des données leur fait obstacle.
Mais il existe des solutions même dans des cas aussi sérieux. Fondée en 2013 et réunissant plus de 380 institutions, la Global Alliance for Genetic Health élabore des procédures pour partager sur une base volontaire des données de patients de manière sûre et efficace. L’association a développé un modèle progressif d’autorisation de partage des données géré par les patients pour, notamment, faciliter les recherches sur les maladies rares et infectieuses ainsi que sur le cancer. I
* Journaliste scientifique à Berlin. Paru dans Horizons n°110, septembre 2016, FNS, www.snf.ch/fr/