Date | Version | Statut | Contributeurs |
18/01/2019 | v. 0 | Jalons | Séance plénière |
20/02/2019 | v. 1 | Création du document | V. Stoll, PY Arnould |
21/03/2019 | v. 2.1 | Ajouts, commentaires | C. Arènes, C. Sebban, T. Jouneau, J. Joanik, D. Chopard-Lallier |
26/03/2019 | v. 2.2 | Ajouts, commentaires | Séance plénière |
28/03/2019 | v. 3 | Synthèse | V. Stoll, PY Arnould |
11/04/2019 | v. 4.1 | Ajouts, commentaires | C. Arènes, N. Couedel, C. Sebban, C. Espiau, T. Jouneau – synthèse V. Stoll, PY Arnould |
16/04/2019 | v. 4.2 | Ajouts, commentaires | Séance plénière |
18/04/2019 | v.5 | Synthèse | V. Stoll, PY Arnould |
24/04/2019 | v.5.1 | Ajouts, commentaires | T. Jouneau, D. Chopard-Lallier, L. Albaret, S. Fortuno |
24/04/2019 | v5.2 | Synthèse | V. Stoll, PY Arnould |
12/11/2019 | V5.3 | Synthèse | V.Stoll, PY Arnould |
Le présent Guide identifie un socle de quelques objectifs fondamentaux à atteindre, complétés par des propositions d’actions additionnelles (recommandations), déclinables en fonction de l’ambition institutionnelle, des moyens et de la spécificité des unités de recherche.
Le Plan national pour la Science ouverte publié par le ministère de l’Enseignement supérieur, de la Recherche et de l’Innovation le 4 juillet 2018 s’est donné comme ambition de rendre à terme les données issues de la recherche [1]Selon l’OCDE, http://www.oecd.org/fr/science/inno/38500823.pdf : « les données de la recherche sont définies comme des enregistrements factuels (chiffres, textes, images et sons), qui sont utilisés comme sources principales pour la recherche scientifique et sont généralement reconnus par la communauté scientifique comme nécessaires pour valider les résultats de la recherche ». financée sur fonds publics conformes aux principes FAIR [2]Acronyme pour Findable, Accessible, Interoperable, Reusable, soit Facile à trouver, Accessible, Interopérable, Réutilisable. (axe no 2). Pour y parvenir, une série de mesures y est déclinée, notamment :
Ce Guide s’efforce de tenir compte des différences existantes dans la gestion des données de la recherche, tant au niveau des disciplines que des établissements et opérateurs du MESRI.
Ce document ne traite pas des aspects liés aux publications [3]Se référer aux travaux du Collège publications., à l’intégrité scientifique [4]Voir les travaux de l’Office français de l’intégrité scientifique : https://www.hceres.fr/fr/ofis., ni le volet juridique (licences, RGPD etc.), qui feront l’objet de travaux ultérieurs du CoSO.
Les enjeux de science ouverte deviennent de plus en plus prégnants dans les pratiques de recherche. Une des raisons invoquées réside en l’évolution des politiques des financeurs publics, qui glissent progressivement de l’incitation à l’obligation [5] Voir notamment : la politique européenne H2020 : http://www.horizon2020.gouv.fr/cid82025/le-libre-acces-aux-publications-aux-donnees-recherche.html et le Plan d’action 2019 de l’ANR : http://www.agence-nationale-recherche.fr/financer-votre-projet/plan-d-action-2019/, mais aussi à l’étranger la National Science Foundation : https://www.nsf.gov/news/special_reports/public_access/.. Plus largement, les objectifs majeurs d’une science ouverte concernent le partage des savoirs à des fins de validation et d’intégrité des pratiques scientifiques, l’encouragement à réaliser de nouvelles collaborations, la valorisation et la réutilisation des données produites lors de projets de recherche. Tous ces objectifs doivent en outre respecter le cadre de production établi lors des accords-cadres du projet et prendre en considération la réglementation en vigueur (loi 78-17 du 6 janvier 1978 modifiée, loi pour une République numérique du 7 octobre 2016 et règlement 2016/679 sur la protection des données).
Chaque opérateur de recherche à l’échelle nationale (université, établissement de recherche, regroupement…) est encouragé à se saisir de ces problématiques et à adopter au plus haut niveau un texte-cadre, définissant les grandes lignes politiques et son ambition en matière de science ouverte.
Recommandation n°1 :
Faire adopter un texte-cadre sur la science ouverte au niveau de l’établissement
A minima, il est recommandé que ce document traite des sujets suivants [6]Pour mémoire, le dépôt des publications et l’intégrité scientifique ne doivent pas être omis. :
Selon l’engagement de l’établissement dans la gestion des données, une attention particulière peut être portée à :
L’adoption d’une politique d’établissement devrait être précédée d’une brève étude, qui pourra prendre la forme d’une enquête, analysant l’existant des pratiques et services, tout en identifiant les lacunes sur la gestion des données de la recherche et leur cycle de vie.
Il conviendra ensuite de bien déterminer le rôle des instances au niveau de la gouvernance, propres à décider ou inciter les actions à mener et à les diffuser, notamment :
Il est vivement recommandé de faire voter par les instances politiques (conseil d’administration, conseil scientifique) un texte-cadre, comme une charte de bonnes pratiques, reprenant par exemple [9]Des exemples pourront être trouvés à l’INRA, au CIRAD, à l’Observatoire de Paris… :
Selon les ambitions propres à chaque politique d’établissement, ce document-cadre pourra se limiter à une forte incitation ou au contraire se vouloir plus contraignant [10]On pourra citer l’exemple de l’université de Marseille ou des Arts et Métiers Paris Tech..
Il est recommandé aux établissements de nommer un chargé de mission science ouverte dédié aux questions de science ouverte (archives ouvertes, données de la recherche…), afin d’accompagner la gouvernance de l’établissement.
Recommandation n°2 :
Nommer un chargé de mission science ouverte auprès de la gouvernance
Les données de la recherche n’ont pas vocation à être produites et utilisées exclusivement pour un projet scientifique. Au contraire, une bonne gestion laisse entrevoir de nouvelles applications possibles, par exemple par le croisement ou la fouille de données. Pour ce faire, il est indispensable que les données soient stockées, structurées, interopérables et partagées (selon les principes FAIR), et, si possible, ouvertes (open data).
Plusieurs leviers peuvent être envisagés :
Recommandation n°3 :
Encourager l’écriture d’article de données (Data papers)
Dès l’adoption des principes de la science ouverte par la gouvernance, les premières actions porteront d’abord sur la sensibilisation et le développement progressif de compétences et de bonnes pratiques.
L’adhésion progressive de l’ensemble des acteurs de la communauté scientifique (chercheurs, personnels d’accompagnement…) apparaît indispensable à une appropriation des enjeux.
Les bonnes pratiques existantes des équipes de recherches gagneront à être favorisées et valorisées. Leurs expériences concourront à alimenter les réflexions internes et à dynamiser les bonnes pratiques.
L’engagement des différents acteurs de la recherche (chercheurs, ITA, BIATSS…) dans la science ouverte et la gestion des données se doit d’être reconnu, y compris sur le plan de l’avancement des carrières.
Enfin, des opérations de sensibilisation et de formation permettront de diffuser une culture pratique de la science ouverte et de la science des données auprès de publics variés (masters, doctorants, mais aussi chercheurs et équipes d’appui à la recherche), en s’appuyant le cas échéant sur les acteurs locaux (MSH, URFIST…).
Recommandation n°4 :
Développer une culture de la science ouverte par la sensibilisation et la formation des différents acteurs de la recherche.
Il revient à chaque opérateur de recherche de définir ses propres processus internes et sa coordination d’ensemble pour la science ouverte (définition des rôles, dans un panel d’acteurs au profil diversifié).
Pour ce faire, il est nécessaire d’identifier les acteurs pivots pour un pilotage opérationnel optimal :
La coordination de ces différents acteurs pourra prendre par exemple la forme d’un guichet unique [12]Géré conjointement par plusieurs services (bibliothèques, directions de la recherche, direction informatique et services juridiques…), ce guichet est destiné à offrir un service global, homogène et transparent à l’utilisateur final. On peut imaginer, par exemple, un réseau d’appui à la recherche composé de correspondants « science ouverte » dédiés ou travaillant au sein de chaque unité de recherche, organisation permettant de mutualiser les expériences et développer une démarche d’amélioration continue. C’est une démarche adoptée avec succès par certaines universités à l’étranger : ainsi de celle d’Utrecht (https://www.uu.nl/en/research/research-data-management), d’Édimbourg (https://www.ed.ac.uk/information-services/research-support/research-data-service) ou Cambridge (https://www.data.cam.ac.uk/). En France, les Universités de Strasbourg ou de Lorraine s’orientent vers une organisation de ce type..
Recommandation n°5 :
Mise en œuvre d’un guichet unique.
Le rôle de ces acteurs gagnera en efficacité par le recrutement, ou à défaut la formation, de nouvelles compétences émergentes (data manager, data curator, data scientist, data architect…), qui devront faire l’objet d’une certaine reconnaissance de la communauté.
Pour coordonner et accompagner les bonnes pratiques d’une science ouverte dans les établissements, la création d’un poste d’administrateur de données de l’établissement devra être encouragée. Il aura pour fonction de mettre en œuvre la politique de la science ouverte des données de la recherche approuvée par la gouvernance. Il sera à même de coordonner l’action des différentes directions opérationnelles des établissements et du réseau d’appui à la recherche ou de son représentant. Il devra pouvoir disposer de compétences multidisciplinaires lui permettant de dialoguer avec les différents spécialistes cités ci-dessus, tout en s’appuyant sur les offres informatiques existantes [13]Par exemple, data scientist, data curator, data librarian, IT Dev, juristes… Se référer aux travaux du CoSO Collège compétences et formation..
Recommandation n°6 :
Création d’un poste d’administrateur des données de l’établissement.
L’accompagnement des pratiques de recherche s’appuie sur des outils, comme les plans de gestion de données, qui reprennent toutes les étapes du cycle de vie des données de la recherche d’un projet [14]Voir des exemples de cycle de vie des données : https://www.ukdataservice.ac.uk/manage-data/lifecycle, https://coop-ist.cirad.fr/actualites/integrer-la-gestion-des-donnees-aux-activites-de-recherche-poster..
La gestion des données de la recherche consiste principalement à collecter et organiser les données, produits de la recherche, afin d’en faciliter l’accès et la réutilisation ultérieure et ce, dans un but final d’une utilisation efficiente des deniers publics. Les données de recherche de qualité forment donc un élément central du processus de recherche.
Une bonne gestion des données :
La rédaction d’un plan de gestion des données [15]Ou DMP, Data Management Plan. est devenue une obligation pour de nombreux bailleurs de fonds (Union européenne, ANR…). Ce document, qui peut être initialement très bref, évolue tout au long du projet. Il n’induit pas une ouverture des données par défaut (cas des données personnelles, sensibles, les brevets, etc.).
Ainsi, bien plus qu’une contrainte administrative, le plan de gestion de données se positionne comme partie intégrante du projet de recherche.
Quel que soit le modèle choisi, le plan de gestion de données doit traiter des aspects principaux du cycle de vie des données en suivant la ligne directrice des principes FAIR :
Recommandation n°7 :
Inciter l’écriture de plan de gestion de données dans tout projet de recherche.
Intégrer les données de la recherche à une réflexion plus globale sur la science ouverte, c’est avant tout mieux les gérer. Une politique ambitieuse des données de la recherche intègre les notions de reproductibilité et de réutilisation de la recherche, appuyées sur la qualité et la validation des jeux de données produits, qu’ils aient ou non vocation à être ouverts à la communauté scientifique.
C’est la prise en compte de l’ensemble des problématiques (juridiques, techniques, scientifiques…) touchant aux données de recherche qui permet, en favorisant leur ouverture, d’enrichir la recherche et de la rendre plus collaborative ; en préparant leur archivage, d’assurer la conservation et l’avenir de notre riche patrimoine scientifique ; enfin, en visant la transparence de la recherche et de ses résultats, de rendre la recherche intègre et responsable.
References