Etude d’un service générique d’accueil et de diffusion de données
2021
Etudes & rapports
Le document présente et évalue différents scénarios et niveaux d’ambition fonctionnels relatifs à la création d’un service générique d’accueil et de diffusion des données simples. Il propose différentes modalités d’implémentation qui sont présentées au travers de deux parcours utilisateurs : celui d’un producteur de données et celui d’un réutilisateur de données.

Étude de faisabilité d’un service générique d’accueil et de diffusion des données simples : ambitions du service et scénarios de mise en œuvre

Comité pour la science ouverte – collège Données de la recherche – groupe Service générique d’accueil et de diffusion de données simples

Les membres du groupe sont accompagnés par le cabinet Datactivist.

Synthèse de la phase 3 de l’étude de faisabilité

24 mars 2021

L’ensemble des documents produits dans le cadre de l’étude est disponible sur le site.

Résumé

Le document  présente et évalue différents scénarios et niveaux d’ambition fonctionnels relatifs à la création d’un service générique national. Il correspond à la troisième phase de l’étude de faisabilité. En partant des besoins identifiés lors de la première phase, le document propose différentes modalités d’implémentation qui sont présentées au travers de deux  parcours utilisateurs :  celui d’un producteur de données et celui d’un réutilisateur de données. Pour chacun trois niveaux d’ambition sont décrits. Ils correspondent à l’offre graduelle de l’accompagnement et des fonctionnalités associés au service national. Enfin, trois scénarios de mise en œuvre du service de dépôt sont proposés puis comparés fonctionnellement et économiquement.

Éléments de contexte

La présente étude s’inscrit dans l’action “Développer un service  générique d’accueil et de diffusion des données simples” de l’axe  “Structurer et ouvrir les données de la recherche” du Plan National pour la Science Ouverte.

Les données de la recherche

Le terme « données de recherche » est une notion complexe, on peut retenir une définition englobante regroupant faits, observations, images, résultats de programmes informatiques, enregistrements, mesures ou expériences sur lesquels s’appuie un produit de la recherche.

…  sont sujettes à des risques …

  • Perte des données
  • Captation par les éditeurs de revue
  • Dépôt sur des entrepôts génériques sans curation, non modérés ou non certifiés
  • Faible réutilisabilité car pas ou peu documentées

… et présentent des enjeux auxquels doit répondre le service :

  • Souveraineté et pérennité
  • Visibilité et accessibilité des données
  • Possibilité de dépôt pour tous
  • Intégration dans un écosystème multi-outils et multi-échelles

Parcours utilisateurs et niveaux d’ambition

1. Parcours producteur : le dépôt de données

Trois niveaux d’ambition sur :

  • l’accompagnement
  • la documentation et les aides au dépôt
  • l’évaluation du dépôt

2. Parcours réutilisateur : la découverte et la réutilisation

Trois niveaux d’ambition sur :

  • Les possibilités de découverte des données
  • L’exploration et les modalités de téléchargement
  • Les notifications et l’interaction communautaire

Scénarios de mise en œuvre du service de dépôt

Conditions nécessaires identifiées pour la pérennité du service :

  • Une communauté d’utilisateurs
  • Une communauté de développeurs
  • L’interopérabilité avec les autres services de l’écosystème des données de la recherche
  • Un opérateur national

Trois scénarios de mise en œuvre ont été proposés :

  • mon entrepôt en 1 clic : un entrepôt personnalisable pour mon établissement, en quelques minutes, sur une infrastructure mutualisée
    • Avantages :
      • Simplicité de déploiement et gestion pour les établissement
      • Coût
    • Inconvénients :
      • Personnalisation limitée pour les établissements
    • Exemple international : DataverseNO (https://dataverse.no/)
  • mon entrepôt à la carte : un entrepôt dédié pour mon établissement, sur une infrastructure mutualisée
    • Avantages :
      • Compromis personnalisation/simplicité
    • Inconvénients :
      • Entrepôts sous différentes versions logicielles
    • Exemple international : figshare.com
  • mon entrepôt à déployer chez moi : un entrepôt maîtrisé par mon établissement, sur un socle logiciel partagé installé sur mon infrastructure
    • Avantages :
      • Personnalisation fine pour les établissements
      • Maîtrise des données pour les établissements
    • Inconvénients :
      • Coûts et technicité élevés pour les établissements
      • Liens entre entrepôts et avec d’autres services plus complexes à établir
      • Potentielle perte de visibilité globale
      • Couverture de tous les établissements de l’ESRI très difficile à atteindre
    • Exemple intenational : DANS (https://dans.knaw.nl)

En bref

  • Comparaison fonctionnelle des scénarios
  • Comparaison économique des scénarios
  • Recommandations du groupe de travail