CRUSOE : auto-évaluation et préparation à la certification CoreTrustSeal pour les entrepôts de données

Actualités du comité
12/06/2023

CRUSOE accompagne les responsables d’entrepôts de données dans leur démarche de certification pour obtenir un label d’entrepôt de données de confiance. L’outil s’appuie sur la procédure CoreTrustSeal. Il permet un travail collectif et progressif grâce à la gestion de versions, ainsi que la visualisation de l’avancement de ce travail.

Préserver ses données pour pouvoir les réutiliser à l’avenir, qu’elles soient ou non associées à des publications, est un besoin de toujours pour les scientifiques. L’augmentation du rythme de production de données rend ce besoin encore plus prégnant. Le mouvement vers la science ouverte, qui favorise le partage le plus large possible, et les possibilités techniques de partage des données grâce à Internet, sont une opportunité pour la réutilisation des données et donc pour multiplier leur potentiel de découverte.

Rendre ses données accessibles à soi-même et aux autres nécessite une infrastructure matérielle et logicielle pour leur préservation et leur visibilité. C’est l’objectif des entrepôts de données. Mais comment savoir dans quel entrepôt déposer ses données, ou dans lequel aller en chercher d’autres ? La confiance est à la base de la science ouverte, et c’est la raison d’être de la certification des entrepôts qui leur accorde un label « de confiance » après une évaluation selon des critères et une procédure définie.

Cette certification doit être réalisée par une instance indépendante et rester suffisamment légère pour être à la portée d’entrepôts de données de recherche. C’est pourquoi CoreTrustSeal (CTS) s’impose progressivement comme la procédure la mieux adaptée au monde des données de recherche.  Un dossier de certification CTS comporte 16 critères liés à l’organisation, à la gestion des données et à l’infrastructure technique. Y répondre nécessite en général une démarche collective à laquelle doivent participer des personnels de l’entrepôt ayant des profils et des responsabilités différents. CRUSOE est un outil d’aide à cette démarche. Il permet la préparation collective et progressive des réponses (avec gestion des versions et documents liés) et la visualisation du niveau de satisfaction des critères.

 

 

Visualisation du niveau atteint par un entrepôt pour chacun des critères de CoreTrustSeal (chaque critère peut aller de 0 à 4) 

Les critères de la certification CTS peuvent aussi être utilisés pour évaluer et améliorer ses propres pratiques, sans rechercher une certification. Les critères CTS sont revus tous les trois ans. Pour 2023-2025, ils sont toujours au nombre de seize mais plusieurs ont changé d’intitulé. De plus, les niveaux sont restreints désormais aux anciens niveaux 3 et 4. Les versions 2020-2022 et 2023-2025 coexisteront dans CRUSOE jusqu’à ce que les candidatures déposées avant fin 2022 aient reçu une réponse finale. Ensuite seule la version 2023-2025 sera accessible.

La version actuelle de CRUSOE a été définie par le groupe de travail sur la certification  des entrepôts et services de données commun au collège Données du Comité pour la science ouverte et à RDA France. Elle a été développée, avec le soutien financier du Fond national pour la science ouverte, par le service de données de l’Observatoire Midi-Pyrénées (SEDOO) sur la base d’une première version conçue par celui-ci pour répondre à un besoin naissant. Le SEDOO est également chargé de la maintenance de l’application. Le logiciel est gratuit et en accès libre ; il peut être utilisé en ligne ou être téléchargé et installé dans une instance matérielle indépendante. Des documentations pour l’utilisateur et le développeur sont disponibles, ainsi qu’une version anglaise.

 

Billet rédigé par Gilles Ohanessian et Françoise Genova copilotes du groupe de travail Certification des entrepôts et services de données du Comité pour la science ouverte.