Ouvrir la Science

Entrepôts de données de confiance : critères de conformité

Actualités du comité
25/09/2019

Le nœud français de l’Alliance pour les Données de Recherche (Research Data Alliance), financé dans le cadre du projet RDA-Europe 4.0, a traduit en français le document Core Trustworthy Data Repositories Extended Guidance, version 1.1 datée de juin 2018, accessible sur le site de CoreTrustSeal. CoreTrustSeal (CTS) est un organisme communautaire sans but lucratif qui promeut le développement d’infrastructures de données durables et fiables.

Le guide donne les critères de base relatifs aux entrepôts de données qui visent à décrire les caractéristiques des entrepôts de données utilisables en toute confiance. À ce titre, tous les critères doivent obligatoirement être renseignés. Ce sont des éléments d’appréciation indépendants les uns des autres, ayant la même pondération. Pour chaque critère figurant dans ce document, des conseils de rédaction sont fournis précisant le type d’information qu’un lecteur est en droit d’attendre pour effectuer une évaluation objective, afin d’aider les demandeurs à produire suffisamment d’éléments pour démontrer que leur entrepôt satisfait le critère.

Dans le processus de certification CTS entrent 16 critères, en plus des éléments de contexte de l’entrepôt (type, communauté cible de l’entrepôt, niveau de curation, partenaires sous‐traitants…), qui couvrent son infrastructure organisationnelle, la gestion des objets numériques et les aspects technologiques :

  1. L’entrepôt de données a pour mission explicite de donner accès à des données dans son domaine et de les préserver.
  2. L’entrepôt maintient toutes les licences applicables à l’accès et à l’utilisation des données et en surveille la conformité.
  3. L’entrepôt dispose d’un plan de continuité pour assurer un accès continu à ses collections et leur préservation.
  4. L’entrepôt garantit, dans la mesure du possible, que les données sont créées, conservées, qu’on y accède et qu’elles sont utilisées dans le respect des normes disciplinaires et éthiques.
  5. L’entrepôt dispose d’un financement adéquat et d’un nombre suffisant d’employés qualifiés gérés par un système de gouvernance clair pour mener à bien sa mission.
  6. L’entrepôt adopte un ou plusieurs mécanismes pour s’entourer de façon continue d’avis et commentaires d’experts (en interne ou en externe, incluant une expertise scientifique si le besoin en est pertinent).
  7. L’entrepôt garantit l’intégrité et l’authenticité des données.
  8. L’entrepôt accepte des données et des métadonnées sur la base de critères définis garantissant pertinence et intelligibilité pour les utilisateurs.
  9. L’entrepôt applique des processus et des procédures documentés pour l’archivage des données.
  10. L’entrepôt de données assume la responsabilité de la préservation à long terme et gère cette fonction de façon planifiée et documentée.
  11. L’entrepôt dispose de l’expertise appropriée pour traiter la question de la qualité technique des données et métadonnées et pour assurer qu’une information suffisante est accessible aux utilisateurs pour leur permettre d’évaluer la qualité des données.
  12. L’archivage s’effectue selon des processus de traitement (workflows) précisément définis, de l’ingestion des données à leur diffusion.
  13. L’entrepôt permet aux utilisateurs de découvrir les données et d’y faire référence de façon pérenne par un mécanisme de citation approprié.
  14. L’entrepôt permet de réutiliser les données sur la durée, en veillant à ce que des métadonnées appropriées soient disponibles pour permettre la compréhension et l’utilisation des données.
  15. L’entrepôt fonctionne avec des systèmes d’exploitation et d’autres systèmes de base bien maintenus et utilise des technologies matérielles et logicielles adaptées aux services qu’il fournit à sa communauté cible.
  16. L’infrastructure technique de l’entrepôt assure la protection de l’installation et de ses données, de ses produits, de ses services et de ses utilisateurs.

 

Le demandeur doit indiquer un niveau de conformité pour chaque critère selon le barème suivant :

0 ‐ Sans objet
1 ‐ L’entrepôt n’en a pas encore tenu compte
2 ‐ L’entrepôt maîtrise le concept de façon théorique
3 ‐ L’entrepôt est en phase d’implémentation
4 ‐ La spécification a été entièrement implémentée

Les entrepôts doivent être réévalués tous les trois ans. Même si les systèmes et les fonctions de base évoluent continuellement en fonction de la technologie et des besoins des utilisateurs, il se peut que les entrepôts ne subissent pas de changements majeurs au cours de cette période. Cependant, la norme ISO sur les entrepôts dignes de confiance (ISO 16363) a un cycle de révision de cinq ans, et une période plus courte est jugée nécessaire pour asseoir une norme de confiance de base en permettant d’éventuelles modifications et corrections.

Le document en français Entrepôts de données de confiance : critères de conformité est en ligne sur le site du Nœud national RDA France. Cette traduction ne se substitue pas au document original en langue anglaise qui seul fait autorité dans le processus de certification CTS. La consultation du document est utile pour tous les gestionnaires d’entrepôts de données, même s’ils ne souhaitent pas aller jusqu’à soumettre une demande de certification CoreTrustSeal : les critères permettent de réfléchir à l’organisation et aux processus mis en œuvre, et d’identifier des pistes d’amélioration.

Pour plus d’informations sur CoreTrustSeal et le processus de certification CTS voir le site : https://www.coretrustseal.org/.