Remise des prix science ouverte des données de la recherche, édition 2025

Actualités du comité
01/12/2025

Le ministère de l’Enseignement supérieur, de la Recherche et de l’Espace (MESRE) remet pour la quatrième édition les prix science ouverte des données de la recherche. La cérémonie de remise des prix s’est tenue le 1er décembre 2025, à l’Université Pais-Saclay, lors des Assises nationales des données de la recherche (Andor 2025).

Ce prix vise à mettre en valeur les chercheurs, les projets et les équipes de recherche qui sont engagés dans la gestion et la diffusion des données de la recherche et, pour certains d’entre eux, qui réutilisent dans leurs travaux de recherche des données déjà disponibles. Tout comme le prix science ouverte du logiciel libre de recherche et le prix science ouverte de la thèse, le prix science ouverte des données de la recherche est inscrit dans le deuxième Plan national pour la science ouverte.

Cette année, 8 lauréats ont été récompensés, dans 3 catégories différentes :

  • Le prix « créer un jeu de données manquantes » récompense 2 projets exemplaires dans la mise à disposition d’un nouveau jeu de données répondant à un besoin scientifique thématique.
  • Le prix « créer les conditions de la réutilisation » récompense 4 projets conduisant un travail exemplaire de gestion des données de recherche afin de les rendre réutilisables.
  • Le prix « mention spéciale du jury » concerne 2 projets exemplaires de mise à disposition et d’enrichissement des données.

Catégorie « créer un jeu de données manquantes »

Corpus les Vocaux – SMS vocaux en français

Le projet Corpus les Vocaux constitue le premier corpus de SMS vocaux en français. Il s’agit de données orales spontanées non surveillées. Le partage de ce corpus contribue à enrichir la description de la langue naturelle et de ses variations. Les données sont très originales et partagées avec une forte attention à la documentation. La méthodologie est claire et solide.
Ce projet a fait l’objet de plusieurs financements et il est développé à l’Université de Lorraine, à l’Université de Strasbourg et à l’Université de Liège.

Subwork – Données sur les travailleurs en France

Le projet Subwork propose une base de données originale recensant la structure, la géographie et les caractéristiques sociales des travailleurs et travailleuses en France en 2008 et 2018. Subwork favorise des études sociales quantitatives à plusieurs échelles géographiques, avec des données au croisement de la sociologie, de la géographie et des études urbaines.
Ce projet est porté par une équipe de Nantes Université.

Catégorie « créer les conditions de la réutilisation »

RPG Explorer – Données sur l’utilisation de sols agricoles

Le projet RPG Explorer valorise les données d’utilisation des sols agricoles issues de la Politique Agricole Commune (PAC), qui sont collectées chaque année à l’échelle nationale. RPG Explorer reconstitue des séquences de cultures à partir des historiques annuels. La mise à disposition sous un format spatial standardisé améliore l’accessibilité des données agricoles pour les non spécialistes en Systèmes d’Information Géographique (SIG). Les données se prêtent à un large spectre de réutilisation scientifique et sociale.
RPG Explorer est porté par une équipe d’INRAE et d’AgroParisTech.

Application e-NDP – Registres médiévaux numérisés de Notre-Dame de Paris

Le projet e-NDP renouvelle la connaissance sur Notre-Dame de Paris via l’édition numérique de 26 registres médiévaux. L’application, dont la structuration repose nativement sur les principes FAIR, permet la fouille de ce corpus inédit, donne accès à toutes ressources produites et à la documentation. Le projet utilise HTR (Handwritten Text Recognition) pour la reconnaissance d’écriture manuscrite. Les processus sont clairs et documentés, potentiellement reproductibles.
L’application e-NDP est développée à l’École nationale des chartes – PSL et a obtenu un financement de l’ANR dans le cadre d’un projet coordonné par l’Université Paris Cité.

Plateforme ArchiMed – Images médicales de plus de 100 CHU

La plateforme ArchiMed est dédiée à la centralisation, au stockage, à l’annotation et à la mise à disposition d’images médicales de plus de 100 CHU, pour des projets de recherche. Elle facilite l’accès, la traçabilité et l’analyse des données d’imagerie, conformément aux exigences réglementaires, pour le partage des données personnelles particulièrement sensibles en biologie santé.
La plateforme ArchiMed est développée par le CHRU de Nancy, l’Inserm et l’Université de Lorraine.

Seatizen – Données d’imagerie des écosystèmes coralliens

Le projet Seatizen collecte et met à disposition, avec une implémentation solide des principes FAIR, des données d’imagerie des écosystèmes coralliens dans un but de suivi de l’évolution de la biodiversité. Les données sont standardisées, géoréférencées et partagées à la communauté scientifique et au grand public, pour des utilisations variées y compris dans des modèles d’IA.
Le projet Seatizen a bénéficié de plusieurs financements et est porté par l’Ifremer, INRIA, l’IRD et le CNRS.

Catégorie « mention spéciale du jury »

Panel de Caen – Suivi de 87 jeunes entre 1995 et 2015

Le projet Panel de Caen met à disposition de la communauté scientifique les données d’une enquête débutée en 1995 auprès d’un panel de 87 jeunes. En suivant leurs parcours de vie entre 1995 et 2015, ce panel a comblé un manque dans la recherche sociologique, sur les plans thématique et méthodologique en menant des enquêtes qualitatives et quantitatives. Le travail est remarquable par son ampleur et par l’effort de partage, notamment par la pseudonymisation des données.
Soutenu par de nombreux financements, le Panel de Caen est un projet rendu possible par trois équipes : CDSP (Sciences Po / CNRS), LEST (Aix Marseille Université), et le collectif de recherche du Panel de Caen.

Rivages normands – Eaux souterraines en littoral et modèles de risques hydriques

Le projet Rivages normands collecte et partage des données sur les eaux souterraines en littoral, enrichies par des modèles de risques hydriques sur les territoires. Ces données contribuent à la recherche dans les sciences du système de la terre, sur la biodiversité et les effets climatiques, et aident les collectivités dans leurs prises de décision. Le projet a une portée scientifique et sociale.
Le projet est soutenu par l’Université de Rennes, le CNRS, l’Université de Caen Normandie, la DREAL Normandie et l’Agence de l’Eau Seine Normandie.

Jury

Le jury était composé des membres ci-dessous :

  • Grégoire Rey, Président du jury | Ingénieur de recherche | Inserm et Directeur de l’Infrastructure nationale France Cohortes
  • Hélène Chiapello, Ingénieur de recherche | INRAE, Institut Français de Bioinformatique
  • Olivier Marlet, Ingénieur de Recherche CNRS au Laboratoire Archéologie et Territoires | Université de Tours
  • Sébastien Oliveau, Directeur de recherche CNRS | Directeur de la MSH Paris-Saclay
  • Pierre Poulain, Maître de conférence | Université Paris Cité & CNRS
  • Etienne Roesch, Professeur des universités | University of Reading
  • Magalie Weber, Ingénieur de recherche | INRAE – Biopolymères Interactions Assemblages (BIA)

 

Pour en savoir plus:

 

En poursuivant votre navigation, sans modifier vos paramètres, vous acceptez l'utilisation et le dépôt de cookies destinés à mesurer la fréquentation du site grâce au logiciel Matomo.
OK
Modifier les paramètres