Réutiliser des données, ils et elles l’ont fait ! Paroles de lauréats du prix Science Ouverte données de la recherche

Webinaire

Ouvrir les données de recherche est un travail chronophage et encore peu reconnu dans l’évaluation individuelle des scientifiques, même si cette tendance s’inverse progressivement. Il est légitime de s’interroger sur le devenir des données de recherche mises à disposition publiquement et sur leur utilité pour d’autres scientifiques. Trois lauréats et lauréates du prix Science Ouverte des données de la recherche, mention « réutilisation de données » reviennent sur leur projet et sur la manière dont la mise à disposition de jeux de données ouverts par d’autres ont permis de donner naissance à de nouveaux projets de recherche.

PROGRAMME

Le projet HTR-United – partager des données pour la reconnaissance de texte automatique, Thibault Clérice – co-lauréat du Prix 2023

Le projet HTR-United est un catalogue permettant le partage et la découverte de données d’entrainement pour la transcription et la segmentation automatique de documents, dont les manuscrits. Ce projet met à disposition de nombreux supports avec des jeux variés de données d’entrainement, mais également les codes et modèles validés (Machine Learning pour la reconnaissance de texte) résultant de l’entrainement sur ces mêmes jeux de données. Il favorise la reconnaissance et la réutilisation de ces données répondant à tous les principes FAIR (Facile à trouver, Accessible, Interopérable, Réutilisable).

Le projet Richelieu – Histoire du quartier, Charlotte Duvette, lauréate 2023

Récompensé en 2023 par le prix Science ouverte du ministère de l’Enseignement supérieur et de la recherche, le projet Richelieu. Histoire du quartier consiste à étudier le patrimoine matériel et immatériel d’un quartier parisien (1750-1950). Le volet numérique du projet a la particularité de porter sur une échelle spatiale réduite et sur un corpus de petites dimensions (environ 4000 images), produit manuellement. À partir de ce corpus, l’équipe élabore un protocole réplicable d’analyse de l’évolution urbaine en étudiant le quartier par ses représentations iconographiques et cartographiques. La réplicabilité de cette approche a conduit à définir rigoureusement une politique de science ouverte, dans une conception cyclique de la donnée, notamment grâce aux outils mobilisés (API, SIG, base PostgreSQL…) et aux types de données traités (texte, images, données spatiales…).

Le projet Écosystème TRF-GIS : un data paper pour un système d’information géographique de la Troisième République, Victor Gay, lauréat 2022

Ce projet retrace l’évolution annuelle des cartes et statistiques des structures administratives de la France de la Troisième République (1870-1940). Cette intervention propose un retour d’expérience sur les enjeux et modalités de la rédaction d’un data paper ainsi que de la mise à disposition des données de la base TRF-GIS—un système d’information géographique de la France de la Troisième République. Cette base de données met à disposition nomenclatures et shapefiles annuels correspondant aux circonscriptions administratives de France métropolitaine de 1870 à 1940. Elle décrit ses circonscriptions administratives générales (départements, arrondissements, cantons) ainsi que ses circonscriptions militaires, judiciaires, pénitentiaires, électorales, académiques et ecclésiastiques. Le jeu de données a été publié à l’initiative de Victor Gay sur data.gouv.fr.

Date et Heure
28 mars 2024 28 mars 2024
Lieu
En ligne

Prochainement

27 janvier 2026 29 janvier 2026
L’Université de Lorraine, Inria, INRAE et le CNRS organisent à Nancy, du 27 au 29 janvier 2026, des journées consacrées à l’impact des politiques en faveur de la science ouverte sur les pratiques et les résultats scientifiques. Objet et thématiques des…
28 janvier 2026
Preserving and leveraging source code as a Digital Public Good for a sustainable future To mark the 10th anniversary of Software Heritage, UNESCO and Software Heritage will co-host the 2026 Symposium on January 28, 2026. This event will recognize software…
02 février 2026 06 février 2026
Conférence - Bangalore, Inde
The upcoming 3rd Global Summit on Diamond Open Access under the theme: ‘Collaboration for Equitable Digital Infrastructures and Knowledge Commons in Agriculture and Broader Scientific Research Systems‘ will build on the outcomes of the previous Summits. It will feature high-level…
16 février 2026 18 février 2026
Conférence - Zagreb, Croatie
AI, austerity, and authoritarianism: contemporary challenges in digital curation  The theme of this year’s conference recognises the effect contemporary forces are having on digital curation practices. We invite consideration on how these forces affect the work of the digital curation…
En poursuivant votre navigation, sans modifier vos paramètres, vous acceptez l'utilisation et le dépôt de cookies destinés à mesurer la fréquentation du site grâce au logiciel Matomo.
OK
Modifier les paramètres