Réutiliser des données, ils et elles l’ont fait ! Paroles de lauréats du prix Science Ouverte données de la recherche

Webinaire

Ouvrir les données de recherche est un travail chronophage et encore peu reconnu dans l’évaluation individuelle des scientifiques, même si cette tendance s’inverse progressivement. Il est légitime de s’interroger sur le devenir des données de recherche mises à disposition publiquement et sur leur utilité pour d’autres scientifiques. Trois lauréats et lauréates du prix Science Ouverte des données de la recherche, mention « réutilisation de données » reviennent sur leur projet et sur la manière dont la mise à disposition de jeux de données ouverts par d’autres ont permis de donner naissance à de nouveaux projets de recherche.

PROGRAMME

Le projet HTR-United – partager des données pour la reconnaissance de texte automatique, Thibault Clérice – co-lauréat du Prix 2023

Le projet HTR-United est un catalogue permettant le partage et la découverte de données d’entrainement pour la transcription et la segmentation automatique de documents, dont les manuscrits. Ce projet met à disposition de nombreux supports avec des jeux variés de données d’entrainement, mais également les codes et modèles validés (Machine Learning pour la reconnaissance de texte) résultant de l’entrainement sur ces mêmes jeux de données. Il favorise la reconnaissance et la réutilisation de ces données répondant à tous les principes FAIR (Facile à trouver, Accessible, Interopérable, Réutilisable).

Le projet Richelieu – Histoire du quartier, Charlotte Duvette, lauréate 2023

Récompensé en 2023 par le prix Science ouverte du ministère de l’Enseignement supérieur et de la recherche, le projet Richelieu. Histoire du quartier consiste à étudier le patrimoine matériel et immatériel d’un quartier parisien (1750-1950). Le volet numérique du projet a la particularité de porter sur une échelle spatiale réduite et sur un corpus de petites dimensions (environ 4000 images), produit manuellement. À partir de ce corpus, l’équipe élabore un protocole réplicable d’analyse de l’évolution urbaine en étudiant le quartier par ses représentations iconographiques et cartographiques. La réplicabilité de cette approche a conduit à définir rigoureusement une politique de science ouverte, dans une conception cyclique de la donnée, notamment grâce aux outils mobilisés (API, SIG, base PostgreSQL…) et aux types de données traités (texte, images, données spatiales…).

Le projet Écosystème TRF-GIS : un data paper pour un système d’information géographique de la Troisième République, Victor Gay, lauréat 2022

Ce projet retrace l’évolution annuelle des cartes et statistiques des structures administratives de la France de la Troisième République (1870-1940). Cette intervention propose un retour d’expérience sur les enjeux et modalités de la rédaction d’un data paper ainsi que de la mise à disposition des données de la base TRF-GIS—un système d’information géographique de la France de la Troisième République. Cette base de données met à disposition nomenclatures et shapefiles annuels correspondant aux circonscriptions administratives de France métropolitaine de 1870 à 1940. Elle décrit ses circonscriptions administratives générales (départements, arrondissements, cantons) ainsi que ses circonscriptions militaires, judiciaires, pénitentiaires, électorales, académiques et ecclésiastiques. Le jeu de données a été publié à l’initiative de Victor Gay sur data.gouv.fr.

Date et Heure
28 mars 2024 28 mars 2024
Lieu
En ligne

Prochainement

10 novembre 2025 14 novembre 2025
Conférence - En ligne
The Geneva Workshop on Innovations in Scholarly Communication will take place online 10-14 November 2025. Day 10: Research Security and openness Day 11:Open infrastructure Day 12: Navigating AI in Open Science Day 13: Commercialization and Open Science Day 14: Research Integrity
10 novembre 2025 11 novembre 2025
Conférence - Berlin, Allemagne et en ligne
This years Open Science Days have the theme: “Open Science in the Light of Geopolitical Polarization” The current geopolitical landscape is characterized by rising political and trade tensions as well as heightened economic interest in scientific innovation. This polarization has…
12 novembre 2025 28 novembre 2025
Rencontre - Paris et en ligne
Les Journées RDA France 2025 ont lieu du 12 au 28 novembre. Au programme de ces Journées : Mercredi 12 novembre 10h00 – 11h30 | Atelier Comment participer à la RDA et à RDA France 14h00 – 15h30 | Atelier OPIDoR enrichit ses…
17 novembre 2025 21 novembre 2025
Depuis 2018, la Semaine de la science ouverte donne l’occasion chaque année à la communauté de la recherche de Paris 1 Panthéon-Sorbonne d’échanger sur les perspectives offertes par l’ouverture des publications, des données et des logiciels et de partager les…
En poursuivant votre navigation, sans modifier vos paramètres, vous acceptez l'utilisation et le dépôt de cookies destinés à mesurer la fréquentation du site grâce au logiciel Matomo.
OK
Modifier les paramètres