Réutiliser des données, ils et elles l’ont fait ! Paroles de lauréats du prix Science Ouverte données de la recherche

Webinaire

Ouvrir les données de recherche est un travail chronophage et encore peu reconnu dans l’évaluation individuelle des scientifiques, même si cette tendance s’inverse progressivement. Il est légitime de s’interroger sur le devenir des données de recherche mises à disposition publiquement et sur leur utilité pour d’autres scientifiques. Trois lauréats et lauréates du prix Science Ouverte des données de la recherche, mention « réutilisation de données » reviennent sur leur projet et sur la manière dont la mise à disposition de jeux de données ouverts par d’autres ont permis de donner naissance à de nouveaux projets de recherche.

PROGRAMME

Le projet HTR-United – partager des données pour la reconnaissance de texte automatique, Thibault Clérice – co-lauréat du Prix 2023

Le projet HTR-United est un catalogue permettant le partage et la découverte de données d’entrainement pour la transcription et la segmentation automatique de documents, dont les manuscrits. Ce projet met à disposition de nombreux supports avec des jeux variés de données d’entrainement, mais également les codes et modèles validés (Machine Learning pour la reconnaissance de texte) résultant de l’entrainement sur ces mêmes jeux de données. Il favorise la reconnaissance et la réutilisation de ces données répondant à tous les principes FAIR (Facile à trouver, Accessible, Interopérable, Réutilisable).

Le projet Richelieu – Histoire du quartier, Charlotte Duvette, lauréate 2023

Récompensé en 2023 par le prix Science ouverte du ministère de l’Enseignement supérieur et de la recherche, le projet Richelieu. Histoire du quartier consiste à étudier le patrimoine matériel et immatériel d’un quartier parisien (1750-1950). Le volet numérique du projet a la particularité de porter sur une échelle spatiale réduite et sur un corpus de petites dimensions (environ 4000 images), produit manuellement. À partir de ce corpus, l’équipe élabore un protocole réplicable d’analyse de l’évolution urbaine en étudiant le quartier par ses représentations iconographiques et cartographiques. La réplicabilité de cette approche a conduit à définir rigoureusement une politique de science ouverte, dans une conception cyclique de la donnée, notamment grâce aux outils mobilisés (API, SIG, base PostgreSQL…) et aux types de données traités (texte, images, données spatiales…).

Le projet Écosystème TRF-GIS : un data paper pour un système d’information géographique de la Troisième République, Victor Gay, lauréat 2022

Ce projet retrace l’évolution annuelle des cartes et statistiques des structures administratives de la France de la Troisième République (1870-1940). Cette intervention propose un retour d’expérience sur les enjeux et modalités de la rédaction d’un data paper ainsi que de la mise à disposition des données de la base TRF-GIS—un système d’information géographique de la France de la Troisième République. Cette base de données met à disposition nomenclatures et shapefiles annuels correspondant aux circonscriptions administratives de France métropolitaine de 1870 à 1940. Elle décrit ses circonscriptions administratives générales (départements, arrondissements, cantons) ainsi que ses circonscriptions militaires, judiciaires, pénitentiaires, électorales, académiques et ecclésiastiques. Le jeu de données a été publié à l’initiative de Victor Gay sur data.gouv.fr.

Date et Heure
28 mars 2024 28 mars 2024
Lieu
En ligne

Prochainement

01 juin 2026 03 juin 2026
Conférence - Braga, Portugal
As we enter a time of increasing global volatility, with political tensions rising and new technologies transforming the information commons, the open science community is faced with a set of novel and pressing challenges that will need to be addressed…
02 juin 2026
Le GT Recherche ESR et le Collège EOSC-France proposent un cycle de 3 webinaires sur l’EOSC avec pour premier événement :  « Bilan sur la stratégie politique : retour sur cinq années au sein de l’EOSC Steering Board » Intervention de Volker Beckmann (Chargé…
03 juin 2026 05 juin 2026
Conférence - Singapour
To Go Far, Go Together: Advancing Scholarly Communication Across Boundaries and Disruptions Join us for FORCE2026, where researchers, publishers, librarians, developers, funders, and other stakeholders come together to discuss challenges and opportunities in the evolving landscape of scholarly communication. Building…
08 juin 2026 11 juin 2026
Conférence - En ligne
The annual international Open Repositories (OR) Conference occupies a unique place in the landscape of open knowledge, open source and digital preservation conferences. Acknowledging institutional interests in the vital role open repositories play in preserving and creating access to scholarly…
En poursuivant votre navigation, sans modifier vos paramètres, vous acceptez l'utilisation et le dépôt de cookies destinés à mesurer la fréquentation du site grâce au logiciel Matomo.
OK
Modifier les paramètres