Réutiliser des données, ils et elles l’ont fait ! Paroles de lauréats du prix Science Ouverte données de la recherche

Webinaire

Ouvrir les données de recherche est un travail chronophage et encore peu reconnu dans l’évaluation individuelle des scientifiques, même si cette tendance s’inverse progressivement. Il est légitime de s’interroger sur le devenir des données de recherche mises à disposition publiquement et sur leur utilité pour d’autres scientifiques. Trois lauréats et lauréates du prix Science Ouverte des données de la recherche, mention « réutilisation de données » reviennent sur leur projet et sur la manière dont la mise à disposition de jeux de données ouverts par d’autres ont permis de donner naissance à de nouveaux projets de recherche.

PROGRAMME

Le projet HTR-United – partager des données pour la reconnaissance de texte automatique, Thibault Clérice – co-lauréat du Prix 2023

Le projet HTR-United est un catalogue permettant le partage et la découverte de données d’entrainement pour la transcription et la segmentation automatique de documents, dont les manuscrits. Ce projet met à disposition de nombreux supports avec des jeux variés de données d’entrainement, mais également les codes et modèles validés (Machine Learning pour la reconnaissance de texte) résultant de l’entrainement sur ces mêmes jeux de données. Il favorise la reconnaissance et la réutilisation de ces données répondant à tous les principes FAIR (Facile à trouver, Accessible, Interopérable, Réutilisable).

Le projet Richelieu – Histoire du quartier, Charlotte Duvette, lauréate 2023

Récompensé en 2023 par le prix Science ouverte du ministère de l’Enseignement supérieur et de la recherche, le projet Richelieu. Histoire du quartier consiste à étudier le patrimoine matériel et immatériel d’un quartier parisien (1750-1950). Le volet numérique du projet a la particularité de porter sur une échelle spatiale réduite et sur un corpus de petites dimensions (environ 4000 images), produit manuellement. À partir de ce corpus, l’équipe élabore un protocole réplicable d’analyse de l’évolution urbaine en étudiant le quartier par ses représentations iconographiques et cartographiques. La réplicabilité de cette approche a conduit à définir rigoureusement une politique de science ouverte, dans une conception cyclique de la donnée, notamment grâce aux outils mobilisés (API, SIG, base PostgreSQL…) et aux types de données traités (texte, images, données spatiales…).

Le projet Écosystème TRF-GIS : un data paper pour un système d’information géographique de la Troisième République, Victor Gay, lauréat 2022

Ce projet retrace l’évolution annuelle des cartes et statistiques des structures administratives de la France de la Troisième République (1870-1940). Cette intervention propose un retour d’expérience sur les enjeux et modalités de la rédaction d’un data paper ainsi que de la mise à disposition des données de la base TRF-GIS—un système d’information géographique de la France de la Troisième République. Cette base de données met à disposition nomenclatures et shapefiles annuels correspondant aux circonscriptions administratives de France métropolitaine de 1870 à 1940. Elle décrit ses circonscriptions administratives générales (départements, arrondissements, cantons) ainsi que ses circonscriptions militaires, judiciaires, pénitentiaires, électorales, académiques et ecclésiastiques. Le jeu de données a été publié à l’initiative de Victor Gay sur data.gouv.fr.

Date et Heure
28 mars 2024 28 mars 2024
Lieu
En ligne

Prochainement

12 mai 2025 14 mai 2025
Conférence - Tokyo, Japon
The conference is being jointly organized by COAR, JPCOAR and the National Institute of Informatics and will bring together international and Japanese participants to share experiences, identify priority activities across our communities, and contribute to the development of a shared…
27 mai 2025 28 mai 2025
Rencontre - Anvers, Belgique
Registration for EOSC Association’s 10th General Assembly is now open! GA#10 will be held as an in-person-only, lunch-to-lunch meeting on 27-28 May 2025 in Antwerp. It will take place alongside the closing event for the EOSC Focus project and the kick-off…
28 mai 2025 29 mai 2025
We invite to WOOC researchers, scholarly publishers, funders, policymakers, institutions, and open citations advocates, interested in the widespread adoption of practises for creation, sharing, reuse and improvement of open scholarly metadata.  This year’s edition of the workshop will gravitate around…
03 juin 2025
Conférence - Bruxelles, Belgique
The DIAMAS project has made a major contribution towards establishing a high-quality, aligned,community-led, and sustainable scholarly communication ecosystem that aims to make open access the standard practice for publications across Europe. As the project nears its conclusion, we are excited…