Réutiliser des données, ils et elles l’ont fait ! Paroles de lauréats du prix Science Ouverte données de la recherche

Webinaire

Ouvrir les données de recherche est un travail chronophage et encore peu reconnu dans l’évaluation individuelle des scientifiques, même si cette tendance s’inverse progressivement. Il est légitime de s’interroger sur le devenir des données de recherche mises à disposition publiquement et sur leur utilité pour d’autres scientifiques. Trois lauréats et lauréates du prix Science Ouverte des données de la recherche, mention « réutilisation de données » reviennent sur leur projet et sur la manière dont la mise à disposition de jeux de données ouverts par d’autres ont permis de donner naissance à de nouveaux projets de recherche.

PROGRAMME

Le projet HTR-United – partager des données pour la reconnaissance de texte automatique, Thibault Clérice – co-lauréat du Prix 2023

Le projet HTR-United est un catalogue permettant le partage et la découverte de données d’entrainement pour la transcription et la segmentation automatique de documents, dont les manuscrits. Ce projet met à disposition de nombreux supports avec des jeux variés de données d’entrainement, mais également les codes et modèles validés (Machine Learning pour la reconnaissance de texte) résultant de l’entrainement sur ces mêmes jeux de données. Il favorise la reconnaissance et la réutilisation de ces données répondant à tous les principes FAIR (Facile à trouver, Accessible, Interopérable, Réutilisable).

Le projet Richelieu – Histoire du quartier, Charlotte Duvette, lauréate 2023

Récompensé en 2023 par le prix Science ouverte du ministère de l’Enseignement supérieur et de la recherche, le projet Richelieu. Histoire du quartier consiste à étudier le patrimoine matériel et immatériel d’un quartier parisien (1750-1950). Le volet numérique du projet a la particularité de porter sur une échelle spatiale réduite et sur un corpus de petites dimensions (environ 4000 images), produit manuellement. À partir de ce corpus, l’équipe élabore un protocole réplicable d’analyse de l’évolution urbaine en étudiant le quartier par ses représentations iconographiques et cartographiques. La réplicabilité de cette approche a conduit à définir rigoureusement une politique de science ouverte, dans une conception cyclique de la donnée, notamment grâce aux outils mobilisés (API, SIG, base PostgreSQL…) et aux types de données traités (texte, images, données spatiales…).

Le projet Écosystème TRF-GIS : un data paper pour un système d’information géographique de la Troisième République, Victor Gay, lauréat 2022

Ce projet retrace l’évolution annuelle des cartes et statistiques des structures administratives de la France de la Troisième République (1870-1940). Cette intervention propose un retour d’expérience sur les enjeux et modalités de la rédaction d’un data paper ainsi que de la mise à disposition des données de la base TRF-GIS—un système d’information géographique de la France de la Troisième République. Cette base de données met à disposition nomenclatures et shapefiles annuels correspondant aux circonscriptions administratives de France métropolitaine de 1870 à 1940. Elle décrit ses circonscriptions administratives générales (départements, arrondissements, cantons) ainsi que ses circonscriptions militaires, judiciaires, pénitentiaires, électorales, académiques et ecclésiastiques. Le jeu de données a été publié à l’initiative de Victor Gay sur data.gouv.fr.

Date et Heure
28 mars 2024 28 mars 2024
Lieu
En ligne

Prochainement

01 décembre 2025 02 décembre 2025
Pendant ces deux jours, des acteurs académiques et du monde économique seront réunis pour aborder les enjeux liés à la production, la gestion et le traitement des données de la recherche, alors que la souveraineté européenne sur les données scientifiques…
02 décembre 2025
Conférence - En ligne
Lancée en 2021, OpenAlex bouscule l’écosystème des bases de données bibliographiques et bibliométriques. A contre-courant des bases commerciales basées sur un corpus limité et des données propriétaires, elle tente de proposer le contenu le plus vaste, le plus diversifié et…
03 décembre 2025
Rencontre - Copenhague, Danemark et En ligne
CoARA, together with the European University Association, Science Europe, and the European Commission, is hosting a dedicated, hybrid side event on 3 December at 9h-11h (CET) to mark CoARA’s 3rd anniversary under the theme, “Celebrating three years of CoARA: Collectively shaping the future of research assessment.”  This event will…
03 décembre 2025 04 décembre 2025
Conférence - Copenhague, Danemark et en ligne
As part of Denmark’s Presidency of the Council of the European Union, Aalborg University together with international partners is hosting a conference on reformning research assessment on December 3-4, 2025 at Tivoli Hotel & Congress Center in Copenhagen. The conference…
En poursuivant votre navigation, sans modifier vos paramètres, vous acceptez l'utilisation et le dépôt de cookies destinés à mesurer la fréquentation du site grâce au logiciel Matomo.
OK
Modifier les paramètres