Soutenu par le Comité pour la Science ouverte, l’objectif du projet Visa TM, lancé en 2017, est de décrire une infrastructure capable de rendre la fouille de textes accessible à tous, en offrant des services à même de contribuer à un effet catalyseur de la science : transfert de technologies, innovation, réutilisation des données et résultats. L’objectif de l’infrastructure est de faciliter l’accès aux contenus, apporter des solutions technologiques et des traitements adaptés aux besoins, ainsi qu’un accompagnement humain.
Ce projet s’inscrit dans le mouvement de développement d’une Science ouverte tendant à la mise à disposition des bibliothèques numériques et des ressources sémantiques et à l’intégration de données de sources diverses, dont textuelles.
Il rassemble dans un partenariat trois institutions mettant en synergie leurs complémentarités : MaIAGE et DIST de l’INRA, l’Inist-CNRS et le LIRMM de l’Université de Montpellier.
Les principaux résultats de Visa TM portent sur :
Les huit rapports finaux relèvent de trois thèmes interdépendants :
Un « Visa TM Day », organisé le vendredi 15 novembre 2019 au ministère de l’Enseignement supérieur, de la Recherche et de l’Innovation, a clôturé ce projet. Cette journée a été l’occasion de dresser un état des lieux et de discuter des perspectives concrètes ouvertes par les résultats du projet.
Les présentations sont disponibles à cette adresse : https://visatm.inist.fr/2019/11/26/visa-tm-day-contenus/.
Quatre ateliers prospectifs ont également eu lieu autour de “quelle infrastructure de service de fouille de textes pour demain”. Leur compte rendu est accessible à cette adresse : https://visatm.inist.fr/2019/11/26/les-ateliers-de-visa-tm-day/.
Le volet Étude propose d’imaginer et de décrire l’infrastructure technique et humaine nécessaire en se basant à la fois sur l’expérience OpenMinTeD et sur les besoins de la communauté de recherche nationale. Ce document s’appuie sur un questionnaire qui a permis de faire émerger des avis et des attentes. L’analyse des besoins fait des recommandations après analyse des points forts et faibles des différentes approches possibles en s’appuyant sur le contexte dans lequel s’inscrit le projet Visa TM, en mettant en avant les éléments favorables actuels et en développant les besoins des utilisateurs potentiels d’une plateforme.
Ce document dresse une cartographie des différents acteurs qui constituent l’environnement d’une future plateforme de fouille de textes et contribuent à son fonctionnement. Il met en exergue les différentes possibilités d’organisation de ces acteurs dans l’idée d’une construction de service optimal de fouille de textes en analysant les avantages et les freins éventuels de chacune de ces propositions.
Ce rapport explicite les différentes missions incombant à une plateforme de fouille de textes destinée à répondre de manière optimale aux services attendus aussi bien par les acteurs participants que par les utilisateurs finaux. Il répertorie les différentes activités de la plateforme et analyse les interactions entre ses diverses composantes. Ces activités font appel à différents métiers et des compétences nécessaires à leur exercice.
Ce document analyse l’écosystème des outils de traitement et d’assistance du text mining et leur intégration dans l’e-infrastructure OpenMinTeD. Il propose un recensement des outils de text mining et s’intéresse à la sélection des outils dans le cadre d’une e-infrastructure. Ce rapport analyse le cadre à mettre en place pour l’animation de la communauté académique afin de maintenir le futur dispositif à l’état de l’art par rapport aux outils et ressources.
Ce document décrit les briques logicielles principales d’OpenMinTeD, leur rôle, leur fonctionnement et leurs interactions. Il vise aussi à transmettre une idée de l’ensemble des spécifications pour une plateforme de services : stabilité, pérennité, sécurité, légalité, traçabilité. La première partie présente l’architecture globale d’OpenMinTeD. La deuxième partie décrit chaque élément en indiquant sa fonction, le besoin auquel il s’adresse, l’effort de développement et de configuration. La dernière partie expose les conclusions que l’on peut tirer de l’organisation logicielle d’OpenMinTeD.
Les travaux décrits dans ce document détaillent les développements réalisés sur la plateforme OpenMinTeD dans le cadre des appels d’offres lancés par ce projet. Sont apportés des recommandations et des propositions dans le domaine de trois réponses portant sur :
L’application pilote pour l’IST fournit un service d’aide à la construction et à l’exploration de corpus de documents scientifiques issus du réservoir ISTEX, en utilisant des outils de fouille de textes.
Ce rapport démontre l’utilité de l’approche de composition de workflows de text mining et sa connexion à des applications métiers pour un développement rapide et un résultat de qualité dans un domaine particulier, celui de la microbiologie. Le document analyse les points forts (qualité des productions) et limitations de l’approche (accès aux corpus).
Les livrables sont accessibles sur le site Objectif TDM.
References