scanR est un outil d'exploration du système français de recherche et d'innovation, qui permet d'effectuer une recherche en fonction de 4 types de données reliées entre elles (structures de recherche, financements, auteurs et productions). Il favorise la transparence et l'appropriation par tous des dernières avancées scientifiques.

ScanR moteur de la recherche et de l’innovation

scanR, moteur de la recherche et de l’innovation, est une application ouverte d’exploration du paysage français de l’enseignement supérieur, de la recherche et de l’innovation (ESRI). Il permet :

  • d’identifier et de caractériser les entités (laboratoires publics de recherche, institutions publiques, entreprises, association et fondation) actives dans un domaine de recherche sur le territoire français ;
  • d’associer des travaux scientifiques et leurs auteurs, des projets bénéficiant de crédits publics en faveur de la recherche et de l’innovation à une thématique de recherche.

En combinant des données ouvertes et des informations extraites des sites web des entités qu’il référence, scanR propose, pour plus de 37 000 entités publiques ou privées, près de 500 000 auteurs, 90 000 projets financés sur fonds publics et 2 000 000 de productions scientifiques (articles, thèses, ouvrages et monographies, brevets), un vaste ensemble d’informations permettant de les décrire et de les caractériser en identifiant notamment les liens qu’ils entretiennent entre eux.
Le moteur n’utilise que des données publiques et ouvertes qui sont nettoyées et enrichies. Elles sont librement réutilisables (licence Etalab2).

En janvier 2020, une nouvelle version majeure de scanR est mise en ligne. Des travaux avaient été engagés en janvier 2018 axés sur trois chantiers conduits en parallèle sur : l’infrastructure technique et l’exposition des données, les données elles-mêmes et l’interface proposée aux utilisateurs.
Les nouveautés et évolutions sont les suivantes :

  • interface et expérience utilisateur : design renouvelé, expérience utilisateur entièrement revue et interface bilingue française et anglaise ;
  • élargissement de la gamme des APIs ;
  • données : intégration d’identifiants-auteurs (Idref), repérage des institutions étrangères et nouvelles sources (publications de recherche, thèses, ouvrages, brevets, projets).

Il permet d’identifier et de caractériser des entités telles que les laboratoires publics de recherche, les institutions publiques et les entreprises, actives dans un domaine de recherche sur le territoire français, et d’associer des travaux scientifiques et leurs auteurs, des projets à une thématique de recherche. scanR exploite l’essentiel des sources ouvertes sur la recherche et l’innovation : baromètre de la science ouverte, Sudoc, Theses.fr, Patstat (brevets), HAL…

Une FAQ est disponible sur le site.

Une première version de scanR avait été lancée en version BÊTA en juillet 2016 grâce aux efforts combinés de la société Datapublica/C-Radar et de l’équipe du département des outils d’aide à la décision (sous-direction des Systèmes d’information et des études statistiques (SIES) du ministère de l’Enseignement supérieur, de la Recherche et de l’Innovation). Son interface était basique, ses fonctionnalités limitées à l’exploration des laboratoires publics, et des institutions publiques, des entreprises, des associations et fondations actives en recherche.