Quelles stratégies de diffusion et pérennité pour les logiciels de recherche dans les établissements publics français ?
Sylvie TONDA-GOLDSTEIN (Inria) – Pilotage
Mélanie CLÉMENT-FONTAINE (Université Paris-Saclay Versailles Saint Quentin en Yvelines)
Nicolas JULLIEN (Institut Mines Télécom Atlantique)
Jeanne ROBINEAU (Institut de Recherche pour le Développement)
François SABOT (Institut de Recherche pour le Développement)
Avril 2025
Le présent document propose une analyse de la diffusion et de la pérennité des travaux scientifiques de type logiciel produits par les établissements de recherche français. Partant du constat qu’il n’existe pas de définition partagée du concept de valorisation de la recherche et que le Haut conseil d’évaluation de la recherche et de l’enseignement supérieur (Hcéres) considère que c’est un sujet particulier qui a besoin d’une définition rigoureuse et partagée, la définition proposée en 2020 par l’Hcéres ne couvre pas la valorisation académique des productions de la recherche telles que les publications scientifiques ; pourtant, l’enquête du MESR de 2023-2024 met en exergue que les scientifiques ayant répondu à l’enquête citent largement cette valorisation. Nous décidons tout au long de ce rapport de ne pas employer le terme « valorisation de la recherche », et utiliserons les termes « diffusion » et « pérennité », dynamique d’innovation, transfert, impact. Par cet ensemble de termes, nous souhaitons couvrir tous les axes : socio-économique, économique, scientifique (citations des logiciels ou des publications, participation à des projets de recherche), notoriété.
Cette analyse prend appui sur un travail d’enquête mené sur une dizaine de projets logiciels, dont six projets étudiés en détail, avec 13 entretiens réalisés. Après avoir présenté l’affinité pour les logiciels ouverts dans la partie 1, et un état des lieux de l’écosystème actuel des logiciels de recherche dans la partie 2, notamment les types de logiciels produits, nous faisons une synthèse, informée par les résultats de l’enquête, des perspectives de diffusion et promotion des logiciels de recherche et des investissements nécessaires pour ce faire (partie 3).
Les logiciels sont des productions intellectuelles codées en langage informatique pour effectuer des tâches spécifiques. Ils peuvent évoluer, être diffusés et avoir une existence autonome. Faire d’un logiciel un bien échangeable nécessite, comme pour les autres « biens publics » et, parmi eux, les biens produits intellectuellement, de créer les conditions techniques, en particulier juridiques, par le biais des droits de la propriété intellectuelle (DPI), permettant de déterminer la titularité des droits, les modes d’exploitation et de protection. Une fois la titularité des DPI déterminée, les titulaires des droits peuvent contrôler l’accès à la production du logiciel et en fixer les contreparties, selon les éléments de diffusion et pérennité recherchés, via un contrat, qui sera le plus souvent appelé une « licence d’utilisation de logiciel ». Ces contrats peuvent être à titre onéreux ou pas, les conditions d’utilisation peuvent encadrer les possibilités d’améliorer le logiciel ou encore la manière de citer les contributeurs (notamment au sein de la communauté scientifique).
En permettant à un acteur de contrôler l’accès à un code source, le régime des DPI permet au titulaire des droits de contrôler aussi les évolutions futures de ce logiciel ainsi que la dynamique d’innovation qui peut se développer autour de lui (le « développement continu du logiciel », Fitzgerald et Stol, 2017). Le logiciel libre est une stratégie qui consiste à renoncer à une partie du contrôle sur le patrimoine logiciel existant afin de dynamiser le développement continu et l’innovation. On peut comprendre pourquoi la recherche, dont l’un des objets est de favoriser l’innovation, est sensible à cette stratégie de diffusion et pérennité. C’est cependant une stratégie parmi d’autres, qui doit être évaluée (examen coût-avantage), par rapport aux bénéfices attendus, au flux d’innovation et aux contributions logicielles générés.
Notre étude a consisté à examiner les coûts et les avantages d’un tel choix grâce à une analyse approfondie des cycles de vie de logiciels de recherche, en se basant sur des approches telles que celles de l’European Open Science Cloud (EOSC) et le concept de développement continu.
Elle conclut d’abord que le cycle de vie d’un projet logiciel de recherche se divise en 4 étapes, qui peuvent ne pas concerner tous les projets. Ces étapes incluent la preuve de concept, l’initiation d’une collaboration scientifique, le développement continu en collaboration, et la production de logiciels métiers.
- Preuve de concept : Un logiciel naît souvent d’un projet de recherche pour répondre à une question spécifique. Le logiciel est destiné à une utilisation interne par les chercheurs pour valider des hypothèses scientifiques. S’il est nécessaire pour la publication des résultats, il peut être diffusé, mais sans forcément de volonté de le développer au-delà. Cette diffusion ou ce premier travail peut initier de nouveaux développements et collaborations.
- Initiation de collaborations : Si le projet se révèle prometteur, il peut continuer d’évoluer au-delà de la première publication. Cette phase implique souvent des collaborations internes et/ou externes, où les chercheurs à l’initiative du logiciel coordonnent son développement. Cela peut impliquer une gestion plus formelle, notamment si des contributions externes (comme des rapports de bogues ou des demandes d’évolution) sont reçues. Cela se fait souvent via des plateformes collaboratives éventuellement hébergées par l’institution, et demande une implication de l’équipe de recherche. Elle en retire des bénéfices en termes de publication scientifique et de participation à des projets de recherche.
- Développement continu en collaboration : Si le projet continue de croître, il devient obligatoire de structurer les contributions et d’organiser le développement de manière plus formelle, en mettant en place des règles pour les contributions, les tests, et la publication des versions. C’est un investissement important en temps de la part des porteurs du projet, qui peut être compliqué à maintenir dans la durée, même si cela assure de la visibilité à l’équipe (et à son institution), et des retours (projets de recherche, thèses industrielles, etc.).
- Production continue de « logiciels métiers » : Certains logiciels évoluent pour répondre aux besoins spécifiques d’industries ou d’institutions. Ils se transforment alors en logiciels applicatifs utilisés dans des contextes professionnels. À ce stade, le projet peut être géré par lesdits acteurs socio-économiques, en se séparant de l’équipe de recherche initiale du projet logiciel car il est devenu un produit métier avec des objectifs plus commerciaux que scientifiques.
Notre étude a identifié quatre « idéaux-types » de logiciels, chacun avec ses propres enjeux et perspectives de soutenabilité dans le temps.
- Les logiciels « en sommeil » : Ces logiciels, développés dans le cadre d’un projet, n’ont plus de valeur stratégique pour l’équipe de recherche (et donc l’institution). La publication sous licence libre, par exemple sur une plateforme comme Software Heritage, est encouragée, car rendre le logiciel public peut générer des collaborations non anticipées ou renforcer la visibilité des recherches internes à l’institution.
- Les logiciels sur commande : Ces logiciels, souvent produits pour des partenaires externes, sont régis par des contrats de recherche partenariale ou de prestation. L’institution s’assure du transfert auprès du partenaire privé, en définissant clairement les DPI et en déposant et archivant les versions du logiciel. La licence peut être libre ou privative selon le partenaire.
- Les logiciels de collaboration : Ces logiciels, développés par l’institution de recherche (via une équipe ou un laboratoire) en collaboration avec un ou des partenaires publics ou privés, nécessitent un contrôle strict des DPI par l’institution. La diffusion sous licence libre, notamment copyleft, permet de garantir l’accès aux contributions tout en suscitant des retours et des améliorations. Une approche de double licence (libre et propriétaire) est souvent envisagée pour optimiser les opportunités de dynamique d’innovation, à condition que l’institution ait sécurisé les droits sur l’intégralité du code, notamment par le biais de contrats de cession avec les contributeurs externes.
- Les logiciels stratégiques : Ces logiciels jouent un rôle central dans l’activité scientifique de l’institution, constituant des indicateurs clés de cette dernière. Ils contribuent à renforcer l’image de l’institution et favorisent les collaborations scientifiques, voire industrielles. Il est essentiel de maintenir un contrôle total des DPI et de choisir des licences permettant d’élargir la communauté d’utilisateurs de favoriser l’externalisation partielle de la R&D et d’attirer de nouveaux partenaires scientifiques ou industriels. La maintenance et l’évolution de ces logiciels peuvent être assurées en interne ou par une startup issue du laboratoire.
La diffusion et la pérennité des logiciels de recherche repose sur des fondements juridiques et techniques impliquant des choix de licences adaptés à chaque logiciel et à son évolution. L’utilisation de modèles de licences libres, en particulier copyleft, parfois en complément d’autres stratégies de diffusion et pérennité, apparaît comme un levier important pour optimiser la diffusion et la valorisation scientifique, mais aussi industrielle. Ces stratégies reposent toutes sur une analyse des objectifs et des actions concrètes pour s’assurer un contrôle des DPI du projet logiciel.
Finalement, notre enquête souligne que les stratégies de diffusion et de pérennité reposent aussi sur des ressources humaines et des outils nécessaires à la production et la gestion des logiciels de recherche.
La maintenance des logiciels, en particulier ceux diffusés sous une licence libre, requiert un investissement important en temps et en ressources humaines. Cette tâche devient d’autant plus lourde lorsque le logiciel attire de nombreuses contributions externes, parfois au point d’exiger un personnel dédié à temps plein. Idéalement, il semble que la maintenance doive être assurée par le laboratoire à l’origine du logiciel, même si on peut imaginer faire appel à des personnels spécialisés en développement logiciel partagés entre plusieurs laboratoires (lorsque le langage utilisé est maîtrisé largement). Ces spécialistes garantissent la stabilité et la pérennité des logiciels et jouent un rôle crucial dans la sensibilisation des scientifiques à la diffusion et à la pérennité des développements logiciels.
Pour optimiser cette maintenance, il semble nécessaire de mutualiser les outils et les ressources au niveau national, facilitant ainsi la pérennité des logiciels. Des plateformes génériques de développement logiciel existent déjà dans plusieurs institutions françaises, mais de nouvelles fonctionnalités semblent attendues, telles que des outils de publication web facilitant la communication avec la communauté scientifique mondiale ou encore l’intégration continue pour les contributions aux logiciels. L’harmonisation des outils pourrait aussi faciliter l’identification des nouvelles créations au sein des laboratoires, notamment en intégrant des déclarations de création/logicielle (analogues aux déclarations d’invention) dès qu’un projet de développement est initié et en déployant les développements sur les forges nationales.
Le logiciel constitue une des productions scientifiques. Pour une diffusion et une pérennité efficaces, notre enquête révèle la nécessité d’intégrer tous les types de productions, publications, données, y compris les supports de formation, la documentation, etc., dans un système unique et accessible. Cela nécessite une complémentarité des outils utilisés par les contributeurs et utilisateurs de ce système, afin de favoriser le travail collaboratif.
Actuellement, il n’existe pas de cadre précis pour le choix des licences, qu’elles soient libres ou propriétaires. La variété des licences libres disponibles peut complexifier l’exploitation des logiciels, soulignant l’importance de définir une liste restreinte de licences compatibles avec les enjeux de la recherche.
Dès le début du cycle de vie d’un logiciel, il apparaît essentiel de planifier les stratégies d’exploitation du code pour anticiper ses évolutions, ses modes de diffusion, et les différentes perspectives de promotion afin d’assurer sa soutenabilité dans le temps.
En synthèse, les retours d’expérience suggèrent de travailler sur trois axes principaux : définir des outils de diffusion et pérennité (méthodes, techniques, plateformes, etc.) dans les pratiques existantes, en mutualisant les développements autant que faire se peut, former à l’usage de ces outils (propriété intellectuelle et modèles de projets pérennes de toute nature), et appliquer ces outils dans les politiques de propriété intellectuelle des institutions. Il a été aussi souligné que cela doit passer par la reconnaissance dans les carrières des scientifiques du travail de gestion et d’animation des projets logiciels.
Sommaire
1 | Contexte
2 | Le logiciel de recherche : état des lieux
Logiciel, de quoi parle-t-on ?
Les enjeux en droit de la propriété intellectuelle appliqué aux logiciels
Le cycle de vie d’un projet logiciel de recherche
Le logiciel comme preuve de concept
Initiation d’une collaboration
Production continue d’un logiciel de recherche
Production continue d’un logiciel métier
3 |Les logiciels de recherche : perspectives de pérennité
Les idéaux types de promotions des logiciels de recherche
Présentation des quatre situations types de projet logiciel
Le passage d’un logiciel d’un type à un autre
Les ressources humaines et les outils nécessaires à la production et à la pérennité de logiciels de la recherche
La maintenance de logiciels
Plateformes informatiques utiles à la pérennité des travaux de recherche
Intégrer les outils dans les processus existants
Le cadre contractuel
Le choix d’une licence ouverte
Les accords de contribution
4 |Conclusion
Annexes
Lexique
Synthèse des entretiens réalisés
Analyse de quelques exemples de projets de logiciels scientifiques
Bibliographie
Remerciements