novembre 30, 2022 • 5 min read

L’open source : comment l’union fait la force en recherche appliquée

Rédigé par Jeanne Bachmann

Jeanne Bachmann

 

Résumé de cet article par ChatGPT :

"Cet article explique comment l'open source contribue à la recherche appliquée en permettant la collaboration et le partage de code entre les chercheurs et les entreprises. L'utilisation de logiciels open source permet de réduire les coûts de développement, d'accélérer le processus de recherche et de profiter de la communauté pour améliorer et étendre les outils existants. L'article présente des exemples de projets open source en Data Science, notamment TensorFlow, PyTorch et Pandas, qui ont été développés par des entreprises et des universités pour soutenir la recherche en IA. L'open source est également un moyen d'attirer des talents et de promouvoir la notoriété de l'entreprise. Enfin, l'article souligne les avantages et les défis liés à l'utilisation de l'open source en recherche appliquée."

L’open source, c’est quoi ?

L’Open source est un terme largement utilisé dans le secteur de l’informatique, comme l’intelligence artificielle (IA) par exemple. Il est employé pour parler d’un code ouvert à tous, l’open source est à la fois une philosophie de travail et un moyen de partage qui répond à des critères bien précis, érigés par l’organisation Open Source Initiative en 1998. Mais pourquoi commençons-nous à en entendre parler de plus en plus dans les médias spécialisés ?

Historiquement, l’open source a toujours été présent dans l’informatique : dès les années 60, les ordinateurs étaient vendus équipés de logiciels souvent peu stables, il était alors important pour les informaticiens de pouvoir comprendre et manipuler ces derniers. Depuis les années 2000, l’utilisation et le développement de logiciels open source s’est amplifié ; au Royaume-Uni par exemple, 97% des entreprises utilisent des logiciels open source en 2021, et 65% d’entre elles y contribuent, selon le rapport de l’ONG Open UK.

Dans cet article, vous apprendrez pourquoi la recherche et développement s’enthousiasme autant de cette montée de l’open source, mais également les travers que son utilisation peut engendrer.

En pratique, comment les entreprises utilisent l’open source ?

Aujourd’hui, des logiciels open source sont utilisés dans la recherche et développement dans de multiples secteurs économiques, aussi bien la médecine ou la finance. On peut citer le projet GPGTools, qui permet de chiffrer et de coder les e-mails envoyés, qui a été construit sur un modèle open source.
Ce fonctionnement collaboratif propose deux principaux avantages : le premier est la réduction de coûts. Étant des logiciels avec un code complètement ouverts, leur utilisation et appropriation sont par conséquent la plupart du temps gratuits. Le deuxième avantage concurrentiel de l’open source est l’offre exponentielle qui croît d’environ 30% par an depuis 2003 : l’utilisation et le développement de ses logiciels par des milliers de personnes permettent une coopération mondiale.
Ainsi, certains logiciels opensourcés sont maintenus à jours depuis plusieurs années par plusieurs milliers de personnes : Linux en est l’exemple parfait. Système d’exploitation privilégié des informaticiens pendant longtemps grâce à sa flexibilité, il est encore aujourd’hui maintenu à jour par des milliers d’utilisateurs.
Cette croissance assure un partage de connaissance engendrant une qualité de code globalement bonne, fiable et évolutive ; souvent gérée par la création de communautés GitHub. D’autres avantages sont également liés à l’utilisation de l’open source, comme sa flexibilité, permettant de le modifier et de l’adapter à chaque utilisateur.

Étant un argument compétitif pour les entreprises utilisant des logiciels open-source (autant pour leur recrutement que pour leur marketing), je dois vous mettre en garde des règles liées à l’application de tels logiciels. Une multitude de restrictions à l’utilisation de l’open source sont listées dans le code de l’Open Source Initiative; cependant aucune législation française ou européenne ne fait appliquer ce code, qui reste un code d’honneur pour les contributeurs à l’open source.
La liste des contraintes d’utilisation si on veut respecter le code de l’Open Source Initiative sont nombreuses, mais on peut les résumer en quatre libertés principales à maintenir sur un code ou programme : la liberté d’exécution, d’étude, de redistribution de copies et de copies modifiées.

1️⃣  La première règle que doit respecter un logiciel open source est la liberté d’exécution du programme, en effet tous les utilisateurs du code ont la liberté de le faire fonctionner dans n’importe quel but : un même algorithme de reconnaissance d’objets pourra être utilisé dans un contexte médical, pour être entrainé sur des bactéries et en détecter par exemple. Ou dans un contexte industriel, entrainé pour reconnaitre des produits défectueux. Cette règle doit assurer une neutralité éthique des programmes développés en open source, mais son contrôle est complexe à cause de l’immensité de la masse de contributions open sources (413 millions sur GitHub en 2022).

2️⃣  La liberté d’étude et de modification est moteur dans la croissance de l’utilisation de l’open source : ainsi chacun peut s’approprier ou extraire le code qu’il souhaite.

3️⃣  La liberté de redistribuer des copies du code, une liberté fondamentale qui s’oppose à la construction d’une économie basée sur la vente dudit programme.

4️⃣  Mais également la liberté de redistribuer de copies modifiées, qui assure chacun de profiter des dernières évolutions et changements faits sur le code par la communauté.


Quels sont les impacts sur la recherche appliquée ?

Aujourd’hui, les impacts de l’open source se situent à toutes les échelles de notre environnement. Nous avons vu récemment émerger dans les actualités et sur les réseaux sociaux le logiciel en ligne DALL.E 2 : une intelligence artificielle qui permet de modifier ou d’étendre une photo de manière réaliste ou selon un style donné, en lui dictant par un texte la modification souhaitée (l'image d’illustration a été généré par cet algorithme).
Ensuite, le réseau Reddit ouvre par exemple un terrain de jeu pour les blagueurs, qui postent toutes sortes de choses en lien avec l’open source, comme des images et bug générés par des IA, ou des programmes amusant comme ceux qui génèrent des citations de Chuck Norris.

Si toutes ces publications peuvent nous faire penser qu’elles tendent à décrédibiliser l’open source, il n’en est rien. Des données de santé sont par exemple échangées et partagées dans le monde entier, nous l’avons vu avec la Covid-19, où le partage de nos tests ou vaccins étaient réguliers. L’open source est aujourd’hui largement utilisée dans le domaine de la médecine : en 2019, l'Open Source Pharma Fondation a réussi à faire passer un médicament générique pour le diabète à un stade très avancé, ce pour un coût de développement inférieur d’environ deux milliards d’euros à un médicament moyen et en deux an seulement. En plus de son coût avantageux, l’utilisation de l’open source est cité comme indispensable dans la prévention de certaines maladies comme le cancer, où une étude en masse des tumeurs est clef dans sa détection par l’IA.

Malgré son impact déjà présent sur le grand public, le partage de données et programmes open source continue de générer des conflits éthiques. Aujourd’hui, il est nécessaire pour les instances étatiques de réfléchir l’avenir de l’utilisation de programmes à code ouvert, ainsi qu'à la réglementation qui doit l’encadrer.
Comment doit-on adapter notre système et quel va être l’évolution de l’informatique à code ouvert ?

Quelles opportunités pour l’open source de demain ?

L’open source est en marche pour ouvrir de nouvelles perspectives au monde de la recherche : la démocratisation de l’informatique couplée à celle des outils no-code nous rapproche tous de l’utilisation des dernières technologies développées. En 2022, un grand nombre de zones d’ombre légales sont encore exploitées avec bien ou malveillance. Les gouvernements mondiaux en sont bien conscients : nous pouvons déjà voir l’émergence de nouvelles réglementations liées à l’utilisation de programmes informatiques ou data.
La loi République Numérique paru en 2016 qui les oblige les administrations françaises à ouvrir leurs principaux documents informatiques (certaines bases de données, codes source, etc) a été un tournant dans le partage de données à un niveau national. Une des clefs de ces changements est le fait que les documentations techniques accompagnant les logiciels open source sont de plus en plus intelligibles pour les décideurs politiques, ce qui maximise les opportunités de défendre l’open source à un niveau étatique.

Dans l’univers du développement de la production, l’avenir de l’open source s’annonce radieux : une connaissance croissante de l’impact social de ces technologies grâce à ses applications notables sur l’automatisation de tâches redondantes, facilite l’adoption par les grandes institutions.
Ce cercle vertueux permet une utilisation et formation croissante, une meilleure compréhension pour pouvoir adapter la réglementation et faire évoluer l’open source : plus de 30 % des entreprises du Fortune 100 ont désormais mis en place des départements spécialisés pour aider à structurer les politiques et procédures organisationnelles autour de l’open source.
Ces changements vont passer en grande partie par des moyens humains, comment allez-vous participer à cette évolution, et comment vous accompagnerez-vous dans cette aventure ?

Cet article a été écrit par

Jeanne Bachmann

Jeanne Bachmann