La révolution de l’IA générative : Faut-il opter pour du open-source ou du propriétaire ?

L’IA générative est aujourd’hui considérée comme une révolution plutôt qu’une simple nouveauté technologique. Elle a réussi à sortir l’IA de l’ombre de la théorie pour l’intégrer pleinement dans des applications pratiques, touchant ainsi presque tous les aspects de notre quotidien, du travail à la création en passant par l’apprentissage.

Comme dans toute ère nouvelle, les opinions sont partagées sur la manière dont l’IA générative devrait être développée, utilisée et régulée. Les discussions animées concernant le rôle du open-source dans l’IA générative en sont une preuve évidente. Des personnalités influentes de l’industrie, telles que Marc Andreessen et Vinod Khosla, ainsi que de nombreux autres acteurs du secteur, ont pris position sur le sujet, comme l’a souligné le Wall Street Journal.

Andreessen se positionne en faveur de l’open-source pour l’IA, affirmant que : “L’open-source pour l’IA est une situation gagnant-gagnant pour tous. Non seulement les utilisateurs bénéficient du modèle lui-même, mais les développeurs du monde entier tirent profit d’un accès approfondi aux modèles d’IA”. De son côté, Khosla plaide pour le maintien de l’IA de manière propriétaire, estimant que sa fermeture peut constituer une protection contre les dangers potentiels et les abus de la part de cybercriminels et de “mauvais acteurs”. Les deux parties ont de bons arguments.

Ces débats animés sur l’ouverture de l’IA suscitent une question cruciale qui pourrait changer la trajectoire du développement et de l’utilisation de l’IA : les grands modèles linguistiques, qui forment la base de l’IA générative, devraient-ils être proposés en open-source ou en logiciel propriétaire ?

Pour mieux comprendre cette question, il est nécessaire de saisir ce qu’est le open-source et de distinguer l’IA open-source de l’IA propriétaire. Le open-source est un programme d’IA distribué gratuitement au public pour permettre aux utilisateurs de le modifier et de le partager. L’IA fermée (ou propriétaire) garde son code confidentiel, empêchant ainsi les utilisateurs de personnaliser son utilisation. Par exemple, le modèle Llama 2 de Meta est disponible en open-source, tandis que les solutions d’OpenAI et d’Anthropic offrent des modèles fermés.

En plus de l’IA, le open-source est disponible pour les systèmes d’exploitation, les serveurs web et les applications. On peut remonter aux débuts de l’informatique pour retracer les origines du partage de code source et du développement collaboratif, des pratiques communes parmi les chercheurs et programmeurs. Ce n’est cependant que plus tard, lorsque Linus Torvalds a créé le système d’exploitation Linux en 1991 en invitant des contributions de développeurs du monde entier, que le open-source a officiellement pris son essor. Comme l’histoire l’a montré, le concept de open-source a favorisé l’innovation et la concurrence sur le marché, ainsi que le développement collaboratif et le partage de ressources.

L’IA générative open-source présente plusieurs avantages convaincants à prendre en compte.

Collaboration et Innovation
L’IA open-source encourage la collaboration et favorise l’innovation en mettant en commun l’expertise collective de chercheurs, de data scientists, de développeurs et d’ingénieurs. En partageant le code, les ensembles de données et les expériences, les performances et les capacités des modèles peuvent être continuellement améliorées, et les bonnes pratiques partagées pour optimiser leur utilisation.

Personnalisation
En maintenant les modèles d’IA générative en open-source, les organisations ainsi que les développeurs ont la liberté de les personnaliser pour répondre aux besoins d’applications spécifiques, de marchés et d’utilisateurs. Ils peuvent modifier le code, ajuster les paramètres et intégrer des fonctionnalités supplémentaires au besoin.

Transparence
Les modèles d’IA open-source permettent aux chercheurs, développeurs, entreprises et utilisateurs finaux d’avoir accès au code, aux algorithmes et aux données utilisés pour entraîner le modèle. Cette transparence peut favoriser la confiance et la responsabilité dans le système d’IA, et permettre d’identifier librement tout biais pour le corriger.

Soutien de la communauté
Au lieu de nécessiter un dépannage et un support coûteux de la part de fournisseurs propriétaires, les modèles d’IA générative open-source bénéficient généralement d’une communauté entière de contributeurs qui fournissent un support, une documentation et une maintenance, ainsi que des bonnes pratiques et des leçons apprises.

Bien que l’IA générative open-source présente des avantages clés qui peuvent stimuler l’innovation et l’adoption à l’échelle de l’industrie, elle n’est pas toujours entièrement gratuite, ni réellement ouverte, pour être honnête. Certains fournisseurs open-source monétisent leurs modèles en facturant des services visant à personnaliser la plateforme pour des organisations spécifiques ou en vendant des services, des fonctionnalités et un support supplémentaires pour leur utilisation sur leurs modèles ouverts.

Pour les entreprises utilisant des modèles open-source gratuits, cependant, elles peuvent bénéficier de la liberté d’utiliser les modèles comme elles le souhaitent, mais n’ont souvent pas les compétences ou les ressources en IA pour les personnaliser efficacement, établir une gouvernance ou former les employés à leur utilisation optimale. L’intégration de l’IA générative open-source dans l’entreprise peut être une tâche ardue qui pourrait compromettre la confidentialité des données et la sécurité, et augmenter les risques pour l’entreprise en l’absence d’un plan stratégique ou de soutien par le biais de partenariats.

Peut-être l’une des plus grandes inquiétudes du open-source réside dans son ubiquité. Lorsqu’il est librement disponible, il n’y a aucun moyen de contrôler son utilisation par les mauvais acteurs qui peuvent exploiter les modèles pour propager la désinformation, produire des deep fakes ou se livrer à d’autres activités malveillantes.

L’IA générative se généralise rapidement dans tous les secteurs de la société. Comme pour tout changement perturbateur de ce type, il faut tout un village pour garantir son utilisation la plus effective et la plus sûre possible. Malgré les défis que peut présenter l’IA générative open-source, je crois que cet environnement collaboratif est ce qui peut en fin de compte permettre à ce village de s’épanouir.