Les solutions d’intelligence artificielle (IA), et en particulier l’IA générative, s’immiscent de plus en plus dans tous les types de produits et services que nous utilisons quotidiennement. Les vendeurs qui détiennent la plus grande part de marché dans les modèles utilisés comme base pour ces applications quotidiennes, connus sous le nom de modèles fondamentaux, auront les clés du royaume dans le contexte effréné de la ruée vers l’or qu’est l’IA générative.
Les modèles fondamentaux deviennent la nouvelle plateforme d’IA
Contrairement aux modèles d’IA construits pour gérer une seule tâche, tels que la reconnaissance d’image ou l’analyse de sentiment, les modèles fondamentaux ont été formés sur une très grande quantité de données pour être largement applicables à une très large gamme de tâches. Ils exécutent ensuite ces tâches à des niveaux supérieurs à la plupart des modèles à usage unique. Les modèles fondamentaux de langue importante (LLMs) qui sont très populaires aujourd’hui peuvent effectuer une très large gamme de tâches de traitement du langage naturel (NLP), pas seulement une seule tâche, comme l’analyse de sentiment, les chatbots, les questions-réponses sur des documents, l’analyse de documents, voire l’extraction de texte à partir d’images (OCR). Un seul grand modèle fondamental peut faire toutes ces choses, ce qui les rend incroyablement convaincants, et fait partie de ce qui a propulsé l’IA générative au premier plan de chaque conversation sur l’IA aujourd’hui.
Les modèles de base les plus populaires deviennent rapidement des noms familiers : les modèles GPT d’OpenAI, et en particulier son application ChatGPT basée sur eux, le modèle Gemini de Google, Claude d’Anthropic, et une multitude d’autres. Beaucoup de ces modèles, y compris ceux mentionnés précédemment, sont propriétaires en ce sens que les données d’entraînement sous-jacentes, les paramètres du modèle entraîné, les réglages d’ajustement du modèle et les hyperparamètres, et d’autres aspects sont étroitement détenus et non révélés.
Les choses peuvent potentiellement mal tourner lorsque vous incorporez les modèles d’IA de quelqu’un d’autre dans vos systèmes, surtout lorsque vous avez peu de contrôle ou de visibilité sur ces modèles. Pourtant, malgré le jardin clos de plus en plus grand des modèles de langue importants propriétaires, les organisations ne sont pas encore pleinement conscientes des inconvénients potentiels de l’utilisation de modèles d’apprentissage machine non ouverts. Après tout, la plupart des organisations et des individus sont encore très nouveaux et inexpérimentés en matière d’IA.
En effet, lorsque les organisations disent qu’elles utilisent des IA ou qu’elles construisent des systèmes d’IA, la plupart du temps elles effectuent des appels API aux versions hébergées dans le cloud des modèles propriétaires. Parfois, les organisations exécutent des modèles localement ou sur leur propre infrastructure, mais le rythme ultra-rapide de l’itération de l’IA pousse les entreprises à prendre des mesures expédientes pour utiliser simplement ce qui est disponible maintenant. Le besoin de contrôle local ou de personnalisation des modèles est repoussé aux itérations suivantes ou n’est jamais réalisé.
Le gouvernement porte un regard plus attentif sur les modèles de base propriétaires… et les investissements qui y sont liés
Les vendeurs technologiques établis tels que Microsoft, Amazon, Google, Meta, Oracle, IBM, et d’autres comprennent correctement que les modèles de base d’IA sont les plateformes du futur, et s’ils veulent avoir une part de l’avenir, ils doivent avoir un doigt dans chacune des principales entreprises de modèles d’IA. C’est ce qui a conduit à des investissements époustouflants dans des entreprises comme OpenAI, Anthropic, Mistral, et d’autres qui ont levé des dizaines de milliards de dollars dans des investissements partenariaux, dépassant de loin ce que la communauté des capitaux-risqueurs a été capable d’investir.
Comme discuté en détail dans un podcast AI Today sur ce sujet, ces vendeurs sont dans la course à la domination de l’IA. Et cela ne devrait pas vraiment surprendre, puisque l’IA est la plus grande opportunité de marché de la dernière décennie. Il y a vraiment deux façons de dominer ces marchés avec de nouvelles technologies, et c’est construire ou acheter. Cependant, l’industrie évolue beaucoup trop vite pour construire votre chemin vers la domination. Ainsi, ces vendeurs doivent acheter ou s’associer stratégiquement pour obtenir leur avantage.
Cette activité intense de partenariat et d’investissement a attiré l’attention des régulateurs fédéraux. La Federal Trade Commission (FTC) a récemment lancé une enquête sur ces investissements et partenariats en IA générative. Ils s’intéressent à l’examen des dynamiques concurrentielles du marché de l’IA en pleine émergence pour tenter de garantir l’innovation et l’équité, et pour avoir une meilleure compréhension des tendances et pratiques du marché pour voir ce qui pourrait être un comportement anticoncurrentiel. Mais il n’est pas nécessaire d’attendre une action réglementaire qui pourrait ne pas être à venir pour décider de votre approche pour vous assurer que vous avez une plus grande liberté de choix et de contrôle dans l’utilisation et le développement des modèles d’IA.
Quelles sont les alternatives à Open AI et aux autres modèles émergents de base d’IA?
Le défi des modèles propriétaires est que si les organisations deviennent dépendantes d’eux pour leurs capacités en IA, elles seront limitées dans leur flexibilité et leur liberté en termes de déploiement, de configuration et d’adaptation des modèles à leurs objectifs spécifiques. C’est parce que si vous n’avez pas les données sous-jacentes, les paramètres du modèle et des détails supplémentaires, vous n’êtes pas vraiment capable de reconstruire ces modèles, vous ne pouvez que les utiliser en tant que consommateur.
Les modèles de base peuvent changer dans leur fonctionnement, ils peuvent changer dans leurs capacités de performance, et rencontrer des problèmes de modèles refusant de répondre aux invitations et aux entrées sous forme de modération de contenu, restreignant les types de données que vous pouvez leur soumettre ou leur retirer. Si ce n’est pas votre plateforme, vous n’avez aucun contrôle dessus. Les organisations commencent à voir les problèmes avec cette approche.
Les organisations ont de plus en plus de choix en ce qui concerne les modèles fondamentaux qu’elles utilisent dans leurs applications. Le rythme rapide de l’innovation en IA donne lieu à des modèles développés à la fois dans des modèles open source qui partagent tous les aspects des données, des informations d’entraînement, des paramètres du modèle, et plus encore, ainsi que d’autres modèles propriétaires ou des versions spécifiquement ajustées des modèles déjà en usage.
La raison de l’émergence de nouveaux modèles est que les modèles propriétaires sont, à bien des égards, l’équivalent d’un verrouillage par un fournisseur. Elon Musk a notamment poursuivi en justice Open AI pour ce qu’il considérait comme une violation de leur promesse initiale de développement de technologies d’IA « en open source », et a tout récemment publié ses propres modèles Grok en open source en opposition aux modèles propriétaires sur le marché.
Quelle est la différence entre l’open source et les modèles d’IA propriétaires?
Cela a conduit à la croissance et à l’émergence de modèles de base d’IA open source. Les modèles open source sont disponibles en téléchargement, en utilisation et en intégration gratuitement, et en plus, vous pouvez également examiner le code du modèle, les détails, les poids et paramètres, et le modèle entraîné final pour effectuer les changements vous-même. Vous pouvez voir tous ces aspects. Tout comme une grande partie de la base technologique sur laquelle les systèmes IA fonctionnent est open source, de même la poussée pour que les modèles générés par ces systèmes soient également ouverts et disponibles. Il y a beaucoup de discussions sur la transparence, en particulier dans le contexte de la construction de solutions d’IA fiables.
Bon nombre de ces modèles open source fonctionnent aussi bien sinon mieux dans certains cas que les alternatives commerciales propriétaires. Les solutions open source vous offrent la liberté de déployer et d’opérationnaliser les modèles, ainsi que la possibilité de tuning ou de retravailler profondément et fortement sur vos propres données propriétaires sans partager ces données avec un fournisseur tiers. Comme les modèles de langue importante open source sont transparents, vous pouvez les personnaliser selon vos besoins spécifiques plus facilement qu’avec les versions fermées. Et l’open source a une communauté active et un soutien de la communauté actif qui favorise également l’innovation.
Certains des modèles open source émergents et populaires comprennent LlaMa / Llama 2, Bloom, MosaicML MPT-7B, Falcon, GPT-NeoX et GPT-J, PaLM2, Dolly, Vicuna, OPT-175 B, et de plus en plus d’autres. Il s’agit d’un domaine d’innovation et de développement continu, et d’un domaine sur lequel nous verrons certainement plus d’attention, potentiellement animée.
Un modèle de langue importante open source que vous pouvez posséder et exécuter signifie que vous êtes en contrôle des données que vous partagez et du maintien de la confidentialité sur vos invitations et vos réponses aux modèles de langue importante. Cela a été beaucoup critiqué ces derniers temps par des organisations et des agences gouvernementales qui disent qu’elles n’autorisent pas leurs employés à utiliser des modèles de langue importante hébergés en raison des exigences relatives à la confidentialité et à la sécurité des données.
De plus, il existe un potentiel d’économies de coûts et de diminution de la dépendance des fournisseurs avec les modèles open source. Sans coûts de licence pour utiliser vos modèles, les modèles de langue importants open source peuvent être moins coûteux à long terme, notamment lorsque vous les intégrez de plus en plus dans un plus grand nombre de systèmes. Cependant, comme toute technologie open source, vous devez supporter le coût de mise en œuvre et d’exécution des modèles, ce qui peut être potentiellement significatif.