Le prix de l’IA générative baisse en 2024

Il semblerait qu’il existe un décalage entre les communications prospectives des PDG ou autres personnes de haut niveau et ce que nous voyons réellement se produire dans les entreprises. Presque tous les PDG affirment que l’IA générative sera énormément transformative. Elle va restructurer les affaires. La presse regorge d’exemples d’entreprises investissant massivement dans l’IA générative. Mais la plupart de ces investissements proviennent des entreprises technologiques.

Prenons l’exemple des puces qui alimentent l’IA. Il y a une grande ruée pour construire des centres de données et des capacités de calcul permettant aux modèles d’IA générative de fonctionner. Ce sont les acteurs du matériel.

Mais lorsque nous examinons l’utilisation réelle par les grandes organisations, qui utilise l’IA générative? Qu’est-ce qui crée la vague de l’IA générative?

À ce stade, il semble que la plupart de l’argent dépensé ne profite pas aux entreprises qui l’utilisent effectivement. La consommation réelle d’IA générative par les entreprises et les individus semble être assez limitée.

Oui, quelques applications d’IA générative sont passées en production. Mais comme je l’ai déjà mentionné dans un précédent article de blog, il semble peu probable qu’un grand nombre des tests pilotes réalisés par les entreprises en 2023 passeront en production en 2024.

D’où vient ce décalage? Nous voyons des entreprises technologiques effectuer d’énormes dépenses, mais il y a peu d’utilisation visible dans les entreprises. Il n’y a pas beaucoup de consommation.

Je crois qu’il est fort probable que la majeure partie des dépenses visibles en capacité de calcul a été réalisée en prévision d’une adoption rapide et généralisée de l’IA générative par les grandes entreprises. Et si cela ne se produisait pas de cette manière? Sommes-nous face à des investissements prématurés?

Les faits sur le terrain ne soutiennent pas l’idée que les grandes organisations seront les principaux consommateurs. Ainsi, nous avons effectivement deux sources de décalage : ceux qui vendent de l’IA générative par rapport à ceux qui la consomment.

Par conséquent, il est peu probable que nous assistions à une adoption en profondeur et à grande échelle de l’IA générative dans les entreprises en 2024. Cela ne veut pas dire que nous ne verrons pas d’exemples de son impact. Mais en termes de consommation généralisée, non.

De plus, il existe un fossé rhétorique entre les cadres supérieurs et les entreprises qu’ils dirigent. Les dirigeants pourraient modérer leur discours au fil du temps. Mais il est actuellement difficile de savoir combien de temps cela prendra. Ils pourraient sortir d’une phase d’euphorie pour entrer dans un cycle de réalité pratique qui ne correspond pas à l’euphorie.

Par conséquent, les prix de l’IA générative sont susceptibles de baisser. Nous constatons déjà que Microsoft réduit ses prix de plusieurs manières. Elle rend son offre d’IA générative, Copilot, disponible pour le consommateur ainsi que pour les petites entreprises. Elle abaisse également le seuil pour les entreprises en termes du nombre de licences à acheter.

En substance, Microsoft réduit les prix pour les consommateurs plutôt que pour les entreprises. En effet, l’entreprise cherche à segmenter le marché de l’IA générative et à facturer des prix différents dans différentes parties du marché.

Cette stratégie de tarification premium a du sens. Si la consommation n’est pas au rendez-vous pour la soutenir, nous pourrions commencer à voir les prix baisser de manière beaucoup plus agressive.

Une autre raison pour laquelle nous pourrions voir les prix actuels de nombreux modèles baisser est que les entreprises de produits tentent de facturer en fonction de la valeur plutôt que de l’utilisation. Elles font valoir que c’est une technologie très puissante et crée beaucoup de valeur commerciale, donc elles peuvent en demander un prix élevé.

L’histoire n’est pas gentille avec ces modèles. Les modèles de tarification ont tendance à suivre le coût de production plutôt que l’utilisation de la technologie.

Un autre facteur est que de nombreux véhicules de tarification sont complexes. Ils utilisent de multiples variables pour calculer le temps et une combinaison de sièges autorisés pour les personnes à utiliser l’IT pour des jetons lorsque les gens utilisent réellement le produit. Cela s’ajoute aux coûts traditionnels des logiciels.

Cette complexité doit se résoudre en modèles beaucoup plus simples, potentiellement un modèle logiciel et d’utilisation. Cela devrait encore réduire le prix effectif de l’IA générative à mesure que les entreprises et les individus avancent en 2024.

Comme je l’ai déjà mentionné, la tarification premium est souvent basée sur la valeur plutôt que sur le coût d’utilisation. Il se peut que les entreprises de produits mettent en place une capacité de calcul en croyant en l’arrivée d’une vague massive. Mais une vague de consommation plus modeste est probable. Par conséquent, il y a des coûts abandonnés et une capacité excédentaire fera baisser les prix.

Cela ne signifie pas que l’IA générative n’aura pas un impact significatif. Il semble simplement que les entreprises et les individus prendront du temps pour assimiler les implications qui s’appliquent à leurs activités et à leur propre vie.