Les gadgets alimentés par l’IA déçoivent : des conceptions problématiques et des solutions à l’horizon

Ce printemps, la hype a été alimentée autour de deux gadgets alimentés par l’IA : le Humane AI Pin et le Rabbit R1. Tous deux promettaient une automatisation basée sur l’IA et une conversation fluide avec un assistant IA toujours présent, toujours prêt à aider. Ils ont échoué. Le célèbre critique technologique Marques Brownlee a qualifié le Humane AI Pin de “pire produit que j’ai jamais testé”, tandis que le Rabbit R1 a reçu le verdict quelque peu plus indulgent de “à peine testable”.

“Pas plus de six mois avant de voir des applications [IA] réelles fonctionner sur des PC, voire des appareils mobiles.” -Dwith Chenna, AMD

Le Dr. John Pagonis, chercheur principal en UX chez Zanshin Labs, a observé que tout nouveau dispositif grand public doit prouver qu’il est meilleur que ce qui est déjà disponible, une tâche que ces deux gadgets IA ont échoué. “Quel problème [ces dispositifs] résolvent-ils ? Quel besoin comblent-ils ? Ce n’est pas évident.”

Alors, ça y est, c’est terminé, non ? Pas tout à fait. Alors que Humane et Rabbit ont échoué, des solutions aux problèmes qui ont entravé ces nouveaux venus sont toutes proches – et elles pourraient changer à jamais la technologie grand public. ChatGPT, tu es là ? Bonjour ? Bonjour… ?

Les meilleurs actuels modèles linguistiques larges basés sur l’IA (LLM) font face à un ennemi commun : la latence. Les gens s’attendent à une réaction lorsque qu’ils tapotent ou parlent, mais les meilleurs LLM résident dans des centres de données, ce qui peut entraîner des retards. C’est au cœur des problèmes de Humane et Rabbit. Les examinateurs se sont plaints que les gadgets étaient lents à répondre et inutiles lorsque l’accès à Internet était peu fiable ou indisponible.

Pourtant, il y a une solution : placer le LLM sur l’appareil. J’ai évoqué cette possibilité pour IEEE Spectrum en décembre, et beaucoup de choses ont été faites depuis. Le Llama 3 de Meta, le Phi 3 de Microsoft et l’OpenLEM d’Apple – tous annoncés en avril 2024 – ont apporté de grands progrès dans la qualité des petits modèles IA. Les fabricants de puces comme Apple, Intel, AMD et Qualcomm s’attaquent également au problème, en renforçant les performances des coprocesseurs IA dans les ordinateurs portables, les tablettes et les smartphones.

“Toutes ces applications, toutes ces notifications différentes. C’est trop. C’est épuisant. Il y a beaucoup de recherches montrant que ce ne devrait pas être la façon dont nous interagissons avec la technologie.” -Patricia Reiners, designer UX

Dwith Chenna, ingénieur chez AMD et spécialiste de l’inférence IA, a déclaré que ces améliorations rendent les LLM possibles sans le cloud. Le Humane AI Pin et le Rabbit R1 ont simplement été lancés trop tôt pour tirer parti de ces avancées.

Le M4 d’Apple, qui a fait ses débuts dans le nouveau iPad Pro, possède, selon la société, “le moteur neuronal le plus rapide d’Apple”.

“Il y a beaucoup de concentration à essayer de mettre en place [de grands modèles linguistiques] pour les faire fonctionner sur des appareils comme des ordinateurs personnels et des téléphones mobiles”, a déclaré Chenna. “Je ne pense pas qu’il faudra plus de six mois avant de voir des applications [IA] réelles fonctionner sur des ordinateurs personnels, voire même des appareils mobiles.”

L’intégration des LLM dans la technologie grand public abordera également un autre problème clé : la confidentialité. Le Rabbit R1 utilise un modèle d’action volumineux (LAM) pour automatiser des applications et des services, mais certains testeurs se sont dit mal à l’aise avec l’idée. Le LAM nécessite des informations personnelles, telles que des identifiants de connexion et des mots de passe, pour agir au nom de l’utilisateur. Rabbit a promis de gérer les informations de manière sécurisée, mais étant donné que le modèle IA qu’il utilise est hébergé dans le cloud, les données sont inévitablement envoyées hors de l’appareil.

“Je pense que l’une des principales préoccupations est la confidentialité et la sécurité. Tout le monde n’est pas à l’aise de partager ses informations avec le cloud”, a déclaré Chenna. Pagonis est d’accord et note que les plus grandes entreprises technologiques manœuvrent déjà pour résoudre le problème. “Lors de la Google I/O, ils ont évoqué le fait de faire fonctionner Gemini Nano sur l’appareil pour une meilleure confidentialité. Et c’est une stratégie que je suis sûr qu’Apple suivra.”

Des erreurs de conception ternissent les gadgets IA

Des LLM plus petits et plus rapides qui fonctionnent sur l’appareil pourraient résoudre le problème de latence, mais ils ne rachèteront pas instantanément les gadgets de Humane et Rabbit. Les deux ont commis des erreurs de conception graves qui entravent la facilité d’utilisation promise.

“Je pense que la technologie est absolument fascinante, et aussi… super révolutionnaire”, a déclaré Patricia Reiners, designer UX indépendante et animatrice du podcast Future of UX. “Mais, il doit fonctionner. Les problèmes de convivialité de base ne devraient pas être d’actualité.”

Reiners a expliqué que les maux de Humane et Rabbit pourraient être évités s’ils prenaient du recul par rapport à leurs ambitions en matière d’IA pour réfléchir à la manière dont les gens utilisent la technologie dans le monde réel. Le Humane AI Pin peut surchauffer en cas d’utilisation fréquente et dépend d’un projecteur pour afficher des informations, ce qui pose problème en cas d’utilisation en extérieur. Rabbit, quant à lui, désactive l’écran tactile du R1 dans certains menus, mais pas dans d’autres, ce qui perturbe les utilisateurs.

“Je pense que c’est très important pour les personnes qui lisent votre article”, dit Reiners. “Testez les appareils ou les produits dès le premier concept. Commencez par les prototypes.”

Reiners et Pagonis avaient des opinions différentes sur le destin de Humane et Rabbit. Reiners doute que les problèmes de conception de Humane soient résolubles, mais a déclaré que les fonctionnalités “à moitié cuites” du Rabbit R1 pourraient être abordées par des mises à jour. Pagonis était plus sceptique. “[Humane et Rabbit] ont échoué, à mon avis, à l’exercice fondamental de découverte de produit – qui est de comprendre l’utilité d’un produit, puis de le rendre facile”, a-t-il déclaré.

L’IA pourrait-elle tuer l’application ?

Mais ils étaient d’accord sur une chose : l’échec des premiers gadgets IA laisse le champ libre aux géants Apple, Google et Microsoft.

“Apple et Google, ils ne dorment pas”, a déclaré Reiners. “C’est la raison pour laquelle le Rabbit R1 et le Humane AI Pin ont si précipitamment décidé de transporter. Ils savent que les grands acteurs travaillent dessus.”

Pagonis est allé plus loin et a prédit un nettoyage complet pour les grandes technologies. “Qui va gagner ? Les entreprises qui détiennent vos données, comme Google. Qui contrôle l’expérience utilisateur, comme Apple. Et qui entretient une relation avec vous, comme Apple et Google et, bien sûr, Microsoft.”

Cela peut sembler décevant. Cela implique que les futurs appareils alimentés par l’IA maintiendront le statu quo : ils auront l’apparence, la sensation et le fonctionnement des smartphones auxquels nous sommes habitués.

Pourtant, Reiners ne pense pas que c’est la fin de l’histoire. L’IA pourrait ne pas réinventer l’aspect et la convivialité de la technologie grand public de demain, mais elle pourrait propulser une réinvention du logiciel que nous utilisons sur nos ordinateurs, tablettes et smartphones.

“Lorsque vous ouvrez votre téléphone, il se passe tellement de choses. Toutes ces applications, toutes ces notifications différentes. C’est trop. C’est épuisant”, a déclaré Reiners. “Il y a beaucoup de recherches montrant que cela ne devrait pas être la façon dont nous interagissons avec la technologie.”

Reiners pense que des entreprises comme Apple et Google tenteront de tenir les promesses faites par Humane et Rabbit avec des systèmes d’exploitation IA simplifiés qui prédisent les besoins des utilisateurs et automatisent les tâches courantes. Elle note que les smartphones seraient plus faciles à utiliser s’ils présentaient aux utilisateurs moins d’options une fois l’appareil déverrouillé. Les téléphones pourraient même remplacer les applications par des automatisations contrôlées par un agent IA sur l’appareil.

“L’utilisateur n’a pas vraiment besoin d’applications”, a déclaré Reiners. “Il a un objectif, ce qu’il veut faire, et veut le réaliser. Ainsi, en tant que concepteurs et acteurs travaillant dans la technologie, nous devons repenser la manière dont nous interagissons avec les utilisateurs.”