**Meta Dévoile Llama 3.2 : Une Révolution dans le Traitement Multimodal**

Lors de la conférence annuelle Meta Connect, Meta a présenté Llama 3.2, une nouvelle itération de sa série de modèles de traitement du langage et d’images. Composée de quatre modèles distincts, cette version marque une avancée significative dans le domaine de l’intelligence artificielle, avec des applications potentielles dans divers secteurs.

Les modèles Llama 3.2 incluent deux versions multimodales, 11B et 90B, capables de traiter à la fois du texte et des images, et deux modèles plus légers, 1B et 3B, dédiés uniquement au texte. Cette diversité de taille et de capacité permet une adaptation à différents environnements, en particulier sur des appareils mobiles et des systèmes embarqués, où l’efficacité est cruciale.

L’innovation majeure réside dans l’intégration d’un encodeur d’image au sein des modèles de langage. Cela permet de réaliser des tâches complexes telles que l’analyse de graphiques, la génération de légendes d’images et la localisation d’objets dans des images à l’aide de descriptions en langage naturel. Ces modèles sont prêts à l’emploi, réduisant ainsi le besoin d’entraînement complexe. Ils peuvent également être affinés facilement grâce à des outils tels que TorchTune.

Les modèles compacts 1B et 3B, quant à eux, utilisent des techniques d’élagage et de distillation pour garantir des performances élevées tout en étant optimisés pour les processeurs Arm, notamment ceux de Qualcomm et MediaTek. Ils sont conçus pour exécuter efficacement des tâches de synthèse et de suivi d’instructions, tout en offrant une personnalisation aisée pour des applications spécifiques.

L’évaluation des performances des Llama 3.2 est prometteuse. Les modèles de vision se mesurent aux leaders du secteur, tandis que le modèle 3B surpasse plusieurs concurrents dans des tâches spécifiques. Meta continue de promouvoir une approche ouverte, rendant ces modèles accessibles via des plateformes telles que llama.com et Hugging Face.

En parallèle, une suite d’outils nommée Llama Stack a été introduite pour faciliter le déploiement des modèles dans divers environnements, allant du cloud à des installations sur site, avec une interface utilisateur adaptée.

Meta affirme ainsi sa position de leader dans