**Meta Llama 3.2 : Une avancée majeure dans les modèles de langage multimodaux**
Lors de la conférence annuelle Meta Connect, Meta a présenté la dernière version de sa famille de modèles Llama, baptisée Llama 3.2. Cette nouvelle itération comprend quatre modèles, dont deux multimodaux (11B et 90B) capables de traiter à la fois des images et du texte, ainsi que deux modèles légers (1B et 3B) exclusivement textuels, conçus pour une utilisation sur appareils mobiles et périphériques.
Les modèles multimodaux Llama 3.2 se distinguent par leur architecture innovante qui intègre un encodeur d’image, permettant des applications variées telles que l’analyse d’images, la génération de légendes et la localisation d’objets à partir de descriptions textuelles. Ces modèles sont prêts à l’emploi sans nécessiter d’entraînements supplémentaires complexes, bien qu’ils puissent être ajustés avec des outils comme TorchTune pour des usages spécifiques.
Les versions légères, quant à elles, ont été optimisées pour assurer une performance élevée sur des appareils aux capacités limitées. Grâce à des techniques comme l’élagage et la distillation, les modèles 1B et 3B maintiennent leur efficacité dans des tâches telles que la réécriture et le suivi d’instructions, tout en étant adaptés pour les processeurs basés sur l’architecture Arm.
Meta souligne également que les modèles Llama 3.2 rivalisent avec des leaders du marché sur des tâches critiques de reconnaissance visuelle et de traitement du langage. Les modèles sont disponibles au téléchargement sur des plateformes comme llama.com et Hugging Face, facilitant leur intégration dans des applications variées.
En parallèle, Meta a lancé Llama Stack, une suite d’outils destinée à simplifier le déploiement des modèles Llama dans divers environnements, qu’ils soient sur site ou dans le cloud. Cette suite propose une interface utilisateur intégrée et des conteneurs Docker pour optimiser l’expérience des développeurs. Avec cette avancée, Meta continue de promouvoir une approche ouverte pour stimuler l’innovation dans le domaine de l’intelligence artificielle.