**Meta Llama 3.2 : Une avancée significative dans la modélisation multimodale**
Lors de sa conférence annuelle Meta Connect, Meta a présenté la dernière version de sa famille de modèles, Llama 3.2, marquant une évolution majeure dans le domaine de l’intelligence artificielle. Cette nouvelle itération se compose de quatre modèles, dont deux, avec 11 milliards et 90 milliards de paramètres, sont multimodaux, capables de traiter à la fois du texte et des images. En revanche, les modèles plus légers, avec 1 milliard et 3 milliards de paramètres, restent exclusivement textuels, optimisés pour les appareils mobiles et les systèmes embarqués.
Les modèles Llama 3.2 intègrent pour la première fois des fonctionnalités de traitement d’images grâce à une architecture novatrice qui combine un encodeur d’image avec un modèle de langage. Cette avancée permet des applications variées, telles que la génération de légendes pour des images et l’analyse de graphiques. Les modèles sont prêts à l’emploi dès le téléchargement, tout en offrant la possibilité d’un ajustement personnalisé via TorchTune, garantissant ainsi une flexibilité d’utilisation.
Les versions compactes, conçues pour fonctionner sur des appareils légers, exploitent des techniques d’élagage et de distillation pour maintenir leurs performances. Optimisées pour les processeurs Arm, elles sont déjà compatibles avec les puces Qualcomm et MediaTek, facilitant leur intégration dans divers dispositifs.
En termes de performance, les modèles de vision Llama 3.2 se mesurent efficacement à des solutions concurrentes comme Claude 3 Haiku et GPT-4o-mini dans les tâches de reconnaissance d’image. De plus, le modèle 3B surpasse des rivaux tels que Gemma 2.6B dans des domaines comme le suivi d’instructions et la synthèse.
Meta a également lancé Llama Stack, une suite d’outils pour simplifier le déploiement des modèles Llama 3.2. Cette distribution offre des solutions adaptées à divers environnements, incluant des interfaces en ligne de commande et des conteneurs Docker, visant à faciliter l’intégration pour les développeurs.
Avec Llama 3.2, Meta réaffirme son engagement en faveur d’une approche ouverte, rendant ces modèles accessibles pour une large gamme d’applications à travers différentes plateformes. Le téléchargement est d’