**Lancement du projet DATAWISE : Une avancée majeure dans l’automatisation de l’annotation des données**

Ce 1er octobre marque le coup d’envoi du projet DATAWISE (Data Annotation Technology Advancement With Innovative Solutions for Efficiency), lauréat de l’AAP R&D Booster de la région Auvergne-Rhône-Alpes (AURA). Initié par Neovision, en partenariat avec le laboratoire LIRIS, ce projet vise à automatiser l’annotation des données, une étape essentielle pour l’entraînement des modèles d’intelligence artificielle (IA) en vision par ordinateur.

DATAWISE se positionne comme un projet clé au sein de Minalogic, le pôle de compétitivité des technologies numériques en AURA. Ce programme soutient la collaboration entre les acteurs de la recherche et les entreprises, favorisant le développement de solutions innovantes. Neovision, société grenobloise experte en machine learning et en vision par ordinateur depuis 2014, conjugue son savoir-faire avec les compétences du LIRIS, reconnu pour ses travaux de pointe en traitement d’images et en sciences des données.

L’un des principaux défis auxquels fait face le secteur de l’IA est la préparation manuelle des données, souvent longue et ardue. Comme l’indique Stefan Duffner, chercheur au LIRIS, cette phase peut ralentir considérablement le développement des modèles d’IA et détourner les data scientists de leur mission principale : l’analyse des données. Le projet DATAWISE ambitionne de pallier cette problématique en développant des technologies d’automatisation non seulement pour l’annotation, mais aussi pour le nettoyage des données, optimisant ainsi les cycles de développement et réduisant les biais dans les modèles d’IA.

Lucas Nacsa, PDG de Neovision, souligne l’importance de cette innovation : “Notre objectif est de créer des modèles capables de s’entraîner directement sur des données industrielles complexes, sans nécessiter une préparation manuelle massive.” Cette approche pourrait significativement améliorer les performances des systèmes d’IA et réduire le temps de mise en œuvre des solutions.

Au-delà de l’annotation, le projet prévoit d’intégrer des grands modèles de langage (LLM) pour enrichir l’ergonomie des outils développés, rendant ces technologies plus accessibles et adaptées aux besoins des entreprises. En effet, en facilitant l’exploitation de vastes bases de données visuelles