L’intelligence artificielle (IA) offre de grandes promesses pour les entreprises de tous les secteurs, avec l’arrivée des modèles d’IA spécifiques à l’industrie comme la prochaine vague d’illumination. Cependant, avec des produits d’IA générative formés sur de grandes quantités de données pour identifier des modèles, le succès du modèle dépend entièrement de la qualité, de la disponibilité et de la validité de ces données d’entrée.

Les données sont partout, mais il n’est pas toujours facile d’interroger les données pour comprendre leur origine, leur âge, leur sensibilité et leur fiabilité. La vague d’IA force une conversation sur l’accessibilité à ces informations sur les données, en particulier si elles doivent être exploitées pour l’IA.

Récemment, cela a été soulevé par l’Alliance pour les données et la confiance en introduisant des normes de provenance des données pour améliorer la fiabilité de l’IA. Les normes sont conçues pour aider les entreprises à comprendre où, quand et comment les données ont été collectées ou générées pour offrir une transparence dans le nombre croissant d’applications d’IA.

La provenance des données est un élément crucial de cette transparence, capturant la manière dont les données circulent à travers l’organisation et offrant des informations sur la qualité, la sécurité et la validité des données. En exploitant les informations sur les données utilisées, les entreprises peuvent identifier et corriger les éventuels goulots d’étranglement, incohérences ou inexactitudes dans le pipeline de données et augmenter ainsi la précision et l’efficacité du produit d’IA. D’un autre côté, sans transparence des données, de claires indications de provenance des données et de vérité des données, il est difficile de faire confiance au modèle d’IA et le succès sera entravé.

Bien qu’il existe probablement de nombreuses façons de capturer de telles informations essentielles sur les données, je propose une idée novatrice. J’ai travaillé dans le secteur de la gestion des identités et des accès (IAM) depuis longtemps et j’ai fondé l’un des leaders du marché avant de lancer ma société actuelle, IndyKite. C’est de ce point de vue que je crois que l’IAM moderne est largement sous-utilisé dans la pile technologique d’aujourd’hui, car il peut offrir des avantages significatifs pour l’IA et d’autres applications modernes, en particulier en termes de véracité des données. L’IAM traditionnel a été maintenu séparé du reste de la pile en raison de préoccupations en matière de sécurité. Cependant, l’IAM moderne vise à connecter des silos de données disparates et à traiter les données d’identité comme un facteur de croissance.

En adoptant une approche d’identité moderne basée sur les graphes, vous pouvez exploiter un tissu d’identité unifié, complet avec le contexte, la provenance des données et les attributs de risque pour chaque entité (par exemple, humaine, système, produit numérique ou points de données individuels), le tout sans exposer de données sensibles. Cette approche considère chaque application, entité numérique et point de données comme une “identité” et capture des informations pour supporter les normes de confiance numérique décrites par l’Alliance pour les données et la confiance. Les données peuvent ensuite être utilisées dans des produits d’IA sur mesure et des tâches automatisées avec confiance tout en fournissant la transparence et les preuves nécessaires quant à sa véracité.

Commencer vers une plus grande confiance dans vos applications améliorées par l’IA ne nécessite pas un processus ardu ou un remaniement significatif de la technologie que vous avez déjà en place. Avec les bons outils, vous pouvez exploiter vos données telles quelles, d’où elles sont, sans un investissement important. La magie réside dans la façon dont vous abordez le défi et dont vous pensez à vos données.

Le meilleur endroit pour commencer est de comprendre ce que vous voulez que votre application résolve, les données dont vous avez besoin pour le résoudre et la vérité requise de ces données. Un modèle de données flexible est ici vital, car il vous permettra de commencer petit et de grandir et de changer en fonction de votre échelle (sans casser la logique ou créer des architectures de données trop compliquées). Plus votre maturité en matière de données est élevée, plus cette étape sera rapide.

À partir de là, vous pouvez créer votre couche de données unifiée, enrichie de métadonnées de provenance et de relations. Vous pouvez exploiter cette couche pour commencer à prendre des décisions d’accès intelligentes, améliorer votre logique d’application, obtenir des insights plus approfondis dans vos analyses ou alimenter vos applications d’IA et des applications améliorées par l’IA.

Nous sommes juste au début de voir tout ce que l’IA peut offrir, et je crois que nous ne faisons que gratter la surface de ce qui peut être réalisé avec la vérité des données centrée sur l’identité. Cette prochaine vague d’IA ne doit pas seulement regarder ce que l’IA peut permettre, mais comment nous pouvons mieux permettre l’IA.