Il y a un virage important vers l’intelligence artificielle (IA) et le machine learning (ML) dans les entreprises du monde entier, et cela est principalement dû à l’architecture prometteuse d’Open AI, notamment à travers le succès de ChatGPT. Cette architecture combine deux approches éprouvées du machine learning : les grands modèles de langage (LLM) et l’apprentissage par renforcement provenant des retours humains (RLHF).
Les LLM sont des outils avancés de prédiction qui génèrent des séquences de texte cohérent en analysant de vastes quantités de données textuelles. Leur capacité à produire un texte pertinent varie en fonction de l’application et du contexte, mettant en lumière les défis de l’apprentissage non supervisé à travers divers cas d’utilisation. Quant au RLHF, un agent d’apprentissage automatique apprend des actions optimales par interaction avec son environnement et des retours, incorporant à la fois des évaluations automatisées et humaines pour affiner ses décisions.
Une innovation clé dans les modèles GPT implique l’association des LLM avec un modèle secondaire qui évalue la qualité du texte, utilisant les sorties classées par les humains pour entraîner ce modèle. Cette combinaison améliore la capacité des LLM à s’aligner sur les préférences humaines, démontrant une approche synergique pour améliorer le texte généré par l’IA.
L’avenir de l’IA/ML réside dans la capacité à interagir avec la connaissance d’une nouvelle manière, une manière qui ne nécessite pas les compétences qui causent déjà une pénurie de main-d’œuvre en matière de sécurité. Les fournisseurs ont accès à des trésors de données de sécurité que le client moyen ou l’entreprise utilisant leur technologie n’a pas. Il est impératif d’encoder ces données dans des LLM représentant le langage de la sécurité, de former de nouveaux réseaux neuronaux pour réaliser des analyses de sécurité spécifiques et d’utiliser les données d’interaction utilisateur pour inférer les retours humains pour l’apprentissage par renforcement.
En conclusion, pour accélérer l’adoption de ces nouvelles technologies, il est crucial de maintenir une cohérence du schéma des données entre les produits, de considérer le risque comme une mesure de l’issue et de placer l’expérience utilisateur au cœur de la capture des données d’interaction utilisateur. Ces approches permettront de maximiser l’efficacité et l’efficience des modèles d’IA construits sur les données de sécurité, ouvrant ainsi la voie à de nouvelles possibilités dans le domaine de la sécurisation des informations.