Kuaishou Technology, l’entreprise chinoise connue pour sa plateforme de partage de vidéos courtes, a récemment présenté son nouveau modèle Text-to-Video nommé Kling, capable de générer des vidéos jusqu’à 2 minutes. Concurrent direct de Sora d’OpenAI et VEO de Google, Kling utilise une architecture de transformer et une technologie d’attention conjointe spatio-temporelle 3D pour produire des vidéos réalistes à partir de texte. Grâce à sa capacité à simuler précisément les propriétés du monde physique et à reconstruire les visages et les corps en 3D à partir d’une seule image, Kling offre des possibilités inédites dans l’industrie cinématographique. Des démonstrations de ce modèle ont déjà été publiées par Kuaishou, laissant entrevoir un avenir prometteur pour la création de contenu vidéo.