L’innovation technologique dans le domaine de la génération vidéo connaît un véritable essor avec l’émergence de modèles text-to-video de plus en plus performants. Après Sora d’OpenAI et VEO de Google, c’est au tour de Kling, développé par Kuaishou Technology, de se démarquer en produisant des vidéos allant jusqu’à 2 minutes, surpassant ainsi ses prédécesseurs.

Kuaishou, entreprise chinoise renommée pour sa plateforme de partage de vidéos courtes, a récemment mis au point Kling, un modèle de diffusion capable de convertir du texte en clips vidéo de haute qualité. Grâce à une architecture de transformer et à des capacités de modélisation avancées, Kling parvient à simuler avec précision les propriétés du monde physique, offrant une expérience vidéo réaliste.

En utilisant un mécanisme d’attention conjointe spatio-temporelle 3D et une technologie de reconstruction 3D du visage et du corps humain, Kling parvient à modéliser des mouvements complexes et à améliorer l’expression des visages et du corps à partir d’une seule image. Cette prouesse technique ouvre de nouvelles perspectives dans l’industrie du cinéma, comme en témoigne la projection prochaine des “Sora Shorts” au Tribeca Film Festival, créés par des cinéastes ayant exploré les capacités du modèle d’OpenAI.

Avec Kling, Kuaishou confirme sa position de leader dans le domaine de l’intelligence artificielle et réaffirme son engagement à repousser les limites de la création vidéo. Une véritable révolution qui promet de transformer l’industrie du divertissement et de proposer des expériences toujours plus immersives pour les utilisateurs.