Une révolution dans le domaine de la génération de vidéos est en marche avec l’émergence de nouveaux modèles tels que Sora, VEO et Kling. Développé par Kuaishou Technology, Kling vient concurrencer les modèles existants avec la capacité de produire des vidéos allant jusqu’à 2 minutes, surpassant ainsi ses prédécesseurs.

Kuaishou, connu pour sa plateforme de vidéos courtes, s’est récemment lancé dans le domaine de l’intelligence artificielle, avec la présentation de LLM KwaiYii et de son modèle texte-image Kolors. Kling, le dernier né de l’entreprise chinoise, utilise une architecture de transformer et une stratégie d’entraînement à résolution variable pour générer des vidéos réalistes de haute qualité.

Grâce à un mécanisme d’attention conjointe spatio-temporelle 3D et une technologie de reconstruction 3D du visage et du corps humain, Kling est capable de modéliser des mouvements complexes avec précision, offrant ainsi de nouvelles perspectives dans l’industrie cinématographique. La démonstration de la puissance de Kling se fera lors du Tribeca Film Festival, avec la projection des “Sora Shorts”, créés par cinq cinéastes ayant bénéficié de l’accès anticipé au modèle d’OpenAI.