L’avancée dans le domaine de la génération automatique de vidéos prend de l’ampleur avec l’apparition de Kling, le dernier modèle développé par l’entreprise chinoise Kuaishou Technology. Après Sora d’OpenAI et VEO de Google, Kling se démarque en offrant la capacité de produire des vidéos allant jusqu’à 2 minutes, surpassant ainsi ses concurrents.
Kuaishou, réputé pour sa plateforme de partage de vidéos courtes, s’est lancé dans le domaine de l’intelligence artificielle l’année dernière, avec le développement de modèles comme LLM KwaiYii et Kolors. Kling, actuellement en phase de test, se distingue par sa capacité à transformer du texte en vidéos de haute qualité en 1080p à 30 images par seconde.
Grâce à sa technologie avancée de reconstruction 3D du visage et du corps humain, Kling parvient à produire des vidéos réalistes et précises à partir d’une simple image. Doté d’une architecture transformer et d’un mécanisme d’attention spatio-temporelle 3D, ce modèle promet une modélisation efficace des mouvements complexes.
Dans le cadre du Tribeca Film Festival, des cinéastes auront l’opportunité de présenter des courts métrages créés avec l’aide de Sora, d’OpenAI, démontrant ainsi le potentiel révolutionnaire de ces modèles pour l’industrie du cinéma. Kling et ses concurrents s’annoncent comme des acteurs majeurs dans la transformation du secteur de la production vidéo.