Un nouveau joueur vient bousculer le marché de la génération de vidéos ultra-réalistes : Kling, le dernier modèle développé par l’entreprise chinoise Kuaishou Technology. Alors que Sora d’OpenAI et VEO de Google ont déjà suscité l’admiration en produisant des vidéos d’une minute et plus, Kling se démarque en permettant la génération de vidéos atteignant jusqu’à 2 minutes.
Kuaishou, connu pour sa plateforme de partage de vidéos courtes, a récemment investi dans l’IA générative. Après KwaiYii et Kolors, voici Kling, un modèle prometteur qui transforme du texte en clips vidéo haute résolution de 1080p à 30 images par seconde. Grâce à une architecture de transformer et une compréhension approfondie de la sémantique texte-vidéo, Kling simule avec précision les propriétés du monde physique.
Doté d’une technologie de reconstruction 3D du visage et du corps humain, Kling offre des possibilités infinies en matière de création visuelle. Avec un mécanisme d’attention conjointe spatio-temporelle 3D, ce modèle peut modéliser des mouvements complexes de manière réaliste.
Des vidéos de démonstration sur le site de Kuaishou illustrent la puissance de Kling. Ce modèle, tout comme ses prédécesseurs, ouvre de nouvelles perspectives dans l’industrie cinématographique. Les “Sora Shorts”, créés en partenariat avec OpenAI et projetés lors du prochain Tribeca Film Festival, témoignent de l’impact grandissant de ces technologies sur le monde du cinéma.