Un nouveau concurrent de poids vient de faire son entrée sur le marché de la génération de vidéos ultra-réalistes : Kling, développé par l’entreprise chinoise Kuaishou Technology. Ce modèle, qui permet de créer des vidéos allant jusqu’à 2 minutes en partant simplement d’un texte, rivalise désormais avec Sora d’OpenAI et VEO de Google, en étendant les capacités de génération vidéos à une durée plus longue.

Kuaishou, connu pour sa plateforme de partage de vidéos courtes populaire en Chine et à l’international, a récemment mis l’accent sur le développement de l’intelligence artificielle, en particulier dans le domaine de l’IA générative. Le modèle Kling, actuellement en phase d’essai, se démarque par sa capacité à générer des vidéos de haute qualité en résolution 1080p et à 30 images par seconde, grâce à une architecture d’entraînement efficace et évolutive.

Doté d’une compréhension profonde de la sémantique texte-vidéo, Kling utilise une architecture transformer et intègre un mécanisme d’attention spatio-temporelle 3D pour modéliser des mouvements complexes. De plus, sa technologie de reconstruction 3D du visage et du corps humain permet une expression réaliste à partir d’une seule image.

À l’heure où des réalisateurs expérimentent avec ces nouveaux modèles pour créer des œuvres cinématographiques révolutionnaires, il est certain que des avancées telles que Kling pourraient redéfinir l’industrie du cinéma et ouvrir de nouvelles perspectives créatives.