Cet article rapporte l’émergence de Kling, le nouveau modèle de Text-to-Video développé par Kuaishou Technology, une entreprise chinoise renommée pour sa plateforme de partage de vidéos courtes. Kling rivalise avec Sora et VEO en permettant la génération de vidéos réalistes d’une durée allant jusqu’à 2 minutes, grâce à une technologie avancée basée sur l’IA générative.

Les capacités de Kling en matière de modélisation de mouvements spatio-temporels complexes ainsi que de reconstruction 3D du visage et du corps humain lui confèrent une précision et un réalisme remarquables. La technologie de Kling repose sur une architecture de transformer et une compréhension profonde de la sémantique texte-vidéo, lui permettant de simuler avec précision les propriétés du monde physique.

En démontrant son potentiel à transformer l’industrie du cinéma, Kling fait figure de concurrent sérieux pour les modèles existants, ouvrant de nouvelles perspectives pour la création de contenus vidéo en ligne. Des cinéastes ont déjà pu expérimenter Sora dans le cadre du Tribeca Film Festival, mettant en lumière les possibilités offertes par ces technologies révolutionnaires dans le domaine artistique et audiovisuel.