Un nouveau concurrent vient bousculer le marché de la génération automatique de vidéos : Kling, le dernier-né de l’entreprise chinoise Kuaishou Technology. Ce modèle Text-to-Video est capable de créer des vidéos allant jusqu’à 2 minutes, dépassant ainsi Sora d’OpenAI et VEO de Google.
Kuaishou, connu pour sa plateforme de partage de vidéos courtes, a récemment investi dans l’IA générative. Kling, en phase d’essai, promet des vidéos de haute qualité en 1080p à 30 images par seconde grâce à une architecture de transformer et une compréhension profonde de la sémantique texte-vidéo.
Le modèle utilise un mécanisme d’attention conjointe spatio-temporelle 3D pour modéliser des mouvements complexes, ainsi qu’une technologie de reconstruction 3D du visage et du corps humain pour améliorer l’expression visuelle.
Kuaishou a publié des démonstrations convaincantes de Kling, démontrant les capacités impressionnantes de ce modèle. Avec des applications dans l’industrie cinématographique, telles que les “Sora Shorts” présentés lors du Tribeca Film Festival, Kling pourrait bien révolutionner la façon dont les vidéos sont créées et partagées à l’avenir.