Le monde de la génération vidéo est en pleine effervescence avec l’arrivée de Kling, le nouveau modèle développé par l’entreprise chinoise Kuaishou Technology. Alors que les modèles concurrents comme Sora et VEO se contentaient de produire des vidéos allant jusqu’à une minute, Kling va encore plus loin en offrant la possibilité de générer des vidéos de 2 minutes, surpassant ainsi ses prédécesseurs.

Kuaishou est déjà bien connu pour sa plateforme de partage de vidéos courtes, offrant une variété de contenus allant du divertissement aux tutoriels. L’entreprise a récemment investi dans l’intelligence artificielle, en développant des modèles de génération de contenu comme Kling, mais aussi KwaiYii et Kolors dans le domaine de l’IA générative.

Doté d’une infrastructure d’entraînement efficace et de capacités de modélisation avancées, Kling peut transformer du texte en vidéos de haute résolution avec une fréquence de 30 images par seconde. Grâce à une architecture de transformer et à un mécanisme d’attention conjointe spatio-temporelle 3D, il est capable de simuler des mouvements complexes et de reconstruire de manière réaliste les visages et les corps à partir d’une seule image.

Les vidéos de démonstration publiées par Kuaishou montrent le potentiel impressionnant de Kling, qui pourrait bien révolutionner l’industrie du cinéma. Avec la projection prochaine des “Sora Shorts” au Tribeca Film Festival, créés par des cinéastes ayant eu un accès anticipé au modèle d’OpenAI, il est clair que les modèles de génération texte-vidéo comme Kling ouvrent de nouvelles perspectives créatives et artistiques.