L’IA text-to-video continue de repousser les limites de la création de contenu visuel, avec des modèles innovants comme Sora, VEO et maintenant Kling. Lancé par Kuaishou Technology, Kling rivalise avec ses prédécesseurs en permettant la génération de vidéos réalistes allant jusqu’à 2 minutes.
Kuaishou, déjà bien établi dans le domaine du partage de vidéos courtes, a développé Kling pour répondre à la demande croissante de contenu vidéo de qualité. Grâce à sa technique de génération basée sur une architecture Transformer et une compréhension approfondie de la sémantique texte-vidéo, Kling peut créer des vidéos de haute résolution et avec des mouvements spatio-temporels complexes.
Le modèle intègre également une technologie de reconstruction 3D du visage et du corps humain, permettant une expression réaliste à partir d’une seule image. Les vidéos de démonstration publiées par Kuaishou mettent en avant les capacités impressionnantes de Kling, ouvrant la voie à de nouvelles possibilités dans l’industrie du cinéma et de la création de contenu.
Avec des événements tels que la projection des “Sora Shorts” au Tribeca Film Festival, l’impact de ces modèles sur la création cinématographique est déjà palpable. Kling promet d’être un concurrent de taille dans le domaine de la génération de contenu vidéo, offrant aux créateurs et aux réalisateurs de nouvelles opportunités pour donner vie à leurs idées.