Kling : un concurrent de taille pour les modèles Text-to-Video

En février dernier, OpenAI présentait Sora, un modèle révolutionnaire capable de générer des vidéos ultra-réalistes d’une minute, dépassant ainsi les standards actuels. Lors de la Google I/O 2024, Google a dévoilé VEO, une version améliorée de Sora permettant des vidéos plus longues. Cependant, un nouvel acteur entre en scène avec Kling, développé par Kuaishou Technology, entreprise chinoise connue pour sa plateforme de partage de vidéos courtes.

Kuaishou, rival de TikTok, est populaire en Chine et à l’international sous le nom de Kwai. L’entreprise a récemment investi dans l’IA, avec des modèles comme KwaiYii et Kolors. Kling, actuellement en phase d’essai, peut convertir du texte en vidéos de deux minutes en 1080p et 30 images par seconde grâce à une infrastructure performante.

Doté d’une architecture de transformer et d’un mécanisme d’attention 3D, Kling peut modéliser des mouvements complexes et reconstruire des visages en 3D à partir d’une seule image. À travers des démos impressionnantes, Kuaishou montre le potentiel révolutionnaire de ce modèle qui pourrait bouleverser l’industrie cinématographique.

Suivant la tendance initiée par les “Sora Shorts” au Tribeca Film Festival, les modèles Text-to-Video comme Kling promettent de redéfinir la création vidéo en offrant des possibilités infinies. Une nouvelle ère s’ouvre dans le monde de l’IA et du cinéma grâce à des innovations telles que Kling, campé pour devenir une référence incontournable dans le domaine.