Le domaine de la génération de vidéos par intelligence artificielle est en pleine effervescence. En février dernier, OpenAI a dévoilé Sora, un modèle Text-to-Video révolutionnaire capable de créer des vidéos très réalistes d’une minute de longueur. Google a ensuite présenté VEO lors de la conférence Google I/O 2024, offrant des capacités de génération vidéo étendues. La société chinoise Kuaishou Technology a maintenant rejoint la compétition avec Kling, un modèle pouvant générer des vidéos de deux minutes.

Kuaishou est connu pour sa plateforme de partage de vidéos courtes, populaire en Chine et à l’international sous le nom de Kwai. L’entreprise s’est tournée vers l’intelligence artificielle l’an dernier, en particulier dans le domaine de l’IA générative. Kling, actuellement en phase d’essai, utilise une architecture de transformer et est capable de convertir du texte en vidéos 1080p à 30 images par seconde.

Grâce à une infrastructure d’entraînement efficace et des capacités de modélisation avancées, Kling peut simuler le monde physique avec précision, et modéliser des mouvements spatio-temporels complexes. L’introduction d’une technologie de reconstruction 3D du visage et du corps humain améliore encore la qualité des vidéos produites.

L’impact potentiel de modèles comme Kling sur l’industrie cinématographique est déjà perceptible, avec la projection prochaine de “Sora Shorts” au Tribeca Film Festival. Cette série de courts métrages réalisés à l’aide de Sora par cinq cinéastes promet d’être une étape cruciale dans l’évolution de la création cinématographique.