Kuaishou Technology lance Kling pour concurrencer OpenAI et Google

En février dernier, OpenAI présentait Sora, un modèle Text-to-Video capable de générer des vidéos réalistes jusqu’à une minute. Google, lors de la conférence Google I/O 2024, a ensuite dévoilé VEO pour générer des vidéos dépassant cette durée. Aujourd’hui, Kuaishou Technology entre dans la course avec Kling, capable de produire des vidéos de 2 minutes. Kuaishou, connu pour sa plateforme de vidéos courtes, a développé une stratégie d’intelligence artificielle, présentant des modèles tels que son LLM KwaiYii et son modèle texte-image Kolors.

Kling, en phase d’essai, transforme du texte en vidéos de qualité 1080p à 30 images par seconde. Il utilise une architecture transformer et une compréhension avancée de la sémantique texte-vidéo. Grâce à une technologie interne de reconstruction 3D du visage et du corps humain, il peut reproduire avec précision les mouvements physiques. Kling possède également un mécanisme d’attention spatio-temporelle 3D pour modéliser des mouvements complexes. Des vidéos de démonstration sont disponibles sur le site de Kuaishou.

Ces technologies ont un impact potentiel sur l’industrie cinématographique, comme en témoigne la projection prochaine des “Sora Shorts” au Tribeca Film Festival, créés avec l’aide de Sora d’OpenAI. Kling et ses concurrents ouvrent de nouvelles perspectives pour la création vidéo, offrant des possibilités inédites aux professionnels du cinéma.