Kuaishou Technology, une entreprise chinoise réputée pour sa plateforme de partage de vidéos, a récemment lancé Kling, un modèle Text-to-Video révolutionnaire capable de générer des vidéos jusqu’à 2 minutes. Contrairement à ses concurrents Sora et VEO, Kling offre une résolution de 1080p et une fréquence de 30 images par seconde pour des vidéos ultra-réalistes.

Grâce à une architecture de transformer et à une compréhension pointue de la sémantique texte-vidéo, Kling utilise des techniques de modélisation inspirées de la réalité physique pour simuler avec précision les mouvements spatio-temporels complexes. De plus, sa technologie de reconstruction 3D du visage et du corps humain permet une expression détaillée à partir d’une seule image.

Avec le potentiel de révolutionner l’industrie cinématographique, Kling et d’autres modèles similaires pourraient bien être le futur du contenu vidéo, comme en témoigne la projection prochaine des “Sora Shorts” au Tribeca Film Festival, créés avec l’aide de Sora d’OpenAI. L’ère de la génération vidéo par intelligence artificielle est bel et bien lancée.