Kuaishou Technology, une entreprise chinoise bien connue pour sa plateforme de partage de vidéos courtes, a récemment lancé Kling, un modèle text-to-video révolutionnaire capable de générer des vidéos ultra-réalistes allant jusqu’à 2 minutes. Ce dernier rivalise avec les modèles Sora d’OpenAI et VEO de Google, étendant ainsi les limites de la génération vidéo automatisée.

Grâce à une technologie de pointe et une infrastructure d’entraînement efficace, Kling peut transformer du texte en clips vidéo avec une résolution de 1080p et une fréquence de 30 images par seconde. Doté d’une architecture transformer et d’un mécanisme d’attention conjointe spatio-temporelle 3D, le modèle peut modéliser des mouvements complexes et simuler avec précision les propriétés du monde physique.

En exploitant une technologie de reconstruction 3D du visage et du corps humain, Kling est capable d’améliorer l’expression des visages et du corps à partir d’une seule image. Des vidéos de démonstration montrent le potentiel impressionnant de ce modèle, qui pourrait révolutionner l’industrie du cinéma en offrant de nouvelles possibilités créatives.

Avec l’avènement de modèles de génération vidéo avancés tels que Kling, l’avenir du divertissement visuel s’annonce prometteur, ouvrant ainsi de nouvelles perspectives pour l’industrie cinématographique et les créateurs de contenu.