Kuaishou Technology, une entreprise chinoise spécialisée dans le partage de vidéos courtes, a récemment dévoilé Kling, un nouveau modèle Text-to-Video capable de générer des vidéos allant jusqu’à 2 minutes. Ce concurrent direct des modèles Sora d’OpenAI et VEO de Google propose une technologie avancée permettant une génération efficace de vidéos très réalistes.
Kuaishou, connu pour sa plateforme de partage de vidéos au succès grandissant, a renforcé ses capacités d’IA avec le développement de Kling. Ce modèle révolutionnaire utilise une architecture de transformer et une approche sémantique texte-vidéo pour offrir des vidéos de haute qualité. Grâce à des avancées technologiques telles qu’une infrastructure d’entraînement efficace et une optimisation de l’inférence, Kling peut générer des vidéos en haute résolution à 30 images par seconde.
En plus de ses performances remarquables, Kling intègre des fonctionnalités telles qu’un mécanisme d’attention conjointe spatio-temporelle 3D et une technologie de reconstruction 3D du visage et du corps humain (3D VAE) pour améliorer la qualité des vidéos produites. Des démonstrations ont déjà été publiées par Kuaishou, démontrant la puissance et la précision de ce nouveau modèle.
L’arrivée de Kling sur le marché de la génération de vidéos promet de bouleverser l’industrie cinématographique et de proposer de nouvelles perspectives créatives. Avec des projets comme les “Sora Shorts” réalisés en collaboration avec des cinéastes de renom, l’impact de modèles tels que Kling sur le monde de l’audiovisuel ne fait aucun doute. À surveiller de près pour les passionnés de technologie et de création vidéo.