Kuaishou Technology vient de lancer Kling, un modèle Text-to-Video révolutionnaire capable de générer des vidéos de haute qualité allant jusqu’à 2 minutes. Cette technologie vient concurrencer des modèles similaires tels que Sora d’OpenAI et VEO de Google, en étendant les capacités de génération de vidéos à une durée encore plus longue.
Kuaishou, connu pour sa plateforme de partage de vidéos courtes, a récemment investi dans l’IA générative et a développé une série de modèles performants, notamment Kling. Ce dernier utilise une architecture de transformer et une technologie avancée pour créer des vidéos réalistes avec une résolution de 1080p et une fréquence de 30 images par seconde.
Grâce à des mécanismes d’attention spatio-temporelle 3D et de reconstruction 3D du visage et du corps humain, Kling peut modéliser des mouvements complexes et améliorer l’expression des personnages. Des démonstrations de cette technologie sont disponibles sur le site de Kuaishou, montrant son potentiel dans le domaine du cinéma et de la création de contenu vidéo.
Avec des modèles comme Kling en développement, l’industrie de la vidéo pourrait bientôt connaître une véritable révolution, offrant de nouvelles possibilités créatives aux cinéastes et aux créateurs de contenu.