Les avancées dans le domaine de l’IA continuent de révolutionner la création de contenu multimédia. En effet, après Sora d’OpenAI et VEO de Google, voici Kling, le nouveau modèle Text-to-Video développé par Kuaishou Technology. Ce dernier est capable de générer des vidéos allant jusqu’à deux minutes, dépassant ainsi ses prédécesseurs en termes de durée et de réalisme.
Kuaishou, connu pour sa plateforme de partage de vidéos courtes, a récemment investi dans l’IA générative avec le développement de Kling. Ce modèle utilise une architecture de transformer et possède une compréhension profonde de la sémantique texte-vidéo. Grâce à une stratégie d’entraînement à résolution variable et à des technologies de pointe, Kling peut simuler avec précision les propriétés du monde physique, offrant ainsi des vidéos de grande qualité.
Un mécanisme d’attention conjointe spatio-temporelle 3D et une technologie de reconstruction 3D du visage et du corps humain permettent à Kling de modéliser des mouvements complexes et d’améliorer l’expression des visages et des corps à partir d’une seule image. Des démonstrations de la capacité de Kling sont disponibles sur le site de Kuaishou et ont déjà suscité l’intérêt du public.
Ces avancées technologiques pourraient révolutionner l’industrie cinématographique, comme en témoigne la projection prochaine des “Sora Shorts” créés par des cinéastes renommés avec l’aide de Sora d’OpenAI. Kling et ses prédécesseurs ouvrent la voie à de nouvelles possibilités dans le domaine de la création de contenu vidéo, promettant des avancées majeures dans un avenir proche.