L’avancée récente dans le domaine de l’IA générative a été marquée par la présentation de Kling, le dernier modèle développé par l’entreprise chinoise Kuaishou Technology. Cette nouvelle technologie a la capacité de transformer du texte en vidéos jusqu’à 2 minutes, dépassant ainsi les modèles existants tels que Sora et VEO.
Kuaishou, connu pour sa plateforme de partage de vidéos courts, a récemment mis en place une stratégie d’IA développant des modèles avancés tels que Kling. Ce dernier utilise une architecture transformer et une compréhension approfondie de la sémantique texte-vidéo, lui permettant de simuler avec précision les mouvements spatio-temporels complexes.
Grâce à une technologie de reconstruction 3D du visage et du corps humain, Kling peut améliorer l’expression des visages et des corps à partir d’une seule image. La société a publié sur son site des vidéos de démonstration illustrant les capacités impressionnantes de son modèle.
Des modèles comme Kling ont le potentiel de révolutionner l’industrie du cinéma, comme en témoigne la projection des “Sora Shorts” au Tribeca Film Festival, créés par des cinéastes utilisant le modèle d’OpenAI. Avec l’émergence de ces technologies de pointe, l’avenir de la création vidéo semble prometteur et innovant.