Le mois dernier, Google a dévoilé VEO, une extension du modèle Text-to-Video Sora d’OpenAI capable de créer des vidéos de plus d’une minute. Aujourd’hui, c’est au tour de Kuaishou Technology de présenter Kling, un compétiteur capable de générer des vidéos allant jusqu’à 2 minutes. Kuaishou, connu pour sa plateforme de partage de vidéos courtes, a récemment investi dans l’IA générative. Kling se distingue par sa capacité à transformer du texte en clips vidéo de haute qualité, grâce à une infrastructure d’entraînement efficace et des capacités de modélisation avancées. Le modèle adopte une architecture de transformer et intègre un mécanisme d’attention conjointe spatio-temporelle 3D, ainsi qu’une technologie de reconstruction 3D du visage et du corps humain. Les possibilités offertes par des modèles comme Kling pourraient transformer l’industrie du cinéma, comme en témoigne la création de courts métrages avec Sora par des cinéastes pour le Tribeca Film Festival.
K