Kuaishou Technology, une entreprise chinoise bien connue pour sa plateforme de partage de vidéos courtes, a récemment lancé son modèle Text-to-Video nommé Kling, capable de générer des vidéos allant jusqu’à 2 minutes en qualité 1080p à 30 images par seconde. Cette avancée dans le domaine de l’IA générative vient concurrencer des modèles tels que Sora d’OpenAI et VEO de Google, en offrant une durée de vidéo plus longue et des fonctionnalités avancées.
Kling utilise une architecture transformer avec une attention conjointe spatio-temporelle 3D pour modéliser des mouvements complexes et des scènes réalistes. De plus, sa technologie de reconstruction 3D du visage et du corps humain améliore l’expression des personnages à partir d’une seule image. Cette innovation ouvre de nouvelles perspectives dans l’industrie du cinéma, comme en témoigne la projection prochaine des “Sora Shorts”, une série de courts métrages créés avec l’aide de Sora d’OpenAI, au Tribeca Film Festival.