OpenAI et Google ont trouvé un nouveau rival dans le domaine de la génération de vidéos réalistes avec Kling, un modèle Text-to-Video développé par Kuaishou Technology. Ce dernier surpasse ses concurrents en produisant des vidéos allant jusqu’à 2 minutes, avec une résolution de 1080p et une fréquence de 30 images par seconde.
Kuaishou, connu pour sa plateforme de partage de vidéos courtes, a récemment étendu ses activités à l’intelligence artificielle générale. Kling, actuellement en phase d’essai, utilise une architecture transformer et une technologie d’attention conjointe spatio-temporelle 3D pour modéliser des mouvements complexes. De plus, la technologie de reconstruction 3D du visage et du corps humain améliore la qualité des vidéos produites.
Ce nouveau modèle, avec ses capacités avancées, a le potentiel de révolutionner l’industrie du cinéma. En effet, des cinéastes ont créé une série de courts métrages, les “Sora Shorts”, en utilisant le modèle Sora d’OpenAI, qui ont été projetés au Tribeca Film Festival. Cette avancée technologique ouvre de nouvelles perspectives dans le domaine de la création de contenu vidéo.