Les avancées récentes dans le domaine de l’intelligence artificielle ont ouvert la voie à des innovations spectaculaires dans la génération de vidéos réalistes. En février dernier, OpenAI dévoilait Sora, un modèle Text-to-Video révolutionnaire capable de produire des vidéos jusqu’à une minute de durée, surpassant ainsi ses prédécesseurs. Google a ensuite présenté VEO à la conférence Google I/O 2024, offrant des vidéos d’une durée supérieure à une minute. Cependant, ces deux modèles sont désormais concurrencés par Kling, développé par Kuaishou Technology en Chine, qui permet la génération de vidéos allant jusqu’à 2 minutes.
Kuaishou, connu pour sa plateforme de vidéos courtes, a récemment investi dans l’intelligence artificielle, développant des modèles avancés tels que LLM KwaiYii et le dernier né, Kling. Ce dernier se distingue par sa capacité à transformer du texte en vidéos de haute qualité en utilisant une infrastructure et une architecture bien optimisées, offrant une résolution de 1080p et une fréquence de 30 images par seconde. Grâce à des techniques avancées d’entraînement et de modélisation, Kling peut simuler avec précision des scènes du monde physique et modéliser des mouvements spatio-temporels complexes.
Le modèle Kling possède également une technologie de reconstruction 3D du visage et du corps, améliorant ainsi l’expression des personnages à partir d’une seule image. Cette avancée promet de transformer l’industrie cinématographique, comme en témoigne la projection prochaine des “Sora Shorts” au Tribeca Film Festival, créés par cinq cinéastes en utilisant le modèle d’OpenAI. Les démonstrations de Kling montrent un immense potentiel pour l’avenir de la création de vidéos réalistes, ouvrant de nouvelles perspectives dans le monde du divertissement et des médias.