OpenAI, Google et désormais Kuaishou Technology se livrent une véritable course à l’innovation dans le domaine de la génération de vidéos ultra-réalistes. En effet, après Sora et VEO, Kuaishou dévoile Kling, un modèle Text-to-Video révolutionnaire capable de produire des vidéos jusqu’à 2 minutes de qualité exceptionnelle. Cette prouesse technologique marque une avancée majeure dans le domaine de l’IA générative, permettant à Kling de rivaliser avec ses concurrents et de s’imposer sur le marché.

Grâce à une infrastructure d’entraînement efficiente et des capacités d’inférence optimisées, Kling parvient à générer des vidéos en haute résolution (1080p) et à une fréquence de 30 images par seconde, offrant ainsi une expérience visuelle immersive et réaliste. Doté d’une architecture de transformer et d’une compréhension pointue de la sémantique texte-vidéo, ce modèle bénéficie également d’un mécanisme d’attention conjointe spatio-temporelle 3D, lui permettant de modéliser des mouvements complexes avec une grande précision.

Par ailleurs, la technologie de reconstruction 3D du visage et du corps humain intégrée à Kling améliore significativement l’expression des personnages, offrant ainsi des scènes plus authentiques et crédibles. Les performances impressionnantes de ce modèle ouvrent de nouvelles perspectives dans l’industrie du cinéma, comme en témoignent les “Sora Shorts” projetés au Tribeca Film Festival, réalisés en collaboration avec des cinéastes de renom.

Ainsi, le secteur de la création audiovisuelle se voit profondément transformé par l’avènement de modèles tels que Kling, ouvrant la voie à de nouvelles possibilités créatives et esthétiques. Kuaishou Technology s’impose comme un acteur majeur de cette révolution technologique, offrant des solutions innovantes et performantes qui promettent de redéfinir les standards de l’industrie.