Un nouvel acteur entre en scène dans la course à la génération de vidéos réalistes : Kling, le modèle Text-to-Video révolutionnaire développé par Kuaishou Technology, vient concurrencer Sora et VEO avec des vidéos pouvant atteindre 2 minutes de durée.
Kuaishou, célèbre pour sa plateforme de partage de vidéos courtes, fait son entrée dans le domaine de l’IA avec Kling, un modèle utilisant une architecture transformant et capable de convertir du texte en clips vidéo de haute qualité. Grâce à une stratégie d’entraînement à résolution variable et à une technologie de modélisation inspirée de la loi de mise à l’échelle physique du monde réel, Kling offre des vidéos ultra-réalistes à une fréquence de 30 images par seconde.
Doté d’un mécanisme d’attention conjointe spatio-temporelle 3D et d’une technologie de reconstruction 3D du visage et du corps humain avancée, Kling permet de modéliser des mouvements complexes de manière précise. Des démonstrations de la puissance de ce modèle ont été partagées par Kuaishou, laissant entrevoir les possibilités infinies offertes par cette technologie révolutionnaire.
Avec le potentiel de transformer l’industrie du cinéma, Kling fait déjà parler de lui avant même sa commercialisation, avec des réalisateurs ayant eu un accès anticipé à ce modèle pour créer des courts métrages impressionnants. La concurrence est rude dans le domaine de la génération de vidéos, mais avec Kling, Kuaishou Technology risque bien de changer la donne.