Kling, le nouveau modèle Text-to-Video développé par Kuaishou Technology, défie les géants OpenAI et Google en permettant la génération de vidéos jusqu’à deux minutes de durée. L’entreprise chinoise, bien connue pour sa plateforme de partage de vidéos courtes, a récemment investi dans l’intelligence artificielle générative, développant des modèles comme KwaiYii et Kolors.
Kling repose sur une infrastructure d’entraînement efficace et une architecture de transformer, offrant une résolution de 1080p et une fréquence de 30 images par seconde. Grâce à un mécanisme d’attention spatio-temporelle 3D et une technologie de reconstruction 3D du visage et du corps, le modèle promet des vidéos réalistes et précises.
Des vidéos de démonstration publiées par Kuaishou ont déjà captivé l’attention du public, montrant les capacités impressionnantes de Kling dans la simulation de scènes complexes. Avec des modèles comme Sora, Google et maintenant Kling, l’industrie du cinéma pourrait connaître une véritable révolution technologique, ouvrant de nouvelles perspectives créatives pour les réalisateurs.