L’innovation dans le domaine de l’intelligence artificielle continue de surprendre avec l’arrivée de Kling, le tout dernier modèle de génération de vidéos développé par l’entreprise chinoise Kuaishou Technology. Avec une capacité de créer des vidéos allant jusqu’à 2 minutes, Kling vient concurrencer les modèles Text-to-Video les plus avancés, tels que Sora d’OpenAI et VEO de Google.

Kuaishou, connu pour sa plateforme de partage de vidéos courtes, a récemment lancé Kling, qui repousse les limites de la génération de vidéos réalistes. Avec une résolution de 1080p et une fréquence de 30 images par seconde, Kling se distingue par son infrastructure d’entraînement efficace et ses performances optimisées.

Ce modèle de diffusion basé sur une architecture de transformer intègre une compréhension approfondie de la sémantique texte-vidéo. Grâce à une stratégie d’entraînement à résolution variable et à une architecture auto-développée, Kling peut simuler avec précision les propriétés du monde physique et modéliser des mouvements spatio-temporels complexes.

La technologie de reconstruction 3D du visage et du corps humain de Kling permet une expression réaliste à partir d’une seule image, offrant ainsi des possibilités créatives infinies. Des vidéos de démonstration du modèle sont déjà disponibles en ligne, révélant la puissance et la précision de Kling dans la génération de contenu visuel.

Avec des modèles comme Kling qui repoussent les frontières de l’IA générative, l’industrie du cinéma est sur le point de vivre une transformation majeure. Les courts métrages créés avec l’aide de Sora seront présentés lors du Tribeca Film Festival, soulignant ainsi l’impact de ces technologies sur la création cinématographique.