Un nouveau concurrent de taille vient défier les modèles Text-to-Video existants. Kling, développé par Kuaishou Technology, est capable de générer des vidéos réalistes de deux minutes, surpassant ainsi les modèles Sora et VEO dévoilés par OpenAI et Google récemment. Kuaishou est déjà connu pour sa plateforme de vidéos courtes Kwai, devenue populaire tant en Chine qu’à l’international.

Grâce à une architecture de transformer et une compréhension approfondie de la sémantique texte-vidéo, Kling peut générer des vidéos de haute qualité, soutenues par une technologie de reconstruction 3D du visage et du corps humain développée en interne. Des vidéos de démonstration ont déjà été partagées, montrant la capacité du modèle à simuler des mouvements spatio-temporels complexes et des paysages variés avec précision.

Ces avancées dans le domaine de l’IA générative pourraient révolutionner l’industrie du cinéma, comme en témoigne la projection prochaine des “Sora Shorts” au Tribeca Film Festival. Kling et ses semblables ouvrent de nouvelles perspectives créatives et techniques pour les professionnels du cinéma et de la production vidéoludique.