L’avènement de la technologie Text-to-Video prend une nouvelle ampleur avec l’arrivée de Kling, le dernier modèle développé par l’entreprise chinoise Kuaishou Technology. Capable de générer des vidéos réalistes d’une durée maximale de 2 minutes, Kling rivalise avec les modèles Sora et VEO, présentés respectivement par OpenAI et Google.
Kuaishou est une plateforme populaire de partage de vidéos courtes, similaire à TikTok, qui a étendu ses activités vers le domaine de l’intelligence artificielle. Kling, en phase d’essai, se distingue par sa capacité à transformer facilement du texte en clips vidéo hautement qualitatifs grâce à une infrastructure optimisée et évolutif.
Le modèle Kling se base sur une architecture transformer et une compréhension avancée de la sémantique texte-vidéo. En utilisant un mécanisme d’attention 3D conjoint spatio-temporel et une technologie de reconstruction 3D du visage et du corps humain, Kling parvient à simuler des mouvements complexes avec une grande précision.
Kuaishou a publié des démonstrations de la performance de Kling sur son site, illustrant la diversité des possibilités offertes par ce nouveau modèle. Avec le potentiel de transformer l’industrie cinématographique, Kling et ses homologues comme Sora ou VEO ouvrent de nouvelles perspectives créatives dans la production vidéo. L’avenir de la création de contenu semble prometteur avec ces avancées technologiques majeures.