Révolution de l'intelligence artificielle de Kuaishou : une nouvelle ère dans la production vidéo avec le modèle KLING

Les développements dans le domaine de l’intelligence artificielle repoussent chaque jour les limites du monde technologique. Parmi ces innovations, un modèle qui défie notre imagination en matière de production vidéo est venu de Chine. Kuaishou, le rival de TikTok en Chine, a développé KLING, un nouveau modèle en libre accès similaire au modèle Sora d'OpenAI, qui n'est pas encore largement disponible, mais qui fonctionne mieux à bien des égards. Ce modèle, nommé KLING, a la capacité de créer des vidéos presque réalistes à partir de textes.

Un nouveau souffle dans la production vidéo assistée par intelligence artificielle avec KLING

Avec une simple représentation d'un Chinois assis à une table en train de manger des nouilles avec des baguettes, le modèle KLING a pu produire une vidéo presque réaliste qui se compare favorablement à la vidéo de Will Smith de nouilles à l'aspect démoniaque créée par Modelscope Text2Video l'année dernière.

KLING peut produire des vidéos de 2 minutes en qualité 1080p et 30 images par seconde (fps) avec une seule commande. Il peut simuler avec précision les propriétés physiques du monde réel. Grâce à l'architecture Diffusion Transformer, KLING transforme les descriptions de textes riches en scènes en direct. Prenant en charge différents formats d'image avec un support VAE 3D dédié et un entraînement à résolution variable, le modèle offre la possibilité de capturer l'expression complète et le mouvement des membres à partir d'une seule photographie du corps entier, avec une technologie avancée de reconstruction du visage et du corps en 3D.

Il est clair que la Chine fait partie des leaders mondiaux dans le développement de modèles d’intelligence artificielle. Désormais en accès libre, KLING n'est qu'un exemple du chemin parcouru par le pays dans ce domaine.

OpenAI a annoncé son intention de lancer Sora d'ici la fin de l'année, mais on se demande si cet effort sera suffisant face aux modèles chinois de conversion texte-vidéo. Le plus grand avantage d'OpenAI dans cette course pourrait être la possibilité que la Chine ne rende pas son modèle disponible dans le monde entier.

Il est intéressant de noter que le KLING n’est pas le premier modèle de production vidéo à sortir de Chine. Sorti en avril, Vidu AI a été le premier à être considéré comme la version chinoise de Sora, capable de créer des vidéos de 16 secondes avec une résolution de 1080p.

Ces avancées technologiques repoussent les limites de la créativité basée sur l’IA et offrent des indices passionnants sur la manière dont la production de contenu façonnera l’avenir.