Le nouveau modèle de production vidéo d'OpenAI, Sora, a été présenté

OpenAI, l’une des sociétés leaders dans le domaine de l’intelligence artificielle, a annoncé Sora, un nouveau modèle de production vidéo capable de créer des scènes réalistes et imaginatives à partir d’instructions textuelles. Le modèle texte-vidéo OpenAI Sora, qui peut créer des vidéos photoréalistes d’une durée maximale d’une minute sur la base des commandes saisies par les utilisateurs, allie technologie et créativité.

Les fonctionnalités innovantes de Sora

Sora permet un large éventail de créativité, y compris des scènes complexes avec plusieurs personnages, des types de mouvements spécifiques et des détails précis de l’intrigue et de l’arrière-plan. Selon le blog promotionnel d’OpenAI, le modèle peut comprendre comment les objets existent dans le monde physique, interpréter avec précision les accessoires et produire des personnages expressifs qui expriment des émotions vives.

Les démos créées avec Sora incluent une scène aérienne de la Californie à son apogée, une vidéo de ce qui semble être un train traversant Tokyo, etc. Cependant, OpenAI note que le modèle peut avoir des difficultés à réaliser avec précision une simulation physique d’une scène complexe.

Récemment, des sociétés telles que Runway et Pika ont attiré l’attention avec leurs propres modèles de conversion texte-vidéo, tandis que Lumiere de Google s’impose comme l’un des principaux concurrents d’OpenAI dans ce domaine. Semblable à Sora, Lumiere offre aux utilisateurs des outils pour créer une vidéo à partir de texte et permet également de créer une vidéo à partir d’une image fixe.

voici sora, notre modèle de génération vidéo :https://t.co/CDr4DdCrh1

Aujourd’hui, nous lançons le red-teaming et offrons l’accès à un nombre limité de créateurs.@_tim_brooks @billpeeb @model_mechanic sont vraiment incroyables ; travail incroyable de leur part et de l’équipe.

moment remarquable.

– Sam Altman (@sama) 15 février 2024

Pour l’instant, OpenAI Sora est disponible pour les membres de « l’équipe rouge » qui évaluent les dommages et les risques potentiels du modèle. D’autre part, OpenAI donne également accès à certains artistes visuels, designers et cinéastes pour obtenir des commentaires. La société note que le modèle actuel peut ne pas reproduire avec précision les lois physiques d’une scène complexe et peut ne pas interpréter avec précision certains modèles de cause à effet.

OpenAI, comme d’autres produits d’IA, devra faire face aux conséquences si les vidéos générées par l’IA sont confondues avec de vraies. À cet égard, la société a déclaré plus tôt ce mois-ci qu’elle avait ajouté des filigranes à son outil de conversion texte-image DALL-E 3, mais qu’ils pouvaient être « facilement supprimés ». Sora suscite d’importantes discussions non seulement dans le monde de la technologie et de l’art, mais aussi au niveau éthique et social.

Le nouveau modèle de production vidéo d’OpenAI, Sora, a été présenté

Les fonctionnalités innovantes de Sora