Google a présenté aux entreprises son tout nouveau modèle vidéo d'intelligence artificielle productive, appelé Veo. Veo, annoncé pour la première fois en mai, a été présenté au public trois mois après l'introduction du produit similaire d'OpenAI, Sora. Désormais, Google a devancé ses concurrents en lançant Veo avec un aperçu spécial sur sa plateforme Vertex AI.
Veo peut produire des vidéos de haute qualité à partir d'entrées basées sur du texte ou des images à une résolution de 1080p et dans une variété de styles visuels et cinématographiques. Lors de la première annonce, la durée des clips produits était de « plus d’une minute » ; Cependant, il n'y a pas de limitation claire à cet égard dans la version préliminaire. Les nouveaux exemples de vidéos partagés par Google mettent en valeur les capacités de Veo, et il est assez difficile de comprendre que ces contenus sont créés par l'intelligence artificielle.
L'exemple de vidéo, dans lequel le motif du pelage et du collier d'un chien restent cohérents lors de ses mouvements, montre à quel point Veo peut traiter les détails.
Imagen 3, le modèle d'intelligence artificielle de conversion texte-image de Google, sera disponible pour tous les clients Google Cloud à partir de la semaine prochaine. Cette extension étend la disponibilité d'Imagen 3, lancé avec une version limitée aux États-Unis sur la plateforme AI Test Kitchen de Google en août. Les utilisateurs auront accès à de nouvelles fonctionnalités telles que l'édition de photos basée sur du texte et l'intégration de leur propre marque, style, logo ou caractéristiques du produit dans les images créées.
Google déclare que les modèles Veo et Imagen 3 incluent des mesures de sécurité intégrées pour empêcher la production de contenu préjudiciable et prévenir les violations des droits d'auteur. Toutefois, des expériences antérieures ont montré que ces protections peuvent être contournées. Tout le contenu produit est marqué numériquement avec la technologie SynthID développée par DeepMind de Google. Ce filigrane numérique invisible vise à réduire les problèmes de désinformation et d’attribution erronée. Semblable au système Content Credentials d'Adobe, cette technologie vise à augmenter la précision et la fiabilité du contenu produit avec l'intelligence artificielle.
Avec le lancement par Google de son modèle vidéo, le modèle Sora d'OpenAI semble avoir pris du retard par rapport à la concurrence. OpenAI avait prévu de sortir Sora d’ici fin 2024 ; mais il n’a pas encore atteint cet objectif. Pendant ce temps, le contenu généré par l'IA commence à apparaître davantage dans la publicité, comme la récente campagne de Noël de Coca-Cola. Selon Google, 86 % des organisations utilisant l’IA générative constatent une augmentation de leurs revenus. Cela montre que les entreprises se tournent vers l’adoption des solutions existantes plutôt que d’attendre Sora.
Google annonce une nouvelle ère dans la production de contenu avec Veo
Le lancement de Veo est considéré comme annonçant une nouvelle ère dans la production de contenu. Les entreprises auront la possibilité de créer du contenu plus rapidement et plus efficacement en utilisant de tels outils. Cependant, les dimensions éthiques et juridiques des contenus produits avec l’intelligence artificielle continuent d’être discutées. Il est donc primordial que ces technologies soient utilisées de manière responsable et consciente.
Les modèles Veo et Imagen 3 de Google sont considérés comme une étape importante dans le domaine de l'intelligence artificielle productive. On observe avec curiosité comment les entreprises intégreront ces outils et quelles innovations elles y apporteront.