Google permet aux utilisateurs de créer leurs propres mondes interactifs avec Project Genie

Genie 3, développé par Google DeepMind et introduit pour la première fois l'été dernier, fait partie des systèmes appelés « modèle mondial » dans le domaine de l'intelligence artificielle. De tels modèles ne produisent pas seulement des images ; Il peut également créer des environnements numériques dynamiques capables de réagir aux mouvements de l'utilisateur. Genie 3, initialement positionné pour la formation d'agents d'intelligence artificielle, est désormais ouvert aux utilisateurs extérieurs à Google sous le nom de Project Genie. Cette évolution rend plus visible le potentiel de l’intelligence artificielle générative dans les domaines du divertissement, du design et de la simulation.

Il existe certaines conditions pour accéder à Project Genie. Ceux qui souhaitent essayer le service doivent disposer d'un abonnement Google AI Ultra, qui coûte 250 $ par mois. De plus, les utilisateurs doivent résider aux États-Unis et être âgés d’au moins 18 ans. Même si ces limitations ne plaisent pas au grand public, il semble que Google ait préféré tester le système de manière contrôlée.

Quels modes d'interaction propose Google Project Genie ?

Project Genie propose initialement trois modes d'interaction différents : World Sketching, exploration et remixing. En mode World Sketching, Nano Banana Pro de Google entre en jeu et prépare l'esquisse visuelle de base du monde numérique que Genie 3 va créer. À ce stade, les utilisateurs peuvent définir le personnage qui apparaîtra dans le monde et déterminer l'angle de la caméra : vue à la première personne, à la troisième personne ou isométrique. De plus, le style d'exploration peut également être prédéfini.

Le brouillon préparé par Nano Banana Pro est présenté à l'utilisateur en avant-première. Ainsi, il devient possible de prendre diverses dispositions avant d'entrer dans le monde à créer. Cependant, la réutilisation de commandes précédemment écrites pour des mondes créés par d'autres utilisateurs est également prise en charge. Cette approche offre une structure qui encourage la production de contenu communautaire.

Cependant, Project Genie n’est pas considéré comme un moteur de jeu au sens classique du terme. Bien que les visuels et les interactions qui en résultent ressemblent à des jeux, il n’existe pas de système de notation ni de mécanismes basés sur des tâches. De plus, les mondes créés et le temps d'interaction sont limités à 60 secondes. La présentation visuelle est limitée à 24 images par seconde et à une résolution de 720p.

Malgré cela, Project Genie montre concrètement le point atteint par DeepMind dans les technologies de modélisation mondiale ces dernières années. La capacité de l’intelligence artificielle à simuler des interactions physiques ouvre la voie à différents scénarios d’utilisation dans des domaines tels que l’éducation, le prototypage et le design créatif. Le fait que Google propose ce système en accès limité s’impose comme un choix remarquable, tant en termes de collecte de retours techniques que de maîtrise des risques éventuels.

D'un autre côté, Project Genie semble offrir un environnement expérimental aux développeurs et aux passionnés d'IA malgré ses limites actuelles. Si Google DeepMind étend ses travaux dans ce domaine, il est possible que les systèmes mondiaux basés sur des modèles atteignent à l'avenir une base d'utilisateurs plus large.

blog technologiquepartage régulièrement son agenda technologique sur différentes plateformes. Il transmet instantanément les principales actualités de la chaîne WhatsApp, propose du contenu actualisé via Google News, résume les gros titres des comptes Instagram et X et complète le contenu avec des critiques de produits et des explications détaillées sur la chaîne YouTube.