De nouvelles informations selon lesquelles OpenAI accélère ses investissements dans les technologies d'intelligence artificielle basées sur la voix révèlent une tendance de plus en plus évidente dans le secteur technologique. Selon les nouvelles partagées par The Information ; Au cours des deux derniers mois, OpenAI a complètement reconsidéré ses modèles audio en réunissant sous un même toit une partie importante de ses équipes d’ingénierie, de développement de produits et de recherche. Il est précisé que ces études sont menées pour un matériel personnel dont la priorité est le son, qui devrait être disponible d'ici un an environ. L'approche d'OpenAI ne se limite pas à la conversation plus naturelle de ChatGPT ; Il reflète également une vision plus large visant à réduire la dépendance aux écrans.
Le fait que la voix devienne de plus en plus une interface centrale dans le secteur technologique rend les étapes d'OpenAI plus compréhensibles. Le fait que les haut-parleurs intelligents soient présents dans plus d’un tiers des foyers aux États-Unis montre que les assistants vocaux sont devenus un élément ordinaire de la vie quotidienne. Cependant, la fonctionnalité proposée par Meta pour les lunettes intelligentes Ray-Ban, qui vise à clarifier les conversations dans des environnements bruyants grâce à un système à cinq microphones, révèle que la voix ne se limite pas à donner des commandes. Les expériences « Audio Overviews » de Google, qui transforment les résultats de recherche en résumés audio de type chat, et l'intégration par Tesla du chatbot Grok développé par xAI dans les véhicules sont parmi les différents exemples de cette transformation.
OpenAI se concentre sur les modèles audio avancés
Outre les grandes entreprises technologiques, de plus petites startups travaillent également sur différents matériels dans l’attente d’un avenir centré sur la voix. Bien que les produits portables sans écran tels que Humane AI Pin n’aient pas répondu aux attentes malgré des investissements élevés, la recherche dans ce domaine n’est pas terminée. Le produit d'intelligence artificielle, développé par Friend AI et présenté sous la forme d'un collier, suscite des débats sur la vie privée en raison de sa revendication d'enregistrement continu. Malgré cela, il semblerait qu'au moins deux sociétés, dont une équipe dirigée par le fondateur de Pebble, Eric Migicovsky, prévoient de proposer des anneaux d'intelligence artificielle basés sur l'interaction vocale en 2026.
Du côté d’OpenAI, l’accent est mis sur des modèles sonores plus avancés. Il est indiqué que le nouveau modèle vocal, qui devrait être prêt début 2026, peut gérer plus naturellement les interruptions pendant les conversations et répondre même lorsque l'utilisateur parle. Cette approche vise à résoudre le problème de latence, qui constitue l’une des plus grandes limites des systèmes d’intelligence artificielle actuels. Il est également indiqué en coulisses que l'entreprise travaille sur une famille de produits comprenant différents matériels tels que des lunettes ou des haut-parleurs intelligents sans écran.
Ces développements rendent les avancées d'OpenAI du côté matériel plus significatives. La participation de l'ancien chef du design d'Apple, Jony Ive, aux efforts matériels de l'entreprise et l'acquisition de sa startup io dans le cadre d'un accord de 6,5 milliards de dollars ont accru l'importance accordée aux conceptions axées sur le son. Les critiques passées d'Ive concernant la dépendance aux appareils et son accent mis sur des produits moins distrayants expliquent pourquoi OpenAI a adopté une approche qui repousse les écrans en arrière-plan.