OpenAI pourrait bientôt présenter son nouvel assistant numérique multimodal

OpenAI, qui mène des travaux pionniers dans le domaine des technologies d'intelligence artificielle, a présenté un nouveau modèle d'intelligence artificielle multimodale pour ses utilisateurs. Ce modèle a la capacité de reconnaître des objets ainsi que la capacité de parler. Selon de nouvelles informations, cette technologie sera exposée en détail lundi prochain.

Fonctionnalités du nouvel assistant IA multimodal d'OpenAI

Le nouveau modèle d'OpenAI offre une capacité d'interprétation d'images et d'audio plus rapide et plus précise par rapport aux modèles existants de transcription et de synthèse vocale. Ces fonctionnalités avancées peuvent aider les agents du service client à mieux comprendre le ton de la voix des appelants et s'ils sont sarcastiques. Il est également indiqué que le modèle a théoriquement le potentiel d’enseigner les mathématiques aux étudiants ou de traduire des signaux du monde réel.

Le modèle en question peut surpasser le GPT-4 Turbo pour répondre à certains types de questions, mais la tendance à présenter de fausses informations avec confiance demeure. Cela montre les domaines dans lesquels l’intelligence artificielle doit encore être travaillée. Développeur Ananay Arora D'après les informations partagéesOpenAI pourrait également travailler sur la capacité de ChatGPT à passer des appels téléphoniques.

OpenAI semble travailler sur les appels téléphoniques dans chatGPT. Cela ne constituera probablement qu’une petite partie de l’événement annoncé lundi.
(1/n) pic.twitter.com/KT8Hb54DwA

– Ananay (@ananayarora) 11 mai 2024

Selon Arora, OpenAI dispose de serveurs dédiés pour la communication vocale et vidéo en temps réel. Cela peut indiquer que l’entreprise vise à enrichir davantage les interactions des utilisateurs. Cependant, il a été clairement indiqué que ces innovations n’étaient pas liées au GPT-5. Le PDG Sam Altman a déclaré que l'annonce de la semaine prochaine ne concerne pas un modèle qui devrait être « matériellement meilleur » que GPT-4.

Les nouvelles annonces d'OpenAI devraient coïncider avec la conférence des développeurs I/O de Google et potentiellement attirer l'attention. Google teste une technologie permettant de passer des appels téléphoniques en utilisant l'intelligence artificielle, et des rumeurs circulent concernant un projet appelé « Pixie » qui remplacerait l'Assistant Google multimodal. OpenAI présentera ces nouvelles technologies en direct sur son site Internet lundi soir à 20h00, heure de Turquie.

Ce nouvel assistant IA multimodal d'OpenAI pourrait ouvrir un nouveau chapitre dans le domaine des assistants numériques. Le développement de la technologie continue d’apporter des innovations dans de nombreux domaines de la vie quotidienne, améliorant considérablement l’expérience utilisateur. Ces évolutions permettront à l’intelligence artificielle de se démarquer non seulement par sa puissance de calcul mais aussi par son intelligence perceptuelle.

blog technologique X, Tableau à feuilles mobiles, Actualités de Google Et InstagramSuivre sur!