ChatGPT prend désormais en charge le partage de vidéos et d'écran

OpenAI lance ChatGPT, une plateforme de chat basée sur l'intelligence artificielle Mode son avancé (AVM) a annoncé une mise à jour importante à ce sujet. Ces nouvelles fonctionnalités permettent aux utilisateurs de communiquer de manière plus interactive avec ChatGPT en utilisant les caméras de leur téléphone et les fonctions de partage d'écran. En particulier, la possibilité de partager des informations visuellement et à l'écran élargit le domaine d'utilisation de ChatGPT. Désormais, les utilisateurs peuvent permettre à l'intelligence artificielle de comprendre et de répondre à ces informations en pointant la caméra de leur appareil vers un objet spécifique ou en partageant le contenu sur leur écran.

Fonctionnalités nouvellement introduites, Titulaires d'un abonnement ChatGPT Plus et Pro Il a été mis à disposition pour y accéder. Le déploiement pour les clients éducatifs et professionnels devrait commencer en janvier 2025. Cette étape d'OpenAI révèle comment les assistants basés sur l'intelligence artificielle peuvent être rendus plus fonctionnels dans différents domaines de la vie quotidienne. En outre, les effets qu’auront des innovations telles que la vidéo et le partage d’écran sur les entreprises et l’éducation suscitent déjà de la curiosité.

Dites ho ho ho au Père Noël en mode vocal 🎅

Le Père Noël est déployé aujourd'hui pour tout le monde sur toutes les plateformes ChatGPT et est disponible jusqu'à la fin du mois… puis il retournera au pôle Nord. pic.twitter.com/NVS9bRok4r

-OpenAI (@OpenAI) 12 décembre 2024

ChatGPT interagit de manière plus complète avec les modes visuels

OpenAI a présenté ces fonctionnalités lors d'un livestream. Le directeur des produits de l'entreprise, Kevin Weil, et son équipe ont utilisé les capacités visuelles de ChatGPT pour créer un processus de préparation du café à verser je l'ai fait étape par étape. Dans ce processus, le modèle d’intelligence artificielle a réussi à expliquer les étapes de préparation du café en analysant une machine à café. De plus, il a fourni des conseils à l'utilisateur en comprenant le message sur l'écran d'un téléphone grâce à la fonction de partage d'écran.

En plus de toutes ces fonctionnalités, un autre détail qui attire l'attention des utilisateurs est Présentation de l'option vocale du Père Noël en mode vocal alimenté par l'IA arrivé. Cette option, qui s'active en touchant une icône en forme de flocon de neige dans l'application, offre une expérience amusante. Il est toutefois précisé que cette option audio ne convient qu’aux utilisateurs âgés de 13 ans et plus. De telles petites touches d'OpenAI sont considérées comme une étape importante pour rendre la technologie de l'intelligence artificielle plus accessible et plus conviviale.

Equiper ChatGPT d'innovations fonctionnelles telles que la vidéo et le partage d'écran est une fonctionnalité récemment annoncée par Google. Avec le modèle Gemini 2.0 Il est interprété comme le résultat du concours auquel il a participé. Gemini 2.0 est capable de traiter des données visuelles et audio et d'effectuer des tâches en plusieurs étapes pour le compte de l'utilisateur. On sait que ce modèle a été testé pour différents scénarios d'utilisation sous les noms de « Projet Astra », « Projet Mariner » et « Projet Jules ».

Dans ce contexte, les capacités visuelles et de partage d’écran qu’OpenAI a ajoutées à ChatGPT sont considérées comme une avancée remarquable sur le marché concurrentiel de l’intelligence artificielle. De telles fonctionnalités, qui offrent des avantages pratiques notamment dans la vie quotidienne, prouvent que les plateformes basées sur l'intelligence artificielle peuvent non seulement fournir des informations mais également une expérience utilisateur plus complète.

Les fonctions d'analyse visuelle et de partage d'écran de ChatGPT devraient être largement utilisées dans les secteurs des affaires et de l'éducation, ainsi que par les utilisateurs individuels. L'analyse du contenu visuel, en particulier, peut s'avérer être un facteur de gain de temps dans les processus commerciaux. De même, dans le domaine de l’éducation, il devient possible pour les étudiants d’interpréter instantanément des supports visuels ou de simplifier des informations complexes à l’aide de l’intelligence artificielle.