Le modèle d'IA Claude 3.5 Sonnet d'Anthropic peut utiliser l'ordinateur seul

Anthropic a franchi une étape importante dans le domaine de l'intelligence artificielle et a ajouté une nouvelle capacité au modèle Claude 3.5 Sonnet. Ce modèle est équipé d'une fonctionnalité appelée « utilisation de l'ordinateur » et est actuellement disponible en version bêta publique. Grâce à cette fonctionnalité, Claude peut déplacer le curseur de la souris, cliquer sur des boutons et écrire du texte en regardant l'écran de l'ordinateur comme un humain. Grâce à l'API, les développeurs peuvent faire fonctionner Claude comme un humain sur un ordinateur. Cette fonctionnalité a été présentée pour la première fois sur un ordinateur Mac.

L'application de bureau Copilot Vision de Microsoft et ChatGPT d'OpenAI ont démontré les capacités des outils d'intelligence artificielle capables de voir les écrans des utilisateurs. Google a également développé l'application Gemini avec des fonctions similaires pour les appareils Android. Cependant, ces solutions n'ont pas encore atteint le stade permettant d'effectuer des opérations et de réaliser des tâches sur des ordinateurs sous une forme largement utilisable. Bien que Rabbit, qui avait fait une promesse similaire, visait à offrir ces fonctionnalités dans le modèle R1, il n'a pas encore été en mesure de lancer cette fonctionnalité.

Anthropic précise que cette nouvelle fonctionnalité est encore expérimentale et présente quelques lacunes. Cette fonction peut être « complexe et sujette aux erreurs », selon l'entreprise. La société prédit qu'elle a introduit cette fonctionnalité à un stade précoce pour recueillir les commentaires des développeurs et que des améliorations significatives seront apportées au fil du temps.

Selon les développeurs, les opérations que Claude peut actuellement effectuer sur l'ordinateur sont limitées. Par exemple, les opérations de routine telles que le glisser et le zoom ne peuvent pas encore être effectuées par Claude. La méthode de Claude pour visualiser l'écran est basée sur une structure « flipbook » qui combine des captures d'écran plutôt qu'un flux vidéo. Pour cette raison, des notifications à court terme ou des actions rapides peuvent échapper à l'attention de Claude.

De plus, Claude a reçu pour instruction de ne pas interagir avec les réseaux sociaux. En outre, divers systèmes ont été développés pour garantir qu'il ne s'engage pas dans des activités liées aux élections et s'abstienne de tâches telles que la création de contenu sur les réseaux sociaux, la journalisation d'un espace Web ou l'interaction avec des sites gouvernementaux. Ces mesures visent à garantir que Claude travaille dans des limites sécuritaires et éthiques.

Le modèle Claude 3.5 Sonnet d'Anthropic attire l'attention non seulement par ses fonctionnalités informatiques, mais également par ses améliorations de performances dans de nombreux domaines. La société déclare que cette nouvelle version apporte des améliorations significatives à de nombreux standards de l’industrie. Les performances de Claude ont augmenté de manière significative, notamment dans les tâches de codage de logiciels et d'utilisation d'outils. Claude est passé de 33,4 pour cent à 49 pour cent au test SWE-bench Verified, devant des concurrents tels qu'OpenAI.

Dans les tâches de manutention des véhicules, Claude a obtenu une augmentation de performance de 62,6 pour cent à 69,2 pour cent au banc d'essai TAU dans le secteur de la vente au détail et de 36 pour cent à 46 pour cent dans le secteur de l'aviation, qui est un domaine plus exigeant. Ces développements montrent que Claude est devenu un outil d'intelligence artificielle beaucoup plus efficace et vise à offrir une expérience plus fonctionnelle aux utilisateurs.

Anthropic propose son nouveau modèle au même prix et rapidité

Le nouveau modèle Claude 3.5 Sonnet d'Anthropic est disponible au même prix et à la même vitesse que la version précédente, offrant aux clients la possibilité de découvrir des capacités plus avancées sans frais supplémentaires.