Le nouveau modèle o1 d'OpenAI se concentre sur la résolution de problèmes complexes

OpenAI a présenté son nouveau modèle « o1 », décrit comme une étape majeure dans le domaine de l'intelligence artificielle. Ce modèle attire l'attention par sa capacité à résoudre des problèmes plus complexes et est considéré comme une étape importante vers l'objectif de l'entreprise de développer une intelligence artificielle de type humain. L'O1 est meilleur pour résoudre des problèmes en plusieurs étapes et écrire du code que les modèles précédents, mais ces performances ont un prix. Le o1 est plus cher et fonctionne plus lentement que le modèle GPT-4o.

Le modèle O1 a également été introduit aux côtés d'une version plus petite et plus économique, la o1-mini. Ce modèle, qui n'est actuellement disponible que pour les utilisateurs ChatGPT Plus et Team, sera également disponible pour les utilisateurs Enterprise et Edu la semaine prochaine. Il n'a pas encore été déterminé quand les utilisateurs gratuits pourront accéder à o1-mini. L'utilisation d'API est assez coûteuse pour les développeurs ; L'API o1-preview est disponible au prix de 15 $ pour 1 million de jetons d'entrée et de 60 $ pour 1 million de jetons de sortie. À titre de comparaison, la même quantité de GPT-4o peut être utilisée au coût de 5 $ pour l’entrée et de 15 $ pour la sortie.

Nouvelles méthodes pédagogiques et « pensée en chaîne »

OpenAI a soumis le modèle o1 à un processus de formation complètement différent par rapport aux modèles précédents. Bien que la société ait annoncé que o1 avait été formé avec un « nouvel algorithme d’optimisation » et un ensemble de données de formation spécialement préparé, les détails de ce processus n’ont pas encore été clairement partagés. Cependant, Jerry Tworek, responsable de la recherche chez OpenAI, note que le modèle « produit moins d'informations fictives » et que son taux de précision augmente. Cependant, il est reconnu que le modèle peut encore produire des informations erronées ou fictives.

Le processus de formation d'O1 diffère considérablement des modèles GPT précédents. Alors que les modèles GPT ont été formés pour imiter les modèles appris à partir de grands ensembles de données, le modèle o1 a été formé avec une technique appelée « apprentissage par renforcement ». Cette technique donne au modèle la capacité de prendre des décisions grâce à des mécanismes de récompense et de punition. De plus, il aborde le processus de résolution des questions étape par étape avec une méthode appelée « chaîne de pensée ». Cela fonctionne de la même manière que les gens résolvent un problème en le décomposant en plusieurs parties.

Il est indiqué que grâce à cette méthodologie de formation, le modèle est plus performant, notamment dans les problèmes mathématiques complexes et les processus de codage. Par exemple, lors de l'examen de préparation à l'Olympiade internationale de mathématiques, le modèle GPT-4o n'a répondu correctement qu'à 13 %, tandis que le modèle o1 a réussi à résoudre correctement 83 % de ces questions. Ce résultat montre une amélioration significative des capacités de résolution de problèmes du modèle.

Plus de performances, un coût plus élevé

Bien que le modèle O1 surpasse le GPT-4o dans de nombreux domaines, il n'a pas le même niveau de précision des informations. Il est souligné qu’il n’a pas autant de succès que GPT-4o, notamment en matière d’information mondiale générale. De plus, o1 n'a pas de capacités de navigation sur Internet ni de traitement de fichiers et d'images. Cependant, on pense que ce modèle représente une classe plus large de capacités. Le nom du modèle « o1 » est décrit comme une sorte de « réinitialisation » et un nouveau départ dans ce domaine.

Lors des démonstrations du nouveau modèle d'OpenAI, il a été observé que le modèle imite presque la pensée humaine dans le processus de résolution de questions complexes. Par exemple, lorsqu'on essayait de résoudre un problème mathématique, le modèle donnait l'impression de réfléchir étape par étape, en utilisant des expressions telles que « Je suis curieux », « Je réfléchis » et « D'accord, voyons voir ». » Bien que cette approche confère au modèle un style de travail proche de celui des humains, il ne faut pas oublier que l’intelligence artificielle ne pense pas réellement comme un humain.

L’une des plus grandes innovations réalisées par OpenAI avec le modèle o1 est qu’il a franchi une étape importante vers l’amélioration continue des capacités de prise de décision et de résolution de problèmes de l’intelligence artificielle. Ces développements pourraient à l’avenir ouvrir la voie à des systèmes d’intelligence artificielle avancés tels que des systèmes autonomes ou des « agents » décisionnels. Bien qu’O1 soit toujours considéré comme un modèle lent et coûteux, il est considéré comme une étape cruciale dans l’objectif de l’IA d’atteindre une intelligence semblable à celle de l’humain.