Le nouveau modèle abordable d'OpenAI : GPT-4o Mini

OpenAI a présenté le GPT-4o Mini, un modèle plus abordable et plus léger pour les développeurs. Ce nouveau modèle coûte beaucoup moins cher que les modèles pleine grandeur et est présenté comme plus performant que le modèle GPT-3.5. Avec ce modèle, OpenAI vise à rendre la technologie de l’intelligence artificielle (IA) accessible à un public plus large.

Les développeurs peuvent être confrontés à des coûts élevés lorsqu'ils développent des applications à l'aide des modèles OpenAI. Cette situation crée un obstacle majeur, surtout dans les projets à moindre budget. De nombreux développeurs ont été contraints d'opter pour des modèles moins chers comme le Gemini 1.5 Flash de Google ou le Claude 3 Haiku d'Anthropic. OpenAI entre sur le marché avec GPT-4o Mini comme solution à ce problème.

« GPT-4o Mini remplit véritablement notre mission de rendre la technologie d'IA plus accessible à un public plus large », a déclaré Olivier Godement, chef de produit de la plateforme API OpenAI. « Si nous voulons que l’IA profite à tous les secteurs, à toutes les applications et aux quatre coins du monde, nous devons rendre la technologie de l’IA beaucoup plus abordable. » dit.

Large gamme d'utilisations du GPT-4o Mini

À partir d'aujourd'hui, les utilisateurs de ChatGPT pourront utiliser GPT-4o Mini avec les forfaits Free, Plus et Team. Ce nouveau modèle remplacera GPT-3.5 Turbo, et les utilisateurs Enterprise pourront également y accéder la semaine prochaine. GPT-3.5 ne sera plus une option pour les utilisateurs de ChatGPT, mais continuera d'être disponible pour les développeurs via l'API. Godement a déclaré qu'ils n'avaient pas encore déterminé quand GPT-3.5 serait supprimé de l'API.

D'autre part, le nouveau modèle léger offrira un support texte et visuel dans l'API et prendra bientôt en charge toutes les entrées et sorties multimodales, c'est-à-dire vidéo et audio. Ces fonctionnalités peuvent être utilisées pour développer des assistants virtuels plus performants. Par exemple, des assistants qui comprennent votre projet de voyage et font des recommandations peuvent être possibles avec ce modèle. Cependant, il est important de noter que le modèle est conçu pour des tâches simples et n’est pas utilisé pour développer des applications complexes comme Siri.

Le GPT-4o Mini a obtenu un score de 82 % à l’examen de référence MMLU (Measage Massive Multitask Language Understanding). Cet examen comprend environ 16 000 questions à choix multiples couvrant 57 sujets académiques. Lors de leur lancement en 2020, les modèles ont obtenu de très mauvais résultats à cet examen. GPT-3.5 a obtenu un score de 70 % à cet examen et GPT-4o un score de 88,7 %. Google affirme que Gemini Ultra a obtenu un score de 90 % à ce test, le score le plus élevé jamais obtenu. En comparaison, les modèles rivaux Claude 3 Haiku ont obtenu un score de 75,2 pour cent et Gemini 1.5 Flash un score de 78,9 pour cent.

Il convient de noter que la manière dont les tests de référence sont mis en œuvre varie légèrement d'une entreprise à l'autre, il est donc difficile de comparer les scores des différents modèles. En outre, le fait que l’intelligence artificielle contienne ces réponses dans l’ensemble de données et donc la possibilité de tricher à l’examen doit être considéré comme une autre question importante. Un autre problème important est que les évaluateurs tiers ne sont généralement pas inclus dans le processus.

Les développeurs souhaitent réduire les coûts lors de la création d’applications d’IA. Le lancement de GPT-4o Mini offre à ces développeurs un nouvel outil. OpenAI a donné à la startup de technologie financière Ramp l'opportunité de tester ce modèle. Ramp a développé un outil qui extrait les données de dépenses des reçus à l'aide du GPT-4o Mini. Au lieu de remplir des zones de texte, les utilisateurs téléchargent une photo de leur reçu et demandent au modèle d'organiser ces données. Le client de messagerie Superhuman a également testé GPT-4o Mini et amélioré sa fonction de génération automatique de suggestions de réponse.

Ce nouveau modèle vise à offrir aux développeurs la possibilité de créer des applications et des outils qu'ils ne peuvent pas faire avec des modèles plus grands et plus coûteux. De nombreux développeurs s'étaient tournés vers les modèles Claude 3 Haiku ou Gemini 1.5 Flash pour éviter des coûts de transaction élevés.

En conséquence, le lancement par OpenAI du GPT-4o Mini est considéré comme une étape importante qui permettra à la technologie de l'IA d'atteindre un public plus large. Godement a déclaré : « Je pense que ce modèle sera très populaire. « Il sera utilisé à la fois par les applications existantes utilisant l'IA et par de nombreuses applications qui ne pouvaient auparavant pas accéder à cette technologie en raison de son prix », a-t-il déclaré.