Meta a signé un nouvel accord avec Amazon Web Services pour étendre son infrastructure d'intelligence artificielle. Dans ce contexte, l'entreprise va déployer à grande échelle les processeurs Graviton d'AWS. Cette étape, qui élargit la portée d'une coopération de longue date, est un indicateur concret des projets d'infrastructure de Meta pour les systèmes d'intelligence artificielle de nouvelle génération.
Dans la première phase, des dizaines de millions de cœurs Graviton devraient être mis en service. Cependant, il est indiqué que l'infrastructure dispose d'une structure flexible qui peut être étendue à mesure que la capacité d'intelligence artificielle de Meta augmente. Ce choix témoigne d’un changement significatif dans la façon dont l’infrastructure de l’intelligence artificielle est façonnée. Alors que les unités de traitement graphique restent essentielles à la formation de grands modèles, la montée en puissance des systèmes définis comme IA agentique augmente le besoin de charges de travail gourmandes en CPU. Cela inclut des opérations telles que le raisonnement en temps réel, la génération de code et la gestion de processus en plusieurs étapes.
Les processeurs Graviton5 préférés de Meta offrent une architecture spécialement conçue pour de telles charges de travail. Cette puce nouvelle génération, dotée de 192 cœurs, se démarque par sa capacité de cache cinq fois supérieure à celle de la génération précédente. Cette structure peut réduire le délai de communication entre les cœurs jusqu'à 33 %. Ainsi, une bande passante plus élevée et un traitement des données plus rapide deviennent possibles. Ces fonctionnalités offrent des avantages directs aux systèmes d’IA agentique qui évaluent et exécutent en permanence des processus en plusieurs étapes.
L'infrastructure AWS Graviton prend en charge les objectifs d'IA agentique de Meta
Les processeurs Graviton, construits sur l'infrastructure Nitro System d'AWS, offrent une structure personnalisée en termes de performances et de sécurité. Bien que ce système offre une plus grande efficacité en séparant les composants matériels et logiciels, il prend également en charge des scénarios d'utilisation sans système d'exploitation qui permettent un accès direct au matériel. Malgré cela, la compatibilité avec les services AWS tels qu'Elastic Network Adapter et Amazon EBS est maintenue. Ainsi, Meta peut exécuter ses propres structures de machines virtuelles sans perdre en performances.
De plus, les exemples basés sur Graviton5 offrent la prise en charge d'Elastic Fabric Adapter, ce qui rend possible une communication à faible latence et à bande passante élevée. Cette fonctionnalité est essentielle pour les tâches d’intelligence artificielle à grande échelle qui nécessitent la coordination d’un grand nombre de processeurs. Pour les systèmes Meta qui traitent des milliards d'interactions utilisateur, ces avantages d'infrastructure se reflètent directement dans les performances.
Les déclarations faites par les dirigeants de Meta et d'AWS clarifient également la portée de l'accord. Les cadres supérieurs travaillant du côté d'AWS soulignent que cette collaboration offre une vaste infrastructure qui comprend non seulement du matériel mais également des services de traitement de données et d'inférence. Le front des matières premières, en revanche, souligne que la diversification des sources d’énergie de transformation est devenue une nécessité stratégique. Surtout dans les charges de travail gourmandes en CPU, l'équilibre entre efficacité et performances joue un rôle décisif dans ce choix.
Un autre élément frappant est que Graviton5 a été développé selon un processus de production de 3 nanomètres. Le fait qu'AWS contrôle l'ensemble du processus, de la conception des puces à l'architecture du serveur, offre des avantages en termes de performances globales et d'efficacité énergétique. De cette manière, on obtient une augmentation des performances allant jusqu'à 25 pour cent par rapport à la génération précédente, tandis qu'une structure plus équilibrée est proposée du côté de la consommation d'énergie.
À une époque où le besoin en puissance de traitement pour les applications d’intelligence artificielle augmente, la mise à l’échelle efficace de l’infrastructure devient décisive en termes de coût et de durabilité. L'accent mis par Meta sur les processeurs Graviton souligne l'importance croissante des charges de travail basées sur les processeurs et rend plus visible le rôle des puces spéciales dans ce domaine. Cette approche peut contribuer à fournir des expériences d’intelligence artificielle plus rapides et plus cohérentes sur des plateformes qui servent de larges bases d’utilisateurs.
Pour ne pas rater l'agenda technologique, 📰 ajoutez-le à Google News, 💬 rejoignez notre chaîne WhatsApp, ▶ abonnez-vous à YouTube, 📷 suivez-nous sur Instagram et 𝕏 X.