Anthropic est en pourparlers à un stade précoce avec la startup de semi-conducteurs basée à Londres Fractile au sujet des accélérateurs d'inférence d'IA. Selon des informations basées sur des sources proches du sujet, ce contact pourrait ajouter un nouveau maillon à la chaîne d'approvisionnement en puces que l'entreprise a déjà établie avec Nvidia, Google et Amazon. Cette évolution coïncide avec une période où une pression croissante sur les coûts se fait sentir, notamment dans les infrastructures d’intelligence artificielle.
Les puces développées par Fractile ne devraient pas être prêtes à être utilisées à court terme. Il est indiqué que les produits de la société atteindront leur maturité commerciale vers 2027. Ce calendrier indique un calendrier similaire à celui des travaux axés sur le TPU qu'Anthropic réalise avec Google et Broadcom. Par conséquent, une éventuelle collaboration est évaluée dans le cadre de la stratégie matérielle à long terme de l’entreprise.
Fondée en 2022 par Walter Goodwin, titulaire d'un doctorat à Oxford, Fractile adopte une approche différente des architectures classiques. La conception de puce développée par la société combine des unités de stockage et de traitement de données sur la même puce et utilise la SRAM au lieu de la DRAM. Alors que le transfert de données entre le GPU et la mémoire externe crée un sérieux goulot d'étranglement dans les systèmes traditionnels, Fractile vise à éliminer ce problème. Selon les résultats de simulation partagés précédemment par Goodwin, cette approche peut offrir de sérieux avantages en termes de rapidité et de coût dans l'exécution de grands modèles de langage.
Anthropic vise à réduire les coûts de l'intelligence artificielle grâce à une architecture basée sur SRAM
L'architecture de Fractile réduit la latence en conservant les données nécessaires au calcul directement à côté des unités de traitement. En conséquence, les données sont traitées sur site plutôt que de voyager vers et depuis un module DRAM distinct. Il est indiqué que cette approche peut théoriquement offrir une vitesse jusqu'à 100 fois supérieure et un avantage financier jusqu'à 10 fois supérieur à celui des GPU Nvidia. Cependant, la société n’a pas encore produit de puces de test physique, les performances annoncées n’ont donc pas été vérifiées dans la pratique.
La startup a reçu à ce jour 15 millions de dollars d’investissement de démarrage. Kindred Capital, le Fonds OTAN pour l'innovation et Oxford Science Enterprises ont participé à ce cycle d'investissement. En outre, il semblerait que Fractile serait en pourparlers pour un nouveau cycle d'investissement de 200 millions de dollars avec une valorisation de plus d'un milliard de dollars. Il est indiqué que des investisseurs tels que Founders Fund, 8VC et Accel sont intéressés par ce processus. Il convient également de noter que l'équipe d'ingénierie de la société comprend des personnes issues de Graphcore, Nvidia et Imagination Technologies.
Du côté d’Anthropic, l’approche consistant à réduire la dépendance matérielle se démarque. La société exécute le modèle Claude sur les GPU Nvidia, ainsi que sur les processeurs Trainium d'Amazon et l'infrastructure TPU de Google. Grâce à l'accord annoncé en octobre, l'accès à plus d'un gigawatt de capacité de traitement a été assuré. En avril, il a été annoncé que cette capacité serait portée à 3,5 gigawatts, couvrant la période 2027-2031.
Parallèlement, la croissance financière d'Anthropic affiche également un rythme remarquable. Il est indiqué que le chiffre d'affaires annualisé de l'entreprise a dépassé 30 milliards de dollars en mars, soit une augmentation significative par rapport au niveau d'environ 9 milliards de dollars fin 2025. Malgré cela, les coûts d'extraction élevés continuent de mettre la pression sur la rentabilité. Cela accroît l’intérêt pour des solutions matérielles plus efficaces.
Il existe d'autres startups développant des approches de type Fractile. Des sociétés comme Groq et Cerebras travaillent sur des architectures qui rapprochent la mémoire et les unités de traitement. L'accord d'acquisition de 20 milliards de dollars de Nvidia avec Groq et l'annonce ultérieure de son propre accélérateur axé sur l'inférence montrent l'orientation de la concurrence dans ce domaine. Avec la mise à l’échelle des modèles d’intelligence artificielle, l’équilibre entre performances et coût devient l’un des facteurs déterminants du côté matériel.
Pour ne pas rater l'agenda technologique, 📰 ajoutez-le à Google News, 💬 rejoignez notre chaîne WhatsApp, ▶ abonnez-vous à YouTube, 📷 suivez-nous sur Instagram et 𝕏 X.