Course à l'IA : face à Nvidia et Google, Amazon dévoile sa nouvelle puce Trainium 3 et annonce déjà la suivante

AWS a présenté les nouveautés de sa puce IA, qui se veut comme le meilleur rapport prix-performance du marché.

( AFP / RONNY HARTMANN )

La filiale d'Amazon dédiée à l'informatique à distance (cloud), Amazon Web Services (AWS), a dévoilé mardi 2 décembre sa nouvelle puce dédiée au développement et au fonctionnement de l'intelligence artificielle (IA), un processeur présenté comme économique alors que la concurrence s'accélère sur ce marché.

Il s'agit de la Trainium 3, dont les capacités de calcul ont plus que quadruplé (jusqu'à 4,4 fois plus plus) par comparaison avec la génération précédente, mise en production il y a un an seulement. Premier acteur mondial du cloud, AWS a mis au point les premières Trainium en 2020 pour réduire sa dépendance aux grands noms de l'électronique, en premier lieu Nvidia, dont les GPU (graphics processing units), des processeurs dits graphiques, sont les plus prisés pour l'IA.

Les Trainium n'offrent pas un éventail d'utilisations aussi large que les produits proposés par Nvidia, mais présentent des performances comparables dans le contexte de l'IA générative.

En attendant Trainium 4

Le groupe indique ainsi que le coût de développement (entraînement) et d'utilisation (inférence) de grands modèles d'IA générative avec Trainium permet aux clients d'AWS de réduire leurs coûts jusqu'à 50%. La start-up de génération de vidéo IA Decart peut notamment, toujours selon AWS, créer des séquences avec Trainium pour la moitié du prix de revient de l'utilisation de GPU.

L'arrivée de la Trainium 3 constitue une nouvelle illustration du durcissement de la concurrence dans l'univers des puces IA, longtemps dominé sans partage par Nvidia. Outre AWS, Google se renforce également, de son côté, sur ce créneau, avec son propre processeur IA, le Tensor Processing Unit (TPU).

La filiale d'Alphabet a surpris, mi-novembre, en expliquant que Gemini 3, considéré comme l'un des meilleurs assistants IA, avait été développé uniquement sur TPU, sans se servir de processeurs Nvidia. Mardi, lors de la conférence re:Invent, le patron d'AWS Matt Garman, a évalué à plus d'un million le nombre de puces Trainium déjà mises en service. "Nous les vendons aussi vite que nous pouvons les fabriquer", a-t-il assuré. "Trainium représente déjà plusieurs milliards de dollars de chiffre d'affaires et continue à croître rapidement."

Sollicité par l'AFP, un porte-parole a néanmoins précisé que les Trainium n'étaient pas vendues à des tiers, d'autres opérateurs de centres de données par exemple, mais uniquement facturés dans le cadre de l'utilisation du cloud par des clients d'AWS. La Trainium 3 a aussi pour elle, selon AWS, de consommer 40% d'énergie en moins que ses prédécesseurs, à performances équivalentes. Amazon travaille déjà à la Trainium 4, dont il prévoit qu'elle réduise encore ses besoins en énergie de moitié par rapport à la version précédente,