L'essor des IA pourrait créer une nouvelle pénurie de GPU

Pierre Dandumont

mardi 14 février 2023 à 12:30 • 101

Depuis quelques années, le marché des cartes graphiques a un problème de pénurie. Les raisons sont multiples et vont de l'essor des cryptomonnaies à une demande en forte hausse à cause des différents confinements ou de la sortie de consoles… et ce n'est pas fini. En effet, la montée en force des IA amène une demande assez élevée sur ce marché.

Un entraînement coûteux, un déploiement qui l'est encore plus

Un article de Forbes s'intéresse en effet aux coûts de ces technologies, et il est astronomique. La création des données employées par ChatGPT (l'entraînement) aurait nécessité environ 10 000 cartes graphiques Nvidia, un volume déjà conséquent. Mais une estimation sur le nombre de GPU exigé pour fournir les réponses aux utilisateurs donne le tournis : si Google devait recourir à des GPU pour répondre aux requêtes via l'IA, il faudrait un peu plus de 4 000 000¹ de cartes graphiques A100, qui se négocient aux alentours de 20 000 € (dès 15 000 € pour la version 40 Go, si le cœur vous en dit). Le total dépasserait les 100 milliards de dollars, dont une bonne partie retomberait dans les poches de Nvidia.

Les NPU ne règlent pas les choses

L'article de Forbes évoque les expérimentations dans le domaine des NPU — Neural Processing Unit, les puces dédiées aux calculs liés à l'IA — comme celles présentes dans les iPhone depuis quelques années. Sur le papier, le développement des NPU permet une meilleure efficacité que les GPU car ils sont pensés pour un usage précis. En effet, même les cartes les plus haut de gamme de Nvidia ne réservent qu'une partie des transistors à cet usage et gardent des fonctions liées aux calculs classiques. Mais en pratique, les cartes graphiques conservent l'avantage d'une puissance élevée — une puce Nvidia A100 atteint 624 TOPs contre 17 pour un A16 — et la généralisation des TPU risque d'amener le même problème de pénurie.

Une « carte graphique » A100, qui n'a même pas de sortie vidéo.

De fait, les pénuries de composants ne sont pas attachées au type de produits directement, mais plutôt aux capacités de production. Pour un volume identique chez les grands fondeurs², fabriquer des GPU ou des NPU ne change pas réellement la donne. Si une partie de l'offre part vers les NPU plutôt que les GPU ou si une partie des GPU part vers les serveurs, le résultat est à peu près le même sur le marché : il y a moins de cartes graphiques dans les étals.

La question principale, à laquelle il est difficile de répondre, vient de la manière dont les grands noms du secteur vont déployer les technologies. Selon SemiAnalysis, Google a par exemple utilisé des modèles moins étendus pour Bard, probablement pour réduire les coûts.

512 820 serveurs, 4 102 568 cartes. ↩︎
Essentiellement TSMC actuellement. ↩︎

Soutenez MacGeneration sur Tipeee

MacGeneration

iGeneration

WatchGeneration

Services

Rejoignez le Club iGen

L'essor des IA pourrait créer une nouvelle pénurie de GPU

Un entraînement coûteux, un déploiement qui l'est encore plus

Les NPU ne règlent pas les choses

MacGeneration a besoin de vous

Actualités

Coup d’œil sur le X40 Turbo de Kuxiu: une station de charge Qi2.2 compacte

VideoProc Converter AI : un outil IA tout-en-un et accessible pour traiter vos vidéos et images (- 61 %) 📍

Sortie de veille : Tim Cook, stop ou encore ?

De nombreux tapis de bureau en promotion, pour tous les goûts, même ceux qui aiment les lumières RGB

« Far West » des réseaux sociaux selon Macron : le constat est là, mais quelles solutions concrètes ?

TeamGroup présente un SSD externe avec bouton d’autodestruction. Si si.

Un boule de nöel connectée avec haut-parleur intégré ! 20 € seulement !

Choisir son écran professionnel : ce qui compte vraiment 📍

Apple fait totalement disparaître Traqués (The Hunt), une série française, de son service Apple TV

OVHcloud : un Summit 2025 sous le signe de l’intelligence artificielle

OpenAI déploie les conversations de groupe avec ChatGPT dans le monde entier 🆕

De nombreux PC Dell et HP privés du codec HEVC, dont la licence est trop onéreuse

Black Friday Mac : CyberGhost en méga promo (−83 % + 4 mois offerts), plus pour longtemps 📍

Empêcher l'app Jeux de se lancer quand vous pressez le bouton Xbox ou PlayStation sur une manette

Fnac : 10 € offerts tous les 100 € d’achat pour les adhérents, y compris sur les produits Apple

Le MacBook Air M2 est à son prix le plus bas sur Amazon, avec 16 Go de RAM 🆕

Image du moment

Tests

Test du Philips Brilliance 27E3U7903 : un bon moniteur 5K à la webcam décevante

Test du SSD externe Transcend ESD420 : il colle parfaitement à l’iPhone, un peu moins au Mac

Test du MacBook Pro M5 : ennuyeux mais terriblement efficace

Test des S3XY Buttons pour les Tesla : 260 € pour en économiser 3 800

Test du Slim Solar+ K980 de Logitech : un clavier solaire sans port USB-C, est-ce une bonne idée ?

Test de la souris MX Master 4 de Logitech : une souris qui nous fait vibrer ?