L'essor des IA pourrait créer une nouvelle pénurie de GPU

Pierre Dandumont

mardi 14 février 2023 à 12:30 • 101

Depuis quelques années, le marché des cartes graphiques a un problème de pénurie. Les raisons sont multiples et vont de l'essor des cryptomonnaies à une demande en forte hausse à cause des différents confinements ou de la sortie de consoles… et ce n'est pas fini. En effet, la montée en force des IA amène une demande assez élevée sur ce marché.

Un entraînement coûteux, un déploiement qui l'est encore plus

Un article de Forbes s'intéresse en effet aux coûts de ces technologies, et il est astronomique. La création des données employées par ChatGPT (l'entraînement) aurait nécessité environ 10 000 cartes graphiques Nvidia, un volume déjà conséquent. Mais une estimation sur le nombre de GPU exigé pour fournir les réponses aux utilisateurs donne le tournis : si Google devait recourir à des GPU pour répondre aux requêtes via l'IA, il faudrait un peu plus de 4 000 000¹ de cartes graphiques A100, qui se négocient aux alentours de 20 000 € (dès 15 000 € pour la version 40 Go, si le cœur vous en dit). Le total dépasserait les 100 milliards de dollars, dont une bonne partie retomberait dans les poches de Nvidia.

Les NPU ne règlent pas les choses

L'article de Forbes évoque les expérimentations dans le domaine des NPU — Neural Processing Unit, les puces dédiées aux calculs liés à l'IA — comme celles présentes dans les iPhone depuis quelques années. Sur le papier, le développement des NPU permet une meilleure efficacité que les GPU car ils sont pensés pour un usage précis. En effet, même les cartes les plus haut de gamme de Nvidia ne réservent qu'une partie des transistors à cet usage et gardent des fonctions liées aux calculs classiques. Mais en pratique, les cartes graphiques conservent l'avantage d'une puissance élevée — une puce Nvidia A100 atteint 624 TOPs contre 17 pour un A16 — et la généralisation des TPU risque d'amener le même problème de pénurie.

Une « carte graphique » A100, qui n'a même pas de sortie vidéo.

De fait, les pénuries de composants ne sont pas attachées au type de produits directement, mais plutôt aux capacités de production. Pour un volume identique chez les grands fondeurs², fabriquer des GPU ou des NPU ne change pas réellement la donne. Si une partie de l'offre part vers les NPU plutôt que les GPU ou si une partie des GPU part vers les serveurs, le résultat est à peu près le même sur le marché : il y a moins de cartes graphiques dans les étals.

La question principale, à laquelle il est difficile de répondre, vient de la manière dont les grands noms du secteur vont déployer les technologies. Selon SemiAnalysis, Google a par exemple utilisé des modèles moins étendus pour Bard, probablement pour réduire les coûts.

512 820 serveurs, 4 102 568 cartes. ↩︎
Essentiellement TSMC actuellement. ↩︎

MacGeneration

iGeneration

WatchGeneration

Services

Rejoignez le Club iGen

L'essor des IA pourrait créer une nouvelle pénurie de GPU

Un entraînement coûteux, un déploiement qui l'est encore plus

Les NPU ne règlent pas les choses

Rejoignez le Club iGen

Actualités

Amazon divise par deux l’abonnement Prime pour les étudiants

Vous n'aimez pas Liquid Glass ? Un hack permet de s'en débarrasser sous macOS Tahoe

Arnaques par SMS : les arnaques explosent en 2025, nos conseils pour s’en protéger 📍

Pas d'écran pour les enfants de moins de 3 ans

Le Prime Day d'Amazon durera 4 jours du 8 au 11 juillet

Dia : le successeur d'Arc mise tout sur l'IA

Nouveautés d’iOS 26, macOS Tahoe, Liquid Glass… Tous nos articles pour tout savoir sur la WWDC 2025

Les activités en direct dans macOS 26 ne demandent pas iOS 26 et pourraient fonctionner en Europe

Découverte de Téléphone dans iOS 26 : nouvelle interface, appels inconnus, portages sur l’iPad et le Mac

France Identité : l’intégration de la carte grise disponible en bêta

La publicité s’infiltre finalement dans WhatsApp

Comme promis, Apple sort de nouvelles bêtas… pour iOS 18.6 et macOS 15.6

Bug amusant ou blague non assumée ? Une mise à jour de Windows 11 ressuscite le son de démarrage de Vista

Un triple écran 15,6 pouces, qui promet l'équivalent de 43 pouces en 48:9

Shadow, le PC dans le cloud, fait évoluer ses offres avec une pseudo RTX 4060

Le PCI-Express 7.0 (256 Go/s) arrive alors que le PCIe 6.0 ne va pas se démocratiser avant 2030

Image du moment

Tests

Test du BenQ PD2730S : un moniteur 5K de 27" attrayant

Test de l'Eaton 3S Mini : le mini onduleur pour les box internet… qui ne convient pas pour toutes

Test de l'Asustor Flashstor 12 Gen2 : le NAS « full SSD » qui bat des records

Test de la Pro Click V2 Vertical de Razer : une souris verticale qui n’est pas que pour les joueurs

Test de l'Asus PA32UCDM : un écran QD-OLED à 240 Hz pour macOS, est-ce bien utile ?

Test de l'antenne Starlink mini, parfaite pour ceux qui aiment voyager