Depuis maintenant plusieurs années, Nvidia n’a pas le droit d’exporter toutes les puces qu’elle voudrait en Chine : les plus performantes dans le domaine de l’intelligence artificielle sont sous embargo, les USA interdisant au constructeur de les envoyer dans l’Empire du milieu. Si Donald Trump avait annoncé vouloir renforcer encore plus ces restrictions au début de son mandat, il était revenu sur sa décision après une discussion avec Jensen Huang, le patron de Nvidia. Au final, tout ça pour rien : la Chine a décidé d’interdire elle-même à ses géants de la tech d’utiliser des puces Nvidia.

Alors que le gouvernement américain avait déjà interdit à Nvidia de proposer sa carte pour serveurs la plus puissante destinée à l’IA, la H100, pour la remplacer par une H20 qui n’a que le dixième des performances d’origine, il en a ensuite été de même pour une autre carte dédiée aux professionnels, mais cette fois sur station de travail. En effet, alors que le reste du monde peut bénéficier de la RTX Pro 6000, monstre de puissance possédant plus de 24 000 cœurs CUDA et 96 Go de mémoire GDDR7, la Chine n’a droit qu’à une version limitée, la RTX Pro 6000D. Si les spécifications exactes ne sont pas connues, la bande passante est déjà notoirement différente : la RTX Pro 6000 monte à 1,8 To/s, quand la version 6000D plafonne à 1,1 To/s.

Le gouvernement US voudrait limiter encore plus les exportations de Nvidia en Chine
Malgré tout, Nvidia fait environ 13 % de son chiffre d’affaires mondial en Chine, représentant plusieurs milliards de dollars. Jensen Huang s’était inquiété des volontés de restrictions encore plus fortes du président américain, et avait obtenu en retour l’assurance que les H20 et RTX Pro 6000D bridées pourraient continuer à être proposées en Chine.
Retournement de situation, c’est maintenant la Chine qui ne veut plus de ces puces en invoquant une violation de la « loi anti-monopole » chinoise, comme le rapporte LeMonde. Ainsi, le régulateur de la cybersécurité (SAMR) a interdit aux entreprises technologiques du pays telles Alibaba ou ByteDance d’acheter de nouvelles puces Nvidia.
Pourquoi cette décision ? Et pourquoi maintenant ?
Il semble qu’une partie de l’affaire vienne d’une déclaration fracassante du secrétaire au commerce américain sur CNBC, Howard Lutnick :
Nous ne leur vendons pas nos meilleurs produits, ni nos produits de seconde classe, ni même de la troisième. [...] On veut vendre suffisamment aux Chinois pour que leurs développeurs deviennent accrocs à la technologie américaine.
Le gouvernement chinois aurait très mal pris cette déclaration, et a convoqué les dirigeants locaux de Nvidia pour une question de « graves problèmes de sécurité » : le communiqué faisait état d’un système de géolocalisation intégré dans les puces, ainsi que d’un killswitch permettant de les bloquer à distance, ce que dément Nvidia.
Si ces suspicions, doublées de la déclaration du secrétaire au commerce pouvaient suffire à déclencher l’ire des dirigeants chinois et des représailles à la mesure de l’affront, elles tombent en plus au bon moment : T-Head, filiale d’Alibaba spécialisée dans les semi-conducteurs, a récemment présenté un nouveau processeur spécialisé dans l’IA, affirmant que celui-ci égalait les performances du H20 de Nvidia.
Ce nouveau processeur a été présenté en grandes pompes durant le journal du soir le 16 septembre, en compagnie du premier ministre Li Qiang, dans un data-center de l’opérateur China Unicom.
Cette affaire rappelle fortement l’histoire du bannissement de Huawei : alors que les USA et le reste du monde pensaient mettre tellement de bâtons dans les roues du constructeur qu’il finirait par s’effondrer, notamment en lui barrant l’accès aux Google Services, Huawei a résisté et a fini par proposer pour chaque élément interdit une alternative locale. Plus fort encore, le constructeur propose désormais HarmonyOS, remplaçant totalement Android sur les téléphones vendus en Chine.
En interdisant les puces Nvidia dans le développement de l’IA, la Chine fait d’une pierre deux coups : non seulement elle envoie un message fort aux USA, leur signalant qu’ils n’ont plus besoin de leur aide et ne se satisferont plus de produits de seconde zone, mais en plus le gouvernement chinois incite maintenant fortement ses pépites locales à pousser autant que possible pour égaler, voire dépasser Nvidia et les autres géants de la tech US.
Mise à jour à 23h30 : en plus de la présentation du nouveau processeur proposé par T-Head le 16 septembre, s'ajoute ce soir la conférence de Huawei. En effet, le constructeur chinois a présenté deux grosses nouveautés concernant les fermes à calcul dédiées à l'intelligence artificielle : les SuperPods et les SuperClusters. Les SuperPods sont divisés en deux gammes, les Atlas 950, composés de 8 192 NPU (Neural Processing Unit) Ascend, et les Atlas 960, qui en comportent 15 488. Selon les calculs de Huawei, l'Atlas 950 a 56,8 fois plus de NPU que le système Nvidia NVL144, nouveau né de la marque, et aurait ainsi 6,7 fois plus de puissance de calcul. La marque se compare même aux prochains NVL576 de Nvidia, et annonce d'avance rester en tête.

Ces SuperPods peuvent ensuite être assemblés en SuperClusters, avec l'Atlas 950 SuperCluster, composé de plus de 500 000 NPU Ascend, et l'Atlas 960 SuperCluster, qui en comporte lui plus d'un million. Ce dernier serait capable d'atteindre les 4 ZFLOPS (Zeta-Flops) en calcul FP4, et permettrait à Huawei de développer des modèles d'IA à plus de 1000 milliards de paramètres.
Huawei ne compte pas s'arrêter là, et annonce que chaque année sortira une nouvelle version de ses NPU, indiquant pouvoir doubler la capacité de calcul à chaque génération. La marque compte ainsi rattraper rapidement le retard sur Nvidia, dans un premier temps en multipliant le nombre de NPU, avant d'augmenter drastiquement leur puissance unitaire chaque année.
Décidément très en forme, Huawei a aussi présenté un serveur « généraliste » destiné à remplacer les habituels serveurs d'Oracle ou d'IBM vus dans les grandes entreprises, avec le Taishan 950 SuperPod. Supportant la virtualisation et les process Stark, Huawei indique une amélioration de 30 % dans les calculs en temps réel et une utilisation 20 % plus efficace de la mémoire en environnement virtualisé. Pour augmenter drastiquement ses performances, Huawei a travaillé sur l'interconnexion de chaque élément, en utilisant un nouveau protocole d'interconnexion maison appelé UnifiedBus. Le patron de la marque promet une latence de seulement 2,1 microsecondes, sur une distance maximum de 200 mètres. De quoi faire des clusters toujours plus grands, pour encore plus de performances : « Le protocole UnifiedBus permet à plus de 10 000 NPU de fonctionner comme une seule machine unifiée ».
Entre T-Head et les annonces de Huawei, la Chine montre qu'elle a fait de l'IA et de la souveraineté nationale au niveau des supercalculateurs l'une de ses priorités absolues. La bataille est lancée, et promet d'être âpre et sans merci.