Un bug dans un CPU AMD le fait planter après 1 044 jours

Pierre Dandumont

lundi 05 juin 2023 à 18:00 • 15

Vous ne le savez peut-être pas, mais les CPU ont des bugs. Ils sont généralement documentés par les fabricants — du moins ceux qui vendent leurs CPU, comme Intel ou AMD — et parfois corrigés. Et AMD a un bug particulier dans ses processeurs EPYC 7002 (l'équivalent serveur des Ryzen 3000) : le CPU peut ne plus répondre après 1 044 jours (un peu moins de 3 ans).

Les bugs sont courants

Les CPU contiennent des milliards de transistors et peuvent donc avoir des bugs. Pour les corrections, les fabricants ont trois choix : corriger matériellement le CPU avec une nouvelle révision, corriger de façon logicielle le problème avec du microcode ou ne rien faire. Le bug le plus célèbre est évidemment celui du Pentium, dans les années 90 : l'image d'Intel avait été sérieusement écornée à l'époque et avait remplacé les CPU défectueux par une nouvelle révision. Dans certains cas particuliers, les premiers Pentium pouvaient en effet donner une réponse inadéquate à un type de calcul précis, ce qui est évidemment un problème.

Un Pentium touché par le fameux bug (Konstantin Lanzet, CC BY-SA 3.0)

La correction par microcode, plus courante, consiste à passer par du code intégré dans le firmware (BIOS, UEFI, etc.) qui va prendre en charge les bugs. C'est une solution efficace si le bug est rare et n'arrive que dans des conditions extrêmement précises, étant donné qu'il peut y avoir une perte de performances.

Dans le cas du bug d'AMD, la marque indique que le problème ne va pas être corrigé, car le bug reste assez peu probable : même dans les serveurs, un uptime de pratiquement 3 ans demeure finalement assez rare (mais pas improbable). Qui plus est, un redémarrage reste nécessaire de temps en temps pour appliquer les corrections de bugs par microcode.

Un problème de temps

Maintenant, d'où vient cette valeur de 1 044 jours ? Probablement de la fréquence du CPU et d'un compteur, selon ce message sur Reddit. En effet, en prenant comme base la fréquence du TSC — Time Stamp Counter, le composant qui compte le nombre de cycles — et en supposant qu'il stocke le nombre de cycles dans une variable flottante en double précision, le nombre de jours est proche de la limite de la variable.

Vous n'avez rien compris ? Expliquons. Le compteur de cycle dépend généralement d'une fréquence de base, qui est souvent de 100 MHz dans un CPU moderne. Chaque cent-millionième de seconde, c'est-à-dire toutes les 10 ns, un compteur est incrémenté. Une variable flottante en double précision contient 64 bits, mais avec une structure particulière : 1 bit pour le signe (+ ou -), 11 bits pour l'exposant et 53 bits pour les données. Avec un compteur de ce type, il est donc possible de compter jusqu'à 9 007 199 254 740 989 (2⁵³). Maintenant, prenons ce nombre et faisons le calcul : avec un compteur incrémenté toutes les 10 ns, la valeur maximale est de 1 042 jours et 12 heures environ, un nombre très proche de celui annoncé par AMD. Une fois la valeur dépassée, le compteur repart probablement à 0, ce qui provoque une erreur.

Pourquoi est-ce qu'AMD parle de 1 044 jours et pas 1 042 ? Parce que comme l'explique le document de la marque, la valeur de référence (REFCLK) peut varier légèrement en fonction des cartes mères. Si la fréquence de base attendue est de 100 MHz, elle peut être légèrement plus élevée¹ ou plus faible pour des raisons matérielles et donc induire un léger décalage.

Notons enfin qu'Apple a probablement des bugs de ce type dans ses CPU, mais que la documentation n'est pas publique : ce qui se passe chez Apple reste chez Apple.

C'est une astuce assez courante pour grappiller une première place dans des benchmarks, en fournissant une fréquence un rien plus élevée que celle prévue. ↩︎

MacGeneration

iGeneration

WatchGeneration

Services

Rejoignez le Club iGen

Un bug dans un CPU AMD le fait planter après 1 044 jours

Les bugs sont courants

Un problème de temps

Rejoignez le Club iGen

Actualités

Promo : une batterie chameau de 27650 mAh capable de recharger Mac et iPhone à 114 € (-56 €)

Développeurs : Technotes ajoute des notes de la communauté sur la documentation d’Apple

L’iPhone redécolle en Chine, le Mac cartonne aux États-Unis : Apple souffle un peu avant les trimestriels le 31

Apple a creusé l’idée de proposer des services de cloud computing aux développeurs pour concurrencer AWS

Apple sort des fonds d’écran aux couleurs de son nouvel Apple Store à Osaka

Test du ViewSonic ColorPro VP2788-5K : 27″, 5K et DCI-P3 pour le prix d’un demi-Studio Display

Guerre commerciale : les produits fabriqués au Vietnam voient leur taxe multipliée par cinq

Microsoft Office 2021 pour Mac à 49,99 € : une aubaine à ne pas rater pendant les soldes d’été 📍

L’iPhone 17 Pro Max pourrait avoir une grosse batterie de 5 000 mAh

Une extension Chrome et Firefox désactive le doublage par IA de YouTube

Le générateur de vidéos Veo 3 est désormais disponible en France dans l’application Gemini

Starlink pourrait amener un Wi-Fi plus rapide et plus fiable dans les TGV

Les identifiants d’une quinzaine de futurs Mac en fuite

L'utilitaire pour faire tourner des LLM en local Ollama devient une application native

Apple rejoint discrètement Threads, le dernier réseau social de Meta

NimDoor : des hackers nord-coréens ciblent des entreprises de crypto via le Mac

Image du moment

Tests

Test du ViewSonic ColorPro VP2788-5K : 27″, 5K et DCI-P3 pour le prix d’un demi-Studio Display

Test du BenQ PD2730S : un moniteur 5K de 27" attrayant

Test de l'Eaton 3S Mini : le mini onduleur pour les box internet… qui ne convient pas pour toutes

Test de l'Asustor Flashstor 12 Gen2 : le NAS « full SSD » qui bat des records

Test de la Pro Click V2 Vertical de Razer : une souris verticale qui n’est pas que pour les joueurs

Test de l'Asus PA32UCDM : un écran QD-OLED à 240 Hz pour macOS, est-ce bien utile ?

Les bugs sont courants

Un problème de temps

Rejoignez le Club iGen

Actualités

Promo : une batterie chameau de 27650 mAh capable de recharger Mac et iPhone à 114 € (-56 €)

Développeurs : Technotes ajoute des notes de la communauté sur la documentation d’Apple

L’iPhone redécolle en Chine, le Mac cartonne aux États-Unis : Apple souffle un peu avant les trimestriels le 31

Apple a creusé l’idée de proposer des services de cloud computing aux développeurs pour concurrencer AWS

Apple sort des fonds d’écran aux couleurs de son nouvel Apple Store à Osaka

Test du ViewSonic ColorPro VP2788-5K : 27″, 5K et DCI-P3 pour le prix d’un demi-Studio Display

Guerre commerciale : les produits fabriqués au Vietnam voient leur taxe multipliée par cinq

Microsoft Office 2021 pour Mac à 49,99 € : une aubaine à ne pas rater pendant les soldes d’été 📍

L’iPhone 17 Pro Max pourrait avoir une grosse batterie de 5 000 mAh

Une extension Chrome et Firefox désactive le doublage par IA de YouTube

Le générateur de vidéos Veo 3 est désormais disponible en France dans l’application Gemini

Starlink pourrait amener un Wi-Fi plus rapide et plus fiable dans les TGV

Les identifiants d’une quinzaine de futurs Mac en fuite

L'utilitaire pour faire tourner des LLM en local Ollama devient une application native

Apple rejoint discrètement Threads, le dernier réseau social de Meta

NimDoor : des hackers nord-coréens ciblent des entreprises de crypto via le Mac

Image du moment

Tests

Test du ViewSonic ColorPro VP2788-5K : 27″, 5K et DCI-P3 pour le prix d’un demi-Studio Display

Test du BenQ PD2730S : un moniteur 5K de 27" attrayant

Test de l'Eaton 3S Mini : le mini onduleur pour les box internet… qui ne convient pas pour toutes

Test de l'Asustor Flashstor 12 Gen2 : le NAS « full SSD » qui bat des records

Test de la Pro Click V2 Vertical de Razer : une souris verticale qui n’est pas que pour les joueurs

Test de l'Asus PA32UCDM : un écran QD-OLED à 240 Hz pour macOS, est-ce bien utile ?

Microsoft Office 2021 pour Mac à 49,99 € : une aubaine à ne pas rater pendant les soldes d’été 📍