Ouvrir le menu principal

MacGeneration

Recherche

Doom, Mario, Civilization : les IA génératives peuvent-elles terminer des jeux des années 90 ?

Félix Cattafesta

vendredi 18 avril 2025 à 17:30 • 13

Ailleurs

Cela fait plusieurs mois que des petits malins s’amusent à essayer de faire jouer les IA génératives à des jeux vidéo : la chaîne Twitch Claude Plays Pokemon montre par exemple le modèle d’Anthropic tentant de venir à bout de Pokémon Rouge grâce à ses capacités de vision par ordinateur. Le chercheur Alex Zhang va plus loin et a créé VideoGameBench, un benchmark qui cherche à voir si les modèles d’IA peuvent terminer une vingtaine de jeux vidéo tournant en temps réel. Le test repose sur des titres des années 90 aux genres variés.

4 modèles d’IA jouant à Doom

Alex Zhang note que, si les LLM peuvent effectuer certaines actions complexes, ils sont bien en peine de venir à bout de jeux vidéo demandant de raisonner à court et à long terme, en plus de faire preuve d’intuition et de compréhension de l'espace. Son benchmark fournit l’essentiel à l’IA, à savoir l’image du jeu, une « manette » virtuelle et une indication claire si un jeu est terminé. Les titres présentés sont principalement des jeux Game Boy ou MS-DOS pour la bonne raison que les repères visuels sont plus simples que ceux des jeux plus récents, et car ils requièrent de faire appel à une manette comme à une souris, ce qui pose des défis variés.

Les genres sont multiples, avec de la plateforme (Super Mario Land) ou des titres plus calmes comme Pokémon Crystal ou Civilization 1. Certains jeux nerveux tels Doom ou Quake sont au programme, pour lesquels Alex Zhang a dû ruser : ceux-là se mettent automatiquement en pause lorsque le LLM « réfléchit », ce qui lui évite de se faire tuer directement par un ennemi lui tirant dessus.

VideoGameBench en action

Quelle observation tirer de tout cela ? Eh bien que les modèles d’IA doués de vision sont bien loin de pouvoir terminer un jeu complet, et qu’ils peinent globalement à arriver au bout du premier niveau de chaque titre. Les IA prennent entre 3 et 5 secondes pour effectuer une action, ce qui est bien trop lent pour certains jeux comme Mario où les premiers ennemis arrivent déjà plutôt lentement.

L’expérience met en lumière certaines difficultés des modèles, ayant parfois du mal à interpréter ce qu’ils « voient ». La vidéo ci-dessous montre Claude en train de gaspiller ses balles sur un ennemi… déjà à terre, ce qui l’empêche d’aller bien loin. L’IA a aussi du mal à être précise avec un combo clavier/souris, ce qui est capital dans des jeux comme Civilization ou Warcraft. Enfin, les modèles ne comprennent pas certaines mécaniques des jeux peu intuitives, qu’ils sont incapables de deviner sur le tas (par exemple les techniques pour battre un boss).

Alex Zhang n’indique pas quel modèle commercial est le plus efficace, mais explique que GPT-4o, Claude Sonnet 3.7, Gemini 2.5 Pro et Gemini 2.0 Flash sont incapables de venir à bout du premier niveau de Doom. Le projet est disponible gratuitement sur GitHub si vous voulez l’essayer en local.

Soutenez MacGeneration sur Tipeee

MacGeneration a besoin de vous

Vous pouvez nous aider en vous abonnant ou en nous laissant un pourboire

Soutenez MacGeneration sur Tipeee

iPhone Air (805 €), iPad A16 (324 €) et iPad Air M3 (464 €) : les meilleures offres du jour

16/11/2025 à 21:01

• 42


Pour les retardataires : le magazine des 25 ans de MacG et son mug sont à nouveau en vente !

16/11/2025 à 19:44

• 66


Sécurité : pourquoi un antivirus ou un VPN ne suffit plus en 2025 📍

16/11/2025 à 19:30

• 0


Le futur de l’iPhone, la mort du Mac Pro et l’iPod reste au musée : la semaine Apple

16/11/2025 à 19:00

• 53


Même sous Windows 11, la puce M5 d'Apple montre sa puissance et met à l'amende les meilleures puces x86

16/11/2025 à 08:00

• 29


Tim Cook pourrait quitter Apple dès 2026 !

15/11/2025 à 11:07

• 227


Apple TV trouve un nouveau canal de diffusion : la porte du frigo

15/11/2025 à 11:00

• 41


Les nouveautés de Photos sur macOS Tahoe : une interface renouvelée, des outils inchangés

15/11/2025 à 10:00

• 16


Sortie de veille : cinq ans plus tard, un bilan parfait pour les Mac Apple Silicon ?

15/11/2025 à 08:00

• 32


Design, support lombaire et prix choc : Doro C300 de Sihoo, la chaise ergonomique à ne pas manquer ce Black Friday 📍

14/11/2025 à 22:58

• 0


Les petits colis seront soumis aux droits de douane dès 2026

14/11/2025 à 20:30

• 131


Black Friday : le pack de deux caméras euFyCam 2C compatibles HomeKit de retour à 100 €

14/11/2025 à 18:38

• 14


L’iPhone Pocket est maintenant en vente à partir de 159 €, mais il n’y en aura pas pour tout le monde 🆕

14/11/2025 à 18:38

• 130


Striiiipes transforme le logo de l’app Cartes en porte-cartes en cuir

14/11/2025 à 16:37

• 23


Astuce macOS 26 : supprimer l’icône des apps des services cloud dans la barre latérale du Finder

14/11/2025 à 16:21

• 12


Prizmo Remix, le Raccourcis des scanners qui automatise le traitement des scans

14/11/2025 à 15:22

• 6