Moins glamour que le rachat d’un designer célèbre et de son entreprise, mais pas dénué d’intérêt pour autant : Anthropic présente la nouvelle génération de son intelligence artificielle, Claude 4, en deux parfums : Claude Opus 4 et Claude Sonnet 4.

Alors que la firme était déjà plutôt avancée par rapport aux autres IA dans le domaine du code (et Apple semble ne pas s’y être trompée en intégrant Claude à une version interne de Xcode), Anthropic enfonce le clou avec Opus 4 : elle affiche un score de 72,5 % sur SWE-Bench et 43,2 % sur Terminal-Bench quand son concurrent le plus proche, OpenAI o3, finit respectivement à 69,1 % et 30,2 %.
La version plus « légère », Sonnet 4, réussit 72,7 % sur le SWE-Bench et 35,5 % sur le Terminal-Bench, envoyant paître GPT-4.1 avec ses 54,6 % et 30,3 %. Mais dans les faits, quels avantages pratiques ?
Selon Anthropic, Opus 4 « excelle dans la résolution de défis complexes que d’autres modèles ne peuvent pas traiter », pouvant rester autonome pendant plusieurs heures sur des formules de haut vol sans intervention humaine, Rakuten l’ayant par exemple fait travailler sept heures d’affilée sur une tâche de refactorisation à agent unique. Anthropic annonce aussi avoir réduit de 65 % les comportements amenant à des raccourcis ou échappatoires par rapport à Sonnet 3.7.
La firme lance à côté de ces deux nouvelles versions Claude Code, un assistant de développement disponible pour tous. Il s’intègre avec JetBrains, VS Code et GitHub Actions, GitHub ayant même annoncé son intention de baser Copilot sur Sonnet 4.
Opus 4 et Sonnet 4 sont tous les deux disponibles via l’API d’Anthropic, mais aussi Amazon Bedrock ou Google Vertex AI, pour les versions payantes. Seul Sonnet 4 est accessible gratuitement.