Les spécialistes de l’IA se rendent coup pour coup. Au lendemain du lancement de l’application Mac de Gemini, les trois principaux concurrents de Google ont chacun lancé des nouveautés significatives.
Codex se fortifie
Seulement deux mois et demi après son lancement, OpenAI renforce sensiblement Codex. Cette application déjà utilisée par plus de 3 millions de développeurs pour accélérer la création d’applications gagne des nouveautés qui vont au-delà de l’écriture du code.
Codex peut désormais utiliser toutes les applications de l’ordinateur comme le ferait l’utilisateur lui-même, en visualisant l’interface puis en cliquant sur les boutons. Cela permet par exemple de déléguer à l’IA le test d’une interface utilisateur. Plusieurs agents peuvent fonctionner simultanément sur le Mac sans interférer avec le reste du système. C’est une réponse directe aux dernières évolutions de Claude, qui peut également interagir largement avec macOS.
De plus, pour les développeurs web, Codex intègre maintenant un navigateur permettant de commenter directement les pages afin de fournir des instructions précises à l’agent. En cliquant sur une image, on pourra par exemple demander à ce qu’elle soit remplacée par une autre créée directement par l’IA. C’est une autre nouveauté de cette mise à jour significative : l'application peut maintenant utiliser le modèle gpt-image-1.5 pour générer des images de toutes sortes.
Par ailleurs, OpenAI propose 90 extensions supplémentaires (elles rassemblent des skills, des intégrations et des serveurs MCP) pour exploiter efficacement des applications et services tiers. Parmi les autres améliorations, on note l’introduction d’une fonction de mémoire qui retient les préférences et les corrections, afin d’améliorer la rapidité et la qualité des tâches futures sans nécessiter de réglages complexes.
Toutes ces nouveautés sont dès à présent disponibles, à l’exception de la mémoire et de l'utilisation de l'ordinateur qui arriveront un peu plus tard dans l’Union européenne et au Royaume-Uni.
Anthropic améliore son modèle phare
Quasiment dans le même temps, Anthropic a sorti une nouvelle version de son modèle le plus avancé, celui qui est notamment destiné au codage agentique. Claude Opus 4.7 représenterait « une amélioration notable » par rapport à Opus 4.6 pour les tâches d’ingénierie logicielle, un domaine dans lequel l’entreprise brillait déjà.
Grâce à l’IA, Spotify fait coder ses ingénieurs sur le trajet du bureau
Le nouveau modèle serait suffisamment fiable pour gérer sans supervision des tâches de programmation complexes et longues, en respectant les consignes et en vérifiant ses résultats avant de les livrer. Les développeurs n’ont plus qu’à se tourner les pouces… et dépenser encore plus de sous chez Anthropic.
Opus 4.7 utilise en effet un nouveau tokenizer (l’outil qui transforme le contenu en tokens, l’unité de base manipulée par les modèles d’IA) qui peut être moins avantageux pour les utilisateurs. À entrée équivalente, il peut générer jusqu’à 35 % de tokens supplémentaires. Résultat, son utilisation peut revenir plus cher ou faire atteindre plus rapidement la limite d’un abonnement. Or, les plafonds de Claude sont déjà très bas.
De ChatGPT Plus à Claude Pro : l’herbe est-elle vraiment plus orange ailleurs ?
Perplexity déploie son Personal Computer
Enfin, annoncé en mars, le Personal Computer de Perplexity commence à être déployé pour les abonnés Perplexity Max (abonnement à 176 €/mois). Surfant sur la vague OpenClaw, il s’agit d’un agent IA personnel qui tourne en local et qui est censé faciliter la vie, quand il ne la complique pas en hallucinant.

Perplexity donne comme exemples assez basiques le rangement automatique du dossier Téléchargements de son Mac ou bien la comparaison de fichiers locaux avec une page web. À condition d’avoir suffisamment confiance dans le système pour lui donner complètement les rênes de son ordinateur, on peut aussi lui déléguer des tâches plus compliquées et plus sensibles qui impliquent plusieurs apps.











