OpenAI et Anthropic se sont testés l’un et l’autre cet été, pour améliorer la sécurité

Greg Onizuka

mercredi 27 août 2025 à 20:15 • 13

Les modèles de LLM deviennent au fil du temps de plus en plus complexes. Tellement complexes au final que les valider en interne devient de plus en plus difficile. Dans l’optique d’améliorer les performances de leurs modèles, en diminuant les risques d’hallucination et en vérifiant que les sécurités en place sont efficaces, OpenAI et Anthropic ont fait un mouvement rarement vu entre deux gros concurrents : ils ont fait des tests croisés entre leurs IA.

Claude et ChatGPT se sont visités l’un et l’autre, pour tester leurs capacités et sécurités. Image Anthropic.

C’est par un post de blog commun sur leurs sites respectifs qu’OpenAI et Anthropic ont annoncé leur collaboration estivale, chacun testant les capacités des modèles publics de l’autre afin d’estimer les failles restantes à corriger, et la solidité des IA.

Éléments trouvés par OpenAI et Anthropic

OpenAI a fait un résumé par catégories des éléments trouvés durant leurs tests chez leur concurrent principal :

Claude 4 excellent pour respecter la hiérarchie des consignes, surpassant GPT o3 sur la résistance aux conflits entre instructions du système et de l’utilisateur.
GPT o3 et Claude sont très robustes face aux tentatives de contourner les verrous système, même si Claude 4 sera plus facilement influençable que son concurrent d’OpenAI.
Dans 70 % des cas, Claude refuse de donner une réponse quand il a un doute. ChatGPT répond bien plus facilement, mais fait monter le taux d’hallucination par la même occasion.
Les IA ayant une structure explicite de raisonnement comme o3 sont plus performants et leurs sécurités plus robustes que les autres.
Aucun des modèles testés n’est infaillible. Que ce soit par une action volontaire de l’opérateur ou non, toutes les IA testées ont échoué à un moment ou un autre que ce soit au niveau précision de la réponse ou respect des garde-fous.
L’usage de scénarios originaux, comme la flatterie de l’IA, ou le placement de l’opérateur en tant que lanceur d’alerte, ont permis plus facilement de tromper les garde-fous de ChatGPT ou de Claude.

Que ce soit chez Anthropic comme chez OpenAI, les tests croisés ont apporté des conclusions et idées intéressantes, et montrent que la collaboration entre concurrents pour ce genre de contrôles des intelligences artificielles peut faire avancer la recherche et la sécurité de celles-ci. Au bout d’un moment, elle pourrait même s’avérer indispensable, tant les modèles deviennent complexes.

Soutenez MacGeneration sur Tipeee

MacGeneration

iGeneration

WatchGeneration

Services

Rejoignez le Club iGen

OpenAI et Anthropic se sont testés l’un et l’autre cet été, pour améliorer la sécurité

Éléments trouvés par OpenAI et Anthropic

MacGeneration a besoin de vous

Actualités

Seagate a des disques durs de 69 To dans ses laboratoires

Black Friday : notre récap des meilleures offres (AirPods, Hue, MacBook…) 🆕

Black Friday : les meilleures promotions sur les produits Apple

UPDF Black Friday : jusqu’à –50 % de réduction — un éditeur PDF puissant, dopé à l’IA (Ajoysoft inclus)

Le résolveur DNS européen dns0.eu a fermé sans prévenir il y a un mois

Vous avez un Mac ? L'offre CyberGhost à −83 % + 4 mois offerts s'envole pour le Black Friday 📍

De belles réductions sur la souris MX Master 4 et sur un pack avec le clavier MX Keys : la souris presque gratuite

Black Friday : le Mac mini M4 à partir de 589 €

Black Friday Fnac : le MacBook Air M4 à 899 € (+80 € en chèques-cadeaux) et jusqu'à 240 € offerts sur l'iPhone 17 Pro Max 🆕

Jusqu'à - 50 % chez ShopSystem : les coques iPhone les plus fines au monde ! 📍

Black Friday iPad : l'iPad A16 à 310 €, l'iPad Air à 475 €, l'iPad Pro M5 11" à 860 € et le M4 13" à 1 049 € 🆕

Apple Podcasts s’ouvrirait parfois sans prévenir pour montrer des programmes « étranges »

Black Friday : le MacBook Air M4 16 Go bradé à 874 €, le modèle M2 à 773 €

Black Friday : 10 € en bon d’achat Amazon pour une carte cadeau Apple d’au moins 100 €

Réduction rare sur le Magic Keyboard USB-C Touch ID avec pavé numérique 🆕

Apple Store : des cartes cadeaux, mais pas de réduction sur les prix des produits Apple

Image du moment

Tests

Test d'un adaptateur USB-C vers Ethernet à 10 Gb/s : des compromis pour un petit prix

Test du Philips Brilliance 27E3U7903 : un bon moniteur 5K à la webcam décevante

Test du SSD externe Transcend ESD420 : il colle parfaitement à l’iPhone, un peu moins au Mac

Test du MacBook Pro M5 : ennuyeux mais terriblement efficace

Test des S3XY Buttons pour les Tesla : 260 € pour en économiser 3 800

Test du Slim Solar+ K980 de Logitech : un clavier solaire sans port USB-C, est-ce une bonne idée ?