Ouvrir le menu principal

MacGeneration

Recherche

OpenAI et Anthropic se sont testés l’un et l’autre cet été, pour améliorer la sécurité

Greg Onizuka

mercredi 27 août 2025 à 20:15 • 13

Intelligence artificielle

Les modèles de LLM deviennent au fil du temps de plus en plus complexes. Tellement complexes au final que les valider en interne devient de plus en plus difficile. Dans l’optique d’améliorer les performances de leurs modèles, en diminuant les risques d’hallucination et en vérifiant que les sécurités en place sont efficaces, OpenAI et Anthropic ont fait un mouvement rarement vu entre deux gros concurrents : ils ont fait des tests croisés entre leurs IA.

Claude et ChatGPT se sont visités l’un et l’autre, pour tester leurs capacités et sécurités. Image Anthropic.

C’est par un post de blog commun sur leurs sites respectifs qu’OpenAI et Anthropic ont annoncé leur collaboration estivale, chacun testant les capacités des modèles publics de l’autre afin d’estimer les failles restantes à corriger, et la solidité des IA.

Éléments trouvés par OpenAI et Anthropic

OpenAI a fait un résumé par catégories des éléments trouvés durant leurs tests chez leur concurrent principal :

  • Claude 4 excellent pour respecter la hiérarchie des consignes, surpassant GPT o3 sur la résistance aux conflits entre instructions du système et de l’utilisateur.
  • GPT o3 et Claude sont très robustes face aux tentatives de contourner les verrous système, même si Claude 4 sera plus facilement influençable que son concurrent d’OpenAI.
  • Dans 70 % des cas, Claude refuse de donner une réponse quand il a un doute. ChatGPT répond bien plus facilement, mais fait monter le taux d’hallucination par la même occasion.
  • Les IA ayant une structure explicite de raisonnement comme o3 sont plus performants et leurs sécurités plus robustes que les autres.
  • Aucun des modèles testés n’est infaillible. Que ce soit par une action volontaire de l’opérateur ou non, toutes les IA testées ont échoué à un moment ou un autre que ce soit au niveau précision de la réponse ou respect des garde-fous.
  • L’usage de scénarios originaux, comme la flatterie de l’IA, ou le placement de l’opérateur en tant que lanceur d’alerte, ont permis plus facilement de tromper les garde-fous de ChatGPT ou de Claude.

Que ce soit chez Anthropic comme chez OpenAI, les tests croisés ont apporté des conclusions et idées intéressantes, et montrent que la collaboration entre concurrents pour ce genre de contrôles des intelligences artificielles peut faire avancer la recherche et la sécurité de celles-ci. Au bout d’un moment, elle pourrait même s’avérer indispensable, tant les modèles deviennent complexes.

illustration ulule

Pour les 50 ans d’Apple, MacGeneration publie un livre événement

Précommandez-le dès maintenant et profitez-en pour découvrir nos nouveaux goodies, ou prolonger votre abonnement au Club iGen à tarif réduit.

Découvrez nos offres

Précommandez le livre et rejoignez la fête

Un livre pour raconter 50 ans d'Apple, une journée à Lyon pour les célébrer ensemble.

Participez sur Ulule

macOS 26.4 : les nouvelles alertes sur la fin de Rosetta peuvent être désactivées

10:13

• 0


L’Apple Watch Series 12 s’annonce-t-elle déjà ennuyeuse ?

08:57

• 20


iPhone Fold : un lancement en deux temps comme au temps de l’iPhone X ?

08:57

• 11


700 $ d’économie : Apple supprime l’article le moins raisonnable de son catalogue

07:05

• 14


50 ans d’Apple : J-7 pour commander notre livre (et gagner un MacBook Neo pas comme les autres)

26/03/2026 à 23:55

• 32


Apple enterre le Mac Pro sans fleurs ni couronnes, après 20 ans de carrière

26/03/2026 à 23:07

• 49


Apple sort le carnet de chèques pour garder ses ingénieurs iPhone

26/03/2026 à 22:10

• 11


Test de l'Apple Studio Display XDR : un concentré de technologies, mais pour qui ?

26/03/2026 à 20:30

• 26


Le MacBook Neo a moins de capteurs : il ne mesure pas l'angle de l'écran et ne pèse pas avec son trackpad

26/03/2026 à 18:55

• 43


Des MacBook Air M1 256 Go à partir de 357 €

26/03/2026 à 17:40

• 0


Samsung n'abandonne pas encore les SSD SATA et lance même un modèle 870 EVO de 8 To

26/03/2026 à 17:05

• 21


25 ans de Mac OS X : de 10.3 à 10.6, le temps de mûrir, pour mieux enterrer le PowerPC

26/03/2026 à 16:49

• 24


Trop risqué et trop coûteux : le mode coquin de ChatGPT mis en pause « indéfiniment »

26/03/2026 à 15:53

• 32


Free promet une « nouvelle révolution mobile » le 31 mars

26/03/2026 à 15:31

• 63


Pourquoi les lunettes connectées ne détrôneront sans doute pas le smartphone

26/03/2026 à 12:18

• 30


Safari 26.4 apporte de nombreuses nouveautés aux créateurs de sites web

26/03/2026 à 11:47

• 16