Ouvrir le menu principal

MacGeneration

Recherche

OpenAI et Anthropic se sont testés l’un et l’autre cet été, pour améliorer la sécurité

Greg Onizuka

mercredi 27 août 2025 à 20:15 • 13

Intelligence artificielle

Les modèles de LLM deviennent au fil du temps de plus en plus complexes. Tellement complexes au final que les valider en interne devient de plus en plus difficile. Dans l’optique d’améliorer les performances de leurs modèles, en diminuant les risques d’hallucination et en vérifiant que les sécurités en place sont efficaces, OpenAI et Anthropic ont fait un mouvement rarement vu entre deux gros concurrents : ils ont fait des tests croisés entre leurs IA.

Claude et ChatGPT se sont visités l’un et l’autre, pour tester leurs capacités et sécurités. Image Anthropic.

C’est par un post de blog commun sur leurs sites respectifs qu’OpenAI et Anthropic ont annoncé leur collaboration estivale, chacun testant les capacités des modèles publics de l’autre afin d’estimer les failles restantes à corriger, et la solidité des IA.

Éléments trouvés par OpenAI et Anthropic

OpenAI a fait un résumé par catégories des éléments trouvés durant leurs tests chez leur concurrent principal :

  • Claude 4 excellent pour respecter la hiérarchie des consignes, surpassant GPT o3 sur la résistance aux conflits entre instructions du système et de l’utilisateur.
  • GPT o3 et Claude sont très robustes face aux tentatives de contourner les verrous système, même si Claude 4 sera plus facilement influençable que son concurrent d’OpenAI.
  • Dans 70 % des cas, Claude refuse de donner une réponse quand il a un doute. ChatGPT répond bien plus facilement, mais fait monter le taux d’hallucination par la même occasion.
  • Les IA ayant une structure explicite de raisonnement comme o3 sont plus performants et leurs sécurités plus robustes que les autres.
  • Aucun des modèles testés n’est infaillible. Que ce soit par une action volontaire de l’opérateur ou non, toutes les IA testées ont échoué à un moment ou un autre que ce soit au niveau précision de la réponse ou respect des garde-fous.
  • L’usage de scénarios originaux, comme la flatterie de l’IA, ou le placement de l’opérateur en tant que lanceur d’alerte, ont permis plus facilement de tromper les garde-fous de ChatGPT ou de Claude.

Que ce soit chez Anthropic comme chez OpenAI, les tests croisés ont apporté des conclusions et idées intéressantes, et montrent que la collaboration entre concurrents pour ce genre de contrôles des intelligences artificielles peut faire avancer la recherche et la sécurité de celles-ci. Au bout d’un moment, elle pourrait même s’avérer indispensable, tant les modèles deviennent complexes.

Stellantis prépare une voiture électrique beaucoup moins chère à l’horizon 2028

12:33

• 31


LG prépare un écran 1 000 Hz, parce que 120 Hz c’est déjà le passé

12:15

• 15


30 ans plus tard, Windows CE tourne sur Nintendo 64

10:51

• 3


Plus de 47 millions de dollars de produits Apple achetés grâce à des cartes cadeaux détournées

09:53

• 10


Faut-il espérer de nouveaux Mac à la WWDC ?

07:26

• 18


iPhone : Apple chercherait la formule magique pour ressusciter le titane

07:25

• 12


Scrapbook Pixixel : quand le vibe coding ressuscite le regretté iView MediaPro

06:45

• 15


L’Apple Watch Ultra 4 viserait une détection plus poussée de l’hypertension

05:59

• 30


Elon Musk perd sa bataille judiciaire contre OpenAI

18/05/2026 à 21:22

• 36


Apple donne rendez-vous le 8 juin pour le keynote de la WWDC 2026

18/05/2026 à 19:41

• 15


Avez-vous adopté un nouveau navigateur axé sur l’IA ?

18/05/2026 à 18:10

• 51


Orange se prépare à commercialiser un répéteur Wi-Fi 7 pour ses clients français

18/05/2026 à 15:24

• 6


Aerial 4.0 anime le bureau du Mac avec ses propres vidéos et des flux en direct

18/05/2026 à 15:16

• 17


Hovercraft, une app macOS pour présenter ses PDF en les contrôlant du bout des doigts

18/05/2026 à 13:01

• 6


OpenAI active la bibliothèque de fichiers de ChatGPT en Europe

18/05/2026 à 11:50

• 5


L'IA de plus en plus utilisée pour les arnaques sur les sites de vente d'occasion comme leboncoin ou Vinted

18/05/2026 à 11:40

• 55