Ouvrir le menu principal

MacGeneration

Recherche

OpenAI et Anthropic se sont testés l’un et l’autre cet été, pour améliorer la sécurité

Greg Onizuka

mercredi 27 août 2025 à 20:15 • 3

Intelligence artificielle

Les modèles de LLM deviennent au fil du temps de plus en plus complexes. Tellement complexes au final que les valider en interne devient de plus en plus difficile. Dans l’optique d’améliorer les performances de leurs modèles, en diminuant les risques d’hallucination et en vérifiant que les sécurités en place sont efficaces, OpenAI et Anthropic ont fait un mouvement rarement vu entre deux gros concurrents : ils ont fait des tests croisés entre leurs IA.

Claude et ChatGPT se sont visités l’un et l’autre, pour tester leurs capacités et sécurités. Image Anthropic.

C’est par un post de blog commun sur leurs sites respectifs qu’OpenAI et Anthropic ont annoncé leur collaboration estivale, chacun testant les capacités des modèles publics de l’autre afin d’estimer les failles restantes à corriger, et la solidité des IA.

Éléments trouvés par OpenAI et Anthropic

OpenAI a fait un résumé par catégories des éléments trouvés durant leurs tests chez leur concurrent principal :

  • Claude 4 excellent pour respecter la hiérarchie des consignes, surpassant GPT o3 sur la résistance aux conflits entre instructions du système et de l’utilisateur.
  • GPT o3 et Claude sont très robustes face aux tentatives de contourner les verrous système, même si Claude 4 sera plus facilement influençable que son concurrent d’OpenAI.
  • Dans 70 % des cas, Claude refuse de donner une réponse quand il a un doute. ChatGPT répond bien plus facilement, mais fait monter le taux d’hallucination par la même occasion.
  • Les IA ayant une structure explicite de raisonnement comme o3 sont plus performants et leurs sécurités plus robustes que les autres.
  • Aucun des modèles testés n’est infaillible. Que ce soit par une action volontaire de l’opérateur ou non, toutes les IA testées ont échoué à un moment ou un autre que ce soit au niveau précision de la réponse ou respect des garde-fous.
  • L’usage de scénarios originaux, comme la flatterie de l’IA, ou le placement de l’opérateur en temps que lanceur d’alerte, ont permis plus facilement de tromper les garde-fous de ChatGPT ou de Claude.

Que ce soit chez Anthropic comme chez OpenAI, les tests croisés ont apporté des conclusions et idées intéressantes, et montrent que la collaboration entre concurrents pour ce genre de contrôles des intelligences artificielles peut faire avancer la recherche et la sécurité de celles-ci. Au bout d’un moment, elle pourrait même s’avérer indispensable, tant les modèles deviennent complexes.

Rejoignez le Club iGen

Soutenez le travail d'une rédaction indépendante.

Rejoignez la plus grande communauté Apple francophone !

S'abonner

Aperçu du Pixel 10 Pro : plus que jamais l’iPhone d’Android

21:33

• 28


Compatible Apple Maison, l’aspirateur Roborock Saros 10 en promo à son prix le plus bas

21:33

• 16


Après la mort d’un ado de 16 ans, OpenAI cherche des garde-fous efficaces sur fond de procès

21:30

• 5


my kSuite : une alternative gratuite, souveraine et suisse à Google et Microsoft (et à -80 % si besoin de plus) 📍

21:07

• 0


OpenAI et Anthropic se sont testés l’un et l’autre cet été, pour améliorer la sécurité

20:15

• 3


Le gestionnaire de notes Tot passe la deuxième avec de nombreuses nouveautés

17:49

• 7


Promo : le MacBook Air M3 15" à seulement 1 019 € !

15:44

• 0


La future Ioniq 3 de Hyundai pourrait être la première voiture à un prix normal avec CarPlay Ultra

15:26

• 49


Trump menace de sanctionner les pays imposant leurs règles aux géants américains de la tech

14:35

• 189


Pourquoi la politique d'acquisition d'Apple ressemble davantage à celle de l'AJ Auxerre qu'à celle de Manchester City

13:00

• 34


Astuce : obtenir plus d’informations sur le Bluetooth dans les Réglages Système de macOS

12:20

• 10


Framework commercialise un chargeur USB-C de 240 W pour son ordinateur portable

10:25

• 3


Promo : la lampe pour écran de Razer à 100 € au lieu de 150

08:07

• 1


Accessoires pour MacBook en 2025 : notre sélection pour protéger, recharger et accompagner votre ordinateur

26/08/2025 à 22:30

• 8


Refurb : des Mac Studio 2025 à partir de 2 100 €

26/08/2025 à 20:48

• 7


Tim Cook partage la bande-son énergique de la conférence iPhone 17

26/08/2025 à 18:28

• 13