Ouvrir le menu principal

MacGeneration

Recherche

OpenAI affirme que DeepSeek a siphonné ses données pour entrainer ses modèles

Félix Cattafesta

mercredi 29 janvier 2025 à 15:30 • 110

Services

L’arroseur arrosé. OpenAI, qui a formé ChatGPT en moissonnant l’intégralité des sites du web, affirme aujourd’hui que l’entreprise chinoise DeepSeek a utilisé ses données pour former son modèle. Selon le Financial Times, Microsoft aurait détecté un siphonnage massif via les API d’OpenAI à la fin 2024. Le duo suspecte que les comptes utilisés soient liés à DeepSeek, qui fait les gros titres depuis cette semaine.

L’entreprise chinoise propose des modèles d’IA présentés comme aussi performants que ses principaux concurrents tout en étant bien moins gourmands en énergie à former. Si tout cela est discutable sur certains points, le lancement a fait trembler les grands du domaine : Meta a lancé une cellule d’urgence pour disséquer ces nouveaux modèles, tandis que l’app DeepSeek a dépassé celle de ChatGPT sur l’App Store américain.

DeepSeek, la tempête boursière dans un verre de ChatGPT 4o

DeepSeek, la tempête boursière dans un verre de ChatGPT 4o

OpenAI affirme avoir les preuves d’une « distillation », qu’elle suspecte venir de DeepSeek. Cette technique consiste à utiliser les résultats de modèles plus grands et plus performants pour entraîner des modèles plus petits. Une bonne alternative évitant de devoir dépenser les fortunes investies par les mastodontes du secteur. Bien qu’OpenAI propose ses API aux développeurs, elle interdit formellement de s’en servir pour créer un modèle rival.

La startup américaine n’a pas donné de détails sur les preuves qu’elle a récoltées. Plusieurs experts ont observé des réponses des modèles de DeepSeek laissant penser qu’ils pourraient avoir été entraînés sur le GPT-4 d’OpenAI. Un point intéressant vient du fait que les modèles de l’entreprise de Sam Altman sont entièrement gardés sous clef, là où ceux de la startup chinoise sont partiellement ouverts (les données d’entrainement restent privées). Autrement dit, l’arrivée de DeepSeek pourrait donner un nouveau souffle au secteur de l’open source.

« Nous savons que les entreprises basées en Chine - et d'autres - essaient constamment de distiller les modèles des principales entreprises américaines d'IA », a déclaré OpenAI dans un communiqué avant d’ajouter prendre des contre-mesures pour protéger « sa propriété intellectuelle ». « Nous pensons [...] qu'il est essentiel que nous travaillions en étroite collaboration avec le gouvernement américain pour protéger au mieux les modèles les plus performants des efforts déployés par les adversaires et les concurrents pour s'emparer de la technologie américaine », conclut l’entreprise.

Pour rappel, le New York Times ainsi que de nombreux médias et artistes ont attaqué OpenAI en justice pour une exploitation sans autorisation de leurs contenus. La startup s’était alors défendue en déclarant que « l’entraînement de modèles d'intelligence artificielle à l'aide de documents accessibles au public sur l'internet est un usage légitime ». Elle avait également déclaré qu’il était « impossible » de créer des produits comme ChatGPT sans utiliser des matériaux protégés par le droit d’auteur.

Mise à jour à 16 h : Ajout d’un paragraphe rappelant plusieurs procédures en cours contre OpenAI.

Rejoignez le Club iGen

Soutenez le travail d'une rédaction indépendante.

Rejoignez la plus grande communauté Apple francophone !

S'abonner

Les activités en direct dans macOS 26 ne demandent pas iOS 26 et pourraient fonctionner en Europe

16/06/2025 à 21:23

• 9


Découverte de Téléphone dans iOS 26 : nouvelle interface, appels inconnus, portages sur l’iPad et le Mac

16/06/2025 à 20:35

• 15


France Identité : l’intégration de la carte grise disponible en bêta

16/06/2025 à 19:51

• 97


La publicité s’infiltre finalement dans WhatsApp

16/06/2025 à 19:51

• 45


Comme promis, Apple sort de nouvelles bêtas… pour iOS 18.6 et macOS 15.6

16/06/2025 à 19:20

• 12


Bug amusant ou blague non assumée ? Une mise à jour de Windows 11 ressuscite le son de démarrage de Vista

16/06/2025 à 18:57

• 16


Un triple écran 15,6 pouces, qui promet l'équivalent de 43 pouces en 48:9

16/06/2025 à 18:07

• 3


Shadow, le PC dans le cloud, fait évoluer ses offres avec une pseudo RTX 4060

16/06/2025 à 16:58

• 19


Le PCI-Express 7.0 (256 Go/s) arrive alors que le PCIe 6.0 ne va pas se démocratiser avant 2030

16/06/2025 à 15:39

• 8


Grosse panne sur les réseaux mobile et fixe de SFR

16/06/2025 à 14:54

• 54


Un Steam Deck caché dans un clavier Apple pour l'utiliser avec des lunettes AR

16/06/2025 à 13:00

• 13


En Allemagne, le Schleswig-Holstein va abandonner les outils Microsoft comme Teams ou Office

16/06/2025 à 11:38

• 59


macOS Tahoe change plus facilement la couleur des LED des manettes de PlayStation

16/06/2025 à 10:45

• 14


Choisissez le moniteur parfait pour votre Mac

16/06/2025 à 09:09

• 0


GlassBar opacifie déjà la barre des menus de macOS Tahoe

16/06/2025 à 09:04

• 17


Nouveautés d’iOS 26, macOS Tahoe, Liquid Glass… Tous nos articles pour tout savoir sur la WWDC 2025

16/06/2025 à 06:00

• 12