Ouvrir le menu principal

MacGeneration

Recherche

Nvidia prise à utiliser des œuvres piratées pour entraîner son IA

Greg Onizuka

mercredi 21 janvier 2026 à 21:15 • 23

Intelligence artificielle

Dans la course à l’intelligence artificielle, tous les coups semblent permis, et bien souvent, c’est le créateur de contenus (façon industrielle de dire « artiste », histoire de ne pas trop lui donner d’importance) qui prend, comme le rapporte Dataconomy.

Jensen va pouvoir s’accrocher à son blouson, les explications vont être difficiles à entendre... Image Nvidia Taïwan/Wikipedia, CC BY 2.0.

Si les LLM les plus connus viennent d’OpenAI, Anthropic, Meta ou encore Microsoft, Nvidia développe elle aussi ses propres versions. Sous le nom de NeMo, Retro-48B, InstructRetro ou encore Megatron, ces modèles lui permettent de donner des bases à ses clients, ou de faire des démonstrations convaincantes au public.

Et comme tous ses concurrents, Nvidia est bien obligée d’alimenter en données ses LLM... et le plus vite possible, vu la voracité des autres entreprises ! Mais aller vite autorise-t-il pour autant à se passer des règles les plus élémentaires, comme celles du droit d’auteur ?

C’est la question (semblant assez vite répondue) que pose un collectif d’auteurs à la justice américaine en poursuivant Nvidia pour utilisation d’œuvres piratées afin de nourrir ses LLM. En effet, l’entreprise de Jensen Huang aurait décidé de prendre de gros raccourcis en faisant appel à Anna’s Archive : si le nom est très peu connu du grand public, cette entité est responsable du piratage massif de nombreuses archives de livres en tout genre, faisant ouvertement fi du droit d’auteur, prétextant que celui-ci est nuisible à la connaissance.

Anna’s Archive, à la tête d’un beau pactole de 500 To de données environ, a ainsi été contactée par un membre de la data strategy team de Nvidia, afin d’avoir un accès le plus rapide possible à la base de données. L’entité aurait positivement répondu à Nvidia, en monnayant l’accès rapide demandé à plusieurs dizaines de milliers de dollars.

Prise la main dans le pot de confiture, Nvidia va donc devoir s’expliquer devant la justice. La situation est d’autant moins à l’avantage du créateur de puces qu’Anna’s Archive a dans sa réponse clairement signalé à Nvidia que le contenu a été récupéré et maintenu illégalement : l’entreprise ne peut donc pas feindre l’innocence sur la provenance des données.

La plainte, si elle met en lumière les détails de la correspondance avec Anna’s Archive, indique que Nvidia ne s’est pas contentée de cette source : Books3, Libyen, Sci-Hub ou encore Z-Library ont été mis à contribution pour alimenter les LLM de la marque.

Pire, la plainte affirme que Nvidia a non seulement utilisé ces sources pour entraîner ses IA, mais a aussi fourni à certains gros clients les clés d’accès à ces sources illégales, notamment « The Pile », qui contenait les archives de Books3.

Le procès se déroulant aux USA, il est lancé sous forme de class action. Si pour le moment le nombre des auteurs faisant partie de celle-ci reste raisonnable, il pourrait augmenter rapidement, le collectif appelant les centaines de personnes flouées à se joindre à lui, afin de faire pression et demander réparation. Nvidia est un très gros morceau, mais la fuite des échanges entre l’entreprise et Anna’s Archive est terrible pour la firme, qui aura du mal à se dépêtrer de cette histoire sans y perdre quelques espèces sonnantes et trébuchantes...

illustration ulule

Pour les 50 ans d’Apple, MacGeneration publie un livre événement

Précommandez-le dès maintenant et profitez-en pour découvrir nos nouveaux goodies, ou prolonger votre abonnement au Club iGen à tarif réduit.

Découvrez nos offres

Précommandez le livre et rejoignez la fête

Un livre pour raconter 50 ans d'Apple, une journée à Lyon pour les célébrer ensemble.

Participez sur Ulule

GitHub va entraîner des modèles pour IA sur votre utilisation, sauf si vous refusez

30/03/2026 à 23:01

• 7


120 000 € franchis : plus que 48 heures pour pré-commander notre livre sur les 50 ans d’Apple

30/03/2026 à 21:14

• 13


La première bêta de tous les OS 26.5 est disponible pour les développeurs, sans grosses nouveautés 🆕

30/03/2026 à 20:05

• 30


Free Mobile laisse entendre que sa « révolution mobile » pourrait viser les voyageurs

30/03/2026 à 17:11

• 31


Premier rabais sur le MacBook Air M5 (-100 €), stocks au plus bas pour le Neo 🆕

30/03/2026 à 16:50

• 28


Apple écope d’une amende de 450 000 € pour violation des sanctions contre la Russie

30/03/2026 à 16:34

• 23


Apple préparerait bien un iMac à écran OLED, mais il faudrait être très patient

30/03/2026 à 15:18

• 26


Samsung remplace ARM par RISC-V dans un nouveau SSD PCIe 5.0

30/03/2026 à 14:37

• 8


Netflix chamboule son lecteur vidéo sur Apple TV et bouscule les repères de la plateforme

30/03/2026 à 13:52

• 37


J-3 : plus de 115 000 € récoltés et plus de 2000 livres vendus ! Merci !

30/03/2026 à 13:40

• 59


AirPods Max : attention à ces contrefaçons indétectables au premier coup d’œil

30/03/2026 à 11:20

• 35


Un Mac mini M2 à 420 €. Qui dit mieux ?

30/03/2026 à 11:06

• 0


Journée MacGeneration : demandez le programme !

30/03/2026 à 11:00

• 28


Dell intègre un capteur d’empreinte dans une souris de bureau

30/03/2026 à 10:44

• 11


pCloud profite de Pâques pour brader son stockage cloud familial à vie 📍

30/03/2026 à 10:40

• 0


Apple améliore ses modèles pour Apple Intelligence avec iOS et macOS 26.4

30/03/2026 à 09:56

• 18