Aux États-Unis, Getty Images attaque Stable Diffusion en justice

Félix Cattafesta |

Getty Images attaque Stable Diffusion. Dans une plainte déposée auprès du tribunal de district du Delaware, la banque d'images américaine accuse Stability AI de « violation effrontée de [sa] propriété intellectuelle à une échelle stupéfiante ». Les clichés de l'agence de photographie ont été utilisés pour entraîner plusieurs intelligences artificielles sans qu'aucune autorisation ne soit accordée.

Image tirée de la plainte de Getty, qui reproche l'utilisation abusive de son filigrane.

Getty Images affirme que la startup diffusant le modèle open source Stable Diffusion a copié plus de 12 millions de clichés de sa base de données sans autorisation ou compensation. Elle l'aurait fait « dans le cadre de ses efforts pour construire une entreprise concurrente ». Getty a déjà accordé des licences pour ses images à d'autres entreprises mettant sur pied des IA similaires, ce qui souligne bien le problème du manque de permission.

La bataille juridique va tourner autour du concept de fair use, qui délimite le droit d'auteur et autorise certains écarts dans des conditions spécifiques (comme les travaux créatifs). Stable Diffusion a été entrainé sur des centaines de millions de clichés récupérés à travers le net, dont certains faisaient partie de banques d'images protégées. Ce procès va donc permettre de savoir si cette utilisation était légale et peut entrer dans le cadre du fair use.

Image tirée de la plainte de Getty. Elle montre les similitudes entre image réelle et générée.

Dans sa plainte, Getty attaque aussi sur le fait que les IA peuvent reproduire son filigrane et ternirait ainsi son image de marque (par exemple en le collant sur des images médiocres). L'affaire ne devrait pas être réglée en une semaine : un avocat suivant le dossier de près a expliqué à The Verge qu'il faudra probablement plusieurs années avant que le procès ne soit mis en place. Aux États-Unis, Stability AI et Midjourney font également l'objet d'une autre action en justice : trois artistes les poursuivent pour avoir utilisé leurs créations sans les avoir prévenus.

avatar Insomnia | 

Pas surpris, il est fort à parier que si la majorité des IA utilisent des bases de données sous licence et qu’on leur demande de retirer ces données on va se retrouver avec des IA bancale comme Siri 🤪

avatar IceWizard | 

@Insomnia

« Pas surpris, il est fort à parier que si la majorité des IA utilisent des bases de données sous licence et qu’on leur demande de retirer ces données on va se retrouver avec des IA bancale comme Siri 🤪 »

Ou pire ! Insomnia c’est même pas 0,31 Siri, qui n’est pourtant pas une IA, mais un assistant vocal.

avatar Insomnia | 

@IceWizard

Reste à voir si c’est faisable et si c’est pas le cas, on va voir disparaître toutes ces IA faute de moyen et qui voudrait se payer une entreprise qui pourrait se retrouver avec des plaintes sur le dos. D’ailleurs pour ma part les IA de ce genre ne devraient pas exister, les jeunes vont vite prendre le pli de les utiliser pour tricher, les profs sans moyen de vérifier et quand il faudra écrire sur le diplôme final on va vite voir les résultats catastrophiques de ce genre dIA.

avatar tupui | 

@Insomnia

On pourra toujours faire des tests sans documents. Et quand bien même, suffit de monter le niveau. Si on fait du nivellement par le bas oui ça va être dur, mais sinon je vois pas vraiment de problème. Sans aller jusqu’au doctorat, quand on fait des études approfondies, a un moment ça sert plus à rien de faire des recherches sur Google, il faut vraiment taffer 😉 Je me souvient d’examens ou projets ou on avait 0 limites et je peux garantir que ça m’aurait servit strictement à rien ce genre d’outils… Bref, comme la calculette ou internet en son temps, ca bouscule un peu les choses mais au final les gens vont continuer à apprendre et à résoudre des problèmes par eux même. Pas les mêmes peut être, mais c’est pas bien grave ça.

avatar Insomnia | 

@tupui

Pas faux 😌

avatar cosmoboy34 | 

@tupui

Tout à fait c’est un faux problème. Google n’a pas changé grand chose non plus et c’est pourtant aussi facile de retrouver tous type d’information.

Concernant le problème des images ça va être autrement plus complexe. Si on peut comprendre la peur de ces entreprises de ne plus exister à cause des ia, sur le fond c’est comme faire un procès à un artiste qui s’est inspiré d’autres.

Certains demandent des royalties aux ia pour s’être inspirées et avoir appris grâce à leur œuvres. Mais est-ce qu’un artiste donne des royalties à toutes les œuvres qu’il a vu qui ont en grande partie influencé son travail ?

Ces procès vont être très intéressants. La bataille de la tech vs le monde artistique. quand le nouveau monde entre en collision avec l’ancien

avatar tupui | 

@cosmoboy34

> Mais est-ce qu’un artiste donne des royalties à toutes les œuvres qu’il a vu qui ont en grande partie influencé son travail ?

Il faut différentier copyright holder et license. On peut donner une license d’exploitation tout en gardant les droits. Un autre artiste peut dire qu’il accepte lea œuvres dérivés, sous certaines conditions ou non.

Dans le cas de Copilot par exemple, ils enfreignent directement tout ce qui est GPL. En temps que dev, j’ai pas le droit de lire du code GPL si c’est pour m’aider à écrire du code en MIT ou BSD par exemple. Pire, StackOverflow n’est pas compatible avec ces mêmes licenses.

C’est un gros problème pour NumPy et SciPy par exemples qui sont tout deux open source et BSD. On a pas le droit de regarder StackOverflow. Et on ferme systématiquement toutes les PRs qui mentionnent ça. Ou la plupart du code écrit en R. Beaucoup de personnes ne s’intéressent pas au sujet et font juste “comme les autres”. On doit faire la chasse ensuite pour demander une nouvelle license, etc.

Bref, ça me fait bien ****** quand des trucs comme Copilot se cognent royalement de ce genre de considérations quand nous on se tue à respecter les règles. Et on continuera à le faire.

avatar calotype | 

@Insomnia

Oui tout à fait car celon moi, l’intérêt énorme d’utiliser de telles bases de donnés comme les banques d’images, n’est pas du tout lié au volume de contenu dont le web regorge déjà.
Mais surtout le fait que toutes les images de ces banques sont correctement associées à de très nombreux tags, sujet, verbe, complément et autres adjectifs qualificatifs…
C’est probablement là le plus intéressant pour que l’apprentissage d’une IA soit la plus juste.

avatar Insomnia | 

@calotype

Vaut mieux que l’utiliser des photos bruts car le net regorge de photos pas très reluisante et je te dis pas l’état des réponses

avatar marc_os | 

> un avocat suivant le dossier de près a expliqué à The Verge qu'il faudra probablement plusieurs année avant que le procès ne soit mis en place. Aux États-Unis

Ça n'existe pas les jugements "en référé" aux Etats-Unis, justement pour éviter que des situations illégales s'éternisent et que que le plaignant subisse des dommages pendant des années ?

avatar Paquito06 | 

@marc_os

Ca existe bien sur (summary judgement), mais c’est onereux et faut surtout etre sûr de son coup.

avatar SamsungMeSaoule | 

Je ne sais pas de quoi vous parlez ici, mais j’ai constaté une consommation anormale de ma batterie d’iPhone 13 Pro Max. En 20 jours, j’ai perdu 3% d’autonomie de batterie. Après vérification, je crois que ces dysfonctionnements sont provoqués par l’app Safari. J’attends vos retours.

avatar iGildas | 

@SamsungMeSaoule

Lol

avatar h-de-pierre | 

@SamsungMeSaoule

😂

avatar tupui | 

Ah la bonne nouvelle de la journée ! Marre de ces boites qui ne respectent rien. Et outre le côté légal, y’a un truc aussi qu’on appel l’éthique…

avatar Seb42 | 

@tupui

On le savait, on le voit et on n’a pas fini d’en entendre parler mais IA et Éthique ça n’existe pas même si certains sont persuadés du contraire.

avatar tupui | 

@Seb42

En vrai il y a pleins de petites boites qui s’en fichent pas et utilisent que des datasets qui ont les bonnes licenses (et la bonne car certains prennent un dataset et le redistribuent en changeant la license…lol). Mais oui les gros s’en fichent complètement. Et je les comprends aussi, tant qu’on leur dit rien ça leur rapporte plus et ça fait tellement longtemps maintenant que même si demain ils ont un procès, ça aura value largement le coup… moche.

avatar Seb42 | 

@tupui

Oui mais pour l’instant on ne parle « que » d’image.
Mais demain ce sera les coups de crayon des artistes, les styles musicaux d’autres, les mémoires d’auteurs, qui seront plagiés copiés, et il n’y aura personne à juger car le système n’appartiendra pas à quelqu’un il se sera auto alimenté… encore plus si il est open source alimenté par la communauté.

avatar Ceylo | 

@tupui

Pareil très heureux de cette news 😄

avatar YosraF | 

1/ ils ont peur pour leur business ce qui est normal
2/ ils ont loupé le virage de l’ia. C’était à eux de le faire peut être ?
3/ l’image foireuse de l’exemple, représente pas mal d’images générés par stable diffusion. Heureusement que c’est pas toujours comme ça. Pour ma part j’ai jamais eu le logo.
4/ pour celui qui a dit les élèves vont tricher ceci cela. Il faut repartir à l’âge de pierre et apprendre aux enfants à chasser. Au moins plus de prises de têtes 🤣

avatar jean_claude_duss | 

@YosraF

C’est pas qu’une histoire de peur. C’est plutôt du vol manifeste de ton taff. Je comprend que les artistes soient outrés.

avatar YosraF | 

@jean_claude_duss

Les artistes eux même savent que l’inspiration est continu en regardant le travail des autres. Un humain a le droit d’apprendre des autres sur Instagram et une IA on doit la limiter ?

Je pense que c’est perdu d’avance. Même une IA avec des apprentissages non supervisées apprendra de elle même et on pourra rien y faire.

avatar perlaurent | 

Ça va être compliqué de bloquer le phénomène IA et pas que dans l’imagerie…. Il sera intéressant de voir la suite des événements.

avatar beber666 | 

Ils vont avoir du mal à bloquer quoi que ce soit, les modèles Stable Diffusion étant disponibles gratuitement, et fonctionnent en local via InvokeAI ou autre...

avatar Biking Dutch Man | 

Cyniquement si leur IA était si bonne que cela ils auraient commencé à l’utiliser pour enlever les filigranes. Quant aux droits, que ce soit dans la science ou dans la musique, ce sont en fait souvent d’autres ayant droit qui les possèdent. On devrait les nommer autrement que droits d’auteurs.

CONNEXION UTILISATEUR