DALL-E, Stable Diffusion (1/2) : tout comprendre à la génération d'images par IA

Félix Cattafesta |

Cela fait quelques mois que des logiciels permettant de générer des images saisissantes à partir d'une simple description captivent des milliers de curieux. Il suffit de taper ce qui vous passe par la tête en anglais pour qu'un programme vous sorte au bout de quelques secondes une image représentant plus ou moins fidèlement ce que vous lui avez demandé. En résultent des créations aussi bizarres que réalistes, comme ce raton laveur dans l'espace ou cette mosaïque byzantine représentant Dark Vador. Au cœur de ce processus créatif, des technologies d'intelligence artificielle de plus en plus évoluées.

Deux illustrations générées avec Midjourney.

La fin du mois de novembre s'est montrée particulièrement chargée dans ce domaine ; deux acteurs importants ont présenté de toutes nouvelles versions de leurs IA allant toujours plus loin dans le réalisme. Stable Diffusion est entré dans sa deuxième version tandis que Midjourney a passé la quatrième. Les résultats sont encore plus bluffants, d'autant plus quand on sait que ce type d'IA n'existait quasiment pas il y a deux ans. Voici tout ce qu'il faut savoir à leur sujet.

avatar Seb42 | 

Merci pour ce bel article.
C’est bien plus effrayant qu’enthousiasment.
Je ne vois ici aucune avancée pour l’Homme. Même si l’article essaye de démontrer l’inverse.
Pire comme tout est numérique maintenant on met en place des outils qui ne feront qu’alimenter des fakes.

avatar cecile_aelita | 

@Seb42

Il y a des choses superbes à faire avec un tel potentiel mais comme toujours le problème viendra de la dérive que l’Homme en fera …
Ce qui m’effraie le plus c’est qu’il y a encore quelques années (20-30 ans en arrière) une image permettait d’apporter du poids dans une argumentation 🙂. Ça illustrait, ça montrait des choses, et à part une poignée de « pro » qui savaient retoucher des images, dans l’ensemble une image montrait quand même des choses sur lesquelles on pouvait s’appuyer (pas toujours évidement mais dans une majorité de cas oui … je vois déjà venir les réponses 🤦‍♀️).
Maintenant n’importe qui même moi ou ma mère, on peut supprimer un élément d’une photo en 2 clics et dire « bah non tu vois, je n’y étais pas à cet endroit »… donc une image a perdu à 100% sa capacité de « preuve » et de montrer des choses vraies. Et ça je trouve ça dommage 🙂.
Je sais très bien qu’on va me dire « non ça n’a jamais été le cas etc etc bla bla bla »… bref ceux qui auront compris ce que je voulais dire (et heureusement ils sont nombreux 😅) c’est avec joie que j’échangerai avec vous 😅. Pour ceux qui sont juste là pour être dans la contradiction et vouloir avoir raison, je vais m’abstenir de répondre 😂.

avatar Chris K | 

@cecile_aelita

« bref ceux qui auront compris ce que je voulais dire (et heureusement ils sont nombreux 😅) c’est avec joie que j’échangerai avec vous 😅. Pour ceux qui sont juste là pour être dans la contradiction et vouloir avoir raison, je vais m’abstenir de répondre 😂. »

Oui maîtresse. 🙇

avatar cecile_aelita | 

@Chris K

C’était un peu direct j’avoue 😅!
Mais c’est pénible ces gens qui ne sont même pas là pour discuter mais juste pour dire que l’autre a tort et vouloir avoir le dernier mot 😋!

avatar abalem | 

@cecile_aelita

Tu parles avec trop de gens en même temps dans ta tête 😵‍💫

avatar pocketalex | 

"Mais c’est pénible ces gens qui ne sont même pas là pour discuter mais juste pour dire que l’autre a tort et vouloir avoir le dernier mot 😋!'

tu as tort !

avatar vicento | 

@pocketalex

😎🤣

avatar Chris K | 

Je me sers beaucoup de MidJourney (perso, un peu déçu par le version 4). Je n’ai pas encore utilisé les autres. Pour avoir un résultat conforme à mes attentes j’ai dû me plonger dans la doc afin d’utiliser des lignes de commandes consistantes.

Le résultat me bluffe régulièrement (et parfois me déçoit aussi mais c’est ce qui fait aussi l’attrait de ces outils).

Bon article.

avatar koko256 | 

Une belle avancée pour l'homme au contraire...

avatar Chris K | 

« Je ne vois ici aucune avancée pour l’Homme »

Néandertalien est d’accord avec ça.

avatar Seb42 | 

@Chris K

C’est un peu difficile à évoquer un ressenti et surtout le développer.
Mais si pour toi avec ça, tu penses faire avancer l’humanité… bien à toi.
Ça te permettra pas de vivre plus longtemps / mieux, ni aller plus loin.
Mais bon, on est content de ou faire une machine ce que l’homme ne sait plus imaginer.

avatar Chris K | 

@Seb42

« Mais si pour toi avec ça, tu penses faire avancer l’humanité… bien à toi.
Ça te permettra pas de vivre plus longtemps / mieux, ni aller plus loin. »

Je ne sais même pas de quoi tu parles en fait. DALL-E, Stable Diffusion etc. ça a été conçu pour faire avancer (dans quel sens d’ailleurs ?) l’humanité ? Quelqu’un a dit ça (sérieusement je veux dire, en dehors des discours commerciaux) ?

avatar cecile_aelita | 

@Seb42

+1

avatar vicento | 

@Seb42

Je connais des artistes 👩‍🎨 qui utilisent Stable diffusion et ils ne manquent pourtant pas d’inspiration. En revanche il peut maintenant produire beaucoup plus vite et / ou explorer un nombre de piste plus important qu’auparavant.

avatar Seb42 | 

@vicento

L’art n’est le résultat que malheureusement de personnes avec un don, quelque soit le domaine.
Aujourd’hui on a des images faites d’IA, demain on aura des chansons composées uniquement par de l’IA, puis des films, des jeux etc..
Ou va paraître l’émotion, le génie ? Comment motiver les plus jeunes à se surpasser pour atteindre les sommets ?

il y a des domaines où il faut de l’expertise, de l’imagination et on n’est pas tous égaux.
Entre dire à une IA je vais une épée enflammée avec un fond noir, et le faire soit même, ou est le talent ?

Et qui plus est mettre ça à la portée de tout un chacun sur internet .., les réseaux « sociaux » ne vous ont pas assez montré la part sombre de l’Homme ?

avatar Laurent38 | 

@Seb42

En effet... La technologie a servie jusque'à présent à libérer l'Homme de tâches éprouvantes et rébarbatives pour lui laisser plus de temps pour les loisirs, la réflexion, l'art, etc... Maintenant, la technologie libère également des ces "tâches"... Si même l'art devient une entreprise PUREMENT mercantile (évidemment que l'art n'a jamais été gratuit) au point de se servir de l'IA pour en faire toujours plus, que restera-t-il à l'Homme ? Beaucoup trouvent ça utile, voire chouette que M. ou Mme Toulemonde s'improvise créateur, qu'un(e) artiste puissent augmenter sa puissance de travail, mais pour faire quoi ??? Pourquoi cette course au "plus vite", "plus", au "toujours plus" ? On est aujourd'hui inondé d'infos de productions diverses et cela va aller encore en augmentant, mais pour faire quoi ? Une grosse partie des infos sont des fakes voire des infos inutiles, alors quel est l'intérêt de cette boulimie d'info ? une grosse partie de la production artistique est sans intérêt, jetable, aussitôt réalisée, aussitôt oubliée. Que M. ou Mme Toulemonde fasse joujou, ok, mais de là à crier au génie parce qu'un type pond une BD à partir d'images créées par une IA qui a, justement eu besoin d'images pour copier ce que d'autres ont fait, on marche sur la tête !
Et qu'on ne me parle pas de créativité quand il s'agit d'imiter d'anciens artistes ou d'anciennes cultures pour se réapproprier des cultures plus contemporaines. La technologie est en train d'éteindre la créativité. Ce que l'auto tune a fait à la chanson, ces logiciels vont bientôt le faire aux créations picturales.

avatar Seb42 | 

@Laurent38

C’est tout à fait ça, comment certains peuvent s’en réjouir? 😞

avatar Kaarlito | 

Le problème est que tous ces moteurs se basent sur le travail existant d’un pan entier de l’industrie visuelle (l’illustration), des visuels dont la plus grande partie est protégée par la loi du copyright et collectés à travers internet, leur servant de base de données; les résultats ne viennent pas du néant, ils ne sont qu’un amalgame de visuels « volés ». Etant moi-même illustrateur, je suis révulsé par ce pillage sans vergogne.

avatar Chris K | 

@Kaarlito

Pour quelles raisons le copyright s’appliquerait ici ?

avatar Kaarlito | 

Beaucoup d’illustrations, bien que sur internet sont protégés par le droit d’auteur. Un portfolio n’est pas un catalogue d’images libres de droit. Les bases de ces IA ne font aucune distinction entre une illustration accessible, mais interdite à la reproduction commerciale, d’une autre sous licence libre. Il y a déjà des cas oû de nombreux illustrateurs/trices subissent des préjudices. Exemple: de quel droit quelqu’un peut-il prétendre « réaliser » des images à la manière d’un Tardi ou d’un Giger (pour y arriver, il faut une base référentielle, elle ne vient pas de nulle part), le compte facebook d’Iris Compiet montre un exemple de l’étendue du problème. Si cela restait un fan-art, je ne serais pas contre, mais il est évident que ces compagnies qui développent ces IA proposerons un service payant, et les dérives vont être nombreuses. Elles se défaussent déjà, en prétextant que ce sont les clients qui sont responsables de leurs « oeuvres ». Quand des lois seront votées pour les encadrer, cela risque d’être trop tard.

avatar Chris K | 

@Kaarlito

Tu évoquais le copyright, qui, je crois, est légèrement différent du droit d’auteur.

Je n’en connais pas assez pour discuter sur le sujet (d’où ma question initiale). La génération par IA génère un modèle mathématique, logiquement (mais sous toute réserve) il n’y a pas de reproduction et diffusion des oeuvres passées à la moulinette (reste la question : ont-il le droit de passer ses oeuvres dans une moulinette ?).

Si je demande à l’IA de me créer une image de la Tour Eiffel éclairée la nuit dans un style Disney. Le droit d’auteur s’appliquent-il ? Envers qui ?

avatar Splinter | 

@Chris K

Pas de droit d’auteur sur les créations par ordinateur

En revanche, le point soulevé concernait l’utilisation de contenus protégés par le droit d’auteur dans le but de « nourrir » les modèles mathématiques de la machine. Et il s’agit effectivement sans doute d’une forme de reproduction des créations qui, normalement, devait être autorisée par les ayants droit.

avatar vicento | 

@Chris K

Pour moi on est dans le même cas de figure qu’un photographe.
L’œuvre qu’il prend en photo ne lui appartient pas (en général) pourtant la photo générée par son appareil et des outils de post production devient une œuvre originale pour laquelle il peut faire valoir des droits d’auteur.

L’IA n’est « qu’un outil / appareil » de plus. On peut faire des choses magnifiques avec ou produire de la 💩

avatar richard84 | 

Merci pour cet article !

avatar Gravoche67 | 

Une image générée montrant Tim Cook jouant avec le futur casque AR/VR d'Apple. Elle a été utilisée comme image d'accroche pour un article sur WatchGeneration.

Je me souviens avoir laissé un commentaire sur cette horreur 😫

avatar Splinter | 

@Gravoche67

Horrible image en effet 😆

avatar Alex Giannelli | 

Article très intéressant 🙏🏻

avatar vicento | 

Sur Mac invokeAI dispo sur GitHub permet d’aller encore plus loin que Diffusionbee

https://github.com/invoke-ai/InvokeAI

Si vous avez un Mac Silicon testez le 😃

avatar JLG47 | 

Depuis Georges Méliès, nous savons que les images ne montre pas toujours la réalité, mais ce que l'auteur souhaite nous faire voir/croire.
L'URSS (mais pas que) l'a massivement utilisé.
Et maintenant, nous devons douter de toutes les images.
Nous serons donc soumis au doute permanent, sauf à imposer aux machine de signer visiblement leurs production. C'est possible.

CONNEXION UTILISATEUR