DALL-E 2 peut désormais imaginer ce qui se passe en dehors du cadre d'un tableau

Félix Cattafesta |

Les IA permettant de générer une image à partir de quelques mots continuent de s'améliorer. DALL-E 2, l'une des plus connues du domaine, vient d'être mise à jour avec une fonction offrant d'imaginer ce qui se passe en dehors d'une image. Celle ci peut ajouter des éléments visuels du même style ou encore « donner une nouvelle direction à une histoire » afin de créer des œuvres loufoques ou intéressantes.

La jeune fille à la perle de Johannes Vermeer, revisité par August Kamp via DALL-E 2.

Cette fonction baptisée Outpainting est désormais disponible sur la version pour ordinateur de DALL-E 2. Selon les développeurs, la fonction prend en compte les éléments visuels existants de l'image comme les ombres, les reflets et les textures afin de conserver le contexte de l'image originale. Elle marche avec les clichés personnels, mais aussi avec les tableaux.

La fonction n'est pas automatique : il va falloir étendre l'image par petite section et régulièrement re-générer certaines pièces du puzzle afin d'obtenir un résultat satisfaisant. Si vous avez accès à l'API, un guide est disponible à ce lien avec quelques conseils pour créer quelque chose qui tient la route.

Pour le moment, DALL-E 2 est uniquement disponible en bêta fermée. Il reste possible de s'inscrire sur une liste d'attente sur le site officiel.

avatar Furious Angel | 

C’est quand même dingue

avatar oomu | 

ha ouais ?

et on fera quoi si Dall-e ajoute hors du cadre un miroir montrant un reflet de l'artiste en train de commettre un meurtre ?

ha ben on sera bien dans la merde !

:)

avatar Matlouf | 

Ca s'appelle spoiler...

avatar vicento | 

@oomu

Bonne idée,

En attendant la puissance du procédé est impressionnante. On est encore qu’au début …

La vidéo et la musique sont aussi concernés.

✅ Pour ceux que cela intéresse, allez voir du côté de stability.ai

Stable diffusion offre bien plus de liberté et de possibilité de création visuelle que Dalle.2 et surtout, c’est réellement open source.

Sinon dans le même style midjourney et disco diffusion proposent aussi leurs solutions de création graphique par ia.

avatar edbattistini123 | 

Hallucinant

avatar occam | 

Sublime illustration du concept GIGO : garbage in, garbage out.

Un système AI suffisamment bien conçu serait d’abord suffisamment informé du domaine de validité des données sur lesquelles il est censé opérer. Des ensembles de données d’entraînement, de validation et surtout d’exclusion, choisis avec un minimum de pertinence, auraient appris à DALL-E 2 qu’une extension de champ chez Vermeer n’aboutit en aucun cas à une galerie de David Teniers le Jeune, peintre du bric-à-brac baroque organisé. Par exemple.

avatar v1nce29 | 

T'as fini de râler ? Tu ne peux pas juste apprécier la performance ?
On ne parle pas de générer du Vasarely, du Pollock ou du Soulages au km, l'ai fait de l'outpainting sur n'importe quelle image. Alors ce n'est pas parfait (ça fait un peu jeune fille à la perle dans un catalogue ikea) mais c'est quand même bluffant.

avatar une fleur | 

@occam

c’est vrai que vermeer était bien connu pour son utilisation des algorithmes d’extension de champ

avatar vicento | 

@occam

Ouai, tu as raison de souligner cette limite.
Mais l’étape d’après, si on arrive (si on a envie) à intégrer les éléments contexte dont tu parles permettra de combler cette lacune.

Pour l’instant les IA sont entraînées sur de masses très importantes de contenus et peuvent produire des visuels imparfaits.

En revanche si on les entraîne sur du contenu dans un domaine tres précis on pourra en tirer des résultats bien plus à propos.

avatar kazede | 

Difficile d’apprécier le résultat sans connaître les oeuvres originales. Je vais prendre le temps de chercher mais si vous voulez MAJ l’article, je pense que d’autres lecteurs seront preneurs.

avatar v1nce29 | 

Ça fait un certain temps que dall-e permet l'outpainting.

PS au temps pour moi, l'outpainting pour dall-e a l'air récent, ce devait être pour une autre AI.

avatar Lucas | 

Wow. Extraordinaire, éblouissant, effrayant…

Difficile de savoir sur quel pied danser, mais le travail en lui-même est remarquable et l’on passe probablement un cap civilisationnel, un jalon en tout cas (parce qu’il y en a tellement), en ce moment…

La question que je me pose maintenant, c’est verra-t-on, et quand, des productions vidéos générées par IA ? D’abord des GIFs, puis des Tik Tok, des court-trajmés… voire des films entiers ?

Est-ce dès le GIF on retourne à la bouillie primaire et on se donne rendez-vous dans 10 ans pour un « short » de 45 secondes, ou dans 18 mois on commence des productions vidéos, de qualité, spontanées ?

Le champ des possibles est immense !

Enfin, la vraie question est plutôt : à quel moment cela sortira des essais sympathiques partagés sur Twitter à un problème généralisé d’authenticité, de confiance, de détournement et de droit d’auteur ?

En parallèle avec le « deep fake » : combien de temps avant que les histoires d’horreur et complots de laboratoires, circonscrites aux cercles initiés, ne deviennent la norme ? Y aura-t-il bientôt des fausses déclarations de personnalités politiques diffusées en masse et suffisamment convaincantes pour toucher au-delà des plus fanatiques ou à côté de la plaque ?

D’ailleurs ne devrait-il pas y avoir un marquage obligatoire de ces « œuvres » à l’export du logiciel ? Garde-t-il une banque de donnée pour la vérifier après coup ? Et quid de la vente d’un t-shirt (ou pire, d’un NFT…) avec l’une de ces productions ?

Que de questions !

avatar vicento | 

@Lu Canneberges

Hello 👋
Les possibilités de trucage et création de faux contenus ont toujours existé.

Évidemment à chaque avancée de la technique on s’inquiète (a raison ?) des dérives possibles.

Au delà de cela, la profusion d’informations contradictoires sur internet nous met déjà tous dans une situation où il est très difficile de se faire une opinion équilibrée sur bien des sujets.
Démêler le vrai du faux est vraiment compliqué.

On peut essayer de se raccrocher aux branches en faisant confiance à notre bon sens et en évitant des prises de position extrêmes.

avatar misc | 

Je trouve ça dingue et merveilleux comme évolution, mais ça fait peur pour les petites mains des métiers de l’image. (Ou la création en général à long terme).

Edit: un autre moteur en bêta publique récemment: https://arstechnica.com/information-technology/2022/09/with-stable-diffusion-you-may-never-believe-what-you-see-online-again/

avatar marc_os | 

Concernant la jeune fille à la perle, l'IA n'a visiblement pas pu imaginer qu'en réalité elle posait dans l'atelier du peintre...

avatar v1nce29 | 

Il ne l'a pas placé non plus dans une grotte ni dans un loft ou une isba.

avatar marc_os | 

@ v1nce29

Je doute que l'atelier de Vermeer ait ressemblé à ça.

avatar Matlouf | 

Ce serait rigolo de faire ça sur le tableau de Dali, le représentant de dos faisant le portrait de son épouse, avec un reflet dans un miroir qui le montre, lui.

CONNEXION UTILISATEUR