DALL-E 3 gère mieux le texte dans les images et s'intègre avec ChatGPT

Félix Cattafesta

jeudi 21 septembre 2023 à 12:45 • 22

OpenAI a présenté une nouvelle version de DALL-E, son modèle d'intelligence artificielle qui permet de générer une image à partir d'une simple description textuelle. Cette troisième mouture semble radicalement plus puissante, et est désormais en mesure d'écrire correctement du texte dans une image. Le dessin ci-dessous a été réalisé grâce à la commande suivante :

Illustration d'un avocat assis sur la chaise d'un thérapeute, disant « Je me sens si vide à l'intérieur », avec un trou de la taille d'une assiette en son centre. Le thérapeute, une cuillère, prend des notes.

C'est une belle avancée, car le texte était jusqu'à présent un des gros défauts des images générées par IA : les lignes affichées donnaient généralement un gloubi-boulga incompréhensible. OpenAI n'est pas la seule à progresser dans le domaine, la dernière version de Stable Diffusion présentée dans le courant de l'été s'étant également améliorée sur ce point.

OpenAI explique que DALL-E 3 permet de plus facilement créer des images intéressantes sans qu'il soit nécessaire d'avoir à bidouiller sa requête en glissant des termes ciblés spécifiques. Les alternatives comme Midjourney ou Stable Diffusion impliquent souvent d'ajouter des mots précis pour obtenir un résultat convenable, comme « hyper réaliste », « détaillé », « qualité photographique », « HDR » etc. Cela ne devrait donc plus être le cas ici, ce qui va simplifier la création. Le système gère désormais plus efficacement les petits détails comme les mains, et se veut plus fidèle aux descriptions données.

« *Une peinture à l'huile expressive d'un joueur de basket-ball qui fait un dunk, représenté comme une explosion d'une nébuleuse* ». À droite, DALL-E 2, à gauche, DALL-E 3.

DALL-E gagne une intégration avec ChatGPT, ce qui va permettre de retoucher une image simplement en discutant avec le bot. On pourra lui demander de l'aide pour trouver de l'inspiration, et ChatGPT sera en mesure de créer une image à partir d'une conversation.

OpenAI tente de répondre à la pression montante autour des IA génératives, qui sont formées à partir d'énormes quantités de contenus trouvés en ligne sans se soucier des questions de droits d'auteurs. Le service ne pourra pas reproduire le style d'un artiste vivant, et les créateurs pourront remplir un formulaire demandant à OpenAI de ne par utiliser leur création pour l'entrainement de leurs prochains modèles. Comme par le passé, l'IA ne pourra pas créer d'image à caractère violent, sexuel ou représentant une célébrité.

Image générée avec DALL-E 3. Rappelons qu'elle a été soigneusement sélectionnée par OpenAI : il est fort probable que le résultat ne soit pas aussi impressionnant à chaque tentative.

Cette nouvelle version de Dall-E est actuellement proposée en avant-première pour les chercheurs. Elle sera disponible pour les clients ChatGPT Plus et Enterprise en octobre, via l'API et dans les Labs plus tard cet automne.

Pour aller plus loin :

Soutenez MacGeneration sur Tipeee

MacGeneration

iGeneration

WatchGeneration

Services

Rejoignez le Club iGen

DALL-E 3 gère mieux le texte dans les images et s'intègre avec ChatGPT

Pour aller plus loin :

MacGeneration a besoin de vous

Actualités

10 € de réduction sur l'ensemble des coques Apple pour les nouveaux iPhone

Promo : le MacBook Air M4 15" avec 24 Go de RAM et 512 Go de stockage à son prix le plus bas

macOS Tahoe peut se connecter automatiquement au partage de connexion d’un iPhone

4K, 5K, 6K : le guide des meilleurs écrans externes pour votre Mac

iOS 26 : RCS, nouveau Siri, météo par satellite… le programme des prochains mois

macOS 15.7 ainsi qu'iOS 18.7 corrigent des failles de sécurité, et l'iPhone 6s a aussi droit à sa mise à jour 🆕

iOS 26 : notre guide des nouveautés est en vente !

ChatGPT va essayer de deviner l’âge de ses utilisateurs pour protéger les ados

Revue de tests des Apple Watch SE 3, Series 11 et Ultra 3 : des fortunes très diverses

Sur iOS 26, Apple Plans se rapproche un petit peu de Waze

À quoi ressemble le nouvel Assistant de réparation de macOS Tahoe 26

Back to School : Microsoft Office 2021 à vie pour Mac à prix cassé 📍

SFR Box 10+ : la box Wi-Fi 7 de SFR est disponible pour tous

macOS Tahoe : Safari disparait de la partition de restauration (ou presque)

watchOS 26 apporte les notifications d’hypertension sur plusieurs Apple Watch

Free Mobile inclut un VPN gratuit, qui permet par hasard de contourner le blocage anti-porno

Image du moment

Tests

Test de deux stations d’accueil pour Mac mini M4, pour retrouver l’USB-A et plus encore

Test de l’écran PA32QCV d'Asus : une alternative abordable au Pro Display XDR ?

Test du « superchargeur » Genki Moonbase : la multiprise qui balance des ports

Test du Razer Joro : un clavier compact plus tourné vers le PC que vers le Mac

Mini-test du chargeur Ugreen Nexode à câble rétractable

Test de l’Aura Aspen : un cadre photo numérique raffiné