Ouvrir le menu principal

MacGeneration

Recherche

DALL-E 3 gère mieux le texte dans les images et s'intègre avec ChatGPT

Félix Cattafesta

jeudi 21 septembre 2023 à 12:45 • 22

Services

OpenAI a présenté une nouvelle version de DALL-E, son modèle d'intelligence artificielle qui permet de générer une image à partir d'une simple description textuelle. Cette troisième mouture semble radicalement plus puissante, et est désormais en mesure d'écrire correctement du texte dans une image. Le dessin ci-dessous a été réalisé grâce à la commande suivante :

Illustration d'un avocat assis sur la chaise d'un thérapeute, disant « Je me sens si vide à l'intérieur », avec un trou de la taille d'une assiette en son centre. Le thérapeute, une cuillère, prend des notes.

C'est une belle avancée, car le texte était jusqu'à présent un des gros défauts des images générées par IA : les lignes affichées donnaient généralement un gloubi-boulga incompréhensible. OpenAI n'est pas la seule à progresser dans le domaine, la dernière version de Stable Diffusion présentée dans le courant de l'été s'étant également améliorée sur ce point.

La dernière version de Stable Diffusion gère mieux les mains et les textes dans les images

La dernière version de Stable Diffusion gère mieux les mains et les textes dans les images

OpenAI explique que DALL-E 3 permet de plus facilement créer des images intéressantes sans qu'il soit nécessaire d'avoir à bidouiller sa requête en glissant des termes ciblés spécifiques. Les alternatives comme Midjourney ou Stable Diffusion impliquent souvent d'ajouter des mots précis pour obtenir un résultat convenable, comme « hyper réaliste », « détaillé », « qualité photographique », « HDR » etc. Cela ne devrait donc plus être le cas ici, ce qui va simplifier la création. Le système gère désormais plus efficacement les petits détails comme les mains, et se veut plus fidèle aux descriptions données.

« Une peinture à l'huile expressive d'un joueur de basket-ball qui fait un dunk, représenté comme une explosion d'une nébuleuse ». À droite, DALL-E 2, à gauche, DALL-E 3.

DALL-E gagne une intégration avec ChatGPT, ce qui va permettre de retoucher une image simplement en discutant avec le bot. On pourra lui demander de l'aide pour trouver de l'inspiration, et ChatGPT sera en mesure de créer une image à partir d'une conversation.

OpenAI tente de répondre à la pression montante autour des IA génératives, qui sont formées à partir d'énormes quantités de contenus trouvés en ligne sans se soucier des questions de droits d'auteurs. Le service ne pourra pas reproduire le style d'un artiste vivant, et les créateurs pourront remplir un formulaire demandant à OpenAI de ne par utiliser leur création pour l'entrainement de leurs prochains modèles. Comme par le passé, l'IA ne pourra pas créer d'image à caractère violent, sexuel ou représentant une célébrité.

Image générée avec DALL-E 3. Rappelons qu'elle a été soigneusement sélectionnée par OpenAI : il est fort probable que le résultat ne soit pas aussi impressionnant à chaque tentative.

Cette nouvelle version de Dall-E est actuellement proposée en avant-première pour les chercheurs. Elle sera disponible pour les clients ChatGPT Plus et Enterprise en octobre, via l'API et dans les Labs plus tard cet automne.

Soutenez MacGeneration sur Tipeee

MacGeneration a besoin de vous

Vous pouvez nous aider en vous abonnant ou en nous laissant un pourboire

Soutenez MacGeneration sur Tipeee

Chaises musicales chez Apple : Lisa Jackson et la directrice juridique officiellement sur le départ en 2026

04/12/2025 à 23:07

• 14


L’IA est un gouffre à énergie, et les modèles à raisonnement sont encore pires que les précédents

04/12/2025 à 21:45

• 84


Des clés de sécurité FIDO2 en promotion, pour différents scénarios et appareils

04/12/2025 à 18:15

• 7


Cyberpunk 2077, Strava, Pokémon TCG : Apple présente les apps de l’années 2025

04/12/2025 à 17:17

• 11


Des doutes sur le reconditionné ? 30 mois de garantie, 30 jours satisfait ou remboursé. Toujours sceptique ?

04/12/2025 à 16:20

• 0


La Russie bloque FaceTime

04/12/2025 à 15:39

• 117


N'espérez pas acheter de SSD à bon prix chez Transcend : la société ne reçoit plus de mémoire flash

04/12/2025 à 11:10

• 23


Tesla veut impressionner ses clients européens avec des démonstrations de sa conduite autonome (supervisée)

04/12/2025 à 09:31

• 100


120 000 caméras connectées piratées pour obtenir des vidéos frivoles

04/12/2025 à 08:52

• 61


ExpressVPN a enfin droit à une app Mac native

04/12/2025 à 08:30

• 5


Le départ d'Alan Dye chez Meta : une bénédiction pour le design d’Apple ?

04/12/2025 à 08:05

• 39


Apple efface déjà John Giannandrea de sa page des dirigeants

04/12/2025 à 07:30

• 10


Chez Meta, Alan Dye va diriger un studio créatif pour inventer l’après-smartphone

04/12/2025 à 06:30

• 20


Comparatif MacBook Air et MacBook Pro : faut-il vraiment passer au Pro ?

03/12/2025 à 23:55

• 35


Apple met en ligne la Release Candidate d'iOS 26.2, iPadOS 26.2 et macOS 26.2

03/12/2025 à 22:25

• 13


Meta récupère Alan Dye, responsable des interfaces depuis 2010 et n°2 du design d’Apple

03/12/2025 à 21:30

• 59