Ouvrir le menu principal

MacGeneration

Recherche

La dernière version de Stable Diffusion gère mieux les mains et les textes dans les images

Félix Cattafesta

vendredi 28 juillet 2023 à 13:00 • 6

Logiciels

Stability AI a récemment mis en ligne la version 1.0 de Stable Diffusion XL, son nouveau modèle de génération d'image qu'elle décrit comme le plus poussé à ce jour. Celui-ci peut « créer des images de haute qualité dans pratiquement tous les styles artistiques », et le communiqué de lancement affirme qu'il s'agit du « meilleur modèle ouvert pour le photoréalisme ».

Des images crées par Stable Diffusion XL.

Stable Diffusion XL (ou SDXL) a été amélioré sur de nombreux points faisant défaut aux modèles précédents. La génération des mains devrait être meilleure, tout comme celle des textes dans une image. Les compositions complexes sur plusieurs plans (par exemple, une femme à l'arrière-plan poursuivant un chien au premier plan) devraient également être de meilleure qualité.

Ce nouveau modèle a une meilleure interprétation des mots, et il faut donc des commandes moins longues pour obtenir de bons résultats. En pratique, il n'y aura plus besoin d'ajouter des termes comme « chef-d'œuvre » à sa commande pour obtenir une image de bonne qualité. Le modèle devrait aussi moins s'emmêler les pinceaux avec certains mots à double sens comme « red square », qui désigne à la fois la place Rouge de Moscou et un carré rouge. De plus, Stability AI recommande désormais de générer des images de 1024×1024 pixels, ce qui représente une belle avancée par rapport aux modèles précédents et permettra d’avoir plus de détails.

Cette grosse mise à jour a été optimisée pour les Mac Apple Silicon, comme l'a fait savoir un des responsables de la division intelligence artificielle de Cupertino dans un billet de blog. SDXL a été porté sur Core ML pour une utilisation native dans les apps Swift. Son framework open source ml-stable-diffusion (qui permet de convertir des modèles Stable Diffusion pour Core ML) a été mis à jour, tout comme son app de démonstration. Cupertino explique également travailler sur une technique de compression avancée plus efficace, accessible à tous.

L'application Draw Things a été mise à jour pour l'arrivée de ce nouveau modèle, permettant de l'essayer facilement. Le modèle est open source et peut être téléchargé gratuitement sur Hugging Face.

Rejoignez le Club iGen

Soutenez le travail d'une rédaction indépendante.

Rejoignez la plus grande communauté Apple francophone !

S'abonner

Promo : la souris ergonomique Lift de Logitech à moitié prix (40 €)

12:06

• 0


Les ressources graphiques Liquid Glass sont disponibles pour Figma

11:00

• 3


Scandale : Apple Intelligence supprime les chats sur les photos 🙀

09:15

• 34


Apple porte plainte contre Jon Prosser et révèle l'origine des fuites sur iOS 26

08:34

• 33


IA : Meta continue de déstabiliser Apple en recrutant ses talents

08:17

• 23


ChatGPT Agent : l’IA qui peut (vraiment) faire le boulot à votre place

17/07/2025 à 21:35

• 85


Blender 5 abandonnera les Mac Intel

17/07/2025 à 21:30

• 5


Razer lance le Core X V2, un boîtier Thunderbolt 5 pour eGPU… mais pas uniquement

17/07/2025 à 18:29

• 4


Cyberpunk 2077 est disponible sur Mac… si vous avez plus de 8 Go de RAM

17/07/2025 à 16:21

• 82


YouTube Premium Lite arrive en France à 7,99 € pour voir moins de pubs

17/07/2025 à 15:44

• 96


Logitech propose (enfin) une version USB-C de son récepteur Bolt, mais oublie l'Unifying

17/07/2025 à 12:32

• 45


Le crédit à 0 % sur l’Apple Store prolongé jusqu’à fin septembre : les iPhone 17 concernés ?

17/07/2025 à 11:03

• 9


2025 serait l'année de Linux sur desktop aux États-Unis

17/07/2025 à 10:52

• 50


Ce que vos données disent de vous... et de vos proches 📍

17/07/2025 à 09:00

• 0


xAI annonce des compagnons virtuels, entre midinette pour otaku et fans de Cinquante nuances de Grey

16/07/2025 à 23:30

• 40


Test du PlugBug 120 W : un chargeur de voyage qu’on n’oublie pas grâce à Localiser

16/07/2025 à 23:10

• 30