Ouvrir le menu principal

MacGeneration

Recherche

La dernière version de Stable Diffusion gère mieux les mains et les textes dans les images

Félix Cattafesta

vendredi 28 juillet 2023 à 13:00 • 6

Logiciels

Stability AI a récemment mis en ligne la version 1.0 de Stable Diffusion XL, son nouveau modèle de génération d'image qu'elle décrit comme le plus poussé à ce jour. Celui-ci peut « créer des images de haute qualité dans pratiquement tous les styles artistiques », et le communiqué de lancement affirme qu'il s'agit du « meilleur modèle ouvert pour le photoréalisme ».

Des images crées par Stable Diffusion XL.

Stable Diffusion XL (ou SDXL) a été amélioré sur de nombreux points faisant défaut aux modèles précédents. La génération des mains devrait être meilleure, tout comme celle des textes dans une image. Les compositions complexes sur plusieurs plans (par exemple, une femme à l'arrière-plan poursuivant un chien au premier plan) devraient également être de meilleure qualité.

Ce nouveau modèle a une meilleure interprétation des mots, et il faut donc des commandes moins longues pour obtenir de bons résultats. En pratique, il n'y aura plus besoin d'ajouter des termes comme « chef-d'œuvre » à sa commande pour obtenir une image de bonne qualité. Le modèle devrait aussi moins s'emmêler les pinceaux avec certains mots à double sens comme « red square », qui désigne à la fois la place Rouge de Moscou et un carré rouge. De plus, Stability AI recommande désormais de générer des images de 1024×1024 pixels, ce qui représente une belle avancée par rapport aux modèles précédents et permettra d’avoir plus de détails.

Cette grosse mise à jour a été optimisée pour les Mac Apple Silicon, comme l'a fait savoir un des responsables de la division intelligence artificielle de Cupertino dans un billet de blog. SDXL a été porté sur Core ML pour une utilisation native dans les apps Swift. Son framework open source ml-stable-diffusion (qui permet de convertir des modèles Stable Diffusion pour Core ML) a été mis à jour, tout comme son app de démonstration. Cupertino explique également travailler sur une technique de compression avancée plus efficace, accessible à tous.

L'application Draw Things a été mise à jour pour l'arrivée de ce nouveau modèle, permettant de l'essayer facilement. Le modèle est open source et peut être téléchargé gratuitement sur Hugging Face.

Rejoignez le Club iGen

Soutenez le travail d'une rédaction indépendante.

Rejoignez la plus grande communauté Apple francophone !

S'abonner

QNAP propose un switch 2,5 Gb/s avec 8 ports, presque abordable

16:56

• 8


Amazon divise par deux l’abonnement Prime pour les étudiants

16:33

• 3


Vous n'aimez pas Liquid Glass ? Un hack permet de s'en débarrasser sous macOS Tahoe

12:08

• 19


Arnaques par SMS : les arnaques explosent en 2025, nos conseils pour s’en protéger 📍

08:59

• 0


Pas d'écran pour les enfants de moins de 3 ans

08:29

• 43


Le Prime Day d'Amazon durera 4 jours du 8 au 11 juillet

08:05

• 18


Dia : le successeur d'Arc mise tout sur l'IA

07:24

• 23


Nouveautés d’iOS 26, macOS Tahoe, Liquid Glass… Tous nos articles pour tout savoir sur la WWDC 2025

00:00

• 13


Les activités en direct dans macOS 26 ne demandent pas iOS 26 et pourraient fonctionner en Europe

16/06/2025 à 21:23

• 13


Découverte de Téléphone dans iOS 26 : nouvelle interface, appels inconnus, portages sur l’iPad et le Mac

16/06/2025 à 20:35

• 26


France Identité : l’intégration de la carte grise disponible en bêta

16/06/2025 à 19:51

• 100


La publicité s’infiltre finalement dans WhatsApp

16/06/2025 à 19:51

• 52


Comme promis, Apple sort de nouvelles bêtas… pour iOS 18.6 et macOS 15.6

16/06/2025 à 19:20

• 13


Bug amusant ou blague non assumée ? Une mise à jour de Windows 11 ressuscite le son de démarrage de Vista

16/06/2025 à 18:57

• 20


Un triple écran 15,6 pouces, qui promet l'équivalent de 43 pouces en 48:9

16/06/2025 à 18:07

• 5


Shadow, le PC dans le cloud, fait évoluer ses offres avec une pseudo RTX 4060

16/06/2025 à 16:58

• 23