La dernière version de Stable Diffusion gère mieux les mains et les textes dans les images

Félix Cattafesta

vendredi 28 juillet 2023 à 13:00 • 6

Stability AI a récemment mis en ligne la version 1.0 de Stable Diffusion XL, son nouveau modèle de génération d'image qu'elle décrit comme le plus poussé à ce jour. Celui-ci peut « créer des images de haute qualité dans pratiquement tous les styles artistiques », et le communiqué de lancement affirme qu'il s'agit du « meilleur modèle ouvert pour le photoréalisme ».

Des images crées par Stable Diffusion XL.

Stable Diffusion XL (ou SDXL) a été amélioré sur de nombreux points faisant défaut aux modèles précédents. La génération des mains devrait être meilleure, tout comme celle des textes dans une image. Les compositions complexes sur plusieurs plans (par exemple, une femme à l'arrière-plan poursuivant un chien au premier plan) devraient également être de meilleure qualité.

Ce nouveau modèle a une meilleure interprétation des mots, et il faut donc des commandes moins longues pour obtenir de bons résultats. En pratique, il n'y aura plus besoin d'ajouter des termes comme « chef-d'œuvre » à sa commande pour obtenir une image de bonne qualité. Le modèle devrait aussi moins s'emmêler les pinceaux avec certains mots à double sens comme « red square », qui désigne à la fois la place Rouge de Moscou et un carré rouge. De plus, Stability AI recommande désormais de générer des images de 1024×1024 pixels, ce qui représente une belle avancée par rapport aux modèles précédents et permettra d’avoir plus de détails.

Cette grosse mise à jour a été optimisée pour les Mac Apple Silicon, comme l'a fait savoir un des responsables de la division intelligence artificielle de Cupertino dans un billet de blog. SDXL a été porté sur Core ML pour une utilisation native dans les apps Swift. Son framework open source ml-stable-diffusion (qui permet de convertir des modèles Stable Diffusion pour Core ML) a été mis à jour, tout comme son app de démonstration. Cupertino explique également travailler sur une technique de compression avancée plus efficace, accessible à tous.

L'application Draw Things a été mise à jour pour l'arrivée de ce nouveau modèle, permettant de l'essayer facilement. Le modèle est open source et peut être téléchargé gratuitement sur Hugging Face.

MacGeneration

iGeneration

WatchGeneration

Services

Rejoignez le Club iGen

La dernière version de Stable Diffusion gère mieux les mains et les textes dans les images

Pour aller plus loin :

Rejoignez le Club iGen

Actualités

À contre-courant : pourquoi Félix pense que le Mac est une bonne machine de jeu

Tim Cook revient sur l’IA, Siri et les futurs produits devant les employés de l’Apple Park

Pourquoi une IA devient malsaine, et comment y remédier ? Anthropic invente le psy pour IA

OpenAI a laissé Google indexer des conversations, avant de vite faire machine arrière

Redonnez vie à vos vidéos : Aiarty Video Enhancer débarque sur Mac et Windows (et c’est bluffant) 📍

Fin de partie pour Windows 11 SE, l’équivalent à Chrome OS de Microsoft

Tim Cook a été plus longtemps à la tête d'Apple que Steve Jobs

Quatre ans après macOS, Adobe Premiere Pro et After Effects arrivent en bêta pour les PC Windows ARM

Promo : l’iPhone 15 Plus à 789 €, une bonne affaire (-19 %)

OpenAI lance un nouveau mode plus pédagogique pour ChatGPT à destination des étudiants

Linus Torvalds a visiblement abandonné son MacBook Air M2

Zuckerberg : « le développement d’une superintelligence est à portée de main »

3 milliards d’iPhone écoulés depuis 2007 : le produit high-tech le plus vendu de l’histoire ?

Promo : la station d'accueil Ugreen pour le Mac mini M4 à 70 € (-30 €)

Résultats T3 25 : et la guerre commerciale profita à Apple !

Ollama propose une nouvelle app pour le Mac qui permet de se passer entièrement du terminal

Image du moment

Tests

Test du fauteuil Flexispot C7 Air : il n’y a que la maille qui m’aille

Test du Synology DS925+ : ça passe ou ça NAS

Test de la ScreenBar Halo 2 : une lampe d'écran à laquelle il ne manque que le Wi-Fi

Test du SSD externe Crucial X10, qui peut atteindre 8 To

Test de la BeeStation Plus : le NAS pour ceux qui ne veulent pas de NAS

Test du clavier Keychron V10 Max : Alice au pays de Corneille ?