Ouvrir le menu principal

MacGeneration

Recherche

La dernière version de Stable Diffusion gère mieux les mains et les textes dans les images

Félix Cattafesta

vendredi 28 juillet 2023 à 13:00 • 6

Logiciels

Stability AI a récemment mis en ligne la version 1.0 de Stable Diffusion XL, son nouveau modèle de génération d'image qu'elle décrit comme le plus poussé à ce jour. Celui-ci peut « créer des images de haute qualité dans pratiquement tous les styles artistiques », et le communiqué de lancement affirme qu'il s'agit du « meilleur modèle ouvert pour le photoréalisme ».

Des images crées par Stable Diffusion XL.

Stable Diffusion XL (ou SDXL) a été amélioré sur de nombreux points faisant défaut aux modèles précédents. La génération des mains devrait être meilleure, tout comme celle des textes dans une image. Les compositions complexes sur plusieurs plans (par exemple, une femme à l'arrière-plan poursuivant un chien au premier plan) devraient également être de meilleure qualité.

Ce nouveau modèle a une meilleure interprétation des mots, et il faut donc des commandes moins longues pour obtenir de bons résultats. En pratique, il n'y aura plus besoin d'ajouter des termes comme « chef-d'œuvre » à sa commande pour obtenir une image de bonne qualité. Le modèle devrait aussi moins s'emmêler les pinceaux avec certains mots à double sens comme « red square », qui désigne à la fois la place Rouge de Moscou et un carré rouge. De plus, Stability AI recommande désormais de générer des images de 1024×1024 pixels, ce qui représente une belle avancée par rapport aux modèles précédents et permettra d’avoir plus de détails.

Cette grosse mise à jour a été optimisée pour les Mac Apple Silicon, comme l'a fait savoir un des responsables de la division intelligence artificielle de Cupertino dans un billet de blog. SDXL a été porté sur Core ML pour une utilisation native dans les apps Swift. Son framework open source ml-stable-diffusion (qui permet de convertir des modèles Stable Diffusion pour Core ML) a été mis à jour, tout comme son app de démonstration. Cupertino explique également travailler sur une technique de compression avancée plus efficace, accessible à tous.

L'application Draw Things a été mise à jour pour l'arrivée de ce nouveau modèle, permettant de l'essayer facilement. Le modèle est open source et peut être téléchargé gratuitement sur Hugging Face.

illustration magazine 25 ans

MacGeneration a 25 ans !

Participez à la fête et découvrez l’histoire de votre site favori en précommandant notre magazine exclusif.

Je précommande le magazine

Selon Sam Altman, la prochaine étape de l’IA pourrait ne pas être si radicale que prévu initialement

04/12/2024 à 22:00

• 21


Jusqu'en octobre 2024, Free envoyait encore des mots de passe en clair

04/12/2024 à 20:30

• 14


Apple prend dans son giron l’extension iCloud Passwords pour Firefox

04/12/2024 à 20:00

• 34


Incogni : vos données protégées avec cette offre Cyber Monday immanquable 📍

04/12/2024 à 19:05


ChatGPT : 300 millions d’utilisateurs hebdomadaires et des annonces à venir avant Noël

04/12/2024 à 18:30

• 7


Les accessoires Apple (claviers, Pencil, souris) toujours en promo à partir de 60 €

04/12/2024 à 17:00

• 7


Tim Cook : Apple n’envisage pas de faire payer les fonctions d’Apple Intelligence

04/12/2024 à 15:30

• 43


Luca Maestri, directeur financier d’Apple, va-t-il conduire Stellantis ?

04/12/2024 à 14:50

• 19


Kuo : l'écran connecté d'Apple attendrait le second semestre 2025

04/12/2024 à 14:13


OpenAI envisage d’ajouter des pubs à ChatGPT

04/12/2024 à 12:00

• 13


Google est-il en train de devenir le Facebook des moteurs de recherche ?

04/12/2024 à 09:55

• 94


Hyundai ne compte pas abandonner CarPlay et Android Auto… pour le moment

04/12/2024 à 08:32

• 32


Apple utilise des puces Amazon pour préentraîner Apple Intelligence

03/12/2024 à 22:45

• 11


Nostalgique de la Touch Bar ? Voici la Flexbar, une copie vendue sur Kickstarter

03/12/2024 à 21:15

• 45


Arx One Backup : protégez vos données, simplement et efficacement sur macOS 📍

03/12/2024 à 17:00


Type : un utilitaire de notes rapide, ouvert et discret

03/12/2024 à 12:00

• 14