Google présente une IA bluffante qui transforme n'importe quel texte en image

Vous connaissez peut-être thispersondoesnotexist.com, un site qui génère de faux selfies en se basant sur une intelligence artificielle de NVIDIA. Google travaille sur un concept similaire, mais beaucoup plus poussé baptisé Imagen. Son fonctionnement est simple : on entre une description de quelques mots, et l'IA se charge de vous concocter une image. L'entreprise a diffusé quelques exemples dans un billet de blog, et le résultat est bluffant. Jugez par vous-même :

À gauche : « Un aigle à tête blanche fait de chocolat en poudre, de mangue et de crème fouettée ». À droite : « Un chien qui regarde avec curiosité dans un miroir et voit un chat ».

Google n'est pas le premier sur ce segment : il existe déjà le logiciel DALL-E, dont une deuxième version est sortie le mois dernier et développée par OpenAI. Selon la firme de Mountain View, son outil est plus puissant. Elle s'est amusée à comparer ses résultats avec ceux de DALL-E, et son étude montre que les évaluateurs humains préfèrent nettement Imagen aux autres méthodes.

Si ces résultats sont impressionnants, il faut toutefois nuancer : les équipes ont sans doute choisi les meilleurs résultats et omis de relayer les images floues ou à côté de la plaque. DALL-E par exemple a du mal avec les négations (« un bol de fruits sans pommes »), les visages ou encore avec les textes. Google propose sur son site une petite démo, qui permet de jouer avec une version limitée de l'IA avec seulement quelques mots utilisables.

À gauche : « Un geai bleu debout sur un grand panier de macarons arc-en-ciel ». À droite : « Un corgi mignon vivant dans une maison faite de sushis ».

Il faut dire que les résultats parfois impressionnants obtenus grâce à cette IA n'incitent pas à laisser son code open source à l'heure où les fake-news se partagent à tour de bras. « Les risques potentiels d'utilisation abusive soulèvent des inquiétudes quant à l'ouverture responsable du code et des démos », précisent les équipes de Google.

De plus, les chercheurs expliquent avoir nourri leur algorithme à l'aide de très nombreuses données non triées venant du web. Autrement dit, ils ingèrent à peu près n'importe quoi, que ce soit de la pornographie ou des contenus haineux. « Ces ensembles de données ont tendance à refléter des stéréotypes sociaux, des points de vue oppressifs et des associations désobligeantes, ou autrement nuisibles, à des groupes d'identité marginalisés », précise le texte.

À gauche : « Un fruit du dragon portant une ceinture de karaté dans la neige ». À droite : « Une sculpture transparente d'un canard réalisée en verre. La sculpture se trouve devant une peinture représentant un paysage ».

De plus, l'IA aurait un biais général en faveur de la génération d'images de personnes au teint plus clair ainsi qu'une « tendance à aligner les images représentant différentes professions sur les stéréotypes de genre occidentaux ». Les concurrents d'Imagen ont le même soucis : DALL-E a tendance à représenter le personnel de bord d'un avion comme des femmes, et les PDG comme des hommes.

Google précise également que son IA présente de sérieuses limitations lors de la génération d'images représentant des personnes. Tout cela pousse l'entreprise à conclure que son produit « n'est pas adapté à une utilisation publique sans mettre en place de garde-fous supplémentaires ».

Source :

The Verge

MacGeneration

iGeneration

WatchGeneration

Services

Rejoignez le Club iGen

Google présente une IA bluffante qui transforme n'importe quel texte en image

Pour aller plus loin :

Rejoignez le Club iGen

Actualités

La troisième bêta de macOS 26 apporte un nouveau fond d’écran, à télécharger ici

Tim + Trump = Toxic : Apple pris pour cible par Extinction Rebellion

Prime Day : l’iPhone 16e dès 592 €, un prix record sur Amazon

Prime Day : le MacBook Air M4 à moins de 1 000 € et des remises sur les modèles 512 Go

Les Antivirus pour Mac en 2025 📍

Test du clavier Keychron V10 Max : Alice au pays de Corneille ?

macOS Tahoe 26 : la bêta 3 est disponible pour les développeurs

Pétanque : une nouvelle app iPhone met fin aux débats autour du cochonnet

Creative Cloud : Adobe réduit le nombre de crédits génératifs pour les nouveaux abonnés sur certaines formules

Presque 4 ans après sa sortie, Windows 11 est enfin plus utilisé que Windows 10

Orange propose ChatGPT Plus à moitié prix pendant 6 mois à ses abonnés

ProtectEU : comment l’Union européenne veut affaiblir le chiffrement de bout en bout

F1 : la course vers la rentabilité est lancée pour le film d'Apple

FolderDrive : et si les SSD ressemblaient aux dossiers de macOS

Une carte cadeau Apple de 100 € vous rapporte 10 € sur Amazon

Un SMS, un clic… et des données envolées : pourquoi Incogni devient indispensable  📣

Image du moment

Tests

Test du clavier Keychron V10 Max : Alice au pays de Corneille ?

Test du Twelve South AirFly Pro 2 : pour s’enfiler en l’air

Test du ViewSonic ColorPro VP2788-5K : 27″, 5K et DCI-P3 pour le prix d’un demi-Studio Display

Test du BenQ PD2730S : un moniteur 5K de 27" attrayant

Test de l'Eaton 3S Mini : le mini onduleur pour les box internet… qui ne convient pas pour toutes

Test de l'Asustor Flashstor 12 Gen2 : le NAS « full SSD » qui bat des records

Pour aller plus loin :

Rejoignez le Club iGen

Actualités

La troisième bêta de macOS 26 apporte un nouveau fond d’écran, à télécharger ici

Tim + Trump = Toxic : Apple pris pour cible par Extinction Rebellion

Prime Day : l’iPhone 16e dès 592 €, un prix record sur Amazon

Prime Day : le MacBook Air M4 à moins de 1 000 € et des remises sur les modèles 512 Go

Les Antivirus pour Mac en 2025 📍

Test du clavier Keychron V10 Max : Alice au pays de Corneille ?

macOS Tahoe 26 : la bêta 3 est disponible pour les développeurs

Pétanque : une nouvelle app iPhone met fin aux débats autour du cochonnet

Creative Cloud : Adobe réduit le nombre de crédits génératifs pour les nouveaux abonnés sur certaines formules

Presque 4 ans après sa sortie, Windows 11 est enfin plus utilisé que Windows 10

Orange propose ChatGPT Plus à moitié prix pendant 6 mois à ses abonnés

ProtectEU : comment l’Union européenne veut affaiblir le chiffrement de bout en bout

F1 : la course vers la rentabilité est lancée pour le film d'Apple

FolderDrive : et si les SSD ressemblaient aux dossiers de macOS

Une carte cadeau Apple de 100 € vous rapporte 10 € sur Amazon

Un SMS, un clic… et des données envolées : pourquoi Incogni devient indispensable 📣

Image du moment

Tests

Test du clavier Keychron V10 Max : Alice au pays de Corneille ?

Test du Twelve South AirFly Pro 2 : pour s’enfiler en l’air

Test du ViewSonic ColorPro VP2788-5K : 27″, 5K et DCI-P3 pour le prix d’un demi-Studio Display

Test du BenQ PD2730S : un moniteur 5K de 27" attrayant

Test de l'Eaton 3S Mini : le mini onduleur pour les box internet… qui ne convient pas pour toutes

Test de l'Asustor Flashstor 12 Gen2 : le NAS « full SSD » qui bat des records

Un SMS, un clic… et des données envolées : pourquoi Incogni devient indispensable  📣