Pico-Banana-400K : Apple publie un énorme jeu de données pour apprendre à retoucher les photos par texte

Félix Cattafesta

mercredi 29 octobre 2025 à 16:32 • 3

Malgré les fortes turbulences dans le domaine, Apple continue de plancher sur l’IA et vient de publier Pico-Banana-400K. Il s’agit d’un jeu de données comportant 400 000 exemples d’édition d’images guidée par texte. Il a été pensé pour améliorer les systèmes d’IA visant à retoucher des photos depuis une demande textuelle.

Apple explique avoir suivi avec intérêt l’évolution des modèles permettant d’éditer une photo avec du texte, citant par exemple les travaux de Google ou d’OpenAI. Cependant, elle note que les progrès ont pu être limités par l’absence de données d’entraînement tirées de vraies photos. Le but de Pico-Banana-400K est donc de corriger le tir avec un corpus massif, proprement annoté et construit sur d'authentiques clichés plutôt que sur des images artificielles générées de toutes pièces.

Pour cela, Apple a utilisé la base de données Open Images avant de les passer à la moulinette de Gemini-2.5 Flash. Celui-ci suggère des modifications (« change la couleur du ciel ») avant que le Nano-Banana de Google s’exécute. Gemini-2.5 Pro juge ensuite du résultat et met de côté les plus qualitatifs. Les résultats jugés trop insuffisant ne sont pas jetés, et Apple en a gardé environ 56 000 pour l’alignement de modèles, c’est-à-dire pour apprendre ce qui est bon et ce qui est moins bon.

La création de la base de données selon Apple.

Le jeu comporte 35 catégories différentes. On y trouve des retouches simples (ajoute un objet, change une couleur) ou des transformations plus globales (change la météo). Sont également inclus des cas dans lesquels le style graphique ou le texte affiché sont modifiés. Il inclut aussi 72 000 dialogues d’édition multi-étapes, où une image est modifiée tour après tour. L’étude permet de voir que Nano-Banana n’est pas infaillible : s’il s’en sort bien 93 % du temps pour changer un style, la modification de texte ou le changement de place d’un objet ne fonctionne pas plus de 40 % du temps.

Apple mentionne dans le papier que fabriquer Pico-Banana-400K a coûté environ 100 000 dollars et que l’ensemble du corpus a été généré quasi intégralement sans annotation humaine manuelle. La base de données peut être téléchargée sur GitHub et est sous licence gratuite pour une utilisation non commerciale.

Pour les 50 ans d’Apple, MacGeneration publie un livre événement

Précommandez-le dès maintenant et profitez-en pour découvrir nos nouveaux goodies, ou prolonger votre abonnement au Club iGen à tarif réduit.

Découvrez nos offres

MacGeneration

iGeneration

WatchGeneration

Services

Rejoignez le Club iGen

Pico-Banana-400K : Apple publie un énorme jeu de données pour apprendre à retoucher les photos par texte

Pour les 50 ans d’Apple, MacGeneration publie un livre événement

Précommandez le livre et rejoignez la fête

Actualités

50 ans d’Apple : J-7 pour commander notre livre (et gagner un MacBook Neo pas comme les autres)

Le MacBook Neo a moins de capteurs : il ne mesure pas l'angle de l'écran et ne pèse pas avec son trackpad

Des MacBook Air M1 256 Go à partir de 357 €

Samsung n'abandonne pas encore les SSD SATA et lance même un modèle 870 EVO de 8 To

25 ans de Mac OS X : de 10.3 à 10.6, le temps de mûrir, pour mieux enterrer le PowerPC

Trop risqué et trop coûteux : le mode coquin de ChatGPT mis en pause « indéfiniment »

Free promet une « nouvelle révolution mobile » le 31 mars

Pourquoi les lunettes connectées ne détrôneront sans doute pas le smartphone

Safari 26.4 apporte de nombreuses nouveautés aux créateurs de sites web

La guerre des prix sur les produits Apple est lancée entre Joybuy et Amazon

Mahsa Alert : l’app que personne ne devrait avoir à installer

Honda rétrograde sur l'électrique et envoie à la casse la voiture imaginée avec Sony

Portrait d’un « Apple Pin » : à quoi faut-il s’attendre pour le futur compagnon de l’iPhone ?

Web mobile : Android met Safari dans le rétroviseur

Le Launchpad est mort, mais Apple veut bloquer les clones

25 ans de Mac OS X : de 10.0 à 10.2, l’ère des pionniers

Image du moment

Tests

Test des MacBook Pro M5 Pro et M5 Max : rien ne change dehors, tout change dedans

Test du MacBook Air M5 : meilleur que le M4, mais jusqu'à quel point ?

Test du MacBook Neo : le portable pour le reste d’entre nous

Test du Kuxiu X53 : un support pour MacBook avec un hub USB intégré

Test des webcams Insta360 Link 2 Pro et Link 2C Pro : 4K, IA et suivi motorisé, Insta360 monte en gamme

Test de l'écran 5K de Japannext : pas de fioritures et un prix intéressant