Ouvrir le menu principal

MacGeneration

Recherche

Pico-Banana-400K : Apple publie un énorme jeu de données pour apprendre à retoucher les photos par texte

Félix Cattafesta

mercredi 29 octobre 2025 à 16:32 • 2

Intelligence artificielle

Malgré les fortes turbulences dans le domaine, Apple continue de plancher sur l’IA et vient de publier Pico-Banana-400K. Il s’agit d’un jeu de données comportant 400 000 exemples d’édition d’images guidée par texte. Il a été pensé pour améliorer les systèmes d’IA visant à retoucher des photos depuis une demande textuelle.

Image Apple

Apple explique avoir suivi avec intérêt l’évolution des modèles permettant d’éditer une photo avec du texte, citant par exemple les travaux de Google ou d’OpenAI. Cependant, elle note que les progrès ont pu être limités par l’absence de données d’entraînement tirées de vraies photos. Le but de Pico-Banana-400K est donc de corriger le tir avec un corpus massif, proprement annoté et construit sur d'authentiques clichés plutôt que sur des images artificielles générées de toutes pièces.

Pour cela, Apple a utilisé la base de données Open Images avant de les passer à la moulinette de Gemini-2.5 Flash. Celui-ci suggère des modifications (« change la couleur du ciel ») avant que le Nano-Banana de Google s’exécute. Gemini-2.5 Pro juge ensuite du résultat et met de côté les plus qualitatifs. Les résultats jugés trop insuffisant ne sont pas jetés, et Apple en a gardé environ 56 000 pour l’alignement de modèles, c’est-à-dire pour apprendre ce qui est bon et ce qui est moins bon.

La création de la base de données selon Apple.

Le jeu comporte 35 catégories différentes. On y trouve des retouches simples (ajoute un objet, change une couleur) ou des transformations plus globales (change la météo). Sont également inclus des cas dans lesquels le style graphique ou le texte affiché sont modifiés. Il inclut aussi 72 000 dialogues d’édition multi-étapes, où une image est modifiée tour après tour. L’étude permet de voir que Nano-Banana n’est pas infaillible : s’il s’en sort bien 93 % du temps pour changer un style, la modification de texte ou le changement de place d’un objet ne fonctionne pas plus de 40 % du temps.

Apple mentionne dans le papier que fabriquer Pico-Banana-400K a coûté environ 100 000 dollars et que l’ensemble du corpus a été généré quasi intégralement sans annotation humaine manuelle. La base de données peut être téléchargée sur GitHub et est sous licence gratuite pour une utilisation non commerciale.

Soutenez MacGeneration sur Tipeee

MacGeneration a besoin de vous

Vous pouvez nous aider en vous abonnant ou en nous laissant un pourboire

Soutenez MacGeneration sur Tipeee

Sam Altman, frustré, annule sa commande de Tesla Roadster et se prend un mur

31/10/2025 à 21:00

• 38


Votre iPhone 18 Pro, vous le prendrez plutôt café, violet ou bordeaux ?

31/10/2025 à 17:13

• 45


Cette extension pour Chrome reprend une idée populaire d’Arc pour changer d’onglet

31/10/2025 à 15:20

• 5


Le gouvernement américain voudrait bannir TP-Link pour des raisons de sécurité nationale

31/10/2025 à 11:30

• 20


Le Black Friday a déjà commencé chez Boulanger, qui autorise les retours jusqu’au 31 janvier

31/10/2025 à 10:31

• 5


Attention aux tentatives d'arnaques en lien avec les données volées à Bouygues Telecom

31/10/2025 à 10:19

• 35


iOS 26.1, nouveau matériel : que nous réserve le mois de novembre d’Apple ?

31/10/2025 à 10:01

• 23


Bon plan : le MacBook Air M4 avec 24 Go de RAM et SSD 512 Go à 1 347 €

31/10/2025 à 08:44

• 12


iPhone 17 : un succès au-delà des attentes

31/10/2025 à 08:10

• 48


WhatsApp va bientôt débarquer sur l'Apple Watch

31/10/2025 à 07:35

• 44


Apple, le grand retour : 2025 finit bien mieux qu’elle n’avait commencé

30/10/2025 à 22:57

• 29


Meta perd plus de 200 milliards de valorisation boursière, suite aux doutes sur ses investissements dans l’IA

30/10/2025 à 21:45

• 105


Prosser vs Apple : l’intermédiaire nie avoir prémédité la fuite de l’interface d’iOS 26

30/10/2025 à 21:30

• 5


Le support auto pour iPhone qui aimante vos trajets

30/10/2025 à 21:22

• 0


Comme Microsoft, Google va rouvrir une centrale nucléaire pour ses data-centers

30/10/2025 à 21:00

• 29


La suite Affinity devient totalement gratuite, mais fait payer l'accès à l'IA

30/10/2025 à 19:24

• 79