Ouvrir le menu principal

MacGeneration

Recherche

Veo, Imagen : Google améliore ses outils de générations d’images et de vidéos

Félix Cattafesta

mercredi 21 mai 2025 à 15:58 • 9

Ailleurs

Google a dévoilé de nombreuses nouveautés liées à l’IA lors de sa grande conférence I/O, avec du neuf pour la génération d’images et de vidéos. Le modèle Imagen 4 est désormais disponible pour tous via l’app Gemini et à travers les applications Google Workspace. Google a surtout amélioré la gestion du texte, ce qui devrait simplifier la création de flyers ou de cartes.

Une image créée avec Imagen 4. Image Google

Les modèles de générations d’images ont pendant longtemps été très mauvais pour reproduire du texte, produisant un gloubiboulga incompréhensible. OpenAI avait commencé à corriger le tir dès 2023 avec DALL-E 3, mais la technologie restait assez perfectible. GPT-4o a amélioré les choses en début d’année, et Google cherche désormais à se mettre au niveau. La firme de Mountain View affirme qu’Imagen est nettement plus performant en orthographe et en typographie. Il devrait également mieux se débrouiller avec des détails fins, comme les tissus complexes, les gouttes d'eau et le pelage des animaux.

Google a annoncé qu’une version encore plus rapide d'Imagen 4 serait déployée « prochainement ».

Google a aussi lancé un nouveau modèle de génération de vidéo baptisé Veo 3, qui a comme principal intérêt de pouvoir créer du son (ce qu’OpenAI ne propose pas encore avec Sora). L’entreprise a partagé quelques vidéos montrant les résultats, qui semblent assez impressionnants. Elle affirme que le modèle se débrouille très bien pour la gestion de la physique ou la synchronisation labiale. Cette nouveauté n’est pour le moment accessible qu’aux États-Unis pour les abonnés à l’onéreux forfait Ultra à 249 $ par mois.

Le modèle précédent Veo 2 a été amélioré : les utilisateurs peuvent désormais plus facilement gérer la caméra, demander au service d’imaginer ce qui se passe à l’extérieur d’une image ou encore ajouter/supprimer des éléments. L’entreprise a également lancé Flow, un logiciel de montage par IA combinant Veo, Imagen et Gemini afin de créer des vidéos complexes avec des invites textuelles. La nouveauté est réservée aux utilisateurs américains avec un abonnement Pro ou Ultra.

Rejoignez le Club iGen

Soutenez le travail d'une rédaction indépendante.

Rejoignez la plus grande communauté Apple francophone !

S'abonner

Un SMS, un clic… et des données envolées : pourquoi Incogni devient indispensable  📣

10:00

• 0


Aperçu des nouveautés de Raccourcis dans iOS 26 et macOS 26 : Apple intègre (presque) un chatbot

08:00

• 17


Test du Twelve South AirFly Pro 2 : pour s’enfiler en l’air

05/07/2025 à 11:00

• 9


Sortie de veille : un MacBook avec une puce d’iPhone, attrape-nigaud ou coup de génie ?

05/07/2025 à 08:00

• 25


Un dirigeant de Microsoft conseille aux plus de 9 000 employés licenciés de se faire aider par l’IA

04/07/2025 à 22:00

• 190


Apple fait ses emplettes dans les start-up, entre avatars virtuels et monitoring de l’IA

04/07/2025 à 21:00

• 1


Un premier pas vers le jailbreak de la Touch Bar : le système démarre en mode verbose

04/07/2025 à 17:45

• 27


MacBook Air M2 à 750 € ou Mac Studio M2 Max à 1 300 € ? Entre portable et fixe, il faut choisir

04/07/2025 à 15:22

• 28


Un (faux) traceur GPS sur les cartons des MacBook Air, pour dissuader les livreurs de les voler

04/07/2025 à 13:02

• 83


Un site web pour décoder les pages sauvées en .webarchive par Safari

04/07/2025 à 11:00

• 7


Ulanzi présente une station d'accueil au look de petit Mac Pro

04/07/2025 à 10:15

• 17


Promo : une batterie chameau de 27650 mAh capable de recharger Mac et iPhone à 114 € (-56 €)

04/07/2025 à 09:18

• 13


Développeurs : Technotes ajoute des notes de la communauté sur la documentation d’Apple

04/07/2025 à 08:33

• 5


L’iPhone redécolle en Chine, le Mac cartonne aux États-Unis : Apple souffle un peu avant les trimestriels le 31

04/07/2025 à 07:52

• 42


Apple a creusé l’idée de proposer des services de cloud computing aux développeurs pour concurrencer AWS

03/07/2025 à 21:45

• 48


Apple sort des fonds d’écran aux couleurs de son nouvel Apple Store à Osaka

03/07/2025 à 21:00

• 10