Ouvrir le menu principal

MacGeneration

Recherche

Veo, Imagen : Google améliore ses outils de générations d’images et de vidéos

Félix Cattafesta

mercredi 21 mai 2025 à 15:58 • 7

Ailleurs

Google a dévoilé de nombreuses nouveautés liées à l’IA lors de sa grande conférence I/O, avec du neuf pour la génération d’images et de vidéos. Le modèle Imagen 4 est désormais disponible pour tous via l’app Gemini et à travers les applications Google Workspace. Google a surtout amélioré la gestion du texte, ce qui devrait simplifier la création de flyers ou de cartes.

Une image créée avec Imagen 4. Image Google

Les modèles de générations d’images ont pendant longtemps été très mauvais pour reproduire du texte, produisant un gloubiboulga incompréhensible. OpenAI avait commencé à corriger le tir dès 2023 avec DALL-E 3, mais la technologie restait assez perfectible. GPT-4o a amélioré les choses en début d’année, et Google cherche désormais à se mettre au niveau. La firme de Mountain View affirme qu’Imagen est nettement plus performant en orthographe et en typographie. Il devrait également mieux se débrouiller avec des détails fins, comme les tissus complexes, les gouttes d'eau et le pelage des animaux.

Google a annoncé qu’une version encore plus rapide d'Imagen 4 serait déployée « prochainement ».

Google a aussi lancé un nouveau modèle de génération de vidéo baptisé Veo 3, qui a comme principal intérêt de pouvoir créer du son (ce qu’OpenAI ne propose pas encore avec Sora). L’entreprise a partagé quelques vidéos montrant les résultats, qui semblent assez impressionnants. Elle affirme que le modèle se débrouille très bien pour la gestion de la physique ou la synchronisation labiale. Cette nouveauté n’est pour le moment accessible qu’aux États-Unis pour les abonnés à l’onéreux forfait Ultra à 249 $ par mois.

Le modèle précédent Veo 2 a été amélioré : les utilisateurs peuvent désormais plus facilement gérer la caméra, demander au service d’imaginer ce qui se passe à l’extérieur d’une image ou encore ajouter/supprimer des éléments. L’entreprise a également lancé Flow, un logiciel de montage par IA combinant Veo, Imagen et Gemini afin de créer des vidéos complexes avec des invites textuelles. La nouveauté est réservée aux utilisateurs américains avec un abonnement Pro ou Ultra.

Rejoignez le Club iGen

Soutenez le travail d'une rédaction indépendante.

Rejoignez la plus grande communauté Apple francophone !

S'abonner

La Chine envoie des supercalculateurs dans l’espace

21/05/2025 à 22:15

• 15


OpenAI se paie l’entreprise de Jony Ive et d’anciens designers d’Apple pour 6,5 milliards de dollars

21/05/2025 à 20:30

• 49


Raycast permet d’exploiter un modèle local pour utiliser l’IA gratuitement et sans serveurs

21/05/2025 à 18:30

• 9


SynthID Detector : le futur portail de Google pour détecter les contenus générés par IA

21/05/2025 à 18:00

• 4


Kernel Panic : Flutter ou Swift, deux visions s’affrontent

21/05/2025 à 17:00

• 6


Veo, Imagen : Google améliore ses outils de générations d’images et de vidéos

21/05/2025 à 15:58

• 7


MacBook Air M4 : la chute des prix se poursuit encore sur ce nouvel incontournable 🆕

21/05/2025 à 12:22

• 88


La Magic Mouse USB-C en promo à 65 € (- 24 %)

21/05/2025 à 12:20

• 9


AI Mode : comment Google va transformer son moteur de recherche avec Gemini

21/05/2025 à 12:19

• 11


Les drones d'Amazon livrent des iPhone et AirPods en 60 min chrono

21/05/2025 à 11:30

• 64


WhatsApp : cette arnaque s’affiche dans votre fil de discussion officiel 📍

21/05/2025 à 11:14

• 0


Promo : jusqu'à -12 % sur des Mac mini et iMac M4

21/05/2025 à 10:45

• 14


Gemini va s’intégrer à Chrome pour analyser les pages web

21/05/2025 à 10:32

• 12


Google Chrome va bientôt pouvoir automatiquement changer vos mots de passe en fuite

21/05/2025 à 09:44

• 3


Google AI Ultra : un abonnement à 249 $/mois pour avoir le meilleur de Gemini et plus encore

20/05/2025 à 21:00

• 29


Test de l'Asustor Flashstor 12 Gen2 : le NAS « full SSD » qui bat des records

20/05/2025 à 20:30

• 2