Ouvrir le menu principal

MacGeneration

Recherche

Veo, Imagen : Google améliore ses outils de générations d’images et de vidéos


Google a dévoilé de nombreuses nouveautés liées à l’IA lors de sa grande conférence I/O, avec du neuf pour la génération d’images et de vidéos. Le modèle Imagen 4 est désormais disponible pour tous via l’app Gemini et à travers les applications Google Workspace. Google a surtout amélioré la gestion du texte, ce qui devrait simplifier la création de flyers ou de cartes.

Une image créée avec Imagen 4. Image Google

Les modèles de générations d’images ont pendant longtemps été très mauvais pour reproduire du texte, produisant un gloubiboulga incompréhensible. OpenAI avait commencé à corriger le tir dès 2023 avec DALL-E 3, mais la technologie restait assez perfectible. GPT-4o a amélioré les choses en début d’année, et Google cherche désormais à se mettre au niveau. La firme de Mountain View affirme qu’Imagen est nettement plus performant en orthographe et en typographie. Il devrait également mieux se débrouiller avec des détails fins, comme les tissus complexes, les gouttes d'eau et le pelage des animaux.

Google a annoncé qu’une version encore plus rapide d'Imagen 4 serait déployée « prochainement ».

Google a aussi lancé un nouveau modèle de génération de vidéo baptisé Veo 3, qui a comme principal intérêt de pouvoir créer du son (ce qu’OpenAI ne propose pas encore avec Sora). L’entreprise a partagé quelques vidéos montrant les résultats, qui semblent assez impressionnants. Elle affirme que le modèle se débrouille très bien pour la gestion de la physique ou la synchronisation labiale. Cette nouveauté n’est pour le moment accessible qu’aux États-Unis pour les abonnés à l’onéreux forfait Ultra à 249 $ par mois.

Le modèle précédent Veo 2 a été amélioré : les utilisateurs peuvent désormais plus facilement gérer la caméra, demander au service d’imaginer ce qui se passe à l’extérieur d’une image ou encore ajouter/supprimer des éléments. L’entreprise a également lancé Flow, un logiciel de montage par IA combinant Veo, Imagen et Gemini afin de créer des vidéos complexes avec des invites textuelles. La nouveauté est réservée aux utilisateurs américains avec un abonnement Pro ou Ultra.

macOS 27 enterre les Time Capsule, mais le projet les ramenant à la vie arrive à maturité

10/06/2026 à 22:30

• 13


Avec Tap to Share, l’iPhone gère désormais bien plus que le paiement, sauf en UE

10/06/2026 à 21:44

• 55


Gemini en carafe chez plusieurs utilisateurs, affichant une surcharge des serveurs

10/06/2026 à 20:20

• 13


macOS Golden Gate 27 : comment Apple remet d’équerre l’interface du Mac

10/06/2026 à 18:32

• 34


Avant visionOS, Apple avait préféré xrOS et realityOS

10/06/2026 à 17:30

• 1


WWDC 2026 : des easter eggs se cachaient partout dans le keynote d’Apple

10/06/2026 à 16:11

• 17


Offrez à votre Mac la suite Microsoft Office 2021 complète pour 44,99 €, à vie 📍

10/06/2026 à 15:39

• 0


macOS 27 Golden Gate fait la chasse aux applications qui s'incrustent en arrière-plan

10/06/2026 à 15:10

• 24


L’iPhone 17 est légèrement rétrogradé par iOS 27

10/06/2026 à 14:58

• 78


Promo : 40 € de réduction sur les 2 MacBook Neo

10/06/2026 à 14:18

• 5


Trois pays bloquent les messages RCS chiffrés de façon globale avec iOS 27 : la Chine, la Corée du Sud… et la France

10/06/2026 à 13:55

• 121


Après avoir augmenté ses prix, Starlink fait payer la location de l'antenne 10 € par mois

10/06/2026 à 13:10

• 16


Anthropic dévoile Claude Fable, son premier modèle de la famille Mythos

10/06/2026 à 12:03

• 29


Siri AI n'est pas un fake : contrairement à son prédécesseur, il existe bel et bien !

10/06/2026 à 11:48

• 15


WWDC 2026 : toutes les petites nouveautés passées sous silence

10/06/2026 à 10:12

• 42


Les principales nouveauté d’iOS 27 selon Apple

10/06/2026 à 09:39

• 25