Sans surprise, l’IA était la vedette de la grande conférence de Google ayant eu lieu hier soir. L’entreprise a dévoilé Gemini 3.5 Flash, présenté comme sa meilleure offre à ce jour en matière de codage et d'agents IA autonomes. Elle a également levé le voile sur Omni, un modèle multimodal pensé pour transformer du texte ou des images en vidéo.

Commençons avec Gemini 3.5 Flash, que Google présente comme son modèle le plus solide pour le codage et les tâches dites « agentiques » (ces enchaînements d’actions où l’IA va planifier et exécuter des tâches au fil de l’eau). L’entreprise affirme qu’il dépasse Gemini 3.1 Pro sur plusieurs tests liés au développement et aux agents autonomes, tout en conservant la promesse de vitesse de la gamme Flash.
Cette vitesse est l’un de ses arguments principaux : selon Google, Gemini 3.5 Flash produit ses réponses jusqu’à quatre fois plus rapidement que certains modèles concurrents de pointe, tout en restant capable de gérer des tâches longues et complexes. L’entreprise imagine déjà des usages très concrets, par exemple pour moderniser une vieille base de code ou analyser de longs documents financiers. Le modèle est disponible dès maintenant dans l’app Gemini ainsi que pour les développeurs via Google AI Studio, Android Studio et l’API Gemini.
Il y a toutefois un revers pour les développeurs : Gemini 3.5 Flash coûte nettement plus cher que les précédents modèles Flash. Comme le relève Simon Willison, le tarif atteint 1,50 $ par million de jetons en entrée et 9 $ par million de jetons en sortie, soit trois fois le prix de Gemini 3 Flash Preview et six fois celui de Gemini 3.1 Flash-Lite. À ce niveau, Gemini 3.5 Flash se rapproche de Gemini 3.1 Pro, facturé 2 $ en entrée et 12 $ en sortie, ce qui rend le positionnement « Flash » un peu moins évident qu’avant : le modèle reste rapide, mais il n’est plus vraiment bon marché.
De son côté, Omni Flash est un modèle multimodal plus axé sur la vidéo. Il peut générer des vidéos à partir de texte, mais aussi combiner plusieurs types de contenus. On pourra ainsi mélanger des images, de l’audio, une vidéo existante avec des consignes écrites. Google insiste surtout sur sa capacité à garder le fil d’une scène : il devrait préserver des personnages cohérents et respecter une certaine logique physique.
On peut demander à Omni de changer un décor, d’ajouter un objet, de modifier un mouvement, d’appliquer un style visuel ou de synchroniser certains éléments avec une musique. Google promet aussi une meilleure compréhension du monde réel, par exemple pour produire des scènes où la gravité ou les liquides paraissent plus réalistes. Omni Flash est dès à présent disponible dans l’app Gemini pour les utilisateurs payants, avec un déploiement prévu plus tard pour les développeurs et les entreprises via API.













