Google I/O : l'ère Gemini (et Android 15 attendra)

Pierre Dandumont |

Ce soir, Google organisait son grand raout annuel, Google I/O. Et cette année, le mot à la mode était évidemment IA, avec Gemini 1.5. D'ailleurs, si vous attendiez des nouvelles d'Android 15, mauvaise nouvelle : la nouvelle version de l'OS ne sera détaillée que lors de la seconde journée de la Google I/O 2024.

Sundar Pichai, présent sur scène devant de nombreux développeurs, a bien expliqué que Gemini allait être intégré dans tous les services, comme Google Photos. Une nouvelle fonction, Ask Photos, va permettre d'effectuer des recherches sur le contenu de vos photos de façon simple, en langage naturel.

Sundar Pichai annonce ensuite les Agents, une sorte d'assistant capable d'effectuer certaines tâches pour vous. Un des exemples est le retour d'une paire de chaussures trop petites, avec un assistant qui va effectuer les étapes nécessaires (mais pas aller poster le colis). Google met bien en avant que l'assistant travaille sous notre supervision. Dans Gmail, il sera possible de résumer des emails, si vous recevez un message un peu long.

Projet Astra

Google présente un nouveau produit, le projet Astra. Il s'agit d'un agent pour la vie de tous les jours, qui a été montré avec des lunettes connectées. Quelques exemples montrent l'assistant qui décrit des images, parfois avec un contexte à deviner, comme le chat de Schrödinger.

Google annonce aussi Imagen 3, un générateur d'image qui — enfin — est capable de générer du texte correctement (nous allons croire Google). Dans la même veine, une partie de la conférence met l'emphase sur la musique mais aussi sur la génération de vidéos à partir de texte.

Trilium, la nouvelle génération de TPU

Google annonce son nouveau TPU (Tensor Processing Unit), Trilium, et rappelle qu'Axion, son système sur puce pour les serveurs, existe. Sundar Pichai montre aussi que les serveurs de la société emploient un refroidissement liquide. Trilium, 4,7x plus rapide que les puces actuelles pour l'IA, sera disponible en fin d'année 2024 pour les clients cloud.

Google a sa propre puce pour les serveurs, Axion

Google a sa propre puce pour les serveurs, Axion

Une intégration dans la recherche

Pour la recherche, Google tente de se redéfinir, avec des exemples frappants (en espérant que cette année, ils ne soient pas simulés). Un des exemples montre une personne en train de filmer une platine en posant une question directement au smartphone, et l'IA de Google donne une réponse qui semble correcte. C'est évidemment un cas d'usage un peu particulier, mais l'intégration des outils semble bonne. D'autres exemples montrent que l'IA peut chercher des recettes, par exemple.

De façon plus large, l'idée est de proposer une réponse à une question, sans nécessairement renvoyer l'utilisateur vers des sites Internet, mais aussi de permettre d'améliorer peu à peu une question, en étant de plus en plus précis, en laissant l'IA se débrouiller.

Gemini Live

Google annonce une application Gemini Live, avec laquelle vous pouvez discuter en temps réel. L'intégration du projet Astra, plus tard dans l'année, devrait permettre d'analyser de la vidéo.

En parallèle, la société montre aussi les Gems, qui peuvent se résumer à un Gemini personnalisé pour un usage précis.

Pour les Français, bonne nouvelle : Gemini Advanced arrive en France dans un abonnement à 22 € par mois, qui donne accès aux intégrations liées à Gmail mais aussi à 2 To de stockage dans le cloud.

Une intégration dans Android

Google annonce qu'Android 15 va intégrer Gemini et que la fonction Circle to Search (Encercler pour Rechercher) allait être déployée sur de nombreux appareils (200 millions d'ici fin 2024 selon Google). Gemini Nano (le LLM pas si large, du coup) va être intégré dans plus d'appareils et gagne la possibilité d'analyser des images. De même, dans une présentation très visuelle, il est capable de vous prévenir si un appel est du spam (sinon, les applications Orange font le job).

Astuce : avoir la fonction « Encercler pour chercher » des téléphones Android sur iPhone

Astuce : avoir la fonction « Encercler pour chercher » des téléphones Android sur iPhone

Pour une IA responsable

Un des derniers intervenants, nous parle du fait qu'un grand pouvoir implique de grandes responsabilités (à peu près). Google indique que SynthID, qui permet de détecter des images générées par IA, va être adapté pour effectuer la même tâche pour le texte, avec une implémentation open source.

Pour terminer, Sundar Pichai montre que son IA a appris à compter : elle indique qu'il a prononcé le mot IA 120... 121 fois. Une valeur à vérifier une fois le replay de la conférence en ligne.

avatar MartyNick | 

Où l'on voit les limites de l'usage de l'IA à date.
On peut déjà chercher par mots clés dans ses photos depuis longtemps, soit par recherche de texte dans l'image ou recherche contextuelle dans l'image.
On vient rajouter le langage naturel pour faire savant alors que la plus-value est quasiment nulle.
On vend des fonctions déjà existantes au chaland...

avatar yod75 | 

@ MartyNick
Tu serais surpris du nombre de personnes qui rament avec les mots clés... si le machin comprends les tournures de phrases approximatives, il peut être utile à beaucoup

avatar MartyNick | 

@yod75

Je viens de tester dans Photos en dictant et en tapant « au bord de l’eau », « lundi », « lundi soir », « à la campagne »,
« Dans les champs ».
Il n’y a qu’à la campagne qui n’a rien donné.
Je me répète c’est assez superficiel comme annonce.
Fantastical proposait déjà l’ajout de rendez vous en langage naturel, il y a de ça plus de 6 ans !

avatar nanni | 

@MartyNick

J’ai fait ces recherches également et j’ai tout et n’importe quoi . De la neige, des photos de nuit , des selfies des photos de voitures … bref ça ressemble à rien mais bon c’est Apple ça ne peut être que parfait semble t’il

avatar MartyNick | 

@nanni

Alors c’était un peu mieux chez moi mais clairement pas parfait.
Je me suis un peu plus documenté.
Ça a été intégré lors de l’adoption de la fonction des albums automatiques généré par l’iPhone donc il y a un moment déjà.
Déjà chez Apple c’est un gimmick.
La fonction albums automatiques est cool mais si je n’avais pas d’Apple TV, je ne les regarderais jamais.
Et comme vous le faites remarquer, il y a des ratés.
Je ne dis pas que ça serait inutile ad vitam aeternam mais en l’état Google ne propose aucune use case.
Pour exemple, en 2006,, les macs proposaient déjà de reconnaître les visages dans photos mais il fallait les qualifier, éliminer les erreurs, retrouver les oubliés.
Ça ne servait pas à grand chose si ce n’est à chercher rapidement les photos mais le temps gagné avec été perdu avant dans la qualification.
Maintenant, c’est automatique soit mais quel est le use case ?

avatar nhtud948 | 

GooglUseless…

ChatGPT montre encore la supériorité de son langage.

avatar macbook60 | 

Sur l’application Google en haut il y’a une option pour activer gemini

avatar ratz | 

Hmm ?.ou ça svp? Je vois pas

avatar macbook60 | 

@ratz

Tout en haut il y a un deuxième bouton recherché et le symbole de Gemini

avatar Brice21 | 

@macbook60

Je crois que tu confonds avec Google Lens qui permet de rechercher ce que l’on voit à la caméra, depuis des années.

avatar macbook60 | 

@Brice21

Non je connais Google Lens je ne peut pas envoyer de capture ici dommage

avatar ratz | 

@macbook60

Je vois pas du tout, tu parles de lappli google sur iOS et android ??

avatar macbook60 | 

@ratz

Application Google sur iOS

avatar Nico_Belgium | 

Vivement les commentaires pour expliquer pour la millième fois à quel point Apple est en retard par rapport à Google 👀

Je sors les pop corn

avatar raoolito | 

😅

avatar Gotmilker | 

@Nico_Belgium

Non pas du tout. Ils sont largement en avance sur les casques à 4000€.

avatar jackhal | 

Ça c'était avant qu'Apple sorte le M4 et gagne définitivement la guerre de l'IA.

P.S. : ceci est une information objective et incontestable. Il est donc inutile de tenter de la contester avec des avis irrationnels.

avatar Mageekmomo | 

Allez, c’est parti, voilà venir la valse des experts débutants qui nous expliquent la vie en commentaire.

avatar nova313 | 

À part de l’IA, y’a rien à se mettre sous la dent 😕

avatar Artefact3000 | 

Je dois avouer que les conférences de Google, Samsung et même Microsoft me fascine. J'espère toujours que ça soit vrai. Je sais, je suis un grand romantique.

avatar DG33 | 

Non mais oh, c’est quoi cet 🌈 sur la première photo ?

avatar roccoyop | 

@DG33

C’est pas un arc en ciel. Ce ne sont que les 4 couleurs de Google. L’arc en ciel en a 7.

avatar Lecorbubu | 

Non pas que les technologies présentées ne soient pas puissantes ou intéressantes, je n’ai pas la capacité d’évaluer cela, par contres les vidéos démos proposées ici par Google donnent vraiment l’impression que cela s’adresse à des personnes devenues complètements bêtes …

avatar Furious Angel | 

@Lecorbubu

Oui… Des gens pas capables de renvoyer des chaussettes et de lire un mail de trois paragraphes. C’est pas ça que j’attends de l’IA

avatar Madalvée | 

Tant que les imbéciles continueront à créer du contenu web pour se le faire pomper par quelqu'un d'autre qui fera du fric avec, ça marchera.

avatar ratz | 

D'accord mais c'est pour quand, et quand est ce que on pourra utiliser ça en France ?

Et l'intégration gmail pour résumer les mails est payante, uniquement avec le forfait a 22 balles ?

Quand est ce que tous ces services seront disponibles et utilisables par le grand public, et surtout en Europe ?

avatar Soner | 

Rien d’impressionnant

avatar Yves SG | 

Je comprends bien que cette démo est sensée être très impressionnante, mais en fait je ne la trouve pas même interessante.
Il peut le faire. Ok. Et après ?

avatar Yves SG | 

En plus, il est semble-t-il complètement nul.
Premier essai, avec la question relativement simple voire très simple) :
« À quoi sert un compte courant d’associé »

Réponse :
« Un compte courant d'associé est un compte bancaire utilisé pour enregistrer les flux financiers entre un associé et son entreprise. Il fonctionne comme un compte bancaire classique, mais avec des caractéristiques spécifiques… » 🤦‍♂️

ChatGPT s’en sort infiniment mieux

avatar Glop0606 | 

J’ai regardé la présentation et j’ai trouvé ça tellement mou du genou. Je dois dire que je m’attendais à mieux. En tout cas ce matin la vidéo du gamin et son père avec Chat Gpt en instituteur de poche m‘a carrément plus bluffé que toute la présentation de Google. Et puis pourquoi avoir scindé Gemini et la présentation d’androïd 15? C’est la symbiose des deux qui est interessante.

avatar picpic | 

Lire cette actualité m’a rappelé une démo faite par Google en 2018 : Google Duplex, une IA qui prenait rendez-vous au téléphone en interagissant avec un humain sans que ce dernier ne s’en rende compte

https://youtu.be/D5VN56jQMWM?feature=shared

Je me rappelle qu’à l’époque beaucoup se demandaient à quel point Google avait « bidonné » la vidéo de démo tant tout semblait fluide et était impressionnante (il suffit d’écouter les réactions du public)

Force est de constater qu’avec les annonces d’OpenAi et de Google ces derniers jours, on y est ! Les intonations de voix, les « hmmm », les faux rires…

avatar Yves SG | 

@picpic

Merci du partage !
C’est étonnant, l’Ia de Google aurait été plus avancée il y a 6 ans qu’aujourd’hui ?

avatar Brice21 | 

@Yves SG

Entre la démo et la release il y a l’ombre.

avatar Furious Angel | 

Beaucoup de choses un peu spectaculaires mais parfaitement inutiles. Et des usages que je ne vois absolument personne adopter, quand on voit ceux qu’ils ont aujourd’hui…

avatar pat3 | 

On est d’accord que Astra n’a aucune intérêt ?
J’ai trouvé search in the Gemini Era plus intéressant… mais c’est un montage vidéo. J’attendrais de voir ce que ça donne en vrai.

avatar Ingmar97432 | 

C’est mon grand âge qui me rattrape avec des neurones en chute libre ou la deuxième vidéo est lue en accéléré? Même pas le temps de lire que ça change de plan.. 😰
Ça me fait penser aux pubs ou aux dessins animés.
Toujours plus vite. Après on s’étonne que les gens sont stressés et fatigués.

avatar smog | 

Je ne fais pas un gros usage des "IA génératives" textuelles, mais pour le code relativement simple, je trouve Gemini plus performant que chatGPT. Par exemple, quand j'ai besoin d'exemples en PyQt6, Gemini est largement mieux. ChatGPT (3.5) change les 5 en 6, et considère que les bibliothèques PyQt5 sont identiques aux 6. J'ai pas trouvé d'amélioration significative avec la version 4.
Comme quoi, ça dépend de ce que l'on cherche à faire.

PS : étant dans le supérieur, je participe à la sélection "Parcoursup" : aujourd'hui 95% des (futurs) étudiants font leur lettre de motivation avec ces outils, mais ces derniers ne savent pas faire. C'est bien écrit mais la notion de "motivation" est comprise comme "écrire que je suis motivé". Malgré les variantes, l'esprit est le même dans chaque lettre. L'avantage certain, c'est que niveau orthographe c'est bien plus qualitatif que les années précédentes !

avatar Ingmar97432 | 

@smog

"L'avantage certain, c'est que niveau orthographe c'est bien plus qualitatif que les années précédentes !"

Ça pique moins vos yeux mais ils seront encore plus mauvais à force de ne plus écrire eux-mêmes.

avatar Jacksong | 

Les lettres de motivation IA c'est grillé à des kilomètres.
Personnellement lorsque je fait du recrutement je met ça en point négatif.

CONNEXION UTILISATEUR