Siri pourrait devenir bien plus malin avec cette avancée des chercheurs d’Apple

Stéphane Moussie |

La pile des articles de recherche d’Apple dans le domaine de l’intelligence artificielle continue de grossir. Le dernier en date, publié fin mars, décrit un système destiné à améliorer la compréhension du contexte par un assistant conversationnel — vous avez dit Siri ?

ReALM, pour Reference Resolution As Language Modeling, est un grand modèle de langage spécialisé dans l’analyse des correspondances entre les éléments et le sous-texte. Concrètement, cette technologie est capable d’identifier des informations présentes sur une page web ou dans une application et d’associer ces infos entre elles.

Image Apple.

« Permettre à l'utilisateur de poser des questions sur ce qu'il voit à l'écran est une étape cruciale pour garantir une expérience vraiment mains libres avec les assistants vocaux », écrivent les chercheurs d’Apple. Imaginez que vous visitiez le site web d’un restaurant sur lequel se trouve son numéro de téléphone et que vous demandiez ensuite à Siri d’appeler cet établissement. C’est une utilisation potentielle de ReALM, qui se charge d’encoder chaque élément identifié comme du texte, mise en avant dans l’article scientifique.

Mais on pourrait sûrement pousser l’utilisation en demandant à Siri de lister tous les plats qui contiennent du poisson, par exemple. Analyser en continu le contenu pour interagir ensuite avec, c’est l’idée derrière Rewind, une application Mac qui enregistre tout ce qui se trouve à l’écran pour pouvoir ensuite fouiller dans l’historique avec l’aide de GPT-4.

En parlant de GPT-4, les savants d’Apple assurent que leur invention fait aussi bien, voire mieux, que le modèle le plus avancé d’OpenAI dans ce cas d’usage de mise en contexte. Et de conclure que « ReaLM [est] un choix idéal pour un système pratique de résolution de références pouvant fonctionner sur l'appareil sans compromettre les performances. » Y’a plus qu’à !

avatar abalem | 

E.N.F.I.N ! 😮‍💨😮‍💨😮‍💨

avatar Marius_K | 

Siri plus malin, le problème est que quand on multiplie 0 par quoi que ce soit ça fait toujours 0...
Siri est vraiment désespérant depuis quelques temps, ce qui est tout de même bizarre car avec le temps ça aurait dû s'améliorer alors que depuis quelques mois voir années ça ne cesse de se dégrader.

avatar Furious Angel | 

@Marius_K

Depuis la semaine dernière, si je lui demande de mettre France Inter, il balance un podcast au lieu de la radio. Et ça remarchera sûrement dans quelques jours. C’est de la folie pure le fonctionnement de Siri…

avatar MarcMame | 

Chez moi, Siri ne répondait pas quand je le sommais de le faire et se déclenchait régulièrement tout seul, parfois même dans le silence le plus complet.
J’ai fini par le désactiver.
Je ne ressens aucun manque.

avatar debione | 

Ouais, super, on nous promet un Siri qui sera capable de rivaliser avec Alexa/Google des années 2015...

Plus sérieusement, on remarque a quel point Apple est restée en gare sur l'IA, entre l'annonce sur la fabuleuse capacité à décrire ce qu'il y a sur une photo et le fait que Siri risque enfin de juste comprendre ce que l'on dit, j'ai l'impression d'être en 2015...
A mon avis, ce sera un truc tout limité en usage interne, et pour le reste, ils seront prêt à payer pour nous mettre du Google ou du Microsoft, qu'ils auront bien du mal a rattraper...

Apple est très forte pour faire rentrer elle-même les loups dans la bergerie, elle n'a même pas besoin du DMA pour le faire toute seule.

avatar Furious Angel | 

@debione

Ces travaux (et leur publication) montrent au contraire qu’ils y travaillent depuis longtemps. Ils ont peut-être été surpris par le buzz généré par Chat GPT et l’espèce d’engouement médiatique (qui ne sort presque pas des médias spécialisés, n’exagérons rien) pour les IA génératives qui a balayé celui pour le metavers, mais dans les usages concrets, le grand public est très loin d’utiliser tout ça, et c’est très loin d’être présent chez les concurrents d’Apple à ce jour.

avatar debione | 

@Furious Angel | :
Ils y travaillent peut-être, les autres ont sorti des produits. Essayer une fois les commandes vocales google ou alexa pour se rendre compte. Essayer une fois les solutions Google pour les images. Regarder ou en sont OpenAi actuellement.

"mais dans les usages concrets, le grand public est très loin d’utiliser tout ça, et c’est très loin d’être présent chez les concurrents d’Apple à ce jour."
C'est qui les concurrent d'Apple? Google et Microsoft. Les deux sont à la pointe dans ce domaine.
Alors dans le privé je ne sais pas, perso j'aime écrire, donc je ne me suis pas intéressé de très près. Par contre, j'ai été surpris à quel point dans mon entourage cela est utilisé dans le monde professionnel. Pour pondre un discours de bienvenue, pour pondre des lettres types, pour pondre du code. Et comme tout ce joli monde pro est à 99% sur windows ils utilisent tous copilote. Alors ils ne l'utilisent pas encore en fermant les yeux, ils repassent derrière, mais tous me disent que le gain de temps est stratosphérique.

On verra en septembre, si Apple est capable de rivaliser avec Gemini et openAi, ils auront leurs propres solutions au même niveau que leurs concurrents (la ils m'épateraient vraiment), si leur solutions est juste moins bonne, ou si comble du comble ils devront se tourner vers un de leurs concurrents parce qu'ils se sont fait véritablement larguer sur le sujet.

Si j'y vais au pif, je dirais qu'Apple va nous pondre une IA interne moins performante que Gemini et à moins d'acheter une grosse boîte ils passeront complètement à côté de l'IA "cloud". Exactement comme ils ont fait quand ils sont complètement passé à côté du streaming et que leur seul salut fut d'acheter Beats. Ce serait pas la première fois que Papy Cook se plante dans l'orientation des futurs technologies.

avatar BeePotato | 

@debione : « 
Ouais, super, on nous promet un Siri qui sera capable de rivaliser avec Alexa/Google des années 2015...
[…] entre l'annonce sur la fabuleuse capacité à décrire ce qu'il y a sur une photo et le fait que Siri risque enfin de juste comprendre ce que l'on dit, j'ai l'impression d'être en 2015... »

Je ne vois pas bien le rapport entre ce qui est décrit dans l’article du ReALM et 2015 ou Alexa ou Google Assistant.

avatar toto_tutute | 

C'est TOTALEMENT IRRESPONSABLE de laisser 90% de la production des semi-conducteurs les plus avancés (et 60% des semi-conducteurs au total) sur une île dont on ne reconnaît même pas la souveraineté et qui est sous la menace croissante du régime de Pékin !

En cas de blocus de l'île, le Covid, ce serait du pipi de chat à côté de la crise économique et financière qui en découlerait.

Il est vraiment temps que nos dirigeants se réveillent là !

avatar occam | 

@toto_tutute

Est-il concevable que ce commentaire soit en fait destiné à un autre fil, celui sur le tremblement de terre à Taiwan ?
Si oui, question accessoire : un successeur de Siri un brin plus doué serait-il capable de reclasser ce commentaire dans le bon fil ?

avatar yod75 | 

@occam

Tu es joueur : il a peut être déjà demandé à Siri de poster son commentaire, et tu as vu le résultat ;)

avatar Levrai | 

Donc d'après Apple leur ia est au niveau de chatgpt4 mais aucune app exploite encore cette fameuse ia, rien à l'horizon. La seule chose dispo actuellement cest le baratin de Tim...
D'ici Apple décide de la sortir, chatgpt sera sûrement en version 6!
Perso, mon s23 ultra à reçu one ui 6.1 et je profite des nouveautés ia du s24 ultra. De plus l'assistant Google dopé avec Gemini est actuellement disponible.

avatar Vaenoxis | 

Siri est devenu de plus en plus catastrophique c’est dingue.

Avant pour la lumière chez moi, pour prendre un rendez vous ça marchait nickel.

Maintenant quand je lui demande d’augmenter la lumière d’une lampe il me fout de la musique, et quand je lui dis très précisément : crée un rendez vous à tel heure tel jour il me sort à chaque fois, à quel heure est votre rendez-vous 😵‍💫.

Vivement de la bonne update parce que là ça devient ridicule.

Et le pire c’est que vraiment ça marchait mieux avant 😅 ..

avatar gregelhombre | 

Et les sms, on en parle?
Il écrit des mots qui n'ont rien à voir avec ce qu'on lui dicte !
Usant et on parle même pas des fôtes ....

avatar 0MiguelAnge0 | 

Les savants d’Apple !!! Tout le monde se fout de leur tronche avec Siri depuis 2014…. Faudrait remiser les savants et demander à des pros de prendre le relais.

avatar Numa | 

Siri fait 4 choses pour moi, me dire l’heure, lancer un compte à rebours pour la cuisson des pâtes, lancer France Infos , et lancer la musique de manière aléatoire. Pendant quelques temps, il confondait la station France Info et un podcast vieillissant de France Info, mais c’est résolu. En clair, je pourrais m’en passer… il faudrait ChatGPT à la place de Siri.

avatar Shepherd | 

« Siri pourrait devenir bien plus malin avec cette avancée des chercheurs d’Apple » : et bien, ce ne sera pas de luxe ! 😁

Pages

CONNEXION UTILISATEUR