Siri pourrait devenir bien plus malin avec cette avancée des chercheurs d’Apple

Stéphane Moussie |

La pile des articles de recherche d’Apple dans le domaine de l’intelligence artificielle continue de grossir. Le dernier en date, publié fin mars, décrit un système destiné à améliorer la compréhension du contexte par un assistant conversationnel — vous avez dit Siri ?

ReALM, pour Reference Resolution As Language Modeling, est un grand modèle de langage spécialisé dans l’analyse des correspondances entre les éléments et le sous-texte. Concrètement, cette technologie est capable d’identifier des informations présentes sur une page web ou dans une application et d’associer ces infos entre elles.

Image Apple.

« Permettre à l'utilisateur de poser des questions sur ce qu'il voit à l'écran est une étape cruciale pour garantir une expérience vraiment mains libres avec les assistants vocaux », écrivent les chercheurs d’Apple. Imaginez que vous visitiez le site web d’un restaurant sur lequel se trouve son numéro de téléphone et que vous demandiez ensuite à Siri d’appeler cet établissement. C’est une utilisation potentielle de ReALM, qui se charge d’encoder chaque élément identifié comme du texte, mise en avant dans l’article scientifique.

Mais on pourrait sûrement pousser l’utilisation en demandant à Siri de lister tous les plats qui contiennent du poisson, par exemple. Analyser en continu le contenu pour interagir ensuite avec, c’est l’idée derrière Rewind, une application Mac qui enregistre tout ce qui se trouve à l’écran pour pouvoir ensuite fouiller dans l’historique avec l’aide de GPT-4.

En parlant de GPT-4, les savants d’Apple assurent que leur invention fait aussi bien, voire mieux, que le modèle le plus avancé d’OpenAI dans ce cas d’usage de mise en contexte. Et de conclure que « ReaLM [est] un choix idéal pour un système pratique de résolution de références pouvant fonctionner sur l'appareil sans compromettre les performances. » Y’a plus qu’à !

avatar twinworld | 

Ils sont sympa les ingénieurs Apple, mais s’ils arrivaient déjà à faire en sorte que quand je dis « Siri, ouvre Apple podcast et continue de jouer le podcast xy » il n’ouvre pas Apple musique pour jouer un truc aléatoire, ça serait super. :-)

avatar raoolito | 

@twinworld

je pense que c'est en septembre qu'on commencera à avoir les nouveautés sur Siri

avatar Yves SG | 

@twinworld

+1
Et ce que je n’ai toujours pas compris, c’est comme peut-il se faire qu’il ne parvienne plus aujourd’hui à faire des choses qu’il faisait très bien il y a trois ans…

avatar TDBI | 

@Yves SG

Ne parle pas des choses qui fâchent 🤫

avatar cosmoboy34 | 

@twinworld

Justement ils travaillent sur l’amélioration de Siri c’est un peu le sujet de l’article et de tous les articles récents sur l’ia et Siri.

avatar marc_os | 

@ twinworld

Evidemment, si tu lui demandes de jouer le « podcast xy », faut pas t'étonner si Siri joue ensuite un truc aléatoire ! 🤪

avatar FredMac92 | 

@marc_os

😂

avatar DG33 | 

@marc_os

Et en ajoutant la 3ème dimension tu l’aurais fait planter… ou ressusciter un groupe ?

avatar Korell | 

@twinworld

+1

« Joue moi un peu de musique »

—> « Désolé mais je ne peux faire cela pour l’instant »

Merci Siri 🤡

avatar Dimemas | 

Tellement vrai…
Ou qu’il lance plans sur la bonne adresse …

avatar Scooby-Doo | 

@twinworld,

« Ils sont sympa les ingénieurs Apple, mais s’ils arrivaient déjà à faire en sorte que quand je dis « Siri, ouvre Apple podcast et continue de jouer le podcast xy » il n’ouvre pas Apple musique pour jouer un truc aléatoire, ça serait super. :-) »

👍

Réponse d'Apple à votre problème :

Offre d'emploi Apple AI

Dans le cadre de l'amélioration de notre intelligence artificielle Siri nous recrutons un grand nombre de collaborateurs.

Postes à pourvoir :

1 000 000 d'Indiens ou de Kényans.

Qualifications requises :

Aucune formation préalable nécessaire à part savoir cliquer et taper rapidement.

Discrétion exigée.

Disponibilité :

Immédiate.

Rémunération :

Par tranche de 50 000 clics, paiement au lance-roquettes.

🤪

avatar Cyrille50 | 

Moi, désormais, Siri refuse de mettre "Europe 1" quand je lui demande. Il veut absolument me faire écouter "Europe Music" dont je ne veux absolument pas. Il n'y a pas moyen.

Par ailleurs, Podcasts a de sérieux ratés. Il n'est plus possible d'écouter Franck Ferrand (oui je sais j'écoute des trucs bizarres... Lol). Mais enfin Franck Ferrand a une grande écoute et Apple devrait vérifier que tout fonctionne. Ce n'est plus le cas pour ce podcast... Alors que Radio classique continue à le produire chaque jour.

avatar fte | 

@twinworld

Ce que j’aurais aimé, c’est que Siri soit capable de répondre à cette simple commande : "éteint la lampe kitchen one".

J’ai un Pixel depuis quelques semaines, et je commence á utiliser les commandes vocales. Ça marche sans faille, c’est une découverte, c’est utile !

Trop tard, je m’en fiche maintenant.

avatar Ouya | 

@twinworld

Pareil quand je lui demande de fermer les volets et qu’il mute le son sur l’Apple TV 😂

avatar Mac1978 | 

"Siri pourrait devenir bien plus malin…"

Faut quand même reconnaître que ce n'est pas très difficile. Son QI actuel ne devant guère dépasser 50.

avatar raoolito | 

@Mac1978

c beaucoup ca non?

avatar Mac1978 | 

Non.
Selon la méthode la plus utilisée, celle de Wechsler, le QI moyen et médian est à 100 sur la courbe de Gauss normalisée. L'écart-type (𝜎) est de 15. Donc 98% de la population aurait un QI entre 70 et 130 (± 2𝜎). En dessous, on parle de déficience cognitive - comme pour le Siri actuel - en dessus, on parle de haut-potentiel.
À 50, Siri ferait partie des 0.1% les moins intelligents. Après, il faut croire à toute cette théorie.

avatar raoolito | 

@Mac1978

franchement pour un monoPède n'ayant aucune solution de déplacement ni yeux ni mains juste une oreille et une bouche, je pense que 50 c'est encore beaucoup 😁

avatar Lonesome Boy | 

@Mac1978

Les 0,1% les moins intelligents? Ben du coup, ça colle avec Siri 😅

avatar Mac1978 | 

@Lonesome Boy

En dessous [de 70], on parle de déficience cognitive - comme pour le Siri actuel, donc oui à 50 Siri ne serait pas top.

avatar sangoku | 

@Mac1978

C’est pas pour pinailler pas c’est 96% entre 70 et 130 m’enfin pas grave.
Personnellement je trouve que 50 pour Siri est extrêmement généreux. Mon Siri comprends moins de commandes qu’un chien pas malin. Il comprends « minuteur 7 minutes » pour les pâtes, « quelle heure il est » et « qu’est-ce que j’écoute ». Et c’est tout.

avatar Mac1978 | 

Vous avez raison, 95.4 pour être précise.

Comme je n'ai qu'un chat, je ne peux pas comparer Siri à un chien pas malin, mais je suis d'accord que j'ai été généreuse avec 50. Je l'ai mis en référence à un vague souvenir que j'avais d'une très lointaine information sur les Zèbres et autres HP, et à l'opposé de la courbe, celles et ceux qui souffrent de déficience cognitive.

Enfin, il faut encore croire à cette théorie qui, si elle existe, n'en est pas moins très contreversée. Mais Siri reste vraiment nul dans sa version actuelle.

avatar RonDex | 

@Mac1978

On parlait d’un programme informatique, pas d’un être humain… Et c’est plutôt 110 que 100.

avatar ErioBato | 

Eh ben ça serait pas dommage…

avatar cosmoboy34 | 

Quand on voit toutes les briques d’Apple sur le sujet qui s’accumulent ça laisse rêveur quant au futur de Siri

avatar armandgz123 | 

D’ailleurs je comptais acheter de nouveaux HomePod, mais je vais attendre de voir si une nouvelle version spéciale ia arrive

avatar RomanYeager | 

On a tous des trucs bizarres avec Siri. En ce moment quand je lui demande de fermer les volets, il me dit qu’il ne peut pas gérer le volume de ces appareils… uniquement sur mon iPhone, parce que sur le HomePod ça marche. Mystère.

avatar Camousse | 

@RomanYeager

Même soucis avec la porte de mon garage. Ça traîne depuis iOS 17.4…
C’est vraiment pénible !

avatar Mdtdamien | 

@Camousse

Meme problème depuis iOS 17.4

avatar raoolito | 

@RomanYeager

chez nous c'est l'inverse c'est plutôt sur le HomePod que ça se passe le moins bien alors que l'iPhone ou l'ipad c'est le mieux et la montre c'est pas mal
ah non j'oubliais sur le Mac c'est encore pire 🥲

avatar jerant | 

Le 1er avril 🐟, c’était lundi

avatar Levrai | 

Ces rapports Apple publie sont quand même de gros red flag! Ces travaux publiés ne sont que le résultat des rachats fait à la va vite par Apple ces derniers temps. Comme par hasard les premiers travaux sont publiés juste après l'avènement de chatgpt... Et depuis quand Apple publient ces travaux? Pourquoi ils ne le font pas avec les projets en cour? Bref une bien piètre façon de camoufler sont retard vis a vis de la concurrence!
Ces marrant avant Apple ne se comparaît à personne et maintenant pour ia , ils arrêtent pas de se comparer à chatgpt, un gros aveu de faiblesse...

avatar Baptiste_nv18 | 

@Levrai

Comment ça juste après ChatGPT ? Apple a toujours publié ce genre de choses; ça n’est pas plus fréquent maintenant qu’avant, la seule différence c’est que les médias en parlent étant donné que ce sont parfois des travaux qui touchent à l’IA: sujet qui en tendance ces derniers temps. Ce n’est pas parce que vous n’êtes pas au courant des publications d’Apple qu’elles n’existent pas, ça fait des années qu’Apple le fait; que ce soit concernant l’IA, le Machine Learning, la confidentialité, des recherches en santé, etc.

avatar raoolito | 

@Levrai

c'est peut-être aussi qu'on en parle que depuis ChatGPT et qu'avant on n'y faisait pas attention

avatar BeePotato | 

@ Levrai : « Et depuis quand Apple publient ces travaux? »

Depuis toujours, en fait.
La page machinelearning.apple.com permettant de mettre en valeur les publications directement via le site de l’entreprise est récente, mais la publication d’articles dans des conférences internationales telles qu’ICASSP (comme les derniers articles affichés sur la page) ou autres, ça n’a rien de nouveau.

avatar vincentn | 

@Levrai

Ce n’est pas comme ci Apple n’avait pas un site web recensant depuis 2017 certains de ses articles sur le sujet :

https://machinelearning.apple.com/research?page=1&sort=oldest

Et je ne parle même pas des autres sites et revues dans le domaine, certains articles étant même coecrits avec les équipes de Google et autres. Sans compter les brevets, le neural engine, etc.

Apple fait, et en prod, de l’IA depuis des années, dans nombres de domaines (et sans attendre des rachats de boîtes, que font d’ailleurs également les autres).

Sauf qu’ils appelaient ces technologies et processus par leurs vrais noms et définitions (Machine Learning, etc) pas en utilisant le simple terme générique d’IA. C’est moins commercial, fait moins fantasmer le boursicoteur, mais plus juste (mais ils placeront probablement le terme IA partout lors de la prochaine WWDC, pour la com)

Alors oui, effectivement ils n’ont pas encore en prod d’IA generative utilisable via un robot conversationnel, mais ce n’est qu’une partie de l’IA, et pas forcément, dans les usages, la plus pertinente.

avatar Lonesome Boy | 

@vincentn

Ce genre de personne aura toujours tendance à parler d’autre chose quand on leur montre leur erreur (« whataboutism ») plutôt que de la reconnaître. Le whataboutism est une des plaies des RS.

Par exemple, il va te parler d’autres domaines où Apple ne publie pas, justement.

avatar vincentn | 

@Lonesome Boy

C’est clair, je ne peux qu’aller dans votre sens. Cela en est tout de même fatiguant à force.

avatar v1nce29 | 

> en demandant à Siri de lister tous les plats qui contiennent du poisson

Et spécialement pour la version slave : lister tous les plats qui contiennent du poison

avatar serenity | 

« Siri, fais-moi un tableau qui compare toutes les citadines hybrides non rechargeable, en indiquant aussi le volume de leur coffre avec et sans sièges repliés, ainsi que leur consommation moyenne en ville, sur autoroute, et mixte. »

Et pof au bout de quelques secondes, ça ouvre un joli document Numbers.

Voilà le genre de truc que l’assistant doit pouvoir faire : nous éviter à passer des heures à compiler des informations comme à l’époque préhistorique où on cueillais des fruits et des graines. Des infos fiables, bien synthétisées, présentées dans les applications et supports de notre choix. 👌

avatar Korell | 

@serenity

+1

avatar Furious Angel | 

@serenity

Le problème est la fiabilité de ces infos. C’est vraiment ultra aléatoire avec tous les modèles actuels, et je me demande même seul sera possible d’avoir quelque chose de sérieux à terme.

avatar serenity | 

@Furious Angel

Moins si le système est transparent sur les sources. C’est d’ailleurs le gros problème de ChatGPT : ça ne donne aucune source, alors que pourtant ça en utilise bien.

avatar Furious Angel | 

@serenity

Même en sourçant (ce que fait Copilot) il y a des erreurs. La fiabilité n’est obtenue que quand on va consulter toutes les sources… ce qui prend un temps fou, et c’est justement pour ne pas faire ça que ces robots d’IA sont utilisés.

avatar serenity | 

@Furious Angel

Sauf si les sources sont bien présentées.

avatar Furious Angel | 

@serenity

Mais même comme ça, ça peut mal en extraire le contenu… et si on demande ce résumé à un robot IA, c’est justement pour éviter de se cogner toute la source 😅

avatar serenity | 

@Furious Angel

C’est important d’avoir accès aux sources. C’est plus un travail de présentation pour le coup, moins d’IA.

avatar Levrai | 

Ah bon? ils sont ou les travaux sur Apple car? Ils sont ou les travaux sur les processeurs M? Pareil pour cette accesoire inutile qu'est le vision pro? Ils sont ou tous ces travaux? J'aimerai bien les lires...
Si ca fait des années Apple travail dessus pourquoi ils sont pas foutu de sortir un produit qu'on peut essayer? Pour l'instant quedal , des rumeurs, du bla bla mais aucun produit dispo. Pour l'instant c'est moi je , moi je...Cerise sur le gâteau, pourquoi Apple doit ramper devant la concurrence pour implanter des ia concurrentes alors qu'ils sont tellement en avance qu'ils explosent tous le monde?
Moi je dis que c'est Apple qui met le chocolat dans le papier d'alu

avatar serenity | 

@Levrai

C’est clair. Si seulement Apple était aussi forte avec l’IA qu’avec le hardware, elle n’en serait pas là.

Pages

CONNEXION UTILISATEUR