Siri, Alexa, Cortana : face à ChatGPT, les assistants vocaux ne font plus rêver

Félix Cattafesta |

L'efficacité des modèles textuels types ChatGPT a pour effet de mettre en évidence le manque d'intelligence des assistants vocaux. Promis à un grand avenir et vendus à toutes les sauces dans les années 2010, ceux-ci sont encore loin d'être au point une décennie plus tard. Un article du Financial Times fait le point sur les grands noms du domaine, pour qui l'enthousiasme se tarit.

Amazon Echo Spot.

L'assistant d'Amazon reste un des leaders du domaine face à Google et Apple. IDC estime qu'un utilisateur sur deux invoque Alexa au quotidien. L'engagement a augmenté de plus de 30 % au niveau mondial en 2022 d'après l'entreprise, et plus de 50 % des clients d'Alexa l'utilisent désormais pour faire des achats.

Malgré ces scores satisfaisants, le projet Alexa aurait été relégué au second plan ces derniers temps. Une réorganisation a eu lieu avec l'arrivée du nouveau directeur général Andy Jassy : celui-ci aurait demandé de ne pas forcément faire grossir le service, mais plutôt de le rendre rentable. Ordre aurait été donné de mettre les bouchées doubles sur la monétisation d'Alexa, tandis que la division n'aurait pas échappé à certains licenciements.

Alexa parle beaucoup mais ne rapporte rien à Amazon

Alexa parle beaucoup mais ne rapporte rien à Amazon

Ce désintérêt se ressent aussi chez Microsoft. Alors que l'entreprise veut se faire pionnière dans le domaine des modèles textuels, son CEO n'hésite pas à tacler les produits de la concurrence… et les siens. La firme de Redmond vient d'annoncer que son nouveau Bing AI allait être accessible directement dans la barre des tâches de Windows 11. On y trouvait auparavant l'assistant vocal Cortana, immanquable sur Windows 10 et qui a petit à petit été mis en retrait du système (les apps iOS ont été débranchées en 2019). Satya Nadella explique :

Ils étaient tous bêtes comme leurs pieds […] Qu'il s'agisse de Cortana, d'Alexa, de Google Assistant ou de Siri, tout cela ne fonctionne tout simplement pas. Nous avions un produit qui était censé être le nouveau portail d'accès à un grand nombre d'[informations] qui ne fonctionnait pas.

Le co-fondateur de Siri n'est pas en reste : Adam Cheyer considère que ChatGPT fait paraître les assistants vocaux stupides en comparaison. « Personne ne sait ce qu'ils peuvent faire ou ne pas faire. Ils ne savent pas ce qu'ils peuvent dire ou ne peuvent pas dire », ajoute-t-il avant de qualifier ces services de « maladroits ». Il faut dire que Siri propose une expérience plutôt inconsistante, et l'assistant d'Apple est régulièrement à côté de la plaque.

« Dis Siri, tu es nul ! »

« Dis Siri, tu es nul ! »

La future mode semble être celle des assistants dopés à l'IA. Un employé d'Amazon a déclaré au Financial Times que l'outil faisait le buzz en interne. « Une directive est descendue de certains [cadres] pour que les équipes réfléchissent à ce à quoi ressemblerait une Alexa plus intelligente », confie-t-il. De son côté, Adam Cheyer estime que cela pourrait amener une renaissance de ce type d'assistant, apportant une flexibilité et une complexité qui n'existaient pas avec la génération précédente.

avatar Boboss29 | 

@k43l

Peut être effectivement que Alexa ou autre aurait pu répondre, mais moi j'utilise Siri... Car pas le choix sur homepod mini ou carplay en l'occurrence.

Je te rejoins sur la véracité des réponses qui parfois tapent à côté. Mais ça vient de beaucoup à la façon de formuler la requête. Mais on est encore au début de la technologie. Et désolé mais moi, ce qui me fruste le plus quand j'utilise siri, c'est de ne pas avoir de réponses à des questions qui me trottent dans la tête et auquels, au volant par exemple j'aimerai avoir une réponse. Je peux toujours sortir l'iphone, ou une encyclopédie, aller à la bibliothèque (où je travaille d'ailleurs) mais avoir l'info immédiate en demandant avec sa voix c'est quand même pratique et c'est un peu un fantasme de geek que j'ai depuis longtemps : Genre, t'écoute une info et on te cite un personnage, un lieu, un événement, inconnus. Bah là avec ce siri couplé à chat gpt, je peux avoir des réponses. En plus des autres fonctions de bases de siri (monte le chauffage, envoie un message au Tartenpion, quel temps fera t il demain). Après comme on dit, qui peut le plus, peut le moins, donc à chacun de voir où sont ses limites d'usages, mais il est quand même plaisant de voir que ces assistants vocaux qui nous accompagnent depuis des années pourront sûrement bientôt être plus évolué dans les requêtes qu'on leur soumettra. Ça n'évitera pas de vérifier l'information (comme actuellement et depuis toujours) mais ça ajoute une grosse valeurs ajoutée.

(Tu as testé l'astuce pour le raccourci ?)

avatar k43l | 

pas encore testé mais la fonctionnalité est très interressante !

avatar Sillage | 

“La future mode semble être celle des assistants dopés à l'IA.”

En même temps, dès les débuts de Siri, qui n’a pas tenté une conversation ?

Siri n’a jamais eu d’intérêt pour moi.

Quant à Bing, j’ai été étonné de faire mon premier chat avec samedi passé.

avatar Htb41 | 

Une petite minute… Je m’en charge… 😴

avatar Krocell | 

Alexa ça va encore. Google moyen mais Siri est le pire

avatar Brice21 | 

Moi j’utilise surtout Siri comme interface vocale avec iCloud. Je lui demande de fixer des rendez-vous dans mon agenda, de les déplacer, d’inviter des personnes, je crée des rappels tout le temps, pour ma liste de course, des trucs à faire à la maison ou quand j’arrive au bureau ou dans une heure. Je dicte des notes quand j’ai une idée et les mains occupées. Je lui demande la météo quand je m’habille. Au volant, je vérifie que ma porte de garage est bien fermée, j’envoie des messages et des e-mails, je lui demande de me conduire à une adresse, a un magasin ou un restaurant pour obtenir le trajet, je lui demande de prévenir ma compagne quand je suis en retard, ou d’appeler quelqu’un dans carnet d’adresse. Chez moi je lui demande d’allumer l’Apple TV, de lancer une application (ce qui allume la télé et l’ampli). Bref je ne me sers pas de Siri pour remplacer Google.

Tout ceci ChatGPT en est incapable. C’est juste un perroquet stochastique qui babelutte sur le thème de la question, ce qui fait illusion. C’est rigolo mais ca sert pas à la meme chose. Par contre ça remplace pas mal de recherche dans Google.

Ce qui serait génial ça serait un ChatGPT avec les connaissances et l’intelligence de Wolfram Alpha et la capacité d’exécuter des actions sur base d’intentions tel que Siri en est capable. Ce n’est pas impossible mais cela va demander l’intégration d’algorythmes totalement hétérogenes.

GPT est un LLM (large language model), Siri/Google Assistant sont des chatbot basé sur le système intents/objects, WolframAlpha est un outil de calcul en language naturel. Mais je pense qu’on va voir cela arriver dans les 5 prochaines années.

avatar debione | 

Du coup je me pose la question (et finalement assez sérieusement) si rendre des assistants vocaux plus intelligents n'est pas rendre leurs utilisateurs moins intelligents...

Bon va falloir que je définisse exactement le mot "intelligence" avant de pouvoir y répondre...

avatar Boboss29 | 

Rendre un outil plus efficace n'est jamais négatif...
Il y a toujours eu ce débat. Est-ce que la voiture a rendu l'Homme plus paresseux ? Dans un sens peut-être mais ça lui a permis d'aller plus loin autour de lui. Bah c'est un peu pareil. Si on peut s'affranchir de certaines formes rébarbatives pour peaufiner le fond, on pourra à terme surement aller plus loin dans bien des domaines. J'ai installé sur Chat GPT l'extension Chrome WebchatGPT, qui cherche ses sources sur internet. Et pour le coup ça réduit le temps de beaucoup de recherche sur des sujets. J'ai aussi installé des prompts (avec cette même extension) dont un que j'ai nommé "Critique matos tech" (j'ai suivi un tuto pour ça). Maintenant avec ce prompt, il me suffit de l'activer et de taper le nom d'un appareil technologique (exemple airpod pro 2) et il me rédige une critique de l'appareil avec les points forts et les points faibles, en puisant dans diverses sources du net (qui sont référencées). ça ne remplace pas une lecture sur MacGé ou les numériques, mais ça donne une bonne synthèse de l'objet 😀
Comme tout outil il faut trouver les usages. Avec un marteau tu peux accrocher un cadre, monter un meuble ou un maison, casser une vitre, t'exploser les doigts ou tuer une personne...

avatar mat16963 | 

Autant j’ai largement confiance en Google pour rebondir, puisque cette course à l’IA est assez importante pour leur survie et garder une position de leader. Leurs travaux sont déjà bien avancés et je pense que la technologie sera un jour ou l’autre intégrée à Assistant.
Amazon, s’ils le veulent je pense aussi qu’ils ont les moyens d’ajouter à assez court terme des modèles neuronaux de ce genre à Alexa, l’IA est aussi centrale pour eux (après les assistants connectés, d’après un article paru récemment, Alexa est un gouffre financier donc pas sûr que ça soit la priorité). Et concernant Apple ça m’inquiète le plus en tant que client, pas qu’ils en aient pas les moyen, mais Apple est sous Tim Cook spécialement très regardant sur la dépense, ou du moins investit seulement si le retour sur investissement est quasi certain ou que cela permet de vendre un abonnement supplémentaire. Siri ne fonctionne pas sur abonnement et ne rapporte rien dans l’absolu, c’est juste une fonction qui a un rôle marketing. Autrement dit ils font en sorte que Siri fasse le minimum syndical sans trop dépenser. Ce qui est compréhensible d’un point de vue business, mais extrêmement dommage d’un point de vue client, puisque si Apple investissait plus, on pourrait en faire tellement en étant dans l’écosystème Apple. Et Siri était très prometteur il y a 11 ans. Aujourd’hui les autres assistants ont fair des progrès certains, là où Siri a plutôt stagné voire même régressé sur certains points…

avatar ⚜Dan | 

Comme j’ai dit y’a au moins 3 fois ici, utilise
Siri + ChatGPT et voilà, vous avez le meilleur Siri qui existe.

avatar marc_os | 

L'efficacité des modèles textuels types ChatGPT a pour effet de mettre en évidence le manque d'intelligence des assistants vocaux.

Comme si ChatGPT était « intelligent »... Tsss.
Et ChatGPT "comprend-il" si vous lui demandez d'allumer la lumière ?
Quelqu'un l'a-t-il utilisé pour le relier à un actuateur physique ?
Ça m'étonnerait que ça soit si simple.
Car si ChatGPT peut vous générer un texte en rapport avec votre "question" meilleur que Siri & Co, vu qu'il ne comprend pas ce qu'il dit, il ne sera pas si simple à mon avis de créer une app basée sur OpenAI permettant de lui dire simplement : "Ouvre l'application de messagerie" et qu'elle le fasse.
Car il faudrait alors que le logiciel comprenne vraiment ce que veut dire "ouvrir". Bien sûr, on peut tricher et avoir une liste de vocabulaire pré-enregistré permettant de faire le lien, mais OpenAI sera-t-elle capable de faire le lien elle même ?

Pages

CONNEXION UTILISATEUR