Siri : le téléphone emprunte une nouvelle voix

Arnaud de la Grandière |
siri

Avec l'iPhone 4S, Apple vient de changer à nouveau le paradigme de son interface tactile d'une manière éclatante. En effet, pour la première fois dans l'histoire de l'informatique, un véritable mode de contrôle en langage totalement naturel vient d'être intégré de base dans un appareil grand public.

Il pourra être objecté qu'il existait déjà des modules de commande vocale précédemment, notamment dans Android, Windows ou Mac OS X, mais ce serait hors de propos : Siri ne propose pas un simple jeu de commandes vocales précises à effectuer pour communiquer avec l'appareil, mais offre une formulation libre (pas de « mots-clef » à prononcer), et mieux encore, instaure un véritable dialogue avec la machine par le biais d'une intelligence artificielle. En somme, Siri est à la commande vocale ce que l'interface graphique est à la ligne de commande : fini le vocabulaire à apprendre (autrefois les commandes textuelles), vous communiquez avec l'appareil de manière intuitive et simple.

NUI

De fait, la technologie Siri tient d'autant plus de la prouesse qu'elle résout un épineux problème qui freinait de longue date l'adoption des systèmes logiques d'interprétation. Le Newton avait beau proposer un système de reconnaissance de l'écriture cursive incroyablement avancé, les inévitables erreurs d'interprétation étaient immanquablement source de frustration pour l'utilisateur. Malgré tout, les quiproquos sont monnaie courante entre êtres humains, mais bénéficient de notre part d'une bien meilleure tolérance (lire : Pour quelques neurones de plus).

Nous avions évoqué cette question lors de notre interview du professeur Randall Davis du MIT (lire MIT : à la croisée de l'intelligence artificielle et des nouvelles interfaces), et voici l'explication qu'il donnait de cette problématique :

La raison pour laquelle les quiproquos entre personnes ne semblent pas aussi embêtantes, c'est que vous avez des conversations avec les gens. Imaginez si vous aviez un assistant et que la seule manière de communiquer avec lui soit de dire quelque chose, il ferait ce qu'il croit avoir compris que vous vouliez dire, mais se tromperait, et bien, il vous faudrait l'arrêter, tout recommencer, lui redire ce que vous vouliez, ce serait ridicule, ça n'est pas comme cela que nous fonctionnons avec les gens, et ça n'est pas comme cela que nous devrions fonctionner avec les machines. Donc, il y a du travail dans ce domaine, et on a une meilleure compréhension de la manière dont l'ordinateur peut être un partenaire facile à vivre dans la vie de tous les jours, ce qui rendra les malentendus plus faciles à tolérer.

Et à partir du moment où vous pouvez tolérer les malentendus, il devient bien plus facile de parler. La raison pour laquelle il est si difficile de travailler avec les ordinateurs, c'est qu'ils prennent absolument tout au pied de la lettre, et vous devez être exhaustif, complet et précis. Je n'ai pas envie d'être exhaustif, complet et précis, c'est trop embêtant. J'ai envie d'interagir de la façon dont j'interagis normalement avec un autre être humain. Je voudrais que la machine réponde comme une autre personne le ferait, ce qui pourrait être en disant "j'ai compris cette partie, mais pas celle-là".


Et c'est précisément le modèle que suit Siri : que votre demande soit incomplète ou équivoque, et Siri vous demandera des précisions pour s'assurer de l'intention derrière l'ordre. Ne nous y méprenons pas : il s'agit là de rien de moins que le Graal de l'interaction homme-machine. C'est précisément l'un des champs de recherche que le professeur Davis étudie au MIT en ce moment même, et voilà qu'Apple propose une solution clef-en-main dans un appareil de consommation de masse !

Pour bien comprendre les enjeux de Siri, il faut remonter à sa genèse : Apple a racheté la société Siri en avril 2010, après qu'elle a mis en vente son application sur l'App Store (lire : Assistant iOS 5 : « un événement qui change tout »). Mais celle-ci est née d'un projet financé par le DARPA, lui-même une émanation du Pentagone (à qui l'on doit rien de moins que le GPS, Internet, parmi bien d'autres).



Le projet CALO (pour "Cognitive Assistant that Learns and Organizes", assistant cognitif qui apprend et organise) a réuni pas moins de 300 experts du monde entier pendant cinq ans à partir de 2003, et fut piloté par un des plus puissants instituts de recherche privés de la Silicon Valley, le SRI (Standford Research Institute), où sont nés les premiers travaux sur l'interface graphique et la souris. Adam Cheyer, référence mondiale en matière d'interfaces homme-machine et d'intelligence artificielle, était la tête pensante de SRI, et depuis l'acquisition de Siri par Apple, il est devenu l'un des cadres dirigeants de l'ingénierie du groupe dédié à l'iPhone.

La « vallée dérangeante »
Un phénomène étrange a été observé dans le domaine des images de synthèse et de la robotique : à mesure qu'on approche d'un certain réalisme de la représentation humaine, les images suscitent une réaction de rejet de la part des spectateurs, parce que l'être que nous voyons semble incroyablement humain, mais quelque chose d'indicible, dans son apparence ou dans sa façon de se mouvoir, donne l'impression d'un « cadavre en mouvement » (lire L'image de synthèse, d'hier à demain). Cette « vallée dérangeante » connaît également un corollaire lorsque nous sommes confrontés à une interaction vocale avec la machine. Vous en avez tous fait l'expérience : qui n'a pas été exaspéré par ces boîtes vocales interactives, qui au lieu de vous demander de presser une touche sur le clavier téléphonique, vous demandent de prononcer des mots-clefs ? Le système se voulait plus naturel, mais n'a fait que souligner son inhumanité : on se sent profondément stupide à devoir bêtement répéter à voix haute des mots-clefs à une machine qui de toute évidence n'en comprend pas le sens.

Il faut espérer que cette exaspération n'aura pas cours avec Siri, mais le système a toutes les chances pour lui : d'abord parce qu'il ne contraint pas l'humain à un vocabulaire limité et précis de mots-clefs. Ainsi, vous lui donnez des ordres librement, sans avoir à réfléchir à la formulation, aussi spontanément que vous le feriez avec un être humain. Ensuite, parce qu'il apporte un véritable dialogue, vous demandant des compléments ou des précisions le cas échéant. D'autre part, pour peu que sa compréhension soit efficace, et elle semble redoutable, nous n'aurons plus ce sentiment de vacuité qui vient en s'adressant à une « bête machine ».



Mais c'est surtout les avantages indéniables qu'apporte Siri qui nous motiveront à passer outre ce sentiment initial. « Réveille-moi dans 20 minutes » est un ordre sans commune mesure avec la manière dont nous avons eu jusqu'ici à régler un réveil sur l'iPhone. C'est beaucoup plus rapide et efficace, et c'est comme cela que nous sommes habitués à communiquer. Siri offre la voie de la moindre résistance, c'est donc tout naturellement qu'elle gagnera notre préférence.

L'ouverture d'une nouvelle voie
Pour aussi impressionnante qu'elle soit, la technologie Siri n'en est qu'à ses tout débuts. De nouvelles catégories d'ordres feront leur apparition au fur et à mesure, et on imagine sans mal qu'Apple ouvrira son accès aux applications de tierce partie. Mieux encore, si Siri est déjà en mesure de taper le courrier que vous lui dictez, elle ressemblera de plus en plus à une secrétaire particulière : ses capacités d'interaction avec l'être humain la vouent à interagir avec d'autres personnes en votre nom.

Le Knowledge Navigator, un concept d'Apple (et cheval de bataille de John Sculley) en 1987. Date de réalisation prévue ? Septembre 2011. À un mois près, Siri y arrive… presque.


Comme elle est déjà dans votre téléphone, elle pourra prendre vos messages et filtrer vos appels en fonction de votre disponibilité et de l'importance de ceux-ci, ou s'occuper en votre nom de vos réservations à voix haute auprès d'un autre être humain. Il faudra encore quelque temps pour que Siri donne sa pleine mesure, mais on le devine sans mal : Apple tient ici un vaste champ de prospection qui faisait figure de science-fiction il y a encore peu de temps.

Tags
avatar Terence993 | 
Apple est en train de redéfinir le marche rien qu' avec cette fonction. Je vais être encore plus impressionné que quand j' ai mis les mains sur mon Newton pour la première fois.
avatar JYF | 
Excellent article, qui montre bien les enjeux énormes. Après la souris, le tactile, etc., Apple révolutionne encore la donne pour le grand public. Il aura fallu que Jobs meure pour que cet événement informatique d'importance soit relativement occulté.
avatar Rototo104 | 
Merci beaucoup pour cet article extrêmement intéressant ! Je crois que SIRI est une merveille, Apple a quoi qu on puisse dire un temps d'avance sur la concurrence. Déçu parce qu il n y a pas d iPhone 5 avec un nouveau design ? On s'en br.... Ya SIRI ! Les autres ont le design, l iPhone a SIRI (et le design, l'iPhone 4 est très beau je trouve, ayant un 3GS je suis très heureux du 4S)
avatar liocec | 
Excellent article, très clair et précis.
avatar Fil de Brume | 
Moi j'attends vraiment de voir l'ouverture à des applications tierce partie. Par exemple pour pouvoir faire ce genre de choses en voiture : ouvre macgeneration, lis moi les titres, ouvre le premier article, lis moi le premier article, lis moi les commentaires, ecris un commentaire... Tout ça quoi ;). Déjà hier en voiture j'ai utilisé une appli de synthèse vocale pour me lire un article de jeux vidéos pendant que je conduisais, c'est bien pratique... Faire tout ça en commandes vocales serait le top. Le top serait aussi qu'une manipulation d'une oreillette bluetooth permette de lancer siri. Verra t'on l'émergence d'un label de périphériques "compatible siri" ?
avatar Mister_sam32 | 
Très bon article ! Détails clair et précis ! Je m'était dit qu'Apple avait vraiment gaffer de ne pas avoir sorti d'iPhone 5, Mais en faite, je me suis tromper !?! J'ai trop suivis ces rumeurs, qui m'on donner de faux espoirs ! Apple a révolutionner l'iPhone 4 ! Bravo a l'équipe Mac G pour cet article !
avatar YARK | 
Merci pour l'article. Je ne connaissais pas le terme "vallée dérangeante", mais c'est exactement ce que j'ai pensé quand j'ai vu ça : http://www.lesnumeriques.com/demonstration-exosquelette-hal-tokyo-cyberdyne-news-21487.html Un mélange d'émerveillement et une sorte de répulsion. Bizarre comme sensation, est-ce le fait que ce soit réel qui dégage un sentiment différent de la vision d'effets sortis d'un film à la Terminator ?
avatar dedotaku | 
Ça sera dispo iPad 2 avec iOS 5 ?
avatar dedotaku | 
Opus sur ipad 2 ?
avatar Setankin | 
La "valée dérangeante" en ce qui me concerne pour l'intégration de Siri se situe au niveau de la voix en elle-même. Pourquoi les ingénieurs d'Apple ont choisi d'utiliser une voix si robotique alors que de grands progrès ont été réalisés ces dernières années. Même les voix intégrées à Mac OS X semblent plus naturelles que celle de Siri.
avatar Louis XVI | 
Très bon article, Siri est époustouflant (de promesse) !
avatar Felixsanti | 
Superbe article! Merci MacG!
avatar Felixsanti | 
Superbe article! Merci MacG!
avatar tibet | 
On n'oublie pas en même temps que Siri est frappé de l'épithète "Béta" ... il y a encore du boulot y compris pour l'intégration de voix plus naturelle. Ce qui 'n'est peut-être pas la priorité actuelle. Je suis impatient de voir/entendre ça !
avatar kraklesak | 
et Siri dans une iTV, ça pourrait donner ça : http://goopple.fr/2011/apple/itv-apple/
avatar hairquatercut | 
Si je l'engueule, que se passe-t-il ? il m'insulte ou se met-il volontairement en panne ? :-))
avatar Jeckill13 | 
Il est intéressant de voir comment Apple utilise les technologies. Apple n'a pas inventé l'écran tactile et le smartphone, ils l'ont seulement rendu l'interface utilisable par tous et évident d'utilisation, pareil pour l'ipad le pc tablette était déjà là, Apple l'a juste rendu agréable d'utilisation et performant, pareil pour le magasin d'application ( ou ça d'appele comme ça puisque AppStore est une marque déposée, prend ça dans les dents Microsoft) et maintenant le contrôle vocale ! Apple ou comment revisiter notre façon d'utiliser la technologie.
avatar Joe Guillian | 
Avant la sortie du nouvel iPhone je me demandais ce qu'apporterait Apple de plus vis à vis de la concurrence. Fondamentalement au delà d'un attrait esthétique et d'un confort visuel, un nouvel écran, un nouveau form factor, etc tant attendus n’aurait pas apporté grand-chose si ce n'est d'être un peu plus « à jour » face à la concurrence. Ma question était plutôt, après la première version (V1) de l’iPhone, qui pour moi était une révolution dans le monde de la téléphonie (écran tactile vraiment tactile-réactif, interface homme-machine très fluide, etc. qui donnait presque une impression de magie au 1ère usage) que pouvait apporter aujourd’hui Apple alors que la concurrence fait aussi bien voire mieux parfois ? (si si..) Avec SIRI, c'est clairement une nouvelle dimension qu'explore Apple au travers d’un smartphone, je ne sais pas si cette techno. marchera/suivra dans le temps, si la mayonnaise prendra auprès des utilisateurs, mais il faut avouer que c’est vraiment prometteur! C’est en tout cas ce type de nouveauté que j’attendais pour me dire qu’Apple se distingue une nouvelle fois par l’innovation et un parie (gonflé ?) sur l’avenir.
avatar Rototo104 | 
@kraklesak awesome ton lien ! J achete ! :P
avatar asseb | 
@ Fil de brume C'est possible avec certaines oreillettes, perso j'ai une nokia, un appui long sur le bouton lance la reconnaissance vocale, ca lancera donc aussi Siri !
avatar ce78 | 
Passionnant merci ! J'ai hâte de voir ça vendredi 14 !!!!!
avatar Hi me | 
C'est du vrai ou pas le knowledge navigator
avatar Dodi12 | 
Il y a peut-être aussi une relation à faire entre siri et l'énorme data-center d'Apple car je ne pense pas qu'Apple ait investi autant d'argent juste pour iCloud. J'espère que siri se developpera rapidement, je suis très pressé de retrouver cette fonction sur mon Mac, ça sera sans doute le premier ordinateur sans clavier.
avatar machoire | 
Dommage pour l'iphone 4....:(
avatar ckfd | 
Siri sur LIon ? c'est possible? Quelqu'un sait? je le verrais bien sur mon macbook air en nomade. je trouverais plus naturel d'ailleurs d'interagir avec mon laptop mais ce n'est surement qu'une perception.
avatar therealshad | 
Quelle appli utilises tu pour lire les article ? merci :)
avatar primalmotion | 
Dans la video, l'assistant, on dirait Mark Zuckerberg.
avatar oupsman | 
Je n'ai qu'un regret concernant Siri, c'est d'être obligé d'acheter un 4S pour en profiter : j'aimerais bien ça soit disponible sur mon iPad 2 ...
avatar manu1707 | 
C'est génial comme fonctionnalité ! Quand je vois la faiblesse d'esprit du petit journal ... Ça me fait marrer
avatar kisco | 
Comment Siri sait-il qui est ma femme ou mon frère dans mes contacts? Y aura-t-il des champs en plus de type "Relation" à remplir dans le carnet d'adresses? Quelqu'un est-il informé sur ce point? Merci
avatar Almux | 
Ouais!... Mais, tout ça, ça va de nouveau faire jaser les haters! - C'est pas si bien que ça... y'avais d'jà... Apple n'a rien inventé... Et patati et patata!... Bref: "Les chiens aboient et la caravane passe..."
avatar Eazy7 | 
Comment on active Siri au fait ? C'est un programme ? Un démon qui tourne en tâche de fond ?
avatar Fil de Brume | 
@Eazy7 : Comme pour la reconnaissance vocale actuelle, appui long sur le bouton home.
avatar Anthony Nelzin-Santos | 
@Eazy7 : comme l'assistant vocal actuel, appui long sur le bouton d'accueil. On peut ensuite appuyer sur un bouton à l'écran pour déclencher l'écoute, ou porter l'iPhone à l'oreille.
avatar Arnaud de la Grandière | 
@ kisco : il y a plusieurs manière d'informer Siri sur les liens avec les personnes : - Marie Dupont est ma femme Siri saura dorénavant à qui vous faites référence. Mais si vous n'avez pas pris la précaution de lui préciser, Siri vous posera la question : - Envoie un message à ma femme - Quel est le nom de votre femme ? - Marie Dupont - Quel message dois-je lui envoyer ? - J'arrive dans un quart d'heure Ce qui aurait également pu fonctionner d'un seul coup avec : - Envoie un message à Marie Dupont : j'arrive dans un quart d'heure. Plus d'infos sur http://www.tuaw.com/2011/10/05/iphone-4s-what-can-you-say-to-siri/
avatar josselinrsa | 
@kisco : Bonne question Peut-être un rapport avec Find my Friends
avatar shenmue | 
C'est bien sûr une appli majeure, que bien sûr encore on s'est empressé de minorer sur les sites généralistes (mais aussi sur un site Mac) en opposant en face des logiciels comme Vilingo, pourtant très loin des perfs de Siri: http://www.lesnumeriques.com/vlingo-commande-vocale-gratuite-smartphones-android-news-21445.html Siri offre une compréhension contextuelle, qui arrive souvent à déduire ce que l'on veut dire sans le besoin de TOUT dire et qui le cas échéant nous demande des précisions comme pourrait d'aileurs le faire un interlocuteur humain. Certes, ce n'est pas une invention d'Apple, mais comme souvent, la technologie a été optimisée, les services attenants ont été étendus et surtout le lien entre le moteur Siri et Nuance a été le coup de poker sans doute gagnant qui va permettre à cette réco d'être vraiment l'assistant numérique dont on rêvait tous un peu, notre jarvis perso au fond de la poche. Steve Jobs sera mort quelques heures donc seulement après la présentation d'un iBidule qui va sans aucun doute, et l'histoire de la technologie s'en souviendra, être le début de nouveaux outils toujours plus simples d'utilisation, toujours plus fluides à maitriser, dans un environnement toujours plus maitrisé. De bout en bout, c'est bien une légende en marche.
avatar Adrien13 | 
Merci MacG pour ce bel article très intéressant.
avatar shenmue | 
A noter que Siri apprend au fur et à mesure de son utilisation: Exemple: - Rappelles moi de sortir les poubelles quand je serais à la maison - Siri: qu'elle est l'adresse de votre maison - 19 avenue Trucmuche. Le second coup, il ne posera plus la question, pas besoin d'avoir enregistré ça avant, pas besoin de rentrer des listes de mots clefs, Siri s'enrichit envers chaque utilisateur, afin que la communication soit plus fluide. C'est juste géant, le début d'un truc énorme pour Apple qui en plus a protégé le "moteur" de ce logiciel en le faisant tourner à distance sur ses serveurs. La méthode Google: on est dans la logique du secret industriel. Samsung pourra ouvir un iPhone 4S en 2, ils ne trouveront pas les algos de Siri....
avatar LeLaid | 
Purée. On imagine déjà l'évolution de Mac OS :)) C'est comique mais il y a tout un paquet de monde que je ne lis pas ici.... Vraiment étrange....
avatar Oliviou | 
@nonoche : N'importe quoi: Marie Dupont est MA femme. Usurpateur.
avatar Oenc | 
Et dans 3 ans, Samsung, Google Android et plein d'autre marques copieront et porteront le mode de contrôle de Siri d'une manière baclée sur leur appareil tout en se proclamant grand révolutionnaire de la commande vocale mobile. J'en rie déjà...
avatar Venel | 
Internet vient de pantagon ?? Ou pas, il vient du CERN à Genève
avatar shenmue | 
@Lelaid:"C'est comique mais il y a tout un paquet de monde que je ne lis pas ici.... Vraiment étrange...." T'inquiètes, ils préparent déjà des conrte-arguments comme ceux que j'ai pu lire sur Pci, comme par exemple le temps de latence. Sur Siri, ce temps de latence est faible, vraiment faible, mais il existe au vu des vidéos. Arguments des "anti-tout-ce-propose-Apple-et-que-c'est-toujours-de-la merde-même-quand-ça-tue-tout" ? S'il y a un temps de latence, même infime, c'est inutilisable, c'est nul, et finalement, ça ne vaut pas mieux que le reste. On avait eu droit à ce type de débilités pour la sortie du Mac avec sa souris ("un jouet") avant que tout le monde ne fasse pareil, on a eu droit à ça avec l'iPod ("la roue comme interface ? lol"), avec l'iPhone ("pas de claviers nuémrique en dur" re-lol) et là, ben c'est pareil, on cherche un truc pourvu de dire que c'est de la merde au final. Siri est à des coudées au dessus de tout les systèmes de réco vu sur windows, Google ou autres, mais il y en a eu sur Pci pour soutenir que c'était kif kif ailleurs. Ce n'est même plus désolant un tel déni, c'est, à ce point là, stupide, puisqu'on préfère dire une connerie, pourvu, parce que c'est visiblement ça l'essentiel, pourvu donc qu'on ne reconnaisse pas qu'Apple a une longueur d'avance. A chaque fois qu'Apple propose un truc de neuf, on a la patrouille des degs qui viennent expliquer qu'ils n'ont rien inventé, qu'on a vu ça ailleurs (lors de la sortie de l'iPhone cet argument était bien pitoyable aussi...), etc... Le but n'est pas d'argumenter ici, c'est juste de dire qu'Apple c'est de la merde bien enrobée dans du marketing, même si au passage cela doit atomiser toute notion de vérité historique...
avatar methos1435 | 
J'attend de voir ce que ca donner en realite. De voir si l'assistant est capable de comprendre une personne qui oarle normalement (cad pas en machant sa phrase a deux a l'heure... J'attend aussi de voir si appke compte mettre a jour cette applicaion ou s'il faudra "tout racheter" pour rofiter des evolutions. Enfin j'attend de voir debarquer ce truc sur lion. Si 'est bon pour tout ca j'envisagerai peut etre de repasser a l'iphone et de reinstaller lion a la place d'archlinux... Parce qu'un assistant personnel qui est capable de comprendre naturellement ce que je dis, j'en reve depuis des annees mais les attentes sont grandes.
avatar lukasmars | 
Très impressionnant. Mais j'attend de voir en français ce que ça va donner.
avatar methos1435 | 
Désolé pour les fautes. L'ipad sans la correction automatique ...
avatar shenmue | 
@Oenc:"Et dans 3 ans, Samsung, Google Android et plein d'autre marques copieront et porteront le mode de contrôle de Siri d'une manière baclée sur leur appareil tout en se proclamant grand révolutionnaire de la commande vocale mobile. J'en rie déjà..." Ouais, ben ils ont intérêt à beaucoup bosser alors, parce que quand on voit d'où vient Siri, les travaux de pointe que cela a demandé, c'est pas juste une rustine sur un logiciels de réco actuel qui vont apporter le même truc. A noter qu'Apple est très loin d'avoir utilisé toutes ses options pour confondre la concurrence qui voudrait se contenter de suivre: - ils ont toujours (et pour toujours) une exclusivité sur l'utilisation du Liquid Metal et bossent en ce moment sur de nouvelles batteries révolutionnaires utilisant cet élément. - Ils ont des options et des vues assez claires sur la techno de Witricity, qui pourrait tout bonnement révolutionner l'aimentation électrique des appareils à la maison (on pense d'ailleurs à la robotique, d'autant plus en lien avec Siri). Et ils ont de l'argent pour acheter ce qu'ils veulent, ou presque. Va falloir sortir les rames, le début de l'après-Job ne commencera en tout cas pas par un parcours de santé pour les concurrents..
avatar sylko | 
Non, c'est le web qui a été développé au CERN ;-) https://www.macg.co/web/voir/132942/tim-berners-lee-et-la-demo-de-worldwideweb.app
avatar enkyl31 | 
Comparativement à la reconnaissance vocale de Google, que vaut Siri ? Quelqu'un a-t-il eu la chance de tester les 2 ? (merci de ne pas répondre en extrapolant les publicités d'Apple VS les critiques rapportées par une tierce personne sur la solution Google).

Pages

CONNEXION UTILISATEUR