Almond, un nouvel assistant personnel open source

Sabrina Fekih |

Bien que les assistants virtuels simplifient certaines actions du quotidien, on leur remet souvent un bonnet d'âne quand il s'agit de respect de la vie privée. Que ce soit Amazon, Google ou même Apple, les géants de la tech ont tous été épinglés pour des pratiques douteuses d'enregistrements de conversations depuis leurs assistants vocaux respectifs.

Une problématique sur laquelle des chercheurs et étudiants de l'Université de Stanford ont planché jusqu'à mettre au point un assistant qui ne dépend d'aucun grand groupe. Appelé Almond, l'assistant, qui est accessible sur le web et Android, est open source et gratuit.

Sous le capot d'Almond, il y a LUInet, un composant qui permet de comprendre le langage naturel. Ce composant exploite un réseau neuronal, alimenté par des jeux de données provenant des utilisateurs et de programmes spéciaux, pour améliorer sa compréhension. Les requêtes en langage naturel sont traduites dans le langage de programmation ThingTalk.

Almond envoie les requêtes vers Thingpedia, une « encyclopédie des opérations pour les services en ligne et les objets connectés », qui lui retourne alors le résultat demandé… si le service en question s'est branché sur Thingpedia. C'est la condition sine qua non pour qu'Almond fonctionne, il ne peut pas sortir de son chapeau n'importe quoi.

À l'heure actuelle, Dropbox, Gmail, Instagram, Nest, Spotify et des dizaines d'autres services et objets sont en partie contrôlables (uniquement en anglais) avec Almond. Il est possible d'entremêler les actions : on peut par exemple faire cette requête à Almond « quand je quitte la maison, arrête le chauffage. » C'est IFTTT en langage naturel et en open source.

Almond ne comprend que les requêtes textuelles et ne répond que sous forme textuelle également. Toutefois, une association avec Home Assistant a récemment abouti à l'assistant vocal Ada. Le principe est de transformer les commandes vocales en texte pour qu'Almond puisse les traiter.

Différentes demandes peuvent être réalisées en connectant son compte Twitter par exemple

« Ce qui se passe à Vegas ne reste plus à Vegas désormais », déplore Monica Lam, la responsable du projet, dans une interview au New York Times, en référence à la décision de l'hôtel Wynn Resorts à Las Vegas d'installer des Amazon Echo dans ses chambres. Encore à mille lieues de Siri, Google Assistant ou Alexa, Almond compte sur la contribution développeurs du monde entier pour offrir une alternative libre dans le futur.

D'autres initiatives open source ont lieu dans le domaine des assistants. À travers Common Voices, la fondation Mozilla s'attache à constituer un grand jeu de données de voix humaines utilisable par des services open source, comme Mycroft et Leon.

avatar J'en_crois Pas_mes yeux | 

" Amazon, Google... Apple, les géants de la tech ont tous été épinglés pour des (...) enregistrements de conversations depuis leurs assistants vocaux respectifs."
Les enregistrements auxquels vous faites référence ne posent pas un réel danger. Ils sont "trop artisanaux, anecdotique", et tant qu'ils ne sont écoutés que par des oreilles humaines et qu'ils ne sont pas ciblés autrement que pour l'amélioration du service, le danger n'est pas réel.
Ce ne sont pas les oreilles humaines qui posent problème, mais que ces enregistrement puissent être conserver pour enrichir le BigData.

avatar smog | 

Et le Big Data, qui l'exploite ? Peut-être pas les oreilles humaines, mais le reste de l'humain ! ;-)

avatar J'en_crois Pas_mes yeux | 

@smog
heu... si tu veux dire que les "méchants" ce sont les hommes pas les machines, nous sommes bien d'accord. Mais l'écoute individuelle de chaque citoyen, la Stasi a essayé... Si tu veux la Stasi.2, on change d'échelle. Les paroles sont transformées en texte indexé. Ce qui pose problème, ce n'est pas l'écoute en direct, c'est la conservation et l'indexation des données. Les oreilles et la mémoire humaine... elles ne font pas le poids

avatar smog | 

Oui mais je serais loin catégorique sur "elles ne font pas le poids"... Certes, l'indexation rend bien des services mais ça n'empêche que l'écoute par des oreilles humaines, avec ses limites, peut très bien être malsaine.
Quand on écoutait les communications pendant la 2nde guerre mondiale, il n'y a avais que des oreilles. plus ciblé certes mais pas de machines d'analyse (juste de décryptage). Quand on veut trouver quelque chose, on peut. C'est peut-être là le soucis même sans algorithmes complexes...

avatar J'en_crois Pas_mes yeux | 

@ smog
j'insiste : anecdotique.
Bien sur en soi, la Stasi ou autres écoutes à l'oreilles n'avait rien d'anecdotiques pour ceux qui les subissaient si l'on se souvient des répercussions. Mais tout d'abord objectifs/moyens/répercution de cette micro écoute humaine par Apple/Google/Amazon est négligeable (en dehors de l'amélioration de l'outil).
Mais surtout les dizaines, centaines, milliers ? dizaines de milliers ? sont sans commune mesure avec les milliards potentiellement écoutés, mémorisés indexés que permet l'enregistrement automatisé;
Les oreilles humaines n'ont d'intérêt que pour l'écoute d'une cible particulière (présidents, décideurs, criminels, etc.). En dehors des cibles particulières, dans l'écoute massifiée qui se prépare, l'écoute humaine est devenue obsolète;

avatar smog | 

Oui c'est possible. Et quand on voit comment chez nous (en France) les dysfonctionnements en termes d'écoutes/de surveillance (voir les histoires récentes des terroristes) pourtant bien ciblées, on se dit qu'on ne risque pas grand chose. Mais bon, quand il y a beaucoup d'infos, il faut quand-même trier et stocker, je ne sais pas, même si les ordinateurs trient, si la somme de "data" sera finalement exploitable à grande échelle...
Ce qui est sûr pour moi, c'est qu'il y aura un moment où il sera bon d'avoir un ordinateur non-relié à un quelconque réseau ;-)

avatar J'en_crois Pas_mes yeux | 

@smog
Bien d'accord :-)
" je ne sais pas, même si les ordinateurs trient, si la somme de "data" sera finalement exploitable à grande échelle..."
De ce que nous croyons savoir, le Bigdata est encore sous-exploité. Elle permet certes aux populistes de remporter des élections ou provoquer le brexit, mais il est à craindre que sa capacité de prédire et de manipuler les futurs deviennent dans un futur pas si éloigné une réalité.

avatar smog | 

Oui... Bombe à retardement pour nos sociétés ? (Une de plus ?)

avatar Ali Ibn Bachir Le Gros | 

et tant qu'ils ne sont écoutés que par des oreilles humaines et qu'ils ne sont pas ciblés autrement que pour l'amélioration du service, le danger n'est pas réel.

Lol 🤣

avatar thierry37 | 

L'assistante s'appellera Amandine, dans sa version française. 😜

avatar smog | 

Ce serait bien ! Mais ma compagne s'appelle Amandine, confusions possibles ;-)

avatar pat3 | 

C’est vraiment une très bonne nouvelle que ces initiatives open source dans ce domaine hautement aspirateur de données.
Ce sera évidemment très difficile de les utiliser en lieu et place des assistants installés par les constructeurs ou les fournisseurs d’OS, mais c’est un premier pas qui permet de croire que tout n’est pas joué d’avance dans ce domaine.

avatar SyMich | 

On n’écrit pas « Université DE Stanford » comme on ne dit pas « Université DE Pierre et Marie Curie » ou « Lycée DE Molière » ... 🤦‍♂️

CONNEXION UTILISATEUR