Translatotron : Google cherche à garder l'intonation et la voix du locuteur dans les traductions vocales

Stéphane Moussie |

Les ingénieurs de Google travaillent sur un tout nouveau système de traduction vocale pouvant notamment mieux conserver l’intonation du locuteur.

La traduction vocale fonctionne généralement en trois étapes, expliquent Ye Jia et Ron Weiss sur le blog Google AI. Premièrement, le système transcrit la parole en texte. Deuxièmement, ce texte est traduit dans la langue désirée. Et troisièmement, le texte traduit est prononcé par une synthèse vocale.

Ce système fragmenté, à l’œuvre dans Google Traduction par exemple, fonctionne globalement bien, mais il y a matière à faire mieux, estiment les ingénieurs qui expérimentent un nouveau mécanisme.

Architecture du Translatotron

Le Translatotron, le nom de leur nouveau système, fait l’impasse sur l’étape de conversion de la parole en texte. En traduisant plus directement les paroles, le Translatotron est censé offrir plusieurs avantages : plus de vitesse, pas d’erreur possible entre la reconnaissance et la traduction, une meilleure gestion des mots qui n’ont pas besoin d’être traduits (comme les noms propres) et la conservation de l’intonation.

Source (en espagnol)
Traduction avec le système traditionnel
Traduction avec le Translatotron

Pour l’heure, le Translatotron donne de moins bons résultats que la méthode traditionnelle en ce qui concerne la fidélité de la traduction. Mais il se démarque d’ores et déjà en matière de reproduction de l’intonation.

Google veut même aller plus loin en conservant la voix du locuteur. Imaginez un peu : c’est comme si c’était vous qui parliez chinois ou néerlandais. Des échantillons d’essais entre l’espagnol et l’anglais sont disponibles sur cette page. Les résultats ne sont pas très probants pour le moment pour la conservation de la voix, mais le Translatotron est toujours en plein développement.

avatar noooty | 

Whaou, bientôt on aura l’implant dans la gorge ou le cerveau pour parler toutes les langues.

avatar ForzaDesmo | 

Se parler à soi même... c'est complètement fou !
Vite je prends rendez-vous chez mon psy.

Je préfèrerai qu'il utilise la voix de ma copine plutôt. 🧐

avatar oomu | 

vous inquiétez pas, y aura des kits de voix par des acteurs et actrices reconnues, et un droit voisin de la vraisemblance d'une voix pour faire un marché de la vente de voix à usages uniques.

avatar Finouche | 

A force de s'en remettre à la technologie, on finira par ne plus avoir besoin de cerveau.
C'est peut-être le but...

avatar huexley | 

Personnellement les pigeons voyageurs, faire les lessives dans une rivière ou allumer un feu avec des Silex me tente pas vraiment... Je suis sur que tu te sers d'un atlas routier pour faire tes trajets, que tu envoies des telegrammes et que ton utilise une cabine de telephone pour appeler, brrr le progrès qu'elle horreur.

avatar Mike Mac | 

Avec la voix de "Lèvres en feu"... Mmmm...

https://tinyurl.com/yyt3qfvx

avatar xDave | 

on nous M.A.S.H. le boulot quand même

CONNEXION UTILISATEUR