Ouvrir le menu principal

MacGeneration

Recherche

Translatotron : Google cherche à garder l'intonation et la voix du locuteur dans les traductions vocales

Stéphane Moussie

jeudi 16 mai 2019 à 11:24 • 7

Logiciels

Les ingénieurs de Google travaillent sur un tout nouveau système de traduction vocale pouvant notamment mieux conserver l’intonation du locuteur.

La traduction vocale fonctionne généralement en trois étapes, expliquent Ye Jia et Ron Weiss sur le blog Google AI. Premièrement, le système transcrit la parole en texte. Deuxièmement, ce texte est traduit dans la langue désirée. Et troisièmement, le texte traduit est prononcé par une synthèse vocale.

Ce système fragmenté, à l’œuvre dans Google Traduction par exemple, fonctionne globalement bien, mais il y a matière à faire mieux, estiment les ingénieurs qui expérimentent un nouveau mécanisme.

Architecture du Translatotron

Le Translatotron, le nom de leur nouveau système, fait l’impasse sur l’étape de conversion de la parole en texte. En traduisant plus directement les paroles, le Translatotron est censé offrir plusieurs avantages : plus de vitesse, pas d’erreur possible entre la reconnaissance et la traduction, une meilleure gestion des mots qui n’ont pas besoin d’être traduits (comme les noms propres) et la conservation de l’intonation.

Source (en espagnol)
Traduction avec le système traditionnel
Traduction avec le Translatotron

Pour l’heure, le Translatotron donne de moins bons résultats que la méthode traditionnelle en ce qui concerne la fidélité de la traduction. Mais il se démarque d’ores et déjà en matière de reproduction de l’intonation.

Google veut même aller plus loin en conservant la voix du locuteur. Imaginez un peu : c’est comme si c’était vous qui parliez chinois ou néerlandais. Des échantillons d’essais entre l’espagnol et l’anglais sont disponibles sur cette page. Les résultats ne sont pas très probants pour le moment pour la conservation de la voix, mais le Translatotron est toujours en plein développement.

Rejoignez le Club iGen

Soutenez le travail d'une rédaction indépendante.

Rejoignez la plus grande communauté Apple francophone !

S'abonner

Du keynote au code : comment Decathlon hiérarchise les nouveautés d’iOS pour ses apps

15:00

• 3


Ces articles du Club iGen passent en accès libre : découvrez nos contenus premium

12:51

• 2


À contre-courant : pourquoi Christophe ne croit pas au discours d’Apple sur la vie privée

10:57

• 29


S’il vous plaît, ne créez pas de bombe nucléaire avec Claude

15/08/2025 à 20:30

• 31


La publicité et les liens commerciaux pourraient arriver dans ChatGPT… avec prudence

15/08/2025 à 15:30

• 22


Un SSD NVMe de 2 To proche de la taille d'une carte micro SIM

15/08/2025 à 11:55

• 35


Mieux qu'Amazon : le MacBook M4 à 920 € pour le 15 août

15/08/2025 à 10:27

• 10


Intel et le Thunderbolt 5 ajoutent l'USB 3.2 Gen 2x2 (20 Gb/s) aux Mac dans certains cas

15/08/2025 à 10:00

• 14


Une panne nationale d'envergure touche la SNCF [🆕 retour à la normale]

15/08/2025 à 08:35

• 159


Le développement de l’IA finalement bloqué par le mur de la consommation électrique ?

14/08/2025 à 22:15

• 150


Le MacBook Pro M5 pourrait avoir une option cellulaire 5G

14/08/2025 à 21:00

• 40


L'IA est là et il faut apprendre à parler chatbot

14/08/2025 à 20:30

• 17


Un Mac Pro M4 Ultra repéré dans du code : futur lancement ou projet avorté ?

14/08/2025 à 17:50

• 23


iPad A18, Studio Display 2, nouvelle Apple TV : tous les appareils révélés par une grosse fuite d’Apple

14/08/2025 à 16:30

• 44


Apple préparerait bien un successeur au Studio Display, avec une puce A19 Pro 🆕

14/08/2025 à 15:05

• 58


Bonne affaire : le MacBook Air M4 repasse sous les 1 000 € sur Amazon  🆕

14/08/2025 à 14:13

• 143