YouTube a sous-titré automatiquement un milliard de vidéos

Nicolas Furno |

YouTube propose le plus grand catalogue de vidéos au monde, c’est le service de streaming le plus utilisé et Google entend proposer ce contenu le plus largement possible. À cette fin, l’entreprise a ajouté la prise en charge des sous-titres dès 2006 et depuis près de dix ans, elle sous-titre automatiquement les vidéos en anglais.

À l’heure actuelle, un milliard de vidéos ont été sous-titrées automatiquement par YouTube. Google a aussi modifié l’algorithme de reconnaissance et les résultats sont désormais bien meilleurs, comme le montre cet exemple.

Avant / après : la qualité des sous-titres automatiques a été largement améliorée par Google. Cliquer pour agrandir

Vous pouvez essayer vous-même, par exemple avec le trailer de Planet of the Apps, l’émission de télé-réalité lancée par Apple. Elle est fournie avec des sous-titres rédigés à la main qui sont parfaits, mais vous pouvez activer les sous-titres automatiques de YouTube en passant par l’icône en forme de roue crantée. Le résultat n’est pas aussi bon, mais il y a peu d’erreurs et si vous ne pouvez pas entendre les voix, c’est une bonne manière de suivre malgré tout.

Ce sous-titrage automatisé a été pensé à l’origine pour des raisons d’accessibilité, mais il sert aussi pour les usages mobiles. Un grand nombre de vidéos sont regardées aujourd'hui sur les smartphones sans le son, surtout sur les réseaux sociaux. De nombreux créateurs de contenus insèrent le texte directement dans l’image, mais la solution de YouTube est plus universelle.

Ajoutons que ces sous-titres automatiques ne sont proposés qu’en anglais, mais qu’ils peuvent ensuite être traduits dans n’importe quelle langue. La qualité du résultat dépend de la capacité de Google Translate pour passer d’une langue à l’autre, mais c’est encore perfectible.

avatar zoubi2 | 

"La qualité du résultat dépend de la capacité de Google Translate pour passer d’une langue à l’autre"

Laquelle capacité est encore extrêmement limitée !! Ça peut servir pour essayer de deviner ce que veut dire un texte dans une langue inconnue, mais à part ça... Surtout si la langue n'est pas académique...

avatar Paquito06 | 

@zoubi2

En maitrisant 4 langues, j'ai pu voir que Google avait fait d'enormes progres niveau traduction sur la derniere decennie. Y a encore quelques accrochages et parfois des contre sens terrible (car ca passe par l'Anglais je presume) mais c'est de moins en moins frequent et en effet, on peut bien plus que pour depanner converser dans une langue totalement inconnue.

avatar françois bayrou | 

Je voulais faire une boutade en collant ici la transcription de "je suis tout à fait d'accord avec ce que vous dites", traduit d'une langue vers l'autre, une 20aine de fois, en passant par des langues bien différentes. Ca n'a pas marché : Google m'a au final donné "je suis tout à fait d'accord avec ce que vous dites"

Dont acte

je suis tout à fait d'accord avec ce que vous dites

avatar Bigdidou | 

@Paquito06
"Y a encore quelques accrochages et parfois des contre sens terrible (car ca passe par l'Anglais je presume) mais c'est de moins en moins frequent"

Peu importe leur fréquence, à la limite.
Le fait qu'ils puissent exister doit rendre très prudent, comme l'écrit oomu.
Après, c'est sur, ça dépanne.

avatar Paquito06 | 

@Bigdidou

Pour un usage pro c'est exclus on passe toujours par l'humain, mais pour la majorite du public qui ne maitrise qu'une langue et se doit de dialoguer ca depanne bien plus je pense.

avatar benooo8888 | 

Ça serait bien que ce soit proposé aussi sur leur app de l'Apple TV...
Cette app commence à être vieillotte ...

avatar oomu | 

Mouais, pour l'avoir essayé, je ne suis pas convaincu.

Et surtout, il y a le risque de contre-sens inimaginable à l'avance. Dramatique si on croit que c'est infaillible et qu'on ne comprends pas la langue.

Ainsi, si quand vous suivez votre youtubeur américain favori, vous lisez subitement "I hate freshly ground black people", vérifiez s'il a pas plutôt dit "I hate freshly ground black pepper." ^^,

-
Mais bah, la technologie progresse et j'ai bon espoir que vers 2040 je pourrai enfin voter pour un Robot Géant Surpuissant et à l'Amour Infini.

avatar Mac13 | 

Pas au point au point qu'ils nous rendent dyslexies !

Je demande les sous titres corrigés.

La loi oblige les textes publiques correctement...

avatar PiRMeZuR | 

Ces traductions automatiques prennent tous leur sens depuis que YouTube a donné la possibilité aux utilisateurs de les améliorer. L'outil mis à disposition est redoutable d'ergonomie et d'efficacité mais c'est la traduction automatique qui mâche 90% du boulot.

YouTube semble ici s'être inspiré du phénomène de traduction crowd sourcée qu'on a vu arriver avec des séries massivement piratées comme Game of Thrones et traduites bénévolement en quelques dizaines de minutes par des individus anonymes.

avatar whocancatchme | 

Je suis toujours impressionné par la qualité du translator de Facebook quand un statut n'est pas dans la bonne langue, je me demande pourquoi Google n'arrive pas à faire pareil

avatar lolo57 | 

Parce que les statuts sont des phrases courtes. Sur des phrases courte google s'en sort bien aussi. Je viens de faire une petite admin pour un client, avec une traduction automatique des champs de titre et description via l'api azure de Microsoft. ça marche pas mal à condition de faire des phrases courtes et syntaxiquement simple dans la langue de départ. Ici le français.

avatar narugi | 

C'est du machine learning donc le programme s'améliore de jour en jour.

avatar Dgamax | 

Avec le machine learning Google arrive à se passer de l'anglais comme référence.
C'est à dire qu'ils l'entrainent de traduire anglais vers japonais par exemple et anglais coréen et grace au machine learning ils ont découvert qu'il était capable de traduire du japonais vers le coréen sans lui avoir appris.

https://www.google.fr/amp/s/www.cnet.com/google-amp/news/google-translate-uses-machine-learning-for-its-cool-new-trick/

CONNEXION UTILISATEUR