Ouvrir le menu principal

MacGeneration

Recherche

YouTube va bientôt proposer des doublages générés par l'IA

Félix Cattafesta

vendredi 23 juin 2023 à 10:15 • 15

Services

Google veut simplifier la vie des créateurs de vidéos YouTube et va prochainement proposer des doublages par IA. L'entreprise a pour cela fait appel aux équipes du service spécialisé Aloud, issu de sa division Area 120 en charge de différents types de projets expérimentaux.

Une vidéo de présentation explique comment tout fonctionne sous le capot. Le service génère tout d'abord une transcription du texte, que l'utilisateur peut modifier et adapter. Le script est ensuite traduit et lu par l'IA afin d'être facilement greffé à la vidéo. Il est possible d'avoir une idée du résultat sur cette vidéo de la chaîne The Amoeba Sisters : il suffit de sélectionner la piste doublée en espagnol en cliquant sur la roue dentée en bas à droite du lecteur.

Si les services d'Aloud ont été présentés début 2022, leur intégration sur YouTube aujourd'hui n'est pas surprenante. La plateforme a lancé depuis quelque temps une fonction permettant de proposer plusieurs pistes audio sur une vidéo. Le vidéaste MrBeast affiche ainsi pas moins de 13 doublages sur ses dernières vidéos, allant du japonais au français en passant par l'arabe ou le turc. Actuellement, les services d'Aloud se limitent à l'anglais, à l'espagnol et au portugais, mais d'autres langues devraient arriver par la suite.

YouTube a confirmé à The Verge que la fonction était en ce moment en cours de test avec une centaine de créateurs, et qu'elle avait pour ambition de la proposer à un plus grand nombre courant 2024. Sur le long terme, l'objectif est de « faire en sorte que les pistes audio traduites ressemblent à la voix du créateur, avec plus d'expression et une synchronisation labiale ».

Ce projet n'est pas sans rappeler le « Traducteur Universel » de Google, présenté lors de la dernière grande conférence du groupe. Celui-ci double les vidéos à l'aide de l'IA et fait en sorte que les lèvres d'une personne soient synchronisées de façon convaincante. Or, ce traducteur ne devrait être proposé qu'à une poignée des partenaires : Google craint que la technologie puisse être utilisée pour créer facilement des deepfakes, visant à faire raconter n'importe quoi à n'importe qui.

Rejoignez le Club iGen

Soutenez le travail d'une rédaction indépendante.

Rejoignez la plus grande communauté Apple francophone !

S'abonner

Infomaniak lance une plateforme “souveraine” d’IA open source

12/10/2024 à 18:30

• 11


Apple n'a plus le droit de faire circuler des voitures autonomes en Californie

12/10/2024 à 11:05

• 46


Sortie de veille : le MacBook Pro M4 déjà en fuite ?

12/10/2024 à 08:00

• 8


L’ARCOM valide la solution temporaire de la CB pour les sites frivoles

11/10/2024 à 21:15

• 31


L'application Steam Link streame en AV1 sur Mac si vous avez une puce M3

11/10/2024 à 19:15

• 18


Le SuperDrive d'Apple est en voie de disparition 🆕

11/10/2024 à 17:22

• 73


Intel lance les Core Ultra 200S pour succéder à la 14e génération de Core

11/10/2024 à 16:00

• 11


Apple ouvre son plus grand labo de R&D en Chine

11/10/2024 à 15:08

• 23


Amazon obligé d'arrêter de vendre les Fire TV Stick dans certains pays à cause de Nokia

11/10/2024 à 12:25


Tesla présente le Robotaxi et promet son arrivée sur les routes américaines d’ici deux ou trois ans

11/10/2024 à 10:20

• 79


Donald Trump veut interdire les voitures autonomes

11/10/2024 à 10:09

• 125


Test d'un adaptateur microSD pour MacBook : pourquoi c’est un support de stockage à utiliser avec précaution

11/10/2024 à 08:45

• 16


Orange lance son offre 5G+ Home

11/10/2024 à 07:51


Asahi Linux lance des jeux AAA sur les Mac Apple Silicon, parfois mieux que macOS

10/10/2024 à 20:00

• 25


Global Police Summit : les conférences spécialisées d'Apple pour les forces de l'ordre

10/10/2024 à 18:30

• 7


Une faille dans CUPS, la technologie d'impression d'Apple, très dangereuse dans de nombreux UNIX… sauf ceux d'Apple

10/10/2024 à 16:15

• 23