Ouvrir le menu principal

MacGeneration

Recherche

Le « Traducteur universel » de Google double les vidéos à l'aide de l'IA et s'occupe même de la synchronisation labiale

Félix Cattafesta

jeudi 11 mai 2023 à 17:15 • 20

Ailleurs

Google a profité de la Google I/O pour déballer ses nouveautés en matière d'IA, et a levé le voile sur une technologie permettant de « traduire » une vidéo de manière assez impressionnante. Le service va artificiellement doubler un passage dans une autre langue et faire en sorte que les lèvres d'une personne soient synchronisées de façon convaincante. Cela donne l'impression d'un locuteur natif sans avoir besoin de véritablement doubler une vidéo. Une petite démo a été présentée pendant la conférence (1:15:00).

En coulisse, l'algorithme va transcrire la vidéo puis traduire le texte. Il va ensuite le faire lire à l'IA en recréant la voix du locuteur tout en faisant en sorte de garder l'intonation et le style. La piste est par la suite intégrée à la vidéo, avec une synchronisation labiale permettant d'offrir un résultat convaincant. Il y a encore une marge de progression pour Google (on peut voir les ficelles si on se concentre sur les lèvres), mais cela reste bluffant.

L'intérêt de la technologie est évident : Google montre que l'on pourrait par exemple doubler un cours en plusieurs langues sans devoir faire appel à plusieurs locuteurs natifs ou recourir à des sous-titres. Cependant, on peut également craindre les scénarios dans lesquels elle serait utilisée à mauvais escient. Google est bien conscient des risques et a expliqué sur scène ne pas trop savoir sur quel pied danser. L'entreprise y voit une « tension » entre audace et sécurité, précisant que le concept pourrait être repris pour créer des deepfakes malveillants visant à faire raconter n'importe quoi à n'importe qui.

Ce « Traducteur Universel » ne sera donc proposé qu'à des partenaires certifiés et intégrera des garde-fous pour éviter les abus. Google a aussi promis de mettre en place un système de filigrane dans ses modèles, qui devrait aider à « relever le défi de la désinformation ».

Rejoignez le Club iGen

Soutenez le travail d'une rédaction indépendante.

Rejoignez la plus grande communauté Apple francophone !

S'abonner

Sauf interdiction, Anthropic entrainera Claude avec vos conversations

11:08

• 2


Le grand tapis de souris de Logitech en promo à 8 €

10:34

• 0


Aménager son bureau Mac en 2025 : les écrans, meubles et accessoires essentiels

10:24

• 35


Mini-test du chargeur Ugreen Nexode à câble rétractable

10:00

• 1


Alors que ses ventes sont en chute libre en Europe, Tesla sort une Model Y encore plus chère

09:54

• 65


Combien ça coûte d'attaquer Apple en justice ?

08:59

• 14


Promo : -65 € sur le SDD SanDisk Extreme Pro 4 To

08:30

• 3


my kSuite : une alternative gratuite, souveraine et suisse à Google et Microsoft (et à -80 % si besoin de plus) 📍

08:07

• 0


Test du détecteur de fumée MS-1 de Sensereo : Matter via Thread dans un module séparé

07:57

• 4


Apple a bloqué iTorrent sur l’AltStore à la demande de gouvernements 🆕

07:54

• 64


Xcode bêta développeur 7 active l’intégration de ChatGPT 5 et Claude

28/08/2025 à 20:45

• 23


Après une mise en demeure de l’Arcom, cinq sites porno baisent les bras

28/08/2025 à 20:15

• 81


Les créateurs de Vivaldi ne veulent pas intégrer une intelligence artificielle générative dans leur navigateur

28/08/2025 à 18:15

• 9


Proton pense aux coups durs avec une nouvelle option de partage

28/08/2025 à 17:30

• 1


Une alternative au Magic Keyboard : le Logitech MX Keys Mini à 55 € seulement

28/08/2025 à 16:34

• 7


L’une des plus anciennes plateformes de blog va fermer ses portes avec un seul mois de préavis

28/08/2025 à 12:16

• 11