Ouvrir le menu principal

MacGeneration

Recherche

Le « Traducteur universel » de Google double les vidéos à l'aide de l'IA et s'occupe même de la synchronisation labiale

Félix Cattafesta

jeudi 11 mai 2023 à 17:15 • 20

Ailleurs

Google a profité de la Google I/O pour déballer ses nouveautés en matière d'IA, et a levé le voile sur une technologie permettant de « traduire » une vidéo de manière assez impressionnante. Le service va artificiellement doubler un passage dans une autre langue et faire en sorte que les lèvres d'une personne soient synchronisées de façon convaincante. Cela donne l'impression d'un locuteur natif sans avoir besoin de véritablement doubler une vidéo. Une petite démo a été présentée pendant la conférence (1:15:00).

En coulisse, l'algorithme va transcrire la vidéo puis traduire le texte. Il va ensuite le faire lire à l'IA en recréant la voix du locuteur tout en faisant en sorte de garder l'intonation et le style. La piste est par la suite intégrée à la vidéo, avec une synchronisation labiale permettant d'offrir un résultat convaincant. Il y a encore une marge de progression pour Google (on peut voir les ficelles si on se concentre sur les lèvres), mais cela reste bluffant.

L'intérêt de la technologie est évident : Google montre que l'on pourrait par exemple doubler un cours en plusieurs langues sans devoir faire appel à plusieurs locuteurs natifs ou recourir à des sous-titres. Cependant, on peut également craindre les scénarios dans lesquels elle serait utilisée à mauvais escient. Google est bien conscient des risques et a expliqué sur scène ne pas trop savoir sur quel pied danser. L'entreprise y voit une « tension » entre audace et sécurité, précisant que le concept pourrait être repris pour créer des deepfakes malveillants visant à faire raconter n'importe quoi à n'importe qui.

Ce « Traducteur Universel » ne sera donc proposé qu'à des partenaires certifiés et intégrera des garde-fous pour éviter les abus. Google a aussi promis de mettre en place un système de filigrane dans ses modèles, qui devrait aider à « relever le défi de la désinformation ».

Rejoignez le Club iGen

Soutenez le travail d'une rédaction indépendante.

Rejoignez la plus grande communauté Apple francophone !

S'abonner

Tous les Cybertruck produits rappelés pour... des morceaux de carrosserie qui se détachent

22/03/2025 à 21:00

• 74


Promo : l'iPad 10 64 Go à 285 €, soit son plus bas prix !

22/03/2025 à 11:57

• 14


Dites adieu aux éditeurs PDF encombrants : UPDF fait tout, 10x plus vite ! 📍

22/03/2025 à 11:11


Test des Mac Studio de 2025 : une drôle de gamme

22/03/2025 à 10:00

• 31


Découvrez le compagnon idéal pour votre (nouveau) Mac

Partenaire


Sortie de veille : l’iPhone va devoir faire ami-ami avec les gadgets de la concurrence

22/03/2025 à 08:00

• 8


USA : la responsabilité de l’hébergeur de site internet probablement bientôt modifiée... ou purement supprimée

21/03/2025 à 21:45

• 37


Un processeur fait de neurones humains présenté au MWC 2025

21/03/2025 à 21:15

• 65


TechCrunch rejoint MacWorld et PCWorld dans un fonds d’investissements

21/03/2025 à 20:30

• 4


Un Apple-1 vendu aux enchères pour 375 000 dollars

21/03/2025 à 20:00

• 11


Claude d'Anthropic sait maintenant chercher sur le web

21/03/2025 à 16:30

• 11


Calibre synchronise les liseuses Kobo comme un iPod

21/03/2025 à 13:45

• 29


Promo : une box et un forfait 5G illimité à 20 € par mois chez Free, une offre similaire chez Bouygues

21/03/2025 à 12:30

• 31


Sonos : -20% sur des enceintes, barre, casque et caisson de basses

21/03/2025 à 11:41

• 33


Fnac : 100 € reversés pour l'achat d'un MacBook Air ou d'iPhone 16 Plus et 16 Pro

21/03/2025 à 11:30

• 2


Google confie la recherche de Gmail aux bons soins de l’IA

21/03/2025 à 11:15

• 12