Ouvrir le menu principal

MacGeneration

Recherche

Le « Traducteur universel » de Google double les vidéos à l'aide de l'IA et s'occupe même de la synchronisation labiale

Félix Cattafesta

jeudi 11 mai 2023 à 17:15 • 20

Ailleurs

Google a profité de la Google I/O pour déballer ses nouveautés en matière d'IA, et a levé le voile sur une technologie permettant de « traduire » une vidéo de manière assez impressionnante. Le service va artificiellement doubler un passage dans une autre langue et faire en sorte que les lèvres d'une personne soient synchronisées de façon convaincante. Cela donne l'impression d'un locuteur natif sans avoir besoin de véritablement doubler une vidéo. Une petite démo a été présentée pendant la conférence (1:15:00).

En coulisse, l'algorithme va transcrire la vidéo puis traduire le texte. Il va ensuite le faire lire à l'IA en recréant la voix du locuteur tout en faisant en sorte de garder l'intonation et le style. La piste est par la suite intégrée à la vidéo, avec une synchronisation labiale permettant d'offrir un résultat convaincant. Il y a encore une marge de progression pour Google (on peut voir les ficelles si on se concentre sur les lèvres), mais cela reste bluffant.

L'intérêt de la technologie est évident : Google montre que l'on pourrait par exemple doubler un cours en plusieurs langues sans devoir faire appel à plusieurs locuteurs natifs ou recourir à des sous-titres. Cependant, on peut également craindre les scénarios dans lesquels elle serait utilisée à mauvais escient. Google est bien conscient des risques et a expliqué sur scène ne pas trop savoir sur quel pied danser. L'entreprise y voit une « tension » entre audace et sécurité, précisant que le concept pourrait être repris pour créer des deepfakes malveillants visant à faire raconter n'importe quoi à n'importe qui.

Ce « Traducteur Universel » ne sera donc proposé qu'à des partenaires certifiés et intégrera des garde-fous pour éviter les abus. Google a aussi promis de mettre en place un système de filigrane dans ses modèles, qui devrait aider à « relever le défi de la désinformation ».

Rejoignez le Club iGen

Soutenez le travail d'une rédaction indépendante.

Rejoignez la plus grande communauté Apple francophone !

S'abonner

Test du clavier Keychron V10 Max : Alice au pays de Corneille ?

20:30

• 1


macOS Tahoe 26 : la bêta 3 est disponible pour les développeurs

19:41

• 2


Pétanque : une nouvelle app iPhone met fin aux débats autour du cochonnet

16:19

• 38


Creative Cloud : Adobe réduit le nombre de crédits génératifs pour les nouveaux abonnés sur certaines formules

15:42

• 8


Presque 4 ans après sa sortie, Windows 11 est enfin plus utilisé que Windows 10

14:30

• 11


Orange propose ChatGPT Plus à moitié prix pendant 6 mois à ses abonnés

12:31

• 21


ProtectEU : comment l’Union européenne veut affaiblir le chiffrement de bout en bout

11:09

• 56


Les Antivirus pour Mac en 2025 📍

10:42

• 0


F1 : la course vers la rentabilité est lancée pour le film d'Apple

10:40

• 29


FolderDrive : et si les SSD ressemblaient aux dossiers de macOS

07:31

• 14


Une carte cadeau Apple de 100 € vous rapporte 10 € sur Amazon

06:50

• 4


Un SMS, un clic… et des données envolées : pourquoi Incogni devient indispensable  📣

06/07/2025 à 10:00

• 0


Aperçu des nouveautés de Raccourcis dans iOS 26 et macOS 26 : Apple intègre (presque) un chatbot

06/07/2025 à 08:00

• 20


Test du Twelve South AirFly Pro 2 : pour s’enfiler en l’air

05/07/2025 à 11:00

• 10


Sortie de veille : un MacBook avec une puce d’iPhone, attrape-nigaud ou coup de génie ?

05/07/2025 à 08:00

• 38


Un dirigeant de Microsoft conseille aux plus de 9 000 employés licenciés de se faire aider par l’IA

04/07/2025 à 22:00

• 201