Ouvrir le menu principal

MacGeneration

Recherche

VLC pourrait intégrer Whisper pour des sous-titres automatisés

Pierre Dandumont

jeudi 21 décembre 2023 à 21:30 • 23

Logiciels

Nous vous parlons régulièrement de Whisper, un logiciel open source conçu par OpenAI pour transcrire fidèlement de l'audio en texte. Et bien ce programme pourrait être intégré à VLC pour proposer des fonctions de transcription plus évoluée.

Si vous lancez VLC cette semaine, vous pourrez profiter de cette icône.

Le projet en cours se base sur whisper.cpp, une implémentation en C/C++ qui a gagné récemment des optimisations pour les GPU Apple. Il y a évidemment quelques (grosses) étapes à franchir : Whisper se base sur des modèles qui peuvent être assez volumineux et a besoin d'une dizaine de secondes d'audio au minimum pour fonctionner, ce qui nécessite quelques ajustements dans le décodage des vidéos. Pour le moment, l'implémentation nécessite de fournir un modèle et pose quelques soucis à la compilation, pour une raison simple : Whisper nécessite macOS 13 au minimum et VLC est compilé pour des versions plus anciennes de macOS.

Les différents essais menés par Gabriel Lafond-Thenaille n'amèneront pas nécessairement une intégration dans VLC dans le futur, mais l'idée reste intéressante pour amener de nouvelles fonctions dans le logiciel libre.

illustration magazine 25 ans

MacGeneration a 25 ans !

Participez à la fête et découvrez l’histoire de votre site favori en précommandant notre magazine exclusif.

Je précommande le magazine

Free rejoint ses concurrents avec une Box 5G mais Wi-Fi 7

11:12

• 21


Apple effacerait l'encoche des MacBook Pro en 2026

10:25

• 39


Voiture : Xiaomi passe la deuxième en présentant la YU7, version SUV de sa SU7

09:17

• 25


Test des JBL Tour Pro 3 : des écouteurs qui ne manquent pas d’écran

09:03


Comme le Thunderbolt, les cartes SD Express peuvent être un problème de sécurité

07:00

• 3


CyberGhost VPN : plus que quelques heures pour sauter sur l'offre Cyber Monday ! 📍

09/12/2024 à 22:02


Microsoft met en avant Prism, son équivalent de Rosetta 2, qui évolue un peu pour les jeux

09/12/2024 à 21:30

• 11


Sora, le générateur de vidéos d’OpenAI, est lancé… sauf en Europe

09/12/2024 à 20:31

• 83


iOS 18.2 et macOS 15.2 : une deuxième release candidate avant les versions finales

09/12/2024 à 19:28


Le Raspberry Pi 500 « ordinosaure » arrive, avec un écran portable de 15 pouces

09/12/2024 à 17:00

• 18


Xavier Niel : le Player Devialet a été un signe d'embourgeoisement de Free

09/12/2024 à 15:25

• 44


Safari 18.2 intègre de nouveaux fonds d’écran pour sa page d’accueil, à télécharger dès maintenant

09/12/2024 à 14:59

• 6


Intel n’a pas su se réinventer, selon le patron d’Arm

09/12/2024 à 12:00

• 13


Ce très vieux bug qui traine dans les colonnes du Finder

09/12/2024 à 10:40

• 32


Apple annonce l’arrivée de ses boutiques en Arabie Saoudite à partir de l'été 2025

09/12/2024 à 07:17

• 10


Jusqu'à -50% de réduction : Trouvez le cadeau parfait pour Noël !

Partenaire